[go: up one dir, main page]

ES2416104T3 - Aldolases, nucleic acids that encode them and methods to produce and use them - Google Patents

Aldolases, nucleic acids that encode them and methods to produce and use them Download PDF

Info

Publication number
ES2416104T3
ES2416104T3 ES09009627T ES09009627T ES2416104T3 ES 2416104 T3 ES2416104 T3 ES 2416104T3 ES 09009627 T ES09009627 T ES 09009627T ES 09009627 T ES09009627 T ES 09009627T ES 2416104 T3 ES2416104 T3 ES 2416104T3
Authority
ES
Spain
Prior art keywords
seq
aldolase
sequence
polypeptide
disclosed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09009627T
Other languages
Spanish (es)
Inventor
Ellen Burke
Steven John Gort
Paula M. Hicks
Peter Luginbuhl
Sara C. Mcfarlan
Toby Richardson
Christopher Solheid
David Weiner
Lishan Zhao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cargill Inc
Original Assignee
Cargill Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cargill Inc filed Critical Cargill Inc
Application granted granted Critical
Publication of ES2416104T3 publication Critical patent/ES2416104T3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Seasonings (AREA)
  • Indole Compounds (AREA)

Abstract

Un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, salesde la misma y combinaciones de la misma en una vía de múltiples etapas, siendo los derivados de (R,R)-monatinacompuestos de fórmula general (II):**Fórmula** en donde Ra, Rb, Rc, Rd y Re representan cada uno independientemente cualquier sustituyente que se selecciona deun átomo de hidrógeno, un grupo hidroxilo, un grupo alquilo C1-C3, un grupo alcoxi C1-C3, un grupo amino o unátomo de halógeno, que se selecciona de un átomo de yodo, átomo de bromo, átomo de cloro o átomo de flúor, conla condición de que Ra, Rb, Rc, Rd, y Re no sean todos hidrógeno y en donde Rb y Rc, y/o Rd y Re juntos forman ungrupo alquileno C1-C4, en donde una reacción en la vía es facilitada por un polipéptido que se selecciona de un polipéptido aislado o recombinanteque comprende la secuencia de aminoácidos de SEQ ID NO:276 o fragmentos o subsecuencias de la misma quetienen actividad de aldolasa.A method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, the derivatives of (R, R) -monatin compounds of general formula (II): ** Formula ** wherein Ra, Rb, Rc, Rd and Re each independently represent any substituent that is selected from a hydrogen atom, a hydroxyl group, a C1-alkyl group C3, a C1-C3 alkoxy group, an amino group or a halogen atom, which is selected from an iodine atom, bromine atom, chlorine atom or fluorine atom, provided that Ra, Rb, Rc, Rd, and Re are not all hydrogen and where Rb and Rc, and / or Rd and Re together form a C1-C4 alkylene group, where a pathway reaction is facilitated by a polypeptide which is selected from an isolated or recombinant polypeptide comprising the amino acid sequence of SEQ ID NO: 276 or fragments or subsequences thereof that have aldolase activity.

Description

Aldolasas, ácidos nucleicos que las codifican y métodos para producir y usar las mismas Aldolases, nucleic acids that encode them and methods to produce and use them

Campo de acuerdo con la invención Field according to the invention

La presente invención se refiere a la biología molecular y celular y a la bioquímica. Más específicamente, la invención se refiere a métodos para preparar polipéptidos que tienen actividad de aldolasa, tal como se define en las reivindicaciones. The present invention relates to molecular and cellular biology and biochemistry. More specifically, the invention relates to methods for preparing polypeptides having aldolase activity, as defined in the claims.

Antecedentes de la invención Background of the Invention

La monatina es un edulcorante de alta intensidad que tiene la fórmula química: Monatin is a high intensity sweetener that has the chemical formula:

La monatina incluye dos centros quirales que conducen a cuatro posibles configuraciones estereoisoméricas. La configuración R,R (el “estereoisómero R,R” o “la (R,R)-monatina”); la configuración S,S (el “estereoisómero S,S” o “la (S,S)-monatina”); la configuración R,S (el “estereoisómero R,S” o “la (R,S)-monatina”); y la configuración S,R (el “estereoisómero S,R” o “la (S,R)-monatina”). Tal como se utiliza en la presente, a menos que se indique de otra forma, el término “monatina” se usa para referirse a composiciones que incluyen los cuatro estereoisómeros de monatina, composiciones que incluyen cualquier combinación de estereoisómeros de monatina (tal como una composición que incluye solo los estereoisómeros R,R y S,S de monatina), así como también una sola forma isomérica. The monatin includes two chiral centers leading to four possible stereoisomeric configurations. The R, R configuration (the "R, R stereoisomer" or "la (R, R) -monatin"); the S, S configuration (the "S, S stereoisomer" or "la (S, S) -monatin"); the R, S configuration (the "R, S stereoisomer" or "la (R, S) -monatin"); and the S, R configuration (the "S, R stereoisomer" or "la (S, R) -monatin"). As used herein, unless otherwise indicated, the term "monatin" is used to refer to compositions that include all four monatin stereoisomers, compositions that include any combination of monatin stereoisomers (such as a composition which includes only the monatin R, R and S, S stereoisomers), as well as a single isomeric form.

A los efectos de esta divulgación, la estructura principal de carbono se numerará como se ilustró anteriormente, siendo el carbono unido directa y covalentemente al grupo alcohol identificado como el carbono en la posición 2 y el carbono unido directa y covalentemente al grupo amino identificado como el carbono en la posición 4. Consecuentemente, las referencias en la presente una (R,R)-monatina, (S,S)-monatina, (R,S)-monatina y (S,R)monatina significan: (2R,4R)-monatina, (2S,4S)-monatina, (2R,4S)-monatina y (2S,4R)-monatina, respectivamente, a menos que se indique de otra forma. For the purposes of this disclosure, the carbon backbone will be numbered as illustrated above, with carbon being attached directly and covalently to the alcohol group identified as the carbon at position 2 and carbon attached directly and covalently to the amino group identified as the carbon at position 4. Accordingly, references herein an (R, R) -monatin, (S, S) -monatin, (R, S) -monatin, and (S, R) monatin mean: (2R, 4R ) -monatin, (2S, 4S) -monatin, (2R, 4S) -monatin, and (2S, 4R) -monatin, respectively, unless otherwise indicated.

Cabe señalar que, en la bibliografía, la estructura principal de carbono de la monatina también se ha numerado usando una convención alternativa, siendo el carbono unido al grupo alcohol el carbono en la posición 4 y el carbono unido al grupo amino el carbono en la posición 2. Por lo tanto, por ejemplo, las referencias a la (2S,4R)-monatina en esta divulgación serían iguales a las referencias a la (2R,4S)-monatina en la bibliografía usando la convención de numeración alternativa. It should be noted that, in the literature, the carbon backbone of monatin has also been numbered using an alternative convention, with the carbon attached to the alcohol group being carbon at position 4 and the carbon attached to the amino group being carbon at position 2. Therefore, for example, references to (2S, 4R) -monatin in this disclosure would be the same as references to (2R, 4S) -monatin in the literature using the alternative numbering convention.

Más aun, debido a las distintas convenciones de designación, la monatina se conoce con varios nombres químicos alternativos, entre los que se incluyen: ácido 2-hidroxi-2-(indol-3-ilmetil)-4-aminoglutárico; ácido 4-amino-2-hidroxi-2(1H-indol-3-ilmetil)-pentanodioico; ácido 4-hidroxi-4-(3-indolilmetil)glutámico y 3-(1-amino-1,3-dicarboxi-3-hidroxi-but4-il)indol. Furthermore, due to the different naming conventions, monatin is known by several alternative chemical names, including: 2-hydroxy-2- (indole-3-ylmethyl) -4-aminoglutaric acid; 4-amino-2-hydroxy-2 (1H-indole-3-ylmethyl) -pentanedioic acid; 4-hydroxy-4- (3-indolylmethyl) glutamic acid and 3- (1-amino-1,3-dicarboxy-3-hydroxy-but4-yl) indole.

Ciertas formas isoméricas de monatina pueden encontrarse en la corteza de las raíces de la planta Schlerochiton ilicifolius que se encuentra en la región de Transvaal en Sudáfrica. Las Solicitudes de Patente de los Estados Unidos Nos. 10/422.366 (“la solicitud '366”) y 10/979.821 (“la solicitud '821”) divulgan, entre otras cosas, polipéptidos, rutas y microorganismos para la producción in vitro e in vivo de monatina. Certain isomeric forms of monatin can be found in the root bark of the Schlerochiton ilicifolius plant found in the Transvaal region of South Africa. United States Patent Applications Nos. 10 / 422,366 ("the '366 application") and 10 / 979,821 ("the' 821 application") disclose, among other things, polypeptides, pathways, and microorganisms for in vitro production and monatina in vivo.

Compendio Compendium

Se divulgan polipéptidos que tienen actividad de aldolasa (de aquí en adelante “aldolasas”), incluyendo actividad de piruvato aldolasa tal como, a modo no taxativo, actividad de HMG y KHG aldolasa, polinucleótidos que codifican los polipéptidos y métodos para preparar y utilizar los polipéptidos y polinucleótidos. En algunas realizaciones también se divulgan composiciones (tales como composiciones farmacéuticas, composiciones de combustibles y aditivos para combustibles, alimentos y aditivos para alimentos, bebidas y aditivos para bebidas, piensos y aditivos para piensos, fármacos y aditivos para fármacos, complementos alimenticios) que comprenden polipéptidos o polinucleótidos. Estas composiciones pueden formularse en una variedad de formas, tales como comprimidos, geles, píldoras, implantes, líquidos, aerosoles, películas, micelas, polvos, alimento, granulados de pienso o cualquier tipo de forma encapsulada. Polypeptides having aldolase activity (hereinafter "aldolases") are disclosed, including pyruvate aldolase activity such as, non-exhaustively, HMG and KHG aldolase activity, polynucleotides encoding the polypeptides, and methods for preparing and using the polypeptides and polynucleotides. In some embodiments, compositions (such as pharmaceutical compositions, fuel compositions and fuel additives, food and food additives, beverages and beverage additives, feed and feed additives, drugs and drug additives, food supplements) are also disclosed which comprise polypeptides or polynucleotides. These compositions can be formulated in a variety of forms, such as tablets, gels, pills, implants, liquids, sprays, films, micelles, powders, food, feed granules, or any type of encapsulated form.

Las aldolasas y/o composiciones de las mismas pueden ser útiles en contextos farmacéuticos, industriales y/o agrícolas. Aldolases and / or compositions thereof can be useful in pharmaceutical, industrial and / or agricultural contexts.

Las aldolasas y/o composiciones de las mismas pueden ser útiles para formar o escindir enlaces carbono-carbono. Aldolases and / or compositions thereof can be useful for forming or cleaving carbon-carbon bonds.

Se proporcionan aldolasas que catalizan reacciones que forman enlaces carbono-carbono entre un aceptor de alfacetoácido y un piruvato o un donante derivado de piruvato (ver esquema de reacción más adelante). El aceptor también puede ser una cetona o un aldehído. Más aun, se proporcionan aldolasas que tienen actividad 4-hidroxi-2oxoglutarato aldolasa (tal como 2-ceto-4-hidroxiglutarato aldolasa, 2-oxo-4-hidroxiglutarato aldolasa, KHG-aldolasa, EC 4.1.3.16) y catalizan la siguiente reacción: 4-hidroxi-2-oxoglutarato <=> piruvato + glioxilato. Más aun, se proporcionan aldolasas que tienen actividad HMG-aldolasa (tal como 4-hidroxi-4-metil-2-oxoglutarato aldolasa, piruvato aldolasa, aldolasa gamma-metil-gamma-hidroxi-alfa-cetoglutárica, 4-hidroxi-4-metil-2-cetoglutarato aldolasa, EC 4.1.3.17) y catalizan la siguiente reacción: 4-hidroxi-4-metil-2-oxoglutarato <=> 2-piruvato. Una HMG aldolasa también actuará sobre 4-hidroxi-4-metil-2-oxoadipato y 4-carboxi-4-hidroxi-2-oxohexadioato. Aldolases are provided that catalyze reactions that form carbon-carbon bonds between an alpha-ketoacid acceptor and a pyruvate or a pyruvate-derived donor (see reaction scheme below). The acceptor can also be a ketone or an aldehyde. Furthermore, aldolases are provided that have 4-hydroxy-2-oxyglutarate aldolase activity (such as 2-keto-4-hydroxyglutarate aldolase, 2-oxo-4-hydroxyglutarate aldolase, KHG-aldolase, EC 4.1.3.16) and catalyze the following reaction : 4-hydroxy-2-oxoglutarate <=> pyruvate + glyoxylate. Furthermore, aldolases are provided that have HMG-aldolase activity (such as 4-hydroxy-4-methyl-2-oxoglutarate aldolase, pyruvate aldolase, aldolase gamma-methyl-gamma-hydroxy-alpha-ketoglutaric, 4-hydroxy-4- methyl-2-ketoglutarate aldolase, EC 4.1.3.17) and catalyze the following reaction: 4-hydroxy-4-methyl-2-oxoglutarate <=> 2-pyruvate. An HMG aldolase will also act on 4-hydroxy-4-methyl-2-oxoadipate and 4-carboxy-4-hydroxy-2-oxohexadioate.

Aldolasa      Aldolasa

R = H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido R = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl

R2 = H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido R2 = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl

R3 = H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido, ácido carboxílico. R3 = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl, carboxylic acid.

Se proporcionan aldolasas, tales como una piruvato aldolasa, tal como, a modo no taxativo, una HMG y/o una KHG aldolasa, que facilitan la producción de un 2-ceto-glutarato 3,4-sustituido. También se divulga un método para preparar un 2-ceto-glutarato 3,4-sustituido que comprende: (a) proporcionar un polipéptido que tiene una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como, a modo no taxativo, una actividad de HMG aldolasa y/o KMG aldolasa; (b) proporcionar un donante y un compuesto aceptor; y (c) poner en contacto el polipéptido de la etapa (a) con los compuestos de la etapa (b) en condiciones en las cuales la aldolasa cataliza la síntesis de un 2-ceto-glutarato 3,4-sustituido, en donde opcionalmente el donante y el aceptor son un piruvato o un donante de piruvato y un aceptor a-cetoácido, una cetona y/o un aldehído. Aldolases, such as a pyruvate aldolase, such as, but not limited to, an HMG and / or a KHG aldolase, are provided which facilitate the production of a 3,4-substituted 2-keto-glutarate. There is also disclosed a method of preparing a 3,4-substituted 2-keto glutarate comprising: (a) providing a polypeptide having an aldolase activity, such as a pyruvate aldolase activity, such as, non-exhaustively, an HMG aldolase and / or KMG aldolase activity; (b) providing a donor and an acceptor compound; and (c) contacting the polypeptide of step (a) with the compounds of step (b) under conditions in which aldolase catalyzes the synthesis of a 3,4-substituted 2-keto-glutarate, where optionally the donor and acceptor are a pyruvate or a pyruvate donor and an a-keto acid acceptor, a ketone and / or an aldehyde.

Se proporcionan aldolasas que facilitan la producción de ácido R-2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (R-MP), un precursor de monatina. Una piruvato aldolasa, tal como una HMG y/o una KHG aldolasa, puede utilizarse junto con una D-aminotransferasa para preparar un ácido D-glutámico 4-sustituido o un derivado del mismo. Un ácido Dglutámico 4-sustituido y/o un derivado del mismo pueden utilizarse como un antibiótico, dado que se ha descubierto que estos compuestos inhiben la glutamato racemasa bacteriana (WO0214261A3). Más aun, se describe un método para preparar un ácido D-glutámico 4-sustituido que comprende: (a) proporcionar un polipéptido que tiene una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como, a modo no taxativo, una actividad de HMG aldolasa y/o KMG aldolasa; (b) proporcionar un aceptor a-cetoácido y un piruvato o un donante de piruvato; y Aldolases are provided which facilitate the production of R-2-hydroxy 2- (indole-3-ylmethyl) -4-ketoglutaric acid (R-MP), a monatin precursor. A pyruvate aldolase, such as an HMG and / or a KHG aldolase, can be used in conjunction with a D-aminotransferase to prepare a 4-substituted D-glutamic acid or a derivative thereof. A 4-substituted Dglutamic acid and / or a derivative thereof can be used as an antibiotic, since these compounds have been found to inhibit bacterial glutamate racemase (WO0214261A3). Furthermore, a method for preparing a 4-substituted D-glutamic acid is disclosed comprising: (a) providing a polypeptide having an aldolase activity, such as a pyruvate aldolase activity, such as, non-exhaustively, a HMG aldolase and / or KMG aldolase activity; (b) providing an a-keto acid acceptor and a pyruvate or a pyruvate donor; and

(c) poner en contacto el polipéptido de la etapa (a) con los compuestos de la etapa (b) en condiciones en las cuales la aldolasa cataliza la síntesis de un ácido D-glutámico 4-sustituido, en donde opcionalmente el polipéptido tiene actividad de piruvato aldolasa, HMG aldolasa y/o KHG aldolasa y en donde opcionalmente el método además comprende el uso de una D-aminotransferasa. (c) contacting the polypeptide of step (a) with the compounds of step (b) under conditions in which aldolase catalyzes the synthesis of a 4-substituted D-glutamic acid, where optionally the polypeptide has activity pyruvate aldolase, HMG aldolase and / or KHG aldolase and wherein optionally the method further comprises the use of a D-aminotransferase.

Se divulgan ácidos nucleicos aislados, sintéticos o recombinantes que comprenden una secuencia de ácidos nucleicos que tiene al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o 100% (completa) de identidad de secuencia con respecto a un ácido nucleico divulgado en la presente, incluyendo SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID Isolated, synthetic or recombinant nucleic acids are disclosed comprising a nucleic acid sequence having at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% , 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76 %, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or more, or 100% (complete) sequence identity with respect to a nucleic acid disclosed herein, including SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID N O: 69, SEQ ID

NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 en una región de al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 o más residuos. Uno o más ácidos nucleicos codifican al menos un polipéptido que tiene una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa. En algunas realizaciones, las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante una inspección visual. NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SE Q ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 33 7 and SEQ ID NO: 338 in a region of at least about 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 or more waste. One or more nucleic acids encode at least one polypeptide that has aldolase activity, including pyruvate activity such as, non-exhaustively, HMG and / or KHG aldolase activity. In some embodiments, sequence identities are determined by analysis with a sequence comparison algorithm or by visual inspection.

De forma alternativa, uno o más ácidos nucleicos codifican al menos un polipéptido capaz de generar un anticuerpo que puede unirse específicamente a un polipéptido de la invención, o estos ácidos nucleicos pueden utilizarse como sondas para identificar o aislar ácidos nucleicos que codifican aldolasa o para inhibir la expresión de ácidos nucleicos que expresan aldolasa. Alternatively, one or more nucleic acids encode at least one polypeptide capable of generating an antibody that can specifically bind to a polypeptide of the invention, or these nucleic acids can be used as probes to identify or isolate aldolase encoding nucleic acids or to inhibit the expression of nucleic acids that express aldolase.

Los ácidos nucleicos también pueden incluir ácidos nucleicos aislados, sintéticos o recombinantes que codifican enzimas divulgadas en la presente, tales como enzimas que incluyen uno o más polipéptidos que tienen una secuencia tal como se establece en la SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 y SEQ ID NO:334 y subsecuencias de las mismas, variantes de las mismas y fragmentos enzimáticamente activos de las mismas. El polipéptido puede tener una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa. Nucleic acids can also include isolated, synthetic or recombinant nucleic acids that encode enzymes disclosed herein, such as enzymes that include one or more polypeptides that have a sequence as set forth in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO : 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140 , SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO : 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190 , SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO : 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240 , SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO : 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290 , SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO : 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 and SEQ ID NO: 334 and subsequences thereof, variants thereof and enzymatically active fragments thereof. The polypeptide may have aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity.

También se divulgan ácidos nucleicos que codifican aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa preferiblemente derivados de cultivos mixtos. Más aun, se describen ácidos nucleicos que codifican una enzima que forma o escinde enlaces carbono-carbono aislados de cultivos mixtos que comprenden polinucleótidos tal como se divulgan en la presente, tales como una secuencia que tiene al menos 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o 100% (completa) de identidad de secuencia con respecto a un ácido nucleico divulgado en la presente tal como SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 en una región de al menos aproximadamente 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 o más. Nucleic acids encoding aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase preferably derived from mixed cultures are also disclosed. Furthermore, nucleic acids encoding an enzyme that forms or cleaves carbon-carbon bonds isolated from mixed cultures comprising polynucleotides as disclosed herein are described, such as a sequence having at least 10%, 15%, 20% , 25%, 30%, 35%, 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61 %, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, 99%, or more, or 100% (complete) sequence identity with respect to a nucleic acid disclosed herein such as SEQ ID NO: 1, SEQ ID NO : 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19 , SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO : 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 , SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 241, SEQ ID NO: 251, SEQ ID NO : 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269 , SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 291, SEQ ID NO: 301, SEQ ID NO : 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319 , SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 in a region of at least about 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 or more.

Existen ácidos nucleicos que codifican enzima aldolasa, tal como enzima piruvato aldolasa, enzima HMG y/o KHG, incluyendo secuencias de polinucleótidos tal como se divulgan en la presente y los polipéptidos que las codifican, incluyendo enzimas divulgadas en la presente, tales como polipéptidos divulgados en la presente, tales como SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332, o SEQ ID NO:334, y fragmentos enzimáticamente activos de las misma, preferiblemente derivados de una fuente común, tal There are nucleic acids that encode aldolase enzyme, such as pyruvate aldolase enzyme, HMG and / or KHG enzyme, including polynucleotide sequences as disclosed herein and polypeptides encoding them, including enzymes disclosed herein, such as disclosed polypeptides herein, such as SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96 , SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO : 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146 , SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO : 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196 , SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO : 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246 , SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO : 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296 , SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO : 330, SEQ ID NO: 332, or SEQ ID NO: 334, and enzymatically active fragments thereof, preferably derived from a common source, such

como una fuente ambiental. También se describen ácidos nucleicos que codifican enzima aldolasa, tal como enzima piruvato aldolasa, enzima HMG y/o KHG preferiblemente derivados de fuentes ambientales, tales como fuentes ambientales mixtas. as an environmental source. Nucleic acids encoding aldolase enzyme, such as pyruvate aldolase enzyme, HMG and / or KHG enzyme preferably derived from environmental sources, such as mixed environmental sources, are also described.

En algunas realizaciones, el algoritmo de comparación de secuencias es un algoritmo BLAST versión 2.2.2, en el que se fija una configuración de filtro de blastall -p blastp -d “nr pataa” -F F y todas las demás opciones se configuran con los valores por defecto. In some embodiments, the sequence comparison algorithm is a BLAST version 2.2.2 algorithm, in which a filter setting of blastall -p blastp -d "nr pataa" -FF is set and all other options are configured with the default values.

Se divulgan también ácidos nucleicos aislados, sintéticos o recombinantes que incluyen al menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 o más bases consecutivas de una secuencia de ácidos nucleicos divulgada en la presente, secuencias básicamente idénticas a los mismos y las secuencias complementarias a los mismos. Isolated, synthetic or recombinant nucleic acids are also disclosed including at least 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 or more consecutive bases of a nucleic acid sequence disclosed herein, sequences basically identical to them and the sequences complementary thereto.

Los ácidos nucleicos aislados, sintéticos o recombinantes divulgados en la presente codifican un polipéptido que tiene una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, que es termoestable. El polipéptido termoestable divulgado en la presente puede retener una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como una actividad de HMG y/o KHG aldolasa, en condiciones que comprenden un rango de temperatura de aproximadamente −100ºC a aproximadamente −80ºC, aproximadamente −80ºC a aproximadamente −40ºC, aproximadamente −40ºC a aproximadamente −20ºC, aproximadamente −20ºC a aproximadamente 0ºC, aproximadamente 0ºC a aproximadamente 37ºC, aproximadamente 0ºC a aproximadamente 5ºC, aproximadamente 5ºC a aproximadamente 15ºC, aproximadamente 15ºC a aproximadamente 25ºC, aproximadamente 25ºC a aproximadamente 37ºC, aproximadamente 37ºC a aproximadamente 45ºC, aproximadamente 45ºC a aproximadamente 55ºC, aproximadamente 55ºC a aproximadamente 70ºC, aproximadamente 70ºC a aproximadamente 75ºC, aproximadamente 75ºC a aproximadamente 85ºC, aproximadamente 85ºC a aproximadamente 90ºC, aproximadamente 90ºC a aproximadamente 95ºC, aproximadamente 95ºC a aproximadamente 100ºC, aproximadamente 100ºC a aproximadamente 105ºC, aproximadamente 105ºC a aproximadamente 110ºC, aproximadamente 110ºC a aproximadamente 120ºC o 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC o más. Los polipéptidos termoestables divulgados en la presente pueden retener una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como una actividad de HMG y/o KHG aldolasa, en temperaturas en el rango de aproximadamente −100ºC a aproximadamente −80ºC, aproximadamente −80ºC a aproximadamente −40ºC, aproximadamente −40ºC a aproximadamente −20ºC, aproximadamente −20ºC a aproximadamente 0ºC, aproximadamente 0ºC a aproximadamente 5ºC, aproximadamente 5ºC a aproximadamente 15ºC, aproximadamente 15ºC a aproximadamente 25ºC, aproximadamente 25ºC a aproximadamente 37ºC, aproximadamente 37ºC a aproximadamente 45ºC, aproximadamente 45ºC a aproximadamente 55ºC, aproximadamente 55ºC a aproximadamente 70ºC, aproximadamente 70ºC a aproximadamente 75ºC, aproximadamente 75ºC a aproximadamente 85ºC, aproximadamente 85ºC a aproximadamente 90ºC, aproximadamente 90ºC a aproximadamente 95ºC, aproximadamente 95ºC a aproximadamente 100ºC, aproximadamente 100ºC a aproximadamente 105ºC, aproximadamente 105ºC a aproximadamente 110ºC, aproximadamente 110ºC a aproximadamente 120ºC o 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC o más. Los polipéptidos termoestables divulgados en la presente retienen una actividad de aldolasa a una temperatura en los rangos descritos anteriormente, a aproximadamente pH 3,0, aproximadamente pH 3,5, aproximadamente pH 4,0, aproximadamente pH 4,5, aproximadamente pH 5,0, aproximadamente pH 5,5, aproximadamente pH 6,0, aproximadamente pH 6,5, aproximadamente pH 7,0, aproximadamente pH 7,5, aproximadamente pH 8,0, aproximadamente pH 8,5, aproximadamente pH 9,0, aproximadamente pH 9,5, aproximadamente pH 10,0, aproximadamente pH 10,5, aproximadamente pH 11,0, aproximadamente pH 11,5, aproximadamente pH 12,0 o más. The isolated, synthetic, or recombinant nucleic acids disclosed herein encode a polypeptide that has aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, which is thermostable. The thermostable polypeptide disclosed herein can retain aldolase activity, such as pyruvate aldolase activity, such as HMG and / or KHG aldolase activity, under conditions comprising a temperature range of from about -100 ° C to about -80 ° C , approximately −80ºC to approximately −40ºC, approximately −40ºC to approximately −20ºC, approximately −20ºC to approximately 0ºC, approximately 0ºC to approximately 37ºC, approximately 0ºC to approximately 5ºC, approximately 5ºC to approximately 15ºC, approximately 15ºC to approximately 25ºC, approximately 25ºC at approximately 37ºC, approximately 37ºC to approximately 45ºC, approximately 45ºC to approximately 55ºC, approximately 55ºC to approximately 70ºC, approximately 70ºC to approximately 75ºC, approximately 75ºC to approximately 85ºC, approximately 85ºC to approximately 90ºC, approximately 90ºC to approximately 95ºC, approximately 95ºC to approximately Mind 100ºC, approximately 100ºC to approximately 105ºC, approximately 105ºC to approximately 110ºC, approximately 110ºC to approximately 120ºC or 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC , 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC or more. The thermostable polypeptides disclosed herein can retain an aldolase activity, such as a pyruvate aldolase activity, such as an HMG and / or KHG aldolase activity, at temperatures in the range of about -100 ° C to about -80 ° C, about - 80ºC to approximately −40ºC, approximately −40ºC to approximately −20ºC, approximately −20ºC to approximately 0ºC, approximately 0ºC to approximately 5ºC, approximately 5ºC to approximately 15ºC, approximately 15ºC to approximately 25ºC, approximately 25ºC to approximately 37ºC, approximately 37ºC to approximately 45ºC , approximately 45ºC to approximately 55ºC, approximately 55ºC to approximately 70ºC, approximately 70ºC to approximately 75ºC, approximately 75ºC to approximately 85ºC, approximately 85ºC to approximately 90ºC, approximately 90ºC to approximately 95ºC, approximately 95ºC to approximately 100ºC, approximately 100ºC to approximately 105ºC, approximately Accurately 105ºC to approximately 110ºC, approximately 110ºC to approximately 120ºC or 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC or more. The thermostable polypeptides disclosed herein retain aldolase activity at a temperature in the ranges described above, at about pH 3.0, about pH 3.5, about pH 4.0, about pH 4.5, about pH 5, 0, about pH 5.5, about pH 6.0, about pH 6.5, about pH 7.0, about pH 7.5, about pH 8.0, about pH 8.5, about pH 9.0, about pH 9.5, about pH 10.0, about pH 10.5, about pH 11.0, about pH 11.5, about pH 12.0 or more.

Los ácidos nucleicos aislados, sintéticos o recombinantes codifican un polipéptido que tiene una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, que es termotolerante. Los polipéptidos termotolerantes divulgados en la presente pueden retener una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como una actividad de HMG y/o KHG aldolasa, luego de la exposición a condiciones que comprenden una temperatura en el rango de aproximadamente −100ºC a aproximadamente −80ºC, aproximadamente −80ºC a aproximadamente −40ºC, aproximadamente −40ºC a aproximadamente −20ºC, aproximadamente −20ºC a aproximadamente 0ºC, aproximadamente 0ºC a aproximadamente 5ºC, aproximadamente 5ºC a aproximadamente 15ºC, aproximadamente 15ºC a aproximadamente 25ºC, aproximadamente 25ºC a aproximadamente 37ºC, aproximadamente 37ºC a aproximadamente 45ºC, aproximadamente 45ºC a aproximadamente 55ºC, aproximadamente 55ºC a aproximadamente 70ºC, aproximadamente 70ºC a aproximadamente 75ºC, aproximadamente 75ºC a aproximadamente 85ºC, aproximadamente 85ºC a aproximadamente 90ºC, aproximadamente 90ºC a aproximadamente 95ºC, aproximadamente 95ºC a aproximadamente 100ºC, aproximadamente 100ºC a aproximadamente 105ºC, aproximadamente 105ºC a aproximadamente 110ºC, aproximadamente 110ºC a Isolated, synthetic, or recombinant nucleic acids encode a polypeptide that has aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, which is heat-tolerant. The thermotolerant polypeptides disclosed herein can retain an aldolase activity, such as a pyruvate aldolase activity, such as an HMG and / or KHG aldolase activity, after exposure to conditions comprising a temperature in the range of about - 100ºC to approximately −80ºC, approximately −80ºC to approximately −40ºC, approximately −40ºC to approximately −20ºC, approximately −20ºC to approximately 0ºC, approximately 0ºC to approximately 5ºC, approximately 5ºC to approximately 15ºC, approximately 15ºC to approximately 25ºC, approximately 25ºC to approximately 37ºC, approximately 37ºC to approximately 45ºC, approximately 45ºC to approximately 55ºC, approximately 55ºC to approximately 70ºC, approximately 70ºC to approximately 75ºC, approximately 75ºC to approximately 85ºC, approximately 85ºC to approximately 90ºC, approximately 90ºC to approximately 95ºC, approximately 95ºC to approximately 100ºC , approximately 100ºC to approximately 105ºC, approximately 105ºC to approximately 110ºC, approximately 110ºC to

aproximadamente 120ºC o 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC o más. Los polipéptidos termotolerantes divulgados en la presente pueden retener una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como una actividad de HMG y/o KHG aldolasa, luego de la exposición a una temperatura en el rango de aproximadamente −100ºC a aproximadamente −80ºC, aproximadamente −80ºC a aproximadamente −40ºC, aproximadamente −40ºC a aproximadamente −20ºC, aproximadamente −20ºC a aproximadamente 0ºC, aproximadamente 0ºC a aproximadamente 5ºC, aproximadamente 5ºC a aproximadamente 15ºC, aproximadamente 15ºC a aproximadamente 25ºC, aproximadamente 25ºC a aproximadamente 37ºC, aproximadamente 37ºC a aproximadamente 45ºC, aproximadamente 45ºC a aproximadamente 55ºC, aproximadamente 55ºC a aproximadamente 70ºC, aproximadamente 70ºC a aproximadamente 75ºC, aproximadamente 75ºC a aproximadamente 85ºC, aproximadamente 85ºC a aproximadamente 90ºC, aproximadamente 90ºC a aproximadamente 95ºC, aproximadamente 95ºC a aproximadamente 100ºC, aproximadamente 100ºC a aproximadamente 105ºC, aproximadamente 105ºC a aproximadamente 110ºC, aproximadamente 110ºC a aproximadamente 120ºC o 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC o más. Los polipéptidos termotolerantes divulgados en la presente retienen una actividad de aldolasa luego de la exposición a una temperatura en los rangos descritos anteriormente, a aproximadamente pH 3,0, aproximadamente pH 3,5, aproximadamente pH 4,0, aproximadamente pH 4,5, aproximadamente pH 5,0, aproximadamente pH 5,5, aproximadamente pH 6,0, aproximadamente pH 6,5, aproximadamente pH 7,0, aproximadamente pH 7,5, aproximadamente pH 8,0, aproximadamente pH 8,5, aproximadamente pH 9,0, aproximadamente pH 9,5, aproximadamente pH 10,0, aproximadamente pH 10,5, aproximadamente pH 11,0, aproximadamente pH 11,5, aproximadamente pH 12,0 o más. approximately 120ºC or 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC, 113ºC, 114ºC, 115ºC or more. The thermotolerant polypeptides disclosed herein can retain an aldolase activity, such as a pyruvate aldolase activity, such as an HMG and / or KHG aldolase activity, after exposure to a temperature in the range of about −100 ° C to about −80ºC, approximately −80ºC to approximately −40ºC, approximately −40ºC to approximately −20ºC, approximately −20ºC to approximately 0ºC, approximately 0ºC to approximately 5ºC, approximately 5ºC to approximately 15ºC, approximately 15ºC to approximately 25ºC, approximately 25ºC to approximately 37ºC, approximately 37ºC to approximately 45ºC, approximately 45ºC to approximately 55ºC, approximately 55ºC to approximately 70ºC, approximately 70ºC to approximately 75ºC, approximately 75ºC to approximately 85ºC, approximately 85ºC to approximately 90ºC, approximately 90ºC to approximately 95ºC, approximately 95ºC to approximately 100ºC, approximately 100ºC aa approximately 105ºC, approximately 105ºC to approximately 110ºC, approximately 110ºC to approximately 120ºC or 95ºC, 96ºC, 97ºC, 98ºC, 99ºC, 100ºC, 101ºC, 102ºC, 103ºC, 104ºC, 105ºC, 106ºC, 107ºC, 108ºC, 109ºC, 110ºC, 111ºC, 112ºC , 113ºC, 114ºC, 115ºC or more. The thermotolerant polypeptides disclosed herein retain aldolase activity upon exposure to a temperature in the ranges described above, at about pH 3.0, about pH 3.5, about pH 4.0, about pH 4.5, approximately pH 5.0, approximately pH 5.5, approximately pH 6.0, approximately pH 6.5, approximately pH 7.0, approximately pH 7.5, approximately pH 8.0, approximately pH 8.5, approximately pH 9.0, about pH 9.5, about pH 10.0, about pH 10.5, about pH 11.0, about pH 11.5, about pH 12.0 or more.

Existen ácidos nucleicos aislados, sintéticos o recombinantes que comprenden una secuencia que hibrida en condiciones estrictas con ácidos nucleicos tal como se divulgan en la presente incluyendo una secuencia tal como se establece en SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:1, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337, o SEQ ID NO:338, o fragmentos o subsecuencias de los mismos. Los ácidos nucleicos codifican polipéptidos que tienen una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa. Los ácidos nucleicos pueden ser de al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200 o más residuos de longitud o la longitud completa del gen o transcripto. Las condiciones estrictas comprenden una etapa de lavado que comprende un lavado en 0,2X SSC a una temperatura de aproximadamente 65ºC durante aproximadamente 15 minutos. There are isolated, synthetic, or recombinant nucleic acids that comprise a sequence that hybridizes under stringent conditions to nucleic acids as disclosed herein including a sequence as set forth in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO : 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 1, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 , SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO : 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71 , SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO : 105, SEQ ID NO: 107, SEQ ID NO: 1 09, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337, or SEQ ID NO: 338, or fragments or subsequences thereof. Nucleic acids encode polypeptides that have aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity. Nucleic acids can be at least about 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 , 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200 or more residues in length or the full length of the gene or transcript. Strict conditions comprise a wash step comprising washing in 0.2X SSC at a temperature of about 65 ° C for about 15 minutes.

Existen sondas de ácido nucleico para identificar o aislar ácidos nucleicos que codifican polipéptidos que tienen una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, en donde las sondas comprenden aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 o más bases consecutivas de una secuencia tal como se divulga en la presente, y en donde las sondas identifican el ácido nucleico mediante unión o hibridación. Las sondas pueden comprender un oligonucleótido que comprende entre Nucleic acid probes exist to identify or isolate nucleic acids encoding polypeptides that have aldolase activity, including pyruvate activity such as, non-exhaustively, HMG and / or KHG aldolase activity, where the probes comprise about 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 or more consecutive bases of a sequence as disclosed herein, and wherein the probes identify nucleic acid by binding or hybridization. The probes can comprise an oligonucleotide comprising between

aproximadamente 10-100 bases consecutivas de una secuencia de acuerdo con la invención o fragmentos o subsecuencias de la misma, por ejemplo, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 bases o más, o cualquier longitud intermedia que se desee. about 10-100 consecutive bases of a sequence according to the invention or fragments or subsequences thereof, eg 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 , 75, 80, 85, 90, 95 or 100 bases or more, or any desired intermediate length.

Existen sondas de ácido nucleico para identificar o aislar ácidos nucleicos que codifican polipéptidos que tienen una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, en donde las sondas comprenden ácidos nucleicos que comprenden una secuencia de al menos aproximadamente 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 o más residuos de un ácido nucleico tal como se divulga en la presente, tal como un polinucleótido que tiene al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más o 100% (completa) de identidad de secuencia con respecto a un ácido nucleico divulgado en la presente. En algunas realizaciones, las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante inspección visual. Las sondas pueden comprender un oligonucleótido que comprende entre al menos aproximadamente 10-100 bases consecutivas de una secuencia de ácidos nucleicos divulgados en la presente o una subsecuencia de la misma, por ejemplo 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 bases o más, o cualquier longitud intermedia que se desee. Nucleic acid probes exist to identify or isolate nucleic acids encoding polypeptides that have aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, where the probes comprise nucleic acids that they comprise a sequence of at least about 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 , 700, 750, 800, 850, 900, 950, 1000 or more residues of a nucleic acid as disclosed herein, such as a polynucleotide having at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70% , 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87 %, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more or 100% (complete) of sequence identity with with respect to a nucleic acid disclosed herein. In some embodiments, sequence identities are determined by analysis with a sequence comparison algorithm or by visual inspection. The probes can comprise an oligonucleotide comprising between at least about 10-100 consecutive bases of a nucleic acid sequence disclosed herein or a subsequence thereof, eg 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 or 100 bases or more, or any desired intermediate length.

Existen pares de cebadores de amplificación para amplificar (tal como mediante PCR) ácidos nucleicos que codifican polipéptidos que tienen actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, en donde cada par de cebadores es capaz de amplificar un ácido nucleico que comprende una secuencia tal como se divulga en la presente o fragmentos o subsecuencias de la misma (ver el Listado de Secuencias). Uno o cada miembro del par de secuencias cebadoras de amplificación puede comprender un oligonucleótido que comprende al menos aproximadamente 10 a 50, o más, bases consecutivas de la secuencia o aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 o más bases consecutivas de la secuencia. También se describen pares de cebadores de amplificación, en donde cada par de cebadores comprende un primer miembro que tiene una secuencia tal como fue establecido en aproximadamente los primeros (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 o más residuos de un ácido nucleico de acuerdo con la invención, y un segundo miembro que tiene una secuencia tal como fue establecido en aproximadamente los primeros (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 o más residuos de la hebra complementaria del primer miembro. Pairs of amplification primers exist to amplify (such as by PCR) nucleic acids encoding polypeptides that have aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, where each pair primer is capable of amplifying a nucleic acid comprising a sequence as disclosed herein or fragments or subsequences thereof (see Sequence Listing). One or each member of the pair of amplification primer sequences may comprise an oligonucleotide comprising at least about 10 to 50, or more, consecutive bases of the sequence or about 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 or more consecutive bases in the sequence. Amplification primer pairs are also described, where each primer pair comprises a first member that has a sequence as established in approximately the first (5 ') 12, 13, 14, 15, 16, 17, 18, 19 , 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 or more residues of a nucleic acid according to the invention, and a second member that has a sequence as established in approximately the first (5 ') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 , 29, 30, 31, 32, 33, 34, 35, 36 or more residues of the complementary strand of the first member.

Existen ácidos nucleicos que codifican aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa generados por amplificación, tal como reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación divulgados en la presente. Se divulgan ácidos nucleicos que codifican aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa se generan por amplificación, tal como reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación tal como se divulga en la presente. Existen métodos para preparar una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa mediante amplificación, tal como reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación divulgados en la presente. El par de cebadores de amplificación amplifica un ácido nucleico de una biblioteca, tal como una biblioteca genómica, tal como una biblioteca ambiental. There are nucleic acids encoding aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase generated by amplification, such as polymerase chain reaction (PCR), using a pair of amplification primers disclosed herein. Nucleic acids encoding aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are generated by amplification, such as polymerase chain reaction (PCR), using a pair of amplification primers as disclosed in the present. There are methods of preparing an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase by amplification, such as polymerase chain reaction (PCR), using a pair of amplification primers disclosed herein. The amplification primer pair amplifies a nucleic acid from a library, such as a genomic library, such as an environmental library.

Existen métodos para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa que comprenden la amplificación de un ácido nucleico plantilla con un par de secuencias cebadoras de amplificación capaces de amplificar una secuencia de ácidos nucleicos divulgada en la presente o fragmentos o subsecuencias de la misma. There are methods of amplifying a nucleic acid encoding a polypeptide having aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, comprising amplifying a template nucleic acid with a pair of amplification primer sequences capable of amplifying a nucleic acid sequence disclosed herein or fragments or subsequences thereof.

Existen cassettes de expresión que comprenden un ácido nucleico divulgado en la presente o una subsecuencia del mismo. El cassette de expresión puede comprender el ácido nucleico que se encuentra operativamente ligado a un promotor. El promotor puede ser un promotor viral, bacteriano, mamífero, fúngico, de levadura o vegetal. El promotor vegetal puede ser un promotor de patata, arroz, maíz, trigo, tabaco o cebada. El promotor puede ser un promotor constitutivo. El promotor constitutivo puede comprender CaMV35S. El promotor puede ser un promotor inducible. El promotor puede ser un promotor específico de tejido o un promotor regulado por el ambiente o por el desarrollo. De esta forma, el promotor puede ser, por ejemplo, un promotor específico de semillas, específico de hojas, específico de raíces o específico de tallos o un promotor inducido por abscisión. El cassette de expresión además puede comprender un vector vegetal o de expresión de virus vegetal. There are expression cassettes that comprise a nucleic acid disclosed herein or a subsequence thereof. The expression cassette may comprise nucleic acid that is operably linked to a promoter. The promoter can be a viral, bacterial, mammalian, fungal, yeast or plant promoter. The plant promoter can be a potato, rice, corn, wheat, tobacco or barley promoter. The promoter can be a constitutive promoter. The constitutive promoter can comprise CaMV35S. The promoter can be an inducible promoter. The promoter can be a tissue specific promoter or a promoter regulated by the environment or by development. In this way, the promoter can be, for example, a seed-specific, leaf-specific, root-specific or stem-specific promoter or an abscission-induced promoter. The expression cassette may further comprise a plant or plant virus expression vector.

Existen vehículos de clonación que comprenden un cassette de expresión (tal como un vector) tal como se divulga en la presente o un ácido nucleico tal como se divulga en la presente. El vehículo de clonación puede ser un vector viral, un plásmido, un fago, un fagémido, un cósmido, un fósmido, un bacteriófago o un cromosoma artificial. El vector viral puede comprender un vector de adenovirus, un vector retroviral o un vector viral adeno-asociado. El vehículo de clonación puede comprender un cromosoma artificial bacteriano (BAC), un plásmido, un vector derivado de bacteriófago P1 (PAC), un cromosoma artificial de levadura (YAC) o un cromosoma artificial de mamífero (MAC). There are cloning vehicles that comprise an expression cassette (such as a vector) as disclosed herein or a nucleic acid as disclosed herein. The cloning vehicle can be a viral vector, a plasmid, a phage, a phagemid, a cosmid, a fossil, a bacteriophage, or an artificial chromosome. The viral vector may comprise an adenovirus vector, a retroviral vector, or an adeno-associated viral vector. The cloning vehicle may comprise a bacterial artificial chromosome (BAC), a plasmid, a bacteriophage P1-derived vector (PAC), a yeast artificial chromosome (YAC), or a mammalian artificial chromosome (MAC).

Se divulgan células transformadas que comprenden ácidos nucleicos tal como se divulgan en la presente o cassettes de expresión (tales como vectores) divulgados en la presente o vehículos de clonación divulgados en la presente. La célula transformada puede ser una célula bacteriana, una célula de mamífero, una célula fúngica, una célula de levadura, una célula de insecto o una célula vegetal. La célula vegetal puede ser célula de soja, colza, semilla oleaginosa, tomate, caña de azúcar, un cereal, una patata, trigo, arroz, maíz, tabaco o cebada. Transformed cells comprising nucleic acids as disclosed herein or expression cassettes (such as vectors) disclosed herein or cloning vehicles disclosed herein are disclosed. The transformed cell can be a bacterial cell, a mammalian cell, a fungal cell, a yeast cell, an insect cell, or a plant cell. The plant cell can be soybean, rapeseed, oilseed, tomato, sugar cane, cereal, potato, wheat, rice, corn, tobacco or barley cell.

Existen animales no humanos transgénicos que comprenden un ácido nucleico tal como se divulga en la presente o un cassette de expresión (tal como un vector) tal como se divulga en la presente. El animal es un ratón, una rata, un cerdo, una cabra o una oveja. There are transgenic non-human animals that comprise a nucleic acid as disclosed herein or an expression cassette (such as a vector) as disclosed herein. The animal is a mouse, a rat, a pig, a goat, or a sheep.

Se divulgan plantas transgénicas que comprenden un ácido nucleico tal como se divulga en la presente o un cassette de expresión (tal como un vector) tal como se divulga en la presente. La planta transgénica puede ser una planta de cereal, una planta de maíz, una planta de patata, una planta de tomate, una planta de trigo, una planta de semilla oleaginosa, una planta de colza, una planta de soja, una planta de arroz, una planta de cebada o una planta de tabaco. Transgenic plants comprising a nucleic acid as disclosed herein or an expression cassette (such as a vector) as disclosed herein are disclosed. The transgenic plant can be a cereal plant, a corn plant, a potato plant, a tomato plant, a wheat plant, an oilseed plant, a rapeseed plant, a soybean plant, a rice plant , a barley plant or a tobacco plant.

Existen semillas transgénicas que comprenden un ácido nucleico tal como se divulga en la presente o un cassette de expresión (tal como un vector) tal como se divulga en la presente. La semilla transgénica puede ser una planta de cereal, una semilla de maíz, un grano de trigo, una semilla oleaginosa, una colza, una semilla de soja, un grano de palma, una semilla de girasol, una semilla de sésamo, una semilla vegetal de maní o tabaco. There are transgenic seeds that comprise a nucleic acid as disclosed herein or an expression cassette (such as a vector) as disclosed herein. The transgenic seed can be a cereal plant, a corn seed, a wheat grain, an oilseed, a rapeseed, a soybean seed, a palm kernel, a sunflower seed, a sesame seed, a vegetable seed peanuts or tobacco.

Existen oligonucleótidos antisentido que comprenden secuencias de ácido nucleico complementarias a o capaces de hibridarse en condiciones rigurosas con ácidos nucleicos tal como se divulgan en la presente. También se describen métodos para inhibir la traducción de un mensaje de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa en una célula que comprende administrar a la célula o expresar en la célula un oligonucleótido antisentido que comprende una secuencia de ácidos nucleicos complementaria a, o capaz de hibridarse en condiciones rigurosas con un ácido nucleico divulgado en la presente. El oligonucleótido antisentido tiene de aproximadamente 10 a aproximadamente 50, aproximadamente 20 a aproximadamente 60, aproximadamente 30 a aproximadamente 70, aproximadamente 40 a aproximadamente 80 o aproximadamente 60 a aproximadamente 100 bases de longitud, tal como 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 o más bases de longitud. There are antisense oligonucleotides that comprise nucleic acid sequences complementary to or capable of hybridizing under stringent conditions with nucleic acids as disclosed herein. Also disclosed are methods of inhibiting the translation of an enzyme aldolase message, such as pyruvate aldolase, HMG and / or KHG aldolase in a cell comprising administering to the cell or expressing in the cell an antisense oligonucleotide comprising a nucleic acid sequence complementary to, or capable of hybridizing under stringent conditions to a nucleic acid disclosed herein. The antisense oligonucleotide is from about 10 to about 50, about 20 to about 60, about 30 to about 70, about 40 to about 80, or about 60 to about 100 bases in length, such as 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 or more bases in length.

Se divulgan métodos para inhibir la traducción de un mensaje de enzima aldolasa, tal como piruvato aldolasa, tal como enzima HMG y/o KHG aldolasa en una célula que comprenden administrar a la célula o expresar en la célula un oligonucleótido antisentido que comprende una secuencia de ácidos nucleicos complementaria a, o capaz de hibridarse en condiciones rigurosas con, un ácido nucleico divulgado en la presente. Methods are disclosed for inhibiting translation of an enzyme aldolase message, such as pyruvate aldolase, such as enzyme HMG and / or KHG aldolase in a cell comprising administering to the cell or expressing in the cell an antisense oligonucleotide comprising a sequence of Nucleic acids complementary to, or capable of hybridizing under stringent conditions to, a nucleic acid disclosed herein.

También se divulgan moléculas de ARN inhibitorio (ARNi o ARN de interferencia) de doble hebra (incluido ARN interferente pequeño, o ARNsi, para inhibir la transcripción y microARN o miARN, para inhibir la traducción) que comprenden una subsecuencia de una secuencia divulgada en la presente. En algunos casos, el ARNsi es de aproximadamente 21 a aproximadamente 24 residuos o de aproximadamente al menos 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 o más nucleótidos dúplex de largo. Existen métodos para inhibir la expresión de una enzima aldolasa, tal como la enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa en una célula que comprenden administrar a la célula o expresar en la célula un ARN inhibitorio de doble hebra (ARNsi o miARN), en donde el ARN comprende una subsecuencia de una secuencia divulgada en la presente. Double-stranded inhibitory RNA (RNAi or RNA) molecules (including small interfering RNA, or siRNA, to inhibit transcription and microRNA or miRNA, to inhibit translation) are also disclosed that comprise a subsequence of a sequence disclosed in the Present. In some cases, the siRNA is from about 21 to about 24 residues or from about at least 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 , 31, 32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 or more duplex nucleotides long. There are methods of inhibiting the expression of an aldolase enzyme, such as the pyruvate aldolase enzyme, such as HMG and / or KHG aldolase in a cell, comprising administering to the cell or expressing in the cell a double-stranded inhibitory RNA (siRNA or miRNA ), wherein the RNA comprises a subsequence of a sequence disclosed herein.

También se describen polipéptidos aislados, sintéticos o recombinantes que comprenden una secuencia de aminoácidos que tiene al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más o 100% (completa) de identidad de secuencia con respecto a un polipéptido o péptido divulgado en la presente en una región de aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350 o más residuos, o en la longitud total del polipéptido. En algunas realizaciones, las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante una inspección visual. Las secuencias de polipéptidos o péptidos divulgadas en la presente incluyen SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID Also described are isolated, synthetic, or recombinant polypeptides that comprise an amino acid sequence that is at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76% , 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99% or more or 100% (complete) of sequence identity with respect to a polypeptide or peptide disclosed herein in a region of about 10, 15 , 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300 , 325, 350 or more residues, or over the entire length of the polypeptide. In some embodiments, sequence identities are determined by analysis with a sequence comparison algorithm or by visual inspection. The polypeptide or peptide sequences disclosed herein include SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO : 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30 , SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO : 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80 , SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO : 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130 , S EQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID

NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 y SEQ ID NO:334 y subsecuencias de las mismas, variantes de las mismas y fragmentos enzimáticamente activos de las mismas. Los polipéptidos divulgados en la presente también incluyen fragmentos de al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 o más residuos de longitud o en la longitud total de una enzima. Las secuencias de polipéptidos o péptidos divulgadas en la presente incluyen secuencia codificada mediante un ácido nucleico divulgado en la presente. Las secuencias de polipéptidos o péptidos divulgadas en la presente incluyen polipéptidos o péptidos unidos específicamente mediante un anticuerpo divulgado en la presente (tal como epítopos) o polipéptidos o péptidos que pueden generar un anticuerpo divulgado en la presente (tal como un inmunógeno). NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, I KNOW Q ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 and SEQ ID NO: 334 and subsequences thereof, variants thereof and enzymatically active fragments thereof. The polypeptides disclosed herein also include fragments of at least about 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300 , 350, 400, 450, 500, 550, 600 or more residues in length or in the total length of an enzyme. The polypeptide or peptide sequences disclosed herein include sequence encoded by a nucleic acid disclosed herein. The polypeptide or peptide sequences disclosed herein include polypeptides or peptides specifically linked by an antibody disclosed herein (such as epitopes) or polypeptides or peptides that can generate an antibody disclosed herein (such as an immunogen).

En algunas realizaciones, un polipéptido divulgado en la presente tiene al menos una actividad de enzima aldolasa, tal como, actividad de enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa. En otras realizaciones, un polinucleótido divulgado en la presente codifica un polipéptido que tiene al menos una actividad de enzima aldolasa, tal como, actividad de enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa. In some embodiments, a polypeptide disclosed herein has at least one aldolase enzyme activity, such as, pyruvate aldolase enzyme activity, such as HMG and / or KHG aldolase. In other embodiments, a polynucleotide disclosed herein encodes a polypeptide having at least one aldolase enzyme activity, such as, pyruvate aldolase enzyme activity, such as HMG and / or KHG aldolase.

También se proporcionan polipéptidos o péptidos aislados, sintéticos o recombinantes que comprenden al menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150 o más bases consecutivas de las secuencias de polipéptidos o péptidos divulgadas en la presente, secuencias básicamente idénticas a las mismas y las secuencias complementarias de las mismas. El péptido puede ser, por ejemplo, un fragmento inmunogénico, un motivo (tal como un sitio de unión), una secuencia señal, una secuencia prepro o un sitio activo. Also provided are isolated, synthetic, or recombinant polypeptides or peptides comprising at least 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 , 100, 125, 150 or more consecutive bases of the polypeptide or peptide sequences disclosed herein, sequences basically identical thereto and sequences complementary thereto. The peptide can be, for example, an immunogenic fragment, a motif (such as a binding site), a signal sequence, a prepro sequence, or an active site.

La descripción describe ácidos nucleicos aislados, sintéticos o recombinantes que comprenden una secuencia que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, y una secuencia señal, en donde el ácido nucleico comprende una secuencia divulgada en la presente en la presente. Una “secuencia señal” significa una señal de secreción u otro dominio que facilita la secreción de la aldolasa divulgada en la presente en la presente de la célula huésped. La secuencia señal puede derivarse de otra enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, o una enzima no aldolasa, tal como no piruvato aldolasa, tal como no HMG y/o no KHG aldolasa (heteróloga). La descripción además divulga ácidos nucleicos aislados, sintéticos o recombinantes que comprenden una secuencia que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en donde la secuencia no contiene una secuencia señal y el ácido nucleico comprende una secuencia divulgada en la presente. La descripción divulga polipéptidos aislados, sintéticos o recombinantes que comprenden polipéptidos divulgados en la presente que carecen de toda o parte de una secuencia señal. En algunas realizaciones, el polipéptido aislado, sintético o recombinante puede comprender el polipéptido divulgado en la presente que comprende una secuencia señal heteróloga, tal como una secuencia señal de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, o secuencia señal de enzima no aldolasa, tal como no piruvato aldolasa, tal como no HMG y/o no KHG aldolasa, heteróloga. The disclosure describes isolated, synthetic or recombinant nucleic acids comprising a sequence encoding a polypeptide having an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, and a signal sequence, wherein the nucleic acid it comprises a sequence disclosed herein. A "signal sequence" means a secretory signal or other domain that facilitates the secretion of the aldolase disclosed herein in the host cell. The signal sequence can be derived from another aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, or a non-aldolase enzyme, such as non-pyruvate aldolase, such as non-HMG and / or non-KHG aldolase (heterologous). The disclosure further discloses isolated, synthetic, or recombinant nucleic acids comprising a sequence encoding a polypeptide having an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, wherein the sequence does not contain a signal sequence. and the nucleic acid comprises a sequence disclosed herein. The disclosure discloses isolated, synthetic, or recombinant polypeptides comprising polypeptides disclosed herein that lack all or part of a signal sequence. In some embodiments, the isolated, synthetic, or recombinant polypeptide may comprise the polypeptide disclosed herein comprising a heterologous signal sequence, such as an aldolase enzyme signal sequence, such as pyruvate aldolase, such as HMG and / or KHG aldolase, or non-aldolase enzyme signal sequence, such as non-pyruvate aldolase, such as non-HMG and / or non-KHG aldolase, heterologous.

La descripción además divulga proteínas quiméricas que comprenden un primer dominio que comprende una secuencia señal divulgada en la presente y al menos un segundo dominio. La proteína puede ser una proteína de fusión. El segundo dominio puede comprender una enzima. La proteína puede ser una no enzima. The disclosure further discloses chimeric proteins comprising a first domain comprising a signal sequence disclosed herein and at least a second domain. The protein can be a fusion protein. The second domain can comprise an enzyme. Protein can be a non-enzyme.

La descripción divulga polipéptidos quiméricos que comprenden al menos un primer dominio que comprende péptido señal (SP), una secuencia prepro y/o un dominio catalítico (CD) divulgados en la presente y al menos un segundo dominio que comprende un péptido o polipéptido heterólogo, en donde el péptido o polipéptido heterólogo no se asocia naturalmente con el péptido señal (SP), secuencia prepro y/o dominio catalítico (CD). En algunas realizaciones, el péptido o polipéptido heterólogo no es una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. El péptido o polipéptido heterólogo puede estar en el extremo amino terminal, carboxi terminal o en ambos extremos del péptido señal (SP), la secuencia prepro y/o el dominio catalítico (CD). The disclosure discloses chimeric polypeptides comprising at least one first domain comprising signal peptide (SP), a prepro sequence and / or a catalytic domain (CD) disclosed herein and at least one second domain comprising a heterologous peptide or polypeptide, wherein the heterologous peptide or polypeptide is not naturally associated with the signal peptide (SP), prepro sequence, and / or catalytic domain (CD). In some embodiments, the heterologous peptide or polypeptide is not an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase. The heterologous peptide or polypeptide can be at the amino terminal, carboxy terminal, or both ends of the signal peptide (SP), the prepro sequence, and / or the catalytic domain (CD).

La descripción divulga ácidos nucleicos aislados, sintéticos o recombinantes que codifican un polipéptido quimérico, en donde el polipéptido quimérico comprende al menos un primer dominio que comprende péptido señal (SP), un dominio prepro y/o un dominio catalítico (CD) divulgados en la presente y al menos un segundo dominio que The disclosure discloses isolated, synthetic or recombinant nucleic acids encoding a chimeric polypeptide, wherein the chimeric polypeptide comprises at least a first domain comprising signal peptide (SP), a prepro domain and / or a catalytic domain (CD) disclosed in the present and at least a second domain that

comprende un péptido o polipéptido heterólogo, en donde el péptido o polipéptido heterólogo no se asocia naturalmente con el péptido señal (SP), dominio prepro y/o dominio catalítico (CD). it comprises a heterologous peptide or polypeptide, wherein the heterologous peptide or polypeptide does not naturally associate with the signal peptide (SP), prepro domain and / or catalytic domain (CD).

La descripción divulga secuencias señal aisladas, sintéticas o recombinantes (tales como péptidos señal) que consisten en o que comprenden una secuencia como se establece en los residuos 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 a 46o 1 a 47, de un polipéptido divulgado en la presente tal como SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334. En algunas realizaciones, la descripción divulga secuencias señal que comprenden los primeros 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 o más residuos amino terminales de un polipéptido divulgado en la presente. The disclosure discloses isolated, synthetic, or recombinant signal sequences (such as signal peptides) consisting of or comprising a sequence as set forth in residues 1-14, 1-15, 1-16, 1-17, 1-18, 1 to 19, 1 to 20, 1 to 21, 1 to 22, 1 to 23, 1 to 24, 1 to 25, 1 to 26, 1 to 27, 1 to 28, 1 to 28, 1 to 30, 1 to 31, 1 to 32, 1 to 33, 1 to 34, 1 to 35, 1 to 36, 1 to 37, 1 to 38, 1 to 40, 1 to 41, 1 to 42, 1 to 43, 1 to 44, 1-45, 1-46 or 1-47, of a polypeptide disclosed herein such as SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 7 2, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ I D NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO : 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240 , SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO : 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290 , SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO : 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334. In some embodiments, the disclosure discloses signal sequences comprising the first 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32 , 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57 , 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 or more amino terminal residues of a polypeptide disclosed herein.

La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede comprender una actividad específica de aproximadamente 10 a aproximadamente 12.000 unidades por miligramo de proteína. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, también puede comprender una actividad específica de aproximadamente 1000 a aproximadamente 10.000 unidades por miligramo de proteína, o de aproximadamente 5000 a aproximadamente 7500 unidades por miligramo de proteína. De forma alternativa, la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, comprende una actividad específica en el rango de aproximadamente 10 a aproximadamente 7500 unidades por miligramo de proteína, o de aproximadamente 5000 a aproximadamente 12.000 unidades por miligramo de proteína. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede comprender una actividad específica en el rango de aproximadamente 10 a aproximadamente 5000 unidades por miligramo de proteína, o de aproximadamente 7500 a aproximadamente 10.000 unidades por miligramo de proteína. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, puede comprender una actividad específica en el rango de aproximadamente 10 a aproximadamente 2500 unidades por miligramo de proteína. De forma alternativa, la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, comprende una actividad específica en el rango de aproximadamente 10 a aproximadamente 1000 unidades por miligramo de proteína. Un método ejemplar para medir la actividad de diferentes enzimas aldolasas, tales como piruvato aldolasas, tales como HMG y/o KHG aldolasa utiliza un sustrato general, 4-carboxi-4-hidroxi-2-oxoadipato (“CHA”). Un ensayo típico comprende 50 mM fosfato de sodio pH 7,5, 1 mM MgCl2, 1 mM CHA, 10 !g/ml D-lactato deshidrogenasa (“LDH”) de Lactobacillus leichmanii (Sigma-Aldrich, St. Louis, MO), 0,5 mM NADH. El ensayo se inicia agregando la enzima a ser medida. La liberación de piruvato, junto con la formación de NAD+, se monitorea de forma continua en un espectrofotómetro a 340 nm. Una unidad de actividad de enzima se define como la cantidad que libera suficiente piruvato como para disminuir la absorbancia 1 OD por minuto a 340 nm. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase can comprise a specific activity of from about 10 to about 12,000 units per milligram of protein. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can also comprise a specific activity of from about 1,000 to about 10,000 units per milligram of protein, or from about 5,000 to about 7,500 units per milligram of protein . Alternatively, the activity of enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, comprises a specific activity in the range of from about 10 to about 7,500 units per milligram of protein, or from about 5,000 to about 12,000 units per milligram of protein. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can comprise a specific activity in the range of from about 10 to about 5000 units per milligram of protein, or from about 7500 to about 10,000 units per milligram of protein. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can comprise a specific activity in the range of from about 10 to about 2500 units per milligram of protein. Alternatively, the activity of enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, comprises a specific activity in the range of from about 10 to about 1000 units per milligram of protein. An exemplary method of measuring the activity of different aldolase enzymes, such as pyruvate aldolases, such as HMG and / or KHG aldolase, uses a general substrate, 4-carboxy-4-hydroxy-2-oxoadipate ("CHA"). A typical assay comprises 50mM sodium phosphate pH 7.5, 1mM MgCl2, 1mM CHA, 10 µg / ml D-lactate dehydrogenase (“LDH”) from Lactobacillus leichmanii (Sigma-Aldrich, St. Louis, MO) 0.5 mM NADH. The assay is started by adding the enzyme to be measured. Pyruvate release, along with NAD + formation, is continuously monitored on a spectrophotometer at 340 nm. A unit of enzyme activity is defined as the amount that releases enough pyruvate to decrease the absorbance by 1 OD per minute at 340 nm.

La termotolerancia de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, puede comprender la retención de al menos la mitad de la actividad específica de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa luego de calentarse hasta alcanzar una temperatura elevada, tal como una temperatura de aproximadamente 0ºC a aproximadamente 20ºC, aproximadamente 20ºC a aproximadamente 37ºC, aproximadamente 37ºC a aproximadamente 50ºC, aproximadamente 50ºC a aproximadamente 70ºC, Thermo tolerance of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, may comprise the retention of at least half of the specific activity of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase after heating to an elevated temperature, such as a temperature of about 0 ° C to about 20 ° C, about 20 ° C to about 37 ° C, about 37 ° C to about 50 ° C, about 50 ° C to about 70 ° C,

aproximadamente 70ºC a aproximadamente 75ºC, aproximadamente 75ºC a aproximadamente 80ºC, aproximadamente 80ºC a aproximadamente 85ºC, aproximadamente 85ºC a aproximadamente 90ºC, aproximadamente 90ºC a aproximadamente 95ºC, aproximadamente 95ºC a aproximadamente 100ºC, aproximadamente 100ºC a aproximadamente 110ºC o más alta. La termotolerancia también puede comprender la retención de actividad específica de aproximadamente 10 a aproximadamente 12.000 unidades por miligramo de proteína, o de aproximadamente 5000 a aproximadamente 10.000 unidades por miligramo de proteína, luego de calentarse hasta alcanzar una temperatura elevada, como se ha descrito anteriormente. La termotolerancia también puede comprender la retención de actividad específica en el rango de aproximadamente 10 a aproximadamente 5000 unidades por miligramo de proteína luego de calentarse hasta alcanzar una temperatura elevada, como se ha descrito anteriormente. approximately 70ºC to approximately 75ºC, approximately 75ºC to approximately 80ºC, approximately 80ºC to approximately 85ºC, approximately 85ºC to approximately 90ºC, approximately 90ºC to approximately 95ºC, approximately 95ºC to approximately 100ºC, approximately 100ºC to approximately 110ºC or higher. Thermotolerance may also comprise the retention of specific activity of from about 10 to about 12,000 units per milligram of protein, or from about 5000 to about 10,000 units per milligram of protein, after heating to an elevated temperature, as described above. Thermotolerance may also comprise the retention of specific activity in the range of from about 10 to about 5000 units per milligram of protein after heating to an elevated temperature, as described above.

La descripción divulga polipéptidos aislados, sintéticos o recombinantes divulgados en la presente, en donde los polipéptidos comprenden al menos un sitio de glicosilación. En algunas realizaciones, la glicosilación puede ser una glicosilación enlazada a N. El polipéptido puede glicosilarse luego de expresarse en un huésped P. pastoris o S. pombe o en una célula huésped de mamífero. The disclosure discloses isolated, synthetic, or recombinant polypeptides disclosed herein, wherein the polypeptides comprise at least one glycosylation site. In some embodiments, the glycosylation can be an N-linked glycosylation. The polypeptide can be glycosylated after being expressed in a P. pastoris or S. pombe host or in a mammalian host cell.

El polipéptido puede retener actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en condiciones que presentan un pH de aproximadamente 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 o menos (más ácido). El polipéptido también puede retener una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en condiciones que presentan un pH de aproximadamente 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 o más (más básico). El polipéptido puede retener una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, luego de la exposición a condiciones que presentan un pH de aproximadamente 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 o menos (más ácido). El polipéptido también puede retener una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, luego de la exposición a condiciones que presentan un pH de aproximadamente 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 o más (más básico). The polypeptide can retain aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, under conditions having a pH of about 6.5, pH 6, pH 5.5, pH 5, pH 4.5 , pH 4.0, pH 3.5, pH 3.0 or less (more acidic). The polypeptide can also retain an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, under conditions having a pH of about 7, pH 7.5, pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11.0, pH 11.5, pH 12, pH 12.5 or more (more basic). The polypeptide can retain an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, after exposure to conditions having a pH of about 6.5, pH 6, pH 5.5, pH 5 , pH 4.5, pH 4.0, pH 3.5, pH 3.0 or less (more acidic). The polypeptide may also retain an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, after exposure to conditions having a pH of about 7, pH 7.5, pH 8.0, pH 8 , 5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11.0, pH 11.5, pH 12, pH 12.5 or more (more basic).

La enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgada en la presente tiene actividad en condiciones alcalinas, tales como las condiciones alcalinas del intestino, tal como el intestino delgado. El polipéptido puede retener actividad luego de la exposición al pH ácido del estómago. The aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein has activity under alkaline conditions, such as alkaline conditions of the intestine, such as the small intestine. The polypeptide can retain activity after exposure to the acidic pH of the stomach.

La descripción divulga preparaciones de proteína que comprenden un polipéptido (incluyendo péptidos) divulgado en la presente, en donde la preparación de proteína comprende un líquido, un sólido o un gel. La descripción divulga heterodímeros que comprenden un polipéptido divulgado en la presente y un segundo miembro, tal como un polipéptido u otro (segundo) dominio. El segundo miembro del heterodímero puede ser una enzima aldolasa diferente, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, una enzima diferente u otra proteína. El segundo dominio puede ser un polipéptido y el heterodímero puede ser una proteína de fusión. El segundo dominio también puede ser un epítopo o una etiqueta. La descripción además divulga homomultímeros, incluyendo, a modo no taxativo, homodímeros, homotrímeros, homotetrámeros, homopentámeros y homohexámeros, que comprenden un polipéptido divulgado en la presente. The disclosure discloses protein preparations comprising a polypeptide (including peptides) disclosed herein, wherein the protein preparation comprises a liquid, a solid, or a gel. The disclosure discloses heterodimers comprising a polypeptide disclosed herein and a second member, such as a polypeptide or another (second) domain. The second member of the heterodimer may be a different aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, a different enzyme, or another protein. The second domain can be a polypeptide and the heterodimer can be a fusion protein. The second domain can also be an epitope or a tag. The disclosure further discloses homomultimers, including, but not limited to, homodimers, homotrimers, homotetramers, homopentamers, and homohexamers, which comprise a polypeptide disclosed herein.

La descripción divulga polipéptidos inmovilizados (incluyendo péptidos) que tienen actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en donde el polipéptido inmovilizado comprende un polipéptido divulgado en la presente, un polipéptido codificado por un ácido nucleico divulgado en la presente o un polipéptido que comprende un polipéptido divulgado en la presente y un segundo dominio. El polipéptido puede inmovilizarse en una célula, un metal, una resina, un polímero, una cerámica, un vidrio, un microelectrodo, una partícula grafítica, una perla, un gel, una placa, un arreglo o un tubo capilar. The disclosure discloses immobilized polypeptides (including peptides) having aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, wherein the immobilized polypeptide comprises a polypeptide disclosed herein, a nucleic acid encoded polypeptide disclosed herein or a polypeptide comprising a polypeptide disclosed herein and a second domain. The polypeptide can be immobilized in a cell, metal, resin, polymer, ceramic, glass, microelectrode, graphite particle, bead, gel, plate, array, or capillary tube.

La descripción además divulga ensayos que comprenden un ácido nucleico inmovilizado divulgado en la presente, tales como sondas divulgadas en la presente. La descripción también divulga ensayos que comprenden un anticuerpo divulgado en la presente. The disclosure further discloses assays comprising an immobilized nucleic acid disclosed herein, such as probes disclosed herein. The disclosure also discloses assays comprising an antibody disclosed herein.

La descripción divulga anticuerpos aislados, sintéticos o recombinantes que se unen específicamente a un polipéptido divulgado en la presente o a un polipéptido codificado por un ácido nucleico divulgado en la presente. Estos anticuerpos divulgados en la presente pueden ser un anticuerpo monoclonal o policlonal. También se describen hibridomas que comprenden un anticuerpo divulgado en la presente, tal como un anticuerpo que se une específicamente a un polipéptido divulgado en la presente o a un polipéptido codificado por un ácido nucleico divulgado en la presente. La descripción también divulga ácidos nucleicos que codifican estos anticuerpos. The disclosure discloses isolated, synthetic or recombinant antibodies that specifically bind to a polypeptide disclosed herein or to a nucleic acid encoded polypeptide disclosed herein. These antibodies disclosed herein can be a monoclonal or polyclonal antibody. Hybridomas comprising an antibody disclosed herein are also described, such as an antibody that specifically binds to a polypeptide disclosed herein or a nucleic acid encoded polypeptide disclosed herein. The disclosure also discloses nucleic acids encoding these antibodies.

La descripción divulga métodos para aislar o identificar polipéptidos que tienen actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, que comprenden las etapas de: (a) proporcionar un anticuerpo divulgado en la presente; (b) proporcionar una muestra que comprende polipéptidos; y (c) poner en contacto la muestra de la etapa (b) con el anticuerpo de la etapa (a) en condiciones en las cuales el anticuerpo puede unirse específicamente al polipéptido y de esa forma aislar o identificar un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. The disclosure discloses methods for isolating or identifying polypeptides having aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, comprising the steps of: (a) providing an antibody disclosed herein; (b) providing a sample comprising polypeptides; and (c) contacting the sample from step (b) with the antibody from step (a) under conditions in which the antibody can specifically bind to the polypeptide and thereby isolate or identify a polypeptide having an activity of aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase.

Se describen métodos para preparar un anticuerpo anti-enzima aldolasa, tal como anti-piruvato aldolasa, tal como anti-HMG y/o anti-KHG aldolasa que comprenden administrar a un animal no humano un ácido nucleico divulgado en la presente o un polipéptido divulgado en la presente o subsecuencias de los mismos en una cantidad suficiente para generar una respuesta inmune humoral y de esa forma elaborar un anticuerpo anti-enzima aldolasa, tal como anti-piruvato aldolasa, tal como anti-HMG y/o anti-KHG aldolasa. Se describen además métodos para preparar una respuesta inmune anti-aldolasa, tal como anti-piruvato aldolasa, tal como anti-HMG y/o anti-KHG aldolasa (celular o humoral) que comprende administrar a un animal no humano un ácido nucleico divulgado en la presente o un polipéptido divulgado en la presente o subsecuencias de los mismos en una cantidad suficiente para generar una respuesta inmune (celular o humoral). Methods of preparing an anti-aldolase enzyme antibody, such as anti-pyruvate aldolase, such as anti-HMG and / or anti-KHG aldolase are disclosed comprising administering to a non-human animal a nucleic acid disclosed herein or a disclosed polypeptide herein or subsequences thereof in an amount sufficient to generate a humoral immune response and thereby make an anti-aldolase enzyme antibody, such as anti-pyruvate aldolase, such as anti-HMG and / or anti-KHG aldolase. Also disclosed are methods of preparing an anti-aldolase immune response, such as anti-pyruvate aldolase, such as anti-HMG and / or anti-KHG aldolase (cellular or humoral) which comprises administering to a non-human animal a nucleic acid disclosed in the present or a polypeptide disclosed herein or subsequences thereof in an amount sufficient to generate an immune response (cellular or humoral).

Se describen métodos para producir un polipéptido recombinante que comprende las etapas de: (a) proporcionar un ácido nucleico divulgado en la presente operativamente enlazado a un promotor; y (b) expresar el ácido nucleico de la etapa (a) en condiciones que permiten la expresión del polipéptido y de esa forma producir un polipéptido recombinante. En algunas realizaciones, el método puede comprender además transformar una célula huésped con el ácido nucleico de la etapa (a) y a continuación expresar el ácido nucleico de la etapa (a) y de esa forma producir un polipéptido recombinante en una célula transformada. Methods of producing a recombinant polypeptide are described comprising the steps of: (a) providing a nucleic acid disclosed herein operably linked to a promoter; and (b) expressing the nucleic acid from step (a) under conditions that allow expression of the polypeptide and thereby produce a recombinant polypeptide. In some embodiments, the method may further comprise transforming a host cell with the nucleic acid from step (a) and then expressing the nucleic acid from step (a) and thereby producing a recombinant polypeptide in a transformed cell.

Se describen métodos para identificar un polipéptido que tiene actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, que comprenden las siguientes etapas: (a) proporcionar un polipéptido divulgado en la presente; o un polipéptido codificado por un ácido nucleico divulgado en la presente; (b) proporcionar sustrato de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa; y (c) poner en contacto el polipéptido o un fragmento o una variante del mismo de la etapa (a) con el sustrato de la etapa (b) y detectar una disminución en la cantidad de sustrato o un aumento en la cantidad de un producto de reacción, en donde una disminución en la cantidad del sustrato o un aumento en la cantidad del producto de reacción detecta un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. El sustrato puede ser un carbohidrato, un compuesto que comprende un carbohidrato y/o un mimético de carbohidrato. Methods for identifying a polypeptide having aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are described, comprising the following steps: (a) providing a polypeptide disclosed herein; or a nucleic acid encoded polypeptide disclosed herein; (b) providing aldolase enzyme substrate, such as pyruvate aldolase, such as HMG and / or KHG aldolase; and (c) contacting the polypeptide or a fragment or variant thereof of step (a) with the substrate of step (b) and detecting a decrease in the amount of substrate or an increase in the amount of a product. reaction, wherein a decrease in the amount of the substrate or an increase in the amount of the reaction product detects a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The substrate can be a carbohydrate, a compound comprising a carbohydrate and / or a carbohydrate mimetic.

Se describen métodos para identificar sustrato de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa que comprenden las siguientes etapas: (a) proporcionar un polipéptido divulgado en la presente o un polipéptido codificado por un ácido nucleico divulgado en la presente; (b) proporcionar un sustrato de prueba; y (c) poner en contacto el polipéptido de la etapa (a) con el sustrato de prueba de la etapa (b) y detectar una disminución en la cantidad de sustrato o un aumento en la cantidad de producto de reacción, en donde una disminución en la cantidad del sustrato o un aumento en la cantidad de un producto de reacción identifica el sustrato de prueba como un sustrato de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. Methods for identifying aldolase enzyme substrate, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are described comprising the following steps: (a) providing a polypeptide disclosed herein or nucleic acid encoded herein. Present; (b) provide a test substrate; and (c) contacting the polypeptide of step (a) with the test substrate of step (b) and detecting a decrease in the amount of substrate or an increase in the amount of reaction product, wherein a decrease in the amount of the substrate or an increase in the amount of a reaction product identifies the test substrate as an aldolase enzyme substrate, such as pyruvate aldolase, HMG and / or KHG aldolase.

Se describen métodos para determinar si un compuesto de prueba se une específicamente a un polipéptido que comprende las siguientes etapas: (a) expresar un ácido nucleico o un vector que comprende el ácido nucleico en condiciones permisivas para trasladar el ácido nucleico a un polipéptido, en donde el ácido nucleico comprende un ácido nucleico divulgado en la presente, o proporcionar un polipéptido divulgado en la presente; (b) proporcionar un compuesto de prueba; (c) poner en contacto el polipéptido con el compuesto de prueba; y (d) determinar si el compuesto de prueba de la etapa (b) se une específicamente al polipéptido. Methods are described for determining whether a test compound specifically binds to a polypeptide comprising the following steps: (a) expressing a nucleic acid or a vector comprising the nucleic acid under permissive conditions to transfer the nucleic acid to a polypeptide, in where the nucleic acid comprises a nucleic acid disclosed herein, or providing a polypeptide disclosed herein; (b) providing a test compound; (c) contacting the polypeptide with the test compound; and (d) determining whether the test compound of step (b) specifically binds to the polypeptide.

Se describen métodos para identificar un modulador de una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, que comprenden las siguientes etapas: (a) proporcionar un polipéptido divulgado en la presente o un polipéptido codificado por un ácido nucleico divulgado en la presente; (b) proporcionar un compuesto de prueba; (c) poner en contacto el polipéptido de la etapa (a) con el compuesto de prueba de la etapa (b) y medir una actividad de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en donde un cambio en la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, medido en presencia del compuesto de prueba comparado con la actividad en ausencia del compuesto de prueba determina que el compuesto de prueba modula la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, puede medirse proporcionando un sustrato de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa y detectar una disminución en la cantidad del sustrato o un aumento en la cantidad de un producto de reacción, o un aumento en la cantidad del sustrato o una disminución en la cantidad de un producto de reacción. Una disminución en la cantidad del sustrato o un aumento en la cantidad del producto de reacción con el compuesto de prueba en comparación con la cantidad de sustrato o producto de reacción sin el compuesto de prueba identifica el compuesto de prueba como un activador de la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Un aumento en la cantidad del sustrato o una disminución en la cantidad del producto de reacción con el compuesto de prueba en comparación con la cantidad de sustrato o producto de reacción sin el compuesto de prueba identifica el compuesto de prueba como un inhibidor de la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Methods for identifying a modulator of an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are described, comprising the following steps: (a) providing a polypeptide disclosed herein or a polypeptide encoded by a nucleic acid disclosed herein; (b) providing a test compound; (c) contacting the polypeptide of step (a) with the test compound of step (b) and measuring an activity of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, wherein A change in enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, measured in the presence of the test compound compared to activity in the absence of the test compound determines that the test compound modulates the activity of aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be measured by providing an aldolase enzyme substrate, such as pyruvate aldolase, HMG and / or KHG aldolase and detecting a decrease in the amount of the substrate or an increase in the amount of a reaction product, or an increase in the amount of the substrate or a decrease in the amount of a reaction product. A decrease in the amount of the substrate or an increase in the amount of the reaction product with the test compound compared to the amount of substrate or reaction product without the test compound identifies the test compound as an activator of the activity of aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase. An increase in the amount of the substrate or a decrease in the amount of the reaction product with the test compound compared to the amount of substrate or reaction product without the test compound identifies the test compound as an inhibitor of the activity of aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase.

Se describen sistemas informáticos que comprenden un procesador y un dispositivo de almacenamiento de datos, en donde dicho dispositivo de almacenamiento de datos ha almacenado una secuencia de polipéptidos o una secuencia de ácidos nucleicos divulgada en la presente (tal como un polipéptido o péptido codificado por un ácido nucleico divulgado en la presente). El sistema informático además puede comprender un algoritmo de comparación Computer systems comprising a processor and a data storage device are described, wherein said data storage device has stored a polypeptide sequence or nucleic acid sequence disclosed herein (such as a polypeptide or peptide encoded by a nucleic acid disclosed herein). The computer system may further comprise a comparison algorithm.

de secuencias y un dispositivo de almacenamiento de datos que tiene al menos una secuencia de referencia almacenada en el mismo. El algoritmo de comparación de secuencias puede comprender un programa informático que indica polimorfismos. El sistema informático además puede comprender un identificador que identifica una o más características en dicha secuencia. También se divulgan medios legibles por ordenador que tienen almacenada una secuencia de polipéptidos o una secuencia de ácidos nucleicos divulgada en la presente. Se divulgan métodos para identificar una característica en una secuencia que comprenden las etapas de: (a) leer la secuencia utilizando un programa informático que identifica una o más características en una secuencia, en donde la secuencia comprende una secuencia de polipéptidos o una secuencia de ácidos nucleicos divulgada en la presente; y (b) identificar una o más características en la secuencia con el programa informático. Se divulgan métodos para comparar una primera secuencia con una segunda secuencia que comprenden las etapas de: (a) leer la primera secuencia y la segunda secuencia a través del uso de un programa informático que compara secuencias, en donde la primera secuencia comprende una secuencia de polipéptidos o una secuencia de ácidos nucleicos divulgada en la presente; y (b) determinar diferencias entre la primera secuencia y la segunda secuencia con el programa informático. La etapa de determinar diferencias entre la primera secuencia y la segunda secuencia además puede comprender la etapa de identificar polimorfismos. El método puede comprender además un identificador que identifica una o más características en una secuencia. El método puede comprender leer la primera secuencia utilizando un programa informático e identificar una o más características en la secuencia. of sequences and a data storage device having at least one reference sequence stored therein. The sequence comparison algorithm may comprise a computer program that indicates polymorphisms. The computer system may further comprise an identifier that identifies one or more characteristics in said sequence. Computer readable media are also disclosed having stored a polypeptide sequence or a nucleic acid sequence disclosed herein. Methods for identifying a characteristic in a sequence are disclosed comprising the steps of: (a) reading the sequence using a computer program that identifies one or more characteristics in a sequence, wherein the sequence comprises a polypeptide sequence or an acid sequence nucleic acids disclosed herein; and (b) identify one or more characteristics in the sequence with the computer program. Methods for comparing a first sequence with a second sequence are disclosed comprising the steps of: (a) reading the first sequence and the second sequence through the use of a sequence comparing computer program, wherein the first sequence comprises a sequence of polypeptides or a nucleic acid sequence disclosed herein; and (b) determine differences between the first sequence and the second sequence with the computer program. The step of determining differences between the first sequence and the second sequence may further comprise the step of identifying polymorphisms. The method may further comprise an identifier that identifies one or more characteristics in a sequence. The method may comprise reading the first sequence using a computer program and identifying one or more features in the sequence.

Se divulgan métodos para aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, de una muestra, tal como una muestra ambiental, que comprenden las etapas de: (a) proporcionar un par de secuencias cebadoras de amplificación para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en donde el par de cebadores es capaz de amplificar un ácido nucleico divulgado en la presente; (b) aislar un ácido nucleico de la muestra o tratar la muestra de forma tal que el ácido nucleico en la muestra sea accesible para la hibridación con el par de cebadores de amplificación; y (c) combinar el ácido nucleico de la etapa (b) con el par de cebadores de amplificación de la etapa Methods are disclosed for isolating or recovering a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, from a sample, such as an environmental sample, comprising the steps of: (a) providing a pair of amplification primer sequences to amplify a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, wherein the pair of primers it is capable of amplifying a nucleic acid disclosed herein; (b) isolating a nucleic acid from the sample or treating the sample such that the nucleic acid in the sample is accessible for hybridization with the pair of amplification primers; and (c) combining the nucleic acid from step (b) with the pair of amplification primers from step

(a)(to)
y amplificar ácido nucleico de la muestra y de esa forma aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, de una muestra. Uno o cada miembro del par de secuencias cebadoras de amplificación pueden comprender un oligonucleótido que comprende un par de secuencias cebadoras de amplificación divulgadas en la presente, por ejemplo con al menos aproximadamente 10 a 50 bases consecutivas de una secuencia divulgada en la presente. La muestra puede ser una muestra ambiental.  and amplifying nucleic acid from the sample and thereby isolating or recovering a nucleic acid encoding a polypeptide having an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, from a sample. One or each member of the pair of amplification primer sequences may comprise an oligonucleotide comprising a pair of amplification primer sequences disclosed herein, eg with at least about 10 to 50 consecutive bases of a sequence disclosed herein. The sample may be an environmental sample.

Se divulgan métodos para aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, de una muestra, tal como una muestra ambiental, que comprenden las etapas de: (a) proporcionar una sonda de polinucleótidos que comprende un ácido nucleico divulgado en la presente o una subsecuencia del mismo; (b) aislar un ácido nucleico de la muestra Methods are disclosed for isolating or recovering a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, from a sample, such as an environmental sample, comprising the steps of: (a) providing a polynucleotide probe comprising a nucleic acid disclosed herein or a subsequence thereof; (b) isolating a nucleic acid from the sample

o tratar la muestra de forma tal que el ácido nucleico en la muestra sea accesible para la hibridación con una sonda de polinucleótidos de la etapa (a); (c) combinar el ácido nucleico aislado o la prueba tratada de la etapa (b) con la sonda de polinucleótidos de la etapa (a); y (d) aislar un ácido nucleico que se hibrida específicamente con la sonda de polinucleótidos de la etapa (a) y de esa forma aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, de una muestra. La muestra puede comprender una muestra de agua, una muestra líquida, una muestra de suelo, una muestra de aire o una muestra biológica. La muestra biológica puede derivarse de una célula bacteriana, una célula de protozoario, una célula de insecto, una célula de levadura, una célula de planta, una célula fúngica o una célula de mamífero. La muestra puede ser una muestra ambiental. or treating the sample such that the nucleic acid in the sample is accessible for hybridization with a polynucleotide probe from step (a); (c) combining the isolated nucleic acid or the treated test from step (b) with the polynucleotide probe from step (a); and (d) isolating a nucleic acid that specifically hybridizes with the polynucleotide probe of step (a) and thereby isolating or recovering a nucleic acid encoding a polypeptide having an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, from a sample. The sample may comprise a water sample, a liquid sample, a soil sample, an air sample, or a biological sample. The biological sample can be derived from a bacterial cell, a protozoan cell, an insect cell, a yeast cell, a plant cell, a fungal cell, or a mammalian cell. The sample may be an environmental sample.

Se divulgan métodos para generar una variante de un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, que comprenden las etapas de: (a) proporcionar un ácido nucleico plantilla que comprende un ácido nucleico divulgado en la presente; y Methods for generating a variant of a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are disclosed, comprising the steps of: (a) providing a nucleic acid template comprising a nucleic acid disclosed herein; and

(b)(b)
modificar, eliminar o agregar uno o más nucleótidos en la secuencia de la plantilla o una combinación de los mismos, para generar una variante del ácido nucleico plantilla. El método puede comprender además expresar el ácido nucleico variante para generar una aldolasa variante, tal como polipéptido de enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa. Las modificaciones, adiciones o eliminaciones pueden introducirse mediante un método que comprende PCR susceptible a errores, transposición, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagénesis in vivo, mutagénesis de cassette, mutagénesis de conjunto recursivo, mutagénesis de conjunto exponencial, mutagénesis específica de sitio, reensamblaje de genes, Mutagénesis de Saturación de Sitios de Genes (GSSM), reensamblaje de ligación sintética (SLR), Mutagénesis de Saturación Cromosómica (CSM) o una combinación de los mismos. De forma alternativa, las modificaciones, adiciones o eliminaciones se introducen mediante un método que comprende recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificado por fosfotioato, mutagénesis de plantilla que contiene uracilo, mutagénesis de dúplex discontinuo, mutagénesis de reparación de no coincidencia puntual, mutagénesis de cepa huésped de reparación deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis de eliminación, mutagénesis de selección de restricción, mutagénesis de purificación de restricción, síntesis génica artificial, mutagénesis de conjunto, creación de multímeros de ácidos nucleicos quiméricos y una combinación de los mismos.  modify, delete or add one or more nucleotides in the template sequence or a combination thereof, to generate a variant of the template nucleic acid. The method may further comprise expressing the variant nucleic acid to generate a variant aldolase, such as pyruvate aldolase enzyme polypeptide, such as HMG and / or KHG aldolase. Modifications, additions, or deletions can be introduced by a method comprising error-prone PCR, transposition, oligonucleotide-directed mutagenesis, assembly PCR, sexual PCR mutagenesis, in vivo mutagenesis, cassette mutagenesis, recursive ensemble mutagenesis, ensemble mutagenesis exponential, site specific mutagenesis, gene reassembly, Gene Site Saturation Mutagenesis (GSSM), synthetic ligation reassembly (SLR), Chromosome Saturation Mutagenesis (CSM) or a combination thereof. Alternatively, modifications, additions, or deletions are introduced by a method comprising recombination, recursive sequence recombination, phosphothioate-modified DNA mutagenesis, uracil-containing template mutagenesis, discontinuous duplex mutagenesis, point mismatch repair mutagenesis , poorly repairing host strain mutagenesis, chemical mutagenesis, radiogenic mutagenesis, deletion mutagenesis, restriction selection mutagenesis, restriction purification mutagenesis, artificial gene synthesis, ensemble mutagenesis, creation of chimeric nucleic acid multimers and a combination of the same.

El método puede repetirse hasta que se produzca una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa que tenga una actividad alterada o diferente o una estabilidad alterada o diferente de la de un polipéptido codificado por el ácido nucleico plantilla. El polipéptido de enzima aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa, variante puede ser termotolerante y retener cierta actividad luego de exponerse a una temperatura elevada. La variante aldolasa, tal como polipéptido de enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa puede haber aumentado la glicosilación en comparación con la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa codificada por un ácido nucleico plantilla. De forma alternativa, el polipéptido de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, variante tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, a una alta temperatura, en donde la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa codificada por el ácido nucleico plantilla no es activa a altas temperaturas. El método también puede repetirse hasta que se produzca una secuencia de codificación de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa que tenga un uso de codón alterado con respecto al del ácido nucleico plantilla. El método también puede repetirse hasta que se produzca un gen de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa que tenga mayor o menor nivel de expresión del mensaje o estabilidad que el ácido nucleico plantilla. The method may be repeated until an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase having altered or different activity or altered or different stability from that of a polypeptide encoded by the template nucleic acid is produced. The aldolase enzyme polypeptide, such as pyruvate aldolase enzyme, such as HMG and / or KHG aldolase, variant may be thermotolerant and retain some activity after exposure to an elevated temperature. The aldolase variant, such as pyruvate aldolase enzyme polypeptide, such as HMG and / or KHG aldolase may have increased glycosylation compared to the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase encoded by a nucleic acid template. Alternatively, the aldolase polypeptide, such as pyruvate aldolase, such as HMG and / or KHG aldolase, variant has an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, at a high temperature, wherein the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase encoded by the template nucleic acid is not active at high temperatures. The method can also be repeated until an aldolase enzyme coding sequence occurs, such as pyruvate aldolase, HMG and / or KHG aldolase having altered codon usage relative to that of template nucleic acid. The method can also be repeated until an aldolase enzyme gene, such as pyruvate aldolase, HMG and / or KHG aldolase, is produced that has a higher or lower level of message expression or stability than the template nucleic acid.

Se describen métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, para aumentar su expresión en una célula huésped, comprendiendo dicho método las siguientes etapas: (a) proporcionar un ácido nucleico divulgado en la presente que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa; y (b) identificar un codón no preferido o menos preferido en el ácido nucleico de la etapa (a) y reemplazarlo por un codón preferido o utilizado de forma neutra que codifica el mismo aminoácido que el codón reemplazado, en donde un codón preferido es un codón sobrerrepresentado en secuencias de codificación en genes en la célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias de codificación en genes en la célula huésped y de esa forma modificar el ácido nucleico para aumentar su expresión en una célula huésped. Methods are described for modifying codons in a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, to increase its expression in a host cell, said method comprising the following steps: (a) providing a nucleic acid disclosed herein that encodes a polypeptide having an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase; and (b) identifying a non-preferred or less preferred codon in the nucleic acid of step (a) and replacing it with a preferred or neutrally used codon encoding the same amino acid as the replaced codon, wherein a preferred codon is a codon overrepresented in gene encoding sequences in the host cell and a non-preferred or less preferred codon is an underrepresented codon in gene encoding sequences in the host cell and thereby modify nucleic acid to increase its expression in a host cell .

Se divulgan métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, comprendiendo dicho método las siguientes etapas: (a) proporcionar un ácido nucleico divulgado en la presente; y (b) identificar un codón en el ácido nucleico de la etapa (a) y reemplazarlo por un codón diferente que codifica el mismo aminoácido que el codón reemplazado y de esa forma modificar codones en un ácido nucleico que codifica una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. Methods are disclosed for modifying codons in a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, said method comprising the following steps: (a) providing a nucleic acid disclosed herein; and (b) identifying a codon in the nucleic acid from step (a) and replacing it with a different codon encoding the same amino acid as the replaced codon and thereby modifying codons in a nucleic acid encoding an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase.

Se divulgan métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, para aumentar su expresión en una célula huésped, comprendiendo dicho método las siguientes etapas: (a) proporcionar un ácido nucleico divulgado en la presente que codifica un polipéptido de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa; y (b) identificar un codón no preferido o menos preferido en el ácido nucleico de la etapa (a) y reemplazarlo por un codón preferido o utilizado de forma neutra que codifica el mismo aminoácido que el codón reemplazado, en donde un codón preferido es un codón sobrerrepresentado en secuencias de codificación en genes en la célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias de codificación en genes en la célula huésped y de esa forma modificar el ácido nucleico para aumentar su expresión en una célula huésped. Methods are disclosed for modifying codons in a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, to increase its expression in a host cell, said method comprising the following Steps: (a) providing a nucleic acid disclosed herein that encodes an aldolase enzyme polypeptide, such as pyruvate aldolase, HMG and / or KHG aldolase; and (b) identifying a non-preferred or less preferred codon in the nucleic acid of step (a) and replacing it with a preferred or neutrally used codon encoding the same amino acid as the replaced codon, wherein a preferred codon is a codon overrepresented in gene encoding sequences in the host cell and a non-preferred or less preferred codon is an underrepresented codon in gene encoding sequences in the host cell and thereby modify nucleic acid to increase its expression in a host cell .

Se divulgan métodos para modificar un codón en un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, para disminuir su expresión en una célula huésped, comprendiendo dicho método las siguientes etapas: (a) proporcionar un ácido nucleico divulgado en la presente; y (b) identificar al menos un codón preferido en el ácido nucleico de la etapa (a) y reemplazarlo por un codón no preferido o menos preferido que codifica el mismo aminoácido que el codón reemplazado, en donde un codón preferido es un codón sobrerrepresentado en secuencias de codificación en genes en una célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias de codificación en genes en la célula huésped y de esa forma modificar el ácido nucleico para disminuir su expresión en una célula huésped. La célula huésped puede ser una célula bacteriana, una célula fúngica, una célula de insecto, una célula de levadura, una célula de planta o una célula de mamífero. Methods are disclosed for modifying a codon in a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, to decrease its expression in a host cell, said method comprising the following steps: (a) providing a nucleic acid disclosed herein; and (b) identify at least one preferred codon in the nucleic acid of step (a) and replace it with a non-preferred or less preferred codon encoding the same amino acid as the replaced codon, wherein a preferred codon is an over-represented codon in gene coding sequences in a host cell and a non-preferred or less preferred codon is an underrepresented codon in gene coding sequences in the host cell and thereby modify nucleic acid to decrease its expression in a host cell. The host cell may be a bacterial cell, a fungal cell, an insect cell, a yeast cell, a plant cell, or a mammalian cell.

Se divulgan métodos para producir una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos o sitios de unión a sustrato de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, modificados, en donde los sitios activos o sitios de unión a sustrato modificados derivan de un primer ácido nucleico que comprende una secuencia que codifica un primer sitio activo o un primer sitio de unión a sustrato, comprendiendo dicho método las siguientes etapas: (a) proporcionar un primer ácido nucleico que codifica un primer sitio activo o primer sitio de unión a sustrato, en donde la primera secuencia de ácido nucleico comprende una secuencia que se hidrida en condiciones rigurosas con un ácido nucleico divulgado en la presente, y el ácido nucleico codifica un sitio activo de una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa o un sitio de unión a sustrato de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa; (b) proporcionar un Methods for producing a nucleic acid library encoding a plurality of active sites or substrate binding sites of enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are disclosed, wherein the active sites or sites Substrate binding techniques are derived from a first nucleic acid comprising a sequence encoding a first active site or a first substrate binding site, said method comprising the following steps: (a) providing a first nucleic acid encoding a first site active or first substrate binding site, wherein the first nucleic acid sequence comprises a sequence that hydrides under stringent conditions with a nucleic acid disclosed herein, and the nucleic acid encodes an active site of an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase or an aldolase enzyme substrate binding site, such as pyruvate aldolase, HMG and / or KHG aldolase; (b) provide a

conjunto de oligonucleótidos mutagénicos que codifican variantes de aminoácido naturales en una pluralidad de codones objetivo en el primer ácido nucleico; y (c) utilizar el conjunto de oligonucleótidos mutagénicos para generar un conjunto de ácidos nucleicos variantes de codificación de sitios activos o de codificación de sitios de unión a sustrato que codifican un rango de variaciones de aminoácidos en cada codón de aminoácido que fue mutagenizado y de esa forma producir una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos o sitios de unión a sustrato de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa modificados. El método puede comprender mutagenizar el primer ácido nucleico de la etapa (a) mediante un método que comprende un sistema de evolución dirigida optimizado, Mutagénesis de Saturación de Sitios de Genes (GSSM), reensamblaje por ligamiento sintético (SLR), PCR susceptible a errores, transposición, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagénesis in vivo, mutagénesis de cassette, mutagénesis de conjunto recursivo, mutagénesis de conjunto exponencial, mutagénesis específica de sitio, reensamblaje de genes y una combinación de los mismos. El método también puede comprender mutagenizar el primer ácido nucleico de la etapa (a) o variantes mediante un método que comprende recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificado por fosfotioato, mutagénesis de plantilla que contiene uracilo, mutagénesis de dúplex discontinuo, mutagénesis de reparación de no coincidencia puntual, mutagénesis de cepa huésped de reparación deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis de eliminación, mutagénesis de selección de restricción, mutagénesis de purificación de restricción, síntesis génica artificial, mutagénesis de conjunto, creación de multímeros de ácidos nucleicos quiméricos y una combinación de los mismos. set of mutagenic oligonucleotides that encode natural amino acid variants in a plurality of target codons in the first nucleic acid; and (c) using the set of mutagenic oligonucleotides to generate a set of active site coding or substrate binding site coding variant nucleic acids encoding a range of amino acid variations at each amino acid codon that was mutagenized and that way produce a library of nucleic acids encoding a plurality of enzyme aldolase active sites or substrate binding sites, such as pyruvate aldolase, such as HMG and / or modified KHG aldolase. The method may comprise mutagenizing the first nucleic acid of step (a) by a method comprising an optimized targeted evolution system, Gene Site Saturation Mutagenesis (GSSM), synthetic ligation reassembly (SLR), error-susceptible PCR , transposition, oligonucleotide-directed mutagenesis, assembly PCR, sexual PCR mutagenesis, in vivo mutagenesis, cassette mutagenesis, recursive assembly mutagenesis, exponential assembly mutagenesis, site-specific mutagenesis, gene reassembly, and a combination thereof. The method may also comprise mutagenizing the first nucleic acid of step (a) or variants by a method comprising recombination, recursive sequence recombination, phosphothioate-modified DNA mutagenesis, uracil-containing template mutagenesis, batch duplex mutagenesis, mutagenesis point mismatch repair gene, poorly repaired host strain mutagenesis, chemical mutagenesis, radiogenic mutagenesis, deletion mutagenesis, restriction selection mutagenesis, restriction purification mutagenesis, artificial gene synthesis, pool mutagenesis, acid multimer creation chimeric nucleic acids and a combination thereof.

También se divulgan métodos para obtener una molécula pequeña que comprenden las siguientes etapas: (a) proporcionar una pluralidad de enzimas biosintéticas capaces de sintetizar o modificar una molécula pequeña, en donde una de las enzimas comprende una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa codificada por un ácido nucleico divulgado en la presente; (b) proporcionar un sustrato para al menos una de las enzimas de la etapa (a); y (c) hacer reaccionar el sustrato de la etapa (b) con las enzimas en condiciones que facilitan una pluralidad de reacciones biocatalíticas para generar una molécula pequeña mediante una serie de reacciones biocatalíticas. Se describen además métodos para modificar una molécula pequeña que comprenden las siguientes etapas: (a) proporcionar una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, en donde la enzima comprende un polipéptido divulgado en la presente, o un polipéptido codificado por un ácido nucleico divulgado en la presente o una subsecuencia del mismo; (b) proporcionar una molécula pequeña; y (c) hacer reaccionar la enzima de la etapa (a) con la molécula pequeña de la etapa (b) en condiciones que facilitan una reacción enzimática catalizada por la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa y de esa forma modificar una molécula pequeña mediante una reacción enzimática de aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. El método puede comprender una pluralidad de sustratos de molécula pequeña para la enzima de la etapa (a) y de esa forma generar una biblioteca de moléculas pequeñas modificadas producidas mediante al menos una reacción enzimática catalizada por la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. El método puede comprender una pluralidad de enzimas adicionales en condiciones que facilitan una pluralidad de reacciones biocatalíticas por parte de las enzimas para formar una biblioteca de moléculas pequeñas modificadas producidas por la pluralidad de reacciones enzimáticas. El método puede comprender además la etapa de evaluar la biblioteca para determinar si una molécula pequeña modificada particular que exhibe una actividad deseada se encuentra presente en la biblioteca. La etapa de evaluación de la biblioteca además puede comprender las etapas de eliminar sistemáticamente todas menos una de las reacciones biocatalíticas utilizadas para producir una porción de la pluralidad de las moléculas pequeñas modificadas dentro de la biblioteca mediante evaluación de la porción de la molécula pequeña modificada para detectar la presencia o ausencia de la molécula pequeña particular modificada con una actividad deseada, e identificar al menos una reacción biocatalítica específica que produzca la molécula pequeña particular modificada de actividad deseada. Methods for obtaining a small molecule are also disclosed, comprising the following steps: (a) providing a plurality of biosynthetic enzymes capable of synthesizing or modifying a small molecule, wherein one of the enzymes comprises an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase encoded by a nucleic acid disclosed herein; (b) providing a substrate for at least one of the enzymes in step (a); and (c) reacting the substrate of step (b) with the enzymes under conditions that facilitate a plurality of biocatalytic reactions to generate a small molecule by a series of biocatalytic reactions. Methods for modifying a small molecule are further described which comprise the following steps: (a) providing an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, wherein the enzyme comprises a polypeptide disclosed herein, or a polypeptide encoded by a nucleic acid disclosed herein or a subsequence thereof; (b) providing a small molecule; and (c) reacting the enzyme from step (a) with the small molecule from step (b) under conditions that facilitate an enzyme reaction catalyzed by the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase. and thereby modifying a small molecule by an enzymatic aldolase reaction, such as pyruvate aldolase, HMG and / or KHG aldolase. The method may comprise a plurality of small molecule substrates for the enzyme in step (a) and thereby generate a library of modified small molecules produced by at least one enzyme reaction catalyzed by the enzyme aldolase, such as pyruvate aldolase, such such as HMG and / or KHG aldolase. The method may comprise a plurality of additional enzymes under conditions that facilitate a plurality of biocatalytic reactions by the enzymes to form a library of modified small molecules produced by the plurality of enzymatic reactions. The method may further comprise the step of evaluating the library to determine if a particular modified small molecule that exhibits a desired activity is present in the library. The library evaluation step may further comprise the steps of systematically eliminating all but one of the biocatalytic reactions used to produce a portion of the plurality of the modified small molecules within the library by evaluating the portion of the modified small molecule to detecting the presence or absence of the particular modified small molecule with a desired activity, and identifying at least one specific biocatalytic reaction that produces the particular modified small molecule of desired activity.

Se describen métodos para determinar un fragmento funcional de una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa que comprenden las etapas de: (a) proporcionar una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, en donde la enzima comprende un polipéptido divulgado en la presente o un polipéptido codificado por un ácido nucleico divulgado en la presente o una subsecuencia del mismo; y (b) eliminar una pluralidad de residuos de aminoácidos de la secuencia de la etapa (a) y evaluar la subsecuencia remanente para detectar una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa y de esa forma determinar un fragmento funcional de una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa se mide proporcionando un sustrato de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa y detectar una disminución en la cantidad del sustrato o un aumento en la cantidad de un producto de reacción. Methods for determining a functional fragment of an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, are described comprising the steps of: (a) providing an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, wherein the enzyme comprises a polypeptide disclosed herein or a nucleic acid encoded polypeptide disclosed herein or a subsequence thereof; and (b) removing a plurality of amino acid residues from the sequence of step (a) and evaluating the remaining subsequence to detect an activity of enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase and thus determining a functional fragment of an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase is measured by providing an aldolase enzyme substrate, such as pyruvate aldolase, HMG and / or KHG aldolase and detecting a decrease in the amount of the substrate or a increase in the amount of a reaction product.

Se divulgan métodos para manipulación de células enteras de fenotipos nuevos o modificados utilizando análisis de flujo metabólico en tiempo real, comprendiendo dicho método las siguientes etapas: (a) obtener una célula modificada modificando la composición genética de una célula, en donde la composición genética se modifica por la adición a la célula de un ácido nucleico de acuerdo con la invención; (b) cultivar la célula modificada para generar una pluralidad de células modificadas; (c) medir al menos un parámetro metabólico de la célula monitoreando el cultivo celular de la etapa (b) en tiempo real; y (d) analizar los datos de la etapa (c) para determinar si el parámetro medido difiere de una medición comparable en una célula no modificada en condiciones similares y, de esta forma, identificar un fenotipo manipulado en la célula utilizando análisis de flujo metabólico en tiempo real. En algunas Methods for manipulating whole cells of new or modified phenotypes using real-time metabolic flow analysis are disclosed, said method comprising the following steps: (a) obtaining a modified cell by modifying the genetic composition of a cell, where the genetic composition is modified by the addition to the cell of a nucleic acid according to the invention; (b) culturing the modified cell to generate a plurality of modified cells; (c) measuring at least one metabolic parameter of the cell by monitoring the cell culture of step (b) in real time; and (d) analyze the data from step (c) to determine if the measured parameter differs from a comparable measurement in an unmodified cell under similar conditions, and thereby identify a manipulated phenotype in the cell using metabolic flow analysis. in real time. In some

realizaciones, la composición genética de la célula puede modificarse mediante un método que comprende la eliminación de una secuencia o la modificación de una secuencia en la célula o desactivar la expresión de un gen. El método puede comprender además seleccionar una célula que comprenda un fenotipo recién manipulado. El método puede comprender cultivar la célula seleccionada y generar así una nueva cepa celular que comprende un fenotipo recién manipulado. In embodiments, the genetic makeup of the cell can be modified by a method that comprises deleting a sequence or modifying a sequence in the cell, or disabling expression of a gene. The method may further comprise selecting a cell that comprises a newly manipulated phenotype. The method may comprise culturing the selected cell and thus generating a new cell strain comprising a newly manipulated phenotype.

Se describen métodos para aumentar la termotolerancia o termoestabilidad de un polipéptido de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, comprendiendo el método glicosilar un polipéptido de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, en donde el polipéptido comprende al menos treinta aminoácidos contiguos de un polipéptido divulgado en la presente; o un polipéptido codificado por una secuencia de ácidos nucleicos divulgada en la presente y de esa forma aumentar la termotolerancia o termoestabilidad del polipéptido de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. La actividad específica de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede ser termoestable o termotolerante a una temperatura en el rango entre más de aproximadamente 37ºC a aproximadamente 95ºC. Methods are described for increasing the heat tolerance or thermostability of an aldolase enzyme polypeptide, such as pyruvate aldolase, HMG and / or KHG aldolase, the glycosylating method comprising an aldolase enzyme polypeptide, such as pyruvate aldolase, HMG and / or KHG aldolase, wherein the polypeptide comprises at least thirty contiguous amino acids of a polypeptide disclosed herein; or a polypeptide encoded by a nucleic acid sequence disclosed herein and thereby increase the heat tolerance or thermostability of the aldolase polypeptide, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The specific activity of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase can be thermostable or thermotolerant at a temperature in the range of from more than about 37 ° C to about 95 ° C.

Se divulgan métodos para sobreexpresar un polipéptido de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, recombinante en una célula que comprenden expresar un vector que comprende un ácido nucleico que comprende un ácido nucleico divulgado en la presente o una secuencia de ácidos nucleicos divulgada en la presente, en donde las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante inspección visual, en donde la sobreexpresión se lleva a cabo mediante el uso de un promotor de alta actividad, un vector dicistrónico o mediante amplificación del gen del vector. Methods are disclosed for overexpressing an aldolase polypeptide, such as pyruvate aldolase, such as HMG and / or KHG aldolase, in a cell comprising expressing a vector comprising a nucleic acid comprising a nucleic acid disclosed herein or a sequence of nucleic acids disclosed herein, where sequence identities are determined by analysis with a sequence comparison algorithm or by visual inspection, where overexpression is carried out by using a high activity promoter, a vector dicistronic or by amplification of the vector gene.

Se divulgan métodos para preparar una planta transgénica que comprenden las siguientes etapas: (a) introducir una secuencia heteróloga de ácidos nucleicos en la célula, en donde la secuencia nucleica heteróloga comprende una secuencia de ácidos nucleicos divulgada en la presente y de esa forma producir una célula de planta transformada; y Methods for preparing a transgenic plant are disclosed comprising the following steps: (a) introducing a heterologous nucleic acid sequence into the cell, wherein the heterologous nucleic sequence comprises a nucleic acid sequence disclosed herein and thereby produce a transformed plant cell; and

(b) producir una planta transgénica a partir de la célula transformada. La etapa (a) además puede comprender introducir la secuencia heteróloga de ácidos nucleicos mediante electroporación o microinyección de protoplastos de célula de planta. La etapa (a) además puede comprender introducir la secuencia heteróloga de ácidos nucleicos directamente al tejido de la planta mediante bombardeo con partículas de ADN. De forma alternativa, la etapa (a) además puede comprender introducir la secuencia heteróloga de ácidos nucleicos en el ADN de la célula de planta utilizando un huésped Agrobacterium tumefaciens. La célula de planta puede ser célula de caña de azúcar, remolacha, soja, tomate, patata, maíz, arroz, trigo, tabaco o cebada. (b) produce a transgenic plant from the transformed cell. Step (a) may further comprise introducing the heterologous nucleic acid sequence by electroporation or microinjection of plant cell protoplasts. Step (a) may further comprise introducing the heterologous nucleic acid sequence directly into the plant tissue by bombardment with DNA particles. Alternatively, step (a) may further comprise introducing the heterologous nucleic acid sequence into the DNA of the plant cell using an Agrobacterium tumefaciens host. The plant cell may be a sugarcane, beet, soy, tomato, potato, corn, rice, wheat, tobacco or barley cell.

También se divulgan métodos para expresar una secuencia heteróloga de ácidos nucleicos en una célula de planta que comprenden las siguientes etapas: (a) transformar la célula de planta con una secuencia heteróloga de ácidos nucleicos operativamente enlazado a un promotor, en donde la secuencia nucleica heteróloga comprende un ácido nucleico divulgado en la presente; (b) cultivar la planta en condiciones en las cuales la secuencia heteróloga de ácidos nucleicos se expresa en la célula de planta. Se describen métodos para expresar una secuencia heteróloga de ácidos nucleicos en una célula de planta que comprenden las siguientes etapas: (a) transformar la célula de planta con una secuencia heteróloga de ácidos nucleicos operativamente enlazado a un promotor, en donde la secuencia nucleica heteróloga comprende una secuencia divulgada en la presente; (b) cultivar la planta en condiciones en las cuales la secuencia heteróloga de ácidos nucleicos se expresa en la célula de planta. Methods are also disclosed for expressing a heterologous nucleic acid sequence in a plant cell comprising the following steps: (a) transforming the plant cell with a heterologous nucleic acid sequence operably linked to a promoter, wherein the heterologous nucleic sequence it comprises a nucleic acid disclosed herein; (b) cultivating the plant under conditions in which the heterologous nucleic acid sequence is expressed in the plant cell. Methods are described for expressing a heterologous nucleic acid sequence in a plant cell comprising the following steps: (a) transforming the plant cell with a heterologous nucleic acid sequence operably linked to a promoter, wherein the heterologous nucleic sequence comprises a sequence disclosed herein; (b) cultivating the plant under conditions in which the heterologous nucleic acid sequence is expressed in the plant cell.

La invención proporciona alimentos o piensos que comprenden un polipéptido divulgado en la presente o un polipéptido codificado por un ácido nucleico divulgado en la presente. También se divulgan alimentos, piensos, líquidos, tales como bebidas (tales como jugos de frutas o cerveza), panes o masas o productos panificados o precursores de bebidas (tales como mosto), que comprenden un polipéptido divulgado en la presente. Se describen además aditivos para alimentos, piensos o bebidas que comprenden un polipéptido divulgado en la presente. También se divulgan alimentos o complementos nutricionales, tales como para un humano o un animal, que comprenden un polipéptido divulgado en la presente, tal como un polipéptido codificado por el ácido nucleico divulgado en la presente. The invention provides food or feed comprising a polypeptide disclosed herein or a nucleic acid encoded polypeptide disclosed herein. Also disclosed are foods, feed, liquids, such as beverages (such as fruit juices or beer), breads or doughs, or baked goods or beverage precursors (such as wort), which comprise a polypeptide disclosed herein. Further described are additives for food, feed or beverages comprising a polypeptide disclosed herein. Food or nutritional supplements, such as for a human or an animal, are also disclosed that comprise a polypeptide disclosed herein, such as a nucleic acid encoded polypeptide disclosed herein.

El polipéptido en el alimento o complemento nutricional puede ser glicosilado. También se divulgan matrices de administración de enzima comestible que comprenden un polipéptido divulgado en la presente, tal como un polipéptido codificado por el ácido nucleico divulgado en la presente. La matriz de administración puede comprender un granulado. El polipéptido puede ser glicosilado. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede ser termotolerante. La actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede ser termoestable. The polypeptide in the food or nutritional supplement can be glycosylated. Edible enzyme delivery matrices are also disclosed that comprise a polypeptide disclosed herein, such as a nucleic acid encoded polypeptide disclosed herein. The delivery matrix can comprise a granulate. The polypeptide can be glycosylated. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase may be heat tolerant. Aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase can be thermostable.

Se divulgan alimentos, piensos o complementos nutricionales que comprenden un polipéptido divulgado en la presente. Se describen métodos para utilizar una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa como un complemento nutricional en una dieta animal, comprendiendo dicho método: preparar un complemento nutricional que contiene una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa que comprende al menos treinta aminoácidos contiguos de un polipéptido divulgado en la presente; y administrar el complemento nutricional a un animal. El animal puede ser un humano, un rumiante o un animal monogástrico. La enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede prepararse mediante expresión Food, feed or nutritional supplements are disclosed that comprise a polypeptide disclosed herein. Methods are described for using an enzyme aldolase, such as pyruvate aldolase, HMG and / or KHG aldolase as a nutritional supplement in an animal diet, said method comprising: preparing a nutritional supplement containing an enzyme aldolase, such as pyruvate aldolase, HMG and / or KHG aldolase comprising at least thirty contiguous amino acids of a polypeptide disclosed herein; and administer the nutritional supplement to an animal. The animal can be a human, a ruminant, or a monogastric animal. The aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase can be prepared by expression

de un polinucleótido que codifica la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa en un organismo que se selecciona del grupo que consiste en una bacteria, una levadura, una planta, un insecto, un hongo y un animal. El organismo puede seleccionarse del grupo que consiste en un S. pombe, S. cerevisiae, Pichia pastoris, E. coli, Streptomyces sp., Bacillus sp. Pseudomonas sp., Aspergillus sp. y Lactobacillus sp. of a polynucleotide encoding the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase in an organism selected from the group consisting of a bacterium, a yeast, a plant, an insect, a fungus, and an animal . The organism can be selected from the group consisting of S. pombe, S. cerevisiae, Pichia pastoris, E. coli, Streptomyces sp., Bacillus sp. Pseudomonas sp., Aspergillus sp. and Lactobacillus sp.

Se divulgan matrices de administración de enzima comestible que comprenden una enzima aldolasa recombinante termoestable, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, tal como un polipéptido divulgado en la presente. Se divulgan métodos para administrar un complemento de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa a un animal, comprendiendo dicho método: preparar una matriz de administración de enzima comestible en forma de granulados que comprenden un portador comestible granulado y una enzima aldolasa recombinante termoestable, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en donde los granulados fácilmente dispersan la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa contenida en los mismos en el medio acuoso, y administrar la matriz de administración de enzima comestible al animal. La enzima aldolasa recombinante, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede comprender un polipéptido divulgado en la presente. La enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede ser glucosada para proporcionar termoestabilidad en las condiciones de granulación. La matriz de administración puede formarse mediante granulación de una mezcla que comprende un germen de grano y una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. Las condiciones de granulación pueden incluir aplicación de vapor. Las condiciones de granulación pueden comprender aplicación de una temperatura superior a aproximadamente 80ºC durante aproximadamente 5 minutos y la enzima retiene una actividad específica de al menos 350 a aproximadamente 900 unidades por miligramo de enzima. Edible enzyme delivery matrices are disclosed comprising a thermostable recombinant aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, such as a polypeptide disclosed herein. Methods for administering an enzyme aldolase supplement such as pyruvate aldolase, HMG and / or KHG aldolase to an animal are disclosed, said method comprising: preparing an edible enzyme delivery matrix in the form of granules comprising a granulated edible carrier and a Recombinant thermostable aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, where the granules readily disperse the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase contained therein in the aqueous medium , and administer the edible enzyme delivery matrix to the animal. The recombinant aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase can comprise a polypeptide disclosed herein. The aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be glucoseed to provide thermostability under the granulating conditions. The delivery matrix can be formed by granulating a mixture comprising a grain germ and an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase. Granulation conditions may include steam application. Granulation conditions may comprise applying a temperature above about 80 ° C for about 5 minutes and the enzyme retains a specific activity of at least 350 to about 900 units per milligram of enzyme.

Se describen además composiciones farmacéuticas que comprenden una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa divulgada en la presente o un polipéptido codificado por un ácido nucleico divulgado en la presente. La composición farmacéutica puede actuar como un auxiliar digestivo. Further disclosed are pharmaceutical compositions comprising an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase disclosed herein or a nucleic acid encoded polypeptide disclosed herein. The pharmaceutical composition can act as a digestive aid.

Un compuesto que contiene un enlace carbono-carbono está en contacto con un polipéptido divulgado en la presente que tiene actividad de enzima aldolasa, tal como, actividad de enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa, a un pH en el rango de aproximadamente pH 3,0 a aproximadamente 9,0, aproximadamente 3,0 a aproximadamente 10,0, aproximadamente 3,0 a aproximadamente 11,0 o más. Un compuesto que contiene un enlace carbono-carbono está en contacto con la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, a una temperatura de al menos aproximadamente 55ºC, 60ºC, 65ºC, 70ºC, 75ºC, 80ºC, 85ºC, 90ºC o más. A compound containing a carbon-carbon bond is in contact with a polypeptide disclosed herein that has enzyme aldolase activity, such as, pyruvate aldolase enzyme activity, such as HMG and / or KHG aldolase, at a pH in the range from about pH 3.0 to about 9.0, about 3.0 to about 10.0, about 3.0 to about 11.0 or more. A compound containing a carbon-carbon bond is in contact with the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, at a temperature of at least about 55 ° C, 60 ° C, 65 ° C, 70 ° C, 75 ° C, 80 ° C, 85ºC, 90ºC or more.

Esta divulgación proporciona, entre otras cosas, polipéptidos que son útiles para facilitar una reacción en procesos para producir monatina, derivados de monatina, y sales de la misma, por ejemplo en la producción de ácido R-2hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (también conocido como monatina de R-alfa cetoácido, precursor de Rmonatina, R-MP, y la forma alfa-ceto de monatina), un precursor para ciertos estereoisómeros de monatina, tales como (R,R)- y (S,R)-monatina. La divulgación también proporciona métodos para preparar monatina, derivados de monatina y sales y productos de condensación interna de la misma utilizando uno o más polipéptidos divulgados en la presente. Los métodos para sintetizar R-MP, estereoisómeros de monatina y/o estereoisómeros de derivados de monatina incluyen el uso de uno o más polipéptidos con actividad de aldolasa de cualquiera de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO: 110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID This disclosure provides, among other things, polypeptides that are useful in facilitating a process reaction to produce monatin, monatin derivatives, and salts thereof, for example in the production of R-2-hydroxy 2- (indole-3-ylmethyl acid). ) -4-ketoglutaric (also known as R-alpha keto acid monatin, precursor of Rmonatin, R-MP, and the alpha-keto form of monatin), a precursor to certain monatin stereoisomers, such as (R, R) - and (S, R) -monatin. The disclosure also provides methods for preparing monatin, monatin derivatives and salts, and internal condensation products thereof using one or more polypeptides disclosed herein. Methods for synthesizing R-MP, monatin stereoisomers and / or monatin derivative stereoisomers include the use of one or more aldolase-active polypeptides of any of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ I D NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO : 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148 , SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO : 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198 , SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO : 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248 , SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID

NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 y SEQ ID NO:334, y fragmentos enzimáticamente activos de la misma. NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 and SEQ ID NO: 334, and enzymatically active fragments thereof.

Asimismo, los métodos para sintetizar R-MP, estereoisómeros de monatina y/o estereoisómeros de derivados de monatina pueden incluir el uso de un polipéptido con actividad de aldolasa codificado por una secuencia de ácidos nucleicos que tiene al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más o 100% (completa) de identidad de secuencia con respecto al ácido nucleico divulgado en la presente incluyendo SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 en una región de al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 o más residuos. Also, methods for synthesizing R-MP, monatin stereoisomers and / or monatin derivative stereoisomers can include the use of a polypeptide with aldolase activity encoded by a nucleic acid sequence having at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68% , 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85 %, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or more or 100% ( complete) of sequence identity with respect to the nucleic acid disclosed herein including SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 1 89, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 211, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 in a region of at least about 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 or more waste.

Más aun, los métodos para sintetizar R-MP, estereoisómeros de monatina y/o estereoisómeros de derivados de monatina pueden incluir el uso de un polipéptido con actividad de aldolasa codificado por una secuencia de ácidos nucleicos que se hidrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, Furthermore, methods for synthesizing R-MP, monatin stereoisomers and / or monatin derivative stereoisomers may include the use of an aldolase-active polypeptide encoded by a nucleic acid sequence that is hydrolyzed under stringent conditions with a nucleic acid SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO : 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49 , SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO : 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99 , SEQ ID NO : 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117 , SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO : 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167 , SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO : 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217 , SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO : 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267 , SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299,

SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338. SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338.

La invención proporciona un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, sales de la misma y combinaciones de la misma en una vía de múltiples etapas, en donde una reacción en la vía es facilitada por uno o más polipéptidos seleccionados de polipéptidos aislados o recombinantes que comprenden la secuencia de aminoácidos de SEQ ID NO:276 o fragmentos o subsecuencias de la misma que tienen actividad de aldolasa tal como se define en las reivindicaciones. En algunas realizaciones, los fragmentos o subsecuencias de la misma tienen una actividad de aldolasa de al menos 0,2 mg MP/mg proteína/h. En otras realizaciones, los fragmentos o subsecuencias de la misma tienen una actividad de aldolasa de al menos 0,1 mg MP/mg proteína/h. En algunas realizaciones, la reacción facilitada por uno o más polipéptidos divulgados en la presente se lleva a cabo en aproximadamente 1,0 a aproximadamente 10,0 mM de MgCl2. En otras realizaciones, la reacción facilitada por uno o más polipéptidos divulgados en la presente se lleva a cabo a aproximadamente pH 7,0 a aproximadamente pH 11,5. Incluso en otras realizaciones, la reacción facilitada por uno o más polipéptidos divulgados en la presente se lleva a cabo en aproximadamente 0,005% a aproximadamente 1% de detergente polisorbato. The invention provides a method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, wherein a reaction in the pathway is facilitated by one or more polypeptides selected from isolated or recombinant polypeptides comprising the amino acid sequence of SEQ ID NO: 276 or fragments or subsequences thereof having aldolase activity as defined in the claims. In some embodiments, the fragments or subsequences thereof have an aldolase activity of at least 0.2 mg MP / mg protein / h. In other embodiments, the fragments or subsequences thereof have an aldolase activity of at least 0.1 mg MP / mg protein / h. In some embodiments, the reaction facilitated by one or more polypeptides disclosed herein is carried out in about 1.0 to about 10.0 mM MgCl2. In other embodiments, the reaction facilitated by one or more polypeptides disclosed herein is carried out at about pH 7.0 to about pH 11.5. Even in other embodiments, the reaction facilitated by one or more polypeptides disclosed herein is carried out in about 0.005% to about 1% polysorbate detergent.

En algunas realizaciones, la reacción es una reacción entre indol-3-piruvato y una fuente de carbono C3. En algunas realizaciones, la reacción preferiblemente produce ácido R-2-hidroxi-2-(indol-3-il-metil)-4-cetoglutárico en lugar de ácido S-2-hidroxi-2-(indol-3-il-metil)-4-cetoglutárico. In some embodiments, the reaction is a reaction between indole-3-pyruvate and a C3 carbon source. In some embodiments, the reaction preferably produces R-2-hydroxy-2- (indole-3-yl-methyl) -4-ketoglutaric acid instead of S-2-hydroxy-2- (indole-3-yl-methyl) acid. ) -4-ketoglutaric.

En algunas realizaciones, el producto obtenido mediante la vía de múltiples etapas es (R,R)-monatina, sales de la misma y combinaciones de la misma. In some embodiments, the product obtained by the multistage route is (R, R) -monatin, salts thereof, and combinations thereof.

En otras realizaciones, la (R,R)-monatina se produce en cantidades mayores que la (S,S)-monatina, (S,R)-monatina In other embodiments, (R, R) -monatin is produced in larger amounts than (S, S) -monatin, (S, R) -monatin

o (R,S)-monatina. or (R, S) -monatin.

La invención proporciona un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, sales de la misma y combinaciones de la misma en una vía de múltiples etapas, en donde una reacción en la vía es facilitada por al menos un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que tiene un porcentaje de identidad de secuencia de al menos 95% con respecto a SEQ ID NO:275. En otras realizaciones, el porcentaje de identidad de secuencia es 100%. The invention provides a method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, wherein a Reaction in the pathway is facilitated by at least one polypeptide encoded by a nucleic acid sequence comprising a sequence having a sequence identity percentage of at least 95% with respect to SEQ ID NO: 275. In other embodiments, the percentage of sequence identity is 100%.

La invención proporciona un método que comprende una reacción que preferiblemente produce ácido R-2-hidroxi-2(indol-3-il-metil)-4-cetoglutárico en lugar de ácido S-2-hidroxi-2-(indol-3-il-metil)-4-cetoglutárico en donde un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que tiene al menos 95% de identidad de secuencia con respecto a SEQ ID NO:275 se utiliza para facilitar una reacción en una vía de múltiples etapas. The invention provides a method comprising a reaction that preferably produces R-2-hydroxy-2 (indole-3-yl-methyl) -4-ketoglutaric acid instead of S-2-hydroxy-2- (indole-3- yl-methyl) -4-ketoglutaric wherein a polypeptide encoded by a nucleic acid sequence comprising a sequence having at least 95% sequence identity to SEQ ID NO: 275 is used to facilitate a one-way reaction multi-stage.

La invención proporciona un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, sales de la misma y combinaciones de la misma en una vía de múltiples etapas, en donde una reacción en la vía es facilitada por al menos un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que permanece hibridada en condiciones rigurosas con un ácido nucleico de SEQ ID NO:275 tal como se define en las reivindicaciones. The invention provides a method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, wherein a Reaction in the pathway is facilitated by at least one polypeptide encoded by a nucleic acid sequence comprising a sequence that remains hybridized under stringent conditions to a nucleic acid of SEQ ID NO: 275 as defined in the claims.

La invención también proporciona un método que comprende: producir un producto elegido de ácido R-2-hidroxi 2(indol-3-ilmetil)-4-cetoglutárico, sales del mismo y combinaciones del mismo en una vía, en donde una reacción en la vía es facilitada por uno o más polipéptidos elegidos de polipéptidos aislados o recombinantes que comprenden la secuencia de aminoácidos de SEQ ID NO:276 o fragmentos o subsecuencias de la misma que tienen actividad de aldolasa, en donde dicho ácido R-2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico, sales del mismo y combinaciones del mismo se utiliza para preparar un producto edulcorante. The invention also provides a method comprising: producing a chosen product of R-2-hydroxy 2 (indole-3-ylmethyl) -4-ketoglutaric acid, salts thereof and combinations thereof in one way, wherein a reaction in the pathway is facilitated by one or more polypeptides chosen from isolated or recombinant polypeptides comprising the amino acid sequence of SEQ ID NO: 276 or fragments or subsequences thereof having aldolase activity, wherein said R-2-hydroxy acid 2- (indole-3-ylmethyl) -4-ketoglutaric, salts thereof and combinations thereof is used to prepare a sweetening product.

Se describe además un método que comprende: producir un producto elegido de precursor de monatina, sales del mismo y combinaciones del mismo en una vía de múltiples etapas, en donde una reacción en la vía es facilitada por al menos un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que tiene un porcentaje de identidad de secuencia de al menos 50% con respecto a SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, A method is further described which comprises: producing a chosen monatin precursor product, salts thereof and combinations thereof in a multi-step pathway, wherein a pathway reaction is facilitated by at least one polypeptide encoded by a sequence of nucleic acids comprising a sequence having a sequence identity percentage of at least 50% with respect to SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 , SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121,

SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 o SEQ ID NO:338, en donde dicho precursor de monatina, sales del mismo y combinaciones del mismo es dulce. SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337, or SEQ ID NO: 338, where said monatin precursor, salts thereof and combinations thereof is sweet.

También se divulga un método que comprende: producir un producto elegido de precursor de monatina, sales del mismo y combinaciones del mismo en una vía de múltiples etapas, en donde una reacción en la vía es facilitada por al menos un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que se hidrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 o SEQ ID NO:338, en donde dicho precursor de monatina, sales del mismo y combinaciones del mismo es dulce. Also disclosed is a method comprising: producing a chosen monatin precursor product, salts thereof, and combinations thereof in a multi-step pathway, wherein a pathway reaction is facilitated by at least one polypeptide encoded by a sequence of nucleic acids comprising a sequence that hydrides under stringent conditions with a nucleic acid of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO : 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27 , SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO : 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79 , SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 301, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 or SEQ ID NO: 338, wherein said monatin precursor, salts thereof, and combinations thereof It is sweet.

En un esfuerzo por ser concisos, siempre que se identifique que se han formado intermediarios/productos en la memoria descriptiva y reivindicaciones (tales como monatina, precursor de monatina o derivado o derivados de monatina), debe entenderse que debería incluirse la expresión “y/o sales de los mismos” donde corresponda. En otras palabras, por ejemplo, debe entenderse que la frase “indol-3-piruvato se convierte en MP” incluye “ácido indol3-pirúvico se convierte en MP y/o sales del mismo”. El experto en la técnica, de hecho, apreciará que bajo las condiciones de reacción descritas, las sales de los intermediarios/productos están de hecho presentes. In an effort to be concise, whenever it is identified that intermediates / products have been formed in the specification and claims (such as monatin, monatin precursor or monatin derivative or derivatives), it should be understood that the expression "and / or or leave the same "where appropriate. In other words, for example, the phrase "indole-3-pyruvate converts to MP" should be understood to include "indole-3-pyruvic acid converts to MP and / or salts thereof". The person skilled in the art will, in fact, appreciate that under the described reaction conditions, the salts of the intermediates / products are in fact present.

De acuerdo con algunas realizaciones, el método produce una monatina o composición derivada de monatina en donde la monatina o componente derivado de monatina de la composición incluye solo las formas R,R y S,R de monatina o derivado de monatina. El término “solo”, cuando se utiliza para indicar que solo se forman ciertos isómeros, significa que la vía produciría solo los isómeros identificados si no se produce la racemización. Por consiguiente, el término “solo” no significa la ausencia de otros isómeros, sino que el experto en la técnica entenderá que otras formas isoméricas pueden estar presentes en una cantidad relativamente pequeña debido a la racemización que puede producirse. De acuerdo con algunas realizaciones, el método produce una composición en donde la monatina o componente derivado de monatina de la composición incluye solo la forma R,R de monatina o According to some embodiments, the method produces a monatin or monatin derived composition wherein the monatin or monatin derived component of the composition includes only the R, R and S, R forms of monatin or monatin derivative. The term "alone", when used to indicate that only certain isomers are formed, means that the pathway would produce only the identified isomers if racemization does not occur. Accordingly, the term "alone" does not mean the absence of other isomers, but the person skilled in the art will understand that other isomeric forms may be present in a relatively small amount due to the racemization that may occur. According to some embodiments, the method produces a composition wherein the monatin or monatin-derived component of the composition includes only the R, R form of monatin or

derivado de monatina (excepto que se llegue al punto que se produzca la racemización dando como resultado otras formas isoméricas). monatin derivative (unless the point is reached that racemization occurs resulting in other isomeric forms).

Tal como se utiliza en la presente, la frase “composición de monatina” significa composiciones que incluyen uno o más isómeros de monatina; la expresión también puede significar solo una forma isomérica simple de monatina y nada más. As used herein, the phrase "monatin composition" means compositions that include one or more monatin isomers; the expression may also mean only a simple isomeric form of monatin and nothing else.

Tal como se utiliza en la presente, la frase “composición derivada de monatina” significa composiciones que incluyen uno o más isómeros de un derivado de monatina; la expresión también puede significar solo una forma isomérica simple del derivado de monatina y nada más. As used herein, the phrase "monatin-derived composition" means compositions that include one or more isomers of a monatin derivative; the expression may also mean only a simple isomeric form of the monatin derivative and nothing else.

Tal como se utiliza en la presente, la frase “derivado de monatina” tiene la siguiente estructura: As used herein, the phrase "monatin derivative" has the following structure:

en donde Ra, Rb, Rc, Rd y Re representan cada uno independientemente cualquier sustituyente que se selecciona de un átomo de hidrógeno, un grupo hidroxilo, un grupo alquilo C1-C3, un grupo alcoxi C1-C3, un grupo amino o un átomo de halógeno, tal como un átomo de yodo, átomo de bromo, átomo de cloro o átomo de flúor. Sin embargo, Ra, Rb, Rc, Rd, y Re no pueden simultáneamente ser todos hidrógeno. De forma alternativa, Rb yRc, y/o Rd yRe juntos pueden formar un grupo alquileno C1-C4, respectivamente. wherein Ra, Rb, Rc, Rd and Re each independently represent any substituent that is selected from a hydrogen atom, a hydroxyl group, a C1-C3 alkyl group, a C1-C3 alkoxy group, an amino group or an atom halogen, such as an iodine atom, bromine atom, chlorine atom, or fluorine atom. However, Ra, Rb, Rc, Rd, and Re cannot all simultaneously be hydrogen. Alternatively, Rb andRc, and / or Rd andRe together can form a C1-C4 alkylene group, respectively.

Tal como se utiliza en la presente, “indol-3-piruvato sustituido” significa que uno o más átomos de carbono del anillo indol del indol-3-piruvato está sustituido independientemente por uno o más de los grupos sustituyentes Ra, Rb, Rc, Rd, y Re definidos anteriormente. Sin embargo, Ra, Rb, Rc, Rd, y Re no pueden simultáneamente ser todos hidrógeno. De forma alternativa, Rb y Rc, y/o Rd y Re juntos pueden formar un grupo alquileno C1-C4, respectivamente. As used herein, "substituted indole-3-pyruvate" means that one or more carbon atoms in the indole ring of indole-3-pyruvate is independently substituted by one or more of the substituent groups Ra, Rb, Rc, Rd, and Re defined above. However, Ra, Rb, Rc, Rd, and Re cannot all simultaneously be hydrogen. Alternatively, Rb and Rc, and / or Rd and Re together can form a C1-C4 alkylene group, respectively.

Tal como se utiliza en la presente, “triptófano sustituido” significa que uno o más átomos de carbono del anillo indol del triptófano está sustituido independientemente por uno o más de los grupos sustituyentes Ra, Rb, Rc, Rd, y Re definidos anteriormente. Sin embargo, Ra, Rb, Rc, Rd, y Re no pueden simultáneamente ser todos hidrógeno. De forma alternativa, Rb yRc, y/o Rd yRe juntos pueden formar un grupo alquileno C1-C4, respectivamente. En una realización, el triptófano sustituido contiene el o los mismos grupos sustituyentes en el anillo indol que el derivado final de monatina. As used herein, "substituted tryptophan" means that one or more carbon atoms of the indole ring of tryptophan is independently substituted by one or more of the substituent groups Ra, Rb, Rc, Rd, and Re defined above. However, Ra, Rb, Rc, Rd, and Re cannot all simultaneously be hydrogen. Alternatively, Rb andRc, and / or Rd andRe together can form a C1-C4 alkylene group, respectively. In one embodiment, the substituted tryptophan contains the or the same substituent groups on the indole ring as the final monatin derivative.

Más aun, las vías biosintéticas para producir monatina descritas en la presente pueden utilizar un triptófano sustituido para proporcionar derivados de monatina que probablemente sean dulces. En algunas realizaciones, el triptófano sustituido a ser utilizado en las vías biosintéticas descritas en la presente incluyen triptófano y 5hidroxitriptófano clorado. Furthermore, the biosynthetic pathways for producing monatin described herein can use a substituted tryptophan to provide monatin derivatives that are likely to be sweet. In some embodiments, the substituted tryptophan to be used in the biosynthetic pathways described herein include tryptophan and chlorinated 5-hydroxytryptophan.

Por ejemplo, los D-triptófanos clorados, que tienen similitudes estructurales con la (R,R)-monatina, han sido identificados como edulcorantes no nutritivos (particularmente 6-cloro-D-triptófano). De forma similar, se ha descubierto que las formas de monatina halogenadas y sustituidas por hidroxi son dulces. Ver la Solicitud de Patente de los Estados Unidos Publicada No. 2005/0118317. Grupos halógeno e hidroxilo pueden sustituirse por hidrógeno, particularmente en las posiciones 1-4 del anillo de benceno en el indol de triptófano, sin interferir en las subsiguientes conversiones a D- o L-triptófano, indol-3-piruvato, MP o monatina. En la bibliografía se ha mostrado que los indoles sustituidos son sustratos adecuados para enzimas PLP y han proporcionado triptófanos sustituidos. Fukuda, D. S., et al., “Production of Substituted L-Tryptophans by Fermentation,” Appl. Environ. Microbiol., 21:841-43 (1971). El halógeno no parece dificultar estéricamente el mecanismo catalítico de las subunidades beta de la triptófano sintasa y la enantioespecificidad también permaneció intacta. For example, chlorinated D-tryptophan, which has structural similarities to (R, R) -monatin, have been identified as non-nutritive sweeteners (particularly 6-chloro-D-tryptophan). Similarly, hydroxy-substituted and halogenated monatin forms have been found to be sweet. See United States Patent Application Published No. 2005/0118317. Halogen and hydroxyl groups can be replaced by hydrogen, particularly at positions 1-4 of the benzene ring in the indole of tryptophan, without interfering in subsequent conversions to D- or L-tryptophan, indole-3-pyruvate, MP or monatin. Substituted indoles have been shown in the literature to be suitable substrates for PLP enzymes and have provided substituted tryptophan. Fukuda, D. S., et al., “Production of Substituted L-Tryptophans by Fermentation,” Appl. Environ. Microbiol., 21: 841-43 (1971). Halogen does not appear to sterically hinder the catalytic mechanism of tryptophan synthase beta subunits, and enantiospecificity also remained intact.

En algunas realizaciones se proporciona un proceso para producir una composición de monatina que incluye producir indol-3-piruvato a partir de L-triptófano, producir ácido 2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (“precursor de monatina” o “MP”) a partir de indol-3-piruvato y producir monatina a partir de MP. La reacción de L-triptófano para producir indol-3-piruvato es facilitada por una enzima que tiene mayor especificidad, mayor actividad o ambas para L-triptófano que para R-MP, (R,R)-monatina o ambos. De acuerdo con ciertas realizaciones, la reacción de indol-3In some embodiments, a process is provided for producing a monatin composition which includes producing indole-3-pyruvate from L-tryptophan, producing 2-hydroxy 2- (indole-3-ylmethyl) -4-ketoglutaric acid ("precursor of monatin "or" MP ") from indole-3-pyruvate and produce monatin from MP. The reaction of L-tryptophan to produce indole-3-pyruvate is facilitated by an enzyme that has higher specificity, greater activity, or both for L-tryptophan than for R-MP, (R, R) -monatin, or both. According to certain embodiments, the indole-3 reaction

piruvato es facilitada por una enzima que tiene actividad de aldolasa R específica y por consiguiente produce R-MP. De acuerdo con ciertas realizaciones, se proporciona una enzima racemasa que puede facilitar la epimerización del producto derivado de aminoácido de la reacción del triptófano de una forma isomérica a otra forma isomérica. Pyruvate is facilitated by an enzyme that has specific aldolase R activity and consequently produces R-MP. In accordance with certain embodiments, a racemase enzyme is provided that can facilitate epimerization of the amino acid derivative product of the tryptophan reaction from an isomeric form to another isomeric form.

En algunas realizaciones se proporciona un proceso para producir una composición de monatina que incluye producir indol-3-piruvato a partir de L-triptófano, producir ácido 2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (“precursor de monatina” o “MP”) a partir de indol-3-piruvato y producir monatina a partir de MP. La reacción de L-triptófano para producir indol-3-piruvato es facilitada por una enzima que tiene mayor especificidad, mayor actividad o ambas para el L-triptófano que para R-MP, (R,R)-monatina o ambos, y la reacción de MP para formar monatina es facilitada por una enzima, que es estereoselectiva para R-MP. El término “estereoselectivo” significa que una enzima tiene mayor especificidad, mayor actividad o ambas para un isómero, en este caso para R-MP que para S-MP, que otra. En realizaciones preferidas, una enzima estereoselectiva tiene actividad limitada para un isómero en comparación con otra. Actividad “limitada” significa actividad que puede percibirse mínimamente o que no se percibe, por ejemplo como se determina de acuerdo con experimentos proporcionados en la presente. In some embodiments, a process is provided for producing a monatin composition which includes producing indole-3-pyruvate from L-tryptophan, producing 2-hydroxy 2- (indole-3-ylmethyl) -4-ketoglutaric acid ("precursor of monatin "or" MP ") from indole-3-pyruvate and produce monatin from MP. The reaction of L-tryptophan to produce indole-3-pyruvate is facilitated by an enzyme that has higher specificity, greater activity, or both for L-tryptophan than for R-MP, (R, R) -monatin, or both, and the MP's reaction to form monatin is facilitated by an enzyme, which is stereoselective for R-MP. The term "stereoselective" means that one enzyme has greater specificity, greater activity, or both for one isomer, in this case for R-MP than for S-MP, than another. In preferred embodiments, a stereoselective enzyme has limited activity for one isomer compared to another. "Limited" activity means activity that is minimally perceived or not perceived, for example as determined in accordance with experiments provided herein.

Cabe señalar que, cuando se hace referencia a series de reacciones tales como en los párrafos precedentes, no es necesario que se lleve a cabo de forma explícita cada etapa de la invención; es suficiente que las etapas se lleven a cabo implícitamente. En otras palabras, por ejemplo, el proceso para producir una composición de monatina, que incluye producir indol-3-piruvato a partir de L-triptófano, producir ácido 2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (“precursor de monatina” o “MP”) a partir de indol-3-piruvato y producir monatina a partir de MP, en donde cada reacción es facilitada por una enzima apropiada, puede llevarse a cabo combinando L-triptófano con las enzimas y fijando las condiciones de forma tal que puedan producirse las reacciones enumeradas. En dicho caso, el Ltriptófano puede hacerse reaccionar para producir indol-3-piruvato, el indol-3-piruvato producido a partir de la reacción de L-triptófano puede hacerse reaccionar para formar MP y el MP producido a partir de la reacción de indol3-piruvato puede hacerse reaccionar para formar monatina. El proceso también puede llevarse a cabo, a modo de ejemplo, proporcionando un compuesto que puede producir L-triptófano, en condiciones adecuadas para que ocurra la producción de L-triptófano y combinar dicho compuesto con enzimas capaces de facilitar la serie de reacciones indicadas en condiciones adecuadas para que se produzcan dichas reacciones. Como otro ejemplo, el proceso puede llevarse a cabo proporcionando un microorganismo manipulado genéticamente para producir monatina de acuerdo con la vía descrita y proporcionando condiciones apropiadas para que se produzca el proceso de fermentación. Por ejemplo, un microorganismo que naturalmente produce grandes cantidades de L-triptófano podría manipularse genéticamente para producir o sobreproducir una o más de las enzimas utilizadas para facilitar reacciones en la vía hacia monatina y podrían proporcionarse condiciones adecuadas de forma tal que el microorganismo pueda así producir monatina. It should be noted that, when reference is made to series of reactions such as in the preceding paragraphs, it is not necessary that each stage of the invention be carried out explicitly; it is sufficient that the stages are carried out implicitly. In other words, for example, the process for producing a monatin composition, which includes producing indole-3-pyruvate from L-tryptophan, producing 2-hydroxy 2- (indole-3-ylmethyl) -4-ketoglutaric acid ( "Monatin precursor" or "MP") from indole-3-pyruvate and producing monatin from MP, where each reaction is facilitated by an appropriate enzyme, can be carried out by combining L-tryptophan with the enzymes and binding conditions such that the listed reactions can occur. In that case, the L-tryptophan can be reacted to produce indole-3-pyruvate, the indole-3-pyruvate produced from the L-tryptophan reaction can be reacted to form MP, and the MP produced from the indole3 reaction -pyruvate can be reacted to form monatin. The process can also be carried out, by way of example, by providing a compound that can produce L-tryptophan, under conditions suitable for the production of L-tryptophan to occur and combining said compound with enzymes capable of facilitating the series of reactions indicated in suitable conditions for such reactions to occur. As another example, the process can be carried out by providing a genetically engineered microorganism to produce monatin according to the described route and by providing appropriate conditions for the fermentation process to occur. For example, a microorganism that naturally produces large amounts of L-tryptophan could be genetically engineered to produce or overproduce one or more of the enzymes used to facilitate monatin pathway reactions, and suitable conditions could be provided so that the microorganism can thus produce monatina.

En otras realizaciones se proporciona un proceso para producir monatina, en el cual un sustrato forma un Laminoácido cuando el L-triptófano se convierte en indol-3-piruvato, el indol-3-piruvato reacciona para formar MP (que puede incluir R-MP y S-MP aunque preferiblemente incluye solo o predominantemente R-MP) y el L-aminoácido reacciona para regenerar (también denominado “reciclar”) el sustrato cuando la R-MP se convierte en (R,R)monatina. La reacción de R-MP para formar (R,R)-monatina es facilitada por una aminotransferasa estereoinversora tal como D-metionina aminotransferasa (EC 2.6.1.41) o una enzima que tiene actividad de D-fenilglicina aminotransferasa. In other embodiments, a process for producing monatin is provided, in which a substrate forms a Lamino Acid when L-tryptophan is converted to indole-3-pyruvate, indole-3-pyruvate reacts to form MP (which may include R-MP and S-MP although it preferably includes only or predominantly R-MP) and the L-amino acid reacts to regenerate (also called "recycle") the substrate when the R-MP is converted to (R, R) monatin. The reaction of R-MP to form (R, R) -monatin is facilitated by a stereoinverting aminotransferase such as D-methionine aminotransferase (EC 2.6.1.41) or an enzyme that has D-phenylglycine aminotransferase activity.

Se proporciona un proceso para producir una composición de monatina que incluye producir D-triptófano a partir de L-triptófano, producir indol-3-piruvato a partir de D-triptófano, producir R-MP a partir de indol-3-piruvato y producir (R,R)-monatina a partir de R-MP. La producción del D-triptófano a partir de L-triptófano es facilitada por una triptófano racemasa y equivalentes funcionales de la misma. En ciertas realizaciones adicionales, las reacciones de D-triptófano para formar indol-3-piruvato y de MP para formar monatina son facilitadas por la misma enzima. En otras realizaciones adicionales, la reacción de indol-3-piruvato es facilitada por una enzima que tiene actividad de aldolasa R específica y por consiguiente se forma R-MP y las reacciones del D-triptófano para formar indol-3piruvato y de R-MP para formar (R,R)-monatina son facilitadas por la misma enzima. A process is provided for producing a monatin composition which includes producing D-tryptophan from L-tryptophan, producing indole-3-pyruvate from D-tryptophan, producing R-MP from indole-3-pyruvate and producing (R, R) -monatin from R-MP. The production of D-tryptophan from L-tryptophan is facilitated by a tryptophan racemase and functional equivalents thereof. In certain additional embodiments, the reactions of D-tryptophan to form indole-3-pyruvate and of MP to form monatin are facilitated by the same enzyme. In still other embodiments, the indole-3-pyruvate reaction is facilitated by an enzyme that has specific aldolase R activity and consequently R-MP is formed and the reactions of D-tryptophan to form indole-3-pyruvate and R-MP to form (R, R) -monatin they are facilitated by the same enzyme.

En algunas realizaciones de acuerdo con la invención se proporciona un proceso para producir un derivado de (R,R)-monatina que incluye producir el derivado de monatina a partir de un indol-3-piruvato sustituido y piruvato, utilizando una enzima que tiene actividad de aldolasa R específica para catalizar la reacción, tal como se define en las reivindicaciones. In some embodiments according to the invention there is provided a process for producing a (R, R) -monatin derivative including producing the monatin derivative from a substituted indole-3-pyruvate and pyruvate, using an enzyme having activity of specific aldolase R to catalyze the reaction, as defined in the claims.

Los detalles de una o más realizaciones de la invención quedan establecidos en los dibujos adjuntos y la descripción que figura más adelante. Otras características, objetos y ventajas de acuerdo con la invención serán evidentes a partir de la descripción y los dibujos y a partir de las reivindicaciones. Como se apreciará a partir de la descripción en la presente, la invención es pasible de modificaciones en distintas realizaciones. Por lo tanto, los dibujos y la descripción detallada deberán considerarse como ilustrativos y no restrictivos. Details of one or more embodiments of the invention are set forth in the accompanying drawings and the description below. Other features, objects, and advantages in accordance with the invention will be apparent from the description and drawings, and from the claims. As will be appreciated from the description herein, the invention is subject to modifications in different embodiments. Therefore, the drawings and detailed description should be considered as illustrative and not restrictive.

Breve descripción de los dibujos Brief description of the drawings

Los siguientes dibujos son ilustrativos de realizaciones de la invención y no pretenden limitar el alcance de la invención, el cual está definido por las reivindicaciones. The following drawings are illustrative of embodiments of the invention and are not intended to limit the scope of the invention, which is defined by the claims.

La Figura 1 es un diagrama de flujo que muestra un ejemplo de un proceso enzimático para producir (R,R)-monatina a partir de L-triptófano de acuerdo con la invención. En este ejemplo, el proceso incluye utilizar una Laminotransferasa (ejemplos de los cuales incluyen una L-triptófano aminotransferasa, una aminotransferasa Laromática, una L-aspartato aminotransferasa y una L-alanina aminotransferasa) en la reacción de L-triptófano que tiene mayor especificidad y/o selectividad para L-triptófano como sustrato que para R-MP y/o el proceso incluye utilizar una L-aminoácido oxidasa con especificidad y/o selectividad limitada para (R,R)-monatina como sustrato. En el ejemplo específico diagramado en la Figura 1, una L-aminotransferasa o L-aminoácido oxidasa convierte Ltriptófano en indol-3-piruvato, el indol-3-piruvato se hace reaccionar con una aldolasa R-específica y piruvato para producir monatina de R-alfa cetoácido (R-MP) y la R-MP se convierte en (R,R)-monatina mediante una Daminotransferasa o una D-aminoácido deshidrogenasa. Como se muestra en la Figura 1, las reacciones son reversibles pero, a los efectos de la invención, no es necesario que las reacciones se lleven a cabo en dirección inversa. Figure 1 is a flowchart showing an example of an enzymatic process to produce (R, R) -monatin from L-tryptophan according to the invention. In this example, the process includes using a Laminotransferase (examples of which include an L-tryptophan aminotransferase, a Laromatic aminotransferase, an L-aspartate aminotransferase and an L-alanine aminotransferase) in the reaction of L-tryptophan that has higher specificity and / or selectivity for L-tryptophan as a substrate for R-MP and / or the process includes using an L-amino acid oxidase with specificity and / or limited selectivity for (R, R) -monatin as a substrate. In the specific example diagrammed in Figure 1, an L-aminotransferase or L-amino acid oxidase converts Tryptophan to indole-3-pyruvate, indole-3-pyruvate is reacted with an R-specific aldolase and pyruvate to produce monatin from R -alpha keto acid (R-MP) and R-MP is converted to (R, R) -monatin by a Daminotransferase or a D-amino acid dehydrogenase. As shown in Figure 1, the reactions are reversible but, for the purposes of the invention, the reactions do not need to be carried out in the reverse direction.

La Figura 2 es un diagrama de flujo que muestra un ejemplo de otro proceso para producir (R,R)-monatina de acuerdo con la invención. En este ejemplo, el proceso incluye utilizar una enzima para convertir R-MP en monatina que es estereoselectiva para R-MP. En el ejemplo específico diagramado en la Figura 2 se muestra la conversión del triptófano en indol-3-piruvato en una reacción inversa. El indol-3-piruvato puede hacerse reaccionar con una aldolasa no esteroespecífica para formar inversamente monatina de alfa cetoácido (R y S-MP). La R-MP se convierte inversamente en (R,R)-monatina mediante una D-aminotransferasa estereoselectiva o una D-aminoácido deshidrogenasa estereoselectiva. Cualquier S-MP que se forme mediante la aldolasa no esteroespecífica puede convertirse nuevamente en indol-3-piruvato si se utiliza una D-aminotransferasa o D-aminoácido deshidrogenasa estereoselectiva. A los efectos de la invención, no es necesario que las reacciones que se muestran como reversibles se lleven a cabo en dirección inversa. Figure 2 is a flow chart showing an example of another process for producing (R, R) -monatin according to the invention. In this example, the process includes using an enzyme to convert R-MP to monatin that is stereoselective for R-MP. The specific example diagrammed in Figure 2 shows the conversion of tryptophan to indole-3-pyruvate in a reverse reaction. Indole-3-pyruvate can be reacted with a non-stereospecific aldolase to reverse form alpha keto acid monatin (R and S-MP). R-MP is inversely converted to (R, R) -monatin by a stereoselective D-aminotransferase or a stereoselective D-amino acid dehydrogenase. Any S-MP that is formed by non-stereospecific aldolase can be converted back to indole-3-pyruvate if a stereoselective D-aminotransferase or D-amino acid dehydrogenase is used. For the purposes of the invention, reactions shown to be reversible need not be carried out in the reverse direction.

La Figura 3 es un diagrama de flujo que muestra un ejemplo de otro proceso adicional para producir (R,R)-monatina a partir de L-triptófano de acuerdo con la invención. En este ejemplo, el proceso incluye convertir L-triptófano en Dtriptófano utilizando una triptófano racemasa y utilizar un producto de D-aminoácido en la reacción acoplado a la reacción de formación de indol-3-piruvato como sustrato en la reacción acoplado a la reacción de formación de (R,R)-monatina. En el ejemplo específico diagramado en la Figura 3, L-triptófano se convierte en D-triptófano mediante una triptófano racemasa en una reacción inversa. El D-triptófano se hace reaccionar con alfa-cetoglutarato (a-KG) y D-aminotransferasa de amplia especificidad para producir indol-3-piruvato y D-glutamato. El indol-3piruvato se hace reaccionar con piruvato y una aldolasa R-específica y se convierte en monatina de R-alfa cetoácido (R-MP) y la R-MP se hace reaccionar con D-aminotransferasa de amplia especificidad y D-glutamato para formar (R,R)-monatina y alfa-cetoglutarato (a-KG). Como se muestra en la Figura 3, cada una de las reacciones son reversibles pero, a los efectos de la invención, no es necesario que las reacciones se lleven a cabo en dirección inversa. Figure 3 is a flowchart showing an example of yet another process to produce (R, R) -monatin from L-tryptophan according to the invention. In this example, the process includes converting L-tryptophan to tryptophan using a tryptophan racemase and using a D-amino acid product in the reaction coupled to the indole-3-pyruvate formation reaction as a substrate in the reaction coupled to the reaction of (R, R) -monatin formation. In the specific example diagrammed in Figure 3, L-tryptophan is converted to D-tryptophan by a tryptophan racemase in a reverse reaction. D-tryptophan is reacted with alpha-ketoglutarate (a-KG) and broadly specific D-aminotransferase to produce indole-3-pyruvate and D-glutamate. Indole-3-pyruvate is reacted with pyruvate and an R-specific aldolase and converted to R-alpha keto acid (R-MP) monatin and R-MP is reacted with broadly specific D-aminotransferase and D-glutamate to form (R, R) -monatin and alpha-ketoglutarate (a-KG). As shown in Figure 3, each of the reactions are reversible but, for the purposes of the invention, it is not necessary that the reactions be carried out in the reverse direction.

La Figura 4 es un diagrama de flujo que muestra un ejemplo de otro proceso adicional para producir (R,R)-monatina a partir de L-triptófano de acuerdo con la invención. En este ejemplo, el proceso incluye convertir el L-aminoácido formado en la reacción acoplada a la reacción de L-triptófano en un D-aminoácido; este D-aminoácido actúa como donante de amino para la reacción en la cual la R-MP se convierte en (R,R)-monatina. En el ejemplo específico diagramado en la Figura 4 se hace reaccionar L-triptófano con una L-aminotransferasa y alfa-cetoglutarato para producir indol-3-piruvato y L-glutamato. El indol-3-piruvato se hace reaccionar con piruvato y una aldolasa Respecífica y se convierte en monatina de R-alfa cetoácido (R-MP) y la R-MP se hace reaccionar con una Daminotransferasa de amplia especificidad y D-glutamato para formar (R,R)-monatina y alfa-cetoglutarato. Como se muestra en la Figura 4, las reacciones son reversibles pero, a los efectos de la invención, no es necesario que las reacciones se lleven a cabo en dirección inversa. Figure 4 is a flowchart showing an example of yet another process to produce (R, R) -monatin from L-tryptophan according to the invention. In this example, the process includes converting the L-amino acid formed in the reaction coupled to the L-tryptophan reaction to a D-amino acid; This D-amino acid acts as an amino donor for the reaction in which R-MP is converted to (R, R) -monatin. In the specific example diagrammed in Figure 4, L-tryptophan is reacted with an L-aminotransferase and alpha-ketoglutarate to produce indole-3-pyruvate and L-glutamate. Indole-3-pyruvate is reacted with pyruvate and a specific aldolase and converted to R-alpha keto acid monatin (R-MP), and R-MP is reacted with a broadly specific Daminotransferase and D-glutamate to form (R, R) -monatin and alpha-ketoglutarate. As shown in Figure 4, the reactions are reversible but, for the purposes of the invention, it is not necessary that the reactions be carried out in the reverse direction.

La Figura 5 es un diagrama de flujo que muestra un ejemplo de otro proceso adicional para producir (R,R)-monatina a partir de L-triptófano de acuerdo con la invención. En este ejemplo, el proceso incluye facilitar enzimáticamente la conversión de R-MP en (R,R)-monatina utilizando una enzima estereoinversora de forma tal que el L-aminoácido formado mediante la reacción acoplada a la reacción de L-triptófano puede utilizarse como sustrato para la reacción acoplada a la reacción de R-MP con (R,R)-monatina. En el ejemplo específico diagramado en la Figura 5 se hace reaccionar L-triptófano con una L-aminotransferasa y oxaloacetato, piruvato o alfa-cetoglutarato (a-KG) para producir indol-3-piruvato y L-aspartato (si se utiliza oxaloacetato), L-alanina (si se utiliza piruvato) o L-glutamato (si se utiliza a-KG). El indol-3-piruvato se hace reaccionar con piruvato y una aldolasa R-específica y se convierte en monatina de R-alfa cetoácido (R-MP) y la R-MP se hace reaccionar con una aminotransferasa estereoinversora y L-aspartato, Lalanina o L-glutamato para formar (R,R)-monatina y oxaloacetato (si se utiliza L-aspartato), piruvato (si se utiliza Lalanina) o alfa-cetoglutarato (a-KG, si se utiliza L-glutamato). Como se muestra en la Figura 5, las reacciones son reversibles pero, a los efectos de la invención, no es necesario que las reacciones se lleven a cabo en dirección inversa. Figure 5 is a flowchart showing an example of yet another process to produce (R, R) -monatin from L-tryptophan according to the invention. In this example, the process includes enzymatically facilitating the conversion of R-MP to (R, R) -monatin using a stereoinverting enzyme such that the L-amino acid formed by the reaction coupled to the L-tryptophan reaction can be used as substrate for the reaction coupled to the reaction of R-MP with (R, R) -monatin. In the specific example diagrammed in Figure 5, L-tryptophan is reacted with an L-aminotransferase and oxaloacetate, pyruvate or alpha-ketoglutarate (a-KG) to produce indole-3-pyruvate and L-aspartate (if oxaloacetate is used) , L-alanine (if pyruvate is used) or L-glutamate (if a-KG is used). Indole-3-pyruvate is reacted with pyruvate and an R-specific aldolase and converted to R-alpha keto acid (R-MP) monatin, and R-MP is reacted with a stereoinverting aminotransferase and L-aspartate, Lalanin or L-glutamate to form (R, R) -monatin and oxaloacetate (if L-aspartate is used), pyruvate (if Lalanine is used) or alpha-ketoglutarate (a-KG, if L-glutamate is used). As shown in Figure 5, the reactions are reversible but, for the purposes of the invention, the reactions need not be carried out in the reverse direction.

La Figura 6 es un diagrama de flujo que muestra un ejemplo de otro proceso adicional para producir (R,R)-monatina de acuerdo con la presente invención. En este ejemplo, el proceso incluye reciclar el L-aminoácido producido en la reacción de formación de indol-3-piruvato con el D-aminoácido utilizado como reactivo con R-MP en la reacción de formación de (R,R)-monatina mediante una serie de reacciones de conversión. En el ejemplo específico diagramado en la Figura 6, el L-triptófano se hace reaccionar reversiblemente con una L-aminotransferasa y oxaloacetato para producir indol-3-piruvato y L-aspartato. El indol-3-piruvato se hace reaccionar reversiblemente con piruvato y una aldolasa R-específica y se convierte en monatina de R-alfa cetoácido (R-MP) y la R-MP se hace reaccionar reversiblemente con una D-aminotransferasa y D-alanina para formar (R,R)-monatina y piruvato. El L-aspartato se convierte en L-alanina y CO2 utilizando una aspartato 4-descarboxilasa. La L-alanina se convierte en D-alanina con una alanina racemasa. A los efectos de la invención, no es necesario que las reacciones que se muestran como reversibles se lleven a cabo en dirección inversa. Figure 6 is a flowchart showing an example of yet another process to produce (R, R) -monatin according to the present invention. In this example, the process includes recycling the L-amino acid produced in the indole-3-pyruvate formation reaction with the D-amino acid used as a reagent with R-MP in the (R, R) -monatin formation reaction by a series of conversion reactions. In the specific example diagrammed in Figure 6, L-tryptophan is reversibly reacted with an L-aminotransferase and oxaloacetate to produce indole-3-pyruvate and L-aspartate. Indole-3-pyruvate is reversibly reacted with pyruvate and an R-specific aldolase and converted to R-alpha keto acid monatin (R-MP) and R-MP is reversibly reacted with a D-aminotransferase and D- Alanine to form (R, R) -monatin and pyruvate. L-aspartate is converted to L-alanine and CO2 using a 4-decarboxylase aspartate. L-Alanine is converted to D-Alanine with an alanine racemase. For the purposes of the invention, reactions shown to be reversible need not be carried out in the reverse direction.

La Figura 7 es un diagrama de flujo que muestra un ejemplo de otro proceso adicional para producir (R,R)-monatina de acuerdo con la presente invención. En este ejemplo, el proceso incluye hacer avanzar la reacción de L-triptófano (es decir, impulsar la reacción hacia la producción de indol-3-piruvato) mediante la conversión del producto derivado de L-aminoácido de dicha reacción en otro producto. En este ejemplo, el producto derivado L-aspartato de Laminoácido se convierte en L-alanina en una reacción irreversible utilizando a descarboxilasa. En el ejemplo específico diagramado en la Figura 7 se hace reaccionar L-triptófano reversiblemente con una L-aminotransferasa y con alfa-cetoglutarato (a-KG) u oxaloacetato para producir indol-3-piruvato y L-glutamato (si se utiliza a-KG) o Laspartato (si se utiliza oxaloacetato). Se hace reaccionar indol-3-piruvato reversiblemente con piruvato y una aldolasa R-específica y se convierte en monatina de R-alfa cetoácido (R-MP). La R-MP se hace reaccionar reversiblemente con una D-aminotransferasa y un D-aminoácido para formar (R,R)-monatina y cualquiera de oxaloacetato, piruvato o a-KG. El L-glutamato o L-aspartato que fue producto de la reacción de la Laminotransferasa se convierte en 4-aminobutanoato y CO2 (si el sustrato es L-glutamato) o en �-alanina y CO2 (si el sustrato es L-aspartato) utilizando un ácido glutámico o una aspartato descarboxilasa. A los efectos de la invención, no es necesario que las reacciones que se muestran como reversibles se lleven a cabo en dirección inversa. Figure 7 is a flowchart showing an example of yet another process to produce (R, R) -monatin according to the present invention. In this example, the process includes advancing the L-tryptophan reaction (i.e., boosting the reaction towards the production of indole-3-pyruvate) by converting the L-amino acid derivative product of said reaction into another product. In this example, the L-aspartate derivative product of Lamino Acid is converted to L-alanine in an irreversible reaction using a decarboxylase. In the specific example diagrammed in Figure 7, L-tryptophan is reacted reversibly with an L-aminotransferase and with alpha-ketoglutarate (a-KG) or oxaloacetate to produce indole-3-pyruvate and L-glutamate (if using a- KG) or Laspartate (if oxaloacetate is used). Indole-3-pyruvate is reacted reversibly with pyruvate and an R-specific aldolase and converted to R-alpha keto acid monatin (R-MP). R-MP is reversibly reacted with a D-aminotransferase and a D-amino acid to form (R, R) -monatin and either oxaloacetate, pyruvate or a-KG. The L-glutamate or L-aspartate that was produced by the Laminotransferase reaction is converted to 4-aminobutanoate and CO2 (if the substrate is L-glutamate) or to �-alanine and CO2 (if the substrate is L-aspartate) using a glutamic acid or an aspartate decarboxylase. For the purposes of the invention, reactions shown to be reversible need not be carried out in the reverse direction.

La Figura 8 es un diagrama de flujo que muestra un ejemplo de otro proceso adicional para producir (R,R)-monatina de acuerdo con la presente invención. En este ejemplo, el proceso incluye reciclar el producto derivado de aminoácido de la reacción de L-triptófano con el reactivo aminoácido de la reacción de la R-MP mediante una serie de reacciones de conversión. En el ejemplo específico diagramado en la Figura 8 se hace reaccionar L-triptófano reversiblemente con una L-aminotransferasa y con alfa-cetoglutarato (a-KG) para producir indol-3-piruvato y Lglutamato. Se hace reaccionar indol-3-piruvato reversiblemente con piruvato y una aldolasa R-específica y se convierte en monatina de R-alfa cetoácido (R-MP). La R-MP se hace reaccionar reversiblemente con una Daminotransferasa y D-alanina para formar (R,R)-monatina y piruvato. Se utilizan una L-alanina aminotransferasa y piruvato para convertir reversiblemente el L-glutamato que fue producto de la reacción de la L-aminotransferasa nuevamente en a-KG, con L-alanina como un coproducto. Una alanina racemasa reversiblemente convierte la Lalanina en la D-alanina que es útil en la tercera reacción (la reacción de D-aminotransferasa). A los efectos de la invención, no es necesario que las reacciones que se muestran como reversibles se lleven a cabo en dirección inversa. Figure 8 is a flowchart showing an example of yet another process to produce (R, R) -monatin according to the present invention. In this example, the process includes recycling the amino acid derivative product of the L-tryptophan reaction with the amino acid reagent from the R-MP reaction by a series of conversion reactions. In the specific example diagrammed in Figure 8, L-tryptophan is reacted reversibly with an L-aminotransferase and with alpha-ketoglutarate (a-KG) to produce indole-3-pyruvate and Lglutamate. Indole-3-pyruvate is reacted reversibly with pyruvate and an R-specific aldolase and converted to R-alpha keto acid monatin (R-MP). R-MP is reversibly reacted with a Daminotransferase and D-alanine to form (R, R) -monatin and pyruvate. An L-alanine aminotransferase and pyruvate are used to reversibly convert the L-glutamate that was a product of the reaction of the L-aminotransferase back to a-KG, with L-alanine as a co-product. An alanine racemase reversibly converts Lalanine to D-alanine which is useful in the third reaction (the D-aminotransferase reaction). For the purposes of the invention, reactions shown to be reversible need not be carried out in the reverse direction.

La Figura 9 diagrama de bloques de un sistema informático. Figure 9 block diagram of a computer system.

La Figura 10 es un diagrama de flujo que ilustra una realización de un proceso para comparar una nueva secuencia de proteína o nucleótido con una base de datos de secuencias para determinar los niveles de homología entre la nueva secuencia y las secuencias en la base de datos. Figure 10 is a flow chart illustrating an embodiment of a process for comparing a new protein or nucleotide sequence to a sequence database to determine levels of homology between the new sequence and the sequences in the database.

La Figura 11 es un diagrama de flujo que ilustra una realización de un proceso en un ordenador para determinar si dos secuencias son homólogas. Figure 11 is a flow chart illustrating an embodiment of a process on a computer to determine if two sequences are homologous.

La Figura 12 es un diagrama de flujo que ilustra una realización de un proceso de identificación 300 para detectar la presencia de una característica en una secuencia. FIG. 12 is a flow chart illustrating an embodiment of an identification process 300 for detecting the presence of a feature in a sequence.

Las Figuras 13 y 14 juntas ilustran las actividades de 58 aldolasas diferentes (cada una identificada con su número específico de SEQ ID) en la formación de precursor de monatina (MP) tal como se midió mediante LC/MS/MS. Figures 13 and 14 together illustrate the activities of 58 different aldolases (each identified by their specific SEQ ID number) in monatin precursor (MP) formation as measured by LC / MS / MS.

La Figura 15 ilustra el efecto de ditiotreitol en la producción de monatina por parte del polipéptido con actividad de aldolasa de SEQ ID NO:88. Figure 15 illustrates the effect of dithiothreitol on monatin production by the aldolase-active polypeptide of SEQ ID NO: 88.

Símbolos de referencia similares en los distintos dibujos indican elementos similares. Similar reference symbols in the various drawings indicate similar elements.

Descripción detallada Detailed description

Precedentemente se han descrito varias realizaciones que serán descritas más detalladamente más adelante. Las realizaciones de la invención incluyen uno o más de los aspectos descritos. Various embodiments have been previously described and will be described in more detail below. Embodiments of the invention include one or more of the described aspects.

Abreviaturas y términos Abbreviations and terms

Las siguientes explicaciones de términos y métodos se proporcionan para describir mejor la presente divulgación y guiar a los expertos en la materia en la puesta en práctica de la presente divulgación. Tal como se utiliza en la presente, “incluyendo” significa “que comprende”. Además, las formas singulares "un", "una" o "el" o "la" incluyen las referencias al plural, a menos que el contexto lo indique claramente de otra manera. Por ejemplo, la referencia a "que comprende una proteína" incluye una o varias de dichas proteínas, y la referencia a "que comprende las células" incluye la referencia a una o más células y equivalentes de las mismas conocidas por los expertos en la materia y así sucesivamente. El término “aproximadamente” abarca el rango de error experimental presente en cualquier medición. A menos que se indique lo contrario, se supone que todos los números correspondientes a mediciones tienen la palabra “aproximadamente” delante de ellos, aun si la palabra “aproximadamente” no se utiliza expresamente. The following explanations of terms and methods are provided to better describe the present disclosure and to guide those skilled in the art in practicing the present disclosure. As used herein, "including" means "comprising". Furthermore, the singular forms "a", "an" or "the" or "the" include references to the plural, unless the context clearly indicates otherwise. For example, the reference to "comprising a protein" includes one or more of said proteins, and the reference to "comprising cells" includes the reference to one or more cells and equivalents thereof known to those skilled in the art and so on. The term "approximately" encompasses the range of experimental error present in any measurement. Unless otherwise indicated, all measurement numbers are assumed to have the word "approximately" in front of them, even if the word "approximately" is not expressly used.

Sustitución conservadora: una sustitución de un aminoácido por otro aminoácido en un polipéptido, la cual tiene poco a ningún impacto sobre la actividad del polipéptido. La sustitución se considera conservadora independientemente de si los aminoácidos intercambiados tienen una apariencia estructural o funcional similar. Por ejemplo, de forma ideal, un polipéptido de triptófano aminotransferasa que incluye una o más sustituciones conservadoras retiene actividad de triptófano aminotransferasa. Puede producirse un polipéptido para que contenga una o más sustituciones conservadoras mediante manipulación de la secuencia nucleotídica que codifica este polipéptido utilizando, por ejemplo, procedimientos convencionales tales como mutagénesis dirigida a sitios o PCR u otros métodos conocidos en la técnica. Conservative substitution: a substitution of one amino acid for another amino acid in a polypeptide, which has little to no impact on the activity of the polypeptide. The substitution is considered conservative regardless of whether the exchanged amino acids have a similar structural or functional appearance. For example, ideally, a tryptophan aminotransferase polypeptide that includes one or more conservative substitutions retains tryptophan aminotransferase activity. A polypeptide may be produced to contain one or more conservative substitutions by manipulation of the nucleotide sequence encoding this polypeptide using, for example, conventional procedures such as site-directed mutagenesis or PCR or other methods known in the art.

Ejemplos no taxativos de aminoácidos que pueden sustituirse por un aminoácido original en una proteína y que se consideran sustituciones conservadoras si hay poco a ningún impacto sobre la actividad del polipéptido incluyen: Ala sustituido por ser o thr; arg sustituido por gln, his o lys; asn sustituido por glu, gln, lys, his, asp; asp sustituido por asn, glu o gln; cys sustituido por ser o ala; gln sustituido por asn, glu, lys, his, asp o arg; glu sustituido por asn, gln lys o asp; gly sustituido por pro; his sustituido por asn, lys, gln, arg, tyr; ile sustituido por leu, met, val, phe; leu sustituido por ile, met, val, phe; lys sustituido por asn, glu, gln, his, arg; met sustituido por ile, leu, val, phe; phe sustituido por trp, tyr, met, ile o leu; ser sustituido por thr, ala; thr sustituido por ser o ala; trp sustituido por phe, tyr; tyr sustituido por his, phe o trp; y val sustituido por met, ile, leu. Non-exhaustive examples of amino acids that can be replaced by an original amino acid in a protein and that are considered conservative substitutions if there is little to no impact on the activity of the polypeptide include: Ala substituted by ser or thr; arg replaced by gln, his or lys; asn replaced by glu, gln, lys, his, asp; asp substituted by asn, glu or gln; cys replaced by ser or ala; gln replaced by asn, glu, lys, his, asp or arg; glu substituted by asn, gln lys or asp; gly replaced by pro; his replaced by asn, lys, gln, arg, tyr; ile replaced by leu, met, val, phe; leu replaced by ile, met, val, phe; lys replaced by asn, glu, gln, his, arg; met replaced by ile, leu, val, phe; phe substituted by trp, tyr, met, ile or leu; be replaced by thr, ala; thr replaced by being or wing; trp replaced by phe, tyr; tyr replaced by his, phe or trp; and val replaced by met, ile, leu.

Información adicional acerca de sustituciones conservadoras puede encontrarse en, entre otros lugares, Ben-Bassat et al., (J. Bacteriol. 169:751-7, 1987), O'Regan et al., (Gene 77:237-51, 1989), Sahin-Toth et al., (Proteína Sci. 3:2407, 1994), Hochuli et al., (Bio/Technology 6: 1321-5, 1988), el documento WO 00/67796 (Curd et al.) y en libros de textos convencionales de genética y de biología molecular. Additional information about conservative substitutions can be found in, among other places, Ben-Bassat et al., (J. Bacteriol. 169: 751-7, 1987), O'Regan et al., (Gene 77: 237-51, 1989), Sahin-Toth et al., (Protein Sci. 3: 2407, 1994), Hochuli et al., (Bio / Technology 6: 1321-5, 1988), WO 00/67796 (Curd et al. ) and in conventional genetics and molecular biology textbooks.

Derivado: A los efectos de la memoria descriptiva y las reivindicaciones, una sustancia es “derivada” de un organismo o fuente si una o más de las siguientes afirmaciones es verdadera: 1) la sustancia está presente en el organismo/fuente; 2) la sustancia se elimina del huésped nativo; o 3) la sustancia se retira del huésped nativo y evoluciona, por ejemplo, mediante mutagénesis. Derived: For the purposes of the specification and claims, a substance is "derived" from an organism or source if one or more of the following statements is true: 1) the substance is present in the organism / source; 2) the substance is removed from the native host; or 3) the substance is removed from the native host and evolves, for example, by mutagenesis.

Aislado: El término “aislado”, tal como se utiliza en la presente, se refiere a cualquier sustancia que se retira de su huésped nativo; la sustancia no necesita ser purificada. Por ejemplo “ácido nucleico aislado” se refiere a un ácido nucleico natural que no está inmediatamente contiguo a ambas secuencias a las cuales está inmediatamente contiguo (una en el extremo 5' y una en el extremo 3') en el genoma natural del organismo del que deriva. Por ejemplo, un ácido nucleico aislado puede ser, a modo no taxativo, una molécula de ADN recombinante de cualquier longitud, siempre que una de las secuencias del ácido nucleico que normalmente se encuentran inmediatamente flanqueando esa molécula de ADN recombinante en un genoma natural se retire o esté ausente. De esta forma, un ácido nucleico aislado incluye, a modo no taxativo, un ADN recombinante que existe como una molécula separada (tal como un ADNc o un fragmento de ADN genómico producido por PCR o tratamiento con endonucleasas de restricción) independiente de otras secuencias, así como ADN recombinante que se incorpora en un vector, un plásmido que se replica de manera autónoma, un virus (por ejemplo, un retrovirus, adenovirus o virus herpético) o en el ADN genómico de un procariota o eucariota. Además, un ácido nucleico aislado puede incluir una molécula de ADN recombinante que forma parte de una secuencia de ácido nucleico híbrido o de fusión. Isolated: The term "isolated", as used herein, refers to any substance that is removed from its native host; the substance does not need to be purified. For example "isolated nucleic acid" refers to a natural nucleic acid that is not immediately contiguous to both sequences to which it is immediately contiguous (one at the 5 'end and one at the 3' end) in the natural genome of the organism of the which derives. For example, an isolated nucleic acid may be, but is not limited to, a recombinant DNA molecule of any length, provided that one of the nucleic acid sequences normally found immediately flanking that recombinant DNA molecule in a natural genome is removed or is absent. Thus, an isolated nucleic acid includes, but is not limited to, a recombinant DNA that exists as a separate molecule (such as a cDNA or a genomic DNA fragment produced by PCR or restriction endonuclease treatment) independent of other sequences, as well as recombinant DNA that is incorporated into a vector, an autonomously replicating plasmid, a virus (eg, a retrovirus, adenovirus, or herpetic virus) or into the genomic DNA of a prokaryote or eukaryote. Furthermore, an isolated nucleic acid can include a recombinant DNA molecule that is part of a hybrid or fusion nucleic acid sequence.

Tal como se utiliza en la presente, el término “aislado” significa que el material (tal como una proteína o ácido nucleico de acuerdo con la invención) se retira de su ambiente original (tal como el ambiente natural si es natural). Por ejemplo, un polinucleótido o polipéptido natural presente en un animal vivo no está aislado, pero el mismo polinucleótido o polipéptido, separado de algunos o todos los materiales coexistentes en el sistema natural, está aislado. Dichos polinucleótidos pueden ser parte de un vector y/o dichos polinucleótidos o polipéptidos pueden ser parte de una composición y aún así estar aislados, ya que dicho vector o composición no es parte de su ambiente natural. As used herein, the term "isolated" means that the material (such as a protein or nucleic acid according to the invention) is removed from its original environment (such as the natural environment if it is natural). For example, a natural polynucleotide or polypeptide present in a living animal is not isolated, but the same polynucleotide or polypeptide, separated from some or all of the coexisting materials in the natural system, is isolated. Said polynucleotides can be part of a vector and / or said polynucleotides or polypeptides can be part of a composition and still be isolated, since said vector or composition is not part of its natural environment.

El término “aislado”, tal como se utiliza en la presente con relación al ácido nucleico, incluye también cualquier ácido nucleico artificial, ya que las secuencias de ácido nucleico artificiales no se encuentran en la naturaleza y no tienen secuencias inmediatamente contiguas en un genoma natural. Por ejemplo, el ácido nucleico, artificial tal como un The term "isolated", as used herein in relation to nucleic acid, also includes any artificial nucleic acid, since artificial nucleic acid sequences are not found in nature and do not have immediately contiguous sequences in a natural genome. . For example, artificial nucleic acid such as a

ácido nucleico manipulado genéticamente, se considera que es un ácido nucleico aislado. El ácido nucleico manipulado genéticamente puede obtenerse utilizando técnicas de clonación molecular comunes o de síntesis química de ácido nucleico. El ácido nucleico artificial aislado puede ser independiente de otras secuencias o incorporarse en un vector, un plásmido que se replica de manera autónoma, un virus (por ejemplo, un retrovirus, adenovirus o virus herpético) o el ADN genómico de un procariota o eucariota. Además, un ácido nucleico artificial puede incluir una molécula de ácido nucleico que forma parte de una secuencia de ácido nucleico híbrido o de fusión. Genetically manipulated nucleic acid is considered to be an isolated nucleic acid. Genetically engineered nucleic acid can be obtained using common molecular cloning techniques or chemical nucleic acid synthesis. The isolated artificial nucleic acid can be independent of other sequences or incorporated into a vector, an autonomously replicating plasmid, a virus (eg, a retrovirus, adenovirus, or herpetic virus), or the genomic DNA of a prokaryote or eukaryote. Furthermore, an artificial nucleic acid can include a nucleic acid molecule that is part of a hybrid or fusion nucleic acid sequence.

Purificado: El término “purificado”, tal como se utiliza en la presente, no requiere pureza absoluta, sino que pretende ser un término relativo. Así, por ejemplo, una preparación purificada de polipéptido o ácido nucleico puede ser aquella en la que el polipéptido o ácido nucleico en cuestión esté en una concentración mayor que la que el polipéptido o ácido nucleico estaría en su ambiente natural dentro de un organismo o una concentración mayor que la del medio ambiente de cual se retiró. Purified: The term "purified" as used herein does not require absolute purity, but is intended to be a relative term. Thus, for example, a purified polypeptide or nucleic acid preparation may be one in which the polypeptide or nucleic acid in question is in a higher concentration than the polypeptide or nucleic acid would be in its natural environment within an organism or a concentration greater than that of the environment from which it was withdrawn.

Se han purificado convencionalmente ácido nucleicos individuales obtenidos de una biblioteca hasta lograr una homogeneidad electroforética. Las secuencias obtenidas de estos clones no pudieron obtenerse directamente de la biblioteca o del ADN humano total. Los ácidos nucleicos purificados divulgados en la presente se purificaron a partir del resto del ADN genómico en el organismo al menos 104-106 veces. En algunas realizaciones, el término “purificado” incluye ácidos nucleicos que fueron purificados a partir del resto de ADN genómico o a partir de otras secuencias en una biblioteca u otro ambiente por al menos una orden de magnitud, tal como, en algunas realizaciones, dos o más órdenes o cuatro o cinco órdenes de magnitud. Individual nucleic acids obtained from a library have been conventionally purified to achieve electrophoretic homogeneity. The sequences obtained from these clones could not be obtained directly from the library or from total human DNA. The purified nucleic acids disclosed herein were purified from the rest of the genomic DNA in the body at least 104-106 times. In some embodiments, the term "purified" includes nucleic acids that were purified from the rest of the genomic DNA or from other sequences in a library or other environment by at least an order of magnitude, such as, in some embodiments, two or more orders or four or five orders of magnitude.

Aminoácido: “Aminoácido” o “secuencia de aminoácidos”, tal como se utiliza en la presente, se refiere a una secuencia de oligopéptidos, péptidos, polipéptidos o proteínas o a un fragmento, porción o subunidad de cualquiera de éstos, y a moléculas naturales o sintéticas. “Aminoácido” o “secuencia de aminoácidos" incluye una secuencia de oligopéptidos, péptidos, polipéptidos o proteínas o un fragmento, porción o subunidad de cualquiera de éstos, y moléculas naturales o sintéticas. El término “polipéptido”, tal como se usa en la presente, se refiere a aminoácidos unidos entre sí por enlaces peptídicos o enlaces peptídicos modificados, es decir, isoésteres peptídicos, y pueden contener aminoácidos modificados que no sean los 20 aminoácidos codificados por genes. Los polipéptidos pueden modificarse por procesos naturales, tal como procesamiento post-translacional o por técnicas de modificación química que se conocen bien en la técnica. Pueden ocurrir modificaciones en cualquier parte en el polipéptido, incluida la estructura central del péptido, las cadenas laterales de aminoácidos y los extremos amino o carboxilo. Se apreciará que el mismo tipo de modificación puede estar presente en el mismo grado o en grados diferentes en varios sitios en un polipéptido dado. Asimismo, un polipéptido dado puede tener muchos tipos de modificaciones. Las modificaciones incluyen acetilación, acilación, ADP-ribosilación, amidación, unión covalente de flavina, unión covalente de un resto hemo, unión covalente de un nucleótido o derivado de nucleótidos, unión covalente de un lípido o derivado de lípidos, unión covalente un fosfatidilinositol, ciclización reticulante, formación de enlaces de disulfuro, desmetilación, formación de enlaces intermoleculares covalentes, formación de cisteína, formación de piroglutamato, formilación, gama-carboxilación, glicosilación, formación de anclajes GPI, hidroxilación, yodación, metilación, miristoliación, oxidación, pegilación, procesamiento de glucano hidrolasa, fosforilación, prenilación, racemización, selenoilación, sulfación y adición de aminoácidos mediada por ARN de transferencia a proteína tal como arginilación. (Ver Creighton, T. E., Proteins - Structure and Molecular Properties 2da Ed., W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, págs. 1-12 (1983)). Los péptidos y polipéptidos divulgados en la presente también incluyen todas las formas “miméticas” y “peptidomiméticas”, como se describe en mayor detalle más adelante. Amino Acid: "Amino acid" or "amino acid sequence", as used herein, refers to a sequence of oligopeptides, peptides, polypeptides or proteins or to a fragment, portion or subunit of any of these, and to natural or synthetic molecules . "Amino acid" or "amino acid sequence" includes a sequence of oligopeptides, peptides, polypeptides or proteins or a fragment, portion or subunit of any of these, and natural or synthetic molecules. The term "polypeptide", as used in the present, refers to amino acids linked together by peptide bonds or modified peptide bonds, ie, peptide isosters, and may contain modified amino acids other than the 20 gene-encoded amino acids. Polypeptides can be modified by natural processes, such as post processing -translational or by chemical modification techniques well known in the art Modifications can occur anywhere in the polypeptide, including the central structure of the peptide, the amino acid side chains and the amino or carboxyl termini. type of modification may be present to the same degree or to different degrees at various sites in a polypeptide dice. Also, a given polypeptide can have many types of modifications. Modifications include acetylation, acylation, ADP-ribosylation, amidation, covalent attachment of flavin, covalent attachment of a heme moiety, covalent attachment of a nucleotide or nucleotide derivative, covalent attachment of a lipid or lipid derivative, covalent attachment of a phosphatidylinositol, crosslinking cyclization, disulfide bond formation, demethylation, covalent intermolecular bond formation, cysteine formation, pyroglutamate formation, formylation, gamma-carboxylation, glycosylation, GPI anchor formation, hydroxylation, iodination, methylation, myristollation, oxidation, pegylation, glucan hydrolase processing, phosphorylation, prenylation, racemization, selenoylation, sulfation, and protein transfer RNA mediated addition of amino acids such as arginylation. (See Creighton, TE, Proteins - Structure and Molecular Properties 2nd Ed., WH Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, BC Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)). The peptides and polypeptides disclosed herein also include all "mimetic" and "peptidomimetic" forms, as described in greater detail below.

Polipéptido que tiene una actividad de aldolasa: “Polipéptido que tiene una actividad de aldolasa” significa un polipéptido que solo o en asociación con uno o más polipéptidos adicionales (que tienen la misma secuencia o una secuencia diferente) es una proteína con la actividad enzimática de una aldolasa. Polypeptide having aldolase activity: "Polypeptide having aldolase activity" means a polypeptide which alone or in association with one or more additional polypeptides (having the same or a different sequence) is a protein with the enzymatic activity of an aldolase.

Recombinante: Polipéptidos o proteínas “recombinantes” se refiere a polipéptidos o proteínas producidas por técnicas de ADN recombinante; es decir, producidas a partir de células transformadas por un constructo de ADN exógeno que codifica el polipéptido o proteína deseada. Polipéptidos o proteínas “sintéticas” son aquellas preparadas por síntesis química. Los métodos de síntesis química de péptidos también pueden usarse para sintetizar el polipéptido o los fragmentos divulgados en la presente. Dicho método se conoce en la técnica desde principios de los años sesenta (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Ver también Stewart, J. Recombinant: "Recombinant" polypeptides or proteins refers to polypeptides or proteins produced by recombinant DNA techniques; that is, produced from cells transformed by an exogenous DNA construct that encodes the desired polypeptide or protein. Polypeptides or "synthetic" proteins are those prepared by chemical synthesis. Chemical peptide synthesis methods can also be used to synthesize the polypeptide or fragments disclosed herein. Such a method has been known in the art since the early 1960s (Merrifield, R. B., J. Am. Chem. Soc., 85: 2149-2154, 1963) (See also Stewart, J.

M. y Young, J. D., Solid Phase Peptide Synthesis, 2da Ed., Pierce Chemical Co., Rockford, Ill., págs. 11-12)) y se emplearon recientemente en kits de diseño y síntesis de laboratorio disponibles en el comercio (Cambridge Research Biochemicals). Dichos kits de laboratorio disponibles comercialmente han utilizado generalmente los descubrimientos de H. M. Geysen et al., Proc. Natl. Acad. Sci., Estados Unidos, 81:3998 (1984) y proporcionan péptidos de sintetización sobre las puntas de múltiples “varillas” o “clavijas”, todas las cuales están conectadas a una única placa. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., Pgs. 11-12)) and were recently used in commercially available laboratory design and synthesis kits (Cambridge Research Biochemicals). Such commercially available laboratory kits have generally used the findings of H. M. Geysen et al., Proc. Natl. Acad. Sci., USA, 81: 3998 (1984) and provide synthesizing peptides on the tips of multiple "rods" or "pins", all of which are connected to a single plate.

Básicamente idénticos: La frase “básicamente idénticos”, en el contexto de dos ácidos nucleicos o polipéptidos, se refiere a dos o más secuencias que tienen, por ejemplo, al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, Basically identical: The phrase "basically identical", in the context of two nucleic acids or polypeptides, refers to two or more sequences that have, for example, at least about 50%, 51%, 52%, 53%, 54% , 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71 %, 72%, 73%, 74%,

75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más identidad (de secuencia) de residuos de nucleótidos o aminoácidos cuando se comparan y se alinean para una correspondencia máxima, según se mide utilizando uno de los algoritmos de comparación de secuencias conocidos o mediante inspección visual. En otras realizaciones, la identidad básica existe en una región de al menos aproximadamente 100 o más residuos y más comúnmente las secuencias son básicamente idénticas en al menos aproximadamente 150 a 200 o más residuos. En algunas realizaciones las secuencias son básicamente idénticas en la longitud completa de las regiones de codificación. 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91% , 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or more (sequence) identity of nucleotide or amino acid residues when compared and aligned for maximum correspondence, based on it is measured using one of the known sequence comparison algorithms or by visual inspection. In other embodiments, the basic identity exists in a region of at least about 100 or more residues, and more commonly the sequences are basically identical at least about 150 to 200 or more residues. In some embodiments, the sequences are basically identical over the full length of the coding regions.

Además, una secuencia de aminoácidos “básicamente idéntica” es una secuencia que difiere de una secuencia de referencia por una o más sustituciones, eliminaciones o inserciones de aminoácidos conservadoras o no conservadoras. En algunas realizaciones, la sustitución ocurre en un sitio que no es el sitio activo de la molécula o, alternativamente, la sustitución ocurre en un sitio que es el sitio activo de la molécula, siempre que el polipéptido retenga esencialmente sus propiedades funcionales (enzimáticas). Una sustitución de aminoácidos conservadora, por ejemplo, sustituye un aminoácido por otro de la misma clase (tal como la sustitución de un aminoácido hidrófobo, tal como isoleucina, valina, leucina o metionina, por otro, o la sustitución de un aminoácido polar por otro, tal como la sustitución de arginina por lisina, ácido glutámico por ácido aspártico o glutamina por asparagina). Pueden eliminarse uno o más aminoácidos, por ejemplo, de un polipéptido de aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, lo que resulta en la modificación de la estructura del polipéptido, sin alterar considerablemente su actividad biológica. Por ejemplo, los aminoácidos amino o carboxilo-terminales que no son necesarios para la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, pueden eliminarse. Las secuencias de polipéptidos modificados divulgadas en la presente pueden evaluarse en busca de actividad biológica de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, mediante diferentes métodos, incluyendo poner en contacto la secuencia de polipéptidos modificados con un sustrato y determinar si el polipéptido modificado disminuye la cantidad de sustrato específico en el ensayo o aumenta los bioproductos de la reacción enzimática de un polipéptido funcional de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa con el sustrato. Furthermore, a "basically identical" amino acid sequence is a sequence that differs from a reference sequence by one or more conservative or non-conservative amino acid substitutions, deletions, or insertions. In some embodiments, the substitution occurs at a site that is not the active site of the molecule or, alternatively, the substitution occurs at a site that is the active site of the molecule, provided that the polypeptide essentially retains its functional (enzymatic) properties. . A conservative amino acid substitution, for example, substitutes one amino acid for another of the same kind (such as substituting one hydrophobic amino acid, such as isoleucine, valine, leucine, or methionine, for another, or substituting one polar amino acid for another , such as the substitution of arginine for lysine, glutamic acid for aspartic acid or glutamine for asparagine). One or more amino acids, for example, can be removed from an aldolase polypeptide, such as pyruvate aldolase, HMG and / or KHG aldolase, resulting in modification of the structure of the polypeptide, without significantly altering its biological activity. For example, amino or carboxyl-terminal amino acids that are not necessary for the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be removed. The modified polypeptide sequences disclosed herein can be evaluated for biological activity of enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, by various methods, including contacting the modified polypeptide sequence with a substrate and determining whether the modified polypeptide decreases the amount of specific substrate in the assay or increases the bioproducts of the enzymatic reaction of an aldolase functional polypeptide, such as pyruvate aldolase, such as HMG and / or KHG aldolase with the substrate.

Fragmento: Un “fragmento”, tal como se usa en la presente con respecto a una proteína o polipéptido o ácido nucleico, es una porción de la proteína, polipéptido o ácido nucleico, respectivamente. Los fragmentos pueden tener el mismo o básicamente la misma secuencia de aminoácidos o ácidos nucleicos que la secuencia de proteínas, polipéptidos o ácidos nucleicos más larga de la cual deriva el fragmento. También se incluyen los fragmentos que tienen estructuras tridimensionales diferentes en comparación con las de las proteínas, polipéptidos o ácido nucleicos más largos. Un ejemplo de esto es una molécula “pro-forma”, tal como una proproteína de baja actividad que puede modificarse por escisión para producir una enzima madura con una actividad considerablemente más alta. Un fragmento de una proteína o polipéptido puede ser una porción enzimáticamente activa de una proteína o polipéptido. Fragment: A "fragment", as used herein with respect to a protein or polypeptide or nucleic acid, is a portion of the protein, polypeptide or nucleic acid, respectively. The fragments can have the same or basically the same amino acid or nucleic acid sequence as the longest protein, polypeptide or nucleic acid sequence from which the fragment is derived. Fragments having different three-dimensional structures compared to those of longer proteins, polypeptides, or nucleic acids are also included. An example of this is a "pro-forma" molecule, such as a low-activity proprotein that can be modified by cleavage to produce a mature enzyme with considerably higher activity. A fragment of a protein or polypeptide can be an enzymatically active portion of a protein or polypeptide.

Aminotransferasa estereoinversora: Una “aminotransferasa estereoinversora” es un polipéptido capaz de producir preferiblemente o selectivamente un producto de aminoácido quiral (tal como monatina) mientras que utiliza un sustrato de quiralidad opuesta como donante de amino. Por ejemplo, una aminotransferasa estereoinversora puede ser una D-fenilglicina aminotransferasa (también denominada D-4-hidroxifenilglicina aminotransferasa) que utiliza preferiblemente o selectivamente L-glutamato como sustrato para producir (R,R)-monatina. Ejemplos no taxativos de aminotransferasas estereoinversoras incluyen D-metionina aminotransferasa (EC 2.6.1.41) y enzimas que tienen actividad de D-fenilglicina aminotransferasa o actividad de D-4-hidroxifenilglicina aminotransferasa. Stereoinverting Aminotransferase: A "stereoinverting aminotransferase" is a polypeptide capable of preferentially or selectively producing a chiral amino acid product (such as monatin) while using a substrate of opposite chirality as an amino donor. For example, a stereoinverting aminotransferase may be a D-phenylglycine aminotransferase (also called D-4-hydroxyphenylglycine aminotransferase) that preferably or selectively uses L-glutamate as a substrate to produce (R, R) -monatin. Non-exhaustive examples of stereoinverting aminotransferases include D-methionine aminotransferase (EC 2.6.1.41) and enzymes that have D-phenylglycine aminotransferase activity or D-4-hydroxyphenylglycine aminotransferase activity.

La divulgación proporciona polipéptidos con actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, polinucleótidos que los codifican y métodos para preparar y utilizar estos polinucleótidos y polipéptidos. En algunas realizaciones, la divulgación también proporciona enzimas aldolasa, tales como enzimas piruvato aldolasa, tal como HMG y/o KHG aldolasa, polinucleótidos que codifican estas enzimas, el uso de dichos polinucleótidos y polipéptidos. The disclosure provides aldolase-active polypeptides, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, polynucleotides encoding them, and methods of preparing and using these polynucleotides and polypeptides. In some embodiments, the disclosure also provides aldolase enzymes, such as pyruvate aldolase enzymes, such as HMG and / or KHG aldolase, polynucleotides encoding these enzymes, the use of such polynucleotides, and polypeptides.

La divulgación proporciona aldolasas, tales como piruvato aldolasas, HMG y/o KHG aldolasas, modificadas o evolucionadas con una actividad específica mayor en comparación con las aldolasas no modificadas ni evolucionadas, respectivamente. The disclosure provides aldolases, such as pyruvate aldolases, HMG and / or KHG aldolases, modified or evolved with a higher specific activity compared to unmodified or evolved aldolases, respectively.

Se proporcionan aldolasas, tales como una piruvato aldolasa, tal como, a modo no taxativo una HMG y/o una KHG aldolasa, que facilitan la producción de un 2-ceto-glutarato 3,4-sustituido. La divulgación proporciona un método para preparar un 2-ceto-glutarato 3,4-sustituido que comprende: (a) proporcionar un polipéptido que tiene una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como, a modo no taxativo, una actividad de HMG aldolasa y/o KMG aldolasa; (b) proporcionar un donante y un compuesto aceptor; y (c) poner en contacto el polipéptido de la etapa (a) con los compuestos de la etapa (b) en condiciones en las cuales la aldolasa cataliza la síntesis de un 2-ceto-glutarato 3,4-sustituido, en donde opcionalmente el donante y el aceptor son un piruvato o un donante de piruvato y un aceptor a-cetoácido, una cetona y/o un aldehído. Aldolases, such as a pyruvate aldolase, such as, but not limited to, an HMG and / or a KHG aldolase, are provided which facilitate the production of a 3,4-substituted 2-keto-glutarate. The disclosure provides a method of preparing a 3,4-substituted 2-keto glutarate comprising: (a) providing a polypeptide having aldolase activity, such as pyruvate aldolase activity, such as, non-limitingly, an HMG aldolase and / or KMG aldolase activity; (b) providing a donor and an acceptor compound; and (c) contacting the polypeptide of step (a) with the compounds of step (b) under conditions in which aldolase catalyzes the synthesis of a 3,4-substituted 2-keto-glutarate, where optionally the donor and acceptor are a pyruvate or a pyruvate donor and an a-keto acid acceptor, a ketone and / or an aldehyde.

Una piruvato aldolasa, tal como una HMG y/o una KHG aldolasa, puede utilizarse junto con una D-aminotransferasa para preparar un ácido D-glutámico 4-sustituido o un derivado del mismo. Un ácido D-glutámico 4-sustituido y/o un derivado del mismo puede utilizarse como un antibiótico, dado que se ha descubierto que estos compuestos inhiben A pyruvate aldolase, such as an HMG and / or a KHG aldolase, can be used in conjunction with a D-aminotransferase to prepare a 4-substituted D-glutamic acid or a derivative thereof. A 4-substituted D-glutamic acid and / or a derivative thereof can be used as an antibiotic, since these compounds have been found to inhibit

la glutamato racemasa bacteriana. La divulgación proporciona un método para preparar un ácido D-glutámico 4sustituido que comprende: (a) proporcionar un polipéptido que tiene una actividad de aldolasa, tal como una actividad de piruvato aldolasa, tal como, a modo no taxativo, una actividad de HMG aldolasa y/o KMG aldolasa; (b) proporcionar un aceptor a-cetoácido y un piruvato o un donante de piruvato; y (c) poner en contacto el polipéptido de la etapa (a) con los compuestos de la etapa (b) en condiciones en las cuales la aldolasa cataliza la síntesis de un ácido D-glutámico 4-sustituido, en donde opcionalmente el polipéptido tiene actividad de piruvato aldolasa, HMG aldolasa y/o KHG aldolasa y en donde opcionalmente el método además comprende el uso de una Daminotransferasa. bacterial glutamate racemase. The disclosure provides a method of preparing a 4-substituted D-glutamic acid comprising: (a) providing a polypeptide having an aldolase activity, such as a pyruvate aldolase activity, such as, non-exhaustively, an HMG aldolase activity and / or KMG aldolase; (b) providing an a-keto acid acceptor and a pyruvate or a pyruvate donor; and (c) contacting the polypeptide of step (a) with the compounds of step (b) under conditions in which aldolase catalyzes the synthesis of a 4-substituted D-glutamic acid, where optionally the polypeptide has pyruvate aldolase, HMG aldolase and / or KHG aldolase activity and optionally the method further comprises the use of a Daminotransferase.

La divulgación proporciona composiciones (tales como preparaciones de enzimas, alimentos y aditivos para alimentos, piensos y aditivos para piensos, bebidas y aditivos para bebidas, fármacos y aditivos para fármacos, y complementos alimentarios) que comprenden las enzimas, polipéptidos o polinucleótidos como se divulga en la presente. Estas composiciones pueden formularse en una variedad de formas, tales como líquidos, geles, píldoras, comprimidos, aerosoles, películas, micelas, polvos, alimento, granulados de pienso o formas encapsuladas, incluyendo formas nanoencapsuladas. The disclosure provides compositions (such as enzyme preparations, food and food additives, feed and feed additives, beverages and beverage additives, drugs and drug additives, and food supplements) comprising the enzymes, polypeptides or polynucleotides as disclosed at the moment. These compositions can be formulated in a variety of forms, such as liquids, gels, pills, tablets, sprays, films, micelles, powders, food, feed granules, or encapsulated forms, including nanoencapsulated forms.

Ensayos para medir la actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, tal como para determinar si un polipéptido tiene actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, son bien conocidos en la técnica; ver E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992; Taha T S, Deits TL, Purification and characterization of 2-keto-3-deoxy-6-phosphogluconate aldolase from Azotobacter vinelandii: evidence that the enzyme is bifunctional towards 2-keto-4-hydroxy glutarate cleavage, Biochem Biophys Res Commun. 1994 Apr. 15; 200(1):459-66; Dekker EE, Kobes RD, Grady SR, 2-keto-4-hydroxiglutarate aldolase from bovine liver, Methods Enzymol. 1975;42:280-5; Dekker EE, Nishihara H, Grady SR, Methods Enzymol. 1975;42:285-90, 2-keto-4hydroxyglutarate aldolase from Escherichia coli; Nishihara H, Dekker EE, Biochim Biophys Acta. 1969 Jul 8;185(1):255-7, A stereospecific 2-keto-4-hydroxyglutarate aldolase from Escherichia coli. Un ejemplo de un ensayo adecuado para determinar si un polipéptido tiene actividad de aldolasa, tal como actividad de piruvato aldolasa, tal como HMG y/o KHG aldolasa se describe en el Ejemplo 3. Assays for measuring aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity, such as for determining whether a polypeptide has aldolase activity, including pyruvate activity such as, Non-limiting, HMG and / or KHG aldolase activity are well known in the art; see E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992; Taha T S, Deits TL, Purification and characterization of 2-keto-3-deoxy-6-phosphogluconate aldolase from Azotobacter vinelandii: evidence that the enzyme is bifunctional towards 2-keto-4-hydroxy glutarate cleavage, Biochem Biophys Res Commun. 1994 Apr. 15; 200 (1): 459-66; Dekker EE, Kobes RD, Grady SR, 2-keto-4-hydroxyglutarate aldolase from bovine liver, Methods Enzymol. 1975; 42: 280-5; Dekker EE, Nishihara H, Grady SR, Methods Enzymol. 1975; 42: 285-90, 2-keto-4hydroxyglutarate aldolase from Escherichia coli; Nishihara H, Dekker EE, Biochim Biophys Acta. 1969 Jul 8; 185 (1): 255-7, A stereospecific 2-keto-4-hydroxyglutarate aldolase from Escherichia coli. An example of a suitable assay to determine if a polypeptide has aldolase activity, such as pyruvate aldolase activity, such as HMG and / or KHG aldolase is described in Example 3.

Las aldolasas pueden utilizarse de forma efectiva con una variedad de condiciones de pH, incluyendo por ejemplo, de un rango de aproximadamente 3,0 a aproximadamente 12,0. Las aldolasas pueden utilizarse a aproximadamente pH 3,0, 4,0, 4,5, 5,0, 5,5, 6,0, 6,5, 7,0, 7,5, 8,0, 8,5, 9,0, 9,5, 10,0, 10,5, 11,0, 11,5 o aproximadamente 12,0. También pueden resultar ventajosas las condiciones de reacción llevadas a cabo en condiciones ácidas o alcalinas, tales como en ciertas aplicaciones industriales o farmacéuticas de enzimas divulgadas en la presente. Aldolases can be used effectively with a variety of pH conditions, including, for example, a range from about 3.0 to about 12.0. Aldolases can be used at approximately pH 3.0, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5 , 9.0, 9.5, 10.0, 10.5, 11.0, 11.5 or about 12.0. Reaction conditions carried out under acidic or alkaline conditions, such as in certain industrial or pharmaceutical applications of enzymes disclosed herein, may also be advantageous.

La divulgación proporciona polipéptidos de aldolasa, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa tal como se divulgan en la presente en una variedad de formas y formulaciones. En los métodos divulgados en la presente se utilizan polipéptidos de aldolasa, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa tal como se divulgan en la presente en una variedad de formas y formulaciones. Por ejemplo, polipéptidos purificados de aldolasa, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa pueden utilizarse en preparaciones de enzimas desplegadas en la producción de ácido R-2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (R-MP) y ciertos estereoisómeros de monatina, tales como (R,R)- y (S,R)-monatina y sales de los mismos, así como ciertos estereoisómeros de derivados de monatina, tales como las configuraciones de derivados de (R,R)- y (S,R)-monatina y sales de los mismos o aplicaciones farmacéuticas o de auxiliar alimenticio. De forma alternativa, las enzimas divulgadas en la presente pueden utilizarse directamente en procesos para producir ácido R-2-hidroxi 2-(indol-3ilmetil)-4-cetoglutárico (R-MP) y ciertos estereoisómeros de monatina, tales como (R,R)-monatina y sales de los mismos, así como ciertos estereoisómeros de derivados de monatina, tales como las configuraciones de derivados de (R,R)-monatina y sales de los mismos, para procesar alimentos, líquidos, piensos y similares. The disclosure provides aldolase polypeptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase as disclosed herein in a variety of forms and formulations. Aldolase polypeptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase as disclosed herein in a variety of forms and formulations are used in the methods disclosed herein. For example, purified aldolase polypeptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be used in enzyme preparations deployed in the production of R-2-hydroxy 2- (indole-3-ylmethyl) -4- acid. ketoglutaric (R-MP) and certain monatin stereoisomers, such as (R, R) - and (S, R) -monatin and salts thereof, as well as certain stereoisomers of monatin derivatives, such as derivative configurations of (R, R) - and (S, R) -monatin and salts thereof or pharmaceutical or food aid applications. Alternatively, the enzymes disclosed herein can be used directly in processes to produce R-2-hydroxy 2- (indole-3-methylmethyl) -4-ketoglutaric acid (R-MP) and certain monatin stereoisomers, such as (R, R) -monatin and salts thereof, as well as certain stereoisomers of monatin derivatives, such as configurations of (R, R) -monatin derivatives and salts thereof, for processing food, liquids, feed and the like.

En algunas realizaciones, polipéptidos de aldolasa, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente pueden expresarse en un microorganismo utilizando procedimientos conocidos en la técnica. Los polipéptidos de aldolasa, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente puede inmovilizarse en un soporte sólido antes de su uso en los métodos divulgados en la presente. Métodos para inmovilizar enzimas sobre soportes sólidos son comúnmente conocidos en la técnica, por ejemplo J. Mol. Cat. B: Enzymatic 6 (1999) 29-39; Chivata et al. Biocatalysis: Immobilized cells and enzymes, J. Mol. Cat. 37 (1986) 1-24: Sharma et al., Immobilized Biomaterials Techniques and Applications, Angew. Chem. Int. Ed. Engl. 21 (1982) 837-54: Laskin (Ed.), Enzymes and Immobilized Cells in Biotechnology. In some embodiments, aldolase polypeptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein can be expressed in a microorganism using procedures known in the art. The aldolase polypeptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein can be immobilized on a solid support prior to use in the methods disclosed herein. Methods for immobilizing enzymes on solid supports are commonly known in the art, for example J. Mol. Cat. B: Enzymatic 6 (1999) 29-39; Chivata et al. Biocatalysis: Immobilized cells and enzymes, J. Mol. Cat. 37 (1986) 1-24: Sharma et al., Immobilized Biomaterials Techniques and Applications, Angew. Chem. Int. Ed. Engl. 21 (1982) 837-54: Laskin (Ed.), Enzymes and Immobilized Cells in Biotechnology.

Ácidos nucleicos, sondas y moléculas inhibidoras Nucleic acids, probes, and inhibitory molecules

La divulgación proporciona ácidos nucleicos aislados y recombinantes tales como los del Listado de secuencias; ácidos nucleicos que codifican polipéptidos, incluidas las secuencias de polinucleótidos divulgadas en la presente, tales como las del Listado de secuencias; incluidos cassettes de expresión tales como vectores de expresión y varios vehículos de clonación que comprenden ácidos nucleicos divulgados en la presente. En algunas realizaciones, la divulgación también incluye métodos para descubrir, identificar o aislar secuencias de polipéptidos de aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa nuevas utilizando los ácidos nucleicos divulgados en The disclosure provides isolated and recombinant nucleic acids such as those in the Sequence Listing; Nucleic acids encoding polypeptides, including the polynucleotide sequences disclosed herein, such as those in the Sequence Listing; including expression cassettes such as expression vectors and various cloning vehicles comprising nucleic acids disclosed herein. In some embodiments, the disclosure also includes methods for discovering, identifying, or isolating aldolase polypeptide sequences, such as new pyruvate aldolase, HMG, and / or KHG aldolase using the nucleic acids disclosed in

la presente. La divulgación también incluye métodos para inhibir la expresión de genes y transcriptos que codifican aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa utilizando los ácidos nucleicos divulgados en la presente. the present. The disclosure also includes methods of inhibiting the expression of aldolase-encoding genes and transcripts, such as pyruvate aldolase, such as HMG and / or KHG aldolase using the nucleic acids disclosed herein.

Adicionalmente se proporcionan métodos para modificar los ácidos nucleicos divulgados en la presente, que incluyen hacer variantes de ácidos nucleicos divulgados en la presente mediante, por ejemplo, reensamblaje de ligadura sintética, sistema de evolución dirigida optimizada y/o mutagénesis por saturación tal como mutagénesis por saturación de sitio génico (GSSM). La expresión “mutagénesis por saturación”, Mutagénesis por Saturación de Sitio Génico o “GSSM” incluye un método que utiliza cebadores de oligonucleótidos degenerados para introducir mutaciones puntuales en un polinucleótido, tal como se describe en detalle más adelante. La expresión “sistema de evolución dirigida optimizada” o “evolución dirigida optimizada” incluye un método para reensamblar fragmentos de secuencias de ácido nucleico relacionadas, tales como genes relacionados y se explica en detalle más adelante. La expresión “reensamblaje de ligadura sintética” o “SLR” incluye un método para ligar fragmentos de oligonucleótidos de forma no estocástica y se explica en detalle más adelante. El término “variante” se refiere a polinucleótidos o polipéptidos divulgados en la presente modificados en uno o más pares de bases, codones, intrones, exones o residuos de aminoácidos (respectivamente) que aún conservan la actividad biológica de una aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa divulgada en la presente. Las variantes pueden producirse mediante varios medios incluidos métodos tales como, por ejemplo, PCR propensa a errores, transposición, mutagénesis dirigida mediante oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagénesis in vivo, mutagénesis por cassette, mutagénesis recursiva de conjunto, mutagénesis exponencial de conjunto, mutagénesis sitio específica, reensamblaje génico, GSSM y combinaciones de los mismos. Additionally methods are provided for modifying the nucleic acids disclosed herein, including making nucleic acid variants disclosed herein by, for example, synthetic ligation reassembly, optimized targeted evolution system, and / or saturation mutagenesis such as gene site saturation (GSSM). The term "saturation mutagenesis", Gene Site Saturation Mutagenesis, or "GSSM" includes a method that uses degenerate oligonucleotide primers to introduce point mutations into a polynucleotide, as described in detail below. The term "optimized targeted evolution system" or "optimized targeted evolution" includes a method for reassembling fragments of related nucleic acid sequences, such as related genes, and is explained in detail below. The term "synthetic ligation reassembly" or "SLR" includes a method for ligating oligonucleotide fragments non-stochastically and is explained in detail below. The term "variant" refers to polynucleotides or polypeptides disclosed herein modified at one or more base pairs, codons, introns, exons, or amino acid residues (respectively) that still retain the biological activity of an aldolase, such as pyruvate aldolase , HMG and / or KHG aldolase disclosed herein. Variants can be produced by various means including methods such as, for example, error-prone PCR, transposition, oligonucleotide-directed mutagenesis, assembly PCR, sexual PCR mutagenesis, in vivo mutagenesis, cassette mutagenesis, ensemble recursive mutagenesis, mutagenesis ensemble exponential, site specific mutagenesis, gene reassembly, GSSM, and combinations thereof.

Los ácidos nucleicos divulgados en la presente pueden hacerse, aislarse y/o manejarse mediante, por ejemplo, clonación y expresión de bibliotecas de ADNc, amplificación de ADN mensajero o genómico mediante PCR y similares. Por ejemplo, las secuencias divulgadas en la presente se derivaron inicialmente de fuentes ambientales. Por consiguiente, la divulgación proporciona ácidos nucleicos que codifican aldolasa, tales como piruvato aldolasa, tales como enzima HMG y/o KHG aldolasa y los polipéptidos codificados por los mismos, preferiblemente derivados de una fuente común, tal como una ambiental, cultivo mixto o una fuente bacteriana. The nucleic acids disclosed herein can be made, isolated and / or managed by, for example, cloning and expression of cDNA libraries, amplification of messenger or genomic DNA by PCR, and the like. For example, the sequences disclosed herein were initially derived from environmental sources. Accordingly, the disclosure provides aldolase-encoding nucleic acids, such as pyruvate aldolase, such as the HMG and / or KHG aldolase enzyme and the polypeptides encoded therein, preferably derived from a common source, such as an environmental, mixed culture, or a bacterial source.

Al poner en práctica los métodos divulgados en la presente, se pueden modificar genes homólogos utilizando un ácido nucleico plantilla, tal como se describe en la presente. Los métodos pueden ponerse en práctica junto con cualquier método o protocolo o dispositivo conocido en la técnica, los cuales se han descrito en la literatura científica y de patentes. By practicing the methods disclosed herein, homologous genes can be modified using a template nucleic acid, as described herein. The methods can be practiced in conjunction with any method or protocol or device known in the art, which have been described in the scientific and patent literature.

Las frases “ácido nucleico” o “secuencia de ácidos nucleicos”, tal como se usan en la presente, se refieren a un oligonucleótido, nucleótido, polinucleótido o a un fragmento de cualquiera de estos, de ADN o ARN de origen genómico o sintético, los cuales pueden ser de una sola hebra o de doble hebra y pueden representar una cadena sentido o antisentido (complementaria) con respecto al ácido nucleico peptídico (PNA) o a cualquier material similar a ADN o similar a ARN de origen natural o sintético. Las frases “ácido nucleico” o “secuencia de ácidos nucleicos” incluyen oligonucleótidos, nucleótidos, polinucleótidos o un fragmento de cualquiera de estos, de ADN o ARN (tal como ARNm, ARNr, ARNt, ARNi) de origen genómico o sintético, los cuales pueden ser de una sola hebra o de doble herbra y pueden representar una cadena sentido o antisentido con respecto a ácido nucleico peptídico (PNA) The phrases "nucleic acid" or "nucleic acid sequence", as used herein, refer to an oligonucleotide, nucleotide, polynucleotide or a fragment of any of these, DNA or RNA of genomic or synthetic origin, the which can be single-stranded or double-stranded and can represent a sense or antisense (complementary) chain with respect to peptide nucleic acid (PNA) or any material similar to DNA or similar to RNA of natural or synthetic origin. The phrases "nucleic acid" or "nucleic acid sequence" include oligonucleotides, nucleotides, polynucleotides or a fragment of any of these, DNA or RNA (such as mRNA, rRNA, tRNA, RNAi) of genomic or synthetic origin, which they can be single-stranded or double-stranded and can represent a sense or antisense chain with respect to peptide nucleic acid (PNA)

o a cualquier material similar a ADN o similar a ARN de origen natural o sintético, incluidos, por ejemplo, ARNi, ribonucleoproteínas (tales como ARNi de doble cadena, tales como RNPi). El término abarca ácidos nucleicos, es decir, oligonucleótidos que contienen análogos conocidos de nucleótidos naturales. El término además abarca estructuras similares a ácido nucleico con cadenas principales sintéticas, ver por ejemplo Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197; Strauss-Soukup (1997) Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156. “Oligonucleótido” incluye un polidesoxinucleótido de una sola cadena o dos cadenas de polidesoxinucleótidos complementarias que pueden sintetizarse químicamente. Dichos oligonucleótidos sintéticos no tienen fosfato en 5' y por lo tanto no se unirán a otro oligonucleótido sin agregar un fosfato con un ATP en presencia de una cinasa. Un oligonucleótido sintético puede unirse a un fragmento que no ha sido desfosforilado. or to any DNA-like or RNA-like material of natural or synthetic origin, including, for example, RNAi, ribonucleoproteins (such as double-stranded RNAi, such as RNPi). The term encompasses nucleic acids, that is, oligonucleotides containing known analogs of natural nucleotides. The term further encompasses nucleic acid-like structures with synthetic backbones, see for example Mata (1997) Toxicol. Appl. Pharmacol. 144: 189-197; Strauss-Soukup (1997) Biochemistry 36: 8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6: 153-156. "Oligonucleotide" includes a single-chain polydeoxynucleotide or two complementary polydeoxynucleotide chains that can be chemically synthesized. Such synthetic oligonucleotides have no 5 'phosphate and therefore will not bind to another oligonucleotide without adding a phosphate with an ATP in the presence of a kinase. A synthetic oligonucleotide can bind to a fragment that has not been dephosphorylated.

Una “secuencia codificadora de” o una “secuencia de nucleótidos que codifica” un polipéptido o proteína específica, es una secuencia de ácidos nucleicos que puede transcribirse y traducirse a un polipéptido o proteína cuando se coloca bajo el control de secuencias reguladoras apropiadas. El término “gen” significa el segmento de ADN que participa en la producción de una cadena de polipéptidos; el mismo incluye regiones que preceden y que siguen a la región codificadora (líder y trasera) así como también, cuando corresponde, secuencias intercaladas (intrones) entre segmentos codificadores individuales (exones). Una secuencia promotora está “unida operativamente a” una secuencia codificadora cuando la ARN polimerasa que inicia la transcripción en el promotor transcribirá la secuencia codificadora a ARNm. “Unido operativamente” tal como se usa en la presente se refiere una relación entre dos o más segmentos de ácido nucleico (tales como ADN). Puede referirse a la relación funcional de la secuencia reguladora transcripcional con una secuencia transcrita. Por ejemplo, un promotor está unido operativamente a una secuencia codificadora, tal como un ácido nucleico divulgado en la presente, si estimula o modula la transcripción de la secuencia codificadora en una célula huésped apropiada u otros sistema de expresión. Generalmente, las secuencias reguladoras transcripcionales promotoras que están unidas operativamente a una secuencia transcrita A "coding sequence for" or a "nucleotide sequence encoding" a specific polypeptide or protein, is a nucleic acid sequence that can be transcribed and translated to a polypeptide or protein when placed under the control of appropriate regulatory sequences. The term "gene" means the DNA segment that participates in the production of a polypeptide chain; it includes regions preceding and following the coding region (leader and back) as well as, where appropriate, intercalated sequences (introns) between individual coding segments (exons). A promoter sequence is "operably linked" to a coding sequence when the RNA polymerase that initiates transcription in the promoter will transcribe the coding sequence to mRNA. "Operably linked" as used herein refers to a relationship between two or more nucleic acid segments (such as DNA). It can refer to the functional relationship of the transcriptional regulatory sequence to a transcribed sequence. For example, a promoter is operably linked to a coding sequence, such as a nucleic acid disclosed herein, if it stimulates or modulates transcription of the coding sequence in an appropriate host cell or other expression system. Generally, promoter transcriptional regulatory sequences that are operably linked to a transcribed sequence

están físicamente contiguas a la secuencia transcrita, es decir, actúan en cis. Sin embargo, algunas secuencias reguladoras transcripcionales, tales como potenciadores, no deben estar físicamente contiguos o ubicados de forma cercana a las secuencias codificadoras, cuya transcripción potencian. they are physically contiguous to the transcribed sequence, that is, they act in cis. However, some transcriptional regulatory sequences, such as enhancers, must not be physically contiguous or located in close proximity to the coding sequences, the transcription of which they enhance.

La expresión “cassette de expresión” tal como se usa en la presente se refiere a una secuencia de nucleótidos que es capaz de afectar la expresión de un gen estructural (es decir, una secuencia codificadora de proteína, tal como una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa de acuerdo con la invención) en un huésped compatible con dichas secuencias. Los cassettes de expresión incluyen al menos un promotor unido operativamente con la secuencia codificadora de polipéptido; y, opcionalmente, con otras secuencias, tales como señales de finalización de la transcripción. También se pueden usar factores adicionales necesarios o útiles para producir la expresión, tales como potenciadores, factores alfa. Por consiguiente, los cassettes de expresión también incluyen plásmidos, vectores de expresión, virus recombinantes, cualquier forma de vector de “ADN desnudo” recombinante y similares. Un “vector” comprende un ácido nucleico que puede infectar, transfectar, transducir transitoriamente o permanentemente una célula. Se reconocerá que un vector puede ser un ácido nucleico desnudo The term "expression cassette" as used herein refers to a nucleotide sequence that is capable of affecting the expression of a structural gene (ie, a protein coding sequence, such as an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase according to the invention) in a host compatible with said sequences. Expression cassettes include at least one promoter operably linked to the polypeptide coding sequence; and, optionally, with other sequences, such as transcription termination signals. Additional necessary or useful factors may also be used to produce expression, such as enhancers, alpha factors. Accordingly, expression cassettes also include plasmids, expression vectors, recombinant viruses, any form of recombinant "naked DNA" vector, and the like. A "vector" comprises a nucleic acid that can infect, transfect, transiently or permanently transduce a cell. It will be recognized that a vector can be a bare nucleic acid.

o un ácido nucleico unido a una proteína o lípido. El vector comprende opcionalmente ácidos nucleicos y/o proteínas y/o membranas virales o bacterianas (tales como una membrana celular, una envoltura lipídica viral, etc.). Los vectores incluyen, a modo no taxativo, replicones (tales como replicones de ARN, bacteriófagos) a los cuales pueden unirse fragmentos de ADN y replicarse. Por consiguiente, los vectores incluyen, a modo no taxativo, ARN, ADN o ARN autónomo autorreplicante circular o lineal (tal como plásmidos, virus y similares, ver Patente de los Estados Unidos No. 5.217.879) e incluyen plásmidos de expresión y no expresión. Cuando un microorganismo o cultivo celular recombinante se describe como huésped de un “vector de expresión”, esto incluye ADN extracromosómico circular y lineal y ADN que se ha incorporado al cromosoma(s) huésped. Cuando un vector se mantiene en una célula huésped, el vector puede replicarse establemente por medio de las células durante la mitosis como una estructura autónoma o se incorpora dentro del genoma huésped. or a nucleic acid bound to a protein or lipid. The vector optionally comprises nucleic acids and / or proteins and / or viral or bacterial membranes (such as a cell membrane, a viral lipid envelope, etc.). Vectors include, but are not limited to, replicons (such as RNA replicons, bacteriophages) to which DNA fragments can bind and replicate. Accordingly, vectors include, but are not limited to, circular or linear self-replicating autonomous RNA, DNA, or RNA (such as plasmids, viruses, and the like, see US Patent No. 5,217,879) and include expression plasmids and do not expression. When a recombinant microorganism or cell culture is described as a host of an "expression vector", this includes circular and linear extrachromosomal DNA and DNA that has been incorporated into the host chromosome (s). When a vector is maintained in a host cell, the vector can stably replicate through the cells during mitosis as an autonomous structure or is incorporated into the host genome.

Tal como se usa en la presente, el término “recombinante” abarca ácidos nucleicos adyacentes a un ácido nucleico “de cadena principal” a la cual no son adyacentes en su ambiente natural. En algunas realizaciones, para “enriquecerse” los ácidos nucleicos representarán aproximadamente 5% o más de los insertos de ácido nucleico en una población de moléculas de cadena principal de ácido nucleico. Las moléculas de cadena principal incluyen ácidos nucleicos tales como vectores de expresión, ácidos nucleicos autorreplicantes, virus, ácidos nucleicos integrantes y otros vectores o ácidos nucleicos usados para mantener o manejar un inserto de ácido nucleico de interés. En algunas realizaciones, los ácidos nucleicos enriquecidos representan aproximadamente 15% o más de los insertos de ácido nucleico en la población de moléculas de cadena principal recombinantes. En algunas realizaciones, los ácidos nucleicos enriquecidos representan aproximadamente 50% o más de los insertos de ácido nucleico en la población de moléculas de cadena principal recombinantes. En algunas realizaciones, los ácidos nucleicos enriquecidos representan aproximadamente 90% o más de los insertos de ácido nucleico en la población de moléculas de cadena principal recombinantes. As used herein, the term "recombinant" encompasses nucleic acids adjacent to a "main chain" nucleic acid to which they are not adjacent in their natural environment. In some embodiments, to "enrich" the nucleic acids will represent approximately 5% or more of the nucleic acid inserts in a population of nucleic acid backbone molecules. Backbone molecules include nucleic acids such as expression vectors, self-replicating nucleic acids, viruses, integrating nucleic acids, and other vectors or nucleic acids used to maintain or handle a nucleic acid insert of interest. In some embodiments, the enriched nucleic acids represent approximately 15% or more of the nucleic acid inserts in the population of recombinant backbone molecules. In some embodiments, the enriched nucleic acids represent approximately 50% or more of the nucleic acid inserts in the population of recombinant backbone molecules. In some embodiments, the enriched nucleic acids represent approximately 90% or more of the nucleic acid inserts in the population of recombinant backbone molecules.

Se divulga un ácido nucleico sintético o recombinante aislado que comprende una de las secuencias de acuerdo con la invención, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 o más bases consecutivas de un ácido nucleico divulgado en la presente. Los ácidos nucleicos sintéticos o recombinantes aislados pueden comprender ADN, incluido ADNc, ADN genómico y ADN sintético. El ADN puede ser de doble cadena o de una sola cadena y si es de una sola cadena puede ser la cadena codificadora o la cadena no codificadora (antisentido). Alternativamente, los ácidos nucleicos sintéticos o recombinantes aislados comprenden ARN. There is disclosed an isolated synthetic or recombinant nucleic acid comprising one of the sequences according to the invention, or a fragment comprising at least 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 or 500 or more consecutive bases of a nucleic acid disclosed herein. Isolated synthetic or recombinant nucleic acids can comprise DNA, including cDNA, genomic DNA, and synthetic DNA. DNA can be double-stranded or single-stranded and if it is single-stranded it can be the coding strand or the non-coding (antisense) strand. Alternatively, the isolated synthetic or recombinant nucleic acids comprise RNA.

Los ácidos nucleicos sintéticos o recombinantes aislados divulgados en la presente pueden usarse para preparar uno de los polipéptidos divulgados en la presente o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos de uno de los polipéptidos divulgados en la presente. Por consiguiente, también se divulga un ácido nucleico sintético o recombinante aislado que codifica uno de los polipéptidos divulgados en la presente o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos de uno de los polipéptidos divulgados en la presente. Las secuencias codificadoras de estos ácidos nucleicos pueden ser idénticas a una de las secuencias codificadoras de uno de los ácidos nucleicos divulgados en la presente o pueden ser secuencias codificadoras diferentes que tienen al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos de uno de los polipéptidos divulgados en la presente, como resultado de la redundancia o degeneración del código genético. Los expertos en la técnica conocen el código genético y el mismo puede obtenerse por ejemplo en la página 214 de B. Lewin, Genes VI, Oxford University Press, 1997. The isolated synthetic or recombinant nucleic acids disclosed herein can be used to prepare one of the disclosed polypeptides or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 or more consecutive amino acids from one of the polypeptides disclosed herein. Accordingly, an isolated recombinant or synthetic nucleic acid encoding one of the polypeptides disclosed herein or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 is also disclosed. or 150 or more consecutive amino acids from one of the polypeptides disclosed herein. The coding sequences of these nucleic acids may be identical to one of the coding sequences of one of the nucleic acids disclosed herein or may be different coding sequences having at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 or more consecutive amino acids of one of the polypeptides disclosed herein, as a result of redundancy or degeneracy of the genetic code. The genetic code is known to those skilled in the art and can be obtained for example on page 214 of B. Lewin, Genes VI, Oxford University Press, 1997.

El ácido nucleico aislado que codifica uno de los polipéptidos divulgados en la presente y secuencias sustancialmente idénticas al mismo, puede incluir, a modo no taxativo: la secuencia codificadora de un ácido nucleico divulgado en la presente y secuencias codificadoras adicionales, tales como secuencias líderes o secuencias proproteína y secuencias no codificadoras, tales como intrones o secuencias no codificadoras en 5' y/o 3' de la secuencia codificadora. Por lo tanto, tal como se usa en la presente, la expresión “polinucleótido que codifica The isolated nucleic acid encoding one of the polypeptides disclosed herein and sequences substantially identical thereto, may include, but are not limited to: the coding sequence for a nucleic acid disclosed herein and additional coding sequences, such as leader sequences or proprotein sequences and non-coding sequences, such as introns or non-coding sequences 5 'and / or 3' of the coding sequence. Therefore, as used herein, the term "polynucleotide that encodes

un polipéptido” abarca un polinucleótido que incluye la secuencia codificadora para el polipéptido, así como también un polinucleótido que incluye secuencia codificadora y/o no codificadora adicional. a "polypeptide" encompasses a polynucleotide that includes the coding sequence for the polypeptide, as well as a polynucleotide that includes additional coding and / or non-coding sequence.

Alternativamente, las secuencias de ácido nucleico divulgadas en la presente y secuencias sustancialmente idénticas a las mismas, pueden mutageneizarse utilizando técnicas convencionales, tales como mutagénesis sitio dirigida u otras técnicas conocidas para los expertos en la técnica, para introducir cambios silenciosos en los polinucleótidos divulgados en la presente. Tal como se usa en la presente, “cambios silenciosos” incluye, por ejemplo, cambios que no alternan la secuencia de aminoácidos codificada por el polinucleótido. Dichos cambios pueden ser deseables para aumentar el nivel del polipéptido producido por células huéspedes que contienen un vector que codifica el polipéptido mediante la introducción de codones o pares de codones que ocurren frecuentemente en el organismo huésped. Alternatively, the nucleic acid sequences disclosed herein and sequences substantially identical thereto, can be mutaged using conventional techniques, such as site-directed mutagenesis or other techniques known to those skilled in the art, to introduce silent changes to the polynucleotides disclosed in the present. As used herein, "silent changes" include, for example, changes that do not alternate the amino acid sequence encoded by the polynucleotide. Such changes may be desirable to increase the level of the polypeptide produced by host cells that contain a vector encoding the polypeptide by introducing codons or codon pairs that frequently occur in the host organism.

La divulgación también se refiere a polinucleótidos que tienen cambios nucleotídicos que resultan en sustituciones, adiciones, eliminaciones, fusiones y truncamientos de aminoácidos en los polipéptidos divulgados en la presente. Dichos cambios nucleotídicos pueden introducirse utilizando técnicas tales como mutagénesis sitio dirigida, mutagénesis química aleatoria, eliminación de exonucleasa III y otras técnicas de ADN recombinante. De forma alternativa, dichos cambios nucleotídicos pueden ser variantes alélicas de origen natural que se aíslan mediante la identificación de ácidos nucleicos que se hibridan específicamente con sondas que comprenden al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 bases consecutivas de una de las secuencias divulgadas en la presente (o las secuencias complementarias a las mismas) en condiciones de rigurosidad alta, moderada o baja tal como se proporciona en la presente. The disclosure also relates to polynucleotides that have nucleotide changes that result in amino acid substitutions, additions, deletions, fusions, and truncation in the polypeptides disclosed herein. Such nucleotide changes can be introduced using techniques such as site-directed mutagenesis, random chemical mutagenesis, exonuclease III deletion, and other recombinant DNA techniques. Alternatively, such nucleotide changes may be naturally occurring allelic variants that are isolated by identifying nucleic acids that specifically hybridize to probes comprising at least 10, 15, 20, 25, 30, 35, 40, 50, 75 , 100, 150, 200, 300, 400 or 500 consecutive bases of one of the sequences disclosed herein (or sequences complementary thereto) under conditions of high, moderate or low stringency as provided herein.

Técnicas generales General techniques

Los ácidos nucleicos usados para poner en práctica este método, ya sean ARN, ARNsi, miARN, ácido nucleico antisentido, ADNc, ADN genómico, vectores, virus o híbridos de los mismos, pueden aislarse a partir de una variedad de fuentes, genéticamente manipuladas, amplificadas y/o expresadas/generadas recombinantemente. Los polipéptidos recombinantes (tales como enzimas aldolasas, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) generados a partir de estos ácidos nucleicos pueden aislarse o clonarse y evaluarse individualmente para determinar si tienen una actividad deseada. Se puede usar cualquier sistema de expresión recombinante, incluidos sistemas de expresión celular bacteriana, de mamíferos, levadura, insectos o plantas. The nucleic acids used to implement this method, be they RNA, siRNA, miRNA, antisense nucleic acid, cDNA, genomic DNA, vectors, viruses or hybrids thereof, can be isolated from a variety of sources, genetically manipulated, recombinantly amplified and / or expressed / generated. Recombinant polypeptides (such as aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase) generated from these nucleic acids can be isolated or cloned and individually evaluated to determine if they have a desired activity. Any recombinant expression system can be used, including bacterial, mammalian, yeast, insect or plant cell expression systems.

Alternativamente, estos ácidos nucleicos pueden sintetizarse in vitro mediante técnicas de síntesis química conocidas, tales como las descritas, por ejemplo, en Adams (1983) J. Am. Chem. Soc. 105:661; Belousov (1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radic. Biol. Med. 19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beaucage (1981) Tetra. Lett. 22:1859; Patente de los Estados Unidos No. 4.458.066. Alternatively, these nucleic acids can be synthesized in vitro by known chemical synthesis techniques, such as those described, for example, in Adams (1983) J. Am. Chem. Soc. 105: 661; Belousov (1997) Nucleic Acids Res. 25: 3440-3444; Frenkel (1995) Free Radic. Biol. Med. 19: 373-380; Blommers (1994) Biochemistry 33: 7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68: 109; Beaucage (1981) Tetra. Lett. 22: 1859; United States Patent No. 4,458,066.

Las técnicas para el manejo de ácidos nucleicos, tales como subclonación, sondas de etiquetado (tales como etiquetado con cebador aleatorio utilizando polimerasa Klenow, traducción de muesca, amplificación), secuenciación, hibridación y similares se describen en la literatura científica y de patentes, ver Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), Tomos 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., Nueva York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Parte I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993). Techniques for nucleic acid management, such as subcloning, labeling probes (such as random primer labeling using Klenow polymerase, notch translation, amplification), sequencing, hybridization, and the like are described in the scientific and patent literature, see Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), Volumes 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993).

Otro medio útil para obtener y manejar ácidos nucleicos utilizados para poner en práctica los métodos divulgados en la presente es clonar a partir de muestras genómicas y, si se desea, someter a detección y volver a clonar insertos aislados o amplificados a partir de, por ejemplos, clones genómicos o clones de ADNc. Las fuentes de ácidos nucleicos utilizados en los métodos divulgados en la presente incluyen las contenidas en bibliotecas genómicas o de ADNc, tales como cromosomas artificiales de mamíferos (MACs), ver las Patentes de los Estados Unidos Nos. 5.721.118; 6.025.155; cromosomas artificiales humanos, ver Rosenfeld (1997) Nat. Genet. 15:333-335; cromosomas artificiales de levadura (YAC); cromosomas artificiales bacterianos (BAC); cromosomas artificiales P1, ver Woon (1998) Genomics 50:306-316; vectores derivados de P1 (PACs), ver Kern (1997) Biotechniques 23:120-124; cósmidos, virus recombinantes, fagos o plásmidos. Another useful means of obtaining and handling nucleic acids used to practice the methods disclosed herein is to clone from genomic samples and, if desired, to screen and re-clone inserts isolated or amplified from, for example. , genomic clones or cDNA clones. The nucleic acid sources used in the methods disclosed herein include those contained in genomic or cDNA libraries, such as mammalian artificial chromosomes (MACs), see US Patent Nos. 5,721,118; 6,025,155; human artificial chromosomes, see Rosenfeld (1997) Nat. Genet. 15: 333-335; yeast artificial chromosomes (YAC); bacterial artificial chromosomes (BAC); P1 artificial chromosomes, see Woon (1998) Genomics 50: 306-316; P1-derived vectors (PACs), see Kern (1997) Biotechniques 23: 120-124; cosmids, recombinant viruses, phages, or plasmids.

Un ácido nucleico que codifica un polipéptido divulgado en la presente se ensambla en la fase apropiada con una secuencia líder capaz de dirigir la secreción del polipéptido traducido o de un fragmento del mismo. A nucleic acid encoding a polypeptide disclosed herein is assembled at the appropriate stage with a leader sequence capable of directing secretion of the translated polypeptide or a fragment thereof.

La divulgación proporciona proteínas de fusión y ácidos nucleicos que las codifican. Un polipéptido divulgado en la presente puede fusionarse con un péptido o polipéptido heterólogo, tales como péptidos de identificación del extremo N-terminal que imparten características deseadas, tales como estabilidad aumentada o purificación simplificada. Los péptidos y polipéptidos divulgados en la presente también pueden sintetizarse y expresarse como proteínas de fusión con uno o más dominios adicionales unidos a las mismas, por ejemplo, para producir un péptido más inmunogénico, para aislar más fácilmente un péptido sintetizado recombinantemente, para identificar y aislar anticuerpos y células B que expresan anticuerpos y similares. Los dominios que facilitan la detección y purificación The disclosure provides fusion proteins and nucleic acids that encode them. A polypeptide disclosed herein can be fused with a heterologous peptide or polypeptide, such as N-terminus identification peptides that impart desired characteristics, such as increased stability or simplified purification. The peptides and polypeptides disclosed herein can also be synthesized and expressed as fusion proteins with one or more additional domains attached thereto, for example, to produce a more immunogenic peptide, to more easily isolate a recombinantly synthesized peptide, to identify and isolating antibodies and B cells expressing antibodies and the like. The domains that facilitate detection and purification

incluyen, por ejemplo péptidos de quelación de metales tales como tractos de polihistidina y módulos de histidinatriptófano que permiten la purificación sobre metales inmovilizados, dominios de proteína A que permiten la purificación sobre inmunoglobulina inmovilizada y el dominio utilizado en el sistema de purificación mediante extensión/afinidad FLAGS (Immunex Corp, Seattle Wash.). La inclusión de secuencias escindibles por un enlazante tal como Factor Xa o enterocinasa (Invitrogen, Carlsbad, CA) entre un dominio de purificación y el péptido o polipéptido que comprende el motivo para facilitar la purificación. Por ejemplo, un vector de expresión puede incluir una secuencia de ácidos nucleicos que codifica un epítopo unida a seis residuos de histidina seguidos por una tiorredoxina y un sitio de escisión de enterocinasa (ver por ejemplo Williams (1995) Biochemistry 34:1787-1797; Dobeli (1998) Protein Expr. Purif. 12:404-414). Los residuos de histidina facilitan la detección y purificación mientras el sitio de escisión de enterocinasa proporciona un medio para purificar el epítopo a partir del resto de la proteína de fusión. La tecnología relacionada con vectores que codifican proteínas de fusión y la aplicación de proteínas de fusión se describe en la literatura científica y de patentes, ver por ejemplo Kroll (1993) DNA Cell. Biol., 12:441-53. They include, for example, metal chelation peptides such as polyhistidine tracts and histidine tryptophan modules that allow purification on immobilized metals, protein A domains that allow purification on immobilized immunoglobulin, and the domain used in the purification system by extension / affinity FLAGS (Immunex Corp, Seattle Wash.). Inclusion of cleavable sequences by a linker such as Factor Xa or enterokinase (Invitrogen, Carlsbad, CA) between a purification domain and the peptide or polypeptide comprising the motif to facilitate purification. For example, an expression vector may include a nucleic acid sequence encoding an epitope bound to six histidine residues followed by a thioredoxin and an enterokinase cleavage site (see for example Williams (1995) Biochemistry 34: 1787-1797; Dobeli (1998) Protein Expr. Purif. 12: 404-414). Histidine residues facilitate detection and purification while the enterokinase cleavage site provides a means to purify the epitope from the rest of the fusion protein. The technology related to vectors encoding fusion proteins and the application of fusion proteins is described in the scientific and patent literature, see for example Kroll (1993) DNA Cell. Biol., 12: 441-53.

Secuencias de control de transcripción y traducción Transcription and translation control sequences

La divulgación proporciona secuencias de ácido nucleico (tales como ADN) divulgadas en la presente unidas operativamente a secuencia(s) de control de expresión (tales como de transcripción o traducción), tales como promotores o potenciadores, para dirigir o modular la síntesis/expresión de ARN. La secuencia de control de expresión puede estar en un vector de expresión. Los promotores bacterianos ejemplares incluyen lacI, lacZ, T3, T7, gpt, lambda PR, PL y trp. Los promotores eucarióticos ejemplares incluyen el inmediato-temprano de CMV, el de timidina cinasa de HSV, el temprano y tardío de SV40, LTR de retrovirus y el de metalotioneína I de ratón. The disclosure provides nucleic acid sequences (such as DNA) disclosed herein operably linked to expression control sequence (s) (such as transcription or translation), such as promoters or enhancers, to direct or modulate synthesis / expression RNA. The expression control sequence may be in an expression vector. Exemplary bacterial promoters include lacI, lacZ, T3, T7, gpt, lambda PR, PL, and trp. Exemplary eukaryotic promoters include the immediate-early CMV, the thymidine kinase from HSV, the early and late SV40, LTR from retroviruses, and mouse metallothionein I.

Tal como se usa en la presente, el término “promotor” incluye todas las secuencias capaces de activar la transcripción de una secuencia codificadora en una célula, tal como una célula vegetal o animal. Por consiguiente, los promotores usados en los constructos divulgados en la presente incluyen elementos de control de transcripción que actúan en cis y secuencias reguladoras que participan en la regulación o modulación del tiempo y/o velocidad de transcripción de un gen. Por ejemplo, un promotor puede ser un elemento de control de transcripción que actúa en cis, incluido un potenciador, un promotor, un terminador de transcripción, un origen de replicación, una secuencia de integración cromosómica, regiones sin traducir en 5' y 3' o una secuencia intrónica, que participan en la regulación de la transcripción. Estas secuencias que actúan en cis pueden interactuar con proteínas u otras biomoléculas para llevar a cabo (activar/desactivar, regular, modular, etc.) la transcripción. Los promotores “constitutivos” son aquellos que activan la expresión continuamente en la mayoría de las condiciones ambientales y estados de desarrollo o diferenciación celular. Los promotores “inducibles” o “regulables” dirigen la expresión del ácido nucleico divulgado en la presente bajo la influencia de condiciones ambientales o condiciones de desarrollo. Los ejemplos de condiciones ambientales que pueden afectar la transcripción mediante promotores inducibles incluyen condiciones anaeróbicas, temperatura elevada, sequía o la presencia de luz. As used herein, the term "promoter" includes all sequences capable of activating transcription of a coding sequence in a cell, such as a plant or animal cell. Accordingly, promoters used in the constructs disclosed herein include cis-acting transcription control elements and regulatory sequences that participate in the regulation or modulation of the transcription time and / or rate of a gene. For example, a promoter can be a cis-acting transcription control element, including an enhancer, a promoter, a transcription terminator, an origin of replication, a chromosomal integration sequence, 5 'and 3' untranslated regions or an intronic sequence, involved in the regulation of transcription. These cis-acting sequences can interact with proteins or other biomolecules to carry out (activate / deactivate, regulate, modulate, etc.) transcription. "Constitutive" promoters are those that activate expression continuously in most environmental conditions and states of cell development or differentiation. The "inducible" or "regulatable" promoters direct the expression of the nucleic acid disclosed herein under the influence of environmental conditions or developmental conditions. Examples of environmental conditions that can affect transcription by inducible promoters include anaerobic conditions, elevated temperature, drought, or the presence of light.

Los promotores “específicos de tejido” son elementos de control de transcripción que son activos solamente en células o tejidos u órganos específicos, tales como en plantas o animales. La regulación específica de tejido puede lograrse mediante ciertos factores intrínsecos que aseguran la expresión de genes que codifican proteínas específicas para un tejido dado. Se sabe que dichos factores existen en mamíferos y plantas para permitir el desarrollo de tejidos específicos. "Tissue specific" promoters are transcription control elements that are active only in specific cells or tissues or organs, such as in plants or animals. Tissue specific regulation can be achieved by certain intrinsic factors that ensure the expression of genes that encode specific proteins for a given tissue. Such factors are known to exist in mammals and plants to allow the development of specific tissues.

Los promotores adecuados para expresar un polipéptido en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor lambda PR, el promotor lambda PL, promotores a partir de operones que codifican enzimas glucolíticas tales como 3-fosfoglicerato cinasa (PGK) y el promotor de ácido fosfatasa. Los promotores eucarióticos incluyen el promotor inmediato-temprano de CMV, el promotor de la timidina cinasa de HSV, promotores de choque térmico, el promotor temprano y tardío de SV40, LTR de retrovirus y el promotor de la metalotioneína-I de ratón. También se pueden utilizar otros promotores conocidos por controlar la expresión de genes en células procarióticas o eucarióticas o sus virus. Los promotores adecuados para expresar el polipéptido o fragmento del mismo en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor lambda PR, el promotor lambda PL, promotores a partir de operones que codifican enzimas glucolíticas tales como 3-fosfoglicerato cinasa (PGK) y el promotor de ácido fosfatasa. Los promotores fúngicos incluyen el promotor de factor á. Los promotores eucarióticos incluyen el promotor inmediato-temprano de CMV, el promotor de timidina cinasa de HSV, promotores de choque térmico, el promotor temprano y tardío de SV40, LTR de retrovirus y el promotor de metalotioneína-I de ratón. También se pueden utilizar otros promotores conocidos por controlar la expresión de genes en células procarióticas o eucarióticas o sus virus. Suitable promoters for expressing a polypeptide in bacteria include the E. coli lac or trp promoters, the lacI promoter, the lacZ promoter, the T3 promoter, the T7 promoter, the gpt promoter, the lambda PR promoter, the lambda PL promoter, promoters from operons that encode glycolytic enzymes such as 3-phosphoglycerate kinase (PGK) and the acid phosphatase promoter. Eukaryotic promoters include the CMV immediate-early promoter, the HSV thymidine kinase promoter, heat shock promoters, the SV40 early and late promoter, retrovirus LTR, and the mouse metallothionein-I promoter. Other promoters known to control gene expression in prokaryotic or eukaryotic cells or their viruses can also be used. Suitable promoters to express the polypeptide or fragment thereof in bacteria include the E. coli lac or trp promoters, the lacI promoter, the lacZ promoter, the T3 promoter, the T7 promoter, the gpt promoter, the lambda PR promoter, the lambda PL promoter, promoters from operons encoding glycolytic enzymes such as 3-phosphoglycerate kinase (PGK) and the acid phosphatase promoter. Fungal promoters include the factor a promoter. Eukaryotic promoters include the CMV immediate-early promoter, the HSV thymidine kinase promoter, heat shock promoters, the SV40 early and late promoter, retrovirus LTR, and the mouse metallothionein-I promoter. Other promoters known to control gene expression in prokaryotic or eukaryotic cells or their viruses can also be used.

Promotores vegetales específicos de tejido Tissue Specific Plant Promoters

La divulgación proporciona cassettes de expresión que pueden expresarse de forma específica de tejido, tales como estos pueden expresar una aldolasa, tal como piruvato aldolasa, enzima HMG y/o KHG aldolasa divulgadas en la presente de forma específica de tejido. La divulgación también proporciona plantas o semillas que expresan una aldolasa, tal como piruvato aldolasa, enzima HMG y/o KHG aldolasa divulgadas en la presente de forma específica The disclosure provides expression cassettes that can be tissue-specific expressed, such as these can express an aldolase, such as pyruvate aldolase, HMG enzyme and / or KHG aldolase disclosed herein in a tissue specific manner. The disclosure also provides plants or seeds that express an aldolase, such as pyruvate aldolase, HMG enzyme and / or KHG aldolase specifically disclosed herein.

de tejido. La especificidad de tejido puede ser específico de semilla, específico de tallo, específico de hoja, específico de raíz, específico de fruto y similares. of tissue. Tissue specificity can be seed specific, stem specific, leaf specific, root specific, fruit specific, and the like.

El término “planta” incluye plantas enteras, partes de plantas (tales como hojas, tallos, flores, raíces, etc.), protoplastos vegetales, células de semillas y plantas y progenie de las mismas. La clase de planta que puede utilizarse en el método divulgado en la presente es en general tan amplia como la clase de plantas superiores susceptibles a técnicas de transformación, incluidos angiospermas (plantas monocotiledóneas y dicotiledóneas), así como también gimnospermas. Incluye plantas de una variedad de niveles de ploidía, incluidos los estados poliploide, diploide, haploide y hemicigótico. Tal como se usa en la presente, la expresión “planta transgénica” incluye plantas o células vegetales en las que se ha insertado una secuencia de ácidos nucleicos heteróloga, tales como los ácidos nucleicos y varios constructos recombinantes (tales como cassettes de expresión) divulgados en la presente. The term "plant" includes whole plants, plant parts (such as leaves, stems, flowers, roots, etc.), plant protoplasts, seed cells, and plants and progeny thereof. The plant class that can be used in the method disclosed herein is generally as broad as the class of higher plants susceptible to transformation techniques, including angiosperms (monocotyledonous and dicotyledonous plants), as well as gymnosperms. It includes plants of a variety of ploidy levels, including the polyploid, diploid, haploid, and hemizygous states. As used herein, the term "transgenic plant" includes plants or plant cells into which a heterologous nucleic acid sequence has been inserted, such as nucleic acids and various recombinant constructs (such as expression cassettes) disclosed in the present.

En algunas realizaciones, un promotor constitutivo tal como el promotor CaMV 35S se puede utilizar para expresión en partes específicas de la planta o semilla o en toda la planta. Por ejemplo, para la sobreexpresión, se puede emplear un fragmento de promotor vegetal que dirigirá la expresión de un ácido nucleico en algunos o todos los tejidos de una planta, tal como una planta regenerada. Dichos promotores se denominan en la presente promotores “constitutivos” y son activos bajo la mayoría de las condiciones ambientales y estados de desarrollo o diferenciación celular. Ejemplos de promotores constitutivos incluyen la región de iniciación de transcripción del virus del mosaico de la coliflor (CaMV) 35S, el promotor 1' o 2' derivado de ADN-T de Agrobacterium tumefaciens y otras regiones de iniciación de transcripción de varios genes vegetales conocidos para los expertos. Dichos genes incluyen, por ejemplo, ACT11 de Arabidopsis (Huang (1996) Plant Mol. Biol. 33:125-139); Cat3 de Arabidopsis (GenBank No. U43147, Zhong (1996) Mol. Gen. Genet.251:196-203); el gen que codifica la proteína portadora de estearoil-acilo desaturasa de Brassica napus (Genbank No. X74782, Solocombe (1994)Plant Physiol. 104:1167-1176); GPc1 de maíz (GenBank No. X15596; Martinez (1989) J. Mol. Biol. 208:551-565); el Gpc2 de maíz (GenBank No. U45855, Manjunath (1997) Plant Mol. Biol. 33:97-112); promotores vegetales descritos en las Patentes de los Estados Unidos Nos. 4.962.028; 5.633.440. In some embodiments, a constitutive promoter such as the CaMV 35S promoter can be used for expression in specific parts of the plant or seed or throughout the plant. For example, for overexpression, a plant promoter fragment can be employed that will direct the expression of a nucleic acid in some or all of the tissues of a plant, such as a regenerated plant. Such promoters are referred to herein as "constitutive" promoters and are active under most environmental conditions and stages of cell development or differentiation. Examples of constitutive promoters include the 35S cauliflower mosaic virus (CaMV) transcription initiation region, the 1 'or 2' promoter derived from Agrobacterium tumefaciens T-DNA, and other transcription initiation regions of various known plant genes. for experts. Such genes include, for example, ACT11 from Arabidopsis (Huang (1996) Plant Mol. Biol. 33: 125-139); Arabidopsis Cat3 (GenBank No. U43147, Zhong (1996) Mol. Gen. Genet. 251: 196-203); the gene encoding the stearoyl acyl desaturase carrier protein from Brassica napus (Genbank No. X74782, Solocombe (1994) Plant Physiol. 104: 1167-1176); Corn GPc1 (GenBank No. X15596; Martinez (1989) J. Mol. Biol. 208: 551-565); corn Gpc2 (GenBank No. U45855, Manjunath (1997) Plant Mol. Biol. 33: 97-112); plant promoters described in United States Patent Nos. 4,962,028; 5,633,440.

La divulgación utiliza promotores específicos de tejido o constitutivos derivados de virus que pueden incluir, por ejemplo, el promotor subgenómico del tobamovirus (Kumagai (1995) Proc. Natl. Acad. Sci. Estados Unidos 92:16791683; el virus baciliforme tungro del arroz (RTBV), el cual se replica solo en células del floema de plantas de arroz infectadas, con su promotor que activa la expresión intensa del gen reportero específico del floema; el promotor del virus del mosaico de la nervadura de la yuca (CVMV), con actividad más alta en elementos vasculares, en células del mesófilo de la hoja y en puntas de raíces (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139). The disclosure uses tissue-derived or constitutive promoters derived from viruses that may include, for example, the subgenomic promoter of tobamovirus (Kumagai (1995) Proc. Natl. Acad. Sci. United States 92: 16791683; the rice tungro bacilliform virus ( RTBV), which replicates only in phloem cells of infected rice plants, with its promoter that activates the intense expression of the phloem-specific reporter gene; the promoter of cassava rib mosaic virus (CVMV), with higher activity in vascular elements, in leaf mesophyll cells and in root tips (Verdaguer (1996) Plant Mol. Biol. 31: 1129-1139).

En algunas realizaciones, el promotor vegetal dirige la expresión del ácido nucleico que expresa la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa en un tejido, órgano o tipo celular específico (es decir, promotores específicos de tejido) o de otra forma bajo un control ambiental o de desarrollo más preciso o bajo el control de un promotor inducible. Los ejemplos de condiciones ambientales que pueden afectar la transcripción incluyen condiciones anaeróbicas, temperatura elevada, la presencia de luz o la pulverización con agentes químicos/hormonas. Por ejemplo, la divulgación incorpora el promotor inducible por sequía del maíz (Busk (1997) supra); el promotor inducible por frío, sequía y salinidad alta de la patata (Kirch (1997) Plant Mol. Biol. 33:897 909). In some embodiments, the plant promoter directs expression of the nucleo acid expressing the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase in a specific tissue, organ, or cell type (i.e., tissue-specific promoters) or otherwise under more precise environmental or developmental control or under the control of an inducible promoter. Examples of environmental conditions that can affect transcription include anaerobic conditions, elevated temperature, the presence of light, or chemical / hormone spray. For example, the disclosure incorporates the drought inducible promoter from maize (Busk (1997) supra); the cold, drought and high salinity inducible promoter of potato (Kirch (1997) Plant Mol. Biol. 33: 897 909).

En algunas realizaciones, los promotores específicos de tejido promueven la transcripción solamente dentro de cierto marco temporal de la etapa de desarrollo dentro de dicho tejido. Ver Blazquez (1998) Plant Cell 10:791-800, con la caracterización del promotor del gen LEAFY de Arabidopsis. Ver también Cardon (1997) Plant J12:367-77, que describe el factor de transcripción SPL3, el cual reconoce un motivo secuencial conservado en la región promotora del gen AP1 de identidad del meristemo floral de A. thaliana; y Mandel (1995) Plant Molecular Biology, Tomo 29, pp 995-1004, que describe el promotor del meristemo eIF4. Se pueden usar promotores específicos de tejido que están activos durante todo el ciclo de vida de un tejido específico. En algunas realizaciones, los ácidos nucleicos divulgados en la presente están unidos operativamente a un promotor activo principalmente solo en células de fibra de algodón. En algunas realizaciones, los ácidos nucleicos divulgados en la presente están unidos operativamente a un promotor activo principalmente durante las etapas de alargamiento celular de la fibra de algodón, tal como lo describe Rinehart (1996) supra. Los ácidos nucleicos pueden unirse operativamente al promotor del gen Fb12A para expresarse preferiblemente en células de fibra de algodón (Ibid). Ver también, John (1997) Proc. Natl. Acad. Sci. Estados Unidos 89:5769-5773; John, et al., las Patentes de los Estados Unidos Nos. 5.608.148 y 5.602.321, que describen promotores específicos de fibra de algodón y métodos para la construcción de plantas de algodón transgénicas. Los promotores específicos de raíz también pueden usarse para expresar los ácidos nucleicos divulgados en la presente. Los ejemplos de promotores específicos de raíz incluyen el promotor del gen del alcohol deshidrogenasa (DeLisle (1990) Int. Rev. Cytol. 123:39-60). Otros promotores que pueden usarse para expresar los ácidos nucleicos divulgados en la presente incluyen, por ejemplo promotores específicos de óvulo, específicos de embrión, específicos de endospermo, específicos de tegumento, específicos de cubierta seminal o alguna combinación de los mismos; un promotor específico de hoja (ver Busk (1997) Plant J. 11:1285 1295, que describe un promotor específico de hoja de maíz); el promotor ORF13 de Agrobacterium rhizogenes (que exhibe actividad alta en raíces, ver Hansen (1997) supra);un promotor específico de polen de maíz (ver Guerrero (1990) Mol. Gen. Genet. 224:161 168); puede usarse un promotor de tomate activo durante la maduración del fruto, la In some embodiments, tissue-specific promoters promote transcription only within a certain time frame of the developmental stage within that tissue. See Blazquez (1998) Plant Cell 10: 791-800, with the characterization of the Arabidopsis LEAFY gene promoter. See also Cardon (1997) Plant J12: 367-77, which describes the transcription factor SPL3, which recognizes a conserved sequence motif in the promoter region of the AP1 gene for the identity of the floral meristem of A. thaliana; and Mandel (1995) Plant Molecular Biology, Volume 29, pp 995-1004, which describes the eIF4 meristem promoter. Tissue specific promoters that are active throughout the life cycle of a specific tissue can be used. In some embodiments, the nucleic acids disclosed herein are operably linked to an active promoter primarily only in cotton fiber cells. In some embodiments, the nucleic acids disclosed herein are operably linked to an active promoter primarily during the cotton fiber cell elongation steps, as described by Rinehart (1996) supra. Nucleic acids can be operably linked to the Fb12A gene promoter to be expressed preferably in cotton fiber cells (Ibid). See also, John (1997) Proc. Natl. Acad. Sci. United States 89: 5769-5773; John, et al., US Patent Nos. 5,608,148 and 5,602,321, which describe specific cotton fiber promoters and methods for the construction of transgenic cotton plants. Root specific promoters can also be used to express the nucleic acids disclosed herein. Examples of root specific promoters include the promoter of the alcohol dehydrogenase gene (DeLisle (1990) Int. Rev. Cytol. 123: 39-60). Other promoters that can be used to express the nucleic acids disclosed herein include, for example, ovule-specific, embryo-specific, endosperm-specific, integument-specific, seminal coat-specific, or some combination thereof; a leaf specific promoter (see Busk (1997) Plant J. 11: 1285 1295, which describes a corn leaf specific promoter); the ORF13 promoter from Agrobacterium rhizogenes (which exhibits high root activity, see Hansen (1997) supra), a specific promoter from corn pollen (see Guerrero (1990) Mol. Gen. Genet. 224: 161-168); an active tomato promoter can be used during fruit ripening, the

senescencia y abscisión de las hojas y, en menor medida, de las flores (ver Blume (1997) Plant J. 12:731 746); un promotor específico de pistilo del gen SK2 de la patata (ver Ficker (1997) Plant Mol. Biol. 35:425 431); el gen Blec4 del guisante, que es activo en el tejido epidérmico de ápices caulinares vegetativos y florales de alfalfa transgénica, convirtiéndolo en una herramienta útil para dirigir la expresión de genes externos con respecto a la capa epidérmica de los brotes o fibras en crecimiento activo; el gen BEL1 específico de óvulo (ver Reiser (1995) Cell 83:735-742, GenBank No. U39944); y/o el promotor en Klee, Patente de los Estados Unidos No. 5.589.583, que describe una región promotora vegetal que es capaz de conferir niveles altos de transcripción en el tejido meristemático y/o dividir rápidamente las células. senescence and abscission of the leaves and, to a lesser extent, of the flowers (see Blume (1997) Plant J. 12: 731 746); a pistil-specific promoter of the potato SK2 gene (see Ficker (1997) Plant Mol. Biol. 35: 425 431); the pea Blec4 gene, which is active in the epidermal tissue of vegetative and floral root tips of transgenic alfalfa, making it a useful tool to direct the expression of external genes with respect to the epidermal layer of shoots or fibers in active growth; the ovule-specific BEL1 gene (see Reiser (1995) Cell 83: 735-742, GenBank No. U39944); and / or the promoter in Klee, US Patent No. 5,589,583, which describes a plant promoter region that is capable of conferring high levels of transcription in meristematic tissue and / or rapidly dividing cells.

En algunas realizaciones, los promotores vegetales que son inducibles tras la exposición a hormonas vegetales, tales como auxinas, se usan para expresar los ácidos nucleicos divulgados en la presente. Por ejemplo, el método puede usar el fragmento del promotor E1 de elementos de respuesta a auxina (AuxREs) en la soja (Glycine max L.) (Liu (1997) Plant Physiol. 115:397-407); el promotor GST6 de Arabidopsis que responde a auxina (también responde al ácido salicílico y al peróxido de hidrógeno) (Chen (1996) Plant J. 10: 955-966); el promotor parC inducible por auxina del tabaco (Sakai (1996) Plant Cell Physiol. 37:906-913); un elemento de respuesta a biotina vegetal (Streit (1997) Mol. Plant. Microbe Interact. 10:933-937); y el promotor que responde la hormona del estrés, el ácido abscísico (Sheen (1996) Science 274:1900-1902). In some embodiments, plant promoters that are inducible upon exposure to plant hormones, such as auxins, are used to express the nucleic acids disclosed herein. For example, the method may use the auxin response element E1 promoter fragment (AuxREs) in soybeans (Glycine max L.) (Liu (1997) Plant Physiol. 115: 397-407); the Arabidopsis GST6 promoter that responds to auxin (also responds to salicylic acid and hydrogen peroxide) (Chen (1996) Plant J. 10: 955-966); the tobacco auxin inducible parC promoter (Sakai (1996) Plant Cell Physiol. 37: 906-913); a plant biotin response element (Streit (1997) Mol. Plant. Microbe Interact. 10: 933-937); and the stress hormone responsive promoter, abscisic acid (Sheen (1996) Science 274: 1900-1902).

Los ácidos nucleicos divulgados en la presente también pueden unirse operativamente a promotores vegetales que son inducibles tras la exposición a reactivos químicos que pueden aplicarse a la planta, tales como herbicidas o antibióticos. Por ejemplo, puede usarse el promotor In2-2 del maíz, activado por protectores herbicidas de bencenosulfonamida (De Veylder (1997) Plant Cell Physiol. 38:568-577); la aplicación de diferentes protectores herbicidas induce patrones de expresión génica diferenciados, incluida la expresión en las raíces, hidatodos y el meristemo apical del brote. Las secuencias codificadoras pueden estar bajo el control de, por ejemplo, un promotor inducible por tetraciclina, tal como el descrito con plantas de tabaco transgénicas que contienen el gen de la arginina descarboxilasa de Avena sativa L. (avena) (Masgrau (1997) Plant J. 11:465-473); o un elemento que responde al ácido salicílico (Stange (1997) Plant J. 11:1315-1324). Con la utilización de promotores inducidos por agentes químicos (tales como hormonas o pesticidas), es decir, promotores que responden a un agente químico que puede aplicarse a la planta transgénica en el campo, se puede inducir la expresión de un polipéptido divulgado en la presente en una etapa específica del desarrollo de la planta. Por consiguiente, la divulgación también proporciona plantas transgénicas que contienen un gen inducible que codifica polipéptidos divulgados en la presente, cuyo rango de huéspedes se limita a las especies vegetales objetivo, tales como maíz, arroz, cebada, soja, tomate, trigo, patata y otros cultivos, inducibles en cualquier etapa de desarrollo del cultivo. The nucleic acids disclosed herein can also be operably linked to plant promoters that are inducible upon exposure to chemical reagents that can be applied to the plant, such as herbicides or antibiotics. For example, the corn In2-2 promoter, activated by herbicidal protectors of benzenesulfonamide (De Veylder (1997) Plant Cell Physiol. 38: 568-577) can be used; the application of different herbicidal protectors induces differentiated gene expression patterns, including expression in the roots, hydatodes and the apical meristem of the outbreak. Coding sequences may be under the control of, for example, a tetracycline inducible promoter, such as that described with transgenic tobacco plants containing the arginine decarboxylase gene from Avena sativa L. (oats) (Masgrau (1997) Plant J. 11: 465-473); or an element that responds to salicylic acid (Stange (1997) Plant J. 11: 1315-1324). With the use of promoters induced by chemical agents (such as hormones or pesticides), that is, promoters that respond to a chemical agent that can be applied to the transgenic plant in the field, the expression of a polypeptide disclosed herein can be induced at a specific stage of plant development. Accordingly, the disclosure also provides transgenic plants that contain an inducible gene encoding polypeptides disclosed herein, whose host range is limited to the target plant species, such as corn, rice, barley, soybean, tomato, wheat, potato, and other crops, inducible at any stage of crop development.

El experto reconocerá que un promotor vegetal específico de tejido puede activar la expresión de secuencias unidas operativamente en tejidos distintos a los tejidos objetivo. Por consiguiente, en algunas realizaciones, un promotor específico de tejido es uno que activa la expresión preferiblemente en el tejido o tipo celular objetivo pero también puede provocar la expresión en otros tejidos. The skilled artisan will recognize that a tissue-specific plant promoter can activate the expression of operably linked sequences in tissues other than target tissues. Accordingly, in some embodiments, a tissue specific promoter is one that activates expression preferably in the target tissue or cell type but can also cause expression in other tissues.

Los ácidos nucleicos divulgados en la presente también pueden unirse operativamente a promotores vegetales que son inducibles tras la exposición a reactivos químicos. Estos reactivos incluyen, por ejemplo, herbicidas, auxinas sintéticas o antibióticos que pueden aplicarse, tal como mediante pulverización, sobre las plantas transgénicas. La expresión inducible de ácidos nucleicos que producen la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente permitirá que el agricultor seleccione las plantas con la expresión y/o actividad óptima de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Así puede controlarse el desarrollo de las partes de la planta. De esta forma la divulgación proporciona el medio para facilitar la cosecha de plantas y partes de planta. Por ejemplo, en varias realizaciones, se usa el promotor In2-2 del maíz, activado por protectores herbicidas de bencenosulfonamida (De Veylder (1997) Plant Cell Physiol. 38:568-577); la aplicación de diferentes protectores herbicidas induce patrones de expresión génica diferenciados, incluida la expresión en las raíces, hidatodos y el meristemo apical del brote. Las secuencias codificadoras de acuerdo con la invención están también bajo el control de, por ejemplo, un promotor inducible por tetraciclina, tal como el descrito con plantas de tabaco transgénicas que contienen el gen de la arginina descarboxilasa de Avena sativa L. (avena) (Masgrau (1997) Plant J. 11:465-473); o un elemento que responde al ácido salicílico (Stange (1997) Plant J. 11:1315-1324). The nucleic acids disclosed herein can also be operably linked to plant promoters that are inducible upon exposure to chemical reagents. These reagents include, for example, herbicides, synthetic auxins, or antibiotics that can be applied, such as by spraying, on transgenic plants. The inducible expression of nucleic acids producing the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein will allow the farmer to select plants with the optimal expression and / or activity of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase. In this way the development of the plant parts can be controlled. In this way disclosure provides the means to facilitate the harvesting of plants and plant parts. For example, in several embodiments, the corn In2-2 promoter, activated by herbicidal benzenesulfonamide protectors (De Veylder (1997) Plant Cell Physiol. 38: 568-577) is used; the application of different herbicidal protectors induces differentiated gene expression patterns, including expression in the roots, hydatodes and the apical meristem of the outbreak. The coding sequences according to the invention are also under the control of, for example, a tetracycline inducible promoter, such as that described with transgenic tobacco plants containing the arginine decarboxylase gene from Avena sativa L. (oats) ( Masgrau (1997) Plant J. 11: 465-473); or an element that responds to salicylic acid (Stange (1997) Plant J. 11: 1315-1324).

En algunas realizaciones, la expresión apropiada del polipéptido puede requerir una región de poliadenilación en el extremo 3' de la región codificadora. La región de poliadenilación puede derivarse del gen natural, de una variedad de distintos genes vegetales o animales o de otro origen o de genes en el ADN-T Agrobacteriano. In some embodiments, proper expression of the polypeptide may require a polyadenylation region at the 3 'end of the coding region. The polyadenylation region may be derived from the natural gene, from a variety of different plant or animal genes, or from another origin or from genes in the Agrobacterial T-DNA.

Vectores de expresión y vehículos de clonación Expression Vectors and Cloning Vehicles

La invención proporciona vectores de expresión y vehículos de clonación que comprenden ácidos nucleicos divulgados en la presente, tales como secuencias que codifican las enzimas aldolasas, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgadas en la presente. Los vectores de expresión y vehículos de clonación divulgados en la presente pueden comprender partículas virales, baculovirus, fago, plásmidos, fagómidos, cósmidos, fósmidos, cromosomas bacterianos artificiales, ADN viral (tal como variolovacuna, adenovirus, virus de la viruela The invention provides expression vectors and cloning vehicles comprising nucleic acids disclosed herein, such as sequences encoding aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein. The expression vectors and cloning vehicles disclosed herein may comprise viral particles, baculoviruses, phage, plasmids, phagemids, cosmids, fossids, artificial bacterial chromosomes, viral DNA (such as varicella vaccine, adenovirus, smallpox virus.

aviar, seudorrabia y derivados de SV40), cromosomas artificiales en base a P1, plásmidos de levadura y cualquier otro vector específico para huéspedes específicos de interés (tales como bacillus, Aspergillus y levadura). Los vectores divulgados en la presente pueden incluir secuencias cromosómicas, no cromosómicas y de ADN sintético. Los expertos en la técnica conocen una gran cantidad de vectores adecuados y los mismos están disponibles en el mercado. Los vectores ejemplares incluyen: bacterianos: vectores pQE™ (Qiagen, Valencia, CA), plásmidos pBLUESCRIPT™, vectores pNH, vectores lambda-ZAP (Stratagene, La Jolla, CA); ptrc99a, pKK223-3, pDR540, pRIT2T (GE Healthcare, Piscataway, N.J.), vectores pET (Novagen, Madison, Wis.); Eucarióticos: pXT1, pSG5 (Stratagene, La Jolla, CA), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Sin embargo, cualquier otro plásmido u otro vector puede usarse siempre que sea replicable y viable en el huésped. Se pueden emplear vectores con baja cantidad de copias o alta cantidad de copias en la presente invención. Los “plásmidos” pueden estar disponibles en el mercado, disponibles públicamente sin restricciones o pueden construirse a partir de plásmidos disponibles de acuerdo con procedimientos publicados. En la técnica se conocen plásmidos equivalentes a los descritos en la presente y estos serán evidentes para los expertos en la técnica. avian, pseudorrabia and SV40 derivatives), P1-based artificial chromosomes, yeast plasmids, and any other vector specific for specific hosts of interest (such as bacillus, Aspergillus, and yeast). Vectors disclosed herein can include chromosomal, non-chromosomal, and synthetic DNA sequences. A large number of suitable vectors are known to those of skill in the art and are commercially available. Exemplary vectors include: bacterial: pQE ™ vectors (Qiagen, Valencia, CA), pBLUESCRIPT ™ plasmids, pNH vectors, lambda-ZAP vectors (Stratagene, La Jolla, CA); ptrc99a, pKK223-3, pDR540, pRIT2T (GE Healthcare, Piscataway, N.J.), pET vectors (Novagen, Madison, Wis.); Eukaryotes: pXT1, pSG5 (Stratagene, La Jolla, CA), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). However, any other plasmid or other vector can be used as long as it is replicable and viable in the host. Low copy or high copy vector vectors can be used in the present invention. The "plasmids" can be commercially available, publicly available without restrictions or can be constructed from available plasmids according to published procedures. Equivalent plasmids to those described herein are known in the art and these will be apparent to those skilled in the art.

El vector de expresión puede comprender un promotor, un sitio de unión a un ribosoma para iniciar la traducción y un terminador de transcripción. El vector también puede incluir secuencias apropiadas para amplificar la expresión. Los vectores de expresión de mamíferos pueden comprender un origen de replicación, todos los sitios de unión a ribosoma necesarios, un sitio de poliadenilación, sitios donadores y aceptores de empalme, secuencias de terminación transcripcional y secuencias no transcriptas flanqueadoras en 5'. En algunas realizaciones, las secuencias de ADN derivadas del empalme SV40 y los sitios de poliadenilación pueden utilizarse para proporcionar los elementos genéticos no transcritos necesarios. The expression vector may comprise a promoter, a ribosome binding site to initiate translation, and a transcription terminator. The vector can also include appropriate sequences to amplify expression. Mammalian expression vectors can comprise an origin of replication, all necessary ribosome binding sites, a polyadenylation site, splice donor and acceptor sites, transcriptional termination sequences, and 5 'flanking non-transcribed sequences. In some embodiments, DNA sequences derived from the SV40 junction and polyadenylation sites can be used to provide the necessary non-transcribed genetic elements.

En algunas realizaciones, los vectores de expresión contienen uno o más genes marcadores seleccionables para permitir la selección de células huésped que contienen el vector. Dichos marcadores seleccionables incluyen genes que codifican dihidrofolato reductasa o genes que confieren resistencia a neomicina a cultivos de células eucarióticas, genes que confieren resistencia a tetraciclina o ampicilina en E. coli y el gen TRP1 de S. cerevisiae. Las regiones promotoras pueden seleccionarse a partir de cualquier gen deseado utilizando vectores de cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables. In some embodiments, expression vectors contain one or more selectable marker genes to allow selection of vector-containing host cells. Such selectable markers include genes encoding dihydrofolate reductase or genes conferring neomycin resistance to eukaryotic cell cultures, genes conferring tetracycline or ampicillin resistance in E. coli, and the S. cerevisiae TRP1 gene. Promoter regions can be selected from any desired gene using chloramphenicol transferase (CAT) vectors or other vectors with selectable markers.

En algunas realizaciones, los vectores para expresar el polipéptido o fragmento del mismo en células eucarióticas contienen potenciadores para aumentar los niveles de expresión. Los potenciadores son elementos de ADN que actúan en cis que pueden tener una longitud de aproximadamente 10 a aproximadamente 300 pb. Los mismos pueden actuar sobre un promotor para aumentar su transcripción. Los potenciadores ejemplares incluyen el potenciador SV40 en el lado tardío del origen de replicación pb 100 a 270, el potenciador del promotor temprano del citomegalovirus, el potenciador del polioma en el lado tardío del origen de replicación y los promotores del adenovirus. In some embodiments, vectors to express the polypeptide or fragment thereof in eukaryotic cells contain enhancers to increase expression levels. Enhancers are cis-acting elements of DNA that can be from about 10 to about 300 bp in length. They can act on a promoter to increase its transcription. Exemplary enhancers include the SV40 enhancer on the late side of the origin of replication bp 100 to 270, the cytomegalovirus early promoter enhancer, the polyoma enhancer on the late side of the origin of replication, and the adenovirus promoters.

Una secuencia de ácidos nucleicos puede insertarse en un vector mediante una variedad de procedimientos. En general, la secuencia se liga a la posición deseada en el vector tras la digestión del inserto y el vector con las endonucleasas de restricción apropiadas. Alternativamente, se pueden ligar extremos romos al inserto y al vector. En la técnica se conoce una variedad de técnicas de clonación, tales como las descritas en Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Se considera que dichos procedimientos y otros están dentro del alcance de los expertos en la técnica. A nucleic acid sequence can be inserted into a vector by a variety of procedures. In general, the sequence is ligated to the desired position in the vector after digestion of the insert and the vector with the appropriate restriction endonucleases. Alternatively, blunt ends can be attached to the insert and vector. A variety of cloning techniques are known in the art, such as those described in Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 and Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Such procedures and others are considered to be within the scope of those skilled in the art.

El vector puede estar en forma de un plásmido, una partícula viral o un fago. Otros vectores incluyen secuencias cromosómicas, no cromosómicas y de ADN sintético, derivados de SV40; plásmidos bacterianos, ADN fágico, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN fágico, ADN viral tal como variolovacuna, adenovirus, virus de la viruela aviar y seudorrabia. Una variedad de vectores de clonación y expresión para uso con huéspedes procarióticos y eucarióticos se describe, por ejemplo, en Sambrook. The vector can be in the form of a plasmid, a viral particle, or a phage. Other vectors include chromosomal, non-chromosomal, and synthetic DNA sequences derived from SV40; Bacterial plasmids, phage DNA, baculoviruses, yeast plasmids, vectors derived from combinations of plasmids and phage DNA, viral DNA such as variola vaccine, adenovirus, fowlpox virus, and pseudorrabia. A variety of cloning and expression vectors for use with prokaryotic and eukaryotic hosts are described, for example, in Sambrook.

Los vectores bacterianos específicos que pueden utilizarse incluyen los plásmidos disponibles en el mercado que comprenden elementos genéticos del vector de clonación conocido pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suecia), GEM1 (Promega Biotec, Madison, Wis., EE. UU.) pQE70, pQE60, pQE-9 (Qiagen, Valencia, CA), pD10, psiX174 pBLUESCRIPT II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene, La Jolla, CA), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8, pET (Novagen, Madison, Wis.) y pCM7. Los vectores procarióticos específicos incluyen pSV2CAT, pOG44, pXT1, pSG (Stratagene, La Jolla, CA) pSVK3, pBPV, pMSG y pSVL (Pharmacia). Sin embargo, cualquier otro vector puede utilizarse siempre que sea replicable y viable en la célula huésped. Specific bacterial vectors that can be used include the commercially available plasmids comprising genetic elements of the known cloning vector pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden), GEM1 (Promega Biotec, Madison, Wis ., USA) pQE70, pQE60, pQE-9 (Qiagen, Valencia, CA), pD10, psiX174 pBLUESCRIPT II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene, La Jolla, CA), ptrc99a, pKK223 , pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8, pET (Novagen, Madison, Wis.) and pCM7. Specific prokaryotic vectors include pSV2CAT, pOG44, pXT1, pSG (Stratagene, La Jolla, CA) pSVK3, pBPV, pMSG and pSVL (Pharmacia). However, any other vector can be used as long as it is replicable and viable in the host cell.

Los ácidos nucleicos divulgados en la presente pueden expresarse en cassettes de expresión, vectores o virus y pueden expresarse transitoriamente o establemente en células vegetales y semillas. Un sistema de expresión transitorio ejemplar utiliza sistemas de expresión episómicos, tales como el ARN viral del virus del mosaico de la coliflor (CaMV) generado en el núcleo mediante la transcripción de un minicromosoma episómico que contiene ADN superenrollado, ver Covey (1990) Proc. Natl. Acad. Sci. Estados Unidos 87:1633-1637. Alternativamente, las secuencias codificadoras, es decir, la totalidad o subfragmentos de secuencias divulgadas en la presente, pueden The nucleic acids disclosed herein can be expressed in expression cassettes, vectors, or viruses and can be expressed transiently or stably in plant cells and seeds. An exemplary transient expression system uses episomal expression systems, such as cauliflower mosaic virus (CaMV) viral RNA generated in the nucleus by transcribing an episomal minichromosome containing supercoiled DNA, see Covey (1990) Proc. Natl. Acad. Sci. United States 87: 1633-1637. Alternatively, the coding sequences, i.e., all or sub-fragments of sequences disclosed herein, may

insertarse en el genoma de una célula huésped vegetal convirtiéndose en parte integral del ADN cromosómico huésped. Los transcriptos sentido o antisentido pueden expresarse de esta forma. Un vector que comprende las secuencias (tales como promotores o regiones codificadoras) de ácidos nucleicos divulgados en la presente puede comprender un gen marcador que confiere un fenotipo seleccionable en una célula vegetal o una semilla. Por ejemplo, el marcador puede codificar resistencia biocida, tal como resistencia antibiótica, tal como resistencia a kanamicina, G418, bleomicina, higromicina o resistencia herbicida, tal como resistencia a clorosulfurón o Basta. insert itself into the genome of a plant host cell becoming an integral part of the host chromosomal DNA. Sense or antisense transcripts can be expressed in this way. A vector comprising the sequences (such as promoters or coding regions) of nucleic acids disclosed herein can comprise a marker gene that confers a selectable phenotype on a plant cell or a seed. For example, the marker may encode biocidal resistance, such as antibiotic resistance, such as resistance to kanamycin, G418, bleomycin, hygromycin, or herbicidal resistance, such as resistance to chlorosulfuron or Basta.

Los vectores de expresión capaces de expresar ácidos nucleicos y proteínas en plantas se conocen en la técnica y pueden incluir, por ejemplo, vectores de Agrobacterium spp., virus X de la patata (ver Angell (1997) EMBO J. 16:3675-3684), virus del mosaico del tabaco (ver Casper (1996) Gene 173:69-73), virus del enanismo ramificado del tomate (ver Hillman (1989) Virology 169:42-50), virus del grabado del tabaco (ver Dolja (1997) Virology 234:243252), virus del mosaico dorado del frijol (ver Morinaga (1993) Microbiol Immunol. 37:471-476), virus del mosaico de la coliflor (ver Cecchini (1997) Mol. Plant. Microbe Interact. 10:1094-1101), elemento transponible Ac/Ds del maíz (ver Rubin (1997) Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194), y el elemento transponible supresor-mutador (Spm) del maíz (ver Schlappi (1996) Plant Mol. Biol. 32:717-725); y derivados de los mismos. Expression vectors capable of expressing nucleic acids and proteins in plants are known in the art and may include, for example, Agrobacterium spp., Potato virus X vectors (see Angell (1997) EMBO J. 16: 3675-3684 ), tobacco mosaic virus (see Casper (1996) Gene 173: 69-73), tomato branched dwarf virus (see Hillman (1989) Virology 169: 42-50), tobacco print virus (see Dolja ( 1997) Virology 234: 243252), golden bean mosaic virus (see Morinaga (1993) Microbiol Immunol. 37: 471-476), cauliflower mosaic virus (see Cecchini (1997) Mol. Plant. Microbe Interact. 10 : 1094-1101), Ac / Ds transposable element of maize (see Rubin (1997) Mol. Cell. Biol. 17: 6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204: 161-194), and maize suppressor-mutant transposable element (Spm) (see Schlappi (1996) Plant Mol. Biol. 32: 717-725); and derivatives thereof.

En algunas realizaciones, el vector de expresión puede tener dos sistemas de replicación para permitir que se mantenga en dos organismos, por ejemplo en células de mamíferos o insectos para expresión y en un huésped procariótico para clonación y amplificación. Adicionalmente, para integrar vectores de expresión, el vector de expresión puede contener al menos una secuencia homóloga al genoma de la célula huésped. Puede contener dos secuencias homólogas que flanquean el constructo de expresión. El vector de integración puede dirigirse a un locus específico en la célula huésped seleccionando la secuencia homóloga apropiada para su inclusión en el vector. Los constructos para integrar vectores se conocen en la técnica. In some embodiments, the expression vector can have two replication systems to allow it to be maintained in two organisms, for example in mammalian or insect cells for expression and in a prokaryotic host for cloning and amplification. Additionally, to integrate expression vectors, the expression vector can contain at least one sequence homologous to the genome of the host cell. It can contain two homologous sequences that flank the expression construct. The integration vector can be targeted to a specific locus in the host cell by selecting the appropriate homologous sequence for inclusion in the vector. Constructs for integrating vectors are known in the art.

Los vectores de expresión divulgados en la presente también pueden incluir un gen marcador seleccionable para permitir la selección de cepas bacterianas que han sido transformadas, tales como genes que proporcionan las bacterias resistentes a fármacos tales como ampicilina, cloranfenicol, eritromicina, kanamicina, neomicina y tetraciclina. Los marcadores seleccionables también pueden incluir genes biosintéticos, tales como los de las rutas biosintéticas de histidina, triptófano y leucina. The expression vectors disclosed herein can also include a selectable marker gene to allow selection of bacterial strains that have been transformed, such as genes that provide bacteria resistant to drugs such as ampicillin, chloramphenicol, erythromycin, kanamycin, neomycin, and tetracycline. . Selectable markers can also include biosynthetic genes, such as those from the histidine, tryptophan, and leucine biosynthetic pathways.

La secuencia de ADN en el vector de expresión está unida operativamente a una(s) secuencia(s) de control de expresión apropiada(s) (promotor) para dirigir la síntesis de ARN. Los promotores denominados bacterianos específicos incluyen lacI, lacZ, T3, T7, gpt, lambda PR, PL y trp. Los promotores eucarióticos incluyen el inmediatotemprano de CMV, el de timidina cinasa de HSV, el temprano y tardío de SV40, el LTR de retrovirus y el de metalotioneína-I de ratón. La selección del vector y promotor apropiados está dentro del nivel de experiencia en la técnica. El vector de expresión también contiene un sitio de unión a un ribosoma para iniciar la traducción y un terminador de transcripción. El vector también puede incluir secuencias apropiadas para amplificar la expresión. Las regiones promotoras pueden seleccionarse a partir de cualquier gen deseado utilizando vectores de cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables. Adicionalmente, los vectores de expresión En algunas realizaciones contienen uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para selección de células huésped transformadas tal como dihidrofolato reductasa o resistencia a neomicina para cultivo de células eucarióticas o tal como resistencia a tetraciclina o ampicilina en E. coli. The DNA sequence in the expression vector is operably linked to an appropriate expression control sequence (s) (promoter) to direct RNA synthesis. The so-called bacterial specific promoters include lacI, lacZ, T3, T7, gpt, lambda PR, PL and trp. Eukaryotic promoters include the early CMV, the thymidine kinase from HSV, the early and late SV40, the LTR from retroviruses, and the mouse metallothionein-I. Selection of the appropriate vector and promoter is within the level of skill in the art. The expression vector also contains a ribosome binding site to initiate translation and a transcription terminator. The vector can also include appropriate sequences to amplify expression. Promoter regions can be selected from any desired gene using chloramphenicol transferase (CAT) vectors or other vectors with selectable markers. Additionally, expression vectors In some embodiments contain one or more selectable marker genes to provide a phenotypic trait for selection of transformed host cells such as dihydrofolate reductase or neomycin resistance for eukaryotic cell culture or such as tetracycline or ampicillin resistance in E .coli.

Los vectores de expresión de mamíferos también pueden comprender un origen de replicación, todos los sitios de unión a ribosoma necesarios, un sitio de poliadenilación, sitios donadores y aceptores de empalme, secuencias de terminación transcripcional y secuencias no transcriptas flanqueadoras en 5'. En algunas realizaciones, las secuencias de ADN derivadas del empalme SV40 y los sitios de poliadenilación pueden utilizarse para proporcionar los elementos genéticos no transcritos necesarios. Mammalian expression vectors can also comprise an origin of replication, all necessary ribosome binding sites, a polyadenylation site, splice donor and acceptor sites, transcriptional termination sequences, and 5 'flanking non-transcribed sequences. In some embodiments, DNA sequences derived from the SV40 junction and polyadenylation sites can be used to provide the necessary non-transcribed genetic elements.

Los vectores para expresar el polipéptido o fragmento del mismo en células eucarióticas también pueden contener potenciadores para aumentar los niveles de expresión. Los potenciadores son elementos de ADN que actúan en cis, generalmente con una longitud de aproximadamente 10 a aproximadamente 300 pb que actúan sobre un promotor para aumentar su transcripción. Los ejemplos incluyen el potenciador SV40 en el lado tardío del origen de replicación pb 100 a 270, el potenciador del promotor temprano del citomegalovirus, el potenciador del polioma en el lado tardío del origen de replicación y los promotores del adenovirus. Vectors to express the polypeptide or fragment thereof in eukaryotic cells can also contain enhancers to increase expression levels. Enhancers are cis-acting elements of DNA, generally about 10 to about 300 bp in length, that act on a promoter to increase its transcription. Examples include the SV40 enhancer on the late side of the origin of replication bp 100-270, the cytomegalovirus early promoter enhancer, the polyoma enhancer on the late side of the origin of replication, and the adenovirus promoters.

Además, los vectores de expresión pueden contener uno o más genes marcadores seleccionables para permitir la selección de células huésped que contienen el vector. Dichos marcadores seleccionables incluyen genes que codifican dihidrofolato reductasa o genes que confieren resistencia a neomicina a cultivos de células eucarióticas, genes que confieren resistencia a tetraciclina o ampicilina en E. coli y el gen TRP1 de S. cerevisiae. Furthermore, expression vectors can contain one or more selectable marker genes to allow selection of host cells containing the vector. Such selectable markers include genes encoding dihydrofolate reductase or genes conferring neomycin resistance to eukaryotic cell cultures, genes conferring tetracycline or ampicillin resistance in E. coli, and the S. cerevisiae TRP1 gene.

En algunas realizaciones, el ácido nucleico que codifica uno de los polipéptidos divulgados en la presente y secuencias sustancialmente idénticas al mismo o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos del mismo se ensambla en la fase apropiada con una secuencia líder capaz de dirigir la secreción del polipéptido traducido o fragmento del mismo. En In some embodiments, the nucleic acid encoding one of the polypeptides disclosed herein and sequences substantially identical thereto or fragments comprising at least about 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 or more consecutive amino acids thereof are assembled in the appropriate phase with a leader sequence capable of directing secretion of the translated polypeptide or fragment thereof. In

algunas realizaciones, el ácido nucleico puede codificar un polipéptido de fusión en el cual uno de los polipéptidos de acuerdo con la invención o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos del mismo se fusiona a péptidos o polipéptidos heterólogos, tales como péptidos de identificación de extremo N-terminal que imparten características deseadas, tales como estabilidad aumentada o purificación simplificada. In some embodiments, the nucleic acid can encode a fusion polypeptide in which one of the polypeptides according to the invention or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 or more consecutive amino acids thereof are fused to heterologous peptides or polypeptides, such as N-terminus identification peptides that impart desired characteristics, such as increased stability or simplified purification.

La secuencia de ADN apropiada puede insertarse en el vector mediante una variedad de procedimientos. En general, la secuencia de ADN se liga a la posición deseada en el vector tras la digestión del inserto y el vector con las endonucleasas de restricción apropiadas. Alternativamente, se pueden ligar extremos romos al inserto y al vector. Se divulga una variedad de técnicas de clonación en Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Se considera que dichos procedimientos y otros están dentro del alcance de los expertos en la técnica. The appropriate DNA sequence can be inserted into the vector by a variety of procedures. In general, the DNA sequence is ligated to the desired position in the vector after digestion of the insert and the vector with the appropriate restriction endonucleases. Alternatively, blunt ends can be attached to the insert and vector. A variety of cloning techniques are disclosed in Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 and Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Such procedures and others are considered to be within the scope of those skilled in the art.

El vector puede, por ejemplo, estar en forma de un plásmido, una partícula viral o un fago. Otros vectores incluyen secuencias cromosómicas, no cromosómicas y de ADN sintético, derivados de SV40; plásmidos bacterianos, ADN fágico, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN fágico, ADN viral tal como variolovacuna, adenovirus, virus de la viruela aviar y seudorrabia. Una variedad de vectores de clonación y expresión para uso con huéspedes procarióticos y eucarióticos se describe, por ejemplo, en Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor, N.Y., (1989). The vector may, for example, be in the form of a plasmid, a viral particle, or a phage. Other vectors include chromosomal, non-chromosomal, and synthetic DNA sequences derived from SV40; Bacterial plasmids, phage DNA, baculoviruses, yeast plasmids, vectors derived from combinations of plasmids and phage DNA, viral DNA such as variola vaccine, adenovirus, fowlpox virus, and pseudorrabia. A variety of cloning and expression vectors for use with prokaryotic and eukaryotic hosts are described, for example, in Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, N.Y., (1989).

Células huésped y células transformadas Host cells and transformed cells

La invención también proporciona células transformadas que comprenden secuencias de ácido nucleico divulgadas en la presente, tales como secuencias que codifican enzimas aldolasas, tales como piruvato aldolasas, HMG y/o KHG aldolasa divulgadas en la presente o vectores divulgados en la presente. La célula huésped puede ser cualquiera de las células huéspedes conocidas para los expertos en la técnica, incluidas células procarióticas, células eucarióticas, tales como células bacterianas, células fúngicas, células de levadura, células de mamíferos, células de insectos o células vegetales. Las células bacterianas ejemplares incluyen cualquier especie de Streptomyces, Staphylococcus, Pseudomonas o Bacillus, incluidas E. coli, Bacillus subtilis, Pseudomonas fluorescens, Bacillus cereus o Salmonella typhimurium. Las células fúngicas ejemplares incluyen cualquier especie de Aspergillus. Las células de levadura ejemplares incluyen cualquier especie de Pichia, Saccharomyces, Schizosaccharomyces o Schwanniomyces, incluidas Pichia pastoris, Saccharomyces cerevisiae The invention also provides transformed cells comprising nucleic acid sequences disclosed herein, such as sequences encoding aldolase enzymes, such as pyruvate aldolases, HMG and / or KHG aldolase disclosed herein or vectors disclosed herein. The host cell can be any of the host cells known to those skilled in the art, including prokaryotic cells, eukaryotic cells, such as bacterial cells, fungal cells, yeast cells, mammalian cells, insect cells, or plant cells. Exemplary bacterial cells include any Streptomyces, Staphylococcus, Pseudomonas, or Bacillus species, including E. coli, Bacillus subtilis, Pseudomonas fluorescens, Bacillus cereus, or Salmonella typhimurium. Exemplary fungal cells include any Aspergillus species. Exemplary yeast cells include any species of Pichia, Saccharomyces, Schizosaccharomyces, or Schwanniomyces, including Pichia pastoris, Saccharomyces cerevisiae

o Schizosaccharomyces pombe. Las células de insectos ejemplares incluyen cualquier especie de Spodoptera o Drosophila, incluidas DrosophilaS2 y Spodoptera Sf9. Las células de animales ejemplares incluyen las líneas celulares CHO, COS o de melanoma de Bowes o cualquier línea celular murina o humana. La selección de un huésped apropiado está dentro de las capacidades de los expertos en la técnica. Las técnicas para transformar una amplia variedad de especies de plantas superiores se conocen y describen en la literatura técnica y científica. Ver Weising (1988) Ann. Rev. Genet. 22:421-477; Patente de los Estados Unidos No. 5.750.870. or Schizosaccharomyces pombe. Exemplary insect cells include any Spodoptera or Drosophila species, including DrosophilaS2 and Spodoptera Sf9. Exemplary animal cells include the CHO, COS, or Bowes melanoma cell lines or any murine or human cell lines. Selection of an appropriate host is within the capabilities of those skilled in the art. Techniques for transforming a wide variety of higher plant species are known and described in the technical and scientific literature. See Weising (1988) Ann. Rev. Genet. 22: 421-477; United States Patent No. 5,750,870.

El vector puede introducirse en las células huésped utilizando cualquiera de una variedad de técnicas, incluidas transformación, transfección, transducción, infección viral, pistolas génicas o transferencia génica mediada por Ti. Los métodos específicos incluyen transfección mediante fosfato de calcio, transfección mediada por DEAE-Dextrano, lipofección o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)). The vector can be introduced into host cells using any of a variety of techniques, including transformation, transfection, transduction, viral infection, gene guns, or Ti-mediated gene transfer. Specific methods include calcium phosphate transfection, DEAE-Dextran mediated transfection, lipofection, or electroporation (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).

En algunas realizaciones, los ácidos nucleicos o vectores divulgados en la presente se introducen en las células para someterlas a detección, por lo tanto, los ácidos nucleicos ingresan a las células de forma adecuada para la posterior expresión del ácido nucleico. El método de introducción depende en gran medida del tipo celular objetivo. Los métodos ejemplares incluyen precipitación de CaPO4, fusión de liposomas, lipofección (tal como LIPOFECTIN™), electroporación, infección viral, etc. Los ácidos nucleicos candidatos pueden integrar establemente el genoma de la célula huésped (por ejemplo, con introducción retroviral) o pueden existir transitoriamente o establemente en el citoplasma (es decir, a través del uso de plásmidos tradicionales, utilizando secuencias reguladoras estándares, marcadores de selección, etc.). Dado que muchas detecciones farmacéuticamente importantes requieren células objetivo de mamíferos modelo o humanas, se pueden utilizar vectores retrovirales capaces de transfectar dichos objetivos. In some embodiments, the nucleic acids or vectors disclosed herein are introduced into cells for detection, therefore, nucleic acids enter cells adequately for subsequent expression of the nucleic acid. The method of introduction largely depends on the target cell type. Exemplary methods include CaPO4 precipitation, liposome fusion, lipofection (such as LIPOFECTIN ™), electroporation, viral infection, etc. Candidate nucleic acids can stably integrate the host cell genome (for example, with retroviral introduction) or can exist transiently or stably in the cytoplasm (i.e. through the use of traditional plasmids, using standard regulatory sequences, selection markers , etc.). Since many pharmaceutically important detections require human or model mammalian target cells, retroviral vectors capable of transfecting such targets can be used.

Cuando sea apropiado, las células huésped manipuladas pueden cultivarse en medios nutritivos convencionales modificados según sea apropiado para activar promotores, seleccionar transformantes o amplificar los genes divulgados en la presente. Tras la transformación de una cepa huésped adecuada y el crecimiento de la cepa huésped hasta alcanzar una densidad celular apropiada, el promotor seleccionado puede inducirse mediante medios apropiados (tales como cambio de temperatura o inducción química) y las células pueden cultivarse durante un período adicional para permitir que produzcan el polipéptido o fragmento del mismo deseado. When appropriate, the engineered host cells can be grown in conventional nutrient media modified as appropriate to activate promoters, select transformants, or amplify the genes disclosed herein. After transformation of a suitable host strain and growth of the host strain to an appropriate cell density, the selected promoter can be induced by appropriate means (such as temperature change or chemical induction) and the cells can be cultured for an additional period to allowing them to produce the desired polypeptide or fragment thereof.

Las células pueden cosecharse mediante centrifugación, homogeneizarse mediante medios físicos o químicos y el extracto bruto resultante se conserva para someterse a purificación adicional. Las células microbianas empleadas para la expresión de las proteínas pueden homogeneizarse mediante cualquier método conveniente, incluidos ciclo Cells can be harvested by centrifugation, homogenized by physical or chemical means, and the resulting crude extract is preserved for further purification. Microbial cells used for protein expression can be homogenized by any convenient method, including cycling

de congelación y descongelación, exposición a ultrasonidos, homogeneización mecánica o utilización de agentes de lisis celular. Dichos métodos son conocidos para los expertos en la técnica. El polipéptido o fragmento del mismo expresado puede recogerse y purificarse de los cultivos celulares recombinantes mediante métodos que incluyen precipitación de sulfato de amonio o etanol, extracción ácida, cromatografía de intercambio aniónico o catiónico, cromatografía en fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía de hidroxiapatita y cromatografía en lectina. Se pueden utilizar etapas de repliegue de proteínas, según sea necesario, para completar la configuración del polipéptido. Si se desea, se puede emplear cromatografía líquida de alto rendimiento (HPLC) para las etapas finales de purificación. freezing and thawing, exposure to ultrasound, mechanical homogenization or use of cell lysis agents. Such methods are known to those skilled in the art. The expressed polypeptide or fragment thereof can be collected and purified from the recombinant cell cultures by methods including ammonium sulfate or ethanol precipitation, acid extraction, anion or cation exchange chromatography, phosphocellulose chromatography, hydrophobic interaction chromatography, affinity chromatography. , hydroxyapatite chromatography and lectin chromatography. Protein refolding steps can be used, as necessary, to complete the configuration of the polypeptide. If desired, high performance liquid chromatography (HPLC) can be used for the final stages of purification.

Los constructos en células huésped pueden utilizarse de forma convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del huésped empleado en un procedimiento de producción recombinante, los polipéptidos producidos mediante células huésped que contienen el vector pueden ser glicosilados The constructs in host cells can be used in a conventional way to produce the gene product encoded by the recombinant sequence. Depending on the host employed in a recombinant production procedure, polypeptides produced by host cells containing the vector can be glycosylated

o pueden ser no glicosilados. Los polipéptidos divulgados en la presente pueden o no incluir también un residuo de aminoácido de metionina inicial. or they can be non-glycosylated. The polypeptides disclosed herein may or may not also include an initial methionine amino acid residue.

También se pueden emplear sistemas de traducción in vitro para producir un polipéptido divulgado en la presente. Los sistemas de traducción in vitro pueden utilizar ARNm transcrito a partir de un constructo de ADN que comprende un promotor unido operativamente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. En algunas realizaciones, el constructo de ADN puede linearizarse antes de llevar a cabo una reacción de transcripción in vitro. A continuación el ARNm transcrito se incuba con un extracto de traducción in vitro apropiado, tal como un extracto de reticulocitos de conejo, para producir el polipéptido o fragmento del mismo deseado. In vitro translation systems can also be employed to produce a polypeptide disclosed herein. In vitro translation systems can use mRNA transcribed from a DNA construct comprising a promoter operably linked to a nucleic acid encoding the polypeptide or fragment thereof. In some embodiments, the DNA construct can be linearized before carrying out an in vitro transcription reaction. The transcribed mRNA is then incubated with an appropriate in vitro translation extract, such as an extract from rabbit reticulocytes, to produce the desired polypeptide or fragment thereof.

Los vectores de expresión pueden contener uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para selección de células huésped transformadas tal como dihidrofolato reductasa o resistencia a neomicina para cultivo de células eucarióticas o tal como resistencia a tetraciclina o ampicilina en E. coli. Expression vectors can contain one or more selectable marker genes to provide a phenotypic trait for selection of transformed host cells such as dihydrofolate reductase or neomycin resistance for eukaryotic cell culture or such as tetracycline or ampicillin resistance in E. coli.

Las células huésped que contienen los polinucleótidos de interés, tales como ácidos nucleicos divulgados en la presente, pueden cultivarse en medios nutritivos convenciones modificados según sea apropiado para activar promotores, seleccionar transformantes o amplificar genes. Las condiciones de cultivo, tales como temperatura, pH y similares, son las utilizadas previamente con la célula huésped seleccionada para expresión y serán evidentes para el experto en la técnica. Los clones identificados por tener la actividad enzimática especificada a continuación pueden secuenciarse para identificar la secuencia de polinucleótidos que codifica una enzima que tiene la actividad potenciada. Host cells containing the polynucleotides of interest, such as nucleic acids disclosed herein, can be cultured in nutrient media as modified to appropriate promoters, select transformants, or amplify genes. The culture conditions, such as temperature, pH, and the like, are those previously used with the host cell selected for expression and will be apparent to one skilled in the art. Clones identified as having the enzyme activity specified below can be sequenced to identify the polynucleotide sequence encoding an enzyme that has enhanced activity.

La divulgación proporciona métodos para sobreexpresar enzimas aldolasas, tales como piruvato aldolasas, tales como HMG y/o KHG aldolasa recombinantes en células que comprenden y expresan un vector que comprende un ácido nucleico divulgado en la presente, tal como un ácido nucleico que comprende una secuencia de ácidos nucleicos con al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mayor identidad secuencial con una secuencia divulgada en la presente en una región de al menos aproximadamente 100 residuos, en donde las identidades secuenciales se determinan mediante análisis con un algoritmo de comparación secuencial The disclosure provides methods for overexpressing aldolase enzymes, such as pyruvate aldolases, such as recombinant HMG and / or KHG aldolase in cells comprising and expressing a vector comprising a nucleic acid disclosed herein, such as a nucleic acid comprising a sequence of nucleic acids with at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64 %, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% , 98%, 99% or greater sequential identity with a sequence disclosed herein in a region of at least about 100 residues, where the sequential identities are determined by analysis with a sequential comparison algorithm

o mediante inspección visual, o un ácido nucleico que se hibrida en condiciones rigurosas con una secuencia de ácidos nucleicos divulgada en la presente o una subsecuencia de la misma. La sobreexpresión puede producirse mediante cualquier medio, tal como la utilización de un promotor de gran actividad, un vector dicistrónico o mediante amplificación génica del vector. or by visual inspection, or a nucleic acid that hybridizes under stringent conditions to a nucleic acid sequence disclosed herein or a subsequence thereof. Overexpression can occur by any means, such as the use of a highly active promoter, a dicistronic vector, or by gene amplification of the vector.

Los ácidos nucleicos divulgados en la presente pueden expresarse o sobreexpresarse en cualquier sistema de expresión in vitro o in vivo. Se puede emplear cualquier sistema de cultivo celular para expresar o sobreexpresar proteínas recombinantes, incluidos cultivos bacterianos, de insectos, de levadura, fúngicos o de mamíferos. La sobreexpresión puede producirse mediante la elección apropiada de promotores, potenciadores, vectores (tal como el uso de vectores de replicón, vectores dicistrónicos (ver Gurtu (1996) Biochem. Biophys. Res. Commun. 229:2958)), medios, sistemas de cultivo y similares. En algunas realizaciones, se utiliza amplificación génica utilizando marcadores de selección, tales como glutamina sintetasa (ver Sanders (1987) Dev. Biol. Stand. 66:55-63), en sistemas celulares para sobreexpresar los polipéptidos divulgados en la presente. The nucleic acids disclosed herein can be expressed or overexpressed in any in vitro or in vivo expression system. Any cell culture system can be used to express or overexpress recombinant proteins, including bacterial, insect, yeast, fungal, or mammalian cultures. Overexpression can occur through the appropriate choice of promoters, enhancers, vectors (such as the use of replicon vectors, dicistronic vectors (see Gurtu (1996) Biochem. Biophys. Res. Commun. 229: 2958)), media, systems of cultivation and the like. In some embodiments, gene amplification using selection markers, such as glutamine synthetase (see Sanders (1987) Dev. Biol. Stand. 66: 55-63), is used in cellular systems to overexpress the polypeptides disclosed herein.

Los detalles adicionales en relación a este abordaje se encuentran en la literatura pública y/o son conocidos para los expertos. En un ejemplo específico no taxativo, dicha literatura disponible públicamente incluye EP 0659215 (WO 9403612 A1) (Nevalainen et al.); Lapidot, A., Mechaly, A., Shoham, Y., “Overexpression and single-step purification of a thermostable xylanase from Bacillus stearothermophilus T-6”, J. Biotechnol. Noviembre 51:259-64 (1996); Lüthi, E., Jasmat, N. B., Bergquist, P. L., “Xylanase from the extremely thermophilic bacterium Caldocellum saccharolyticum: overexpression of the gene in Escherichia coli and characterization of the gene product”, Appl. Environ. Microbiol. Setiembre 56:2677-83 (1990); y Sung, W. L., Luk, C. K., Zahab, D. M., Wakarchuk, W., “Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli”, Protein Expr. Purif. Junio 4:2006 (1993), aunque estas referencias no describen las enzimas inventivas de la presente solicitud. Additional details regarding this approach are found in public literature and / or are known to experts. In a specific non-exhaustive example, said publicly available literature includes EP 0659215 (WO 9403612 A1) (Nevalainen et al.); Lapidot, A., Mechaly, A., Shoham, Y., "Overexpression and single-step purification of a thermostable xylanase from Bacillus stearothermophilus T-6", J. Biotechnol. November 51: 259-64 (1996); Lüthi, E., Jasmat, N. B., Bergquist, P. L., “Xylanase from the extremely thermophilic bacterium Caldocellum saccharolyticum: overexpression of the gene in Escherichia coli and characterization of the gene product”, Appl. Environ. Microbiol. September 56: 2677-83 (1990); and Sung, W. L., Luk, C. K., Zahab, D. M., Wakarchuk, W., "Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli", Protein Expr. Purif. June 4: 2006 (1993), although these references do not describe the inventive enzymes of the present application.

La célula huésped puede ser cualquiera de las células huéspedes conocidas para los expertos en la técnica, incluidas células procarióticas, células eucarióticas, células de mamíferos, células de insectos o células vegetales. Como ejemplos representativos de huéspedes apropiados, se pueden mencionar: células bacterianas, tales como E. coli, Streptomyces, Bacillus subtilis, Bacillus cereus, Salmonella typhimurium y varias especies dentro de los géneros Pseudomonas, Streptomyces y Staphylococcus, células fúngicas, tales como Aspergillus, levadura tal como cualquier especie de Pichia, Saccharomyces, Schizosaccharomyces, Schwanniomyces, incluidas Pichia pastoris, Saccharomyces cerevisiae, o Schizosaccharomyces pombe, células de insectos tales como Drosophila S2 y Spodoptera Sf9, células de animales tales como de CHO, COS o de melanoma de Bowes y adenovirus. La selección de un huésped apropiado está dentro de las capacidades de los expertos en la técnica. The host cell can be any of the host cells known to those skilled in the art, including prokaryotic cells, eukaryotic cells, mammalian cells, insect cells, or plant cells. As representative examples of suitable hosts, there may be mentioned: bacterial cells, such as E. coli, Streptomyces, Bacillus subtilis, Bacillus cereus, Salmonella typhimurium and various species within the genera Pseudomonas, Streptomyces and Staphylococcus, fungal cells, such as Aspergillus, yeast such as any species of Pichia, Saccharomyces, Schizosaccharomyces, Schwanniomyces, including Pichia pastoris, Saccharomyces cerevisiae, or Schizosaccharomyces pombe, cells of insects such as Drosophila S2 and Spodoptera Sf9, cells of animals such as CHO, COS, or Bowes melanoma and adenovirus. Selection of an appropriate host is within the capabilities of those skilled in the art.

El vector puede introducirse en las células huésped utilizando cualquiera de una variedad de técnicas, incluidas transformación, transfección, transducción, infección viral, pistolas génicas o transferencia génica mediada por Ti. Los métodos específicos incluyen transfección mediante fosfato de calcio, transfección mediada por DEAE-Dextrano, lipofección o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)). The vector can be introduced into host cells using any of a variety of techniques, including transformation, transfection, transduction, viral infection, gene guns, or Ti-mediated gene transfer. Specific methods include calcium phosphate transfection, DEAE-Dextran mediated transfection, lipofection, or electroporation (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).

Cuando sea apropiado, las células huésped manipuladas pueden cultivarse en medios nutritivos convencionales modificados según sea apropiado para activar promotores, seleccionar transformantes o amplificar los genes de acuerdo con la invención. Tras la transformación de una cepa huésped adecuada y el crecimiento de la cepa huésped hasta alcanzar una densidad celular apropiada, el promotor seleccionado puede inducirse mediante medios apropiados (tales como cambio de temperatura o inducción química) y las células pueden cultivarse durante un período adicional para permitir que produzcan el polipéptido o fragmento del mismo deseado. When appropriate, the manipulated host cells can be grown in standard nutrient media modified as appropriate to activate promoters, select transformants, or amplify genes according to the invention. After transformation of a suitable host strain and growth of the host strain to an appropriate cell density, the selected promoter can be induced by appropriate means (such as temperature change or chemical induction) and the cells can be cultured for an additional period to allowing them to produce the desired polypeptide or fragment thereof.

Las células pueden cosecharse mediante centrifugación, homogeneizarse mediante medios físicos o químicos y el extracto bruto resultante se conserva para someterse a purificación adicional. Las células microbianas empleadas para la expresión de las proteínas pueden homogeneizarse mediante cualquier método conveniente, incluidos ciclo de congelación y descongelación, exposición a ultrasonidos, homogeneización mecánica o utilización de agentes de lisis celular. Dichos métodos son conocidos para los expertos en la técnica. El polipéptido o fragmento del mismo expresado puede recogerse y purificarse a partir de los cultivos celulares recombinantes mediante métodos que incluyen precipitación de sulfato de amonio o etanol, extracción ácida, cromatografía de intercambio aniónico o catiónico, cromatografía en fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía de hidroxiapatita y cromatografía en lectina. Se pueden utilizar etapas de repliegue de proteínas, según sea necesario, para completar la configuración del polipéptido. Si se desea, se puede emplear cromatografía líquida de alto rendimiento (HPLC) para las etapas finales de purificación. Cells can be harvested by centrifugation, homogenized by physical or chemical means, and the resulting crude extract is preserved for further purification. Microbial cells used for protein expression can be homogenized by any convenient method, including freeze-thaw cycling, ultrasound exposure, mechanical homogenization, or use of cell lysing agents. Such methods are known to those skilled in the art. The expressed polypeptide or fragment thereof can be collected and purified from the recombinant cell cultures by methods including ammonium sulfate or ethanol precipitation, acid extraction, anion or cation exchange chromatography, phosphocellulose chromatography, hydrophobic interaction chromatography, chromatography. affinity, hydroxyapatite chromatography and lectin chromatography. Protein refolding steps can be used, as necessary, to complete the configuration of the polypeptide. If desired, high performance liquid chromatography (HPLC) can be used for the final stages of purification.

También se pueden emplear varios sistemas de cultivos celulares de mamíferos para expresar la proteína recombinante. Ejemplos de sistemas de expresión de mamíferos incluyen las líneas COS-7 de fibroblastos de riñón de mono (descritas por Gluzman, Cell, 23:175, 1981) y otras líneas celulares capaces de expresar proteínas a partir de un vector compatible, tales como las líneas celulares C127, 3T3, CHO, HeLa y BHK. Various mammalian cell culture systems can also be employed to express the recombinant protein. Examples of mammalian expression systems include monkey kidney fibroblast COS-7 lines (described by Gluzman, Cell, 23: 175, 1981) and other cell lines capable of expressing proteins from a compatible vector, such as C127, 3T3, CHO, HeLa and BHK cell lines.

Los constructos en células huésped pueden utilizarse de forma convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del huésped empleado en un procedimiento de producción recombinante, los polipéptidos producidos mediante células huésped que contienen el vector pueden ser glicosilados The constructs in host cells can be used in a conventional way to produce the gene product encoded by the recombinant sequence. Depending on the host employed in a recombinant production procedure, polypeptides produced by host cells containing the vector can be glycosylated

o pueden ser no glicosilados. Los polipéptidos de acuerdo con la invención pueden o no incluir también un residuo de aminoácido de metionina inicial. or they can be non-glycosylated. Polypeptides according to the invention may or may not also include an initial methionine amino acid residue.

Alternativamente, los polipéptidos divulgados en la presente o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos de los mismos pueden producirse sintéticamente mediante sintetizadores peptídicos convencionales, tales como los descritos más adelante. En otras realizaciones, se pueden emplear fragmentos o porciones de los polipéptidos para producir los polipéptidos de longitud completa correspondientes mediante síntesis de péptidos; por consiguiente, los fragmentos pueden emplearse como intermediarios para producir los polipéptidos de longitud completa. Alternatively, the polypeptides disclosed herein or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 or more consecutive amino acids thereof can be synthetically produced by peptide synthesizers conventional, such as those described below. In other embodiments, fragments or portions of the polypeptides can be used to produce the corresponding full-length polypeptides by peptide synthesis; therefore, the fragments can be used as intermediates to produce the full length polypeptides.

Los sistemas de traducción in vitro también pueden emplearse para producir uno de los polipéptidos divulgados en la presente o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos de los mismos utilizando ARNm transcritos a partir de un constructo de ADN que comprende un promotor unido operativamente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. En algunas realizaciones, el constructo de ADN puede linearizarse antes de llevar a cabo una reacción de transcripción in vitro. A continuación el ARNm transcrito se incuba con un extracto de traducción in vitro apropiado, tal como un extracto de reticulocitos de conejo, para producir el polipéptido o fragmento del mismo deseado. In vitro translation systems can also be used to produce one of the polypeptides disclosed herein or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 or more. Consecutive amino acids thereof using mRNA transcribed from a DNA construct comprising a promoter operably linked to a nucleic acid encoding the polypeptide or fragment thereof. In some embodiments, the DNA construct can be linearized before carrying out an in vitro transcription reaction. The transcribed mRNA is then incubated with an appropriate in vitro translation extract, such as an extract from rabbit reticulocytes, to produce the desired polypeptide or fragment thereof.

Amplificación de ácidos nucleicos Nucleic acid amplification

Al poner en práctica la divulgación, se pueden producir ácidos nucleicos divulgados en la presente y ácidos nucleicos que codifican enzimas aldolasas, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente o ácidos nucleicos modificados divulgados en la presente, mediante amplificación, tal como PCR. La amplificación además puede utilizarse para clonar o modificar los ácidos nucleicos divulgados en la By practicing the disclosure, nucleic acids disclosed herein and nucleic acids encoding aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, or modified nucleic acids disclosed herein, can be produced. by amplification, such as PCR. Amplification can also be used to clone or modify the nucleic acids disclosed in the

presente. Por consiguiente, la invención proporciona pares de secuencias cebadoras de amplificación para amplificar ácidos nucleicos divulgados en la presente. Un experto en la técnica puede diseñar pares de secuencias cebadoras de amplificación para cualquier parte o para la longitud completa de estas secuencias. Present. Accordingly, the invention provides pairs of amplification primer sequences for amplifying nucleic acids disclosed herein. One skilled in the art can design pairs of amplification primer sequences for any part or for the full length of these sequences.

En algunas realizaciones, la invención proporciona ácidos nucleicos amplificados mediante pares de cebadores de amplificación divulgados en la presente, tales como pares de cebadores tales como fueron establecidos en aproximadamente los primeros (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 o más residuos de ácidos nucleicos divulgados en la presente y en aproximadamente los primeros (5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 o más residuos de las cadenas complementarias. En algunas realizaciones, la divulgación proporciona pares de secuencias cebadoras de amplificación para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en donde el par de cebadores es capaz de amplificar un ácido nucleico que comprende una secuencia divulgada en la presente o fragmentos o subsecuencias de la misma. Uno o cada miembro del par de secuencias cebadoras de amplificación puede comprender un oligonucleótido que comprende al menos aproximadamente 10 a 50 o más bases consecutivas de la secuencia o aproximadamente 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 o más bases consecutivas de la secuencia. En algunas realizaciones, la invención proporciona pares de cebadores de amplificación, en donde el par de cebadores comprende un primer miembro que tiene una secuencia tal como fue establecida en aproximadamente los primeros (5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 o más residuos de un ácido nucleico divulgado en la presente y un segundo miembro que tiene una secuencia tal como fue establecida en aproximadamente los primeros (5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 o más residuos de la cadena complementaria del primer miembro. In some embodiments, the invention provides nucleic acids amplified by amplification primer pairs disclosed herein, such as primer pairs as set forth in approximately the first (5 ') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 or more nucleic acid residues disclosed herein and in approximately the first (5 ') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 or 25 or more residues of the complementary chains. In some embodiments, the disclosure provides amplification primer sequence pairs for amplifying a nucleic acid encoding a polypeptide having an enzyme aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, wherein the primer pair it is capable of amplifying a nucleic acid comprising a sequence disclosed herein or fragments or subsequences thereof. One or each member of the pair of amplification primer sequences may comprise an oligonucleotide comprising at least about 10 to 50 or more consecutive bases in the sequence or about 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 or 25 or more consecutive bases in the sequence. In some embodiments, the invention provides amplification primer pairs, wherein the primer pair comprises a first member having a sequence as set forth in approximately the first (5 ') 12, 13, 14, 15, 16, 17 , 18, 19, 20, 21, 22, 23, 24, or 25 or more residues of a nucleic acid disclosed herein and a second member having a sequence as established in approximately the first (5 ') 15, 16 , 17, 18, 19, 20, 21, 22, 23, 24 or 25 or more residues of the complementary chain of the first member.

La invención proporciona enzimas aldolasas, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa generadas mediante amplificación, tal como reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación divulgados en la presente. En algunas realizaciones, la invención proporciona métodos para hacer una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa mediante amplificación, tal como PCR, utilizando un par de cebadores de amplificación divulgados en la presente. En algunas realizaciones, el par de cebadores de amplificación amplifica un ácido nucleico de una biblioteca, tal como una biblioteca, tal como una biblioteca ambiental. The invention provides aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase generated by amplification, such as polymerase chain reaction (PCR), using a pair of amplification primers disclosed herein. In some embodiments, the invention provides methods for making an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase by amplification, such as PCR, using a pair of amplification primers disclosed herein. In some embodiments, the pair of amplification primers amplifies a nucleic acid from a library, such as a library, such as an environmental library.

Las reacciones de amplificación también pueden utilizarse para cuantificar la cantidad de ácido nucleico en una muestra (tal como la cantidad de mensaje en una muestra celular), etiquetar el ácido nucleico (tal como aplicarlo en un arreglo o una membrana de filtro), detectar el ácido nucleico o cuantificar la cantidad de un ácido nucleico específico en una muestra. En algunas realizaciones, se amplifica el mensaje aislado a partir de una célula o una biblioteca de ADNc. Amplification reactions can also be used to quantify the amount of nucleic acid in a sample (such as the amount of message in a cell sample), label the nucleic acid (such as applying it to an array or a filter membrane), detect the nucleic acid or quantify the amount of a specific nucleic acid in a sample. In some embodiments, the isolated message is amplified from a cell or a cDNA library.

El experto en la técnica puede seleccionar y diseñar cebadores de amplificación de oligonucleótidos adecuados. Los métodos de amplificación también se conocen en la técnica e incluyen reacción en cadena de la polimerasa, PCR (ver PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990) y PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., reacción en cadena de la ligasa (LCR) (ver Wu (1989) Genomics 4:560; Landegren (1988) Science 241:1077; Barringer (1990) Gene 89:117); amplificación de transcripción (ver Kwoh (1989) Proc. Natl. Acad. Sci. Estados Unidos 86:1173); y replicación de secuencia automantenida (ver Guatelli (1990) Proc. Natl. Acad. Sci. Estados Unidos 87:1874); amplificación de replicasa Q Beta (ver Smith (1997) J. Clin. Microbiol. 35:1477-1491), ensayo de amplificación de replicasa Q Beta automatizado (ver Burg (1996) Mol. Cell. Probes 10:257-271) y otras técnicas mediadas por ARN polimerasa (tales como NASBA, Cangene, Mississauga, Ontario); ver también Berger (1987) Methods Enzymol. 152:307-316; Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Patentes de los Estados Unidos Nos. 4.683.195 y 4.683.202; Sooknanan (1995) Biotechnology 13:563-564. The person skilled in the art can select and design suitable oligonucleotide amplification primers. Amplification methods are also known in the art and include polymerase chain reaction, PCR (see PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, NY (1990) and PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., NY, Ligase Chain Reaction (CSF) (see Wu (1989) Genomics 4: 560; Landegren (1988) Science 241: 1077; Barringer (1990) Gene 89: 117) ; transcription amplification (see Kwoh (1989) Proc. Natl. Acad. Sci. United States 86: 1173); and self-sustained sequence replication (see Guatelli (1990) Proc. Natl. Acad. Sci. United States 87: 1874) ; Q beta replicase amplification (see Smith (1997) J. Clin. Microbiol. 35: 1477-1491), automated Q beta replicase amplification assay (see Burg (1996) Mol. Cell. Probes 10: 257-271) and other RNA polymerase mediated techniques (such as NASBA, Cangene, Mississauga, Ontario); see also Berger (1987) Methods Enzymol. 152: 307-316; Ausubel et al. Current Protocols in Molecu Lar Biology, John Wiley & Sons, Inc. 1997 and Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989). United States Patent Nos. 4,683,195 and 4,683,202; Sooknanan (1995) Biotechnology 13: 563-564.

Determinación de identidad secuencial en ácidos nucleicos y polipéptidos Determination of sequential identity in nucleic acids and polypeptides

La divulgación proporciona ácidos nucleicos que comprenden secuencias que tienen al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más o total (100%) identidad secuencial (homología) con un ácido nucleico divulgado en la presente (ver Listado de secuencias) en una región de al menos aproximadamente 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 o más residuos. En algunas realizaciones, la divulgación proporciona polipéptidos que comprenden secuencias que tienen al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más o total (100%) identidad secuencial con un polipéptido divulgado en la presente (ver Listado de secuencias). El grado de identidad secuencial (homología) puede determinarse utilizando cualquier programa informático y parámetros asociados, incluidos los descritos en la presente, tales como BLAST The disclosure provides nucleic acids that comprise sequences that are at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62 %, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% , 96%, 97%, 98%, 99% or more or total (100%) sequential identity (homology) with a nucleic acid disclosed herein (see Sequence Listing) in a region of at least about 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 or more waste. In some embodiments, the disclosure provides polypeptides comprising sequences that are at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61 %, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, 99% or more or total (100%) sequential identity with a polypeptide disclosed herein (see Sequence Listing). The degree of sequential identity (homology) can be determined using any computer program and associated parameters, including those described herein, such as BLAST

2.2.2. o FASTA versión 3.0t78, con los parámetros predeterminados. 2.2.2. o FASTA version 3.0t78, with default parameters.

Las secuencias de ácido nucleico divulgadas en la presente pueden comprender al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 o más nucleótidos consecutivos de una secuencia divulgada en la presente y secuencias básicamente idénticas a la misma. Las secuencias homólogas y fragmentos de secuencias de ácido nucleico divulgadas en la presente pueden referirse a secuencias que tienen al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más identidad secuencial (homología) con estas secuencias. La homología (identidad secuencial) puede determinarse utilizando cualquiera de los programas informáticos y parámetros descritos en la presente, incluido FASTA versión 3.0t78 con los parámetros predeterminados. Las secuencias homólogas también incluyen secuencias de ARN en las cuales las uridinas sustituyen a las timinas en las secuencias de ácido nucleico divulgadas en la presente. Las secuencias homólogas pueden obtenerse utilizando cualquiera de los procedimientos descritos en la presente o pueden resultar de la corrección de un error de secuenciación. Se apreciará que las secuencias de ácido nucleico divulgadas en la presente pueden representarse con el formato tradicional de un solo carácter (Ver el interior de la contratapa de Stryer, Lubert. Biochemistry, 3a Ed., The nucleic acid sequences disclosed herein can comprise at least 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 or 500 or more consecutive nucleotides of a disclosed sequence herein and sequences basically identical thereto. The homologous sequences and nucleic acid sequence fragments disclosed herein can refer to sequences having at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75% , 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92 %, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequential identity (homology) with these sequences. Homology (sequential identity) can be determined using any of the software and parameters described herein, including FASTA version 3.0t78 with the default parameters. Homologous sequences also include RNA sequences in which uridines replace thymine in the nucleic acid sequences disclosed herein. Homologous sequences can be obtained using any of the procedures described herein or can result from correction of a sequencing error. It will be appreciated that the nucleic acid sequences disclosed herein can be represented in the traditional single-character format (See inside back cover of Stryer, Lubert. Biochemistry, 3rd Ed.,

W. H Freeman & Co., Nueva York.) o en cualquier otro formato que registra la identidad de los nucleótidos en una secuencia. W. H Freeman & Co., New York.) Or in any other format that records the identity of nucleotides in a sequence.

En algunas realizaciones, los programas de comparación de secuencias identificados en la presente se usan en este aspecto, es decir, para determinar si una secuencia de ácidos nucleicos o polipéptido está dentro del alcance de la divulgación. Sin embargo, las identidades secuenciales de proteínas y/o ácidos nucleicos (homologías) pueden evaluarse utilizando cualquier algoritmo o programa de comparación secuencial conocido en la técnica. Dichos algoritmos y programas incluyen, pero de ninguna forma se limitan a, TBLASTN, BLASTP, FASTA, TFASTA y CLUSTALW (ver Pearson and Lipman, Proc. Natl. Acad. Sci. Estados Unidos 85(8):2444-2448, 1988; Altschul et al., In some embodiments, the sequence comparison programs identified herein are used in this regard, that is, to determine if a nucleic acid or polypeptide sequence is within the scope of the disclosure. However, the sequential identities of proteins and / or nucleic acids (homologies) can be evaluated using any algorithm or sequential comparison program known in the art. Such algorithms and programs include, but are not limited to, TBLASTN, BLASTP, FASTA, TFASTA, and CLUSTALW (see Pearson and Lipman, Proc. Natl. Acad. Sci. United States 85 (8): 2444-2448, 1988; Altschul et al.,

J. Mol. Biol. 215(3):403-410, 1990; Thompson Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins et al., Methods Enzymol. 266:383-402, 1996; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Altschul et al., Nature Genetics 3:266-272, 1993). J. Mol. Biol. 215 (3): 403-410, 1990; Thompson Nucleic Acids Res. 22 (2): 4673-4680, 1994; Higgins et al., Methods Enzymol. 266: 383-402, 1996; Altschul et al., J. Mol. Biol. 215 (3): 403-410, 1990; Altschul et al., Nature Genetics 3: 266-272, 1993).

En algunas realizaciones, la homología o identidad se mide utilizando un programa informático de análisis de secuencias (tal como Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wis. 53705). Dicho programa informático empareja secuencias similares asignando grados de homología a varias eliminaciones, sustituciones y otras modificaciones. En algunas realizaciones, los términos “homología” e “identidad” en el contexto de dos o más secuencias de ácidos nucleico o polipéptidos, se refiere a dos o más secuencias o subsecuencias que son iguales o tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son iguales cuando se comparan y alinean para determinar la correspondencia máxima en una ventana de comparación o región designada tal como se mide utilizando cualquier cantidad de algoritmos de comparación secuencial o mediante alineación manual e inspección visual. En algunas realizaciones, para la comparación secuencial, una secuencia actúa como una secuencia de referencia con la cual se comparan las secuencias de prueba. Cuando se utiliza un algoritmo de comparación secuencial, las secuencias de prueba y referencia se ingresan en un ordenador, se designan las coordenadas de subsecuencia, si es necesario y se designan los parámetros del programa de algoritmo de secuencias. Se pueden utilizar los parámetros predeterminados del programa o se pueden designar parámetros alternativos. El algoritmo de comparación secuencial a continuación calcula las identidades secuenciales porcentuales para las secuencias de prueba con respecto a la secuencia de referencia, en base a los parámetros del programa. In some embodiments, homology or identity is measured using a sequence analysis software (such as the Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wis. 53705). Said computer program matches similar sequences assigning degrees of homology to various deletions, substitutions and other modifications. In some embodiments, the terms "homology" and "identity" in the context of two or more nucleic acid or polypeptide sequences, refers to two or more sequences or subsequences that are the same or have a specified percentage of amino acid or nucleotide residues that are the same when comparing and aligning to determine the maximum match in a comparison window or designated region as measured using any number of sequential comparison algorithms or by manual alignment and visual inspection. In some embodiments, for sequential comparison, a sequence acts as a reference sequence against which the test sequences are compared. When using a sequential comparison algorithm, the test and reference sequences are entered into a computer, the subsequence coordinates are designated, if necessary, and the parameters of the sequence algorithm program are designated. Default program parameters can be used or alternative parameters can be designated. The sequential comparison algorithm below calculates the percentage sequential identities for the test sequences relative to the reference sequence, based on the program parameters.

Una “ventana de comparación”, tal como se usa en la presente, incluye la referencia a un segmento de cualquiera de la cantidad de posiciones contiguas seleccionadas del grupo que consiste en de 20 a 600, generalmente aproximadamente 50 a aproximadamente 200, más generalmente aproximadamente 100 a aproximadamente 150 en el cual una secuencia pueden compararse con la secuencia de referencia con la misma cantidad de posiciones contiguas después de alinear óptimamente las dos secuencias. Los métodos de alineación de secuencias para comparación se conocen en la técnica. La alineación óptima de secuencias para comparación puede llevarse a cabo, por ejemplo, mediante el algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482, 1981, mediante el algoritmo de alineación de homología de Needleman & Wunsch, J. Mol. Biol. 48:443, 1970, mediante el método de búsqueda de similitud de person & Lipman, Proc. Nat'l. Acad. Sci. Estados Unidos 85:2444, 1988, mediante implementaciones informáticas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.) o mediante alineación manual e inspección visual. Otros algoritmos para determinar la homología o identidad incluyen, por ejemplo, además de un programa BLAST (Herramienta de Búsqueda de Alineación Local Básica en el National Center for Biological Information), ALIGN, AMAS (Análisis de Múltiples Secuencias Alineadas), AMPS (Alineación de Múltiples Secuencias Proteicas), ASSET (Herramienta de Evaluación Estadística de Segmento Alineado), BANDS, BESTSCOR, BIOSCAN (Nodo de Análisis Comparativo de Secuencias Biológicas), BLIMPS (Buscador Mejorado por Bloques), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, algoritmo de Smith-Waterman, DARWIN, algoritmo de Las Vegas, FNAT (Herramienta de Alineación de Nucleótidos Forzada), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Paquete de Análisis Secuencial Fristensky), GAP (Programa de Alineación Global), GENAL, GIBBS, GenQuest, ISSC (Comparación A "comparison window" as used herein includes the reference to a segment of any of the number of contiguous positions selected from the group consisting of from 20 to 600, generally about 50 to about 200, more generally about 100 to about 150 in which one sequence can be compared to the reference sequence with the same number of contiguous positions after optimally aligning the two sequences. Sequence alignment methods for comparison are known in the art. Optimal sequence alignment for comparison can be carried out, for example, by the Smith & Waterman local homology algorithm, Adv. Appl. Math. 2: 482, 1981, using the Needleman & Wunsch, J. Mol. Homology alignment algorithm. Biol. 48: 443, 1970, by the similarity search method of person & Lipman, Proc. Nat'l. Acad. Sci. United States 85: 2444, 1988, by computer implementations of these algorithms (GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.) Or by manual alignment and visual inspection. Other algorithms for determining homology or identity include, for example, in addition to a BLAST program (Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS (Multiple Aligned Sequence Analysis), AMPS (Alignment of Multiple Protein Sequences), ASSET (Aligned Segment Statistical Assessment Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (Block Enhanced Finder), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman's algorithm, DARWIN, Las Vegas algorithm, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequential Analysis Package), GAP (Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC (Comparison

Secuencial Sensible), LALIGN (Alineación Secuencial Local), LCP (Programa de Contenido Local), MACAW (Estación de Trabajo para Construcción y Análisis de Alineaciones Múltiples), MAP (Programa de Alineaciones Múltiples), MBLKP, MBLKN, PIMA (Alineación Multisecuencia Inducida por Patrón), SAGA (Alineación Secuencial Mediante Algoritmo Genético) y WHAT-IF. Dichos programas de alineación también pueden utilizarse para someter a detección bases de datos de genoma para identificar secuencias de polinucleótidos que tienen secuencias sustancialmente idénticas. Existen varias bases de datos de genoma disponibles, por ejemplo, una porción sustancial del genoma humano está disponible como parte del Human Genome Sequencing Project (Gibbs, 1995). Al menos veintiún genomas distintos ya han sido secuenciados, incluidos por ejemplo de M. genitalium (Fraser et al., Science 270:397-403 (1995)), M. jannaschii (Bult et al., Science 23:1058-73 (1996)), H. influenzae (Fleischmann et al., Science 269:496-512 (1995)), E. coli (Blattner et al.,Science 277:1453-74 (1997)) y levadura (S. cerevisiae) (Mewes et al., Nature 387:7-65 (1997)) y D. melanogaster (Adams et al., Science287:2185-95 (2000)). También se ha avanzado considerablemente en la secuenciación de genomas de organismos modelo, tales como de ratón, C. elegansand Arabadopsis sp. Diferentes organizaciones mantienen varias bases de datos que contienen información genómica comentada con algunas informaciones funcionales y se puede acceder a las mismas a través de Internet. Sensitive Sequential), LALIGN (Local Sequential Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Construction and Analysis Workstation), MAP (Multiple Alignment Program), MBLKP, MBLKN, PIMA (Induced Multi-Sequence Alignment by Pattern), SAGA (Sequential Alignment Using Genetic Algorithm) and WHAT-IF. Such alignment programs can also be used to screen genome databases to identify polynucleotide sequences that have substantially identical sequences. There are several genome databases available, for example a substantial portion of the human genome is available as part of the Human Genome Sequencing Project (Gibbs, 1995). At least twenty-one different genomes have already been sequenced, including for example from M. genitalium (Fraser et al., Science 270: 397-403 (1995)), M. jannaschii (Bult et al., Science 23: 1058-73 ( 1996)), H. influenzae (Fleischmann et al., Science 269: 496-512 (1995)), E. coli (Blattner et al., Science 277: 1453-74 (1997)) and yeast (S. cerevisiae) (Mewes et al., Nature 387: 7-65 (1997)) and D. melanogaster (Adams et al., Science287: 2185-95 (2000)). Considerable progress has also been made in the sequencing of the genomes of model organisms, such as the mouse, C. elegansand Arabadopsis sp. Different organizations maintain several databases that contain annotated genomic information with some functional information and can be accessed through the Internet.

En algunas realizaciones, se utilizan los algoritmos BLAST y BLAST 2.0, los cuales se describen en Altschul et al., Nuc. Acids Res. 25:3389-3402, 1977 y Altschul et al., J. Mol. Biol. 215:403-410, 1990, respectivamente. El programa informático para llevar a cabo los análisis BLAST está disponible públicamente a través del National Center for Biotechnology Information. Este algoritmo implica primero identificar pares de secuencias con puntuación alta (HSPs) identificando palabras cortas de longitud W en la secuencia de consulta, que se emparejan o alcanzan algún umbral de puntaje T con un valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de la base de datos. T se refiere al umbral de puntaje de palabra cercana (Altschul et al., supra). Estos aciertos de palabra cercana iniciales actúan como semillas para iniciar búsquedas para encontrar HSPs más largas que los contengan. Los aciertos de palabras se extienden en ambos sentidos a lo largo de cada secuencia hasta el punto que pueda aumentarse el puntaje acumulado de alineación. Los puntajes acumulados se calculan utilizando, para secuencias de nucleótidos, los parámetros M (puntaje premio para un par de residuos que se emparejan; siempre >0). Para secuencias de aminoácidos, se utiliza una matriz de puntaje para calcular el puntaje acumulado. La extensión de los aciertos de palabras en cada sentido puede detenerse cuando: el puntaje acumulado de alineación decae a la cantidad X desde su valor máximo alcanzado; el puntaje acumulado cae hasta cero o por debajo, debido a la acumulación de una o más alineaciones residuales de puntaje negativo; o se alcanza el extremo de cualquiera de las secuencias. Los parámetros W, T y X del algoritmo BLAST determinan la sensibilidad y la velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) utiliza como valores predeterminados una longitud de palabra (W) de 11, una expectativa (E) de 10, M=5, N=−4 y una comparación de ambas cadenas. Para secuencias de aminoácidos, el programa BLASTP utiliza como valores predeterminados una longitud de palabra de 3 y expectativas (E) de 10 y la matriz de puntaje BLOSUM62 (ver Henikoff & Henikoff, Proc. Natl. Acad. Sci. Estados Unidos 89:10915, 1989) alineaciones (B) de 50, expectativa (E) de 10, M=5, N=−4 y una comparación de ambas cadenas. In some embodiments, the BLAST and BLAST 2.0 algorithms are used, which are described in Altschul et al., Nuc. Acids Res. 25: 3389-3402, 1977 and Altschul et al., J. Mol. Biol. 215: 403-410, 1990, respectively. The software for carrying out the BLAST analyzes is publicly available through the National Center for Biotechnology Information. This algorithm involves first identifying high-scoring sequence pairs (HSPs) by identifying short words of length W in the query sequence, which match or reach some T-score threshold with a positive value when aligned with a word of the same length. in a sequence in the database. T refers to the near word score threshold (Altschul et al., Supra). These initial close-word hits act as seeds to start searches to find longer HSPs that contain them. Word hits extend both ways throughout each sequence to the extent that the cumulative alignment score can be increased. Cumulative scores are calculated using, for nucleotide sequences, the M parameters (premium score for a pair of matched residues; always> 0). For amino acid sequences, a score matrix is used to calculate the cumulative score. The extension of the word hits in each direction can be stopped when: the accumulated alignment score falls to the quantity X from its maximum value reached; the cumulative score drops to zero or below, due to the accumulation of one or more residual negative score alignments; or the end of either sequence is reached. The BLAST algorithm parameters W, T, and X determine the sensitivity and speed of the alignment. The BLASTN program (for nucleotide sequences) uses as default values a word length (W) of 11, an expectation (E) of 10, M = 5, N = −4 and a comparison of both strings. For amino acid sequences, the BLASTP program uses as default values a word length of 3 and expectations (E) of 10 and the score matrix BLOSUM62 (see Henikoff & Henikoff, Proc. Natl. Acad. Sci. United States 89: 10915 , 1989) alignments (B) of 50, expectation (E) of 10, M = 5, N = −4 and a comparison of both chains.

El algoritmo BLAST también lleva a cabo un análisis estadístico de la similitud entre dos secuencias (ver Karlin & Altschul, Proc. Natl. Acad. Sci. Estados Unidos 90:5873, 1993). Una medida de similitud que proporciona el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), la cual proporciona un indicio de la probabilidad de que ocurra un emparejamiento al azar entre dos nucleótidos o aminoácidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba con el ácido nucleico de referencia es menor que aproximadamente 0,2. En algunas realizaciones menor que al menos aproximadamente 0,01 y en otras realizaciones menor que aproximadamente 0,001. The BLAST algorithm also performs statistical analysis of the similarity between two sequences (see Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90: 5873, 1993). A measure of similarity provided by the BLAST algorithm is the smallest sum probability (P (N)), which provides an indication of the probability of a random match occurring between two nucleotides or amino acids. For example, a nucleic acid is considered similar to a reference sequence if the smallest sum probability in a comparison of the test nucleic acid with the reference nucleic acid is less than about 0.2. In some embodiments less than at least about 0.01 and in other embodiments less than about 0.001.

En algunas realizaciones, las homologías secuenciales de proteínas y ácido nucleico se evalúan utilizando la Herramienta de Búsqueda de Alineación Local Básica (“BLAST”). Específicamente, se utilizan cinco programas BLAST específicos para llevar a cabo la siguiente tarea: In some embodiments, sequential protein and nucleic acid homologies are evaluated using the Basic Local Alignment Search Tool ("BLAST"). Specifically, five specific BLAST programs are used to accomplish the following task:

(1)(one)
BLASTP y BLAST3 comparan la secuencia de aminoácidos de consulta con una base de datos de secuencias de proteínas;  BLASTP and BLAST3 compare the query amino acid sequence with a database of protein sequences;

(2)(2)
BLASTN compara un secuencias de nucleótidos de consulta con una base de datos de secuencias de nucleótidos;  BLASTN compares a query nucleotide sequence to a nucleotide sequence database;

(3)(3)
BLASTX compara los productos de traducción conceptual de seis marcos de una secuencia de nucleótidos de consulta (ambas cadenas) con una base de datos de secuencias de proteínas;  BLASTX compares the conceptual translation products of six frames of a query nucleotide sequence (both strands) with a protein sequence database;

(4)(4)
TBLASTN compara una secuencia de proteína de consulta con una base de datos de secuencias de nucleótidos traducida en los seis marcos de lectura (ambas cadenas); y  TBLASTN compares a query protein sequence with a translated nucleotide sequence database in all six reading frames (both strands); and

(5)(5)
TBLASTX compara las traducciones en los seis marcos de una secuencia de nucleótidos de consulta con las traducciones en los seis marcos de una base de datos de secuencias de nucleótidos.  TBLASTX compares translations in all six frames of a query nucleotide sequence to translations in all six frames of a nucleotide sequence database.

Los programas BLAST identifican secuencias homólogas identificando segmentos similares, que se denominan en la presente “pares de segmento de puntaje alto”, entre una secuencia de aminoácidos o ácidos nucleicos de consulta y una secuencia de prueba que, en algunas realizaciones, se obtiene de una base de datos de secuencias de proteínas o ácidos nucleicos. Los pares de segmentos de puntaje alto, en algunas realizaciones, se identifican (es decir, alinean) mediante una matriz de puntaje, de la cual se conocen muchas en la técnica. En algunas realizaciones, la matriz de puntaje utilizada es la matriz BLOSUM62 (Gonnet (1992) Science 256:1443-1445; Henikoff and Henikoff (1993) Proteins 17:49-61). En algunas realizaciones, también se pueden utilizar las matrices PAM o PAM250 (ver Schwartz y Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Se puede acceder a los programas BLAST a través de la U.S. National Library of Medicine. BLAST programs identify homologous sequences by identifying similar segments, referred to herein as "high-scoring segment pairs", between a query amino acid or nucleic acid sequence and a test sequence which, in some embodiments, is derived from a nucleic acid or protein sequence database. The high scoring segment pairs, in some embodiments, are identified (ie, aligned) by a scoring matrix, many of which are known in the art. In some embodiments, the scoring matrix used is the BLOSUM62 matrix (Gonnet (1992) Science 256: 1443-1445; Henikoff and Henikoff (1993) Proteins 17: 49-61). In some embodiments, PAM or PAM250 matrices may also be used (see Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). BLAST programs can be accessed through the U.S. National Library of Medicine.

Los parámetros utilizados con los algoritmos mencionados anteriormente pueden adaptarse dependiendo de la longitud de secuencia y el grado de homología estudiados. En algunas realizaciones, los parámetros pueden ser los parámetros predeterminados utilizados por los algoritmos a falta de instrucciones del usuario. The parameters used with the aforementioned algorithms can be adapted depending on the sequence length and degree of homology studied. In some embodiments, the parameters may be the default parameters used by the algorithms in the absence of user instructions.

Sistemas informáticos y productos de programas informáticos Computer systems and software products

La divulgación describe ordenadores, sistemas informáticos, medios legibles por ordenador, productos de programas informáticos y similares en los cuales están grabadas o almacenadas las secuencias de ácidos nucleicos y polipéptidos divulgadas en la presente. Adicionalmente, al poner en práctica los métodos divulgados en la presente, tal como para determinar e identificar identidades secuenciales (para determinar si un ácido nucleico está dentro del alcance de acuerdo con la invención), homologías estructurales, motivos y similares in silico, se puede almacenar, grabar y manejar una secuencia de ácidos nucleicos o polipéptido divulgada en la presente en cualquier medio que pueda leerse o al cual se pueda acceder mediante un ordenador. The disclosure describes computers, computer systems, computer readable media, computer program products, and the like in which the nucleic acid and polypeptide sequences disclosed herein are recorded or stored. Additionally, by practicing the methods disclosed herein, such as to determine and identify sequential identities (to determine if a nucleic acid is within the scope of the invention), structural homologies, motifs, and the like in silico, one can store, record and handle a nucleic acid or polypeptide sequence disclosed herein in any medium that can be read or accessed by a computer.

Tal como se usan en la presente, los términos “grabado” y “almacenado” se refieren al proceso de almacenar información en un medio informático. Un experto puede adoptar fácilmente cualquier método conocido para grabar información en un medio legible por ordenador para generar productos que comprenden una o más secuencias de ácido nucleico y/o polipéptido divulgadas en la presente. Tal como se usan en la presente las expresiones y términos “ordenador”, “programa informático” y “procesador” se usan en sus contextos generales más amplios e incorporan todos los dispositivos que se describen en detalle más adelante. Una “secuencia codificadora de” o una “secuencia que codifica” un polipéptido o proteína específico, es una secuencia de ácidos nucleicos que puede transcribirse y traducirse a un polipéptido o proteína cuando se coloca bajo el control de secuencias reguladoras apropiadas. As used herein, the terms "recorded" and "stored" refer to the process of storing information on a computer medium. An expert can easily adopt any known method of recording information on a computer-readable medium to generate products comprising one or more nucleic acid and / or polypeptide sequences disclosed herein. As used herein, the terms and terms "computer", "computer program" and "processor" are used in their broader general contexts and incorporate all of the devices described in detail below. A "coding sequence for" or a "sequence encoding" a specific polypeptide or protein, is a nucleic acid sequence that can be transcribed and translated to a polypeptide or protein when placed under the control of appropriate regulatory sequences.

Los polipéptidos divulgados en la presente incluyen secuencias divulgadas en la presente y secuencias sustancialmente idénticas a las mismas y subsecuencias y fragmentos enzimáticamente activos de cualquiera de las secuencias precedentes. En algunas realizaciones, las secuencias de polipéptidos sustancialmente idénticas u homólogas se refieren a secuencia de polipéptidos que tiene al menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%o más, o total (100%) identidad secuencial (homología) con la secuencia divulgada en la presente. The polypeptides disclosed herein include sequences disclosed herein and sequences substantially identical thereto and enzymatically active subsequences and fragments of any of the preceding sequences. In some embodiments, substantially identical or homologous polypeptide sequences refer to polypeptide sequence having at least 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59 %, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, or total (100%) sequential identity (homology) with the sequence disclosed herein.

La homología (identidad secuencial) puede determinarse utilizando cualquiera de los programas informáticos y parámetros descritos en la presente. Una secuencia de ácidos nucleicos o polipéptido divulgada en la presente puede almacenarse, grabarse y manejarse en cualquier medio que pueda leerse o al cual se pueda acceder mediante un ordenador. Tal como se usan en la presente, los términos “grabado” y “almacenado” se refieren al proceso de almacenar información en un medio informático. Un experto puede adoptar fácilmente cualquiera de los métodos conocidos actualmente para grabar información en un medio legible por ordenador para generar productos que comprenden una o más de las secuencias de ácidos nucleicos divulgadas en la presente, una o más de las secuencias de polipéptidos divulgadas en la presente. Otra realización es un medio legible por ordenador que tiene grabadas al menos 2, 5, 10, 15 o 20 o más secuencias de ácidos nucleicos o polipéptidos divulgadas en la presente. Homology (sequential identity) can be determined using any of the computer programs and parameters described herein. A nucleic acid or polypeptide sequence disclosed herein can be stored, recorded, and handled in any medium that can be read or accessed by a computer. As used herein, the terms "recorded" and "stored" refer to the process of storing information on a computer medium. A skilled person can easily adopt any of the currently known methods for recording information on a computer readable medium to generate products comprising one or more of the nucleic acid sequences disclosed herein, one or more of the polypeptide sequences disclosed herein. Present. Another embodiment is a computer readable medium having at least 2, 5, 10, 15 or 20 or more nucleic acid or polypeptide sequences disclosed herein recorded.

Se describe además un medio legible por ordenador que tiene grabada una o más secuencias de ácidos nucleicos divulgadas en la presente. También se describe un medio legible por ordenador que tiene grabada una o más secuencias de polipéptidos divulgadas en la presente. También se divulga un medio legible por ordenador que tiene grabadas al menos 2, 5, 10, 15 o 20 o más de las secuencias de ácidos nucleicos o polipéptidos tal como se establecieron anteriormente. In addition, a computer readable medium is described having one or more nucleic acid sequences disclosed herein recorded. Also disclosed is a computer readable medium that has one or more polypeptide sequences disclosed herein recorded on it. Also disclosed is a computer readable medium having at least 2, 5, 10, 15 or 20 or more of the nucleic acid or polypeptide sequences recorded as set forth above.

Los medios legibles por ordenador incluyen medios legibles magnéticamente, medios legibles ópticamente, medios legibles electrónicamente y medios magnéticos/ópticos. Por ejemplo, los medios legibles por ordenador pueden ser un disco duro, un disco flexible, una cinta magnética, CD-ROM, disco versátil digital (DVD), memoria de acceso aleatorio (RAM) o memoria de solo lectura (ROM) así como también otros tipos de otros medios conocidos para los expertos en la técnica. Computer readable media includes magnetically readable media, optically readable media, electronically readable media, and magnetic / optical media. For example, computer-readable media can be a hard drive, floppy disk, magnetic tape, CD-ROM, digital versatile disc (DVD), random access memory (RAM), or read-only memory (ROM) as well as also other types of other means known to those skilled in the art.

También se divulgan sistemas (tales como sistemas en base a Internet), tales como sistemas informáticos que almacenan y manejan la información secuencial descrita en la presente. Un ejemplo de un sistema informático Systems (such as Internet-based systems), such as computer systems that store and manage the sequential information described herein, are also disclosed. An example of a computer system

100 se ilustra en formato de diagrama de bloques en la FIG. 9. Tal como se usa en la presente, “un sistema informático” se refiere a los componentes de equipo, a los componentes de programación y a los componentes de almacenamiento de datos utilizados para analizar una secuencia de nucleótidos de una secuencia de ácidos nucleicos divulgada en la presente o una secuencia de polipéptidos divulgada en la presente. En algunas realizaciones, el sistema informático 100 incluye un procesador para procesar, acceder y manejar datos de secuencias. El procesador 105 cualquier tipo conocido de unidad de central procesamiento, tal como, por ejemplo, el Pentium III de Intel Corporation o procesadores similares de Sun, Motorola, Compaq, AMD o International Business Machines. 100 is illustrated in block diagram format in FIG. 9. As used herein, "a computer system" refers to the equipment components, programming components, and data storage components used to analyze a nucleotide sequence of a nucleic acid sequence disclosed in the present or a polypeptide sequence disclosed herein. In some embodiments, computer system 100 includes a processor for processing, accessing, and handling sequence data. Processor 105 any known type of central processing unit, such as, for example, the Pentium III from Intel Corporation or similar processors from Sun, Motorola, Compaq, AMD or International Business Machines.

En algunas realizaciones, el sistema informático 100 es un sistema de uso general que comprende el procesador 105 y uno o más componentes de almacenamiento de datos internos 110 para almacenar datos y uno o más dispositivos de recuperación de datos para recuperar los datos almacenados en los componentes de almacenamiento de datos. Un experto puede apreciar fácilmente que cualquiera de los sistemas informáticos disponible actualmente es adecuado. In some embodiments, computer system 100 is a general-purpose system comprising processor 105 and one or more internal data storage components 110 for storing data and one or more data recovery devices for retrieving data stored in the components. data storage. An expert can easily appreciate that any of the currently available computer systems is adequate.

En una realización, el sistema informático 100 incluye un procesador 105 conectado a un bus que está conectado a una memoria principal 115 (en una realización implementada como RAM) y uno o más dispositivos de almacenamiento de datos internos 110, tales como un disco duro y/u otro medio legible por ordenador que tenga datos grabados en el mismo. En algunas realizaciones, el sistema informático 100 además incluye uno o más dispositivos de recuperación de datos 118 para leer los datos almacenados en los dispositivos de almacenamiento de datos internos 110. In one embodiment, the computer system 100 includes a processor 105 connected to a bus that is connected to a main memory 115 (in an embodiment implemented as RAM) and one or more internal data storage devices 110, such as a hard disk and / or another computer-readable medium that has data recorded on it. In some embodiments, computer system 100 further includes one or more data recovery devices 118 for reading data stored on internal data storage devices 110.

El dispositivo de recuperación de datos 118 puede representar, por ejemplo, una unidad de disco flexible, una unidad de disco compacto, una unidad de cinta magnética o un módem capaz de conectarse con un sistema de almacenamiento de datos remoto (tal como a través de Internet) etc. En algunas realizaciones, el dispositivo para almacenamiento de datos interno 110 es un medio legible por ordenador removible tal como un disco flexible, un disco compacto, una cinta magnética, etc. que contiene lógica de control y/o datos grabados en el mismo. El sistema informático 100 ventajosamente puede incluir o estar programado mediante un programa informático apropiado para leer la lógica de control y/o los datos del componente de almacenamiento de datos una vez que se inserta en el dispositivo de recuperación de datos. Data recovery device 118 may represent, for example, a floppy disk drive, a compact disk drive, a magnetic tape drive, or a modem capable of connecting to a remote data storage system (such as through Internet) etc. In some embodiments, the internal data storage device 110 is a removable computer readable medium such as a floppy disk, compact disc, magnetic tape, etc. that contains control logic and / or data recorded in it. The computer system 100 may advantageously include or be programmed by a suitable computer program to read the control logic and / or the data from the data storage component once it is inserted into the data recovery device.

El sistema informático 100 incluye una pantalla 120 que se utiliza para exhibir los datos de salida para el usuario del ordenador. Cabe mencionar además que el sistema informático 100 puede estar conectado a otros sistemas informáticos 125 a-c en una red o red de área extensa para proporcionar acceso centralizado al sistema informático The computer system 100 includes a screen 120 that is used to display the output data for the user of the computer. It should be further mentioned that the computer system 100 may be connected to other computer systems 125 a-c in a wide area network or network to provide centralized access to the computer system

100. 100.

El programa informático para acceder y procesar las secuencias de nucleótidos de una secuencia de ácidos nucleicos divulgadas en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma (tales como herramientas de búsqueda, herramientas de comparación y herramientas de modelado, etc.) pueden residir en la memoria principal 115 durante la ejecución. The computer program for accessing and processing the nucleotide sequences of a nucleic acid sequence disclosed herein and sequences substantially identical thereto or a polypeptide sequence disclosed herein and sequences substantially identical thereto (such as search tools , comparison tools, and modeling tools, etc.) may reside in main memory 115 during execution.

En algunas realizaciones, el sistema informático 100 puede comprender adicionalmente un algoritmo de comparación de secuencias para comparar una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma, almacenadas en un medio legible por ordenador con una secuencia(s) de nucleótidos o polipéptidos de referencia almacenada(s) en un medio legible por ordenador. Un “algoritmo de comparación de secuencias” se refiere a uno o más programas que se implementan (localmente o remotamente) en un sistema informático 100 para comparar una secuencia de nucleótidos con otras secuencias de nucleótidos y/o compuestos almacenados dentro de un medio de almacenamiento de datos. Por ejemplo, el algoritmo de comparación de secuencias puede comparar las secuencias de nucleótidos de una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma, almacenadas en un medio legible por ordenador con secuencias de referencia almacenadas en un medio legible por ordenador para identificar homologías o motivos estructurales. In some embodiments, computer system 100 may further comprise a sequence comparison algorithm for comparing a nucleic acid sequence disclosed herein and sequences substantially identical thereto or a polypeptide sequence disclosed herein and sequences substantially identical thereto. It is stored in a computer readable medium with a reference nucleotide or polypeptide sequence (s) stored in a computer readable medium. A "sequence comparison algorithm" refers to one or more programs that are implemented (locally or remotely) in a computer system 100 to compare a nucleotide sequence with other nucleotide and / or compound sequences stored within a storage medium of data. For example, the sequence comparison algorithm can compare the nucleotide sequences of a nucleic acid sequence disclosed herein and sequences substantially identical thereto or a polypeptide sequence disclosed herein and sequences substantially identical thereto, stored. on a computer readable medium with reference sequences stored on a computer readable medium to identify homologies or structural motifs.

La Figura 10 es un diagrama de flujo que ilustra una realización de un proceso 200 para comparar una secuencia nueva de nucleótidos o proteína con una base de datos de secuencias para determinar los niveles de homología entre la secuencia nueva y las secuencias en la base de datos. La base de datos de secuencias puede ser una base de datos privada almacenada dentro de un sistema informático 100 o una base de datos pública tal como GENBANK que está disponible a través de Internet. Figure 10 is a flowchart illustrating an embodiment of a process 200 for comparing a new nucleotide or protein sequence to a sequence database to determine levels of homology between the new sequence and the sequences in the database. . The sequence database may be a private database stored within a computer system 100 or a public database such as GENBANK that is available through the Internet.

El proceso 200 comienza en un estado inicial 201 y a continuación pasa a un estado 202 en donde la nueva secuencia que va a compararse se almacena en una memoria en un sistema informático 100. Tal como se trató anteriormente, la memoria podría ser cualquier tipo de memoria, incluida una RAM o un dispositivo de almacenamiento interno. Process 200 starts in an initial state 201 and then goes into a state 202 where the new sequence to be compared is stored in memory in a computer system 100. As discussed above, the memory could be any type of memory , including a RAM or an internal storage device.

A continuación el proceso 200 pasa a un estado 204 en donde se abre una base de datos de secuencias para llevar a cabo el análisis y comparación. Luego el proceso 200 pasa a un estado 206 en donde la primera secuencia almacenada en la base de datos se lee en una memoria en el ordenador. A continuación se lleva a cabo una comparación en un estado 210 para determinar si la primera secuencia es igual a la segunda secuencia. Cabe destacar que esta etapa no se limita a llevar a cabo una comparación exacta entre la secuencia nueva y la primera secuencia en la base de datos. Los expertos en la técnica conocen métodos para comparar dos secuencias de nucleótidos o proteínas, incluso si no son idénticas. Por ejemplo, se pueden introducir huecos en una secuencia para elevar el nivel de homología entre dos secuencias evaluadas. Los parámetros que controlan si se introducen huecos u otras características a una secuencia durante la comparación generalmente son ingresados por el usuario del sistema informático. The process 200 then enters a state 204 where a sequence database is opened to carry out the analysis and comparison. Then process 200 goes to a state 206 where the first sequence stored in the database is read from memory in the computer. A comparison is then carried out in a state 210 to determine if the first sequence equals the second sequence. It should be noted that this stage is not limited to carrying out an exact comparison between the new sequence and the first sequence in the database. Methods of comparing two nucleotide or protein sequences are known to those skilled in the art, even if they are not identical. For example, gaps can be introduced into a sequence to raise the level of homology between two evaluated sequences. Parameters that control whether gaps or other characteristics are introduced to a sequence during comparison are generally entered by the computer system user.

Una vez llevada a cabo la comparación de las dos secuencias en el estado 210, en el estado de decisión 210 se determina si las dos secuencias son iguales. Por supuesto, el término “igual” no está limitado a secuencias que son absolutamente idénticas. Las secuencias que están dentro de los parámetros de homología ingresados por el usuario se marcarán como “iguales” en el proceso 200. After the comparison of the two sequences in state 210 has been carried out, in decision state 210 it is determined whether the two sequences are the same. Of course, the term "equal" is not limited to sequences that are absolutely identical. Sequences that are within the homology parameters entered by the user will be marked as "equal" in process 200.

Si se determina que las dos secuencias son iguales, el proceso 200 pasa a un estado 214 en donde se exhibe al usuario el nombre de la secuencia de la base de datos. Este estado notifica al usuario que la secuencia con el nombre que se exhibe cumple con las restricciones de homología que se ingresaron. Una vez exhibido el nombre de la secuencia almacenada al usuario, el proceso 200 pasa a un estado de decisión 218 en donde se determina si existen más secuencias en la base de datos. Si no existen más secuencias en la base de datos, a continuación el proceso 200 finaliza en un estado final 220. Sin embargo, si existen más secuencias en la base de datos, a continuación el proceso 200 pasa a un estado 224 en donde se desplaza un señalador a la siguiente secuencia en la base de datos de forma que pueda compararse con la secuencia nueva. De esta forma, la secuencia nueva se alinea y compara con cada secuencia en la base de datos. If the two sequences are determined to be the same, process 200 goes to a state 214 where the sequence name of the database is displayed to the user. This status notifies the user that the sequence with the displayed name complies with the homology restrictions that were entered. Once the name of the stored sequence is displayed to the user, the process 200 goes to a decision state 218 where it is determined if there are more sequences in the database. If there are no more sequences in the database, then process 200 ends in a final state 220. However, if there are more sequences in the database, then process 200 goes to a state 224 where it shifts. a pointer to the next sequence in the database so that it can be compared to the new sequence. In this way, the new sequence is aligned and compared to each sequence in the database.

Cabe destacar que si en el estado de decisión 212 se determinó que las secuencias no son homólogas, a continuación el proceso 200 pasará inmediatamente al estado de decisión 218 para determinar si hay otras secuencias disponibles en la base de datos para hacer la comparación. It should be noted that if the sequences were determined to be non-homologous in decision state 212, then process 200 will immediately go to decision state 218 to determine if other sequences are available in the database for comparison.

Por consiguiente, se divulga un sistema informático que comprende un procesador, un dispositivo de almacenamiento de datos que tiene almacenado en el mismo una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma, un dispositivo de almacenamiento de datos que tiene almacenado en el mismo de forma recuperable secuencias de nucleótidos o secuencias de polipéptidos de referencia para compararlas con una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma y un comparador de secuencias para llevar a cabo la comparación. El comparador de secuencias puede indicar un nivel de homología entre las secuencias comparadas o identificar motivos estructurales en el código de ácido nucleico descrito anteriormente, una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma o puede identificar motivos estructurales en secuencias que se comparan con estos códigos de ácido nucleico y códigos de polipéptidos. En algunas realizaciones, el dispositivo de almacenamiento de datos puede tener almacenadas las secuencias de al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de las secuencias de ácidos nucleicos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas o las secuencias de polipéptidos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas. Accordingly, there is disclosed a computer system comprising a processor, a data storage device having stored therein a nucleic acid sequence disclosed herein and sequences substantially identical thereto or a polypeptide sequence disclosed herein. and sequences substantially identical thereto, a data storage device having recoverable nucleotide sequences or polypeptide sequences stored therein for comparison with a nucleic acid sequence disclosed herein and sequences substantially identical thereto. the same or a polypeptide sequence disclosed herein and sequences substantially identical thereto and a sequence comparator for carrying out the comparison. The sequence comparator can indicate a level of homology between the compared sequences or identify structural motifs in the nucleic acid code described above, a nucleic acid sequence disclosed herein and sequences substantially identical thereto, or a polypeptide sequence disclosed in the present and sequences substantially identical thereto or can identify structural motifs in sequences that are compared to these nucleic acid codes and polypeptide codes. In some embodiments, the data storage device may have stored sequences of at least 2, 5, 10, 15, 20, 25, 30, or 40 or more of the nucleic acid sequences disclosed herein and sequences substantially identical to the same or the polypeptide sequences disclosed herein and sequences substantially identical thereto.

También se divulga un método para determinar el nivel de homología entre una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma y una secuencia de nucleótidos de referencia. El método incluye leer el código de ácidos nucleicos o el código de polipéptidos y la secuencia de nucleótidos o polipéptidos de referencia a través del uso de un programa informático que determina los niveles de homología y determinar la homología entre el código de ácidos nucleicos o el código de polipéptidos y la secuencia de nucleótidos o polipéptidos de referencia con el programa informático. El programa informático puede ser cualquiera de varios programas informáticos para determinar niveles de homología, incluidos los indicados específicamente en la presente (tales como BLAST2N con los parámetros predeterminados o con cualesquiera parámetros modificados). El método puede implementarse utilizando los sistemas informáticos descritos anteriormente. El método también puede llevarse a cabo leyendo al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de las secuencias de ácidos nucleicos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas o las secuencias de polipéptidos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas a través del uso del programa informático y determinando la homología entre los códigos de ácidos nucleicos o códigos de polipéptidos y las secuencias de nucleótidos o secuencias polipéptidos de referencia. There is also disclosed a method of determining the level of homology between a nucleic acid sequence disclosed herein and sequences substantially identical thereto or a polypeptide sequence disclosed herein and sequences substantially identical thereto and a nucleotide sequence of reference. The method includes reading the nucleic acid code or polypeptide code and the reference nucleotide or polypeptide sequence through the use of a computer program that determines levels of homology and determining homology between the nucleic acid code or code. of polypeptides and the reference nucleotide or polypeptide sequence with the computer program. The computer program may be any of several computer programs for determining homology levels, including those specifically indicated herein (such as BLAST2N with predetermined parameters or with any modified parameters). The method can be implemented using the computer systems described above. The method can also be carried out by reading at least 2, 5, 10, 15, 20, 25, 30 or 40 or more of the nucleic acid sequences disclosed herein and sequences substantially identical thereto or the disclosed polypeptide sequences herein and sequences substantially identical thereto through the use of the computer program and determining homology between the nucleic acid codes or polypeptide codes and the reference nucleotide sequences or polypeptide sequences.

La Figura 11 es un diagrama de flujo que ilustra una realización de un proceso 250 en un ordenador para determinar si dos secuencias son homólogas. El proceso 250 comienza en un estado inicial 252 y a continuación pasa a un FIG. 11 is a flowchart illustrating an embodiment of a process 250 on a computer for determining whether two sequences are homologous. Process 250 starts in an initial state 252 and then goes to a

estado 254 en donde una primera secuencia que va a compararse se almacena en una memoria. A continuación se almacena la segunda secuencia que va a compararse en una memoria en un estado 256. Luego el proceso 250 pasa a un estado 260 en donde se lee el primer carácter en la primera secuencia y a continuación se pasa a un estado 262 en donde se lee el primer carácter de la segunda secuencia. Se entenderá que si la secuencia es una secuencia de nucleótidos, entonces el carácter será normalmente A, T, C, G o U. Si la secuencia es una secuencia de proteínas, entonces está en el código de aminoácidos de una sola letra de forma que la primera y la segunda secuencia pueden compararse fácilmente. state 254 where a first sequence to be compared is stored in memory. The second sequence to be compared is then stored in memory in a 256 state. Then process 250 goes to a state 260 where the first character is read in the first sequence and then goes to a state 262 where it is read the first character of the second sequence. It will be understood that if the sequence is a nucleotide sequence then the character will normally be A, T, C, G or U. If the sequence is a protein sequence then it is in the single letter amino acid code so that the first and second sequences can be easily compared.

A continuación se determina en un estado de decisión 264 si los dos caracteres son iguales. Si son iguales, entonces el proceso 250 pasa a un estado 268 en donde se leen los siguientes caracteres en la primera y segunda secuencia. Luego se determina si los siguientes caracteres son iguales. Si lo son, entonces el proceso 250 continúa este ciclo hasta que dos caracteres no sean iguales. Si se determina que los dos caracteres siguientes no son iguales, el proceso 250 pasa a un estado de decisión 274 para determinar si hay más caracteres para leer en las secuencias. Then it is determined in a decision state 264 whether the two characters are the same. If they are the same, then process 250 enters a state 268 where the following characters are read in the first and second sequences. Then it is determined whether the following characters are the same. If they are, then process 250 continues this cycle until two characters are not the same. If it is determined that the next two characters are not the same, process 250 goes into decision state 274 to determine if there are more characters to read in the sequences.

Si no hay más caracteres para leer, entonces el proceso 250 pasa a un estado 276 en donde se exhibe al usuario el nivel de homología entre la primera y segunda secuencia. El nivel de homología se determina calculando la proporción de caracteres iguales entre las secuencias con respecto a la cantidad total de secuencias en la primera secuencia. Por consiguiente, si cada carácter en una primera secuencia de 100 nucleótidos se alinease con cada carácter en una segunda secuencia, el nivel de homología sería 100%. If there are no more characters to read, then process 250 goes to a state 276 where the level of homology between the first and second sequences is displayed to the user. The homology level is determined by calculating the proportion of equal characters between the sequences with respect to the total number of sequences in the first sequence. Therefore, if each character in a first sequence of 100 nucleotides were aligned with each character in a second sequence, the level of homology would be 100%.

Alternativamente, el programa informático puede ser programa informático que compara las secuencias de nucleótidos de una secuencia de ácidos nucleico tal como se establece en la presente, con una o más secuencias de nucleótidos de referencia para determinar si el código de ácidos nucleicos divulgado en la presente y las secuencias sustancialmente idénticas a los mismos, difieren de una secuencia de ácidos nucleicos de referencia en una o más posiciones. Opcionalmente dicho programa registra la longitud e identidad de los nucleótidos insertados, eliminados o sustituidos con respecto a la secuencia de los polinucleótidos de referencia o una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma. En algunas realizaciones, el programa informático puede ser un programa que determina si una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma, contiene un polimorfismo en un solo nucleótido (SNP) con respecto a una secuencia de nucleótidos de referencia. Alternatively, the computer program may be a computer program that compares the nucleotide sequences of a nucleic acid sequence as set forth herein with one or more reference nucleotide sequences to determine whether the nucleic acid code disclosed herein. and the sequences substantially identical thereto differ from a reference nucleic acid sequence in one or more positions. Optionally said program records the length and identity of inserted, deleted or substituted nucleotides with respect to the sequence of the reference polynucleotides or a nucleic acid sequence disclosed herein and sequences substantially identical thereto. In some embodiments, the computer program may be a program that determines whether a nucleic acid sequence disclosed herein and sequences substantially identical thereto contain a single nucleotide polymorphism (SNP) with respect to a reference nucleotide sequence .

Por lo tanto, otra realización de la invención es un método para determinar si una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma, difieren en uno o más nucleótidos de una secuencia de nucleótidos de referencia que comprende las etapas de leer el código de ácidos nucleicos y la secuencia de nucleótidos de referencia a través del uso de un programa informático que identifica diferencias entre secuencias de ácidos nucleicos e identificar diferencias entre el código de ácidos nucleicos y la secuencia de nucleótidos de referencia con el programa informático. En algunas realizaciones, el programa informático es un programa que identifica polimorfismos en un solo nucleótido. El método puede implementarse mediante los sistemas informáticos descritos anteriormente y el método ilustrado en la Figura 11. El método también puede llevarse a cabo leyendo al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de las secuencias de ácidos nucleicos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas y las secuencias de nucleótidos de referencia a través del uso del programa informático e identificando diferencies entre los códigos de ácidos nucleicos y las secuencias de nucleótidos de referencia con el programa informático. Therefore, another embodiment of the invention is a method of determining whether a nucleic acid sequence disclosed herein and sequences substantially identical thereto differ by one or more nucleotides from a reference nucleotide sequence comprising the steps of read the nucleic acid code and the reference nucleotide sequence through the use of a computer program that identifies differences between nucleic acid sequences and identify differences between the nucleic acid code and the reference nucleotide sequence with the computer program. In some embodiments, the computer program is a program that identifies polymorphisms in a single nucleotide. The method can be implemented by the computer systems described above and the method illustrated in Figure 11. The method can also be carried out by reading at least 2, 5, 10, 15, 20, 25, 30 or 40 or more of the sequences of Nucleic acids disclosed herein and sequences substantially identical thereto and the reference nucleotide sequences through the use of the computer program and identifying differences between the nucleic acid codes and the reference nucleotide sequences with the computer program.

En otras realizaciones, el sistema en base a un ordenador puede comprender adicionalmente un identificador para identificar características en una secuencia de ácidos nucleicos divulgada en la presente o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a las mismas. Un “identificador” se refiere a uno o más programas que identifican ciertas características dentro de una secuencia de ácidos nucleicos divulgada en la presente o una secuencia de polipéptidos divulgada en la presente. En algunas realizaciones, el identificador puede comprender un programa que identifica un marco de lectura abierto en una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma. In other embodiments, the computer-based system may further comprise an identifier for identifying features in a nucleic acid sequence disclosed herein or a polypeptide sequence disclosed herein and sequences substantially identical thereto. An "identifier" refers to one or more programs that identify certain characteristics within a nucleic acid sequence disclosed herein or a polypeptide sequence disclosed herein. In some embodiments, the identifier may comprise a program that identifies an open reading frame in a nucleic acid sequence disclosed herein and sequences substantially identical thereto.

La Figura 12 es un diagrama de flujo que ilustra una realización de un proceso identificador 300 para detectar la presencia de una característica en una secuencia. El proceso 300 comienza en un estado inicial 302 y a continuación pasa a un estado 304 en donde una primera secuencia que va a verificarse para determinar sus características se almacena en una memoria 115 en el sistema informático 100. El proceso 300 a continuación pasa a un estado 306 en donde se abre una base de datos de características de secuencias. Dicha base de datos incluirá una lista cada atributo de las características junto con el nombre de la característica. Por ejemplo, un nombre de característica podría ser “Codón de iniciación” y el atributo sería “ATG”. Otro ejemplo sería el nombre de característica “secuencia TAATAA” y el atributo de la característica sería “TAATAA”. Un ejemplo de dicha base de datos es la producida por el University of Wisconsin Genetics Computer Group. Alternativamente, las características pueden ser motivos polipeptídicos estructurales tales como hélices alfa, láminas beta o motivos polipeptídicos funcionales tales como sitios activos enzimáticos, motivos hélice-giro-hélice u otros motivos conocidos para los expertos en la técnica. FIG. 12 is a flow chart illustrating an embodiment of an identifier process 300 for detecting the presence of a feature in a sequence. Process 300 starts in an initial state 302 and then goes into state 304 where a first sequence to be verified to determine its characteristics is stored in memory 115 in computer system 100. Process 300 then goes into a state 306 where a sequence characteristics database is opened. This database will include a list of each attribute of the characteristics together with the name of the characteristic. For example, a feature name could be "Initiation Codon" and the attribute would be "ATG". Another example would be the feature name "TAATAA sequence" and the feature attribute would be "TAATAA". An example of such a database is that produced by the University of Wisconsin Genetics Computer Group. Alternatively, the features may be structural polypeptide motifs such as alpha helices, beta sheets, or functional polypeptide motifs such as enzyme active sites, helix-gyro-helix motifs, or other motifs known to those skilled in the art.

Una vez abierta la base de datos de características en el estado 306, el proceso 300 pasa a un estado 308 en donde se lee la primera característica en la base de datos. A continuación se hace una comparación del atributo de la primera característica con la primera secuencia en el estado 310. Luego se determina en un estado de decisión 316 si el atributo de la característica se encontró en la primera secuencia. Si se encontró el atributo, entonces el proceso 300 pasa a un estado 318 en donde se exhibe al usuario el nombre de la característica encontrada. Once the feature database is opened in state 306, process 300 goes to state 308 where the first feature is read from the database. Next, a comparison is made of the attribute of the first characteristic with the first sequence in state 310. Then it is determined in a decision state 316 if the attribute of the characteristic was found in the first sequence. If the attribute was found, then process 300 goes to a state 318 where the name of the found feature is displayed to the user.

A continuación el proceso 300 pasa a un estado decisión 320 en donde se determina si existen más características en la base de datos. Si no existen más características, a continuación el proceso 300 finaliza en un estado final 324. Sin embargo, si existen más características en la base de datos, entonces el proceso 300 lee la siguiente característica de secuencia en un estado 326 y vuelve al estado 310 en donde el atributo de la siguiente característica se compara con la primera secuencia. Cabe señalar que si el atributo de característica no se encuentra en la primera secuencia en el estado de decisión 316, el proceso 300 pasa directamente al estado de decisión 320 para determinar si existen más características en la base de datos. The process 300 then enters a decision state 320 where it is determined whether there are more features in the database. If there are no more characteristics, then process 300 ends in a final state 324. However, if there are more characteristics in the database, then process 300 reads the next sequence characteristic in a state 326 and returns to state 310. where the attribute of the following characteristic is compared with the first sequence. It should be noted that if the feature attribute is not found in the first sequence in decision state 316, process 300 goes directly to decision state 320 to determine if there are more features in the database.

Por consiguiente, también se divulga un método para identificar una característica dentro de una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma, que comprende leer el código(s) de ácidos nucleicos o código(s) de polipéptidos a través del uso de un programa informático que identifica características en el/los mismo(s) e identificar características dentro del/los código(s) de ácidos nucleicos con el programa informático. En algunas realizaciones, el programa informático comprende un programa que identifica marcos de lectura abiertos. El método puede llevarse a cabo leyendo una sola secuencia o al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de las secuencias de ácidos nucleicos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas o las secuencias de polipéptidos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas, a través del uso del programa informático e identificando características dentro de los códigos de ácidos nucleicos o códigos de polipéptidos con el programa informático. Accordingly, there is also disclosed a method of identifying a characteristic within a nucleic acid sequence disclosed herein and sequences substantially identical thereto or a polypeptide sequence disclosed herein and sequences substantially identical thereto, comprising reading the nucleic acid code (s) or polypeptide code (s) through the use of a computer program that identifies features in it (s) and identify features within the nucleic acid code (s) with the computer program. In some embodiments, the computer program comprises a program that identifies open reading frames. The method can be carried out by reading a single sequence or at least 2, 5, 10, 15, 20, 25, 30 or 40 or more of the nucleic acid sequences disclosed herein and sequences substantially identical to the same or the sequences of polypeptides disclosed herein and sequences substantially identical thereto, through the use of the computer program and identifying features within the nucleic acid codes or polypeptide codes with the computer program.

Una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma, puede almacenarse y manejarse en varios programas de procesamiento de datos en una variedad de formatos. Por ejemplo, una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma, o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma, pueden almacenarse como un texto en un archivo de procesamiento de textos, tal como Microsoft WORD™ A nucleic acid sequence disclosed herein and sequences substantially identical thereto, or a polypeptide sequence disclosed herein and sequences substantially identical thereto, can be stored and managed in various data processing programs in a variety of formats. For example, a nucleic acid sequence disclosed herein and sequences substantially identical thereto, or a polypeptide sequence disclosed herein and sequences substantially identical thereto, may be stored as text in a word processing file, such as Microsoft WORD ™

o WORDPERFECT™ o como un archivo ASCII en una variedad de programas de bases de datos conocidos para los expertos en la técnica, tales como DB2™, SYBASE™ u ORACLE™. Además, se pueden usar muchos programas informáticos y bases de datos como algoritmos de comparación de secuencias, identificadores o fuentes de secuencias de nucleótidos o secuencias de polipéptidos de referencia para compararlas con una secuencia de ácidos nucleicos divulgada en la presente y secuencias sustancialmente idénticas a la misma o una secuencia de polipéptidos divulgada en la presente y secuencias sustancialmente idénticas a la misma. La siguiente lista no pretende limitar la divulgación, sino proporcionar orientación sobre programas y bases de datos que son útiles con las secuencias de ácidos nucleicos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas or WORDPERFECT ™ or as an ASCII file in a variety of database programs known to those of skill in the art, such as DB2 ™, SYBASE ™ or ORACLE ™. In addition, many computer programs and databases can be used as sequence comparison algorithms, nucleotide sequence identifiers or sources, or reference polypeptide sequences to compare with a nucleic acid sequence disclosed herein and sequences substantially identical to that. itself or a polypeptide sequence disclosed herein and sequences substantially identical thereto. The following list is not intended to limit disclosure, but to provide guidance on programs and databases that are useful with the nucleic acid sequences disclosed herein and sequences substantially identical thereto.

o las secuencias de polipéptidos divulgadas en la presente y secuencias sustancialmente idénticas a las mismas. or the polypeptide sequences disclosed herein and sequences substantially identical thereto.

Los programas y bases de datos que pueden utilizarse incluyen, a modo no taxativo: MACPATTERN™ (EMBL), DISCOVERYBASE™ (Molecular Applications Group), GENEMINE™ (Molecular Applications Group), LOOK™ (Molecular Applications Group), MACLOOK™ (Molecular Applications Group), BLAST y BLAST2 (NCBI), BLASTN y BLASTX (Altschul et al., J. Mol. Biol. 215: 403, 1990), FASTA (Pearson and Lipman, Proc. Natl. Acad. Sci. Estados Unidos, 85: 2444, 1988), FASTDB (Brutlag et al. Comp. App. Biosci. 6:237-245, 1990), CATALYST™ (Molecular Simulations Inc.), Catalyst/SHAPE™ (Molecular Simulations Inc.), Cerius2.DBAccess™ (Molecular Simulations Inc.), HYPOGEN™ (Molecular Simulations Inc.), INSIGHT II™, (Molecular Simulations Inc.), DISCOVER™ (Molecular Simulations Inc.), CHARMm™ (Molecular Simulations Inc.), FELIX™ (Molecular Simulations Inc.), DELPHI™, (Molecular Simulations Inc.), QuanteMM™, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), MODELER™ (Molecular Simulations Inc.), ISIS™ (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), la base de datos MDL Available Chemicals Directory, la base de datos MDL Drug Data Report, la base de datos Comprehensive Medicinal Chemistry, la base de datos World Drug Index de Derwents, la base de datos BioByteMasterFile, la base de datos Genbank y la base de datos Genseqn. Muchos otros programas y bases de datos serán evidentes para un experto en la técnica, dada la presente divulgación. Programs and databases that may be used include, but are not limited to: MACPATTERN ™ (EMBL), DISCOVERYBASE ™ (Molecular Applications Group), GENEMINE ™ (Molecular Applications Group), LOOK ™ (Molecular Applications Group), MACLOOK ™ (Molecular Applications Group), BLAST and BLAST2 (NCBI), BLASTN and BLASTX (Altschul et al., J. Mol. Biol. 215: 403, 1990), FASTA (Pearson and Lipman, Proc. Natl. Acad. Sci. United States, 85: 2444, 1988), FASTDB (Brutlag et al. Comp. App. Biosci. 6: 237-245, 1990), CATALYST ™ (Molecular Simulations Inc.), Catalyst / SHAPE ™ (Molecular Simulations Inc.), Cerius2. DBAccess ™ (Molecular Simulations Inc.), HYPOGEN ™ (Molecular Simulations Inc.), INSIGHT II ™, (Molecular Simulations Inc.), DISCOVER ™ (Molecular Simulations Inc.), CHARMm ™ (Molecular Simulations Inc.), FELIX ™ ( Molecular Simulations Inc.), DELPHI ™, (Molecular Simulations Inc.), QuanteMM ™, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), MODELER ™ (Molecular Simulations Inc.), ISIS ™ (Mo lecular Simulations Inc.), Quanta / Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc. ), the MDL Available Chemicals Directory database, the MDL Drug Data Report database, the Comprehensive Medicinal Chemistry database, the Derwents World Drug Index database, the BioByteMasterFile database, the Genbank database and the Genseqn database. Many other programs and databases will be apparent to one skilled in the art, given the present disclosure.

Los motivos que pueden detectarse utilizando los programas mencionados anteriormente incluyen secuencias que codifican cierres de leucina, motivos hélice-giro-hélice, sitios de glicosilación, sitios de ubiquitinación, hélices alfa y láminas beta, secuencias señal que codifican péptidos señal que dirigen la secreción de las proteínas codificadas, secuencias implicadas en la regulación de la transcripción tales como homeosecuencias, extensiones ácidas, sitios activos enzimáticos, sitios de unión a sustrato y sitios de escisión enzimática. Motifs that can be detected using the above-mentioned programs include sequences encoding leucine closures, helix-gyro-helix motifs, glycosylation sites, ubiquitination sites, alpha helices, and beta sheets, signal sequences encoding signal peptides that direct secretion of the encoded proteins, sequences involved in the regulation of transcription such as homeosequences, acidic extensions, enzymatic active sites, substrate binding sites and enzymatic cleavage sites.

Hibridación de ácidos nucleicos Nucleic Acid Hybridization

La divulgación proporciona ácidos nucleicos aislados, sintéticos o recombinantes que se hibridan en condiciones rigurosas con una secuencia divulgada en la presente, tal como SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:110, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 o SEQ ID NO:338. Las condiciones rigurosas pueden ser condiciones de extrema rigurosidad, condiciones de rigurosidad media y/o condiciones de rigurosidad baja, incluidas las condiciones de rigurosidad alta y reducida descritas en la presente. En algunas realizaciones, es la rigurosidad de las condiciones de lavado la que establece las condiciones que determinan si un ácido nucleico está divulgado en la presente, tal como se trata más adelante. The disclosure provides isolated, synthetic, or recombinant nucleic acids that hybridize under stringent conditions to a sequence disclosed herein, such as SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 110, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ I D NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO : 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283 , SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO : 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333 , SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 or SEQ ID NO: 338. The stringent conditions may be extreme stringency conditions, medium stringency conditions and / or low stringency conditions, including the low and high stringency conditions described herein. In some embodiments, it is the stringency of the wash conditions that establishes the conditions that determine whether a nucleic acid is disclosed herein, as discussed below.

“Hibridación” se refiere al proceso por el cual una cadena de ácido nucleico se une a una cadena complementaria a través de apareamiento de bases. Las reacciones de hibridación pueden ser sensibles y selectivas de forma que una secuencia específica de interés puede identificarse incluso en muestras en las que está en una concentración baja. Las condiciones adecuadamente rigurosas pueden definirse, por ejemplo, por las concentraciones de sal o formamida en las soluciones de prehibridación e hibridación o por la temperatura de hibridación y se conocen en la técnica. En otras realizaciones, la rigurosidad puede aumentarse reduciendo la concentración de sal, aumentando la concentración de formamida o elevando la temperatura de hibridación. En otras realizaciones, los ácidos nucleicos divulgados en la presente se definen por su capacidad para hibridarse en varias condiciones de rigurosidad (tales como alta, media y baja), tal como se establece en la presente. "Hybridization" refers to the process by which a nucleic acid chain binds to a complementary chain through base pairing. Hybridization reactions can be sensitive and selective so that a specific sequence of interest can be identified even in samples where it is at a low concentration. Suitably stringent conditions can be defined, for example, by the concentrations of salt or formamide in the prehybridization and hybridization solutions or by the hybridization temperature and are known in the art. In other embodiments, stringency can be increased by reducing the salt concentration, increasing the concentration of formamide, or by raising the hybridization temperature. In other embodiments, the nucleic acids disclosed herein are defined by their ability to hybridize under various stringency conditions (such as high, medium, and low), as set forth herein.

En algunas realizaciones, la hibridación en condiciones de rigurosidad alta comprende aproximadamente 50% de formamida a aproximadamente 37°C a 42°C. En algunas realizaciones, las condiciones de hibridación comprenden condiciones de rigurosidad baja en aproximadamente 35% a 25% de formamida a aproximadamente 30°C a 35°C. En algunas realizaciones, las condiciones de hibridación comprenden condiciones de rigurosidad alta, tales como a 42°C en 50% de formamida, 5×SSPE, 0,3% de SDS y 200 µg/ml de ADN de esperma de salmón cizallado y desnaturalizado. En algunas realizaciones, las condiciones de hibridación comprenden estas condiciones de rigurosidad reducida, pero en 35% de formamida a una temperatura reducida de 35°C. El rango de temperatura correspondiente a un nivel de rigurosidad específico puede estrecharse adicionalmente calculando la relación entre purina y pirimidina del ácido nucleico de interés y ajustando la temperatura en consecuencia. Las variaciones en los rangos y condiciones mencionados anteriormente se conocen en la técnica. In some embodiments, hybridization under high stringency conditions comprises about 50% formamide at about 37 ° C to 42 ° C. In some embodiments, the hybridization conditions comprise low stringency conditions in about 35% to 25% formamide at about 30 ° C to 35 ° C. In some embodiments, hybridization conditions comprise high stringency conditions, such as at 42 ° C in 50% formamide, 5 × SSPE, 0.3% SDS, and 200 µg / ml denatured, sheared salmon sperm DNA . In some embodiments, hybridization conditions comprise these conditions of reduced stringency, but in 35% formamide at a reduced temperature of 35 ° C. The temperature range corresponding to a specific stringency level can be further narrowed by calculating the ratio of purine to pyrimidine of the nucleic acid of interest and adjusting the temperature accordingly. Variations in the ranges and conditions mentioned above are known in the art.

En otras realizaciones, los ácidos nucleicos divulgados en la presente, según se definen por su capacidad para hibridarse en condiciones de rigurosidad, pueden tener entre aproximadamente cinco residuos y la longitud completa del ácido nucleico divulgado en la presente, de forma tal que pueden tener al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 o más residuos de longitud. También se incluyen los ácidos nucleicos más cortos que la longitud completa. Estos ácidos nucleicos pueden ser útiles, por ejemplo, como sondas de hibridación, sondas de etiquetado, sondas de oligonucleótidos para PCR, ARNsi o miARN (de una sola hebra o de doble hebra), antisentido o secuencias que codifican péptidos de unión a anticuerpos (epítopos), motivos, sitios activos y similares. In other embodiments, the nucleic acids disclosed herein, as defined by their ability to hybridize under stringent conditions, may have between about five residues and the full length of the nucleic acid disclosed herein, such that they may have at least minus 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500 , 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 or more residues in length. Nucleic acids shorter than full length are also included. These nucleic acids may be useful, for example, as hybridization probes, labeling probes, oligonucleotide probes for PCR, siRNA or miRNA (single-stranded or double-stranded), antisense, or sequences encoding antibody binding peptides ( epitopes), motifs, active sites and the like.

En algunas realizaciones, los ácidos nucleicos divulgados en la presente se definen por su capacidad para hibridarse en condiciones de rigurosidad que comprenden condiciones de aproximadamente 50% de formamida a aproximadamente 37°C a 42°C. En algunas realizaciones, los ácidos nucleicos divulgados en la presente se definen por su capacidad para hibridarse en condiciones de rigurosidad que comprenden condiciones en aproximadamente 35% a 25% de formamida a aproximadamente 30°C a 35°C. In some embodiments, the nucleic acids disclosed herein are defined by their ability to hybridize under stringent conditions comprising conditions of about 50% formamide at about 37 ° C to 42 ° C. In some embodiments, the nucleic acids disclosed herein are defined by their ability to hybridize under stringency conditions comprising conditions in about 35% to 25% formamide at about 30 ° C to 35 ° C.

Alternativamente, los ácidos nucleicos divulgados en la presente se definen por su capacidad para hibridarse en alta rigurosidad comprendiendo condiciones a 42°C en 50% de formamida, 5×SSPE, 0,3% de SDS y un ácido nucleico de bloqueo de secuencia repetitiva, tal como ADN cot-1 o de esperma de salmón (tal como 200 !g/ml de ADN de esperma de salmón cizallado y desnaturalizado). En algunas realizaciones, los ácidos nucleicos divulgados en la presente se definen por su capacidad para hibridarse en condiciones de rigurosidad reducida que comprenden 35% a 40% de formamida a una temperatura reducida de 35°C a 42°C. Alternatively, the nucleic acids disclosed herein are defined by their ability to hybridize in high stringency comprising conditions at 42 ° C in 50% formamide, 5 × SSPE, 0.3% SDS and a repetitive sequence blocking nucleic acid , such as cot-1 or salmon sperm DNA (such as 200 µg / ml denatured, sheared salmon sperm DNA). In some embodiments, the nucleic acids disclosed herein are defined by their ability to hybridize under conditions of reduced stringency comprising 35% to 40% formamide at a reduced temperature of 35 ° C to 42 ° C.

En reacciones de hibridación de ácidos nucleicos, las condiciones utilizadas para alcanzar un nivel específico de rigurosidad variarán dependiendo de la naturaleza de los ácidos nucleicos que se van a hibridar. Por ejemplo, se pueden tener en cuenta la longitud, el grado de complementariedad, la composición de la secuencia de nucleótidos (tal como contenido de GC con respecto a AT) y tipo de ácido nucleico (tal como ARN o ADN) de las regiones de hibridación de los ácidos nucleicos al seleccionar las condiciones de hibridación. Una consideración adicional es si uno de los ácidos nucleicos está inmovilizado, por ejemplo, en un filtro. In nucleic acid hybridization reactions, the conditions used to achieve a specific level of stringency will vary depending on the nature of the nucleic acids to be hybridized. For example, the length, degree of complementarity, nucleotide sequence composition (such as GC content relative to AT), and type of nucleic acid (such as RNA or DNA) of the regions can be considered. nucleic acid hybridization by selecting hybridization conditions. A further consideration is whether one of the nucleic acids is immobilized, for example, in a filter.

La hibridación puede llevarse a cabo en condiciones de rigurosidad baja, rigurosidad moderada o rigurosidad alta. Como ejemplo de hibridación de ácido nucleico, primero se prehibrida una membrana polimérica que contiene ácidos nucleicos desnaturalizados inmovilizados durante 30 minutos a 45°C en una solución que consiste en NaCl 0,9 M, 50 mM de NaH2PO4, pH 7,0, 5,0 mM de Na2EDTA, 0,5% de SDS, 10× de solución de Denhardt y 0,5 mg/ml de ácido polirriboadenílico. A continuación se agregan a la solución aproximadamente 2×107 cpm (actividad específica 4-9×108 cpm/!g) de sonda de nucleótidos etiquetada en el extremo con 32P. Después de 12-16 horas de incubación, se lava la membrana durante 30 minutos a temperatura ambiente en 1×SET (150 mM de NaCl, 20 mM de clorhidrato de Tris, pH 7,8, 1 mM de Na2EDTA) que contiene 0,5% de SDS, con un lavado posterior de 30 minutos en 1×SET nueva a Tf-10°C para la sonda de oligonucleótidos. A continuación la membrana se expone a una película autorradiográfica para detectar señales de hibridación. Todas las hibridaciones precedentes se considerarían hibridaciones en condiciones de rigurosidad alta. Hybridization can be carried out under conditions of low stringency, moderate stringency, or high stringency. As an example of nucleic acid hybridization, a polymeric membrane containing denatured nucleic acids immobilized for 30 minutes at 45 ° C in a solution consisting of 0.9M NaCl, 50mM NaH2PO4, pH 7.0.5 is first prehybridized. , 0 mM Na2EDTA, 0.5% SDS, 10 × Denhardt's solution and 0.5 mg / ml polyriboadenylic acid. Approximately 2 × 107 cpm (specific activity 4-9 × 108 cpm / µg) of 32P end-labeled nucleotide probe is then added to the solution. After 12-16 hours incubation, the membrane is washed for 30 minutes at room temperature in 1 × SET (150 mM NaCl, 20 mM Tris hydrochloride, pH 7.8, 1 mM Na2EDTA) containing 0, 5% SDS, with a subsequent 30 minute wash in a new 1 × SET at Tf-10 ° C for the oligonucleotide probe. The membrane is then exposed to an autoradiographic film to detect hybridization signals. All preceding hybridizations would be considered hybridizations under high stringency conditions.

Tras la hibridación, el filtro puede lavarse para eliminar cualquier sonda no unida específicamente detectable. También se puede variar la rigurosidad utilizada para lavar los filtros dependiendo de la naturaleza de los ácidos nucleicos que se van a hibridar, la longitud de los ácidos nucleicos que se van a hibridar, el grado de complementariedad, la composición de la secuencia de nucleótidos (tal como contenido de GC con respecto a AT) y el tipo de ácido nucleico (tal como ARN o ADN). A continuación figuran ejemplos de lavados en condiciones de rigurosidad progresivamente más altas: 2X SSC, 0,1% de SDS a temperatura ambiente durante 15 minutos (rigurosidad baja); 0,1X SSC, 0,5% de SDS a temperatura ambiente durante 30 minutos a 1 hora (rigurosidad moderada); 0,1X SSC, 0,5% de SDS durante 15 a 30 minutos entre la temperatura de hibridación y 68°C (rigurosidad alta); y NaCl 0,15M durante 15 minutos a 72°C (rigurosidad muy alta). Se puede llevar a cabo un lavado final de baja rigurosidad en 0,1X SSC a temperatura ambiente. Los ejemplos anteriores son meramente ilustrativos de una conjunto de condiciones que pueden utilizarse para lavar los filtros. Un experto en la técnica sabrá que existen numerosas recetas para lavados de rigurosidad diferentes. Más adelante se proporcionan otros ejemplos. After hybridization, the filter can be washed to remove any specifically detectable unbound probe. The stringency used to wash the filters can also be varied depending on the nature of the nucleic acids to be hybridized, the length of the nucleic acids to be hybridized, the degree of complementarity, the composition of the nucleotide sequence ( such as GC content relative to AT) and the type of nucleic acid (such as RNA or DNA). Following are examples of washes under progressively higher stringency conditions: 2X SSC, 0.1% SDS at room temperature for 15 minutes (low stringency); 0.1X SSC, 0.5% SDS at room temperature for 30 minutes to 1 hour (moderate stringency); 0.1X SSC, 0.5% SDS for 15 to 30 minutes between hybridization temperature and 68 ° C (high stringency); and 0.15M NaCl for 15 minutes at 72 ° C (very high stringency). A low stringency final wash can be carried out in 0.1X SSC at room temperature. The examples above are merely illustrative of a set of conditions that can be used to wash the filters. One of skill in the art will know that there are numerous recipes for different stringent washes. Other examples are provided below.

En algunas realizaciones, las condiciones de hibridación comprenden una etapa de lavado que comprende un lavado durante 30 minutos a temperatura ambiente en una solución que comprende 1×150 mM de NaCl, 20 mM de clorhidrato de Tris, pH 7,8, 1 mM de Na2EDTA, 0,5% de SDS, con un lavado posterior de 30 minutos en solución nueva. In some embodiments, the hybridization conditions comprise a washing step comprising washing for 30 minutes at room temperature in a solution comprising 1 × 150 mM NaCl, 20 mM Tris hydrochloride, pH 7.8, 1 mM of Na2EDTA, 0.5% SDS, with a subsequent 30 minute wash in fresh solution.

Los ácidos nucleicos que se hibridaron con la sonda se identifican mediante autorradiografía u otras técnicas convencionales. Nucleic acids that hybridized to the probe are identified by autoradiography or other conventional techniques.

Los procedimientos precedentes pueden modificarse para identificar ácidos nucleicos que tienen niveles reducidos de identidad secuencial (homología) con la secuencia de la sonda. Por ejemplo, para obtener ácidos nucleicos de identidad secuencial (homología) reducida con respecto a la sonda detectable, se pueden usar condiciones menos rigurosas. Por ejemplo, la temperatura de hibridación puede reducirse en incrementos de 5°C de 68°C a 42°C en una solución amortiguadora de hibridación que tiene una concentración de Na+ de aproximadamente 1M. Tras la hibridación, el filtro puede lavarse con 2X SSC, 0,5% de SDS a la temperatura de hibridación. Estas condiciones se consideran que son condiciones “moderadas” por encima de 50°C y condiciones “bajas” por debajo de 50°C. Un ejemplo específico de condiciones de hibridación “moderadas” es cuando la hibridación se lleva a cabo a 55°C. Un ejemplo específico de condiciones de hibridación “de rigurosidad baja” es cuando la hibridación anterior se lleva a cabo a 45°C. The foregoing procedures can be modified to identify nucleic acids that have reduced levels of sequential identity (homology) with the probe sequence. For example, to obtain nucleic acids of reduced sequential identity (homology) relative to the detectable probe, less stringent conditions can be used. For example, the hybridization temperature can be reduced in 5 ° C increments from 68 ° C to 42 ° C in a hybridization buffer solution that has a Na + concentration of approximately 1M. After hybridization, the filter can be washed with 2X SSC, 0.5% SDS at the hybridization temperature. These conditions are considered to be "moderate" conditions above 50 ° C and "low" conditions below 50 ° C. A specific example of "moderate" hybridization conditions is when hybridization is carried out at 55 ° C. A specific example of "low stringency" hybridization conditions is when the above hybridization is carried out at 45 ° C.

De forma alternativa, la hibridación puede llevarse a cabo en soluciones amortiguadoras, tales como 6X SSC que contiene formamida a una temperatura de 42°C. En este caso, la concentración de formamida en la solución Alternatively, hybridization can be carried out in buffers, such as 6X SSC containing formamide at a temperature of 42 ° C. In this case, the concentration of formamide in the solution

amortiguadora de hibridación puede reducirse en incrementos de 5% de 50% a 0% para identificar clones que tienen niveles reducidos de homología con la sonda. Tras la hibridación, el filtro puede lavarse con 6X SSC, 0,5% de SDS a 50°C. Estas condiciones se consideran que son condiciones “moderadas” por encima de 25% de formamida y condiciones “bajas” por debajo de 25% de formamida. Un ejemplo específico de condiciones de hibridación “moderadas” es cuando la hibridación se lleva a cabo a 30% de formamida. Un ejemplo específico de condiciones de hibridación “de rigurosidad baja” es cuando la hibridación anterior se lleva a cabo a 10% de formamida. Hybridization buffer can be reduced in 5% increments from 50% to 0% to identify clones that have reduced levels of homology with the probe. After hybridization, the filter can be washed with 6X SSC, 0.5% SDS at 50 ° C. These conditions are considered to be "moderate" conditions above 25% formamide and "low" conditions below 25% formamide. A specific example of "moderate" hybridization conditions is when hybridization is carried out at 30% formamide. A specific example of "low stringency" hybridization conditions is when the above hybridization is carried out at 10% formamide.

Sin embargo, la selección de un formato de hibridación puede no ser esencial - la rigurosidad de las condiciones de lavado es la que establece las condiciones que determinan si un ácido nucleico está dentro del alcance de la divulgación. Las condiciones de lavado utilizadas para identificar ácidos nucleicos dentro del alcance de acuerdo con la invención incluyen, por ejemplo: una concentración de sal de aproximadamente NaCl 0,15 M a 72°C durante aproximadamente 15 minutos. Ver Sambrook ed., MOLECULAR CLONING: A LABORATORY MANUAL (2a ed.), tomos 1-3, Cold Spring Harbor Laboratory (1989), LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Parte I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993) y Ausubel, ed. John Wiley & Sons, Inc., Nueva York (1997) para obtener una descripción de la solución amortiguadora SSC y condiciones equivalentes. However, the selection of a hybridization format may not be essential - the stringency of the wash conditions is what establishes the conditions that determine whether a nucleic acid is within the scope of the disclosure. The washing conditions used to identify nucleic acids within the scope of the invention include, for example: a salt concentration of about 0.15 M NaCl at 72 ° C for about 15 minutes. See Sambrook ed., MOLECULAR CLONING: A LABORATORY MANUAL (2nd ed.), Volumes 1-3, Cold Spring Harbor Laboratory (1989), LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993) and Ausubel, ed. John Wiley & Sons, Inc., New York (1997) for a description of the SSC buffer solution and equivalent conditions.

Estos métodos pueden utilizarse para aislar o identificar ácidos nucleicos divulgados en la presente y las secuencias sustancialmente idénticas a los mismos. Por ejemplo, los métodos precedentes pueden utilizarse para aislar o identificar ácidos nucleicos que tienen una secuencia con al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más identidad secuencial (homología) con una secuencia de ácidos nucleicos seleccionada del grupo que consiste en una de las secuencias divulgadas en la presente y secuencias sustancialmente idénticas a las mismas o fragmentos que comprenden al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 bases consecutivas de las mismas y las secuencias complementarias a las mismas. La identidad secuencial (homología) puede medirse utilizando el algoritmo de alineación. Por ejemplo, los polinucleótidos homólogos pueden tener una secuencia codificadora que es una variante alélica de origen natural de una de las secuencias codificadoras descritas en la presente. Dichas variantes alélicas pueden tener una sustitución, eliminación o adición de uno o más nucleótidos cuando se comparan con los ácidos nucleicos divulgados en la presente. Adicionalmente, los procedimientos mencionados anteriormente pueden utilizarse para aislar ácidos nucleicos que codifican polipéptidos que tienen al menos aproximadamente 99%, 95%, al menos 90%, al menos 85%, al menos 80%, al menos 75%, al menos 70%, al menos 65%, al menos 60%, al menos 55% o al menos 50% de identidad secuencial (homología) con un polipéptido divulgado en la presente o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de los mismos tal como se determina utilizando un algoritmo de alineación de secuencias (tal como el algoritmo FASTA versión 3.0t78 con los parámetros predeterminados). These methods can be used to isolate or identify nucleic acids disclosed herein and the sequences substantially identical thereto. For example, the foregoing methods can be used to isolate or identify nucleic acids that have a sequence of at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59 %, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequential identity (homology) with a nucleic acid sequence selected from the group consisting of one of the sequences disclosed herein and sequences substantially identical to the same or fragments comprising at least about 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 or 500 consecutive bases thereof and the complementary sequences to them. Sequential identity (homology) can be measured using the alignment algorithm. For example, homologous polynucleotides may have a coding sequence that is a naturally occurring allelic variant of one of the coding sequences described herein. Such allelic variants can have a substitution, deletion or addition of one or more nucleotides when compared to the nucleic acids disclosed herein. Additionally, the aforementioned procedures can be used to isolate nucleic acids encoding polypeptides having at least about 99%, 95%, at least 90%, at least 85%, at least 80%, at least 75%, at least 70% , at least 65%, at least 60%, at least 55% or at least 50% sequential identity (homology) with a polypeptide disclosed herein or fragments comprising at least 5, 10, 15, 20, 25, 30 , 35, 40, 50, 75, 100 or 150 consecutive amino acids thereof as determined using a sequence alignment algorithm (such as the FASTA version 3.0t78 algorithm with predetermined parameters).

Sondas de oligonucleótidos y métodos para utilizarlas Oligonucleotide probes and methods of using them

La divulgación también proporciona sondas de ácidos nucleicos que pueden utilizarse, por ejemplo, para identificar, amplificar o aislar ácidos nucleicos que codifican un polipéptido que tiene actividad enzimática de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG o fragmentos del mismo o para identificar genes de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. En algunos ejemplos, la sonda comprende al menos aproximadamente 10 bases consecutivas de un ácido nucleico divulgado en la presente. Alternativamente, una sonda divulgada en la presente puede tener al menos aproximadamente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 o aproximadamente 10 a 50, aproximadamente 20 a 60, aproximadamente 30 a 70 bases consecutivas de una secuencia tal como se establece en un ácido nucleico divulgado en la presente. Las sondas identifican un ácido nucleico mediante unión y/o hibridación. Las sondas pueden utilizarse en arreglos divulgados en la presente, ver la descripción más adelante, incluidos arreglos capilares. Las sondas divulgadas en la presente además pueden utilizarse para aislar otros ácidos nucleicos o polipéptidos. The disclosure also provides nucleic acid probes that can be used, for example, to identify, amplify, or isolate nucleic acids that encode a polypeptide that has enzymatic activity of aldolase, such as pyruvate aldolase, such as HMG and / or KHG, or fragments thereof. or to identify aldolase enzyme genes, such as pyruvate aldolase, such as HMG and / or KHG aldolase. In some examples, the probe comprises at least about 10 consecutive bases of a nucleic acid disclosed herein. Alternatively, a probe disclosed herein can have at least about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 , 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 or approximately 10 to 50, approximately 20 to 60, approximately 30 to 70 consecutive bases of a sequence as set forth in a nucleic acid disclosed herein. Probes identify a nucleic acid by binding and / or hybridization. Probes can be used in arrays disclosed herein, see description below, including capillary arrays. The probes disclosed herein can further be used to isolate other nucleic acids or polypeptides.

Los ácidos nucleicos aislados, sintéticos o recombinantes divulgados en la presente, las secuencias complementarias a los mismos o un fragmento que comprende al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 bases consecutivas de una de las secuencias divulgadas en la presente o las secuencias complementarias a las mismas también pueden utilizarse como sondas para determinar si una muestra biológica, tal como una muestra de aceite, contiene un organismo que tiene una secuencia de ácidos nucleicos divulgada en la presente o un organismo del cual se obtuvo el ácido nucleico. En dichos procedimientos, se obtiene una muestra biológica que potencialmente está albergando el organismo del cual se aisló el ácido nucleico y se obtienen ácidos nucleicos de la muestra. Los ácidos nucleicos se ponen en contacto con la sonda en condiciones que permiten que la sonda se hibride específicamente con cualquier secuencia complementaria de las que están presentes en la misma. The isolated, synthetic or recombinant nucleic acids disclosed herein, the sequences complementary thereto or a fragment comprising at least about 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200 , 300, 400 or 500 consecutive bases of one of the sequences disclosed herein or sequences complementary thereto can also be used as probes to determine whether a biological sample, such as an oil sample, contains an organism having a sequence nucleic acid disclosed herein or an organism from which nucleic acid was obtained. In such procedures, a biological sample is obtained that is potentially harboring the organism from which the nucleic acid was isolated, and nucleic acids are obtained from the sample. Nucleic acids are contacted with the probe under conditions that allow the probe to specifically hybridize to any sequence complementary to those present therein.

Cuando sea necesario, se pueden determinar las condiciones que permiten que la sonda se hibride específicamente con secuencias complementarias poniendo en contacto la sonda con secuencias complementarias de muestras que When necessary, conditions that allow the probe to specifically hybridize to complementary sequences can be determined by contacting the probe with complementary sequences from samples that

se sabe que contienen la secuencia complementaria así como también con secuencias testigo que no tienen la secuencia complementaria. Las condiciones de hibridación, tales como la concentración de sal de la solución amortiguadora de hibridación, la concentración de formamida de la solución amortiguadora de hibridación o la temperatura de hibridación pueden variarse para identificar condiciones que permiten que la sonda se hibride específicamente con ácidos nucleicos complementarios. they are known to contain the complementary sequence as well as control sequences that do not have the complementary sequence. Hybridization conditions, such as the salt concentration of the hybridization buffer, the concentration of formamide in the hybridization buffer, or the hybridization temperature can be varied to identify conditions that allow the probe to hybridize specifically with complementary nucleic acids .

Si la muestra contiene el organismo del cual se aisló el ácido nucleico, a continuación se detecta la hibridación específica de la sonda. La hibridación puede detectarse etiquetando la sonda con un agente detectable tal como un isótopo radioactivo, un tinte fluorescente o una enzima capaz de catalizar la formación de un producto detectable. If the sample contains the organism from which the nucleic acid was isolated, then specific probe hybridization is detected. Hybridization can be detected by labeling the probe with a detectable agent such as a radioactive isotope, a fluorescent dye, or an enzyme capable of catalysing the formation of a detectable product.

Los expertos en la técnica conocen muchos métodos para utilizar las sondas etiquetadas para detectar la presencia de ácidos nucleicos complementarios en una muestra. Estos incluyen Transferencias Southern, Transferencias Northern, procedimientos de hibridación de colonias y transferencias en mancha. Se proporcionan protocolos para cada uno de estos procedimientos en Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Many methods are known to those skilled in the art for using the labeled probes to detect the presence of complementary nucleic acids in a sample. These include Southern Blots, Northern Blots, colony hybridization procedures, and blot blots. Protocols for each of these procedures are provided in Ausubel et al. Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 and Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989).

Alternativamente, se puede utilizar más de una sonda (al menos una que es capaz de hibridarse específicamente con cualquier secuencia complementaria que está presente en la muestra de ácido nucleico), en una reacción de amplificación para determinar si la muestra contiene un organismo que contiene una secuencia de ácidos nucleicos divulgada en la presente (tal como un organismo del cual se aisló el ácido nucleico). En algunas realizaciones, las sondas comprenden oligonucleótidos. En algunas realizaciones, la reacción de amplificación puede comprender una reacción PCR. Los protocolos de PCR se describen en Ausubel y Sambrook, supra. Alternativamente, la amplificación puede comprender una reacción en cadena de ligasa, 3SR o una reacción de desplazamiento de cadena. (Ver Barany, F., “The Ligase Chain Reaction in a PCR World”, PCR Methods and Applications 1:5-16, 1991; Alternatively, more than one probe (at least one that is capable of specifically hybridizing to any complementary sequence that is present in the nucleic acid sample) can be used in an amplification reaction to determine if the sample contains an organism that contains a nucleic acid sequence disclosed herein (such as an organism from which nucleic acid was isolated). In some embodiments, the probes comprise oligonucleotides. In some embodiments, the amplification reaction may comprise a PCR reaction. PCR protocols are described in Ausubel and Sambrook, supra. Alternatively, the amplification may comprise a ligase chain reaction, 3SR, or a chain displacement reaction. (See Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1: 5-16, 1991;

E. Fahy et al., “Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR”, PCR Methods and Applications 1:25-33, 1991; y Walker G. T. et al., “Strand Displacement Amplification—an Isothermal in vitro DNA Amplification Technique”, Nucleic Acid Research 20:1691-1696, 1992). En dichos procedimientos, los ácidos nucleicos en la muestra se ponen en contacto con las sondas, se lleva a cabo la reacción de amplificación y se detecta cualquier producto de amplificación resultante. El producto de amplificación puede detectarse llevando a cabo electrofóresis en gel en los productos de reacción y tiñendo el gel con un intercalador tal como bromuro de etidio. Alternativamente, una o más de las sondas pueden etiquetarse con un isótopo radioactivo y la presencia de un producto de amplificación radioactivo puede detectarse mediante autorradiografía después de la electrofóresis en gel. E. Fahy et al., "Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1: 25-33, 1991; and Walker G. T. et al., "Strand Displacement Amplification — an Isothermal in vitro DNA Amplification Technique", Nucleic Acid Research 20: 1691-1696, 1992). In such procedures, the nucleic acids in the sample are contacted with the probes, the amplification reaction is carried out, and any resulting amplification products are detected. The amplification product can be detected by performing gel electrophoresis on the reaction products and staining the gel with an intercalator such as ethidium bromide. Alternatively, one or more of the probes can be labeled with a radioactive isotope and the presence of a radioactive amplification product can be detected by autoradiography after gel electrophoresis.

Las sondas derivadas de secuencias próximas a los extremos de las secuencias divulgadas en la presente también pueden utilizarse en procedimientos de desplazamiento sobre el cromosoma para identificar clones que contienen secuencias genómicas adyacentes a las secuencias divulgadas en la presente. Dichos métodos permiten el aislamiento de genes que codifican proteínas adicionales del organismo huésped. Probes derived from sequences near the ends of the sequences disclosed herein can also be used in chromosome displacement procedures to identify clones containing genomic sequences adjacent to the sequences disclosed herein. Such methods allow the isolation of genes encoding additional proteins from the host organism.

En algunas realizaciones, los ácidos nucleicos aislados, sintéticos o recombinantes divulgados en la presente, las secuencias complementarias a los mismos o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 o más bases consecutivas de una de las secuencias divulgadas en la presente o las secuencias complementarias a las mismas se utilizan como sondas para identificar y aislar ácidos nucleicos relacionados. En algunas realizaciones, los ácidos nucleicos relacionados pueden ser ADNc o ADN genómicos de organismos distintos al organismo de cual se aisló el ácido nucleico. Por ejemplo, los otros organismos pueden ser organismos relacionados. En dichos procedimientos, una muestra de ácido nucleico se pone en contacto con la sonda en condiciones que permiten que la sonda se hibride específicamente con secuencias relacionadas. La hibridación de la sonda con los ácidos nucleicos del organismo relacionado a continuación se detecta utilizando cualquiera de los métodos descritos anteriormente. In some embodiments, the isolated, synthetic, or recombinant nucleic acids disclosed herein, the sequences complementary thereto, or a fragment comprising at least 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 or 500 or more consecutive bases of one of the sequences disclosed herein or sequences complementary thereto are used as probes to identify and isolate related nucleic acids. In some embodiments, the related nucleic acids can be genomic cDNAs or DNAs from organisms other than the organism from which the nucleic acid was isolated. For example, the other organisms may be related organisms. In such procedures, a nucleic acid sample is contacted with the probe under conditions that allow the probe to specifically hybridize to related sequences. Hybridization of the probe with the nucleic acids of the organism listed below is detected using any of the methods described above.

Al variar la rigurosidad de las condiciones de hibridación utilizadas para identificar ácidos nucleicos, tales como ADNc o ADN genómicos, los cuales se hibridan con las sondas detectables, se pueden identificar y aislar los ácidos nucleicos que tienen diferentes niveles de homología con la sonda. La rigurosidad puede variarse llevando a cabo la hibridación a temperaturas variables por debajo de las temperaturas de fusión de las sondas. La temperatura de fusión, Tf, es la temperatura (a fuerza iónica y pH definidos) en la cual el 50% de la secuencia objetivo se hibrida con una sonda perfectamente complementaria. Las condiciones muy rigurosas se seleccionan a aproximadamente 5°C menos o igual que la Tf para una sonda específica. La temperatura de fusión de la sonda puede calcularse utilizando las siguientes fórmulas: By varying the stringency of the hybridization conditions used to identify nucleic acids, such as cDNAs or genomic DNAs, which hybridize to detectable probes, nucleic acids that have different levels of homology to the probe can be identified and isolated. The stringency can be varied by carrying out the hybridization at temperatures varying below the melting temperatures of the probes. The melting temperature, Tf, is the temperature (at defined ionic strength and pH) at which 50% of the target sequence hybridizes with a perfectly complementary probe. Very stringent conditions are selected at about 5 ° C less than or equal to Tf for a specific probe. The melting temperature of the probe can be calculated using the following formulas:

Para sondas de entre 14 y 70 nucleótidos de longitud, la temperatura de fusión (Tf) se calcula utilizando la fórmula: Tf=81,5+16,6(log [Na+])+0,41(fracción G+C)−(600/N) donde N es la longitud de la sonda. For probes between 14 and 70 nucleotides in length, the fusion temperature (Tf) is calculated using the formula: Tf = 81.5 + 16.6 (log [Na +]) + 0.41 (fraction G + C) - (600 / N) where N is the length of the probe.

Si la hibridación se lleva a cabo en una solución que contiene formamida, la temperatura de fusión puede calcularse utilizando la ecuación: Tf=81,5+16,6(log [Na+])+0,41(fracción G+C)−(0,63% formamida)−(600/N) donde N es la longitud de la sonda. If hybridization is carried out in a solution containing formamide, the melting temperature can be calculated using the equation: Tf = 81.5 + 16.6 (log [Na +]) + 0.41 (fraction G + C) - (0.63% formamide) - (600 / N) where N is the length of the probe.

La prehibridación puede llevarse a cabo en 6X SSC, 5× de reactivo de Denhardt, 0,5% de SDS, 100 !g/ml de ADN de esperma de salmón desnaturalizado fragmentado o 6X SSC, 5× de reactivo de Denhardt, 0,5% de SDS, 100 !g/ml de ADN de esperma de salmón desnaturalizado fragmentado, 50% de formamida. Las fórmulas de las soluciones SSC y de Denhardt se indican en Sambrook et al., supra. Prehybridization can be performed in 6X SSC, 5 × Denhardt's reagent, 0.5% SDS, 100 µg / ml fragmented denatured salmon sperm DNA, or 6X SSC, 5 × Denhardt's reagent, 0, 5% SDS, 100 µg / ml fragmented denatured salmon sperm DNA, 50% formamide. The formulas for the SSC and Denhardt solutions are indicated in Sambrook et al., Supra.

En algunas realizaciones, la hibridación se lleva a cabo agregando la sonda detectable en las soluciones de prehibridación indicadas anteriormente. Cuando la sonda comprende ADN de doble hebra, el mismo se desnaturaliza antes de la adición de la solución de hibridación. En algunas realizaciones, el filtro se pone en contacto con la solución de hibridación durante un período de tiempo suficiente para permitir que la sonda se hibride con los ADNc o ADN genómicos que contienen secuencias complementarias a la misma o homólogas a la misma. Para sondas con más de 200 nucleótidos de longitud, la hibridación puede llevarse a cabo a 15-25°C por debajo de la Tf. Para sondas más cortas, tales sondas de oligonucleótidos, la hibridación puede llevarse a cabo a 5-10°C por debajo de la Tf. En algunas realizaciones, para hibridaciones en 6X SSC, la hibridación se lleva a cabo a aproximadamente 68°C. Generalmente, para hibridaciones en soluciones que contienen 50% de formamida, la hibridación se lleva a cabo a aproximadamente 42°C. In some embodiments, hybridization is accomplished by adding the detectable probe into the prehybridization solutions noted above. When the probe comprises double-stranded DNA, it is denatured before the addition of the hybridization solution. In some embodiments, the filter is contacted with the hybridization solution for a period of time sufficient to allow the probe to hybridize to genomic cDNAs or DNAs containing sequences complementary to or homologous to it. For probes over 200 nucleotides in length, hybridization can be carried out at 15-25 ° C below Tf. For shorter probes, such oligonucleotide probes, hybridization can be carried out at 5-10 ° C below Tf. In some embodiments, for 6X SSC hybridizations, hybridization is carried out at approximately 68 ° C. Generally, for hybridizations in solutions containing 50% formamide, hybridization is carried out at approximately 42 ° C.

Inhibición de la expresión de enzimas aldolasas Inhibition of the expression of aldolase enzymes

La divulgación proporciona ácidos nucleicos complementarios (tales como secuencias antisentido) a los ácidos nucleicos divulgados en la presente, tales como ácidos nucleicos que codifican enzimas aldolasas, tales como ácidos nucleicos que comprenden antisentido, ARNsi, miARN y ribozimas. Los ácidos nucleicos divulgados en la presente que comprenden secuencias antisentido pueden ser capaces de inhibir el transporte, empalme o transcripción de genes que codifican enzimas aldolasas. La inhibición puede llevarse a cabo a través del direccionamiento del ADN genómico o ARN mensajero. La transcripción o función del ácido nucleico objetivo puede inhibirse, por ejemplo, mediante hibridación y/o escisión. En un conjunto ejemplar de inhibidores proporcionados por la presente invención incluye oligonucleótidos que son capaces de unirse al gen o mensaje de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, evitando o inhibiendo en ambos casos la producción o función de una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. La asociación puede ser a través de hibridación específica de secuencia. Otro tipo de inhibidores útiles incluye oligonucleótidos que provocan la desactivación o escisión del mensaje de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. El oligonucleótido puede tener actividad enzimática la cual provoca dicha escisión, tal como ribozimas. El oligonucleótido puede estar químicamente modificado o conjugado a una enzima o composición capaz de escindir el ácido nucleico complementario. Un acervo de varios de dichos oligonucleótidos diferentes puede someterse a detección para detectar aquellos con la actividad deseada. Por consiguiente, la divulgación proporciona varias composiciones para la inhibición de la expresión de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa a nivel de ácido nucleico y/o proteína, tal como antisentido, ARNsi, miARN y ribozimas que comprenden secuencias de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente y los anticuerpos anti-aldolasa, tales como anti-piruvato aldolasa, tales como anti-HMG y/o anti-KHG aldolasa divulgados en la presente. The disclosure provides complementary nucleic acids (such as antisense sequences) to the nucleic acids disclosed herein, such as nucleic acids encoding aldolase enzymes, such as nucleic acids comprising antisense, siRNAs, miRNAs, and ribozymes. The nucleic acids disclosed herein that comprise antisense sequences may be capable of inhibiting the transport, splicing, or transcription of genes encoding aldolase enzymes. Inhibition can be accomplished through targeting of genomic DNA or messenger RNA. Transcription or function of the target nucleic acid can be inhibited, for example, by hybridization and / or cleavage. In an exemplary set of inhibitors provided by the present invention includes oligonucleotides that are capable of binding to the aldolase enzyme gene or message, such as pyruvate aldolase, such as HMG and / or KHG aldolase, in both cases preventing or inhibiting the production or function of an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase. Association can be through sequence specific hybridization. Another type of useful inhibitors includes oligonucleotides that cause inactivation or cleavage of the message of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The oligonucleotide can have enzymatic activity which causes such cleavage, such as ribozymes. The oligonucleotide can be chemically modified or conjugated to an enzyme or composition capable of cleaving the complementary nucleic acid. A pool of several such different oligonucleotides can be screened for those with the desired activity. Accordingly, the disclosure provides various compositions for the inhibition of aldolase enzyme expression, such as pyruvate aldolase, such as HMG and / or KHG aldolase at the nucleic acid and / or protein level, such as antisense, siRNA, miRNA and ribozymes comprising aldolase enzyme sequences, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein, and anti-aldolase antibodies, such as anti-pyruvate aldolase, such as anti-HMG and / or anti -KHG aldolase disclosed herein.

La inhibición de la expresión de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede tener una variedad de aplicaciones industriales. Por ejemplo, la inhibición de la expresión de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede retardar o evitar el deterioro de los alimentos. En algunas realizaciones, el uso de composiciones divulgadas en la presente que inhiben la expresión y/o actividad de las enzimas aldolasas, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, tales como anticuerpos, oligonucleótidos antisentido, ribozimas, ARNsi y miARN se utilizan para retardar o evitar el deterioro de los alimentos. Por consiguiente, en algunas realizaciones se divulgan métodos y composiciones que comprenden la aplicación sobre una planta o producto vegetal (tal como un cereal, un grano, fruto, semilla, raíz, hoja, etc.) de anticuerpos, oligonucleótidos antisentido, ribozimas, ARNsi y miARN divulgados en la presente para retardar o evitar el deterioro de los alimentos. Estas composiciones también pueden expresarse mediante la planta (tal como una planta transgénica) u otro organismo (tal como una bacteria u otro microorganismo transformado con un gen de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente). Inhibition of the expression of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase can have a variety of industrial applications. For example, inhibition of the expression of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase can slow or prevent spoilage of food. In some embodiments, the use of compositions disclosed herein that inhibit the expression and / or activity of aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase, such as antibodies, antisense oligonucleotides, ribozymes, siRNAs, and miRNAs are used to slow or prevent spoilage of food. Accordingly, in some embodiments, methods and compositions are disclosed which comprise the application on a plant or plant product (such as a cereal, a grain, fruit, seed, root, leaf, etc.) of antibodies, antisense oligonucleotides, ribozymes, siRNAs. and miRNAs disclosed herein to slow or prevent spoilage of food. These compositions can also be expressed by the plant (such as a transgenic plant) or other organism (such as a bacterium or other microorganism transformed with an aldolase enzyme gene, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed in the Present).

Las composiciones divulgadas en la presente para la inhibición de la expresión de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa (tales como ARNi, ribozimas antisentido, anticuerpos) pueden utilizarse como composiciones farmacéuticas, tales como agentes antipatógenos o en otras terapias, tales como agentes antimicrobianos para, por ejemplo, la Salmonella. The compositions disclosed herein for the inhibition of aldolase enzyme expression, such as pyruvate aldolase, such as HMG and / or KHG aldolase (such as RNAi, antisense ribozymes, antibodies) can be used as pharmaceutical compositions, such as antipathogenic agents. or in other therapies, such as antimicrobial agents for, for example, Salmonella.

Oligonucleótidos antisentido Antisense oligonucleotides

La divulgación proporciona oligonucleótidos antisentido capaces de unirse a un mensaje de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, los cuales, en algunas realizaciones, pueden inhibir la actividad enzimática de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa dirigiéndose al ARNm. En la literatura científica y de patentes se describen estrategias para diseñar oligonucleótidos y el experto en la técnica puede diseñar dichos oligonucleótidos de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa utilizando los nuevos reactivos divulgados en la presente. Por ejemplo, los protocolos de The disclosure provides antisense oligonucleotides capable of binding to an enzyme aldolase message, such as pyruvate aldolase, such as HMG and / or KHG aldolase, which, in some embodiments, can inhibit the enzyme activity of the enzyme aldolase, such as pyruvate aldolase , such as HMG and / or KHG aldolase targeting mRNA. Strategies for designing oligonucleotides are described in the scientific and patent literature, and those aldolase enzyme oligonucleotides, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be designed by the person skilled in the art using the new reagents disclosed herein. For example, the protocols of

desplazamiento sobre el gen/mapeo de ARN para detectar los oligonucleótidos antisentido efectivos se conocen en la técnica, ver Ho (2000) Methods Enzymol. 314:168-183, que describe un ensayo de mapeo de ARN, el cual está basado en técnicas moleculares estándares para proporciona un método fácil y confiable para la selección convincente de secuencias antisentido. Ver también Smith (2000) Eur. J. Pharm. Sci. 11:191-198. gene shuffling / RNA mapping to detect effective antisense oligonucleotides are known in the art, see Ho (2000) Methods Enzymol. 314: 168-183, which describes an RNA mapping assay, which is based on standard molecular techniques to provide an easy and reliable method for convincing selection of antisense sequences. See also Smith (2000) Eur. J. Pharm. Sci. 11: 191-198.

Los ácidos nucleicos de origen natural se utilizan como oligonucleótidos antisentido. Estos oligonucleótidos antisentido pueden tener cualquier longitud; por ejemplo, en otras realizaciones, los oligonucleótidos antisentido son de aproximadamente 5 a aproximadamente 100, aproximadamente 10 a aproximadamente 80, aproximadamente 15 a aproximadamente 60, aproximadamente 18 a aproximadamente 40. La longitud óptima puede determinarse mediante detección habitual. Los oligonucleótidos antisentido pueden estar presentes en cualquier concentración. La concentración óptima puede determinarse mediante detección habitual. Se conoce una amplia variedad de nucleótidos sintéticos, de origen no natural y análogos de ácidos nucleicos que pueden tratar este problema potencial. Por ejemplo, se pueden utilizar ácidos nucleicos peptídicos (PNA) que contienen una cadena principal no iónica, tales como unidades N-(2-aminoetil)glicina. También se pueden utilizar oligonucleótidos antisentido que tienen enlaces fosforotioato, como se describen en WO 97/03211; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J., 1996). Los oligonucleótidos antisentido que tienen análogos de cadena principal de ADN sintética proporcionados en la invención también pueden incluir ácidos nucleicos de fósforo-ditioato, metilfosfonato, fosforamidato, alquil fosfotriéster, sulfamato, 3'-tioacetal, metilen(metilimino), 3'-N-carbamato y morfolino carbamato, tales como los descritos anteriormente. Naturally occurring nucleic acids are used as antisense oligonucleotides. These antisense oligonucleotides can be any length; for example, in other embodiments, antisense oligonucleotides are from about 5 to about 100, about 10 to about 80, about 15 to about 60, about 18 to about 40. The optimal length can be determined by routine detection. Antisense oligonucleotides can be present in any concentration. The optimal concentration can be determined by routine detection. A wide variety of synthetic, unnaturally derived nucleotides and nucleic acid analogs are known that can treat this potential problem. For example, peptide nucleic acids (PNAs) containing a nonionic backbone can be used, such as N- (2-aminoethyl) glycine units. Antisense oligonucleotides having phosphorothioate linkages can also be used, as described in WO 97/03211; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144: 189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J., 1996). Antisense oligonucleotides having synthetic DNA backbone analogs provided in the invention may also include phosphor dithioate, methylphosphonate, phosphoramidate, alkyl phosphotriester, sulphamate, 3'-thioacetal, methylene (methylimino), 3'-N- nucleic acids. carbamate and morpholino carbamate, such as those described above.

Se puede utilizar metodología de química combinatoria para crear grandes cantidades de oligonucleótidos que pueden someterse a detección sistemática rápidamente para detectar oligonucleótidos específicos que tienen las afinidades y especificidades de unión apropiadas con cualquier objetivo, tales como las secuencias de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa sentido y antisentido divulgadas en la presente (ver Gold (1995) J. of Biol. Chem. 270:13581-13584). Combinatorial chemistry methodology can be used to create large amounts of oligonucleotides that can be quickly screened for specific oligonucleotides that have the appropriate binding affinities and specificities for any target, such as aldolase enzyme sequences, such as pyruvate aldolase, such as HMG and / or KHG sense and antisense aldolase disclosed herein (see Gold (1995) J. of Biol. Chem. 270: 13581-13584).

Ribozimas inhibidoras Inhibitory ribozymes

La invención proporciona ribozimas capaces de unir el mensaje de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Estas ribozimas pueden inhibir la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, por ejemplo, apuntando al ARNm. Las estrategias para diseñar ribozimas y seleccionar la secuencia antisentido específica de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa como objetivo se describen bien en la bibliografía científica y de patentes, y el experto en la técnica puede diseñar dichas ribozimas usando los reactivos novedosos divulgados en la presente. Las ribozimas actúan uniéndose a un ARN objetivo a través de la porción de unión a ARN de una ribozima que se mantiene en proximidad cercana a una porción enzimática del ARN que escinde el ARN objetivo. Por lo tanto, la ribozima reconoce y se une a un ARN objetivo a través del apareamiento de bases complementario, y una vez unida al sitio correcto, actúa enzimáticamente para escindir e inactivar el ARN objetivo. La escisión de un ARN objetivo de este modo destruirá su capacidad de dirigir la síntesis de una proteína codificada si la escisión ocurre en la secuencia de codificación. Luego de que una ribozima se haya unido a su objetivo de ARN y lo haya escindido, puede liberarse de dicho ARN para unirse y escindir nuevos objetivos de forma repetida. The invention provides ribozymes capable of binding the enzyme aldolase message, such as pyruvate aldolase, such as HMG and / or KHG aldolase. These ribozymes can inhibit aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, for example, by targeting mRNA. Strategies for designing ribozymes and selecting the enzyme aldolase-specific antisense sequence, such as pyruvate aldolase, such as HMG and / or KHG aldolase as the target, are well described in the scientific and patent literature, and those skilled in the art can design such ribozymes using the novel reagents disclosed herein. Ribozymes work by binding to a target RNA through the RNA-binding portion of a ribozyme that is maintained in close proximity to an enzymatic portion of the RNA that cleaves the target RNA. Thus, the ribozyme recognizes and binds to a target RNA through complementary base pairing, and once attached to the correct site, it acts enzymatically to cleave and inactivate the target RNA. Cleavage of a target RNA in this way will destroy its ability to direct the synthesis of an encoded protein if cleavage occurs in the encoding sequence. After a ribozyme has bound and cleaved from its RNA target, it can break free of that RNA to repeatedly bind and cleave new targets.

En algunas circunstancias, la naturaleza enzimática de una ribozima puede ser ventajosa sobre otras tecnologías, tales como tecnología antisentido (donde una molécula de ácido nucleico simplemente se une a un objetivo de ácido nucleico para bloquear su transcripción, traducción o asociación con otra molécula) como la concentración efectiva de la ribozima necesaria para efectuar un tratamiento terapéutico puede ser menor que aquel de un oligonucleótido antisentido. Esta ventaja potencial refleja la capacidad de la ribozima de actuar enzimáticamente. Por lo tanto, una ribozima única es capaz de escindir varias moléculas de ARN objetivo. En algunas realizaciones, una ribozima es un inhibidor altamente específico, con la especificidad de inhibición que no depende solamente del mecanismo de apareamiento de bases de unión, sino también del mecanismo por el cual la molécula inhibe la expresión del ARN al cual se une. Es decir, la inhibición está causada por la escisión del objetivo de ARN y, por lo tanto, la especificidad se define como la relación de la tasa de escisión del ARN dirigido sobre la tasa de escisión del ARN no dirigido. Este mecanismo de escisión depende de factores adicionales a aquellos que participan en el apareamiento de bases. Por lo tanto, la especificidad de la acción de una ribozima puede ser mayor que la del oligonucleótido antisentido que se une al mismo sitio de ARN. In some circumstances, the enzymatic nature of a ribozyme may be advantageous over other technologies, such as antisense technology (where a nucleic acid molecule simply binds to a nucleic acid target to block its transcription, translation, or association with another molecule) such as the effective concentration of the ribozyme necessary to carry out a therapeutic treatment may be less than that of an antisense oligonucleotide. This potential advantage reflects the ribozyme's ability to act enzymatically. Therefore, a single ribozyme is capable of cleaving various target RNA molecules. In some embodiments, a ribozyme is a highly specific inhibitor, with the specificity of inhibition that depends not only on the binding base pairing mechanism, but also on the mechanism by which the molecule inhibits the expression of the RNA to which it binds. That is, the inhibition is caused by cleavage of the RNA target, and therefore specificity is defined as the ratio of the cleavage rate of targeted RNA to the cleavage rate of non-targeted RNA. This cleavage mechanism depends on factors additional to those involved in base pairing. Therefore, the specificity of the action of a ribozyme may be higher than that of the antisense oligonucleotide that binds to the same RNA site.

La ribozima divulgada en la presente tal como una molécula de ARN de ribozima enzimática puede formarse en un motivo de cabeza de martillo, motivo de horquilla, un motivo de intrón de grupo I y/o un ARN similar a RNasaP en asociación con una secuencia de guía de ARN. Ejemplos de motivos de cabeza de martillo son descritos, por ejemplo, por Rossi (1992) Aids Research and Human Retroviruses 8:183; los motivos de horquilla por Hampel (1989) Biochemistry 28:4929, y Hampel (1990) Nuc. Acids Res. 18:299; el motivo del virus de la hepatitis delta por Perrotta (1992) Biochemistry 31:16; el motivo de RNasaP por Guerrier-Takada (1983) Cell 35:849; y el intrón de grupo I por Cech, Patente de los Estados Unidos No. 4.987.071. Los expertos en la técnica reconocerán que una ribozima divulgada en la presente, tal como una molécula de ARN enzimática de la presente invención, puede tener un sitio de unión del sustrato específico complementario a una o más de las regiones de ARN del gen objetivo. Una The ribozyme disclosed herein such as an enzymatic ribozyme RNA molecule can be formed into a hammerhead motif, hairpin motif, a group I intron motif and / or a RNasaP-like RNA in association with a sequence of RNA guide. Examples of hammerhead motifs are described, for example, by Rossi (1992) Aids Research and Human Retroviruses 8: 183; hairpin motifs by Hampel (1989) Biochemistry 28: 4929, and Hampel (1990) Nuc. Acids Res. 18: 299; the hepatitis delta virus motif by Perrotta (1992) Biochemistry 31:16; the RNasaP motif by Guerrier-Takada (1983) Cell 35: 849; and the group I intron by Cech, US Patent No. 4,987,071. Those skilled in the art will recognize that a ribozyme disclosed herein, such as an enzymatic RNA molecule of the present invention, may have a specific substrate binding site complementary to one or more of the RNA regions of the target gene. A

ribozima divulgada en la presente puede tener una secuencia de nucleótidos dentro o alrededor del sitio de unión del sustrato que imparte una actividad de escisión de ARN a la molécula. Ribozyme disclosed herein can have a nucleotide sequence within or around the substrate binding site that imparts RNA cleavage activity to the molecule.

Interferencia de ARN (ARNi) RNA interference (RNAi)

En algunas realizaciones, la divulgación proporciona moléculas inhibidoras de ARN, las denominadas moléculas de “ARNi”, que comprenden secuencias de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgadas en la presente. La molécula de ARNi puede comprender una molécula de ARN de doble hebra (ARNds), tal como moléculas de ARNsi, miARN y/o ARN de horquilla corta (ARNsh). La molécula de ARNi, tal como ARNsi (ARN inhibidor pequeño) y/o miARN (micro ARN), pueden inhibir la expresión de un gen de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. En algunas realizaciones la molécula de ARNi, tal como ARNsi y/o miARN es de aproximadamente 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 o más nucleótidos dúplex de longitud. Si bien la divulgación no se limita a ningún mecanismo de acción en particular, el ARNi puede ingresar en una célula y causar la degradación de un ARN de una sola hebra (ARNss) de secuencias similares o idénticas, incluyendo ARNm endógenos. Cuando una célula se expone a un ARN de doble hebra (ARNds), el ARNm del gen homólogo se degrada selectivamente mediante un proceso denominado interferencia de ARN (ARNi). Un mecanismo básico posible detrás del ARNi es la rotura de un ARN de doble hebra (ARNds) que coincide con una secuencia de gen específica en piezas cortas denominadas ARN pequeño de interferencia, que desencadena la degradación de ARNm que coincide con su secuencia. En algunas realizaciones, los ARNi divulgados en la presente se usan en tratamientos de silenciamiento de gen, ver Shuey (2002) Drug Discov. Today 7:1040-1046. En algunas realizaciones la divulgación proporciona métodos para degradar selectivamente ARN usando las moléculas de ARNi tales como ARNsi y/o miARN. El proceso puede realizarse in vitro, ex vivo o in vivo. En algunas realizaciones, las moléculas de ARNi divulgadas en la presente pueden usarse para generar una mutación de pérdida de función en una célula, órgano o un animal. In some embodiments, the disclosure provides RNA inhibitory molecules, so-called "RNAi" molecules, which comprise aldolase enzyme sequences, such as pyruvate aldolase, HMG and / or KHG aldolase, disclosed herein. The RNAi molecule may comprise a double-stranded RNA molecule (dsRNA), such as siRNA, miRNA and / or short hairpin RNA (shRNA) molecules. The RNAi molecule, such as siRNA (small inhibitory RNA) and / or miRNA (microRNA), can inhibit the expression of an aldolase enzyme gene, such as pyruvate aldolase, HMG and / or KHG aldolase. In some embodiments the RNAi molecule, such as siRNA and / or miRNA is approximately 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 or more duplex nucleotides in length. While the disclosure is not limited to any particular mechanism of action, RNAi can enter a cell and cause degradation of single-stranded RNA (ssRNA) of similar or identical sequences, including endogenous mRNAs. When a cell is exposed to double-stranded RNA (dsRNA), the mRNA of the homologous gene is selectively degraded by a process called RNA interference (RNAi). A possible basic mechanism behind RNAi is the breakage of a double-stranded RNA (dsRNA) that matches a specific gene sequence into short pieces called small interfering RNAs, which triggers the degradation of the mRNA that matches its sequence. In some embodiments, the RNAi disclosed herein are used in gene silencing treatments, see Shuey (2002) Drug Discov. Today 7: 1040-1046. In some embodiments the disclosure provides methods for selectively degrading RNA using RNAi molecules such as siRNA and / or miRNA. The process can be carried out in vitro, ex vivo or in vivo. In some embodiments, the RNAi molecules disclosed herein can be used to generate a loss-of-function mutation in a cell, organ, or animal.

En un aspecto, la introducción intracelular del ARNi ocurre por internalización de un ligando específico de célula objetivo unido a una proteína de unión de ARN que comprende un ARNi (tal como micro ARN) que se adsorbe. El ligando es específico a un antígeno de superficie de célula objetivo única. El ligando puede internalizarse espontáneamente luego de unirse al antígeno de superficie celular. Si el antígeno de superficie celular único no se internaliza naturalmente luego de unirse a su ligando, la internalización puede promoverse mediante la incorporación de un péptido rico en arginina u otro péptido permeable a la membrana en la estructura del ligando o la proteína de unión de ARN o unión de dicho péptido al ligando o la proteína de unión de ARN. Vea la Solicitud de Patente de los Estados Unidos No. 20060030003; 20060025361; 20060019286; 20060019258. En un aspecto, la divulgación proporciona formulaciones basadas en lípidos para administrar, tal como introducir ácidos nucleicos divulgados en la presente como partículas de lípidos-ácidos nucleicos que comprenden una molécula de ARNi a una célula, ver por ejemplo la Publicación de la Solicitud de Patente de los Estados Unidos No. 20060008910. In one aspect, intracellular introduction of RNAi occurs by internalization of a target cell-specific ligand bound to an RNA binding protein comprising an RNAi (such as microRNA) that is adsorbed. The ligand is specific to a single target cell surface antigen. The ligand can spontaneously internalize after binding to the cell surface antigen. If the single cell surface antigen does not naturally internalize after binding to its ligand, internalization can be promoted by incorporating an arginine-rich peptide or another membrane-permeable peptide into the ligand structure or the RNA-binding protein or binding of said peptide to the ligand or RNA binding protein. See United States Patent Application No. 20060030003; 20060025361; 20060019286; 20060019258. In one aspect, the disclosure provides lipid-based formulations for administration, such as introducing nucleic acids disclosed herein as lipid-nucleic acid particles comprising an RNAi molecule into a cell, see for example, Application Publication U.S. Patent No. 20060008910.

Modificación de ácidos nucleicos – preparación de enzimas variantes Nucleic acid modification - preparation of variant enzymes

Se divulgan métodos para generar variantes de los ácidos nucleicos divulgados en la presente, tales como aquellos que codifican una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. Estos métodos pueden repetirse o usarse en varias combinaciones para generar enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa que tienen una actividad alterada o diferente o una estabilidad alterada o diferente de una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa codificada por el ácido nucleico plantilla. Estos métodos también pueden repetirse o usarse en varias combinaciones tal como para generar variaciones en la expresión del gen/mensaje, traducción del mensaje o estabilidad del mensaje. En otras realizaciones, la composición genética de una célula se altera mediante por ejemplo la modificación de un gen homólogo ex vivo, seguido por su reinserción en la célula. Methods for generating variants of the nucleic acids disclosed herein are disclosed, such as those encoding an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase. These methods can be repeated or used in various combinations to generate aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase that have altered or different activity or altered or different stability of an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase encoded by the template nucleic acid. These methods can also be repeated or used in various combinations such as to generate variations in gene / message expression, message translation, or message stability. In other embodiments, the genetic makeup of a cell is altered by, for example, modification of a homologous gene ex vivo, followed by its reinsertion into the cell.

Un ácido nucleico divulgado en la presente puede alterarse de varios modos. Por ejemplo, métodos aleatorios o estocásticos, o no estocásticos, o métodos de “evolución dirigida”, ver la Patente de los Estados Unidos No. A nucleic acid disclosed herein can be altered in several ways. For example, random or stochastic, or non-stochastic, or "directed evolution" methods, see US Patent No.

6.361.974. Los métodos para la mutación aleatoria de genes es bien conocida en la técnica, ver la Patente de los Estados Unidos No. 5.830.696. Por ejemplo, los mutágenos pueden usarse para mutar aleatoriamente un gen. Los mutágenos incluyen por ejemplo luz ultravioleta o irradiación gamma, o un mutágeno químico, tal como mitomicina, ácido nitroso, psoralenos fotoactivados, solos o en combinación, para inducir las roturas de ADN a que sean reparadas por recombinación. Otros mutágenos químicos incluyen, por ejemplo, bisulfito de sodio, ácido nitroso, hidroxilamina, hidrazina o ácido fórmico. Otros mutágenos son análogos de precursores de nucleótidos, tales como nitrosoguanidina, 5-bromouracilo, 2-aminopurina o acridina. Estos agentes pueden agregarse a una reacción PCR en lugar del precursor de nucleótido de ese modo mutando la secuencia. Los agentes de intercalado tales como proflavina, acriflavina, quinacrina y similares también pueden usarse. 6,361,974. Methods for random gene mutation are well known in the art, see US Patent No. 5,830,696. For example, mutagens can be used to randomly mutate a gene. Mutagens include, for example, ultraviolet light or gamma irradiation, or a chemical mutagen, such as mitomycin, nitrous acid, photoactivated psoralens, alone or in combination, to induce DNA breaks to be repaired by recombination. Other chemical mutagens include, for example, sodium bisulfite, nitrous acid, hydroxylamine, hydrazine, or formic acid. Other mutagens are nucleotide precursor analogs, such as nitrosoguanidine, 5-bromouracil, 2-aminopurine, or acridine. These agents can be added to a PCR reaction in place of the nucleotide precursor thereby mutating the sequence. Interleaving agents such as proflavin, acriflavin, quinacrine and the like can also be used.

Puede usarse cualquier técnica de biología molecular, tal como mutagénesis aleatoria por PCR, ver Rice (1992) Proc. Natl. Acad. Sci. Estados Unidos 89:5467-5471; o mutagénesis de cassette múltiple combinatorio, ver Crameri (1995) Biotechniques 18:194-196. Alternativamente, los ácidos nucleicos, tales como genes, pueden reunirse luego Any molecular biology technique can be used, such as random PCR mutagenesis, see Rice (1992) Proc. Natl. Acad. Sci. United States 89: 5467-5471; or combinatorial multiple cassette mutagenesis, see Crameri (1995) Biotechniques 18: 194-196. Alternatively, nucleic acids, such as genes, can then be brought together

de la fragmentación aleatoria o “estocástica”, ver la Patente de los Estados Unidos No. 6.291.242; 6.287.862; 6.287.861; 5.955.358; 5.830.721; 5.824.514; 5.811.238; 5.605.793. En otras realizaciones, las modificaciones, adiciones o eliminaciones se introducen por medio de PCR propensa a errores, transposición, mutagénesis de cassette, mutagénesis de ensamblaje recursivo, mutagénesis de ensamblaje exponencial, mutagénesis específica de sitio, reensamblaje de genes (tal como Reensamblaje de genes, ver Patente de los Estados Unidos No. 6.537.776), mutagénesis de saturación de sitios de genes (GSSM), reensamblaje de ligación sintética (SLR), recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada con fosfotioato, mutagénesis de plantilla que contiene uracilo, mutagénesis dúplex con brechas, mutagénesis de reparación de coincidencias puntuales, mutagénesis de cepa huésped deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis de eliminación, mutagénesis de restricción-selección, mutagénesis de restricción purificación, síntesis de gen artificial, mutagénesis de ensamblaje, creación de multímeros de ácido nucleico quimérico, mutagénesis de saturación cromosómica (CSM) y/o combinación de estos y otros métodos. for random or "stochastic" fragmentation, see US Patent No. 6,291,242; 6,287,862; 6,287,861; 5,955,358; 5,830,721; 5,824,514; 5,811,238; 5,605,793. In other embodiments, modifications, additions, or deletions are introduced by error-prone PCR, transposition, cassette mutagenesis, recursive assembly mutagenesis, exponential assembly mutagenesis, site-specific mutagenesis, gene reassembly (such as gene reassembly). , see US Patent No. 6,537,776), gene site saturation mutagenesis (GSSM), synthetic ligation reassembly (SLR), recombination, recursive sequence recombination, phosphothioate-modified DNA mutagenesis, template mutagenesis containing uracil, gap duplex mutagenesis, point match repair mutagenesis, poor host strain mutagenesis, chemical mutagenesis, radiogenic mutagenesis, deletion mutagenesis, restriction-selection mutagenesis, restriction mutagenesis purification, artificial gene synthesis, mutagenesis of assembly, creation of chimeric nucleic acid multimers or, chromosomal saturation mutagenesis (CSM) and / or combination of these and other methods.

Las siguientes publicaciones describen una variedad de procedimientos de recombinación recursiva y/o métodos que pueden incorporarse a los métodos divulgados en la presente: Stemmer (1999) “Molecular breeding of viruses for targeting and other clinical properties” Tumor Targeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang (1999) “Evolution of a cytokine using DNA family shuffling” Nature Biotechnology 17:793-797; Minshull (1999) “Protein evolution by molecular breeding” Current Opinion in Chemical Biology 3:284-290; Christians (1999) “Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling” Nature Biotechnology 17:259-264; Crameri (1998) “DNA shuffling of a family of genes from diverse species accelerates directed evolution” Nature 391:288-291; Crameri (1997) “Molecular evolution of an arsenate detoxification pathway by DNA shuffling,” Nature Biotechnology 15:436-438; Zhang (1997) “Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening” Proc. Natl. Acad. Sci. Estados Unidos 94:4504-4509; Patten et al. (1997) “Applications of DNA Shuffling to Pharmaceuticals and Vaccines” Current Opinion in Biotechnology 8:724-733; Crameri et al. (1996) “Construction and evolution of antibody-phage libraries by DNA shuffling” Nature Medicine 2:100-103; Gates et al. (1996) “Affinity selective isolation of ligands from peptide libraries through display on a lac repressor headpiece dimer” Journal of Molecular Biology 255:373-386; Stemmer (1996) “Sexual PCR and Assembly PCR” en: The Encyclopedia of Molecular Biology. VCH Publishers, Nueva York. pp. 447-457; Crameri y Stemmer (1995) “Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes” BioTechniques 18:194-195; Stemmer et al. (1995) “Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides” Gene, 164:49-53; Stemmer (1995) “The Evolution of Molecular Computation” Science 270: 1510; Stemmer (1995) “Searching Sequence Space” Bio/Technology 13:549-553; Stemmer (1994) “Rapid evolution of a protein in vitro by DNA shuffling” Nature 370:389-391; y Stemmer (1994) “DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution.” Proc. Natl. Acad. Sci. Estados Unidos 91:10747-10751. The following publications describe a variety of recursive recombination procedures and / or methods that can be incorporated into the methods disclosed herein: Stemmer (1999) "Molecular breeding of viruses for targeting and other clinical properties" Tumor Targeting 4: 1-4; Ness (1999) Nature Biotechnology 17: 893-896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17: 793-797; Minshull (1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3: 284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17: 259-264; Crameri (1998) “DNA shuffling of a family of genes from diverse species accelerates directed evolution” Nature 391: 288-291; Crameri (1997) "Molecular evolution of an arsenate detoxification pathway by DNA shuffling," Nature Biotechnology 15: 436-438; Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. United States 94: 4504-4509; Patten et al. (1997) "Applications of DNA Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8: 724-733; Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2: 100-103; Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor headpiece dimer" Journal of Molecular Biology 255: 373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" in: The Encyclopedia of Molecular Biology. VCH Publishers, New York. pp. 447-457; Crameri and Stemmer (1995) "Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18: 194-195; Stemmer et al. (1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164: 49-53; Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510; Stemmer (1995) "Searching Sequence Space" Bio / Technology 13: 549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370: 389-391; and Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution." Proc. Natl. Acad. Sci. United States 91: 10747-10751.

Los métodos de mutación para generar diversidad incluyen, por ejemplo, mutagénesis dirigida al sitio (Ling et al. (1997) “Approaches to DNA mutagenesis: an overview” Anal Biochem. 254(2): 157-178; Dale et al. (1996) “Oligonucleotide-directed random mutagenesis using the phosphorothioate method” Methods Mol. Biol. 57:369-374; Smith (1985) “In vitro mutagenesis” Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) “Strategies and applications of in vitro mutagenesis” Science 229:1193-1201; Carter (1986) “Site-directed mutagenesis” Biochem. J. 237:1-7; y Kunkel (1987) “The efficiency of oligonucleotide directed mutagenesis” en Nucleic Acids & Molecular Biology (Eckstein, F. y Lilley, D. M. J. eds., Springer Verlag, Berlín)); mutagénesis que usa plantillas que contienen uracilo (Kunkel (1985) “Rapid and efficient site-specific mutagenesis without phenotypic selection” Proc. Natl. Acad. Sci. Estados Unidos 82:488-492; Kunkel et al. (1987) “Rapid and efficient site-specific mutagenesis without phenotypic selection” Methods in Enzymol. 154, 367-382; y Bass et al. (1988) “Mutant Trp repressors with new DNAbinding specificities” Science 242:240-245); mutagénesis dirigida a oligonucleótidos (Methods in Enzymol. 100: 468500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) “Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment” Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) “Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors” Methods in Enzymol. 100:468-500; y Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template” Methods in Enzymol. 154:329-350); mutagénesis de ADN modificada con fosforotioato (Taylor (1985) “The use of phosphorothioatemodified DNA in restriction enzyme reactions to prepare nicked DNA” Nucl. Acids Res. 13: 8749-8764; Taylor (1985) “The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA” Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) “Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis” Nucl. Acids Res. 14: 96799698; Sayers (1988) “Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis” Nucl. Acids Res. 16:791-802; y Sayers et al. (1988) “Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide” Nucl. Acids Res. 16: 803-814); mutagénesis que usa ADN dúplex con brechas (Kramer et al. (1984) “The gapped duplex DNA approach to oligonucleotide-directed mutation construction” Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. “Oligonucleotide-directed construction of mutations via gapped duplex DNA” 154:350-367; Kramer (1988) “Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction Mutation methods to generate diversity include, for example, site-directed mutagenesis (Ling et al. (1997) "Approaches to DNA mutagenesis: an overview" Anal Biochem. 254 (2): 157-178; Dale et al. ( 1996) "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57: 369-374; Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19: 423-462; Botstein & Shortle (1985 ) "Strategies and applications of in vitro mutagenesis" Science 229: 1193-1201; Carter (1986) "Site-directed mutagenesis" Biochem. J. 237: 1-7; and Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis" in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, DMJ eds., Springer Verlag, Berlin)); mutagenesis using templates containing uracil (Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82: 488-492; Kunkel et al. (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection "Methods in Enzymol. 154, 367-382; and Bass et al. (1988)" Mutant Trp repressors with new DNAbinding specificities "Science 242: 240-245); oligonucleotide-directed mutagenesis (Methods in Enzymol. 100: 468500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment "Nucleic Acids Res. 10: 6487-6500; Zoller & Smith (1983)" Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors "Methods in Enzymol. 100: 468-500; and Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template ”Methods in Enzymol. 154: 329-350); phosphorothioate-modified DNA mutagenesis (Taylor (1985) “The use of phosphorothioatemodified DNA in restriction enzyme reactions to prepare nicked DNA” Nucl. Acids Res. 13: 8749-8764; Taylor (1985) “The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA ”Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986)“ Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis ”Nucl. Acids Res. 14: 96799698; Sayers (1988) "YT Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16: 791-802; and Sayers et al. (1988) "Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide ”Nucl. Acids Res. 16: 803-814); mutagenesis using gapped duplex DNA (Kramer et al. (1984) "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. " Oligonucleotide-directed construction of mutations via gapped duplex DNA ”154: 350-367; Kramer (1988)“ Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction

of mutations” Nucl. Acids Res. 16: 7207; and Fritz (1988) “Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro” Nucl. Acids Res. 16: 6987-6999). of mutations ”Nucl. Acids Res. 16: 7207; and Fritz (1988) "Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999).

Protocolos adicionales que pueden usarse para poner en práctica el método incluyen reparación de no coincidencias (Kramer (1984) “Point Mismatch Repair” Cell 38:879-887), mutagénesis que usa cepas huésped deficientes de reparación (Carter et al. (1985) “Improved oligonucleotide site-directed mutagenesis using M13 vectors” Nucl. Acids Res. 13: 4431-4443; y Carter (1987) “Improved oligonucleotide-directed mutagenesis using M13 vectors” Methods in Enzymol. 154: 382-403), mutagénesis de eliminación (Eghtedarzadeh (1986) “Use of oligonucleotides to generate large deletions” Nucl. Acids Res. 14: 5115), restricción-selección y restricción-selección y restricción-purificación (Wells et al. (1986) “Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin” Phil. Trans. Additional protocols that can be used to practice the method include mismatch repair (Kramer (1984) "Point Mismatch Repair" Cell 38: 879-887), mutagenesis using repair deficient host strains (Carter et al. (1985) "Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443; and Carter (1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods in Enzymol. 154: 382-403), mutagenesis of deletion (Eghtedarzadeh (1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14: 5115), restriction-selection and restriction-selection and restriction-purification (Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin "Phil. Trans.

R. Soc. Lond. A 317: 415-423), mutagénesis por síntesis de gen total (Nambiar et al. (1984) “Total synthesis and cloning of a gene coding for the ribonuclease S protein” Science 223: 1299-1301; Sakamar y Khorana (1988) “Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)” Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) “Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites” Gene 34:315-323; y Grundstrom et al. (1985) “Oligonucleotidedirected mutagenesis by microscale ‘shot-gun’ gene synthesis” Nucl. Acids Res. 13: 3305-3316), reparación de rotura de doble hebra (Mandecki (1986); Arnold (1993) “Protein engineering for unusual environments” Current Opinion in Biotechnology 4:450-455. “Oligonucleotide-directed double-strand break repair in plasmids ofEscherichia coli: a method for site-specific mutagenesis” Proc. Natl. Acad. Sci. Estados Unidos, 83:7177-7181). Los detalles adicionales sobre cualquiera de los métodos anteriores pueden encontrarse en Methods in Enzymology Volumen 154, que también describe controles útiles para solucionar problemas con varios métodos de mutagénesis. R. Soc. Lond. A 317: 415-423), total gene synthesis mutagenesis (Nambiar et al. (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301; Sakamar and Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transduction)" Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites ”Gene 34: 315-323; and Grundstrom et al. (1985)“ Oligonucleotidedirected mutagenesis by microscale 'shot-gun' gene synthesis ”Nucl. Acids Res. 13: 3305-3316) , double strand break repair (Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4: 450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis ”Proc. Natl. Acad. Sci. USA, 83: 7177-7181). Additional details on any of the above methods can be found in Methods in Enzymology Volume 154, which also describes useful controls for troubleshooting problems with various methods of mutagenesis.

Los protocolos que pueden usarse para poner en práctica el método se describen, por ejemplo en la Patente de los Estados Unidos No. 5.605.793 de Stemmer (25 feb. 1997), “´Métodos para la recombinación in vitro”; Patente de los Estados Unidos No. 5.811.238 de Stemmer et al. (22 set. 1998) “Métodos para generar polinucleótidos que tienen características deseadas por selección y recombinación iterativas”; Patente de los Estados Unidos No. 5.830.721 de Stemmer et al. (3 nov. 1998), “Mutagénesis de ADN por fragmentación y reensamblaje aleatorios”; Patente de los Estados Unidos No. 5.834.252 de Stemmer, et al. (10 nov. 1998) “Reacción de polimerasa complementaria final”; Patente de los Estados Unidos No. 5.837.458 de Minshull, et al. (17 nov. 1998), “Métodos y composiciones para la manipulación celular y metabólica”; WO 95/22625, Stemmer y Crameri, “Mutagénesis por fragmentación y reensamblaje aleatorios”; WO 96/33207 de Stemmer y Lipschutz “Reacción en cadena de polimerasa complementaria final”; WO 97/20078 de Stemmer y Crameri “Métodos para generar polinucleótidos que tienen características deseadas por selección y recombinación iterativa”; WO 97/35966 de Minshull y Stemmer, “Métodos y composiciones para la manipulación celular y metabólica”; WO 99/41402 de Punnonen et al. “Direccionamiento de vectores de vacuna genética”; WO 99/41383 de Punnonen et al. “Inmunización de biblioteca de antígenos”; WO 99/41369 de Punnonen et al. “Manipulación de vector de vacuna genética”; WO 99/41368 de Punnonen et al. “Optimización de propiedades inmunomoduladoras de vacunas genéticas”; EP 752008 de Stemmer y Crameri, “Mutagénesis de ADN por fragmentación y reensamblaje aleatorios”; EP 0932670 de Stemmer “Evolución de la captación de ADN celular por recombinación de secuencia recursiva”; WO 99/23107 de Stemmer et al., “Modificación del tropismo de virus y rango huésped por transposición de genoma viral”; WO 99/21979 de Apt et al., “Vectores de virus del papiloma humano”; WO 98/31837 de del Cardayre et al. “Evolución de células y organismos enteros por recombinación de secuencia recursiva”; WO 98/27230 de Patten y Stemmer, “Métodos y composiciones para la manipulación de polipéptidos”; WO 98/27230 de Stemmer et al., “Métodos para la optimización de la terapia de gen por transposición y selección de secuencia recursiva,” WO 00/00632, “Métodos para generar bibliotecas altamente diversas”; WO 00/09679, “Métodos para obtener bancos y secuencias resultantes de polinucleótidos recombinados in vitro”; WO 98/42832 de Arnold et al., “Recombinación de secuencias de polinucleótidos usando cebadores aleatorios o definidos”; WO 99/29902 de Arnold et al., “Método para crear secuencias de polinucleótidos y polipéptidos”; WO 98/41653 de Vind, “Un método in vitro para la construcción de una biblioteca de ADN”; WO 98/41622 por Borchert et al., “Método para construir una biblioteca usando transposición de ADN,” y WO 98/42727 de Pati y Zarling, “Alteraciones de secuencia usando recombinación homóloga”. Protocols that can be used to practice the method are described, for example, in US Patent No. 5,605,793 to Stemmer (Feb. 25, 1997), "" Methods for In Vitro Recombination "; United States Patent No. 5,811,238 to Stemmer et al. (September 22, 1998) "Methods to generate polynucleotides that have desired characteristics by iterative selection and recombination"; United States Patent No. 5,830,721 to Stemmer et al. (Nov 3, 1998), "DNA Mutagenesis by Random Fragmentation and Reassembly"; United States Patent No. 5,834,252 to Stemmer, et al. (Nov 10, 1998) "Final Complementary Polymerase Reaction"; United States Patent No. 5,837,458 to Minshull, et al. (Nov 17, 1998), “Methods and Compositions for Cellular and Metabolic Manipulation”; WO 95/22625, Stemmer and Crameri, "Mutagenesis by Random Fragmentation and Reassembly"; WO 96/33207 to Stemmer and Lipschutz "Final Complementary Polymerase Chain Reaction"; WO 97/20078 to Stemmer and Crameri "Methods for generating polynucleotides having desired characteristics by selection and iterative recombination"; WO 97/35966 to Minshull and Stemmer, "Methods and Compositions for Cellular and Metabolic Manipulation"; WO 99/41402 to Punnonen et al. "Targeting of Genetic Vaccine Vectors"; WO 99/41383 to Punnonen et al. "Antigen Library Immunization"; WO 99/41369 to Punnonen et al. "Manipulation of genetic vaccine vector"; WO 99/41368 to Punnonen et al. "Optimization of immunomodulatory properties of genetic vaccines"; EP 752008 by Stemmer and Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly"; EP 0932670 from Stemmer "Evolution of cellular DNA uptake by recursive sequence recombination"; WO 99/23107 by Stemmer et al., "Modification of virus tropism and host rank by transposition of the viral genome"; WO 99/21979 to Apt et al., "Human Papillomavirus Vectors"; WO 98/31837 of del Cardayre et al. "Evolution of whole cells and organisms by recursive sequence recombination"; WO 98/27230 to Patten and Stemmer, "Methods and Compositions for Manipulating Polypeptides"; WO 98/27230 to Stemmer et al., "Methods for optimization of gene therapy by transposition and recursive sequence selection," WO 00/00632, "Methods for generating highly diverse libraries"; WO 00/09679, "Methods for Obtaining Banks and Resulting Sequences of Recombinant Polynucleotides in Vitro"; WO 98/42832 to Arnold et al., "Recombination of polynucleotide sequences using random or defined primers"; WO 99/29902 to Arnold et al., "Method for creating polynucleotide and polypeptide sequences"; WO 98/41653 to Vind, "An in vitro method for constructing a DNA library"; WO 98/41622 by Borchert et al., "Method for constructing a library using DNA rearrangement," and WO 98/42727 by Pati and Zarling, "Sequence alterations using homologous recombination."

Protocolos que pueden usarse para poner en práctica el método (proporcionando detalles con respecto a varios métodos de generación de diversidad) se describen, por ejemplo, en la solicitud de Patente de los Estados Unidos No. de serie 09/407.800, “TRANSPOSICIÓN DE GENES ALTERADOS POR CODONES” de Patten et al. presentada el 28 de set. de 1999; “EVOLUCIÓN DE CÉLULAS Y ORGANISMOS ENTEROS POR RECOMBINACIÓN DE SECUENCIA RECURSIVA” de del Cardayre et al., Patente de los Estados Unidos No.6.379.964; “RECOMBINACIÓN DE ÁCIDO NUCLEICO MEDIADO POR OLIGONUCLEÓTIDOS” de Crameri et al., Patente de los Estados Unidos No. 6.319.714; 6.368.861; 6.376.246; 6.423.542; 6.426.224 y PCT/US00/01203; “USO DE SÍNTESIS DE OLIGONUCLEÓTIDOS VARIADA DE CODONES PARA LA TRANSPOSICIÓN SINTÉTICA” de Welch et al., Patente de los Estados Unidos No. 6.436.675; “MÉTODOS PARA REALIZAR CADENAS DECARACTERES, POLINUCLEÓTIDOS Y POLIPÉPTIDOS CON CARACTERÍSTICAS DESEADAS” de Selifonov etal., presentada el 18 de ene. de 2000, (PCT/US00/01202) y, por ejemplo, “MÉTODOS PARA REALIZAR CADENAS DE CARACTERES, POLINUCLEÓTIDOS Y POLIPÉPTIDOS CON CARACTERÍSTICAS DESEADAS” de Selifonov et al., presentada en 18 de jul. de 2000 (No. de serie de Estados Unidos 09/618.579); “MÉTODOS PARA POBLAR ESTRUCTURAS DE DATOS PARA EL USO EN SIMULACIONES EVOLUTIVAS” de Selifonov y Stemmer, Protocols that can be used to practice the method (providing details regarding various methods of generating diversity) are described, for example, in US Patent Application Serial No. 09 / 407,800, "TRANSPOSITION OF GENES ALTERED BY CODONS ”by Patten et al. presented on September 28. from 1999; "EVOLUTION OF CELLS AND WHOLE ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION" de del Cardayre et al., US Patent No. 6,379,964; "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" by Crameri et al., US Patent No. 6,319,714; 6,368,861; 6,376,246; 6,423,542; 6,426,224 and PCT / US00 / 01203; "USE OF VARIED OLIGONUCLEOTIDE SYNTHESIS OF CODONS FOR SYNTHETIC TRANSPOSITION" by Welch et al., US Patent No. 6,436,675; Selifonov et al. "METHODS FOR MAKING CHARACTER, POLYNUCLEOTID AND POLYPEPTIDE CHAINS WITH DESIRED CHARACTERISTICS", presented on Jan. 18. 2000, (PCT / US00 / 01202) and, for example, “METHODS FOR CONDUCTING CHAINS OF CHARACTERS, POLYNUCLEOTIDES AND POLYPEPTIDES WITH DESIRED CHARACTERISTICS” by Selifonov et al., presented on Jul. 18. 2000 (US Serial No. 09 / 618,579); "METHODS FOR POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS" by Selifonov and Stemmer,

presentada el 18 de ene. de 2000 (PCT/US00/01138); y “RECOMBINACIÓN MEDIADA POR PLANTILLA DE ÁCIDONUCLEICO DE UNA SOLA HEBRA Y AISLAMIENTO DE FRAGMENTOS DE ÁCIDO NUCLEICO” de Affholter, presentada el 6 de set. de 2000 (No. de serie de Estados Unidos 09/656.549); y Patentes de los Estados Unidos No. 6.177.263; 6.153.410. submitted on Jan 18. 2000 (PCT / US00 / 01138); and Affholter's “MEDICALLY MEDICALLY RECOMBINED ON NUCLEIC ACID NUCLEIC ACID FRAGMENTS AND INSULATION”, presented on September 6. 2000 (US Serial No. 09 / 656,549); and United States Patents No. 6,177,263; 6,153,410.

Los métodos no estocásticos o de “evolución dirigida” incluyen, por ejemplo, mutagénesis de saturación, tal como mutagénesis de saturación de sitios de genes (GSSM), reensamblaje de ligación sintética (SLR) o una combinación de los mismos se usan para modificar los ácidos nucleicos divulgados en la presente para generar enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa con propiedades nuevas o alteradas (tal como actividad bajo condiciones altamente ácidas o alcalinas, temperaturas altas o bajas y similares). Los polipéptidos codificados por los ácidos nucleicos modificados pueden someterse a prueba para detectar una actividad antes de evaluarse para la formación de escisión u otra actividad. Puede usarse cualquier modalidad de evaluación o protocolo tal como usar una plataforma de arreglo de capilares. Ver la Patente de los Estados Unidos No. 6.361.974; 6.280.926; Non-stochastic or "directed evolution" methods include, for example, saturation mutagenesis, such as gene site saturation mutagenesis (GSSM), synthetic ligation reassembly (SLR), or a combination thereof are used to modify the Nucleic acids disclosed herein to generate aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase with new or altered properties (such as activity under highly acidic or alkaline conditions, high or low temperatures, and the like). Polypeptides encoded by the modified nucleic acids can be tested for activity before being evaluated for cleavage formation or other activity. Any evaluation modality or protocol can be used such as using a capillary fixation platform. See United States Patent No. 6,361,974; 6,280,926;

5.939.250. 5,939,250.

Mutagénesis de saturación de sitios de genes o GSSM Gene site saturation mutagenesis or GSSM

Se describen además métodos para realizar enzima usando mutagénesis de saturación de sitios de genes o GSSM, como se describe en la presente, y también en la Patente de los Estados Unidos No. 6.171.820 y 6.579.258. En algunas realizaciones, los cebadores de codón que contienen una secuencia N,N,G/T degenerada se usan para introducir mutaciones puntuales en un polinucleótido tal como una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa o un anticuerpo divulgado en la presente de modo de generar un juego de polipéptidos de progenie en los cuales se representa un rango completo de sustituciones de aminoácidos únicos en cada posición de aminoácidos, tal como un residuo de aminoácidos en un sitio activo de enzima o sitio de unión de ligando dirigido para modificarse. Estos oligonucleótidos pueden comprender una primera secuencia homóloga contigua, una secuencia N,N,G/T degenerada y opcionalmente una segunda secuencia homóloga. Los productos translacionales de progenie de corriente abajo del uso de dichos oligonucleótidos incluyen todos los cambios de aminoácidos posibles en cada sitio de aminoácidos a lo largo del polipéptido porque la degeneración de la secuencia N,N,G/T incluye codones para todos los 20 aminoácidos. En algunas realizaciones, un oligonucleótido degenerado (compuesto por un cassette N,N,G/T degenerado) se usa para someter cada codón original en una plantilla de polinucleótido parental a un rango completo de sustituciones de codón. En otras realizaciones, se usan al menos dos cassettes degenerados –ya sea en el mismo oligonucleótido o no, para someter al menos dos codones originales en una plantilla de polinucleótidos parental a un rango completo de sustituciones de codón. Por ejemplo, más de una secuencia N,N,G/T puede estar contenida en un oligonucleótido para introducir mutaciones de aminoácidos en más de un sitio. Esta pluralidad de secuencias N,N,G/T puede ser directamente contigua o separada por una o más secuencias de nucleótidos adicionales. En otras realizaciones, los oligonucleótidos útiles para introducir adiciones y eliminaciones pueden usarse solos o en combinación con los codones que contienen una secuencia N,N,G/T para introducir cualquier combinación o permutación de adiciones, eliminaciones y/o sustituciones de aminoácidos. Methods for making enzyme using gene site saturation mutagenesis or GSSM are further described, as described herein, and also in US Patent No. 6,171,820 and 6,579,258. In some embodiments, codon primers containing a degenerate N, N, G / T sequence are used to introduce point mutations into a polynucleotide such as an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase or a disclosed antibody. herein in order to generate a set of progeny polypeptides representing a full range of unique amino acid substitutions at each amino acid position, such as an amino acid residue at an active enzyme site or ligand binding site directed to modify. These oligonucleotides can comprise a contiguous first homologous sequence, a degenerate N, N, G / T sequence and optionally a second homologous sequence. Downstream translational progeny products from the use of such oligonucleotides include all possible amino acid changes at each amino acid site throughout the polypeptide because N, N, G / T sequence degeneracy includes codons for all 20 amino acids . In some embodiments, a degenerate oligonucleotide (comprised of a degenerate N, N, G / T cassette) is used to subject each original codon in a parent polynucleotide template to a full range of codon substitutions. In other embodiments, at least two degenerate cassettes are used - whether in the same oligonucleotide or not, to subject at least two original codons in a parent polynucleotide template to a full range of codon substitutions. For example, more than one N, N, G / T sequence may be contained in an oligonucleotide to introduce amino acid mutations at more than one site. This plurality of N, N, G / T sequences can be directly contiguous or separated by one or more additional nucleotide sequences. In other embodiments, oligonucleotides useful for introducing additions and deletions can be used alone or in combination with codons that contain an N, N, G / T sequence to introduce any combination or permutation of amino acid additions, deletions, and / or substitutions.

En algunas realizaciones, la mutagenésis simultánea de dos o más posiciones de aminoácidos contiguas se realiza usando un oligonucleótido que contiene tripletes contiguos N,N,G/T, es decir una secuencia (N,N,G/T)n degenerada. En otras realizaciones, se usan cassettes degenerados que tienen menos degeneración que la secuencia N,N,G/T. Por ejemplo, puede desearse en algunos casos que se use (tal como en un oligonucleótido) una secuencia triplete degenerada compuesta de sólo una N, en donde dicha N puede estar en la primera, segunda o tercera posición del triplete. Cualquier otra base que incluye cualquier combinación y permutación de la misma puede usarse en las dos posiciones restantes del triplete. Alternativamente, puede desearse en algunos casos usar (tal como en un oligo) una secuencia de triplete N,N,N degenerada. In some embodiments, simultaneous mutagenesis of two or more contiguous amino acid positions is performed using an oligonucleotide containing contiguous N, N, G / T triplets, ie, a degenerate (N, N, G / T) n sequence. In other embodiments, degenerate cassettes are used that have less degeneration than the N, N, G / T sequence. For example, it may be desired in some cases that a degenerate triplet sequence composed of only one N is used (such as in an oligonucleotide), where said N may be in the first, second, or third position of the triplet. Any other base that includes any combination and permutation of the same can be used in the remaining two positions of the triplet. Alternatively, it may be desired in some cases to use (such as in an oligo) a degenerate N, N, N triplet sequence.

En algunas realizaciones, el uso de tripletes degenerados (tales como tripletes N,N,G/T) permite una generación sistemática y fácil de un rango completo de aminoácidos naturales (para un total de 20 aminoácidos) en todas y cada una de las posiciones de aminoácidos en un polipéptido (en otras realizaciones, los métodos también incluyen la generación de menos de todas las sustituciones posibles por residuo de aminoácido, o codón, posición). Por ejemplo, para un polipéptido de aminoácido 100, se pueden generar 2000 especies distintas (es decir 20 aminoácidos posibles por posición X 100 posiciones de aminoácidos). A través del uso de un oligonucleótido o juego de oligonucleótidos que contienen un triplete N,N,G/T degenerado, 32 secuencias individuales pueden codificar 20 posibles aminoácidos naturales. Por lo tanto, en un recipiente de reacción en el cual una secuencia de polinucleótido parental está sometida a mutagénesis de saturación usando al menos uno de dicho oligonucleótido, se generan 32 polinucleótidos de progenie distintos que codifican 20 polipéptidos distintos. Por contraste, el uso de un oligonucleótido no degenerado en mutagénesis dirigida al sitio conduce sólo a un producto de polipéptido de progenie por recipiente de reacción. Los oligonucleótidos no degenerados pueden usarse opcionalmente en combinación con cebadores degenerados divulgados; por ejemplo, los oligonucleótidos no degenerados pueden usarse para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones puntuales silenciosas específicas, mutaciones puntuales que conducen a cambios de aminoácidos correspondientes y mutaciones puntuales que causan la generación de codones de detención y la expresión correspondiente de fragmentos de polipéptidos. In some embodiments, the use of degenerate triplets (such as N, N, G / T triplets) allows for a systematic and easy generation of a full range of natural amino acids (for a total of 20 amino acids) at each and every position of amino acids in a polypeptide (in other embodiments, the methods also include generating fewer than all possible substitutions for amino acid residue, or codon, position). For example, for a 100 amino acid polypeptide, 2000 different species can be generated (ie 20 possible amino acids per position X 100 amino acid positions). Through the use of an oligonucleotide or set of oligonucleotides containing a degenerate N, N, G / T triplet, 32 individual sequences can encode 20 possible natural amino acids. Therefore, in a reaction vessel in which a parent polynucleotide sequence is subjected to saturation mutagenesis using at least one of said oligonucleotide, 32 different progeny polynucleotides encoding 20 different polypeptides are generated. In contrast, the use of a non-degenerate oligonucleotide in site directed mutagenesis leads to only one progeny polypeptide product per reaction vessel. Non-degenerate oligonucleotides can optionally be used in combination with disclosed degenerate primers; for example, non-degenerate oligonucleotides can be used to generate specific point mutations in a working polynucleotide. This provides a means of generating specific silent point mutations, point mutations that lead to corresponding amino acid changes, and point mutations that cause the generation of stop codons and the corresponding expression of polypeptide fragments.

En algunas realizaciones, cada recipiente de reacción de mutagénesis de saturación contiene polinucleótidos que codifican al menos 20 moléculas de polipéptidos de progenie (tales como una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) de tal modo que todos los 20 aminoácidos naturales se representan en una posición de aminoácidos específica que corresponde a la posición de codones mutagenizado en el polinucleótido parental (otras realizaciones usan menos de 20 combinaciones naturales). Los polipéptidos de progenie degenerados 32 veces generados a partir de cada recipiente de reacción de mutagénesis de saturación pueden estar sujetos a una amplificación clonal (tal como clonados en un huésped adecuado, tal como huésped E. Coli usando por ejemplo un vector de expresión) y someterse a una detección de expresión. Cuando un polipéptido de progenie individual se identifica mediante la detección para mostrar un cambio favorable en la propiedad (cuando se lo compara con el polipéptido parental, tal como formación carbono-carbono aumentada o actividad de escisión bajo condiciones alcalinas o ácidas), puede secuenciarse para identificar la sustitución de aminoácidos favorable contenida en él. In some embodiments, each saturation mutagenesis reaction vessel contains polynucleotides that encode at least 20 progeny polypeptide molecules (such as an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase) such that all the 20 natural amino acids are represented at a specific amino acid position that corresponds to the mutagenized codon position in the parent polynucleotide (other embodiments use less than 20 natural combinations). The 32-fold degenerate progeny polypeptides generated from each saturation mutagenesis reaction vessel can be subject to clonal amplification (such as cloned into a suitable host, such as E. coli host using for example an expression vector) and undergo expression screening. When an individual progeny polypeptide is identified by detection to show a favorable change in property (when compared to the parent polypeptide, such as increased carbon-carbon formation or cleavage activity under alkaline or acidic conditions), it can be sequenced to identify the favorable amino acid substitution contained in it.

En algunas realizaciones, tras mutagenizar todas y cada una de las posiciones de aminoácidos en un polipéptido parental usando mutagénesis de saturación como se divulga en la presente, pueden identificarse cambios de aminoácidos favorables en más de una posición de aminoácidos. Una o más nuevas moléculas de progenie pueden generarse que contienen una combinación de todas o partes de estas sustituciones de aminoácidos favorables. Por ejemplo, si 2 cambios de aminoácidos favorables específicos se identifican en cada una de las 3 posiciones de aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (sin cambio del aminoácido original, y cada uno de dos cambios favorables) y 3 posiciones. Por lo tanto, hay 3×3×3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente – 6 mutaciones puntuales únicas (es decir 2 en cada una de las tres posiciones) y sin cambios en cualquier posición. In some embodiments, after mutagenizing each and every amino acid position in a parent polypeptide using saturation mutagenesis as disclosed herein, favorable amino acid changes can be identified in more than one amino acid position. One or more new progeny molecules can be generated that contain a combination of all or parts of these favorable amino acid substitutions. For example, if 2 specific favorable amino acid changes are identified at each of the 3 amino acid positions in a polypeptide, the permutations include 3 possibilities at each position (no change from the original amino acid, and each of two favorable changes) and 3 positions. Therefore, there are 3 × 3 × 3 or 27 total possibilities, including 7 that were previously examined - 6 unique point mutations (i.e. 2 at each of the three positions) and unchanged at any position.

Aun en otra realización, la mutagénesis de saturación del sitio puede usarse junto con la transposición, quimerización, recombinación y otros procesos de mutagénesis, junto con la detección. Esta invención proporciona el uso de cualquier proceso de mutagénesis, incluyendo mutagénesis de saturación, de un modo iterativo. En un ejemplo, el uso iterativo de cualquier proceso de mutagénesis se usa en combinación con la detección. In yet another embodiment, site saturation mutagenesis can be used in conjunction with rearrangement, chimerization, recombination, and other mutagenesis processes, along with detection. This invention provides the use of any mutagenesis process, including saturation mutagenesis, in an iterative way. In one example, the iterative use of any mutagenesis process is used in combination with detection.

También se divulga el uso de cebadores de codón propios (que contienen una secuencia N,N,N degenerada) para introducir mutaciones puntuales en un polinucleótido, de modo de generar un juego de polipéptidos de progenie en los cuales se representa un rango completo de sustituciones de aminoácidos únicas en cada posición de aminoácidos (mutagénesis de saturación de sitios de genes (GSSM)). Los oligos usados están compuestos contiguamente por una primera secuencia homóloga, una secuencia N,N,N degenerada y en algunas realizaciones pero no necesariamente una segunda secuencia homóloga. Los productos translacionales de progenie de corriente abajo del uso de dichos oligonucleótidos incluyen todos los cambios de aminoácidos posibles en cada sitio de aminoácidos a lo largo del polipéptido porque la degeneración de la secuencia N,N,N incluye codones para los 20 aminoácidos. Also disclosed is the use of proprietary codon primers (containing a degenerate N, N, N sequence) to introduce point mutations into a polynucleotide, so as to generate a set of progeny polypeptides representing a full range of substitutions. of unique amino acids at each amino acid position (gene site saturation mutagenesis (GSSM)). The oligos used are contiguously composed of a first homologous sequence, a degenerate N, N, N sequence and in some embodiments but not necessarily a second homologous sequence. The downstream progeny translational products of the use of such oligonucleotides include all possible amino acid changes at each amino acid site throughout the polypeptide because N, N, N sequence degeneracy includes codons for all 20 amino acids.

En algunas realizaciones, un oligo degenerado (compuesto por un cassette N,N,N degenerado) se usa para someter cada codón original en una plantilla de polinucleótido parental a un rango completo de sustituciones de codón. En otras realizaciones, se usan al menos dos cassettes N,N,N degenerados –ya sea en el mismo oligonucleótido o no, para someter al menos dos codones originales en una plantilla de polinucleótidos parental a un rango completo de sustituciones de codón. Por lo tanto, más de una secuencia N,N,N puede estar contenida en un oligo para introducir mutaciones de aminoácidos en más de un sitio. Esta pluralidad de secuencias N,N,N puede ser directamente contigua o separada por una o más secuencias de nucleótidos adicionales. Esta pluralidad de secuencias N,N,N puede ser directamente contigua o estar separada por una o más secuencias de nucleótidos adicionales. En otras realizaciones, los oligos útiles para introducir adiciones y eliminaciones pueden usarse solos o en combinación con los codones que contienen una secuencia N,N,N para introducir cualquier combinación o permutación de adiciones, eliminaciones y/o sustituciones de aminoácidos. In some embodiments, a degenerate oligo (consisting of a degenerate N, N, N cassette) is used to subject each original codon in a parent polynucleotide template to a full range of codon substitutions. In other embodiments, at least two degenerate N, N, N cassettes are used - whether in the same oligonucleotide or not, to subject at least two original codons in a parent polynucleotide template to a full range of codon substitutions. Therefore, more than one N, N, N sequence may be contained in an oligo to introduce amino acid mutations at more than one site. This plurality of N, N, N sequences can be directly contiguous or separated by one or more additional nucleotide sequences. This plurality of N, N, N sequences can be directly contiguous or separated by one or more additional nucleotide sequences. In other embodiments, useful oligos for introducing additions and deletions can be used alone or in combination with codons containing an N, N, N sequence to introduce any combination or permutation of additions, deletions and / or amino acid substitutions.

En algunas realizaciones es posible mutagenizar simultáneamente dos o más posiciones de aminoácidos contiguas usando un oligonucleótido que contiene tripletes contiguos N,N,N, es decir una secuencia (N,N,N)n degenerada. También se describe el uso de cassettes degenerados que tienen menos degeneración que la secuencia N,N,N. Por ejemplo, puede desearse en algunos casos que se use (tal como en un oligo) una secuencia triplete degenerada compuesta de sólo una N, en donde dicha N puede estar en la primera, segunda o tercera posición del triplete. Cualquier otra base que incluye cualquier combinación y permutación de la misma puede usarse en las dos posiciones restantes del triplete. Alternativamente, puede desearse en algunos casos usar (tal como en un oligo) una secuencia de triplete N,N,N degenerada, una secuencia de triplete N,N,G/T o N,N,G/C. In some embodiments, it is possible to simultaneously mutagenize two or more contiguous amino acid positions using an oligonucleotide containing contiguous N, N, N triplets, ie, a degenerate (N, N, N) n sequence. The use of degenerate cassettes that have less degeneration than the N, N, N sequence is also described. For example, in some cases it may be desired to use (such as in an oligo) a degenerate triplet sequence consisting of only one N, where said N may be in the first, second, or third position of the triplet. Any other base that includes any combination and permutation of the same can be used in the remaining two positions of the triplet. Alternatively, it may be desired in some cases to use (such as in an oligo) a degenerate N, N, N triplet sequence, an N, N, G / T or N, N, G / C triplet sequence.

En algunas realizaciones, el uso de un triplete degenerado (tal como una secuencia de triplete N,N,G/T o N,N,G/C) es ventajosa por varias razones. Esta divulgación proporciona medios para generar sistemáticamente y relativamente fácilmente la sustitución del rango completo de aminoácidos posibles (para un total de 20 aminoácidos) en todas y cada una de las posiciones de aminoácidos en un polipéptido. Por lo tanto, para un polipéptido de aminoácido 100, la divulgación proporciona medios para generar sistemáticamente y relativamente fácilmente 2000 especies distintas (es decir, 20 aminoácidos posibles por 100 posiciones de aminoácidos). Se aprecia que se proporciona, a través del uso de un oligo que contiene una secuencia de triplete N,N,G/T o N,N,G/C In some embodiments, the use of a degenerate triplet (such as an N, N, G / T, or N, N, G / C triplet sequence) is advantageous for several reasons. This disclosure provides means for systematically and relatively easily generating the replacement of the full range of possible amino acids (for a total of 20 amino acids) at each and every amino acid position in a polypeptide. Therefore, for a 100 amino acid polypeptide, the disclosure provides a means for systematically and relatively easily generating 2000 distinct species (ie, 20 possible amino acids per 100 amino acid positions). It is appreciated that it is provided, through the use of an oligo containing a triplet sequence N, N, G / T or N, N, G / C

degenerada, 32 secuencias individuales que codifican 20 aminoácidos posibles. Por lo tanto, en un recipiente de reacción en el cual una secuencia de polinucleótido parental está sometida a mutagénesis de saturación usando al menos uno de dicho oligo, se generan 32 polinucleótidos de progenie distintos que codifican 20 polipéptidos distintos. Por contraste, el uso de un oligo no degenerado en mutagénesis dirigida al sitio conduce sólo a un producto de polipéptido de progenie por recipiente de reacción. degenerate, 32 individual sequences encoding 20 possible amino acids. Therefore, in a reaction vessel in which a parent polynucleotide sequence is subjected to saturation mutagenesis using at least one of said oligo, 32 different progeny polynucleotides encoding 20 different polypeptides are generated. In contrast, the use of a non-degenerate oligo in site directed mutagenesis leads to only one progeny polypeptide product per reaction vessel.

También se describe el uso de oligos no degenerados, que pueden opcionalmente usarse en combinación con cebadores degenerados divulgados. Se aprecia que en algunas situaciones, es ventajoso usar oligos no degenerados para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones puntuales silenciosas específicas, mutaciones puntuales que conducen a cambios de aminoácidos correspondientes y mutaciones puntuales que causan la generación de codones de detención y la expresión correspondiente de fragmentos de polipéptidos. The use of non-degenerate oligos is also described, which can optionally be used in combination with disclosed degenerate primers. It is appreciated that in some situations, it is advantageous to use non-degenerate oligos to generate specific point mutations in a working polynucleotide. This provides a means of generating specific silent point mutations, point mutations that lead to corresponding amino acid changes, and point mutations that cause the generation of stop codons and the corresponding expression of polypeptide fragments.

Por lo tanto, en algunas realizaciones, cada recipiente de reacción de mutagénesis de saturación contiene polinucleótidos que codifican al menos 20 moléculas de polipéptido de progenie de modo que todos los 20 aminoácidos se representen en una posición de aminoácidos específica que corresponde a la posición de codón mutagenizado en el polinucleótido parental. Los polipéptidos de progenie degenerados 32 veces generados a partir de cada recipiente de reacción de mutagénesis de saturación pueden estar sujetos a una amplificación clonal (tal como clonados en un huésped adecuado de E. Coli usando un vector de expresión) y someterse a una detección de expresión. Cuando un polipéptido de progenie individual se identifica detectando para mostrar un cambio favorable en la propiedad (cuando se compara con el polipéptido parental) puede secuenciarse para identificar la sustitución de aminoácido favorable correspondiente contenida en el mismo. Therefore, in some embodiments, each saturation mutagenesis reaction vessel contains polynucleotides that encode at least 20 progeny polypeptide molecules so that all 20 amino acids are represented at a specific amino acid position corresponding to the codon position. mutagenized in the parent polynucleotide. 32-fold degenerate progeny polypeptides generated from each saturation mutagenesis reaction vessel can be subjected to clonal amplification (such as cloned into a suitable E. coli host using an expression vector) and subjected to detection of expression. When an individual progeny polypeptide is identified by detecting to show a favorable change in property (when compared to the parent polypeptide) it can be sequenced to identify the corresponding favorable amino acid substitution contained therein.

En algunas realizaciones, tras mutagenizar todas y cada una de las posiciones de aminoácidos en un polipéptido parental usando mutagénesis de saturación como se divulga en la presente, pueden identificarse cambios de aminoácidos favorables en más de una posición de aminoácidos. Una o más nuevas moléculas de progenie pueden generarse que contienen una combinación de todas o partes de estas sustituciones de aminoácidos favorables. Por ejemplo, si 2 cambios de aminoácidos favorables específicos se identifican en cada una de las 3 posiciones de aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (sin cambio del aminoácido original, y cada uno de dos cambios favorables) y 3 posiciones. Por lo tanto, hay 3×3×3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente – 6 mutaciones puntuales únicas (es decir 2 en cada una de las tres posiciones) y sin cambios en cualquier posición. In some embodiments, after mutagenizing each and every amino acid position in a parent polypeptide using saturation mutagenesis as disclosed herein, favorable amino acid changes can be identified in more than one amino acid position. One or more new progeny molecules can be generated that contain a combination of all or parts of these favorable amino acid substitutions. For example, if 2 specific favorable amino acid changes are identified at each of the 3 amino acid positions in a polypeptide, the permutations include 3 possibilities at each position (no change from the original amino acid, and each of two favorable changes) and 3 positions. Therefore, there are 3 × 3 × 3 or 27 total possibilities, including 7 that were previously examined - 6 unique point mutations (i.e. 2 at each of the three positions) and unchanged at any position.

También se describe el uso de mutagénesis de saturación en combinación con procesos de mutagenización adicionales, tales como un proceso en donde dos o más polinucleótidos relacionados se introducen en una célula huésped adecuada de tal modo que se genera un polinucleótido híbrido mediante recombinación y reordenamiento reductor. Also described is the use of saturation mutagenesis in combination with additional mutagenization processes, such as a process where two or more related polynucleotides are introduced into a suitable host cell such that a hybrid polynucleotide is generated by recombination and reductive rearrangement.

Además de realizar mutagénesis a lo largo de la secuencia entera de un gen, la presente invención proporciona que la mutagénesis puede usarse para reemplazar cada uno de cualquier número de bases en una secuencia de polinucleótido, en donde el número de bases a ser mutagenizado es, en algunas realizaciones, cualquier entero de 15 a 100000. Por lo tanto, en vez de mutagenizar cada posición a lo largo de una molécula, se puede someter cada In addition to performing mutagenesis throughout the entire sequence of a gene, the present invention provides that mutagenesis can be used to replace each of any number of bases in a polynucleotide sequence, where the number of bases to be mutagenized is, in some embodiments, any integer from 15 to 100,000. Therefore, instead of mutagenizing each position across a molecule, each can be subjected

o un número discreto de bases (en algunas realizaciones un subconjunto que tiene en su totalidad de 15 a 100000) para la mutagénesis. En algunas realizaciones, se usa un nucleótido separado para mutagenizar cada posición o grupo de posiciones a lo largo de una secuencia de polinucleótidos. Un grupo de 3 posiciones a ser mutagenizadas puede ser un codón. Las mutaciones pueden introducirse usando un cebador mutagénico, que contiene un cassette heterólogo, también denominado cassette mutagénico. Ejemplos de cassettes pueden tener de 1 a 500 bases. Cada posición de nucleótidos en dichos cassettes heterólogos son N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G o E, donde E es cualquier base que no es A, C, G, o T (E puede referirse como un oligo de diseñador). or a discrete number of bases (in some embodiments a subset having in its entirety from 15 to 100,000) for mutagenesis. In some embodiments, a separate nucleotide is used to mutagenize each position or group of positions along a polynucleotide sequence. A group of 3 positions to be mutagenized can be a codon. Mutations can be introduced using a mutagenic primer, which contains a heterologous cassette, also called a mutagenic cassette. Examples of cassettes can have from 1 to 500 bases. Each nucleotide position in said heterologous cassettes is N, A, C, G, T, A / C, A / G, A / T, C / G, C / T, G / T, C / G / T, A / G / T, A / C / T, A / C / G or E, where E is any base that is not A, C, G, or T (E may refer to as a designer oligo).

En algunas realizaciones, la mutagénesis de saturación está compuesta por la mutagénesis de un juego completo de cassettes mutagénicos (en donde cada cassette es, en algunas realizaciones, de aproximadamente 1-500 bases de longitud) en secuencia de polinucleótido definida para ser mutagenizados (en donde la secuencia a ser mutagenizada es, en algunas realizaciones, de aproximadamente 15 a 100000 bases de longitud). Por lo tanto, un grupo de mutaciones (que están en el rango de 1 a 100 mutaciones) se introduce en cada cassette para mutagenizarse. Un agrupamiento de mutaciones a ser introducidas en un cassette puede ser diferente o el mismo que un segundo agrupamiento de mutaciones a introducirse en un segundo cassette durante la aplicación de una ronda de mutagénesis de saturación. Dichos agrupamientos se ejemplifican mediante eliminaciones, adiciones, agrupamientos de codones particulares y agrupamientos de cassettes de nucleótidos particulares. In some embodiments, saturation mutagenesis is comprised of the mutagenesis of a complete set of mutagenic cassettes (where each cassette is, in some embodiments, approximately 1-500 bases in length) in defined polynucleotide sequence to be mutagenized (in where the sequence to be mutagenized is, in some embodiments, approximately 15 to 100,000 bases in length). Therefore, a group of mutations (ranging from 1 to 100 mutations) is introduced into each cassette to mutagenize. A cluster of mutations to be introduced into a cassette may be different or the same as a second cluster of mutations to be introduced into a second cassette during the application of a round of saturation mutagenesis. Such clusters are exemplified by deletions, additions, clusters of particular codons, and clusters of particular nucleotide cassettes.

En algunas realizaciones, las secuencias definidas a mutagenizarse incluyen un gen entero, vía, ADNc, un marco de lectura abierto (ORF) y un promotor entero, potenciador, represor/transactivador, origen de replicación, intrón, operador o cualquier grupo funcional de polinucleótido. Generalmente, una “secuencia definida” para este objetivo puede ser cualquier polinucleótido que tiene una secuencia de polinucleótidos de 15 bases y secuencias de polinucleótidos de longitudes de entre 15 bases y 15000 bases (esta invención específicamente nombra cada entero In some embodiments, the defined sequences to be mutagenized include an entire gene, pathway, cDNA, an open reading frame (ORF), and an entire promoter, enhancer, repressor / transactivator, origin of replication, intron, operator, or any functional group of polynucleotides. . Generally, a "defined sequence" for this purpose can be any polynucleotide that has a 15 base polynucleotide sequence and polynucleotide sequences of lengths between 15 bases and 15000 bases (this invention specifically names each integer

entre medio). Las consideraciones para elegir grupos de codones incluyen tipos de aminoácidos codificados por un cassette mutagénico degenerado. In between). Considerations for choosing codon groups include amino acid types encoded by a degenerate mutagenic cassette.

En algunas realizaciones, un agrupamiento de mutaciones que pueden introducirse en un cassette mutagénico, esta invención proporciona específicamente sustituciones de codones degenerados (usando oligos degenerados) que codifican 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 y 20 aminoácidos en cada posición y una biblioteca de polipéptidos codificados de ese modo. In some embodiments, a grouping of mutations that can be introduced into a mutagenic cassette, this invention specifically provides degenerate codon substitutions (using degenerate oligos) encoding 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, and 20 amino acids at each position and a library of polypeptides encoded thereby.

Reensamblaje de ligación sintética (SLR) Synthetic Ligation Reassembly (SLR)

También se describe un sistema de modificación génica no estocástico denominado “reensamblaje de ligación sintética” o simplemente “SLR”, un “proceso de evolución dirigida” para generar polipéptidos, tales como enzimas o anticuerpos de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente, con propiedades nuevas o alteradas. Also described is a non-stochastic gene modification system called "synthetic ligation reassembly" or simply "SLR", a "directed evolution process" to generate polypeptides, such as enzymes or aldolase antibodies, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, with new or altered properties.

El SLR es un método de ligar fragmentos de oligonucleótidos no estocásticamente. Este método difiere de la transposición de oligonucleótidos estocástica en que los bloques de construcción de ácido nucleico no se transponen, concatenan o quimerizan aleatoriamente, sino que se ensamblan no estocásticamente. Ver la Patente de los Estados Unidos No. 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776. En algunas realizaciones, el SLR comprende las siguientes etapas: (a) proporcionar un polinucleótido de plantilla, en donde el polinucleótido de plantilla comprende secuencia que codifica un gen homólogo; (b) proporcionar una pluralidad de polinucleótidos de bloque de construcción, en donde los polinucleótidos de bloque de construcción se diseñan para reensamblarse en cruce con el polinucleótido de plantilla en una secuencia predeterminada, y un polinucleótido de bloque de construcción comprende una secuencia que es una variante del gen homólogo y una secuencia homóloga al polinucleótido de plantilla que flanquea la secuencia variante; (c) combinar un polinucleótido de bloque de construcción con un polinucleótido de plantilla de tal modo que el cruce de polinucleótido de bloque de construcción se reensamble con el polinucleótido de plantilla para generar polinucleótidos que comprenden variaciones de secuencia de gen homólogo. SLR is a method of ligation of oligonucleotide fragments non-stochastically. This method differs from stochastic oligonucleotide rearrangement in that the nucleic acid building blocks are not randomly transposed, concatenated, or chimerized, but assembled non-stochastically. See United States Patent No. 6,773,900; 6,740,506; 6,713,282; 6,635,449; 6,605,449; 6,537,776. In some embodiments, the SLR comprises the following steps: (a) providing a template polynucleotide, wherein the template polynucleotide comprises sequence encoding a homologous gene; (b) providing a plurality of building block polynucleotides, wherein the building block polynucleotides are designed to be reassembled in intersection with the template polynucleotide in a predetermined sequence, and a building block polynucleotide comprises a sequence that is a variant of the homologous gene and a sequence homologous to the template polynucleotide flanking the variant sequence; (c) combining a building block polynucleotide with a template polynucleotide such that the building block polynucleotide cross-over is reassembled with the template polynucleotide to generate polynucleotides comprising homologous gene sequence variations.

El SLR no depende de la presencia de altos niveles de homología entre polinucleótidos para redisponerse. Por lo tanto, este método puede usarse para generar bibliotecas (o conjuntos) no estocásticamente de moléculas de progenie compuestas por más de 10100 quimeras diferentes. El SLR puede usarse para generar bibliotecas compuestas por más de 101000 quimeras diferentes. Por lo tanto, realizaciones incluyen métodos no estocásticos para producir un juego de moléculas de ácido nucleico quimérico finalizado con un orden de ensamblaje general que se elige por diseño. Este método incluye las etapas de generar por diseño una pluralidad de bloques de construcción de ácido nucleico específicos que tienen extremos ligables compatibles mutuamente y ensamblar estos bloques de construcción de ácido nucleico de tal modo que se logre un orden de ensamblaje general diseñado. SLR does not depend on the presence of high levels of homology between polynucleotides to rearrange itself. Therefore, this method can be used to generate non-stochastically libraries (or pools) of progeny molecules composed of more than 10,100 different chimeras. The SLR can be used to generate libraries made up of more than 101,000 different chimeras. Therefore, embodiments include non-stochastic methods of producing a finished chimeric nucleic acid molecule set with a general assembly order that is chosen by design. This method includes the steps of generating by design a plurality of specific nucleic acid building blocks having mutually compatible linkable ends and assembling these nucleic acid building blocks in such a way that a general designed assembly order is achieved.

Los extremos ligables compatibles mutuamente de los bloques de construcción de ácido nucleico a ensamblarse se consideran como “útiles” para este tipo de ensamblaje ordenado si permiten que los bloques de construcción se acoplen en órdenes predeterminados. Por lo tanto, el orden de ensamblaje general en el cual los bloques de construcción de ácido nucleico pueden acoplarse se especifica por el diseño de los extremos ligables. Si se usa más de una etapa de ensamblaje, entonces el orden de ensamblaje general en el cual los bloques de construcción de ácido nucleico pueden acoplarse también se especifica por el orden secuencial de las etapas de ensamblaje. En algunas realizaciones, las piezas de construcción apareadas se tratan con una enzima, tal como una ligasa (tal como ligasa ADN T4) para lograr la unión covalente de las piezas de construcción. The mutually compatible linkable ends of the nucleic acid building blocks to be assembled are considered "useful" for this type of ordered assembly if they allow the building blocks to mate in predetermined orders. Therefore, the general order of assembly in which the nucleic acid building blocks can be coupled is specified by the design of the linkable ends. If more than one assembly step is used, then the general assembly order in which the nucleic acid building blocks can be coupled is also specified by the sequential order of the assembly steps. In some embodiments, the paired building pieces are treated with an enzyme, such as a ligase (such as T4 DNA ligase) to achieve covalent binding of the building pieces.

Los extremos ligables compatibles mutuamente de los bloques de construcción de ácido nucleico a ensamblarse se consideran como “útiles” para este tipo de ensamblaje ordenado si permiten que los bloques de construcción se acoplen en órdenes predeterminados. Estas plantillas de oligonucleótido parental sirven por lo tanto como una fuente de información de secuencia que ayuda en el diseño de los bloques de construcción de ácido nucleico a mutagenizarse, tal como quimerizarse o transponerse. En algunas realizaciones de este método, las secuencias de una pluralidad de plantillas de ácido nucleico parental se alinean de modo de seleccionar uno o más puntos de demarcación. Los puntos de demarcación pueden estar ubicados en un área de homología y están compuestos por uno o más nucleótidos. Estos puntos de demarcación En algunas realizaciones son compartidos por al menos dos de las plantillas progenitoras. Los puntos de demarcación pueden usarse de ese modo para delinear los límites de los bloques de construcción de oligonucleótidos para generarse de modo de redisponer los polinucleótidos parentales. Los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos de quimerización potencial en el ensamblaje de las moléculas de progenie quiméricas finales. Un punto de demarcación puede ser un área de homología (compuesta de al menos una base de nucleótido homóloga) compartida por al menos dos secuencias de polinucleótido parentales. Alternativamente, un punto de demarcación puede ser un área de homología que está compartida por al menos la mitad de las secuencias de polinucleótidos parentales, o puede ser un área de homología que está compartida por al menos dos tercios de las secuencias de polinucleótido parental. Aun más, en algunas realizaciones, los puntos de demarcación útiles son un área de homología que está compartida por al menos tres cuartos de las secuencias de polinucleótidos parentales o puede estar compartida por casi todas las secuencias de polinucleótidos parentales. En algunas realizaciones, un punto de demarcación es un área de homología que está compartida por todas las secuencias de polinucleótidos parentales. The mutually compatible linkable ends of the nucleic acid building blocks to be assembled are considered "useful" for this type of ordered assembly if they allow the building blocks to mate in predetermined orders. These parental oligonucleotide templates therefore serve as a source of sequence information that aids in the design of the nucleic acid building blocks to be mutagenized, such as chimerized or transposed. In some embodiments of this method, the sequences of a plurality of parental nucleic acid templates are aligned so as to select one or more demarcation points. The demarcation points may be located in a homology area and are composed of one or more nucleotides. These demarcation points In some embodiments they are shared by at least two of the parent templates. The demarcation points can thus be used to delineate the boundaries of the oligonucleotide building blocks to be generated so as to rearrange the parent polynucleotides. The identified and selected demarcation points on the progenitor molecules serve as potential chimerization points in the assembly of the final chimeric progeny molecules. A demarcation point can be an area of homology (consisting of at least one homologous nucleotide base) shared by at least two parental polynucleotide sequences. Alternatively, a demarcation point can be an area of homology that is shared by at least half of the parent polynucleotide sequences, or it can be an area of homology that is shared by at least two thirds of the parent polynucleotide sequences. Furthermore, in some embodiments, useful demarcation points are an area of homology that is shared by at least three-fourths of the parent polynucleotide sequences or may be shared by almost all of the parent polynucleotide sequences. In some embodiments, a demarcation point is an area of homology that is shared by all parental polynucleotide sequences.

En algunas realizaciones, se realiza un proceso de reensamblaje de ligación exhaustivamente para generar una biblioteca exhaustiva de polinucleótidos quiméricos de progenie. En otras palabras, todas las combinaciones ordenadas posibles de los bloques de construcción de ácido nucleico se representan en el juego de moléculas de ácido nucleico quimérico finalizado. Al mismo tiempo, en otras realizaciones, el orden de ensamblaje (es decir el orden de ensamblaje de cada bloque de construcción en la secuencia 5’ o 3 de cada ácido nucleico quimerizado finalizado) en cada combinación es por diseño (o no estocástico) como se describió anteriormente. Dada la naturaleza no estocástica de la presente invención, la posibilidad de productos derivados indeseados se reduce en gran medida. In some embodiments, a ligation reassembly process is performed extensively to generate a comprehensive library of progeny chimeric polynucleotides. In other words, all possible ordered combinations of the nucleic acid building blocks are represented in the finished chimeric nucleic acid molecule set. At the same time, in other embodiments, the order of assembly (i.e. the order of assembly of each building block in the 5 'or 3 sequence of each terminated chimeric nucleic acid) in each combination is by design (or non-stochastic) as previously described. Given the non-stochastic nature of the present invention, the possibility of unwanted derivative products is greatly reduced.

En otras realizaciones, el método de reensamblaje de ligación se realiza sistemáticamente. Por ejemplo, el método se realiza de modo de generar una biblioteca compartimentada sistemáticamente de moléculas de progenie, con compartimentos que pueden analizarse sistemáticamente, tal como uno por uno. A través del uso selectivo y con criterio de bloques de construcción de ácido nucleico específicos, acoplados con el uso selectivo y con criterio de reacciones de ensamblaje escalonadas secuencialmente, puede lograrse un diseño donde se hagan juegos específicos de productos de progenie en cada uno de los varios recipientes de reacción. Esto permite que se realice un examen sistemático y un procedimiento de detección. Por lo tanto, estos métodos permiten que se examine sistemáticamente un gran número posible de moléculas de progenie en grupos más pequeños. Dada su capacidad de realizar quimerizaciones de un modo que es altamente flexible pero exhaustivo y también sistemático, en particular cuando hay un bajo nivel de homología entre las moléculas progenitoras, estos métodos proporcionan la generación de una biblioteca (o juego) compuesto de un gran número de moléculas de progenie. Dada la naturaleza no estocástica de la presente invención de reensamblaje de ligación, las moléculas de progenie generadas en algunas realizaciones comprenden una biblioteca de moléculas de ácido nucleico quimerizado finalizadas que tienen un orden de ensamblaje general que se elige por diseño. Los métodos de mutagénesis de saturación y evolución dirigida optimizada también pueden usarse para generar diferentes especies moleculares de progenie. Se aprecia que la divulgación proporciona libertad de elección y control con respecto a la selección de los puntos de demarcación, el tamaño y el número de los bloques de construcción de ácido nucleico y el tamaño y el diseño de los acoples. Asimismo se aprecia que el requisito para la homología intermolecular es altamente relajado para la operabilidad de la presente invención. De hecho, los puntos de demarcación pueden incluso elegirse en áreas de pequeña homología o no homología intermolecular. Por ejemplo, debido a un abultamiento de codón, es decir la degeneración de codones, las sustituciones de nucleótidos pueden introducirse en bloques de construcción de ácido nucleico sin alterar el aminoácido codificado originalmente en la plantilla progenitora correspondiente. Alternativamente, un codón puede alterarse de tal modo que se altere la codificación para un aminoácido original. Dichas sustituciones pueden introducirse en el bloque de construcción de ácido nucleico para mejorar la incidencia de puntos de demarcación homólogos intermoleculares y por lo tanto permitir que se logre un número aumentado de acoples entre los bloques de construcción, que a su vez permite que se genere un número mayor de moléculas quiméricas de progenie. In other embodiments, the ligation reassembly method is systematically performed. For example, the method is performed so as to generate a systematically compartmentalized library of progeny molecules, with compartments that can be systematically analyzed, such as one by one. Through the selective and judicious use of specific nucleic acid building blocks coupled with the selective use and judgment of sequentially staggered assembly reactions, a design can be achieved where specific sets of progeny products are made in each of the various reaction vessels. This allows for a systematic examination and screening procedure. Therefore, these methods allow a large number of progeny molecules to be systematically examined in smaller groups. Given their ability to perform chimerizations in a way that is highly flexible but comprehensive and also systematic, particularly when there is a low level of homology between the parent molecules, these methods provide the generation of a library (or set) composed of a large number of progeny molecules. Given the non-stochastic nature of the present ligation reassembly invention, the progeny molecules generated in some embodiments comprise a library of finished chimerized nucleic acid molecules having a general assembly order which is chosen by design. Optimized directed evolution and saturation mutagenesis methods can also be used to generate different molecular species of progeny. It is appreciated that the disclosure provides freedom of choice and control with respect to selection of demarcation points, size and number of nucleic acid building blocks, and size and design of couplings. It is also appreciated that the requirement for intermolecular homology is highly relaxed for the operability of the present invention. In fact, demarcation points can even be chosen in areas of small intermolecular homology or non-homology. For example, due to codon bulking, ie codon degeneration, nucleotide substitutions can be introduced into nucleic acid building blocks without altering the amino acid originally encoded in the corresponding parent template. Alternatively, a codon can be altered such that the coding for an original amino acid is altered. Such substitutions can be introduced into the nucleic acid building block to improve the incidence of homologous intermolecular demarcation points and thus allow an increased number of couplings to be achieved between the building blocks, which in turn allows a greater number of chimeric progeny molecules.

Reensamblaje de gen sintético Synthetic gene reassembly

También se divulga un método no estocástico denominado reensamblaje de gen sintético, que de algún modo se relaciona con la transposición estocástica, salvo que los bloques de construcción de ácido nucleico no se transponen A non-stochastic method called synthetic gene reassembly is also disclosed, which is somehow related to stochastic rearrangement, except that the nucleic acid building blocks are not transposed

o concatenan o quimerizan aleatoriamente, sino que se ensamblan no estocásticamente. Ver la Patente de los Estados Unidos No. 6.537.776. or concatenate or chimerize randomly, but are assembled non-stochastically. See United States Patent No. 6,537,776.

El método de reensamblaje de gen sintético no depende de la presencia de un alto nivel de homología entre polinucleótidos para transponerse. El método puede usarse para generar bibliotecas (o conjuntos) no estocásticamente de moléculas de progenie compuestas de más de 10100 quimeras diferentes. Posiblemente, el reensamblaje de gen sintético puede usarse aun para generar bibliotecas compuestas por más de 101000 quimeras de progenie diferentes. The synthetic gene reassembly method does not depend on the presence of a high level of homology between polynucleotides to be transposed. The method can be used to generate non-stochastically libraries (or pools) of progeny molecules composed of more than 10,100 different chimeras. Possibly, the synthetic gene reassembly can still be used to generate libraries made up of more than 101,000 different progeny chimeras.

Por lo tanto, se divulga un método no estocástico de producir un juego de moléculas de ácido nucleico quimérico finalizado que tiene un orden de ensamblaje general que se elige por diseño, cuyo método está compuesto por las etapas de generar por diseño una pluralidad de bloques de construcción de ácido nucleico específicos que tienen extremos ligables compatibles mutuamente útiles y ensamblar estos bloques de construcción de ácido nucleico de tal modo que se logre un orden de ensamblaje general diseñado. Therefore, a non-stochastic method of producing a finished chimeric nucleic acid molecule set is disclosed having a general assembly order which is chosen by design, which method is comprised of the steps of generating by design a plurality of blocks of specific nucleic acid construction having mutually useful compatible linkable ends and assembling these nucleic acid building blocks such that a designed overall assembly order is achieved.

Los extremos ligables compatibles mutuamente de los bloques de construcción de ácido nucleico a ensamblarse se consideran como “útiles” para este tipo de ensamblaje ordenado si permiten que los bloques de construcción se acoplen en órdenes predeterminados. Por lo tanto, en algunas realizaciones, el orden de ensamblaje general en el cual los bloques de construcción de ácido nucleico pueden acoplarse está especificado por el diseño de los extremos ligables y, si se usa más de una etapa de ensamblaje, entonces el orden de ensamblaje general en el cual los bloques de construcción de ácido nucleico pueden acoplarse también está especificado por el orden secuencial de las etapas de ensamblaje. En una realización, las piezas de construcción apareadas se tratan con una enzima, tal como una ligasa (tal como ligasa ADN T4) para lograr la unión covalente de las piezas de construcción. The mutually compatible linkable ends of the nucleic acid building blocks to be assembled are considered "useful" for this type of ordered assembly if they allow the building blocks to mate in predetermined orders. Therefore, in some embodiments, the general assembly order in which the nucleic acid building blocks can be coupled is specified by the design of the ligatable ends and, if more than one assembly step is used, then the order of General assembly in which nucleic acid building blocks can be coupled is also specified by the sequential order of the assembly steps. In one embodiment, the paired building pieces are treated with an enzyme, such as a ligase (such as T4 DNA ligase) to achieve covalent binding of the building pieces.

En otra realización, el diseño de bloques de construcción de ácido nucleico se obtiene tras el análisis de las secuencias de un juego de plantillas de ácido nucleico progenitor que sirve como base para producir un juego de progenie de moléculas de ácido nucleico quimérico finalizado. Estas plantillas de ácido nucleico progenitor sirven por lo tanto como una fuente de información de secuencia que ayuda en el diseño de los bloques de construcción de ácido nucleico a mutagenizarse, es decir como quimerizarse o transponerse. In another embodiment, the nucleic acid building block design is obtained after analysis of the sequences of a set of parent nucleic acid templates that serves as the basis for producing a finished set of chimeric nucleic acid molecules. These parent nucleic acid templates therefore serve as a source of sequence information that aids in the design of the nucleic acid building blocks to be mutagenized, i.e. chimerized or transposed.

En un ejemplo, la divulgación proporciona la quimerización de una familia de genes relacionados y su familia codificada de productos relacionados. En un ejemplo particular, los productos codificados son enzimas. Las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgadas en la presente pueden mutagenizarse de acuerdo con los métodos descritos en la presente. In one example, the disclosure provides for the chimerization of a family of related genes and their encoded family of related products. In a particular example, the encoded products are enzymes. The aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein can be mutagenized according to the methods described herein.

Por lo tanto, de acuerdo con una realización, las secuencias de una pluralidad de plantillas de ácido nucleico progenitoras (tales como polinucleótidos de acuerdo con la invención) se alinean en orden para seleccionar uno o más puntos de demarcación, los cuales pueden ubicarse en un área de homología. Los puntos de demarcación pueden usarse para delinear los límites de los bloques de construcción de ácido nucleico para que se generen. Por lo tanto, los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos de quimerización potenciales en el ensamblaje de las moléculas de progenie. Therefore, according to one embodiment, the sequences of a plurality of progenitor nucleic acid templates (such as polynucleotides according to the invention) are aligned in order to select one or more demarcation points, which can be located in a homology area. The demarcation points can be used to delineate the boundaries of the nucleic acid building blocks to be generated. Therefore, the identified and selected demarcation points on the progenitor molecules serve as potential chimerization points in the assembly of the progeny molecules.

En algunas realizaciones, un punto de demarcación útil es un área de homología (compuesta de al menos una base de nucleótidos homóloga) compartida por al menos dos plantillas progenitoras, pero el punto de demarcación puede ser un área de homología que está compartida por al menos la mitad de las plantillas progenitoras, al menos dos tercios de las plantillas progenitoras, al menos tres cuartos de las plantillas progenitoras y en algunas realizaciones casi todas las plantillas progenitoras. Aun más, en algunas realizaciones aun un punto de demarcación útil es un área de homología que está compartida por todas las plantillas progenitoras. In some embodiments, a useful demarcation point is an area of homology (comprised of at least one homologous nucleotide base) shared by at least two parent templates, but the demarcation point may be an area of homology that is shared by at least half of the parent templates, at least two-thirds of the parent templates, at least three-fourths of the parent templates and in some embodiments almost all the parent templates. Furthermore, in some embodiments even a useful demarcation point is an area of homology that is shared by all parent templates.

En una realización, el proceso de reensamblaje de gen se realiza exhaustivamente de modo de generar una biblioteca exhaustiva. En otras palabras, todas las combinaciones ordenadas posibles de los bloques de construcción de ácido nucleico se representan en el juego de moléculas de ácido nucleico quimérico finalizado. Al mismo tiempo, el orden de ensamblaje (es decir el orden de ensamblaje de cada bloque de construcción en la secuencia 5’ o 3 de cada ácido nucleico quimerizado finalizado) en cada combinación es por diseño (o no estocástico). Dada la naturaleza no estocástica de este método, la posibilidad de productos derivados indeseados se reduce en gran medida. In one embodiment, the gene reassembly process is exhaustively performed in order to generate a comprehensive library. In other words, all possible ordered combinations of the nucleic acid building blocks are represented in the finished chimeric nucleic acid molecule set. At the same time, the order of assembly (ie the order of assembly of each building block in the 5 'or 3 sequence of each completed chimerized nucleic acid) in each combination is by design (or non-stochastic). Given the non-stochastic nature of this method, the possibility of unwanted by-products is greatly reduced.

En otras realizaciones, el método indica que el proceso de reensamblaje de gen se realiza sistemáticamente, por ejemplo para generar una biblioteca compartimentada sistemáticamente, con compartimentos que pueden analizarse sistemáticamente, tal como uno por uno. En otras palabras, a través del uso selectivo y con criterio de bloques de construcción de ácido nucleico específicos, acoplados con el uso selectivo y con criterio de reacciones de ensamblaje escalonadas secuencialmente, puede lograrse un diseño donde se hagan juegos específicos de productos de progenie en cada uno de los varios recipientes de reacción. Esto permite que se realice un examen sistemático y un procedimiento de detección. Por lo tanto, permite que se examine sistemáticamente un gran número posible de moléculas de progenie en grupos más pequeños. In other embodiments, the method indicates that the gene reassembly process is performed systematically, for example to generate a systematically compartmentalized library, with compartments that can be systematically analyzed, such as one by one. In other words, through the selective and judicious use of specific nucleic acid building blocks coupled with the selective and judicious use of sequentially staggered assembly reactions, a design can be achieved where specific sets of progeny products are made in each of the various reaction vessels. This allows for a systematic examination and screening procedure. Therefore, it allows a large number of progeny molecules to be systematically examined in smaller groups.

Dada su capacidad de realizar quimerizaciones de un modo que es altamente flexible pero exhaustivo y también sistemático, en particular cuando hay un bajo nivel de homología entre las moléculas progenitoras, la divulgación proporciona la generación de una biblioteca (o juego) compuesto de un gran número de moléculas de progenie. Dada la naturaleza no estocástica de la presente invención de reensamblaje de genes, las moléculas de progenie generadas en algunas realizaciones comprenden una biblioteca de moléculas de ácido nucleico quimerizado finalizadas que tienen un orden de ensamblaje general que se elige por diseño. En algunas realizaciones, dicha biblioteca generada está compuesta por más de 103 a más de 101000 especies moleculares de progenie diferentes. Given its ability to perform chimerizations in a way that is highly flexible but comprehensive and also systematic, particularly when there is a low level of homology between the parent molecules, the disclosure provides for the generation of a library (or set) comprised of large numbers. of progeny molecules. Given the non-stochastic nature of the present gene reassembly invention, the progeny molecules generated in some embodiments comprise a library of finished chimerized nucleic acid molecules having a general assembly order which is chosen by design. In some embodiments, said generated library is comprised of more than 103 to more than 101,000 different progeny molecular species.

En algunas realizaciones, un juego de moléculas de ácido nucleico quimérico finalizadas producidas como se describe está compuesto de un polinucleótido que codifica un polipéptido. En una realización, este polinucleótido es un gen, que puede ser un gen fabricado por el hombre. En otra realización, este polinucleótido es una vía de gen, que puede ser una vía de gen fabricada por el hombre. En algunas realizaciones, la divulgación indica que uno o más genes fabricados por el hombre generados por la invención pueden incorporarse en una vía de gen fabricada por el hombre, tal como una vía operable en un organismo eucariota (incluyendo una planta). In some embodiments, a set of finished chimeric nucleic acid molecules produced as described is comprised of a polynucleotide encoding a polypeptide. In one embodiment, this polynucleotide is a gene, which can be a man-made gene. In another embodiment, this polynucleotide is a gene pathway, which may be a man-made gene pathway. In some embodiments, the disclosure indicates that one or more man-made genes generated by the invention can be incorporated into a man-made gene pathway, such as a pathway operable in a eukaryotic organism (including a plant).

En otra ejemplificación, la naturaleza sintética de esta etapa en la cual los bloques de construcción se generan permite el diseño y la introducción de nucleótidos (tales como uno o más nucleótidos, que pueden ser por ejemplo codones o intrones o secuencias reguladoras) que pueden eliminarse posteriormente en un proceso in vitro (tal como mutagénesis) o un proceso in vivo (tal como utilizando la capacidad de empalme de gen de un organismo huésped). Se aprecia que en muchos casos la introducción de estos nucleótidos también puede ser deseable por muchas otras razones además del beneficio posible de crear un punto de demarcación útil. In another exemplification, the synthetic nature of this stage in which the building blocks are generated allows the design and introduction of nucleotides (such as one or more nucleotides, which may be eg codons or introns or regulatory sequences) that can be removed subsequently in an in vitro process (such as mutagenesis) or an in vivo process (such as using the gene splicing ability of a host organism). It is appreciated that in many cases the introduction of these nucleotides may also be desirable for many other reasons in addition to the possible benefit of creating a useful demarcation point.

Por lo tanto, en algunas realizaciones, un bloque de construcción de ácido nucleico puede usarse para introducir un intrón. Por lo tanto, los intrones funcionales pueden introducirse en un gen fabricado por el hombre. En algunas realizaciones, los intrones funcionales pueden introducirse en una vía de gen fabricada por el hombre. Por consiguiente, la divulgación proporciona la generación de un polinucleótido quimérico que es un gen fabricado por el hombre que contiene uno (o más) intrones introducidos artificialmente. Therefore, in some embodiments, a nucleic acid building block can be used to introduce an intron. Therefore, functional introns can be introduced into a man-made gene. In some embodiments, functional introns can be introduced into a man-made gene pathway. Accordingly, the disclosure provides for the generation of a chimeric polynucleotide that is a man-made gene that contains one (or more) artificially introduced introns.

También se divulga la generación de un polinucleótido quimérico que es una vía de gen fabricada por el hombre que contiene uno (o más) intrones introducidos artificialmente. En algunas realizaciones, los intrones introducidos artificialmente son funcionales en una o más células huésped para empalmar genes del modo que los intrones naturales sirven funcionalmente en el empalme de genes. Se describen además procesos para producir polinucleótidos que contienen intrones fabricados por el hombre para introducirse en organismos huésped para la recombinación y/o empalme. Also disclosed is the generation of a chimeric polynucleotide which is a man-made gene pathway containing one (or more) artificially introduced introns. In some embodiments, artificially introduced introns are functional in one or more host cells to splice genes in the way that natural introns functionally serve in gene splicing. In addition, processes are described for producing polynucleotides containing man-made introns for introduction into host organisms for recombination and / or splicing.

Un gen fabricado por el hombre producido tal como se describe en la presente también puede servir como un sustrato para la recombinación con otro ácido nucleico. De una forma similar, una vía de gen fabricada por el hombre producida tal como se describe en la presente también puede servir como un sustrato para la recombinación con otro ácido nucleico. En algunas realizaciones, la recombinación se facilita por u ocurre en áreas de homología entre el gen fabricado por el hombre que contiene intrones y un ácido nucleico, que sirve como un socio de recombinación. En algunas realizaciones, el socio de recombinación también puede ser un ácido nucleico generado tal como se divulga en la presente, incluyendo un gen fabricado por el hombre o una vía de gen fabricada por el hombre. La recombinación puede estar facilitada por o puede ocurrir en áreas de homología que existen en uno (o más) intrones introducidos artificialmente en el gen fabricado por el hombre. A man-made gene produced as described herein can also serve as a substrate for recombination with another nucleic acid. Similarly, a man-made gene pathway produced as described herein can also serve as a substrate for recombination with another nucleic acid. In some embodiments, recombination is facilitated by or occurs in areas of homology between the intron-containing man-made gene and a nucleic acid, which serves as a recombination partner. In some embodiments, the recombination partner may also be a generated nucleic acid as disclosed herein, including a man-made gene or a man-made gene pathway. Recombination may be facilitated by or may occur in areas of homology that exist in one (or more) introns artificially inserted into the man-made gene.

En algunas realizaciones, el método de reensamblaje de gen sintético tal como se divulga en la presente utiliza una pluralidad de bloques de construcción de ácido nucleico, cada uno de los cuales, en algunas realizaciones, tiene dos extremos ligables. Los dos extremos ligables en cada bloque de construcción de ácido nucleico puede ser de dos extremos romos (es decir cada uno teniendo una saliente de cero nucleótidos) o en algunas realizaciones un extremo romo y una saliente o más, en algunas realizaciones aún dos salientes. En algunas realizaciones, una saliente útil para este objetivo puede ser una saliente 3’ o una saliente 5’. Por lo tanto, un bloque de construcción de ácido nucleico puede tener una saliente 3’ o alternativamente una saliente 5’ o alternativamente dos salientes 3’ o alternativamente dos salientes 5’. El orden general en el cual los bloques de construcción de ácido nucleico se ensamblan para formar una molécula de ácido nucleico quimérico finalizado se determina mediante el diseño experimental por diseño y no es aleatorio. In some embodiments, the synthetic gene reassembly method as disclosed herein uses a plurality of nucleic acid building blocks, each of which, in some embodiments, has two linkable ends. The two linkable ends in each nucleic acid building block may be two blunt ends (i.e. each having a zero nucleotide overhang) or in some embodiments a blunt end and a overhang or more, in some embodiments still two overhangs. In some embodiments, a protrusion useful for this purpose may be a 3 'overhang or a 5' overhang. Therefore, a nucleic acid building block can have a 3 'overhang or alternatively a 5' overhang or alternatively two 3 'overhangs or alternatively two 5' overhangs. The general order in which the nucleic acid building blocks assemble to form a finished chimeric nucleic acid molecule is determined by experimental design by design and is not random.

En algunas realizaciones, un bloque de construcción de ácido nucleico se genera mediante la síntesis química de dos ácidos nucleicos de una sola hebra (también denominados oligos de una sola hebra) y ponerlos en contacto para permitir que se apareen para formar un bloque de construcción de ácido nucleico de doble hebra. Un bloque de construcción de ácido nucleico de doble hebra puede ser de tamaño variable. Los tamaños de estos bloques de construcción pueden ser pequeños o grandes. Los tamaños ejemplares para el bloque de construcción están en el rango de 1 par de base (no incluyendo salientes) a 100.000 pares de base (no incluyendo salientes). También se proporcionan otros rangos de tamaño ejemplares, que tienen límites inferiores de 1 pb a 10.000 pb (incluyendo cada valor entero entremedio) y límites superiores de 2 pb a 100.000 pb (incluyendo cada valor entero entremedio). In some embodiments, a nucleic acid building block is generated by the chemical synthesis of two single-stranded nucleic acids (also called single-stranded oligos) and bringing them into contact to allow them to mate to form a single-stranded building block. double stranded nucleic acid. A double stranded nucleic acid building block can be of variable size. The sizes of these building blocks can be small or large. Exemplary sizes for the building block are in the range of 1 base pair (not including protrusions) to 100,000 base pairs (not including protrusions). Other exemplary size ranges are also provided, having lower limits from 1 bp to 10,000 bp (including each integer value in between) and upper limits from 2 bp to 100,000 bp (including each integer value in between).

Existen muchos métodos por los cuales pueden generarse bloques de construcción de ácido nucleico de doble hebra que son útiles para la invención; y estos se conocen en la técnica y el experto puede realizarlos fácilmente. En algunas realizaciones, un bloque de construcción de ácido nucleico de doble hebra se genera primero generando dos ácidos nucleicos de una sola hebra y permitiéndoles aparearse para formar un bloque de construcción de ácido nucleico de doble hebra. Las dos hebras de un bloque de construcción de ácido nucleico de doble hebra pueden ser complementarias en cada nucleótido aparte de cualquiera que forma una saliente; por lo tanto no contienen no coincidencias, aparte de cualquier saliente. En otra realización, las dos hebras de un bloque de construcción de ácido nucleico de doble hebra son complementarias en menos nucleótidos aparte de cualquiera que forma una saliente. Por lo tanto, de acuerdo con esta realización, un bloque de construcción de ácido nucleico de doble hebra puede usarse para introducir degeneración de codones. En algunas realizaciones la degeneración de codones se introduce usando la mutagénesis de saturación de sitio descrita en la presente, usando uno o más cassettes N,N,G/T o alternativamente usando uno o más cassettes N,N,N. There are many methods by which double stranded nucleic acid building blocks can be generated that are useful to the invention; and these are known in the art and can be easily performed by the skilled person. In some embodiments, a double-stranded nucleic acid building block is first generated by generating two single-stranded nucleic acids and allowing them to mate to form a double-stranded nucleic acid building block. The two strands of a double-stranded nucleic acid building block may be complementary at each nucleotide other than any that forms a overhang; therefore they contain no mismatches, apart from any overhang. In another embodiment, the two strands of a double stranded nucleic acid building block are complementary in fewer nucleotides apart from any one that forms a protrusion. Therefore, in accordance with this embodiment, a double-stranded nucleic acid building block can be used to introduce codon degeneracy. In some embodiments, codon degeneracy is introduced using the site saturation mutagenesis described herein, using one or more N, N, G / T cassettes, or alternatively using one or more N, N, N cassettes.

El método de la recombinación in vivo divulgado en la presente puede realizarse ciegamente en una pileta de híbridos desconocidos o alelos de un polinucleótido o secuencia específicos. Sin embargo, no es necesario saber la secuencia de ADN o ARN del polinucleótido específico. El abordaje de usar la recombinación dentro de una población mezclada de genes puede ser útil para la generación de cualquier proteína útil, por ejemplo, una aldolasa de acuerdo con la invención o una variante de la misma. Este abordaje puede usarse para generar proteínas que tienen especificidad o actividad alterada. Este abordaje también puede ser útil para la generación de secuencias de ácido nucleico híbridas, por ejemplo, regiones de promotor, intrones, exones, secuencias de potenciador, 31 regiones sin traducir o 51 regiones sin traducir de genes. Por lo tanto este abordaje pede usarse para generar genes que tienen tasas aumentadas de expresión. Este abordaje también puede ser útil en el estudio de secuencias de ADN repetitivas. Finalmente, este abordaje puede ser útil para realizar ribozimas o aptámeros divulgados en la presente. The in vivo recombination method disclosed herein can be performed blindly in a pool of unknown hybrids or alleles of a specific polynucleotide or sequence. However, it is not necessary to know the DNA or RNA sequence of the specific polynucleotide. The approach of using recombination within a mixed population of genes can be useful for the generation of any useful protein, for example, an aldolase according to the invention or a variant thereof. This approach can be used to generate proteins that have specificity or altered activity. This approach may also be useful for the generation of hybrid nucleic acid sequences, eg, promoter regions, introns, exons, enhancer sequences, 31 untranslated regions or 51 untranslated regions of genes. Therefore this approach can be used to generate genes that have increased rates of expression. This approach may also be useful in the study of repetitive DNA sequences. Finally, this approach may be useful for making ribozymes or aptamers disclosed herein.

Algunas realizaciones divulgadas en la presente se dirigen al uso de ciclos repetidos de reordenamiento reductor, recombinación y selección que permiten la evolución molecular dirigida de secuencias lineales altamente complejas, tales como ADN, ARN o proteínas a través de la recombinación. Some embodiments disclosed herein are directed to the use of repeated cycles of reductive rearrangement, recombination, and selection that allow for directed molecular evolution of highly complex linear sequences, such as DNA, RNA, or protein through recombination.

Sistema de evolución dirigida optimizada Optimized directed evolution system

Se divulga un sistema de modificación génica no estocástico denominado “sistema de evolución dirigida optimizada” para generar polipéptidos, tales como enzimas o anticuerpos de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente, con propiedades nuevas o alteradas. En algunas realizaciones, la evolución dirigida optimizada se dirige al uso de ciclos repetidos de reordenamiento reductor, recombinación y selección que permiten la evolución molecular dirigida de ácidos nucleicos a través de la recombinación. There is disclosed a non-stochastic gene modification system called "optimized targeted evolution system" to generate polypeptides, such as aldolase enzymes or antibodies, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, with novel properties or altered. In some embodiments, optimized targeted evolution is directed to the use of repeated cycles of reductive rearrangement, recombination, and selection that allow for targeted molecular evolution of nucleic acids through recombination.

La evolución dirigida optimizada permite la generación de una gran población de secuencias quiméricas evolucionadas, en donde la población generada se enriquece significativamente para las secuencias que tienen un número predeterminado de eventos de cruce. Un evento de cruce es un punto en una secuencia quimérica donde un cambio en la secuencia ocurre de una variante parental a otra variante parental. Dicho punto está normalmente en la unión de donde los oligonucleótidos de dos padres se ligan para formar una sola secuencia. Este método permite el cálculo de las concentraciones correctas de secuencias de oligonucleótidos de modo que la población quimérica final de secuencias se enriquezca para el número elegido de eventos de cruce. Esto proporciona un mayor control sobre la elección de variantes quiméricas que tienen un número predeterminado de eventos de cruce. Optimized Targeted Evolution allows the generation of a large population of evolved chimeric sequences, where the generated population is significantly enriched for sequences that have a predetermined number of crossover events. A crossover event is a point in a chimeric sequence where a change in sequence occurs from one parent variant to another parent variant. Said point is normally at the junction where the oligonucleotides of two parents bind to form a single sequence. This method allows the calculation of correct concentrations of oligonucleotide sequences so that the final chimeric population of sequences is enriched for the chosen number of crossover events. This provides greater control over the choice of chimeric variants that have a predetermined number of crossover events.

Además, este método proporciona medios convenientes para explorar una gran cantidad del espacio variante de proteína posible en comparación con otros sistemas. Previamente, si se generaban por ejemplo 1013 moléculas quiméricas durante una reacción, sería extremadamente difícil analizar dicho alto número de variantes quiméricas para una actividad en particular. Además, una porción significativa de la población de progenie tendría un número muy alto de eventos de cruce que resultaban en proteínas que tenían menos posibilidad de tener niveles aumentados de una actividad particular. Usando estos métodos, la población de moléculas quiméricas puede enriquecerse para estas variantes que tienen un número particular de eventos de cruce. Por lo tanto, si bien se pueden generar aún 1013 moléculas quiméricas durante una reacción, cada una de las moléculas elegidas para el análisis adicional tiene más probablemente, por ejemplo, sólo tres eventos de cruce. Dado que la población de progenie resultante puede desviarse para tener un número predeterminado de eventos de cruce, los límites en la variedad funcional entre las moléculas quiméricas son reducidos. Esto proporciona un número más manejable de variables cuando se calcula qué oligonucleótido de los polinucleótidos parentales originales puede ser responsable de afectar un rasgo particular. Furthermore, this method provides convenient means to explore a large amount of the protein variant space possible compared to other systems. Previously, if for example 1013 chimeric molecules were generated during a reaction, it would be extremely difficult to analyze such a high number of chimeric variants for a particular activity. Furthermore, a significant portion of the progeny population would have a very high number of crossover events resulting in proteins that were less likely to have increased levels of a particular activity. Using these methods, the population of chimeric molecules can be enriched for these variants that have a particular number of crossover events. Therefore, while 1,013 chimeric molecules can still be generated during a reaction, each of the molecules chosen for further analysis most likely has, for example, only three crossover events. Since the resulting progeny population can be biased to have a predetermined number of crossover events, the limits on functional variety between chimeric molecules are reduced. This provides a more manageable number of variables when calculating which oligonucleotide of the original parental polynucleotides may be responsible for affecting a particular trait.

Un método para crear una secuencia de polinucleótido de progenie quimérica es crear oligonucleótidos que corresponden a fragmentos o porciones de cada secuencia parental. Cada oligonucleótido en algunas realizaciones incluye una región única de superposición de modo que mezclar los oligonucleótidos resulta en una nueva variante que tiene cada fragmento de oligonucleótido ensamblado en el orden correcto. Los protocolos alternativos para realizar estos métodos de acuerdo con la invención pueden encontrarse en la Patente de los Estados Unidos No. 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974. One method of creating a chimeric progeny polynucleotide sequence is to create oligonucleotides that correspond to fragments or portions of each parent sequence. Each oligonucleotide in some embodiments includes a unique overlapping region so that mixing the oligonucleotides results in a new variant that has each oligonucleotide fragment assembled in the correct order. Alternative protocols for carrying out these methods in accordance with the invention can be found in US Patent No. 6,773,900; 6,740,506; 6,713,282; 6,635,449; 6,605,449; 6,537,776; 6,361,974.

El número de oligonucleótidos generados para cada variante parental tiene una relación con el número total de cruces resultantes en la molécula quimérica que se crea al final. Por ejemplo, tres variantes de secuencia de nucleótidos parentales pueden proporcionarse para sufrir una reacción de ligación de modo de encontrar una variante quimérica que tenga por ejemplo mayor actividad a una alta temperatura. Como ejemplo, un juego de 50 secuencias de oligonucleótidos puede generarse correspondiendo con cada porción de cada variante parental. Por consiguiente, durante el proceso de reensamblaje de ligación podría haber hasta 50 eventos de cruce dentro de cada una de las secuencias quiméricas. La probabilidad de que cada polinucleótido quimérico generado contenga oligonucleótidos de cada variante parental en orden alterno es muy baja. Si cada fragmento de oligonucleótido está presente en la reacción de ligación en la misma cantidad molar, es probable que en algunas posiciones los oligonucleótidos del mismo polinucleótido parental se liguen próximos entre sí y, por lo tanto, no resulten en un evento de cruce. Si la concentración de cada oligonucleótido de cada padre se mantiene constante durante cualquier etapa de ligación en este ejemplo, hay una posibilidad de Y (asumiendo 3 padres) de que un oligonucleótido de la misma variante parental se ligue dentro de la secuencia quimérica y no produzca un cruce. The number of oligonucleotides generated for each parental variant has a relationship to the total number of resulting crosses in the chimeric molecule that is created at the end. For example, three parental nucleotide sequence variants may be provided to undergo a ligation reaction so as to find a chimeric variant having eg higher activity at high temperature. As an example, a set of 50 oligonucleotide sequences can be generated corresponding to each portion of each parental variant. Consequently, during the ligation reassembly process there could be up to 50 crossover events within each of the chimeric sequences. The probability that each generated chimeric polynucleotide contains oligonucleotides of each parental variant in alternate order is very low. If each oligonucleotide fragment is present in the ligation reaction in the same molar amount, it is likely that at some positions the oligonucleotides of the same parent polynucleotide will ligate close to each other and therefore not result in a crossover event. If the concentration of each oligonucleotide from each parent is held constant during any ligation step in this example, there is a possibility of Y (assuming 3 parents) that an oligonucleotide of the same parental variant binds within the chimeric sequence and does not produce a crossing.

Por consiguiente, puede determinarse una función de densidad de probabilidad (PDF) para predecir la población de eventos de cruce que son probables que ocurran durante cada etapa en una reacción de ligación dado un número fijo de variantes parentales, un número de oligonucleótidos que corresponden a cada variante y las concentraciones de cada variante durante cada etapa en la reacción de ligación. Las estadísticas y la matemática detrás de la determinación del PDF se describen a continuación. Utilizando estos métodos, se puede calcular dicha función de densidad de probabilidad, y por lo tanto enriquecer la población de progenie quimérica para un número predeterminado de eventos de cruce que resultan de una reacción de ligación particular. Además, puede predeterminarse un número objetivo de eventos de cruce y el sistema entonces puede programarse para calcular las cantidades de inicio de cada oligonucleótido parental durante cada etapa en la reacción de ligación para resultar en una función de densidad de probabilidad que se centra en el número predeterminado de eventos de cruce. Estos métodos se dirigen al uso de ciclos repetidos de reordenamiento reductor, recombinación y selección que permiten la evolución molecular dirigida de un ácido nucleico codificando un polipéptido a través de la recombinación. El sistema permite la generación de una gran población de secuencias quiméricas evolucionadas, en donde la población generada se enriquece significativamente para las secuencias que tienen un número predeterminado de eventos de cruce. Un evento de cruce es un punto en una secuencia quimérica donde un cambio en la secuencia ocurre de una variante parental a otra variante parental. Dicho punto está normalmente en la unión de donde los oligonucleótidos de dos padres se ligan para formar una sola secuencia. Este método permite el cálculo de las concentraciones correctas de secuencias de oligonucleótidos de modo que la población quimérica final de secuencias se enriquezca para el número elegido de eventos de cruce. Esto proporciona un mayor control sobre la elección de variantes quiméricas que tienen un número predeterminado de eventos de cruce. Therefore, a probability density function (PDF) can be determined to predict the population of crossover events that are likely to occur during each stage in a ligation reaction given a fixed number of parental variants, a number of oligonucleotides corresponding to each variant and the concentrations of each variant during each stage in the ligation reaction. The statistics and math behind determining the PDF are outlined below. Using these methods, such a probability density function can be calculated, and thus enriching the chimeric progeny population for a predetermined number of crossing events resulting from a particular ligation reaction. Furthermore, a target number of crossing events can be predetermined and the system can then be programmed to calculate the starting amounts of each parent oligonucleotide during each stage in the ligation reaction to result in a probability density function that focuses on the number default crossover event. These methods are directed to the use of repeated cycles of reductive rearrangement, recombination, and selection that allow for directed molecular evolution of a nucleic acid by encoding a polypeptide through recombination. The system allows the generation of a large population of evolved chimeric sequences, where the generated population is significantly enriched for sequences that have a predetermined number of crossover events. A crossover event is a point in a chimeric sequence where a change in sequence occurs from one parent variant to another parent variant. Said point is normally at the junction where the oligonucleotides of two parents bind to form a single sequence. This method allows the calculation of correct concentrations of oligonucleotide sequences so that the final chimeric population of sequences is enriched for the chosen number of crossover events. This provides greater control over the choice of chimeric variants that have a predetermined number of crossover events.

Además, estos métodos proporcionan un medio conveniente para explorar una gran cantidad del espacio variante de proteína posible en comparación con otros sistemas. Usando los métodos descritos en la presente, la población de moléculas quiméricas puede enriquecerse para estas variantes que tienen un número particular de eventos de cruce. Por lo tanto, si bien se pueden generar aún 1013 moléculas quiméricas durante una reacción, cada una de las moléculas elegidas para el análisis adicional tiene más probablemente, por ejemplo, sólo tres eventos de cruce. Dado que la población de progenie resultante puede desviarse para tener un número predeterminado de eventos de cruce, los límites en la variedad funcional entre las moléculas quiméricas son reducidos. Esto proporciona un número más manejable de variables cuando se calcula qué oligonucleótido de los polinucleótidos parentales originales puede ser responsable de afectar un rasgo particular. Furthermore, these methods provide a convenient means of exploring a large amount of the protein variant space possible compared to other systems. Using the methods described herein, the population of chimeric molecules can be enriched for these variants that have a particular number of crossover events. Therefore, while 1,013 chimeric molecules can still be generated during a reaction, each of the molecules chosen for further analysis most likely has, for example, only three crossover events. Since the resulting progeny population can be biased to have a predetermined number of crossover events, the limits on functional variety between chimeric molecules are reduced. This provides a more manageable number of variables when calculating which oligonucleotide of the original parental polynucleotides may be responsible for affecting a particular trait.

En algunas realizaciones, el método crea una secuencia de polinucleótido de progenie quimérica creando oligonucleótidos que corresponden a fragmentos o porciones de cada secuencia parental. Cada oligonucleótido en algunas realizaciones incluye una región única de superposición de modo que mezclar los oligonucleótidos resulta en una nueva variante que tiene cada fragmento de oligonucleótido ensamblado en el orden correcto. Ver la Patente de los Estados Unidos No. 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974. In some embodiments, the method creates a chimeric progeny polynucleotide sequence by creating oligonucleotides that correspond to fragments or portions of each parent sequence. Each oligonucleotide in some embodiments includes a unique overlapping region so that mixing the oligonucleotides results in a new variant that has each oligonucleotide fragment assembled in the correct order. See United States Patent No. 6,773,900; 6,740,506; 6,713,282; 6,635,449; 6,605,449; 6,537,776; 6,361,974.

Determinación de eventos de cruce Determination of crossover events

Las realizaciones incluyen un sistema y software que reciben una función de densidad de probabilidad (PDF) de cruce deseada, el número de genes parentales a reensamblarse y el número de fragmentos en el reensamblaje como entradas. La salida de este programa es un “PDF fragmento” que puede usarse para determinar una receta para producir genes reensamblados y la PDF de cruce estimada de esos genes. El procesamiento descrito en la presente se realiza en algunas realizaciones en MATLAB™ (The Mathworks, Natick, Mass.) un lenguaje de programación y entorno de desarrollo para la computación técnica. Embodiments include a system and software that receive a desired crossover probability density (PDF) function, the number of parent genes to reassemble, and the number of fragments in the reassembly as inputs. The output of this program is a "PDF fragment" that can be used to determine a recipe to produce reassembled genes and the estimated crossover PDF of those genes. The processing described herein is performed in some embodiments in MATLAB ™ (The Mathworks, Natick, Mass.) A programming language and development environment for technical computing.

Procesos iterativos Iterative processes

Cualquier proceso divulgado en la presente puede repetirse, tal como un ácido nucleico que codifica un fenotipo nuevo o alterado de una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente, puede identificarse, reaislarse, modificarse nuevamente, reanalizarse para la actividad. Este proceso puede repetirse hasta que se diseñe un fenotipo deseado. Por ejemplo, puede diseñarse una vía anabólica o catabólica bioquímica entera en una célula, incluyendo, por ejemplo, una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Any process disclosed herein can be repeated, such as a nucleic acid encoding a new or altered phenotype of an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, can be identified, isolated, modified again, reanalyze for activity. This process can be repeated until a desired phenotype is designed. For example, an entire biochemical anabolic or catabolic pathway can be designed in a cell, including, for example, an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase.

De forma similar, si se determina que un oligonucleótido particular no afecta de ningún modo el rasgo deseado (tal como un nuevo fenotipo de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) puede eliminarse como una variable sintetizando oligonucleótidos parentales más grandes que incluyen la secuencia a eliminarse. Dado que incorporar la secuencia dentro de una secuencia mayor evita cualquier evento de cruce, no habrá más variación alguna de esta secuencia en los polinucleótidos de progenie. Esta práctica iterativa de determinar qué oligonucleótidos se relacionan más con el rasgo deseado, y cuáles no están relacionados, permite una exploración más eficiente de todas las variantes de proteína posibles que pueden proporcionar un rasgo o actividad particular. Similarly, if it is determined that a particular oligonucleotide in no way affects the desired trait (such as a new aldolase enzyme phenotype, such as pyruvate aldolase, such as HMG and / or KHG aldolase), it can be removed as a variable by synthesizing oligonucleotides. larger parentals that include the sequence to be removed. Since incorporating the sequence into a larger sequence avoids any crossover events, there will be no further variation of this sequence on the progeny polynucleotides. This iterative practice of determining which oligonucleotides are most related to the desired trait, and which are not related, allows for a more efficient exploration of all possible protein variants that may provide a particular trait or activity.

Transposición in vivo Transposition in vivo

En varias realizaciones, la transposición in vivo de moléculas se usa en métodos divulgados en la presente para proporcionar variantes de polipéptidos divulgados en la presente, tal como anticuerpos divulgados en la presente o enzimas aldolasas divulgadas en la presente, tal como piruvato aldolasa, HMG y/o KHG aldolasa y similares. La transposición in vivo puede realizarse utilizando la propiedad natural de las células para recombinar multímeros. Mientras que la recombinación in vivo proporcionó la principal ruta natural para la diversidad molecular, la recombinación genética sigue siendo un proceso relativamente complejo que implica 1) el reconocimiento de homologías; 2) escisión de hebras, invasión de hebras y etapas metabólicas que conducen a la producción de quiasma recombinante; y finalmente 3) la resolución de quiasma en moléculas recombinadas discretas. La formación del quiasma requiere el reconocimiento de secuencias homólogas. In various embodiments, the in vivo transposition of molecules is used in methods disclosed herein to provide variants of the disclosed polypeptides, such as antibodies disclosed herein or aldolase enzymes disclosed herein, such as pyruvate aldolase, HMG and / or KHG aldolase and the like. Transposition in vivo can be performed using the natural property of cells to recombine multimers. While in vivo recombination provided the primary natural route for molecular diversity, genetic recombination remains a relatively complex process involving 1) recognition of homologies; 2) strand cleavage, strand invasion, and metabolic steps leading to the production of recombinant chiasm; and finally 3) the resolution of chiasm in discrete recombined molecules. Chiasm formation requires recognition of homologous sequences.

También se describe un método para producir un polinucleótido híbrido a partir de al menos un primer polinucleótido y un segundo polinucleótido. En algunas realizaciones, el método puede usarse para producir un polinucleótido híbrido introduciendo al menos un primer polinucleótido y un segundo polinucleótido (tal como uno, o ambos, siendo una secuencia de codificación de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa de acuerdo con la invención) que comparten al menos una región de homología de secuencia parcial en una célula huésped adecuada. Las regiones de homología de secuencia parcial promueven procesos que resultan en la reorganización de secuencia produciendo un polinucleótido híbrido. El término “polinucleótido híbrido” como se usa en la presente es cualquier secuencia de nucleótidos que resulta del método y contiene secuencia de al menos dos secuencias originales de polinucleótidos. Dichos polinucleótidos híbridos pueden resultar de eventos de recombinación intermolecular que promueven la integración de secuencia entre moléculas de ADN. Además, dichos polinucleótidos híbridos pueden resultar de procesos de reordenamiento reductor intramolecular que utilizan secuencias repetidas para alterar una secuencia de nucleótidos dentro de una molécula de ADN. Also described is a method of producing a hybrid polynucleotide from at least a first polynucleotide and a second polynucleotide. In some embodiments, the method can be used to produce a hybrid polynucleotide by introducing at least a first polynucleotide and a second polynucleotide (such as one, or both, being an aldolase enzyme coding sequence, such as pyruvate aldolase, such as HMG and / or KHG aldolase according to the invention) that share at least one region of partial sequence homology in a suitable host cell. The partial sequence homology regions promote processes that result in sequence rearrangement producing a hybrid polynucleotide. The term "hybrid polynucleotide" as used herein is any nucleotide sequence that results from the method and contains sequence of at least two original polynucleotide sequences. Such hybrid polynucleotides can result from intermolecular recombination events that promote sequence integration between DNA molecules. Furthermore, such hybrid polynucleotides can result from intramolecular reductive rearrangement processes that use repeated sequences to alter a nucleotide sequence within a DNA molecule.

En algunas realizaciones, el reordenamiento vivo se enfoca en procesos “intermoleculares” colectivamente denominados “recombinación”; que en las bacterias se ve generalmente como un fenómeno “dependiente de RecA”. En algunas realizaciones, el método puede depender de procesos de recombinación de una célula huésped para recombinar y reordenar secuencias, o la capacidad de las células para mediar procesos reductores para disminuir la complejidad de secuencias casi repetidas en la célula por eliminación. Este proceso de “reordenamiento reductor” ocurre por un proceso independiente de RecA “intramolecular”. In some embodiments, live rearrangement focuses on "intermolecular" processes collectively called "recombination"; which in bacteria is generally seen as a “RecA-dependent” phenomenon. In some embodiments, the method may rely on recombination processes of a host cell to recombine and rearrange sequences, or the ability of cells to mediate reducing processes to decrease the complexity of near-repeat sequences in the cell by deletion. This “reductive rearrangement” process occurs through an independent “intramolecular” RecA process.

En otras realizaciones, pueden generarse nuevos polinucleótidos mediante el proceso de reordenamiento reductor. El método implica la generación de constructos que contienen secuencias consecutivas (secuencias de codificación originales), su inserción en un vector apropiado y su introducción posterior en una célula huésped apropiada. El reordenamiento de las identidades moleculares individuales ocurre por procesos combinatorios entre las secuencias consecutivas en el constructo teniendo regiones de homología o entre unidades casi repetidas. El proceso de reordenamiento recombina y/o reduce la complejidad de extensión de las secuencias repetidas y resulta en la producción de especies moleculares nuevas. Pueden aplicarse varios tratamientos para mejorar la tasa de reordenamiento. Estos podrían incluir el tratamiento con luz ultravioleta, o químicos que dañan el ADN y/o el uso de líneas celulares huésped que muestran niveles mejorados de “inestabilidad genética”. Por lo tanto el proceso de reordenamiento puede implicar la recombinación homóloga o la propiedad natural de secuencias casi repetidas para dirigir su propia evolución. In other embodiments, new polynucleotides can be generated by the reductive rearrangement process. The method involves generating constructs containing consecutive sequences (original coding sequences), inserting them into an appropriate vector, and subsequently introducing them into an appropriate host cell. The rearrangement of individual molecular identities occurs by combinatorial processes between consecutive sequences in the construct having regions of homology or between nearly repeated units. The rearrangement process recombines and / or reduces the extension complexity of the repeated sequences and results in the production of new molecular species. Various treatments can be applied to improve the rearrangement rate. These could include treatment with ultraviolet light, or chemicals that damage DNA and / or the use of host cell lines that show improved levels of "genetic instability." Therefore the rearrangement process may involve homologous recombination or the natural property of near-repeat sequences to direct its own evolution.

Las secuencias repetidas o “casi repetidas” tienen un papel en la inestabilidad genética. En algunas realizaciones, las “casi repeticiones” son repeticiones que no se limitan a su estructura de unidad original. Las unidades casi repetidas pueden presentarse como un arreglo de secuencias en un constructo; unidades consecutivas de secuencias similares. Una vez ligadas, las uniones entre las secuencias consecutivas se vuelven esencialmente invisibles y la naturaleza casi repetitiva del constructo resultante ahora es continuo en el nivel molecular. El proceso de eliminación que la célula realiza para reducir la complejidad del constructo resultante opera entre las secuencias casi repetidas. Las unidades casi repetidas proporcionan un repertorio prácticamente ilimitado de plantillas sobre el cual pueden ocurrir eventos de deslizamiento. En algunas realizaciones, los constructos que contienen las casi repeticiones por lo tanto proporcionan efectivamente una elasticidad molecular suficiente tal que los eventos de eliminación (y potencialmente la inserción) pueden ocurrir prácticamente en cualquier lugar dentro de las unidades casi repetitivas. Repeated or "near repeat" sequences have a role in genetic instability. In some embodiments, "near repeats" are repeats that are not limited to their original unit structure. Nearly repeating units can be presented as an array of sequences in a construct; consecutive units of similar sequences. Once linked, the junctions between consecutive sequences become essentially invisible and the quasi-repetitive nature of the resulting construct is now continuous at the molecular level. The elimination process that the cell performs to reduce the complexity of the resulting construct operates between the nearly repeated sequences. Nearly repeating units provide a virtually limitless repertoire of templates upon which slip events can occur. In some embodiments, the constructs containing the quasi-repeats therefore effectively provide sufficient molecular elasticity such that deletion (and potentially insertion) events can occur virtually anywhere within quasi-repeating units.

Cuando las secuencias casi repetidas se ligan todas en la misma orientación, por ejemplo cabeza con cola o viceversa, la célula no puede distinguir unidades individuales. Por consiguiente, el proceso reductor puede ocurrir en todas las secuencias. En contraste, cuando por ejemplo las unidades se presentan cabeza con cabeza, en vez de cabeza con cola, la inversión delinea los criterios de valoración de la unidad adyacente de modo que la formación de la eliminación favorecerá la pérdida de unidades discretas. Por lo tanto, se prefiere con el presente método que las secuencias estén en la misma orientación. La orientación aleatoria de las secuencias casi repetidas resultará en la pérdida de la eficiencia del reordenamiento, mientras que la orientación consistente de las secuencias ofrecerá la mayor eficiencia. Sin embargo, mientras que tener menos secuencias contiguas en la misma orientación reduce la eficiencia, aún puede proporcionar suficiente elasticidad para la recuperación efectiva de nuevas moléculas. Los constructos pueden realizarse con las secuencias casi repetidas en la misma orientación para permitir una mayor eficiencia. When quasi-repeated sequences are all ligated in the same orientation, for example head-to-tail or vice versa, the cell cannot distinguish individual units. Therefore, the reducing process can occur in all sequences. In contrast, when for example units are presented head-to-head, rather than head-to-tail, the inversion delineates the endpoint of the adjacent unit so that the formation of elimination will favor the loss of discrete units. Therefore, it is preferred with the present method that the sequences be in the same orientation. Random orientation of quasi-repeated sequences will result in loss of rearrangement efficiency, while consistent sequence orientation will offer the highest efficiency. However, while having fewer contiguous sequences in the same orientation reduces efficiency, it can still provide enough elasticity for effective recovery of new molecules. Constructs can be performed with the sequences nearly repeated in the same orientation to allow for greater efficiency.

Las secuencias se pueden ensamblar en una orientación de cabeza a cola usando cualquiera de una variedad de métodos, que incluyen los siguientes: Sequences can be assembled in a head-to-tail orientation using any of a variety of methods, including the following:

a) Se pueden utilizar cebadores que incluyen una cabeza poli-A y cola poli-T que cuando se hacen de una sola hebra proporcionarían orientación. Esto se logra teniendo las primeras nuevas bases de los cebadores realizados a partir de ARN y por lo tanto ARNasaH fácilmente eliminada. a) Primers including a poly-A head and poly-T tail can be used which when made single stranded would provide orientation. This is accomplished by having the first new primer bases made from RNA and therefore easily removed RNAseH.

b) Pueden utilizarse cebadores que incluyen sitios de escisión de restricción única. Se requerirían múltiples sitios, una batería de secuencias únicas y etapas de síntesis y ligación repetidas. b) Primers including single restriction cleavage sites can be used. Multiple sites, a battery of unique sequences, and repeated synthesis and ligation steps would be required.

c) Las pocas bases internas del cebador podrían tiolarse y se podría usar una exonucleasa para producir moléculas con cola de forma apropiada. c) The few internal bases of the primer could be thiolated and an exonuclease could be used to produce properly tailed molecules.

En algunas realizaciones, la recuperación de las secuencias reordenadas depende de la identificación de vectores de clonación con un índice repetitivo reducido (RI). Las secuencias de codificación reordenadas pueden recuperarse luego mediante amplificación. Los productos se reclonan y se expresan. La recuperación de vectores de clonación con RI reducido puede estar afectada por: In some embodiments, the recovery of the rearranged sequences depends on the identification of cloning vectors with a reduced repetitive index (RI). The rearranged coding sequences can then be recovered by amplification. Products recline and express themselves. Recovery of cloning vectors with reduced IR may be affected by:

1) El uso de vectores sólo mantenidos establemente cuando el constructo se reduce en complejidad 1) The use of vectors only stably maintained when the construct is reduced in complexity

2) La recuperación física de vectores acortados mediante procedimientos físicos. En este caso, el vector de clonación se recuperaría usando procedimientos de aislamiento de plásmido estándar y se fraccionaría en tamaño en gel de agarosa o columna con un bajo corte de peso molecular utilizando procedimientos estándar. 2) The physical recovery of shortened vectors using physical procedures. In this case, the cloning vector would be recovered using standard plasmid isolation procedures and size fractionated on agarose gel or column with a low molecular weight cutoff using standard procedures.

3) La recuperación de vectores que contienen genes interrumpidos que pueden seleccionarse cuando el tamaño de inserción se reduce. 3) Recovery of vectors containing interrupted genes that can be selected when the insert size is reduced.

4) El uso de técnicas de selección directa con un vector de expresión y la selección apropiada. 4) The use of direct selection techniques with an expression vector and the appropriate selection.

Las secuencias de codificación (por ejemplo genes) de organismos relacionados pueden demostrar un alto grado de homología y codificar productos de proteína bastante diversos. Estos tipos de secuencias son particularmente útiles como casi repeticiones. Sin embargo, si bien los ejemplos ilustrados a continuación demuestran el reordenamiento de secuencias de codificación originales casi idénticas (casi repeticiones), este proceso no se limita a dichas repeticiones casi idénticas. The coding sequences (eg genes) of related organisms can demonstrate a high degree of homology and encode quite diverse protein products. These types of sequences are particularly useful as near repeats. However, while the examples illustrated below demonstrate the rearrangement of nearly identical (near repeats) original coding sequences, this process is not limited to such nearly identical repeats.

El siguiente ejemplo demuestra un método ejemplar de acuerdo con la invención. Se describen las secuencias de ácido nucleico de codificación (casi repeticiones) derivadas de tres (3) especies únicas. Cada secuencia codifica una proteína con un juego distinto de propiedades. Cada una de las secuencias difiere por un único o por pocos pares de base en una posición única en la secuencia. Las secuencias casi repetidas se amplifican separada o conjuntamente y se ligan en ensamblajes aleatorios de tal modo que las permutaciones y combinaciones posibles estén disponibles en la población de moléculas ligadas. El número de unidades casi repetidas puede controlarse mediante las condiciones de ensamblaje. El número promedio de unidades casi repetidas en un constructo se define como el índice repetitivo (RI). The following example demonstrates an exemplary method according to the invention. Coding nucleic acid sequences (near repeats) derived from three (3) unique species are described. Each sequence encodes a protein with a different set of properties. Each of the sequences differs by a single or a few base pairs at a single position in the sequence. The quasi-repeated sequences are amplified separately or together and ligated into random assemblies such that possible permutations and combinations are available in the population of linked molecules. The number of quasi-repeating units can be controlled by assembly conditions. The average number of quasi-repeating units in a construct is defined as the repeating index (RI).

Una vez formados, los constructos pueden o no fraccionarse en tamaño en un gel de agarosa de acuerdo con los protocolos publicados, insertarse en un vector de clonación y transfectarse en una célula huésped apropiada. Luego se propagan las células y se efectúa un “reordenamiento reductor”. La tasa del proceso de reordenamiento reductor puede estimularse mediante la introducción de daño al ADN si se desea. No es relevante si la reducción en RI está mediada por la formación de eliminación entre secuencias repetidas mediante un mecanismo ”intramolecular”, o mediada mediante eventos similares a la recombinación a través de mecanismos “intermoleculares”. El resultado final es un reordenamiento de las moléculas en todas las combinaciones posibles. Once formed, the constructs may or may not be size fractionated on an agarose gel according to published protocols, inserted into a cloning vector, and transfected into an appropriate host cell. The cells are then propagated and a "reductive rearrangement" is performed. The rate of the reductive rearrangement process can be stimulated by introducing DNA damage if desired. It is not relevant whether the reduction in IR is mediated by elimination formation between repeating sequences by an "intramolecular" mechanism, or mediated by events similar to recombination through "intermolecular" mechanisms. The end result is a rearrangement of the molecules in all possible combinations.

Opcionalmente, el método comprende la etapa adicional de analizar los miembros de biblioteca de la pileta transpuesta para identificar miembros de biblioteca transpuestos individuales que tienen la capacidad de unirse o de otro modo interactuar, o catalizar una reacción particular (tal como un dominio catalítico de una enzima) con una macromolécula predeterminada, tal como por ejemplo un receptor proteínico, un oligosacárido, virión u otro compuesto o estructura predeterminada. Optionally, the method comprises the additional step of analyzing the library members of the transposed pool to identify individual rearranged library members that have the ability to bind or otherwise interact, or catalyze a particular reaction (such as a catalytic domain of a enzyme) with a predetermined macromolecule, such as for example a protein receptor, an oligosaccharide, virion or other predetermined compound or structure.

Los polipéptidos que se identifican de dichas bibliotecas pueden usarse con objetivos terapéuticos, diagnósticos, de investigación y temas relacionados (tales como catalizadores, solutos para aumentar la osmolaridad de una solución acuosa y similares) y/o pueden someterse a uno o más ciclos adicionales de transposición y/o selección. The polypeptides that are identified from such libraries can be used for therapeutic, diagnostic, research, and related purposes (such as catalysts, solutes to increase the osmolarity of an aqueous solution, and the like) and / or can undergo one or more additional cycles of transposition and / or selection.

En otras realizaciones, se prevé que antes de o durante la recombinación u reordenamiento, los polinucleótidos generados por el método divulgado en la presente se sometan a agentes o procesos que promueven la introducción de mutaciones en los polinucleótidos originales. La introducción de dichas mutaciones aumentaría la diversidad de los polinucleótidos y polipéptidos híbridos codificados desde allí. Los agentes o procesos que promueven la mutagénesis pueden incluir pero no se limitan a: (+)-CC-1065, o un análogo sintético tal como (+)-CC-1065-(N3-Adenina (ver Sun y Hurley, (1992); un aducto 4'-fluoro-4-aminobifenil N-acetilado o deacetilado capaz de inhibir la síntesis de ADN (ver, por ejemplo, van de Poll et al. (1992)); o un aducto 4-aminobifenil N-acetilado o deacetilado capaz de inhibir la síntesis de ADN (ver también, van de Poll et al. (1992), pp. 751-758); cromo trivalente, una sal de cromo trivalente, un aducto de ADN de hidrocarburo policíclico aromático (PAH) capaz de inhibir la replicación de ADN, tal como 7-bromometil-benz[a]antraceno (“BMA”), tris(2,3-dibromopropil)fosfato (“Tris-BP”), 1,2-dibromo-3cloropropano (“DBCP”), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido (“BPDE”), una sal de halógeno de platino(II), N-hidroxi-2-amino-3-metilimidazo[4,5-f]-quinolina (“N-hidroxi-IQ”) y N-hidroxi-2-amino-1-metil6-fenilimidazo[4,5-f]-piridina (“N-hidroxi-PhIP”). Ejemplos de medios para ralentizar o detener la amplificación PCR consiste de luz UV (+)-CC-1065 y (+)-CC-1065-(N-3-Adenina). Medios que se abarcan en particular son aductos de ADN o polinucleótidos que comprenden los aductos de ADN de los polinucleótidos o la pileta de polinucleótidos, que pueden liberarse o eliminarse mediante un proceso que incluye calentar la solución que comprende los polinucleótidos antes del procesamiento adicional. In other embodiments, it is envisioned that before or during recombination or rearrangement, polynucleotides generated by the method disclosed herein will be subjected to agents or processes that promote the introduction of mutations into the original polynucleotides. The introduction of such mutations would increase the diversity of the hybrid polynucleotides and polypeptides encoded from there. Agents or processes that promote mutagenesis may include but are not limited to: (+) - CC-1065, or a synthetic analog such as (+) - CC-1065- (N3-Adenine (see Sun and Hurley, (1992 ); an N-acetylated or deacetylated 4'-fluoro-4-aminobiphenyl adduct capable of inhibiting DNA synthesis (see, for example, van de Poll et al. (1992)); or an N-acetylated 4-aminobiphenyl adduct or deacetylated capable of inhibiting DNA synthesis (see also, van de Poll et al. (1992), pp. 751-758); trivalent chromium, a trivalent chromium salt, an adduct of aromatic polycyclic hydrocarbon (PAH) DNA capable of inhibiting DNA replication, such as 7-bromomethyl-benz [a] anthracene ("BMA"), tris (2,3-dibromopropyl) phosphate ("Tris-BP"), 1,2-dibromo-3-chloropropane ( "DBCP"), 2-bromoacrolein (2BA), benzo [a] pyrene-7,8-dihydrodiol-9-10-epoxide ("BPDE"), a platinum (II) halogen salt, N-hydroxy-2 -amino-3-methylimidazo [4,5-f] -quinoline ("N-hydroxy-IQ") and N-hydroxy-2-amino-1-methyl6-phenylimidazo [4,5-f] -pyridine ("N -hydroxy- PhIP ”). Examples of means to slow down or stop PCR amplification consist of UV light (+) - CC-1065 and (+) - CC-1065- (N-3-Adenine). Means encompassed in particular are DNA or polynucleotide adducts comprising the DNA adducts of the polynucleotides or the polynucleotide pool, which may be released or removed by a process including heating the solution comprising the polynucleotides prior to further processing.

También se divulga un método para producir proteínas recombinantes que tienen actividad biológica tratando una muestra que comprende polinucleótidos de plantilla de doble hebra que codifican una proteína de tipo silvestre bajo condiciones que proporcionan la producción de polinucleótidos híbridos o reordenados. Also disclosed is a method of producing recombinant proteins that have biological activity by treating a sample comprising double-stranded template polynucleotides encoding a wild-type protein under conditions that provide for the production of hybrid or rearranged polynucleotides.

Producción de variantes de secuencia Production of sequence variants

También se divulgan métodos adicionales para realizar variantes de secuencias de las secuencias de ácido nucleico (tal como una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) divulgadas en la presente. En algunas realizaciones, la invención también proporciona métodos adicionales para aislar enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa usando los ácidos nucleicos y polipéptidos divulgados en la presente. Se describen variantes de una aldolasa, tal como secuencia de codificación de enzima piruvato aldolasa, HMG y/o KHG aldolasa (tal como un gen, ADNc o mensaje) divulgada en la presente, que puede alterarse por cualquier medio, incluyendo por ejemplo métodos aleatorios o estocásticos o no estocásticos o métodos de “evolución dirigida” como se describió anteriormente. Additional methods for making sequence variants of nucleic acid sequences (such as an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase) disclosed herein are also disclosed. In some embodiments, the invention also provides additional methods for isolating aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase using the nucleic acids and polypeptides disclosed herein. Variants of an aldolase are described, such as pyruvate aldolase, HMG and / or KHG aldolase enzyme coding sequence (such as a gene, cDNA or message) disclosed herein, which can be altered by any means, including for example random methods or stochastic or non-stochastic or "directed evolution" methods as described above.

Las variantes aisladas pueden ser naturales. La variante también puede crearse in vitro. Las variantes pueden crearse usando técnicas de manipulación genética tales como mutagénesis dirigida al sitio, mutagénesis química aleatoria, procedimientos de eliminación de exonucleasa III y técnicas de clonación estándar. Alternativamente, dichas variantes, fragmentos, análogos o derivados pueden crearse usando procedimientos de síntesis química o modificación. Otros métodos para realizar variantes también son conocidos por los expertos en la técnica. Esto incluye procedimientos en los cuales las secuencias de ácido nucleico obtenidas de aislados naturales se modifican para generar ácidos nucleicos que codifican polipéptidos que tienen características que mejoran su valor en aplicaciones industriales o de laboratorio. En dichos procedimientos, se genera y caracteriza un gran número de secuencias variantes que tienen una o más diferencias de nucleótidos con respecto a la secuencia obtenida del aislado natural. Estas diferencias de nucleótidos pueden resultar en cambios de aminoácidos con respecto a los polipéptidos codificados por los ácidos nucleicos de los aislados naturales. Isolated variants can be natural. The variant can also be created in vitro. Variants can be created using genetic manipulation techniques such as site-directed mutagenesis, random chemical mutagenesis, exonuclease III removal procedures, and standard cloning techniques. Alternatively, such variants, fragments, analogs, or derivatives can be created using chemical synthesis or modification procedures. Other methods of making variants are also known to those of skill in the art. This includes procedures in which nucleic acid sequences obtained from natural isolates are modified to generate nucleic acids encoding polypeptides that have characteristics that enhance their value in industrial or laboratory applications. In such procedures, a large number of variant sequences are generated and characterized that have one or more nucleotide differences from the sequence obtained from the natural isolate. These nucleotide differences can result in amino acid changes with respect to the polypeptides encoded by the nucleic acids of the natural isolates.

Por ejemplo, pueden crearse variantes usando PCR propensas a error. En algunas realizaciones de PCR propensa a error, se realiza la PCR bajo condiciones donde la fidelidad de copia de la polimerasa ADN es baja, de tal modo que se obtenga una alta tasa de mutaciones puntuales a lo largo de la longitud entera del producto PCR. Se describe la PCR propensa a error tal como en Leung, D. W. et al., (1989) Technique 1:11-15; y Caldwell, R.C. & Joyce, G.F., (1992) PCR Methods Applic. 2:28-33. Brevemente, en dichos procedimientos, los ácidos nucleicos a mutagenizarse se mezclan con cebadores de PCR, solución amortiguadora de reacción, MgCl2, MnCl2, Taq polimerasa y una concentración apropiada de dNTP para lograr una alta tasa de mutación puntual a lo largo de la longitud entera del producto PCR. Por ejemplo, la reacción puede realizarse usando 20 fmoles de ácido nucleico a mutagenizarse, 30 pmoles de cada cebador de PCR, una solución amortiguadora de reacción que comprende 50 mM KCl, 10 mM Tris HCl (pH 8,3) y 0,01% gelatina, 7 mM MgCl2, 0,5 mM MnCl2, 5 unidades de Taq polimerasa, 0,2 mM dGTP, 0,2 mM dATP, 1 mM dCTP y 1 mM dTTP. La PCR puede realizarse por 30 ciclos de 94°C durante 1 minuto, 45°C durante 1 minuto y 72°C durante 1 minuto. Sin embargo, se apreciará que estos parámetros pueden variar según sea apropiado. Los ácidos nucleicos mutagenizados se clonan en un vector apropiado y se evalúan las actividades de los polipéptidos codificados por los ácidos nucleicos mutagenizados. For example, variants can be created using error prone PCR. In some error-prone embodiments of PCR, PCR is performed under conditions where the copy fidelity of the DNA polymerase is low, such that a high rate of point mutations is obtained over the entire length of the PCR product. Error prone PCR is described as in Leung, D. W. et al., (1989) Technique 1: 11-15; and Caldwell, R.C. & Joyce, G.F., (1992) PCR Methods Applic. 2: 28-33. Briefly, in such procedures, the nucleic acids to be mutagenized are mixed with PCR primers, reaction buffer, MgCl2, MnCl2, Taq polymerase, and an appropriate concentration of dNTP to achieve a high point mutation rate over the entire length. of the PCR product. For example, the reaction can be performed using 20 fmoles of nucleic acid to be mutagenized, 30 pmoles from each PCR primer, a reaction buffer comprising 50 mM KCl, 10 mM Tris HCl (pH 8.3) and 0.01% Gelatin, 7mM MgCl2, 0.5mM MnCl2, 5 Taq Polymerase Units, 0.2mM dGTP, 0.2mM dATP, 1mM dCTP and 1mM dTTP. PCR can be performed for 30 cycles of 94 ° C for 1 minute, 45 ° C for 1 minute, and 72 ° C for 1 minute. However, it will be appreciated that these parameters may vary as appropriate. The mutagenized nucleic acids are cloned into an appropriate vector and the activities of the polypeptides encoded by the mutagenized nucleic acids are evaluated.

En algunas realizaciones, se crean las variantes usando mutagénesis dirigida de oligonucleótidos para generar mutaciones específicas del sitio en cualquier ADN clonado de interés. La mutagénesis de oligonucleótidos se describe por ejemplo en Reidhaar-Olson (1988) Science 241:53-57. Brevemente, en dichos procedimientos una pluralidad de oligonucleótidos de doble hebra que tienen una o más mutaciones a introducirse en el ADN clonado se sintetiza y se inserta en el ADN clonado para mutagenizarse. En algunas realizaciones, los clones que contienen el ADN mutagenizado se recuperan, se expresan y las actividades del polipéptido codificado allí se evalúan. In some embodiments, variants are created using oligonucleotide-directed mutagenesis to generate site-specific mutations in any cloned DNA of interest. Oligonucleotide mutagenesis is described for example in Reidhaar-Olson (1988) Science 241: 53-57. Briefly, in such procedures a plurality of double-stranded oligonucleotides having one or more mutations to be introduced into the cloned DNA is synthesized and inserted into the cloned DNA to be mutagenized. In some embodiments, clones containing the mutagenized DNA are recovered, expressed, and the activities of the polypeptide encoded therein are evaluated.

Otro método para generar variantes es la PCR de ensamblaje. La PCR de ensamblaje implica el ensamblaje de un producto PCR de una mezcla de fragmentos de ADN pequeños. Un gran número de reacciones PCR diferentes ocurre en paralelo en el mismo vial, con los productos de una reacción que ceban los productos de otra reacción. La PCR de ensamblaje se describe en la técnica, tal como en la Patente de Estados Unidos 5.965.408. Another method of generating variants is assembly PCR. Assembly PCR involves the assembly of a PCR product from a mixture of small DNA fragments. A large number of different PCR reactions occur in parallel in the same vial, with the products of one reaction priming the products of another reaction. Assembly PCR is described in the art, such as in US Patent 5,965,408.

En algunas realizaciones, la mutagénesis PCR sexual es un ejemplo de método para generar variantes divulgadas en la presente. En algunas realizaciones de mutagénesis PCR sexual la recombinación homóloga forzada ocurre entre moléculas de ADN de una secuencia de ADN diferente pero altamente relacionada in vitro, como resultado de la fragmentación aleatoria de la molécula de ADN basada en la homología de secuencia, seguida por la fijación del cruce mediante la extensión del cebador en una reacción PCR. La mutagénesis PCR sexual se describe por ejemplo en Stemmer (1994) Proc. Natl. Acad. Sci. Estados Unidos 91:10747-10751. Brevemente, en dichos procedimientos una pluralidad de ácidos nucleicos a recombinarse se digieren con Dnasa para generar fragmentos que tienen un tamaño promedio de 50 -200 nucleótidos. Los fragmentos del tamaño promedio deseado se purifican y se resuspenden en una mezcla PCR. La PCR se realiza bajo condiciones que facilitan la recombinación entre los fragmentos de ácido nucleico. Por ejemplo, la PCR puede realizarse resuspendiendo los fragmentos purificados en una concentración de 10-30 ng/!l en una solución de 0,2 mM de cada dNTP, 2,2 mM MgCl2, 50 mM KCL, 10 mM Tris HCl, pH 9,0, y 0,1% Triton X-100. Se agregan 2,5 unidades de Taq polimerasa por 100 !l de mezcla de reacción y se realiza la PCR usando el siguiente régimen: 94°C durante 60 segundos, 94°C durante 30 segundos, 50-55°C durante 30 segundos, 72°C durante 30 segundos (30-45 veces) y 72°C durante 5 minutos. Sin embargo, se apreciará que estos parámetros pueden variar según sea apropiado. En algunas realizaciones, los oligonucleótidos pueden estar incluidos en las reacciones PCR. En otras realizaciones, el fragmento Klenow de polimerasa ADN I puede usarse en un primer juego de reacciones PCR y la Taq polimerasa puede usarse en un juego posterior de reacciones PCR. Las secuencias recombinantes se aíslan y las actividades de los polipéptidos que codifican se evalúan. In some embodiments, sexual PCR mutagenesis is an example of a method of generating variants disclosed herein. In some embodiments of sexual PCR mutagenesis, forced homologous recombination occurs between DNA molecules of a different but highly related DNA sequence in vitro, as a result of random fragmentation of the DNA molecule based on sequence homology, followed by fixation. crossing by primer extension in a PCR reaction. Sexual PCR mutagenesis is described for example in Stemmer (1994) Proc. Natl. Acad. Sci. United States 91: 10747-10751. Briefly, in such procedures a plurality of nucleic acids to be recombined are digested with Dnase to generate fragments having an average size of 50-200 nucleotides. Fragments of the desired average size are purified and resuspended in a PCR mixture. PCR is performed under conditions that facilitate recombination between nucleic acid fragments. For example, PCR can be performed by resuspending the purified fragments at a concentration of 10-30 ng / µl in a 0.2mM solution of each dNTP, 2.2mM MgCl2, 50mM KCL, 10mM Tris HCl, pH 9.0, and 0.1% Triton X-100. 2.5 units of Taq polymerase per 100 µl of reaction mixture are added and PCR is performed using the following regimen: 94 ° C for 60 seconds, 94 ° C for 30 seconds, 50-55 ° C for 30 seconds, 72 ° C for 30 seconds (30-45 times) and 72 ° C for 5 minutes. However, it will be appreciated that these parameters may vary as appropriate. In some embodiments, the oligonucleotides can be included in the PCR reactions. In other embodiments, the Klenow fragment of DNA polymerase I can be used in a first set of PCR reactions and Taq polymerase can be used in a subsequent set of PCR reactions. Recombinant sequences are isolated and the activities of the encoding polypeptides are evaluated.

En algunas realizaciones, las variantes se crean mediante mutagénesis in vivo. En algunas realizaciones, las mutaciones aleatorias en una secuencia de interés se generan propagando la secuencia de interés en una cepa bacteriana, tal como la cepa E. Coli que lleva mutaciones en una o más de las vías de reparación de ADN. Dichas cepas “mutadoras” tienen una tasa de mutación aleatoria más alta que la de un padre de tipo silvestre. Propagar el ADN en una de estas cepas finalmente generará mutaciones aleatorias dentro del ADN. Las cepas mutadoras adecuadas para el uso para la mutagénesis in vivo se describen en la Publicación PCT No. WO 91/16427, publicada el 31 de oct. de 1991 titulada “Métodos para la creación de fenotipos a partir de poblaciones de genes múltiples”. In some embodiments, the variants are created by in vivo mutagenesis. In some embodiments, random mutations in a sequence of interest are generated by propagating the sequence of interest into a bacterial strain, such as the E. coli strain that carries mutations in one or more of the DNA repair pathways. Such "mutant" strains have a higher random mutation rate than that of a wild-type parent. Propagating the DNA in one of these strains will eventually generate random mutations within the DNA. Mutant strains suitable for use for in vivo mutagenesis are described in PCT Publication No. WO 91/16427, published Oct. 31. 1991 entitled "Methods for Phenotype Creation from Multiple Gene Populations".

Las variantes también pueden generarse usando mutagénesis de cassette. En la mutagénesis de cassette una pequeña región de una molécula de ADN de doble hebra se reemplaza por un “cassette” de oligonucleótido sintético que difiere de la secuencia nativa. El oligonucleótido contiene con frecuencia una secuencia nativa completamente y/o parcialmente aleatorizada. Variants can also be generated using cassette mutagenesis. In cassette mutagenesis, a small region of a double-stranded DNA molecule is replaced by a synthetic oligonucleotide "cassette" that differs from the native sequence. The oligonucleotide often contains a fully and / or partially randomized native sequence.

También puede usarse la mutagénesis de ensamblaje recursivo para generar variantes. La mutagénesis de ensamblaje recursivo es un algoritmo para la manipulación de proteínas (mutagénesis de proteínas) desarrollada para producir poblaciones diversas de mutantes fenotípicamente relacionadas cuyos miembros difieren en la secuencia de aminoácido. Este método usa un mecanismo de retroalimentación para controlar rondas sucesivas de mutagénesis de cassette combinatorias. La mutagénesis de ensamblaje recursivo se describe por ejemplo en Arkin (1992) Proc. Natl. Acad. Sci. Estados Unidos 89:7811-7815. Recursive assembly mutagenesis can also be used to generate variants. Recursive assembly mutagenesis is an algorithm for protein manipulation (protein mutagenesis) developed to produce diverse populations of phenotypically related mutants whose members differ in amino acid sequence. This method uses a feedback mechanism to control successive rounds of combinatorial cassette mutagenesis. Recursive assembly mutagenesis is described for example in Arkin (1992) Proc. Natl. Acad. Sci. United States 89: 7811-7815.

En algunas realizaciones, las variantes se crean usando mutagénesis de ensamblaje exponencial. La mutagénesis de ensamblaje exponencial es un proceso para generar bibliotecas combinatorias con una alto porcentaje de mutantes únicos y funcionales, en donde pequeños grupos de residuos se aleatorizan en paralelo para identificar, en cada posición alterada, aminoácidos que conducen a proteínas funcionales. La mutagénesis de ensamblaje exponencial se describe por ejemplo en Delegrave (1993) Biotechnology Res. 11:1548-1552. La mutagénesis aleatoria y dirigida al sitio se describe, por ejemplo, en Arnold (1993) Current Opinion in Biotechnology 4:450-455. In some embodiments, the variants are created using exponential assembly mutagenesis. Exponential assembly mutagenesis is a process to generate combinatorial libraries with a high percentage of unique and functional mutants, where small groups of residues are randomized in parallel to identify, at each altered position, amino acids that lead to functional proteins. Exponential assembly mutagenesis is described for example in Delegrave (1993) Biotechnology Res. 11: 1548-1552. Random and site-directed mutagenesis is described, for example, in Arnold (1993) Current Opinion in Biotechnology 4: 450-455.

En algunas realizaciones, las variantes se crean usando procedimientos de transposición en donde porciones de una pluralidad de ácidos nucleicos que codifican distintos polipéptidos se fusionan para crear secuencias de ácido nucleico quimérico que codifican polipéptidos quiméricos como se describe en la Patente de Estados Unidos 5.965.408, presentada el 9 de jul. de 1996, titulada “Método de reensamblaje de ADN mediante interrupción de la síntesis” y la Patente de los Estados Unidos No. 5.939.250, presentada el 22 de mayo de 1996, titulada “Producción de enzimas que tienen actividades deseadas por mutagénesis”. In some embodiments, variants are created using rearrangement procedures where portions of a plurality of nucleic acids encoding different polypeptides are fused to create chimeric nucleic acid sequences encoding chimeric polypeptides as described in US Patent 5,965,408. , presented on Jul 9. 1996, entitled "DNA Reassembly Method by Disruption of Synthesis" and US Patent No. 5,939,250, filed May 22, 1996, entitled "Production of Enzymes Having Desired Activities by Mutagenesis".

Las variantes de los polipéptidos divulgadas en la presente pueden ser variantes en las cuales uno o más de los residuos de aminoácidos de los polipéptidos de las secuencias divulgadas en la presente se sustituyen con un residuo de aminoácido conservado o no conservado (en algunas realizaciones, un residuo de aminoácido conservado) y dicho residuo de aminoácido sustituido puede o no codificarse por el código genético. Variants of the polypeptides disclosed herein may be variants in which one or more of the amino acid residues of the polypeptides of the sequences disclosed herein are replaced with a conserved or non-conserved amino acid residue (in some embodiments, a conserved amino acid residue) and said substituted amino acid residue may or may not be encoded by the genetic code.

En algunas realizaciones, las sustituciones conservadoras son aquellas que sustituyen un aminoácido dado en un polipéptido por otro aminoácido de características similares. En algunas realizaciones, las sustituciones conservadoras divulgadas en la presente comprenden los siguientes reemplazos: reemplazos de un aminoácido alifático tal como Alanina, Valina, Leucina e Isoleucina con otro aminoácido alifático; reemplazo de una Serina con una Treonina o viceversa; reemplazo de un residuo ácido tal como ácido Aspártico y ácido Glutámico con otro residuo ácido; reemplazo de un residuo que tiene un grupo amida, tal como Asparagina y Glutamina, con otro residuo que tiene un grupo amida; intercambio de un residuo básico tal como Lisina y Arginina con otro residuo básico; y reemplazo de un residuo aromático tal como Fenilalanina, Tirosina con otro residuo aromático. In some embodiments, conservative substitutions are those that substitute a given amino acid in a polypeptide for another amino acid of similar characteristics. In some embodiments, the conservative substitutions disclosed herein comprise the following replacements: replacements of an aliphatic amino acid such as Alanine, Valine, Leucine, and Isoleucine with another aliphatic amino acid; replacing a Serine with a Threonine or vice versa; replacement of an acidic residue such as Aspartic acid and Glutamic acid with another acidic residue; replacement of a residue having an amide group, such as Asparagine and Glutamine, with another residue having an amide group; exchanging a basic residue such as Lysine and Arginine with another basic residue; and replacement of an aromatic residue such as Phenylalanine, Tyrosine with another aromatic residue.

Otras variantes son aquellas en las cuales uno o más de los residuos de aminoácido de un polipéptido divulgado en la presente incluyen un grupo sustituyente. En algunas realizaciones, otras variantes son aquellas en las cuales el polipéptido se asocia con otro compuesto, tal como un compuesto para aumentar la vida media del polipéptido (por ejemplo, polietilenglicol). Las variantes adicionales son aquellas en las cuales se fusionan aminoácidos adicionales al polipéptido, tal como una secuencia líder, una secuencia secretora, una secuencia de proproteína o una secuencia que facilita la purificación, enriquecimiento o estabilización del polipéptido. Other variants are those in which one or more of the amino acid residues of a polypeptide disclosed herein include a substituent group. In some embodiments, other variants are those in which the polypeptide associates with another compound, such as a compound to increase the half-life of the polypeptide (eg, polyethylene glycol). Additional variants are those in which additional amino acids are fused to the polypeptide, such as a leader sequence, a secretory sequence, a proprotein sequence, or a sequence that facilitates purification, enrichment, or stabilization of the polypeptide.

En algunas realizaciones, los fragmentos, derivados y análogos retienen la misma función o actividad biológica que los polipéptidos divulgados en la presente y secuencias sustancialmente idénticas a las mismas. En otras realizaciones, el fragmento, derivado o análogo incluye una proproteína, de tal modo que el fragmento, derivado o análogo pueda activarse mediante la escisión de la porción de proproteína para producir un polipéptido activo. In some embodiments, the fragments, derivatives, and analogs retain the same biological function or activity as the polypeptides disclosed herein and sequences substantially identical thereto. In other embodiments, the fragment, derivative, or analog includes a proprotein, such that the fragment, derivative, or analog can be activated by cleavage of the proprotein portion to produce an active polypeptide.

Optimización de codones para lograr altos niveles de expresión de proteína en células huésped Codon optimization to achieve high levels of protein expression in host cells

Se describen métodos para modificar ácidos nucleicos que codifican una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, para modificar (tal como optimizar) el uso de codones. Se describen además métodos para modificar codones en un ácido nucleico que codifica una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa para aumentar o reducir su expresión en una célula huésped. También se divulgan ácidos nucleicos que codifican una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa modifica para aumentar su expresión en una célula huésped, enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa así modificada, y métodos para preparar las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa modificadas. El método comprende identificar un codón "no preferido" o “menos preferido” en ácido nucleico que codifica enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa y reemplazar uno o más de estos codones no preferidos o menos preferidos por un “codón preferido” que codifica el mismo aminoácido que el codón reemplazado y al menos un codón no preferido o menos preferido en el ácido nucleico ha sido reemplazado por un codón preferido que codifica el mismo aminoácido. Un codón preferido es un codón sobrerrepresentado en secuencias codificadoras en genes en la célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificadoras en genes en la célula huésped. Methods are described for modifying nucleic acids encoding an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, to modify (such as optimize) the use of codons. Methods for modifying codons in a nucleic acid encoding an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase to increase or decrease its expression in a host cell are further described. Nucleic acids encoding an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, are modified to increase their expression in a host cell, enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, thus modified , and methods for preparing the aldolase enzymes, such as pyruvate aldolase, such as HMG and / or modified KHG aldolase. The method comprises identifying a "non-preferred" or "least preferred" codon in nucleic acid encoding aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase, and replacing one or more of these non-preferred or less preferred codons with a "preferred codon" encoding the same amino acid as the replaced codon and at least one non-preferred or less preferred codon in the nucleic acid has been replaced by a preferred codon encoding the same amino acid. A preferred codon is an underrepresented codon in gene encoding sequences in the host cell and a non-preferred or less preferred codon is an underrepresented codon in gene encoding sequences in the host cell.

Las células huésped para expresar los ácidos nucleicos, cassettes de expresión y vectores divulgados en la presente incluyen bacterias, levaduras, hongos, células vegetales, células de insectos y células de mamíferos (ver la discusión anteriormente). Por lo tanto, existen métodos para optimizar el uso de codones en todas estas células, ácidos nucleicos alterados por codones y polipéptidos realizados por los ácidos nucleicos alterados por codón. Ejemplos de células huésped incluyen bacterias gram negativas tales como Escherichia coli; bacterias gram positivas, tales como Streptomyces sp., Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis, Bacillus cereus. Ejemplos de células huésped también incluyen organismos eucariotas, tales como varias levaduras, tales como Saccharomyces sp., incluyendo Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, y Kluyveromyces lactis, Hansenula polymorpha, Aspergillus niger y células y líneas celulares de mamíferos y células y líneas celulares de insectos. Por lo tanto, también se describen ácidos nucleicos y polipéptidos optimizados para la expresión en estos organismos y especies. Host cells for expressing the nucleic acids, expression cassettes, and vectors disclosed herein include bacteria, yeast, fungi, plant cells, insect cells, and mammalian cells (see discussion above). Therefore, there are methods to optimize codon usage in all of these cells, codon-altered nucleic acids, and polypeptides made by codon-altered nucleic acids. Examples of host cells include gram negative bacteria such as Escherichia coli; Gram positive bacteria, such as Streptomyces sp., Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis, Bacillus cereus. Examples of host cells also include eukaryotic organisms, such as various yeasts, such as Saccharomyces sp., Including Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, and Kluyveromyces lactis, Hansenula polymorpha, Aspergillus niger, and mammalian cells and cell lines. insect cell phones. Therefore, nucleic acids and polypeptides optimized for expression in these organisms and species are also described.

Por ejemplo, los codones de un ácido nucleico que codifican una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa aisladas de una célula bacteriana se modifican de tal modo que el ácido nucleico se expresa óptimamente en una célula bacteriana diferente de las bacterias de las cuales la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa se derivan, un levadura, un hongo, una célula vegetal, una célula de insecto o una célula mamífera. Los métodos para optimizar codones son bien conocidos en la técnica, ver la Patente de los Estados Unidos No. 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998) Protein Expr. Purif 12:185-188; Narum (2001) Infect. Immun. 69:7250-7253. También ver Narum (2001) Infect. Immun. 69:7250-7253, que describe codones de optimización en sistemas de ratón; Outchkourov (2002) Protein Expr. Purif. 24:18-24, que describe codones de optimización en levaduras; Feng (2000) Biochemistry 39:15399-15409, que describe codones de optimización en E. coli; Humphreys (2000) Protein Expr. Purif. 20:252-264, que describe el uso de codones de optimización que afecta la secreción en E. coli. For example, codons of a nucleic acid encoding an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase isolated from a bacterial cell are modified such that the nucleic acid is optimally expressed in a bacterial cell other than those bacteria from which the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase are derived, a yeast, a fungus, a plant cell, an insect cell or a mammalian cell. Methods for optimizing codons are well known in the art, see US Patent No. 5,795,737; Baca (2000) Int. J. Parasitol. 30: 113-118; Hale (1998) Protein Expr. Purif 12: 185-188; Narum (2001) Infect. Immun. 69: 7250-7253. Also see Narum (2001) Infect. Immun. 69: 7250-7253, which describes optimization codons in mouse systems; Outchkourov (2002) Protein Expr. Purif. 24: 18-24, which describes optimization codons in yeast; Feng (2000) Biochemistry 39: 15399-15409, which describes optimization codons in E. coli; Humphreys (2000) Protein Expr. Purif. 20: 252-264, which describes the use of optimization codons that affects secretion in E. coli.

Animales no humanos transgénicos Transgenic non-human animals

También se divulgan animales no humanos transgénicos que comprenden un ácido nucleico, un polipéptido (tal como una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa), un cassette o vector de expresión o una célula transfectada o transformada divulgados en la presente. También se divulgan métodos para realizar y usar estos animales no humanos transgénicos. Transgenic non-human animals comprising a nucleic acid, a polypeptide (such as an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase), a cassette or expression vector or a transfected or transformed cell disclosed in the invention are also disclosed. Present. Methods for making and using these transgenic non-human animals are also disclosed.

Los animales no humanos transgénicos pueden ser, por ejemplo, perros, cabras, conejos, ovejas, caballos, peces, cerdos (incluyendo todos los porcinos, puercos y animales relacionados), vacas, ratas y ratones, que comprenden los ácidos nucleicos divulgados en la presente. Estos animales pueden usarse por ejemplo en modelos in vivo para estudiar la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, la actividad o como modelos para analizar agentes que cambian la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa actividad in vivo. Las secuencias de codificación para los polipéptidos para expresarse en animales no humanos transgénicos pueden diseñarse para ser constitutivas o bajo el control de factores reguladores transcripcionales específicos de tejido, específicos de desarrollo o inducibles. Transgenic non-human animals can be, for example, dogs, goats, rabbits, sheep, horses, fish, pigs (including all pigs, pigs, and related animals), cows, rats, and mice, which comprise the nucleic acids disclosed in the Present. These animals can be used for example in in vivo models to study the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, the activity or as models to analyze agents that change the enzyme aldolase, such as pyruvate aldolase, such like HMG and / or KHG aldolase activity in vivo. Coding sequences for polypeptides to be expressed in transgenic non-human animals can be designed to be constitutive or under the control of tissue-specific, developmental-specific, or inducible transcriptional regulatory factors.

Los animales no humanos transgénicos pueden diseñarse y generarse usando cualquier método conocido en la técnica; ver las Patentes de Estados Unidos No. 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166; 6.107.541; 5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698; 5.639.940; 5.573.933; 5.387.742; 5.087.571, que describen la realización y el uso de células y huevos transformados y ratones, ratas, conejos, ovejas, cerdos, pollos, cabras, peces y vacas transgénicos. Ver también por ejemplo Pollock (1999) J. Immunol. Methods 231:147-157, que describe la producción de proteínas recombinantes en la leche de los animales transgénicos que producen lácteos; Baguisi (1999) Nat. Biotechnol. 17:456-461, que demuestra la producción de cabras transgénicas. La Patente de los Estados Unidos No. 6.211.428, describe la realización y el uso de mamíferos no humanos transgénicos que expresan en sus cerebros un constructo de ácido nucleico que comprende una secuencia de ADN. La Patente de Estados Unidos 5.387.742, describe la inyección de secuencias de ADN clonadas recombinantes o sintéticas en huevos de ratón fertilizados, el implante de huevos inyectados en hembras pseudo-embarazadas, y el crecimiento de crecimiento a término de ratones transgénicos. La Patente de los Estados Unidos No. 6.187.992, describe la realización y el uso de un ratón transgénico. Transgenic non-human animals can be designed and generated using any method known in the art; see United States Patents No. 6,211,428; 6,187,992; 6,156,952; 6,118,044; 6,111,166; 6,107,541; 5,959,171; 5,922,854; 5,892,070; 5,880,327; 5,891,698; 5,639,940; 5,573,933; 5,387,742; 5,087,571, which describe the making and use of transgenic cells and eggs and transgenic mice, rats, rabbits, sheep, pigs, chickens, goats, fish, and cows. See also for example Pollock (1999) J. Immunol. Methods 231: 147-157, which describes the production of recombinant proteins in the milk of transgenic dairy-producing animals; Baguisi (1999) Nat. Biotechnol. 17: 456-461, which demonstrates the production of transgenic goats. United States Patent No. 6,211,428, describes the making and use of transgenic non-human mammals expressing in their brains a nucleic acid construct comprising a DNA sequence. US Patent 5,387,742, describes the injection of recombinant or synthetic cloned DNA sequences into fertilized mouse eggs, the implantation of eggs injected into pseudo-pregnant females, and the term growth growth of transgenic mice. United States Patent No. 6,187,992 describes the making and use of a transgenic mouse.

Los “animales knockout” también pueden usarse para realizar los métodos divulgados en la presente. Por ejemplo, en algunas realizaciones, los animales transgénicos o modificados divulgados en la presente comprenden un “animal knockout”, tal como un “ratón knockout”, manipulado para no expresar un gen endógeno, que se reemplaza por un gen que expresa una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa divulgada en la presente, o una proteína de fusión que comprende una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa divulgada en la presente "Knockout animals" can also be used to perform the methods disclosed herein. For example, in some embodiments, the transgenic or modified animals disclosed herein comprise a "knockout animal", such as a "knockout mouse", manipulated not to express an endogenous gene, which is replaced by a gene that expresses an aldolase enzyme , such as pyruvate aldolase, HMG and / or KHG aldolase disclosed herein, or a fusion protein comprising an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase disclosed herein

Plantas y semillas transgénicas Transgenic plants and seeds

La invención proporciona plantas y semillas transgénicas que comprenden un ácido nucleico, un polipéptido (tal como una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa), un cassette o vector de expresión o una célula transfectada o transformada. La invención también proporciona productos o derivados vegetales, tales como frutas, aceites, semillas, hojas, extractos y similares, incluyendo cualquier parte de planta, que comprende un ácido nucleico y/o polipéptido (tal como una xilanasa) divulgado en la presente, tal como en donde el ácido nucleico The invention provides transgenic plants and seeds comprising a nucleic acid, a polypeptide (such as an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase), a cassette or expression vector, or a transfected or transformed cell. The invention also provides plant products or derivatives, such as fruits, oils, seeds, leaves, extracts, and the like, including any plant part, comprising a nucleic acid and / or polypeptide (such as a xylanase) disclosed herein, such like where the nucleic acid

o polipéptido divulgado en la presente es heterólogo para la planta, parte de planta, semilla, etc. La planta transgénica (que incluye partes de planta, frutas, semillas, etc.) puede ser dicotiledónea o monocotiledónea. También se divulgan métodos para realizar y usar estas plantas y semillas transgénicas. La planta o célula vegetal transgénicas que expresan un polipéptido divulgado en la presente pueden construirse de acuerdo con cualquier método conocido en la técnica. Ver, por ejemplo, la Patente de los Estados Unidos No. 6.309.872. or polypeptide disclosed herein is heterologous to the plant, plant part, seed, etc. The transgenic plant (which includes plant parts, fruits, seeds, etc.) can be dicotyledonous or monocotyledonous. Methods for making and using these transgenic plants and seeds are also disclosed. The transgenic plant or plant cell expressing a polypeptide disclosed herein can be constructed according to any method known in the art. See, for example, United States Patent No. 6,309,872.

Los ácidos nucleicos y constructos de expresión divulgados en la presente pueden introducirse en una célula vegetal por cualquier medio. Por ejemplo, los ácidos nucleicos o constructos de expresión pueden introducirse en el genoma de un huésped vegetal deseado, o los ácidos nucleicos o constructos de expresión pueden ser episomas. La introducción en el genoma de una planta deseada puede ser tal que la producción de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa del huésped está regulada por elementos de control transcripcionales o translacionales endógenos. También se describen “plantas knockout” en donde la inserción de la secuencia génica mediante por ejemplo recombinación homóloga ha alterado la expresión del gen endógeno. Los medios para generar plantas “knockout” se conocen bien en la técnica, ver (1998) Proc Natl. Acad. Sci. Estados Unidos 95:4368-4373; Miao (1995) Plant J 7:359-365. Ver la discusión sobre plantas transgénicas a continuación. The nucleic acids and expression constructs disclosed herein can be introduced into a plant cell by any means. For example, nucleic acids or expression constructs can be introduced into the genome of a desired plant host, or nucleic acids or expression constructs can be episomes. The introduction into the genome of a desired plant may be such that the production of enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase from the host is regulated by endogenous transcriptional or translational control elements. Also described are "knockout plants" where insertion of the gene sequence by for example homologous recombination has altered the expression of the endogenous gene. Means for generating "knockout" plants are well known in the art, see (1998) Proc Natl. Acad. Sci. United States 95: 4368-4373; Miao (1995) Plant J 7: 359-365. See the discussion on transgenic plants below.

Los ácidos nucleicos divulgados en la presente pueden usarse para conferir rasgos deseados en esencialmente cualquier planta, tal como plantas productoras de almidón, tal como patata, tomate, soja, remolachas, maíz, trigo, arroz, cebada y similares. Los ácidos nucleicos divulgados en la presente pueden usarse para manipular vías metabólicas de una planta para optimizar o alterar la expresión del huésped de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Los ácidos nucleicos divulgados en la presente pueden cambiar los niveles de expresión o actividad o alterar las características de los compuestos o enzimas producidos naturalmente en una planta. Alternativamente, una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgada en la presente puede usarse en la producción de una planta transgénica para producir un compuesto no producido naturalmente por dicha planta. Esto puede reducir los costos de producción o crear un nuevo producto. The nucleic acids disclosed herein can be used to confer desired traits on essentially any plant, such as starch-producing plants, such as potato, tomato, soybean, beet, corn, wheat, rice, barley, and the like. The nucleic acids disclosed herein can be used to manipulate metabolic pathways of a plant to optimize or alter expression of the enzyme aldolase host, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The nucleic acids disclosed herein can change the levels of expression or activity or alter the characteristics of naturally occurring compounds or enzymes in a plant. Alternatively, an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, disclosed herein can be used in the production of a transgenic plant to produce a compound not naturally produced by said plant. This can reduce production costs or create a new product.

En algunas realizaciones, la primera etapa en la producción de una planta transgénica implica realizar un constructo de expresión para la expresión en una célula vegetal. Estas técnicas son bien conocidas en la técnica. Pueden incluir seleccionar y clonar un promotor, una secuencia de codificación para facilitar la unión eficiente de ribosomas para ARNm y seleccionar las secuencias de terminador de gen apropiadas. Un ejemplo de promotor constitutivo es CaMV35S, del virus mosaico del coliflor, que generalmente resulta en un alto grado de expresión en plantas. Otros promotores son más específicos y responden a señales en el ambiente interno o externo de la planta. Un ejemplo de promotor inducible por luz es el promotor del gen cab, que codifica la proteína de unión a/b de clorofila principal. In some embodiments, the first step in the production of a transgenic plant involves making an expression construct for expression in a plant cell. These techniques are well known in the art. They may include selecting and cloning a promoter, a coding sequence to facilitate efficient ribosome binding to mRNA, and selecting the appropriate gene terminator sequences. An example of a constitutive promoter is CaMV35S, from the cauliflower mosaic virus, which generally results in a high degree of expression in plants. Other promoters are more specific and respond to signals in the internal or external environment of the plant. An example of a light inducible promoter is the cab gene promoter, which encodes the major chlorophyll a / b binding protein.

En algunas realizaciones, el ácido nucleico se modifica para lograr una expresión mayor en una célula vegetal. Por ejemplo, es probable que una secuencia divulgada en la presente tenga un mayor porcentaje de pares de nucleótidos A-T comparados con el que se vio en la planta, algunos de los cuales prefieren pares de nucleótidos G-In some embodiments, the nucleic acid is modified to achieve increased expression in a plant cell. For example, a sequence disclosed herein is likely to have a higher percentage of A-T nucleotide pairs compared to that seen in the plant, some of which prefer G- nucleotide pairs.

C. Por lo tanto, los nucleótidos A-T en la secuencia de codificación pueden sustituirse con nucleótidos G-C sin cambiar significativamente la secuencia de aminoácidos para mejorar la producción del producto génico en las células vegetales. C. Therefore, A-T nucleotides in the coding sequence can be replaced with G-C nucleotides without significantly changing the amino acid sequence to improve production of the gene product in plant cells.

El gen marcador seleccionable puede agregarse al constructo génico para identificar células o tejidos vegetales que han integrado exitosamente el transgén. Esto puede ser necesario porque lograr la incorporación y expresión de los genes en células vegetales es un evento raro, que ocurre sólo en un porcentaje bajo de tejidos o células dirigidos. Los genes marcadores seleccionables codifican proteínas que proporcionan resistencia a agentes que son normalmente tóxicos para las plantas, tales como antibióticos o herbicidas. Sólo las células vegetales que han integrado el gen marcador seleccionable sobrevivirán cuando crecen en un medio que contiene el antibiótico o herbicida apropiados. Para otros genes insertados, los genes marcadores también requieren secuencias promotoras y de terminación para el funcionamiento adecuado. The selectable marker gene can be added to the gene construct to identify plant cells or tissues that have successfully integrated the transgene. This may be necessary because achieving gene incorporation and expression in plant cells is a rare event, occurring only in a low percentage of targeted tissues or cells. The selectable marker genes encode proteins that provide resistance to agents that are normally toxic to plants, such as antibiotics or herbicides. Only plant cells that have integrated the selectable marker gene will survive when grown in a medium containing the appropriate antibiotic or herbicide. For other inserted genes, marker genes also require promoter and termination sequences for proper operation.

En algunas realizaciones, realizar plantas o semillas transgénicas comprende incorporar secuencias divulgadas en la presente y opcionalmente genes marcadores en un constructo de expresión objetivo (tal como un plásmido) junto con el posicionamiento del promotor y las secuencias de terminador. Esto puede implicar la transferencia del gen modificado en la planta a través de un método adecuado. Por ejemplo, un constructo puede introducirse directamente en el ADN genómico de la célula vegetal usando técnicas tales como electroporación y microinyección de protoplastos de célula vegetal, o los constructos pueden introducirse directamente al tejido vegetal usando métodos balísticos, tales como bombardeo de partículas de ADN. Por ejemplo, ver Christou (1997) Plant Mol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73; Takumi (1997) Genes Genet. Syst. 72:63-69, que describe el uso del bombardeo de partículas para introducir transgenes en trigo; y Adam (1997) supra, para el uso del bombardeo de partículas para introducir YAC en células vegetales. Por ejemplo, Rinehart (1997) supra, usó el bombardeo de partículas para generar plantas de algodón transgénicas. Los aparatos para acelerar partículas se describen en la Patente de los Estados Unidos No. 5.015.580 y el instrumento de de aceleración de partículas disponible Bio-Rad (Biolistics) PDS-2000 (Bio-Rad, Hercules, CA); ver también John, Patente de los Estados Unidos No. 5.608.148 y Ellis, Patente de los Estados Unidos No. 5.681.730, que describe la transformación de gimnospermas medidas por partículas. In some embodiments, making transgenic plants or seeds comprises incorporating sequences disclosed herein and optionally marker genes into a target expression construct (such as a plasmid) along with positioning of the promoter and terminator sequences. This may involve transferring the modified gene into the plant through a suitable method. For example, a construct can be directly introduced into plant cell genomic DNA using techniques such as electroporation and microinjection of plant cell protoplasts, or the constructs can be directly introduced into plant tissue using ballistic methods, such as bombardment of DNA particles. For example, see Christou (1997) Plant Mol. Biol. 35: 197-203; Pawlowski (1996) Mol. Biotechnol. 6: 17-30; Klein (1987) Nature 327: 70-73; Takumi (1997) Genes Genet. Syst. 72: 63-69, which describes the use of particle bombardment to introduce transgenes into wheat; and Adam (1997) supra, for the use of particle bombardment to introduce YAC into plant cells. For example, Rinehart (1997) supra, used particle bombardment to generate transgenic cotton plants. Particle acceleration apparatus are described in US Patent No. 5,015,580 and the available Bio-Rad (Biolistics) PDS-2000 particle acceleration instrument (Bio-Rad, Hercules, CA); see also John, US Patent No. 5,608,148 and Ellis, US Patent No. 5,681,730, which describes the transformation of gymnosperms measured by particles.

En algunas realizaciones, los protoplastos pueden inmovilizarse e inyectarse con ácidos nucleicos, tales como un constructo de expresión. Si bien la regeneración vegetal a partir de protoplastos no es fácil con los cereales, la regeneración de vegetal es posible en legumbres usando embriogénesis somática a partir de callos derivados de protoplastos. Los tejidos organizados pueden transformarse con ADN desnudo usando la técnica de pistola de genes, donde el ADN se recubre en microproyectiles de tungsteno, se disparan 1/100 del tamaño de las células que llevan el ADN en profundidad en las células y organelos. El tejido transformado luego se induce para regenerarse habitualmente mediante embriogénesis somática. Esta técnica fue exitosa en varias especies de cereal que incluyen maíz y arroz. In some embodiments, the protoplasts can be immobilized and injected with nucleic acids, such as an expression construct. Although plant regeneration from protoplasts is not easy with cereals, plant regeneration is possible in legumes using somatic embryogenesis from protoplast-derived calli. Organized tissues can be transformed with naked DNA using the gene gun technique, where the DNA is coated in tungsten microprojectiles, fired 1/100 the size of cells that carry DNA deep into cells and organelles. The transformed tissue is then induced to usually regenerate by somatic embryogenesis. This technique was successful in several cereal species including corn and rice.

Los ácidos nucleicos tales como constructos de expresión también pueden introducirse en células vegetales usando virus recombinantes. Las células vegetales pueden transformarse usando vectores virales, tales como vectores derivados del virus mosaico del tabaco (Rouwendal (1997) Plant Mol. Biol. 33:989-999), ver Porta (1996) “Use of viral replicons for the expression of genes in plants”, Mol. Biotechnol. 5:209-221. Nucleic acids such as expression constructs can also be introduced into plant cells using recombinant viruses. Plant cells can be transformed using viral vectors, such as vectors derived from tobacco mosaic virus (Rouwendal (1997) Plant Mol. Biol. 33: 989-999), see Porta (1996) "Use of viral replicons for the expression of genes in plants ”, Mol. Biotechnol. 5: 209-221.

Alternativamente, los ácidos nucleicos, tales como un constructo de expresión, pueden combinarse con regiones de flanqueo de ADN adecuadas e introducirse en un vector huésped de Agrobacterium tumefaciens convencional. Las funciones de virulencia del huésped de Agrobacterium tumefaciens se dirigirá a la inserción del constructo y marcador adyacente en el ADN de la célula vegetal cuando la célula se infecte por las bacterias. Las técnicas de transformación mediadas por Agrobacterium tumefaciens, incluyendo el desarme y el uso de vectores binarios, se describe bien en la bibliografía científica. Ver Horsch (1984) Science 233:496-498; Fraley (1983) Proc. Natl. Acad. Sci. Estados Unidos 80:4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlín 1995). El ADN en una célula A. tumefaciens está contenido en el cromosoma bacteriano, así como en otra estructura conocida como un plásmido Ti (inductor de tumor). El plásmido Ti contiene un alargamiento de ADN denominado ADN-T (de ˜20 kb de longitud) que se transfiere a la célula vegetal en el proceso de infección y una serie de genes vir (virulencia) que dirigen el proceso de infección. A. tumefaciens solo puede infectar una planta a través de heridas: cuando una raíz o tallo vegetal está herido da ciertas señales químicas en respuesta a las cuales los genes vir de A. tumefaciens se vuelven activados y dirigen una serie de eventos necesarios para la transferencia del ADN-T del plásmido Ti al cromosoma de la planta. El ADN-T luego ingresa a la célula vegetal a través de la herida. Una especulación es que el ADN-T espera hasta que el ADN vegetal se replique o transcriba, luego se inserta en el ADN vegetal expuesto. De modo de usar A. tumefaciens como un vector de transgén, la sección inductora de tumor de ADN-T tiene que eliminarse mientras que retiene las regiones de límite de ADN-T y los genes vir. El transgén luego se inserta entre las regiones de límite de ADN-T, donde se transfiere a la célula vegetal y se integra a los cromosomas vegetales. Alternatively, nucleic acids, such as an expression construct, can be combined with suitable DNA flanking regions and introduced into a conventional Agrobacterium tumefaciens host vector. The virulence functions of the Agrobacterium tumefaciens host will target insertion of the construct and adjacent marker into the DNA of the plant cell when the cell is infected by bacteria. Agrobacterium tumefaciens-mediated transformation techniques, including disarmament and the use of binary vectors, are well described in the scientific literature. See Horsch (1984) Science 233: 496-498; Fraley (1983) Proc. Natl. Acad. Sci. United States 80: 4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995). DNA in an A. tumefaciens cell is contained on the bacterial chromosome, as well as in another structure known as a Ti (tumor inducing) plasmid. The Ti plasmid contains a DNA elongation called T-DNA (˜20 kb in length) that is transferred to the plant cell in the infection process and a series of vir (virulence) genes that direct the infection process. A. tumefaciens can only infect a plant through wounds: when a root or plant stem is wounded it gives certain chemical signals in response to which the A. tumefaciens vir genes become activated and direct a series of events necessary for transfer of the T-DNA from the Ti plasmid to the plant chromosome. The T-DNA then enters the plant cell through the wound. One speculation is that the T-DNA waits until the plant DNA is replicated or transcribed, then inserted into the exposed plant DNA. In order to use A. tumefaciens as a transgene vector, the T-DNA tumor-inducing section has to be removed while retaining the T-DNA border regions and vir genes. The transgene is then inserted between the T-DNA border regions, where it is transferred to the plant cell and integrated into the plant chromosomes.

La divulgación proporciona la transformación de plantas monocotiledóneas usando los ácidos nucleicos divulgados en la presente, incluyendo cereales importantes, ver Hiei (1997) Plant Mol. Biol. 35:205-218. Ver también, Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sci. Estados Unidos 80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32:1135-1148, que describen la integración de ADN-T al ADN genómico. Ver también D'Halluin, Patente de los Estados Unidos No. 5.712.135, que describe un proceso para la integración estable de un ADN que comprende un gen que es funcional en una célula de un cereal, u otra planta monocotiledónea. The disclosure provides for the transformation of monocot plants using the nucleic acids disclosed herein, including important cereals, see Hiei (1997) Plant Mol. Biol. 35: 205-218. See also, Horsch, Science (1984) 233: 496; Fraley (1983) Proc. Natl. Acad. Sci. United States 80: 4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32: 1135-1148, which describe the integration of T-DNA into genomic DNA. See also D'Halluin, US Patent No. 5,712,135, which describes a process for the stable integration of a DNA comprising a gene that is functional in a cell of a cereal, or other monocotyledonous plant.

En algunas realizaciones, la tercera etapa implica la selección y regeneración de plantas enteras capaces de transmitir el gen objetivo incorporado a la próxima generación. Dichas técnicas de regeneración pueden usar la manipulación de ciertas fitohormonas en un medio de crecimiento de cultivo de tejidos. En algunas realizaciones, el método usa un marcador de biocida y/o herbicida que fue introducido junto con las secuencias de nucleótidos deseadas. La regeneración vegetal de protoplastos cultivados se describe en Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124-176, MacMillilan Publishing Company, Nueva York, 1983; y Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. La regeneración también puede obtenerse de callos vegetales, explantes, órganos o partes de los mismos. Dichas técnicas de regeneración se describen generalmente en Klee (1987) Ann. Rev. of Plant Phys. 38:467-486. Para obtener plantas enteras de tejidos transgénicos tales como embriones inmaduros, pueden cultivarse bajo condiciones ambientales controladas en una serie de medios que contienen nutrientes y hormonas, un proceso conocido como cultivo de tejidos. Una vez que las plantas enteras se generan y producen semillas, comienza la evaluación de la progenie. In some embodiments, the third stage involves the selection and regeneration of whole plants capable of transmitting the embedded target gene to the next generation. Such regeneration techniques can use the manipulation of certain phytohormones in a tissue culture growth medium. In some embodiments, the method uses a biocide and / or herbicide marker that was introduced along with the desired nucleotide sequences. Plant regeneration of cultured protoplasts is described in Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124-176, MacMillilan Publishing Company, New York, 1983; and Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. Regeneration can also be obtained from plant corns, explants, organs, or parts thereof. Such regeneration techniques are generally described in Klee (1987) Ann. Rev. of Plant Phys. 38: 467-486. To obtain whole plants of transgenic tissues such as immature embryos, they can be grown under controlled environmental conditions in a series of media containing nutrients and hormones, a process known as tissue culture. Once whole plants are spawned and produce seeds, progeny evaluation begins.

En algunas realizaciones, luego que el cassette de expresión se incorpore establemente en plantas transgénicas, puede introducirse en otras plantas por cruce sexual. Se puede usar cualquiera de un número de técnicas de reproducción, dependiendo de la especie a cruzarse. Dado que la expresión transgénica de los ácidos nucleicos divulgados en la presente conduce a cambios fenotípicos, las plantas que comprenden los ácidos nucleicos divulgados en la presente pueden cruzarse sexualmente con una segunda planta para obtener un producto final. Por lo tanto, la semilla divulgada en la presente puede derivar de un cruce entre dos plantas transgénicas divulgadas en la presente, o un cruce entre una planta divulgada en la presente y otra planta. Los efectos deseados (tales como la expresión de los polipéptidos divulgados en la presente para producir una planta en la cual se altera el comportamiento de florecimiento) puede mejorarse cuando ambas plantas parentales expresan los polipéptidos (tal como una enzima aldolasa, piruvato aldolasa, HMG y/o HHG aldolasa) divulgados en la presente. Los efectos deseados pueden pasarse a generaciones vegetales futuros por medios de propagación estándar. In some embodiments, after the expression cassette is stably incorporated into transgenic plants, it can be introduced into other plants by sexual crossing. Any of a number of breeding techniques can be used, depending on the species to be crossed. Since the transgenic expression of the nucleic acids disclosed herein leads to phenotypic changes, plants comprising the nucleic acids disclosed herein can be sexually crossed with a second plant to obtain a final product. Therefore, the seed disclosed herein may be derived from a cross between two transgenic plants disclosed herein, or a cross between a plant disclosed herein and another plant. The desired effects (such as the expression of the polypeptides disclosed herein to produce a plant in which flowering behavior is altered) can be enhanced when both parent plants express the polypeptides (such as an enzyme aldolase, pyruvate aldolase, HMG and / or HHG aldolase) disclosed herein. The desired effects can be passed on to future plant generations by standard propagation means.

En algunas realizaciones, los ácidos nucleicos y polipéptidos divulgados en la presente se expresan o se insertan en cualquier planta o semilla. Las plantas transgénicas divulgadas en la presente pueden ser dicotiledóneas o monocotiledóneas. Ejemplos de plantas transgénicas monocotiledóneas divulgadas en la presente de acuerdo con la invención son pastos, tales como pasto de pradera (pasto azul, Poa), pasto de forraje tal como festuca, lolium, pasto templado, tal como Agrostis y cereales, tal como trigo, avena, centeno, cebada, arroz, sorgo y maíz. Ejemplos de plantas dicotiledóneas transgénicas divulgadas en la presente son tabaco, legumbres, tales como lupinas, patata, remolacha azucarera, guisantes, frijoles y soja, y plantas crucíferas (familia Brassicaceae) tal como coliflor, colza y el organismo modelo próximo relacionado Arabidopsis thaliana. Por lo tanto, las plantas y semillas transgénicas divulgadas en la presente incluyen un amplio rango de plantas, incluyendo pero no limitándose a especies del género Anacardium, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaceis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Linum, Loluim, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanumm, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna y Zea. In some embodiments, the nucleic acids and polypeptides disclosed herein are expressed or inserted into any plant or seed. The transgenic plants disclosed herein can be dicotyledonous or monocotyledonous. Examples of monocotyledonous transgenic plants disclosed herein according to the invention are grasses, such as prairie grass (blue grass, Poa), forage grass such as fescue, lolium, temperate grass, such as Agrostis, and cereals, such as wheat , oats, rye, barley, rice, sorghum and corn. Examples of transgenic dicotyledonous plants disclosed herein are tobacco, legumes, such as lupines, potatoes, sugar beets, peas, beans, and soybeans, and cruciferous plants (family Brassicaceae) such as cauliflower, rapeseed, and the related related model organism Arabidopsis thaliana. Therefore, the transgenic plants and seeds disclosed herein include a wide range of plants, including but not limited to species of the genus Anacardium, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaceis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Linum, Loluim, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago, Nicotza, Ogo Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanumm, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna and Zea.

En realizaciones alternativas, los ácidos nucleicos divulgados en la presente se expresan en plantas que contienen células de fibra, incluyendo, por ejemplo, algodón, árbol de algodón de seda (Kapok, Ceiba pentandra), sauce del desierto, arbusto de la creosata, krascheninnikovia, balsa, ramio, kenaf, cáñamo, rosa de Jamaica, yute, sisal, abacá y lino. En realizaciones alternativas, las plantas transgénicas divulgadas en la presente pueden ser miembros del género Gossypium, incluyendo miembros de cualquier especie Gossypium, tal como G. arboreum; G. herbaceum, G. barbadense y G. hirsutum. In alternative embodiments, the nucleic acids disclosed herein are expressed in plants containing fiber cells, including, for example, cotton, silk cotton tree (Kapok, Ceiba pentandra), desert willow, creosata bush, krascheninnikovia , raft, ramie, kenaf, hemp, Jamaican rose, jute, sisal, abaca and flax. In alternative embodiments, the transgenic plants disclosed herein can be members of the genus Gossypium, including members of any Gossypium species, such as G. arboreum; G. herbaceum, G. barbadense and G. hirsutum.

Se describen plantas transgénicas que han de usarse para producir grandes cantidades de los polipéptidos (tales como una enzima o anticuerpo de aldolasa, piruvato aldolasa, HMG y/o KHG aldolasa) divulgados en la presente. Por ejemplo, ver Palmgren (1997) Trends Genet. 13:348; Chong (1997) Transgenic Res. 6:289-296 (producción de beta-caseína de proteína de la leche humana en plantas de patata transgénicas usando un promotor de sintasa de manopina bidireccional inducible por auxina (mas1',2') con métodos de transformación de disco de hoja mediado por Agrobacterium tumefaciens). Transgenic plants to be used to produce large amounts of the polypeptides (such as an aldolase enzyme or antibody, pyruvate aldolase, HMG and / or KHG aldolase) disclosed herein are described. For example, see Palmgren (1997) Trends Genet. 13: 348; Chong (1997) Transgenic Res. 6: 289-296 (production of human milk protein beta-casein in transgenic potato plants using a auxin-inducible bidirectional manopine synthase promoter (mas1 ', 2') with methods of transformation of leaf disc mediated by Agrobacterium tumefaciens).

Usando procedimientos conocidos, un experto puede analizar plantas divulgadas en la presente detectando el aumento o reducción de ARN, de transgén o proteínas en plantas transgénicas. Los medios para detectar y cuantificar ARNm, o proteínas son bien conocidos en la técnica. Using known procedures, an expert can analyze plants disclosed herein by detecting the increase or decrease of RNA, transgene, or protein in transgenic plants. Means for detecting and quantifying mRNA, or protein are well known in the art.

Polipéptidos y péptidos Polypeptides and peptides

Se divulgan polipéptidos aislados, sintéticos o recombinantes que tienen una identidad de secuencia (tal como al menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más o una identidad de secuencia u homología completa (100%)) con respecto a una secuencia divulgada en la presente, tal como proteínas que tienen una secuencia tal como se establece en SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 y fragmentos enzimáticamente activos de los mismos. La identidad de secuencia porcentual puede ser en el largo total del polipéptido o la identidad puede ser en una región de al menos aproximadamente 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o más residuos. Isolated, synthetic or recombinant polypeptides are disclosed that have a sequence identity (such as at least about 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76% , 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99% or more or a sequence identity or full homology (100%)) with respect to a sequence disclosed herein, such as proteins having a sequence as set forth in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62 , SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO : 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112 , SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO : 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162 , SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO : 196, SEQ ID NO: 1 98, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334 and enzymatically active fragments thereof. The percentage sequence identity can be in the total length of the polypeptide or the identity can be in a region of at least about 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450 , 500, 550, 600, 650, 700 or more waste.

Los polipéptidos de acuerdo con algunas realizaciones divulgadas en la presente también pueden ser más cortos que el largo completo de los polipéptidos. Los polipéptidos (péptidos, fragmentos) pueden ubicarse en un rango de tamaño entre aproximadamente 5 y el largo completo de un polipéptido, tal como una enzima, tal como una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa; los tamaños ejemplares siendo de aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o más residuos, tales como residuos contiguos de una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgada en la presente. Los péptidos divulgados en la presente (tal como una subsecuencia de un polipéptido divulgada en la presente) pueden ser útiles como, por ejemplo, sondas de etiquetado, sitios activos de antígenos (inmunógenos), tolerágenos, motivos, aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa (tal como “dominios catalíticos”), secuencias señal y/o dominios prepro. Polypeptides according to some embodiments disclosed herein may also be shorter than the full length of the polypeptides. Polypeptides (peptides, fragments) can range from about 5 to the full length of a polypeptide, such as an enzyme, such as an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase; exemplary sizes being about 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 or more residues, such as contiguous residues of an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed in Present. The peptides disclosed herein (such as a subsequence of a polypeptide disclosed herein) may be useful as, for example, labeling probes, active sites of antigens (immunogens), tolerogens, motifs, aldolase, such as pyruvate aldolase enzyme , such as HMG and / or KHG aldolase (such as "catalytic domains"), signal sequences and / or prepro domains.

En otras realizaciones, los polipéptidos divulgados en la presente que tienen actividad de aldolasa, tal como actividad de piruvato aldolasa, tal como HMG y/o KHG aldolasa son miembros de un género de polipéptidos que comparten elementos estructurales específicos, tales como residuos de aminoácidos, que se correlacionan con la actividad de aldolasa, incluyendo actividad de piruvato tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa. Estos elementos estructurados compartidos pueden usarse para la generación de rutina de aldolasa, tales como variantes de piruvato aldolasa, tal como HMG y/o KHG aldolasa. Estos elementos estructurales compartidos de la aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgados en la presente, pueden utilizarse como guía para la generación de rutina de aldolasa, tales como variantes de piruvato aldolasa, tal como HMG y/o KHG aldolasa dentro del alcance del género de polipéptidos divulgados en la presente. In other embodiments, the polypeptides disclosed herein that have aldolase activity, such as pyruvate aldolase activity, such as HMG and / or KHG aldolase are members of a genus of polypeptides that share specific structural elements, such as amino acid residues, which correlate with aldolase activity, including pyruvate activity such as, but not limited to, HMG and / or KHG aldolase activity. These shared structured elements can be used for routine generation of aldolase, such as pyruvate aldolase variants, such as HMG and / or KHG aldolase. These shared structural elements of aldolase, such as pyruvate aldolase enzyme, such as HMG and / or KHG aldolase, disclosed herein, can be used as a guide for routine generation of aldolase, such as pyruvate aldolase variants, such as HMG and / or KHG aldolase within the scope of the polypeptide genus disclosed herein.

Tal como se utilizan en la presente, la expresión “aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa” comprende cualquier polipéptido o enzimas capaces de catalizar la reacción de adición de aldol o la reacción de retro-aldol (tal como polipéptidos divulgados en la presente, ver también la Tabla 1 y los Ejemplos 4, 5 y 6, más adelante) o cualquier modificación de un enlace carbono-carbono que contiene material, tal como en la producción de ácido R-2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico (R-MP) y ciertos estereoisómeros de monatina, tales como (R,R)- y (S,R)-monatina, y sales de los mismos. As used herein, the term "aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase" encompasses any polypeptide or enzymes capable of catalyzing the aldol addition reaction or the retro-aldol reaction (such as polypeptides disclosed herein, see also Table 1 and Examples 4, 5 and 6, below) or any modification of a material-containing carbon-carbon bond, such as in the production of R-2-hydroxy acid 2 - (indole-3-ylmethyl) -4-ketoglutaric (R-MP) and certain monatin stereoisomers, such as (R, R) - and (S, R) -monatin, and salts thereof.

Los polipéptidos divulgados en la presente catalizan la formación enlaces carbono-carbono en una reacción de aldol y tienen la capacidad de utilizar piruvato o fosfoenolpiruvato como el componente nucleofílico en la síntesis de un marco 4-hidroxi-2-cetobutirato como se muestra en el esquema general más adelante. The polypeptides disclosed herein catalyze the formation carbon-carbon bonds in an aldol reaction and have the ability to use pyruvate or phosphoenolpyruvate as the nucleophilic component in the synthesis of a 4-hydroxy-2-ketobutyrate framework as shown in the scheme general later.

Aldolasa Aldolasa

R=H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido 5 R2=H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido R3=H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido, ácido carboxílico. R = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl R2 = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl R3 = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl, carboxylic acid.

Sin ceñirse a ninguna teoría, se cree que el fragmento de cuatro carbonos conservado preparado en todas las condensaciones catalizadas por piruvato aldolasa es densamente y diferencialmente funcionalizado. Además, en cada aducto, cuatro estados de oxidación diferentes están contenidos en cuatro carbonos contiguos. El marco Without being bound by theory, the conserved four-carbon fragment prepared in all pyruvate aldolase catalyzed condensations is believed to be densely and differentially functionalized. Furthermore, in each adduct, four different oxidation states are contained in four contiguous carbons. The frame

10 preparado por piruvato aldolasas permite entonces la preparación de ácidos a-amino-y-hidroxicarboxílicos, ácidos hidroxicarboxílico, ácidos a,y-dihidroxicarboxílicos, y azúcares de 2-desoxialdosa como se muestra en el esquema más adelante. 10 prepared by pyruvate aldolases then allows the preparation of α-amino-and-hydroxycarboxylic acids, hydroxycarboxylic acids, α-and-dihydroxycarboxylic acids, and 2-deoxyaldosed sugars as shown in the scheme below.

Por lo tanto, las piruvato aldolasas de acuerdo con algunas realizaciones pueden ser sintéticamente versátiles y Therefore, pyruvate aldolases according to some embodiments can be synthetically versatile and

15 pueden utilizarse en la preparación de una amplia gama de productos para usar en alimentos para animales, procesos industriales y agentes farmacéuticos (ver, por ejemplo, Gijsen, H. J. M. et al., Recent Advances in the Chemoenzymatic Synthesis of Carbohydrates and Carbohydrate Mimetics, Chem. Rev. 1996, 96, 443-473; Henderson, D. P. et al. J. Org. Chem., Stereospecific Preparation of the N-Terminal Amino Acid Moiety of Nikkomycins KX y KZ via a Multiple Enzyme Synthesis, 1997, 62, 7910-7911; Wymer, N. & Toone, E. J. Enzyme15 can be used in the preparation of a wide range of products for use in animal feed, industrial processes and pharmaceutical agents (see, for example, Gijsen, HJM et al., Recent Advances in the Chemoenzymatic Synthesis of Carbohydrates and Carbohydrate Mimetics, Chem Rev. 1996, 96, 443-473; Henderson, DP et al. J. Org. Chem., Stereospecific Preparation of the N-Terminal Amino Acid Moiety of Nikkomycins KX and KZ via a Multiple Enzyme Synthesis, 1997, 62, 7910 -7911; Wymer, N. & Toone, EJ Enzyme

20 catalyzed Synthesis of Carbohydrates. Current Opin. Chemical Biology, 2000, 4, 110-119). 20 catalyzed Synthesis of Carbohydrates. Current Opin. Chemical Biology, 2000, 4, 110-119).

Los polipéptidos de acuerdo con algunas realizaciones pueden tener más de un tipo de actividad enzimática, específicamente actividad de aldolasa y una actividad adicional, por ejemplo, tal como se establece en la Tabla 1, más adelante. Por ejemplo, un polipéptido divulgado en la presente puede tener actividad de aldolasa, piruvato aldolasa, actividad de HMG y/o KHG aldolasa. Adicionalmente, el polipéptido puede tener o puede pensarse que 25 tiene actividad enzimática adicional en base a su clasificación CE. La Tabla 1 incluye la columna “Número de CE previsto”. Un número de CE es el número asignado a un tipo de enzima de acuerdo con un esquema de nomenclatura de enzimas estandarizada desarrollado por la Comisión de Enzimas del Comité de Nomenclatura de la Unión Internacional de Bioquímica y Biología Molecular (IUBMB). Los resultados en la columna “Número de CE previsto” se determinan mediante un búsqueda de BLAST con respecto a la base de datos de Kegg (Enciclopedia de 30 Kyoto de Genes y Genomas). Si la coincidencia BLAST máxima (también denominada un “acierto”) tiene un valor E igual o menos que e−6, el número de CE asignado a la coincidencia máxima se ingresa en la tabla. El número de CE Polypeptides according to some embodiments may have more than one type of enzyme activity, specifically aldolase activity and additional activity, for example, as set forth in Table 1, below. For example, a polypeptide disclosed herein may have aldolase, pyruvate aldolase activity, HMG and / or KHG aldolase activity. Additionally, the polypeptide may or may be thought to have additional enzymatic activity based on its CE classification. Table 1 includes the column "Expected EC number". A CE number is the number assigned to an enzyme type according to a standardized enzyme nomenclature scheme developed by the Enzyme Commission of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (IUBMB). Results in the "Expected EC Number" column are determined by a BLAST search against the Kegg database (Kyoto Encyclopedia of Genes and Genomes). If the maximum BLAST match (also called a "hit") has an E value equal to or less than e − 6, the CE number assigned to the maximum match is entered into the table. CE number

del acierto máxima se usa como una guía de cómo puede ser el número CE de la secuencia de la invención. En casos en los que se proporciona sólo un número de CE parcial, sólo podría asignarse una clasificación amplia en base al acierto máximo. Por ejemplo, en la primera fila, para la SEQ ID NO:2, codificada por la SEQ ID NO:1, el “Número de CE Previsto se incluye como “2 . . . ”. Por lo tanto, la clasificación asignada es ampliamente una transferasa. Para la SEQ ID NO:26, codificada por la SEQ ID NO:25, la clasificación más específica que podría The maximum hit is used as a guide to how the EC number of the sequence of the invention can be. In cases where only a partial CE number is provided, a broad rating could only be assigned based on the maximum hit. For example, in the first row, for SEQ ID NO: 2, coded by SEQ ID NO: 1, the "Expected CE Number is included as" 2. . . " Therefore, the assigned classification is largely a transferase. For SEQ ID NO: 26, encoded by SEQ ID NO: 25, the most specific classification that could

asignarse en base al acierto máximo es una aldehído-liasa. Assigned based on maximum hit is an aldehyde lyase.

Tabla 1 Fuente= Table 1 Source =

Bacteria Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Bacterium Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown Unknown

Fuente= Source =

Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown It is unknown

Fuente= Source =

Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown It is unknown

Fuente= Source =

Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown It is unknown

Fuente= Source =

Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown It is unknown

Fuente= Source =

Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Se desconoce Unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown unknown It is unknown

Fuente= Source =

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Se desconoce It is unknown

Polipéptidos y péptidos divulgados en la presente pueden aislarse de fuentes naturales, pueden ser polipéptidos sintéticos o generarse recombinantemente. Péptidos y proteínas pueden expresarse recombinantemente in vitro o in vivo. Los péptidos y polipéptidos divulgados en la presente pueden realizarse y aislarse usando cualquier método conocido en la técnica. También pueden usarse polipéptidos y péptidos divulgados en la presente, en total o en parte, utilizando métodos químicos bien conocidos en la técnica. Ver por ejemplo Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, A. K., Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995) Technomic Publishing Co., Lancaster, Pa. Por ejemplo, las síntesis de péptidos pueden realizarse utilizando varias técnicas de fase sólida (ver por ejemplo Roberge (1995) Science 269:202; Merrifield (1997) Methods Enzymol. 289:3-13) y la síntesis automatizada puede lograrse, por ejemplo utilizando el Sintetizador de Péptidos 431A (Perkin Elmer) de acuerdo con las instrucciones proporcionadas por el fabricante. Polypeptides and peptides disclosed herein can be isolated from natural sources, can be synthetic polypeptides, or be generated recombinantly. Peptides and proteins can be recombinantly expressed in vitro or in vivo. The peptides and polypeptides disclosed herein can be made and isolated using any method known in the art. Polypeptides and peptides disclosed herein may also be used, in whole or in part, using chemical methods well known in the art. See for example Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, AK, Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995) Technomic Publishing Co., Lancaster, Pa. For example, peptide syntheses can be performed using various solid phase techniques (see for example Roberge (1995) Science 269: 202; Merrifield (1997) Methods Enzymol. 289: 3-13) and automated synthesis can be accomplished, for example using the 431A Peptide Synthesizer (Perkin Elmer) according to the instructions provided by the manufacturer.

Los péptidos y polipéptidos divulgados en la presente también pueden ser glicosilados. La glicosilación puede incorporarse post-translacionalmente ya sea químicamente o por medio de mecanismos biosintéticos celulares, en donde los últimos incorporan el uso de motivos de glicosilación conocidos, que pueden ser nativos a la secuencia o que pueden incorporarse como un péptido o agregarse a la secuencia de ácidos nucleicos de codificación. La glicosilación puede estar O-enlazada o N-enlazada. The peptides and polypeptides disclosed herein can also be glycosylated. Glycosylation can be incorporated post-translationally either chemically or through cellular biosynthetic mechanisms, where the latter incorporate the use of known glycosylation motifs, which may be native to the sequence or which may be incorporated as a peptide or added to the sequence of encoding nucleic acids. Glycosylation can be O-linked or N-linked.

En algunas realizaciones, cuando se indica, los péptidos y polipéptidos divulgados en la presente pueden incluir todas las formas “miméticas” y “peptidomiméticas”. Los términos “miméticas” y “peptidomiméticas” se refieren a un compuesto químico sintético que tiene básicamente las mismas características estructurales y/o funcionales de los polipéptidos divulgados en la presente. Las formas miméticas pueden estar totalmente compuestas por análogos de aminoácidos sintéticos, no naturales o ser una molécula quimérica de aminoácidos peptídicos parcialmente naturales y análogos de aminoácidos parcialmente no naturales. Las formas miméticas pueden incorporar también cualquier cantidad de sustituciones de aminoácidos naturales conservadoras en la medida en que dichas sustituciones no alteren también básicamente la estructura y/o actividad mimética. Al igual que con los polipéptidos divulgados en la presente que son variantes conservadoras o miembros de un género de polipéptidos divulgados en la presente (que tienen por ejemplo aproximadamente 50% o más identidad de secuencia con una secuencia divulgada en la presente), los experimentos de rutina determinarán si un mimético está dentro del alcance divulgado en la presente, es decir, si su estructura y/o función básicamente no se altera. De esta forma, en algunas realizaciones, una composición mimética está dentro del alcance de la divulgación si tiene una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. In some embodiments, when indicated, the peptides and polypeptides disclosed herein can include all "mimetic" and "peptidomimetic" forms. The terms "mimetics" and "peptidomimetics" refer to a synthetic chemical compound that has basically the same structural and / or functional characteristics of the polypeptides disclosed herein. The mimetic forms may be entirely composed of synthetic, unnatural amino acid analogs or be a chimeric molecule of partially natural peptide amino acids and partially unnatural amino acid analogs. Mimetic forms may also incorporate any number of conservative natural amino acid substitutions to the extent that such substitutions do not also fundamentally alter the structure and / or mimetic activity. As with the polypeptides disclosed herein that are conservative variants or members of a genus of polypeptides disclosed herein (having for example about 50% or more sequence identity with a sequence disclosed herein), the experiments of routine will determine if a mimetic is within the scope disclosed herein, that is, if its structure and / or function is basically not altered. Thus, in some embodiments, a mimetic composition is within the scope of the disclosure if it has an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase.

Composiciones miméticas de polipéptidos divulgados en la presente pueden contener cualquier combinación de componentes estructurales no naturales. En una realización alternativa, las composiciones miméticas divulgadas en la presente incluyen uno o todos los siguientes tres grupos estructurales: a) grupos de enlace de residuos que no sean el enlace de amida natural (“enlace peptídico”); b) residuos no naturales en lugar de residuos aminoácidos naturales; o c) residuos que inducen un mimetismo estructural secundario, es decir, para inducir o estabilizar una estructura secundaria, tal como una conformación de giro beta, giro gama, hoja beta, hélice alfa y similares. Por ejemplo, un polipéptido divulgado en la presente puede caracterizarse como un mimético cuando todos o algunos de sus residuos están unidos por medios químicos que no sean enlaces peptídicos naturales. Los residuos peptidomiméticos individuales pueden estar unidos por enlaces peptídicos, otros enlaces químicos o medios de acoplamiento, tal como glutaraldehído, ésteres de N-hidroxisuccinimida, maleimidas bifuncionales, N,N'diciclohexilcarbodiimida (DCC) o N,N'-diisopropilcarbodiimida (DIC). Los grupos ligantes que pueden ser una alternativa al enlace amida tradicional (“enlace peptídico") incluyen, por ejemplo cetometileno (tal como —C(=O)— CH2— por —C(=O)—NH—), aminometileno (CH2—NH), etileno, olefina (CH=CH), éter (CH2—O), tioéter (CH2—S), tetrazol (CN4—), tiazol, retroamida, tioamida o éster (ver Spatola (1983) en Química y Bioquímica de los Aminoácidos, Péptidos y Proteínas, Vol. 7, páginas 267-357, “Peptide Backbone Modifications,” Marcell Dekker, NY). Polypeptide mimetic compositions disclosed herein can contain any combination of unnatural structural components. In an alternative embodiment, the mimetic compositions disclosed herein include one or all of the following three structural groups: a) residue linking groups other than the natural amide bond ("peptide bond"); b) unnatural residues instead of natural amino acid residues; or c) residues that induce secondary structural mimicry, that is, to induce or stabilize a secondary structure, such as a beta-turn, gamma-turn, beta-sheet, alpha-helix conformation, and the like. For example, a polypeptide disclosed herein can be characterized as a mimetic when all or some of its residues are linked by chemical means other than natural peptide bonds. The individual peptidomimetic residues may be linked by peptide bonds, other chemical bonds, or coupling media, such as glutaraldehyde, N-hydroxysuccinimide esters, bifunctional maleimides, N, N'-dicyclohexylcarbodiimide (DCC), or N, N'-diisopropylcarbodiimide (DIC) . Binder groups that may be an alternative to the traditional amide bond ("peptide bond") include, for example, ketomethylene (such as —C (= O) - CH2— by —C (= O) —NH—), aminomethylene (CH2 —NH), ethylene, olefin (CH = CH), ether (CH2-O), thioether (CH2-S), tetrazole (CN4—), thiazole, retroamide, thioamide or ester (see Spatola (1983) in Chemistry and Biochemistry from Amino Acids, Peptides and Proteins, Vol. 7, pages 267-357, "Peptide Backbone Modifications," Marcell Dekker, NY).

Un polipéptido divulgado en la presente también puede caracterizarse como un mimético por contener todos o algunos de los residuos en lugar de residuos aminoácidos naturales. Residuos no naturales se describen en la biblioteca científica y de patentes; algunas composiciones no naturales ejemplares útiles como miméticos de residuos de aminoácidos naturales y lineamientos se describen más adelante. Los miméticos de aminoácidos aromáticos pueden generarse reemplazando por, por ejemplo, D- o L-nafilalanina; D- o L-fenilglicina; D- o L-2 tienilalanina; D-o L-1, -2, 3- o 4-pirenilalanina; D-o L-3 tienilalanina; D- o L-(2-piridinil)-alanina; D- o L-(3-piridinil)alanina; D- o L-(2-pirazinil)-alanina; D- o L-(4-isopropil)-fenilglicina; D-(trifluorometil)-fenilglicina; D-(trifluorometil)fenilalanina; D-p-fluoro-fenilalanina; D-o L-p-bifenilfenilalanina; D-o L-p-metoxi-bifenilfenilalanina; D-o L-2indol(alquil)alaninas; y, D- o L-alquilalaninas, donde el alquilo puede ser metilo, etilo, propilo, hexilo, butilo, pentilo, isopropilo, iso-butilo, sec-isotilo, iso-pentilo sustituido o insustituido o aminoácidos no ácidos. Los anillos aromáticos de un aminoácido no natural incluyen, por ejemplo, anillos aromáticos de tiazolilo, tiofenilo, porazolilo, bencimidazolilo, naftilo, furanilo, pirrolilo y piridilo. A polypeptide disclosed herein can also be characterized as a mimetic by containing all or some of the residues rather than natural amino acid residues. Unnatural waste is described in the Scientific and Patent Library; Some exemplary unnatural compositions useful as mimetics of natural amino acid residues and guidelines are described below. Aromatic amino acid mimetics can be generated by replacing, for example, D- or L-naphylalanine; D- or L-phenylglycine; D- or L-2 thienylalanine; D-o L-1, -2, 3- or 4-pyrenylalanine; D- or L-3 thienylalanine; D- or L- (2-pyridinyl) -alanine; D- or L- (3-pyridinyl) alanine; D- or L- (2-pyrazinyl) -alanine; D- or L- (4-isopropyl) -phenylglycine; D- (trifluoromethyl) -phenylglycine; D- (trifluoromethyl) phenylalanine; D-p-fluoro-phenylalanine; D- or L-p-biphenylphenylalanine; D- or L-p-methoxy-biphenylphenylalanine; D- or L-2indole (alkyl) alanines; and, D- or L-alkylalanines, where the alkyl can be methyl, ethyl, propyl, hexyl, butyl, pentyl, isopropyl, iso-butyl, sec-isotyl, substituted or unsubstituted iso-pentyl or non-acidic amino acids. The aromatic rings of a non-natural amino acid include, for example, aromatic rings of thiazolyl, thiophenyl, porazolyl, benzimidazolyl, naphthyl, furanyl, pyrrolyl, and pyridyl.

Los miméticos de aminoácidos ácidos pueden generarse por sustitución por, por ejemplo, aminoácidos no carboxilato, manteniendo igual una carga negativa; (fosfono)alanina; treonina sulfatada. Grupos laterales carboxilo (tales como aspartilo o glutamilo) también pueden modificarse selectivamente por reacción con carbodiimidas (R'— N—C—N—R') tal como 1-ciclohexil-3(2-morfolinil-(4-etil) carbodiimida o 1-etil-3(4-azonia-4,4-dimetolpentil) carbodiimida. También pueden convertirse el aspartilo o glutamilo en residuos de asparaginilo y glutaminilo por reacción con iones de amonio. Miméticos de aminoácidos básicos pueden generarse por sustitución con, por ejemplo (además de lisina y arginina) los aminoácidos ornitina, citrulina o ácido (guanidino)-acético, o ácido (guanidino)alquil-acético, donde el alquilo se define anteriormente. El derivado de nitrilo (que contiene por ejemplo el resto CN en lugar de COOH) puede sustituirse por asparagina o glutamina. Los residuos de asparaginilo o glutamilo pueden desaminarse a los residuos correspondientes de aspartilo o glutamilo. Los miméticos de residuos de arginina pueden generarse haciendo reaccionar el arginil con por ejemplo uno o más reactivos convencionales, incluidos, por ejemplo fenilglioxal, 2,3-butanodiona, 1,2-ciclo-hexanodiona o ninhidrina, en algunas realizaciones en condiciones alcalinas. Los miméticos de residuos de tirosina pueden generarse haciendo reaccionar tirosilo con, por ejemplo compuestos de diazonio aromáticos o tetranitrometano, N-acetilimidizol y tetranitrometano pueden utilizarse para formar especies de O-acetil tirosilo y derivados de 3-nitro, respectivamente. Miméticos de residuos de cisteína pueden generarse haciendo reaccionar residuos de cistenilo con, por ejemplo alfa-haloacetatos tal como ácido 2cloroacético o cloroacetamida y aminas correspondientes; para proporcionar derivados de carboximetilo o carboxiamidometilo. Los miméticos de residuos de cisteína también pueden generarse haciendo reaccionar residuos de cisteinilo con, por ejemplo bromo-trifluoroacetona, ácido alfa-bromo-beta-(5-imidozoil) propiónico; cloroacetil fosfato, N-alquilmaleimidas, 3-nitro-2-piridil disulfuro; metil 2-piridil disulfuro; p-cloromercuribenzoato; 2-cloromercuri4 nitrofenol; o, cloro-7-nitrobenzo-oxa-1,3-diazol. Los miméticos de lisina pueden generarse (y los residuos de amino terminales pueden alterarse) haciendo reaccionar lisinilo con, por ejemplo anhídridos succínicos y otros de ácido carboxílico. Lisina y otros miméticos de residuos que contienen alfa-amino también pueden generarse por medio de la reacción con imidoésteres, tales como metil picolinimidato piridoxal fosfato, piridoxal, cloroborohidruro, ácido trinitro-bencenosulfónico, O-metilisourea, 2,4, pentanodiona, y reacciones catalizadas por transamidasa con glioxilato. Miméticos de metionina pueden generarse por medio de reacción con, por ejemplo sulfóxido de metionina. Miméticos de prolina incluyen, por ejemplo, ácido pipecólico, ácido carboxílico de tiazolidina, 3- o 4-hidroxi prolina, deshidroprolina, 3- o 4-metilprolina o 3,3,-dimetilprolina. Los miméticos de residuos de histidina pueden generarse haciendo reaccionar histidilo con, por ejemplo, dietilprocarbonato o bromuro de para-bromofenacilo. Otros miméticos incluyen, por ejemplo aquellos generados por la hidroxilación de prolina y lisina; fosforilación de los grupos hidroxilo de residuos de serilo o treonilo; metilación de los grupos alfa-amino de lisina, arginina e histidina; acetilación de la amina N-terminal; metilación de los residuos amida de cadena principal o sustitución con N-metilaminoácidos; o amidación de los grupos de carboxilo C-terminal. Acid amino acid mimetics can be generated by substitution for, for example, non-carboxylate amino acids, keeping a negative charge the same; (phosphono) alanine; sulfated threonine. Carboxyl side groups (such as aspartyl or glutamyl) can also be selectively modified by reaction with carbodiimides (R'— N — C — N — R ') such as 1-cyclohexyl-3 (2-morpholinyl- (4-ethyl) carbodiimide or 1-Ethyl-3 (4-azonia-4,4-dimetholpentyl) carbodiimide Aspartyl or glutamyl can also be converted to asparaginyl and glutaminyl residues by reaction with ammonium ions Basic amino acid mimetics can be generated by substitution with, for example (in addition to lysine and arginine) the amino acids ornithine, citrulline or (guanidino) -acetic acid, or (guanidino) alkyl-acetic acid, where the alkyl is defined above. The nitrile derivative (containing for example the CN moiety instead COOH) can be replaced by asparagine or glutamine. Asparaginyl or glutamyl residues can be deaminated to corresponding aspartyl or glutamyl residues. Arginine residue mimetics can be generated by reacting arginyl with for example one or more Conventional reagents, including, for example, phenylglyoxal, 2,3-butanedione, 1,2-cyclohexanedione, or ninhydrin, in some embodiments under alkaline conditions. Tyrosine residue mimetics can be generated by reacting tyrosyl with, for example aromatic diazonium compounds or tetranitromethane, N-acetylimidizole and tetranitromethane can be used to form O-acetyl tyrosyl species and 3-nitro derivatives, respectively. Mimetics of cysteine residues can be generated by reacting cystyl residues with, for example, alpha-haloacetates such as 2-chloroacetic acid or chloroacetamide and corresponding amines; to provide carboxymethyl or carboxyamidomethyl derivatives. Cysteine residue mimetics can also be generated by reacting cysteinyl residues with, for example, bromo-trifluoroacetone, alpha-bromo-beta- (5-imidozoyl) propionic acid; chloroacetyl phosphate, N-alkylmaleimides, 3-nitro-2-pyridyl disulfide; methyl 2-pyridyl disulfide; p-chloromercuribenzoate; 2-chloromercuri4 nitrophenol; or, chloro-7-nitrobenzo-oxa-1,3-diazole. Lysine mimetics can be generated (and terminal amino residues can be altered) by reacting lysinyl with, for example, succinic and other carboxylic acid anhydrides. Lysine and other alpha-amino-containing residue mimetics can also be generated by reaction with imidoesters, such as methyl picolinimidate pyridoxal phosphate, pyridoxal, chloroborohydride, trinitro-benzenesulfonic acid, O-methylisourea, 2,4, pentanedione, and reactions Transamidase catalyzed with glyoxylate. Methionine mimetics can be generated by reaction with, for example, methionine sulfoxide. Proline mimetics include, for example, pipecolic acid, thiazolidine carboxylic acid, 3- or 4-hydroxy proline, dehydroproline, 3- or 4-methylproline, or 3,3, -dimethylproline. Histidine residue mimetics can be generated by reacting histidyl with, for example, diethylprocarbonate or para-bromophenacyl bromide. Other mimetics include, for example, those generated by hydroxylation of proline and lysine; phosphorylation of hydroxyl groups of seryl or threonyl residues; methylation of the alpha-amino groups of lysine, arginine, and histidine; acetylation of the N-terminal amine; methylation of the main chain amide residues or substitution with N-methylamino acids; or amidation of the C-terminal carboxyl groups.

En algunas realizaciones, un residuo, tal como un aminoácido, de un polipéptido divulgado en la presente puede reemplazarse por un aminoácido (o residuo peptidomimético) de quiralidad opuesta. En algunas realizaciones, cualquier aminoácido natural en la configuración L (a la que también puede hacerse referencia como R o S, dependiendo de la estructura de la entidad química) puede reemplazarse con el aminoácido del mismo tipo estructural químico o un peptidomimético, pero de quiralidad opuesta, denominado como el D-aminoácido, pero también puede denominarse como la forma R o S. In some embodiments, a residue, such as an amino acid, of a polypeptide disclosed herein can be replaced by an amino acid (or peptidomimetic residue) of opposite chirality. In some embodiments, any naturally occurring amino acid in the L configuration (which may also be referred to as R or S, depending on the structure of the chemical entity) can be replaced with the amino acid of the same chemical structural type or a peptidomimetic, but of chirality opposite, termed as the D-amino acid, but may also be termed as the R or S form.

La invención también proporciona métodos para modificar los polipéptidos divulgados en la presente mediante procesos naturales, tal como procesamiento post-translacional (tal como fosforilación, acilación, etc.) o por técnicas de modificación química, y los péptidos modificados resultantes. Las modificaciones pueden ocurrir en cualquier parte en el polipéptido, incluida la estructura central del péptido, las cadenas de aminoácidos y las terminales amino The invention also provides methods of modifying the polypeptides disclosed herein by natural processes, such as post-translational processing (such as phosphorylation, acylation, etc.) or by chemical modification techniques, and the resulting modified peptides. Modifications can occur anywhere in the polypeptide, including the peptide backbone, amino acid chains, and amino termini

o carboxilo. Se apreciará que el mismo tipo de modificación puede estar presente en el mismo grado o en grados variables en varios sitios en un polipéptido dado. También un polipéptido dado puede tener muchos tipos de modificaciones. En algunas realizaciones, las modificaciones incluyen acetilación, acilación, ADP-ribosilación, amidación, unión covalente de flavina, unión covalente de un resto hemo, unión covalente de un nucleótido o derivado de nucleótido, unión covalente de un lípido o derivado de lípido, unión covalente de un fosfatidilinositol, ciclización reticulante, formación de enlaces disulfuro, desmetilación, formación de enlaces intermoleculares covalentes, formación de cisteína, formación de piroglutamato, formilación, carboxilación gama, glicosilación, formación de anclajes GPI, hidroxilación, yodación, metilación, miristoilación, oxidación, pegilación, procesamiento proteolítico, fosforilación, prenilación, racemización, selenoilación, sulfatación y adición mediada por ARN de transferencia de aminoácidos a proteína tal como arginilación. Ver Creighton, T.E., Proteins - Structure and Molecular Properties 2da Ed., W.H. Freeman and Company, Nueva York (1993); Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, Nueva York, págs. 1-12 (1983). or carboxyl. It will be appreciated that the same type of modification may be present to the same degree or to varying degrees at various sites in a given polypeptide. Also a given polypeptide can have many types of modifications. In some embodiments, modifications include acetylation, acylation, ADP-ribosylation, amidation, covalent attachment of flavin, covalent attachment of a heme moiety, covalent attachment of a nucleotide or nucleotide derivative, covalent attachment of a lipid or lipid derivative, binding covalent phosphatidylinositol, crosslinking cyclization, disulfide bond formation, demethylation, covalent intermolecular bond formation, cysteine formation, pyroglutamate formation, formylation, gamma carboxylation, glycosylation, GPI anchor formation, hydroxylation, iodination, methylation, myristoylation, oxidation , pegylation, proteolytic processing, phosphorylation, prenylation, racemization, selenoylation, sulfation, and RNA mediated addition of amino acid transfer to protein such as arginylation. See Creighton, T.E., Proteins - Structure and Molecular Properties 2nd Ed., W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, p. 1-12 (1983).

Los métodos de síntesis peptídica química de fase sólida también pueden usarse para sintetizar el polipéptido o fragmentos divulgados en la presente. Dicho método se ha conocido en la técnica desde principios de los años sesenta (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Ver también Stewart, J. M. y Young, J. D., Solid Phase Peptide Synthesis, 2da Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12)) y se empleó recientemente en kits de diseño y síntesis de laboratorio disponibles en el comercio (Cambridge Research Biochemicals). Dichos kits de laboratorio disponibles comercialmente han utilizado generalmente los descubrimientos de H. M. Geysen et al., Proc. Natl. Acad. Sci., Estados Unidos, 81:3998 (1984) y proporcionan péptidos de sintetización sobre las puntas de múltiples “varillas” o “clavijas”, todas las cuales están conectadas a una única placa. Cuando se utiliza un sistema tal, una placa de varillas o clavijas se invierte y se inserta en una segunda placa de pocillos o depósitos correspondientes, que contienen soluciones para unir o anclar un aminoácido apropiado a las puntas de las varillas o clavijas. Repitiendo dicha etapa del proceso, es decir, invirtiendo e insertando las puntas de las varillas o clavijas en soluciones apropiados, los aminoácidos se incorporan en péptidos deseados. Además, están disponibles varios sistemas de síntesis peptídica de FMOC disponible. Por ejemplo, el ensamblaje de un polipéptido o fragmento puede llevarse a cabo sobre un soporte sólido utilizando un sintetizador automatizado de Applied Biosystems, Inc. Modelo 431A™. Dicho equipo proporciona fácil acceso a los péptidos divulgados en la presente, ya sea por síntesis directa o por síntesis de varios fragmentos que pueden acoplarse utilizando otras técnicas conocidas. Solid phase chemical peptide synthesis methods can also be used to synthesize the polypeptide or fragments disclosed herein. Such a method has been known in the art since the early 1960s (Merrifield, RB, J. Am. Chem. Soc., 85: 2149-2154, 1963) (See also Stewart, JM and Young, JD, Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., Pp. 11-12)) and was recently used in commercially available laboratory synthesis and design kits (Cambridge Research Biochemicals). Such commercially available laboratory kits have generally used the findings of H. M. Geysen et al., Proc. Natl. Acad. Sci., USA, 81: 3998 (1984) and provide synthesizing peptides on the tips of multiple "rods" or "pins", all of which are connected to a single plate. When such a system is used, one rod or pin plate is inverted and inserted into a second plate of corresponding wells or reservoirs, containing solutions for attaching or anchoring an appropriate amino acid to the tips of the pins or rods. By repeating said step of the process, that is, by inverting and inserting the tips of the rods or pins into appropriate solutions, the amino acids are incorporated into desired peptides. In addition, several available FMOC peptide synthesis systems are available. For example, assembly of a polypeptide or fragment can be carried out on a solid support using an automated synthesizer from Applied Biosystems, Inc. Model 431A ™. Such equipment provides easy access to the peptides disclosed herein, either by direct synthesis or by synthesis of various fragments that can be coupled using other known techniques.

Los polipéptidos divulgados en la presente incluyen enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa en forma activa o inactiva. Por ejemplo, los polipéptidos divulgados en la presente incluyen proproteínas antes de su “maduración” o procesamiento de secuencias prepro, tal como por medio de una enzima de procesamiento de proproteína, tal como una proproteína convertasa para generar una proteína madura “activa”. Los polipéptidos divulgados en la presente incluyen enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa inactiva por otras razones, tal como antes de la “activación” por medio de un acontecimiento de procesamiento post-translacional, tal como una acción de endo- o exo-peptidasa o proteinasa, un acontecimiento de fosforilación, una amidación, una glicosilación o una sulfatación, un acontecimiento de dimerización y similares. Los polipéptidos divulgados en la presente incluyen todas las formas activas, incluidas las subsecuencias activas, tales como dominios catalíticos o sitios activos, de la enzima. The polypeptides disclosed herein include aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase in active or inactive form. For example, the polypeptides disclosed herein include proproteins prior to their "maturation" or prepro sequence processing, such as by means of a proprotein processing enzyme, such as a proprotein convertase to generate a "active" mature protein. The polypeptides disclosed herein include aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase inactive for other reasons, such as prior to "activation" by means of a post-translational processing event, such as a action of endo- or exo-peptidase or proteinase, a phosphorylation event, an amidation, a glycosylation or a sulfation, a dimerization event and the like. The polypeptides disclosed herein include all active forms, including active subsequences, such as catalytic domains or active sites, of the enzyme.

La invención incluye enzima aldolasa inmovilizada, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, anti-aldolasa, tal como anti-piruvato aldolasa, tal como anticuerpos anti-HMG y/o anti-KHG aldolasa y fragmentos de los mismos. En algunas realizaciones, la invención proporciona métodos para inhibir la actividad de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, por ejemplo usando mutantes negativos dominantes o anti-aldolasa, tal como anti-piruvato aldolasa, tal como anticuerpos anti-HMG y/o anti-KHG aldolasa divulgados en la presente. También se divulgan heterocomplejos, tales como proteínas de fusión, heterodímeros, etc., que comprenden la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente. The invention includes immobilized aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, anti-aldolase, such as anti-pyruvate aldolase, such as anti-HMG and / or anti-KHG aldolase antibodies and fragments thereof . In some embodiments, the invention provides methods of inhibiting the activity of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, for example using dominant negative mutants or anti-aldolase, such as anti-pyruvate aldolase, such as anti-HMG and / or anti-KHG aldolase antibodies disclosed herein. Heterocomplexes, such as fusion proteins, heterodimers, etc., comprising the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein, are also disclosed.

En algunas realizaciones, los polipéptidos divulgados en la presente pueden tener una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, en diferentes condiciones, tal como en pH y/o temperatura extremos o, en algunas realizaciones, en presencia de agentes oxidantes. En algunas realizaciones, la divulgación proporciona métodos que producen la enzima aldolasa alternativa, tal como piruvato aldolasa, tal como preparaciones de HMG y/o KHG aldolasa con diferentes eficiencias y estabilidades catalíticas, tal como hacia temperatura, agentes oxidantes y condiciones de lavado cambiantes. En algunas realizaciones, variantes de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa pueden producirse utilizando técnicas de mutagénesis dirigida y/o mutagénesis aleatoria. En algunas realizaciones, la evolución dirigida puede utilizarse para producir una gran variedad de enzima aldolasa, tales como variantes de la enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa con especificidades y estabilidad alternativas. In some embodiments, the polypeptides disclosed herein may have aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, under different conditions, such as at extreme pH and / or temperature, or, in some embodiments , in the presence of oxidizing agents. In some embodiments, the disclosure provides methods that produce the alternative aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase preparations with different catalytic efficiencies and stabilities, such as toward temperature, oxidizing agents, and changing washing conditions. In some embodiments, variants of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be produced using targeted mutagenesis and / or random mutagenesis techniques. In some embodiments, targeted evolution can be used to produce a wide variety of aldolase enzyme, such as pyruvate aldolase enzyme variants, such as HMG and / or KHG aldolase with alternative specificities and stability.

Las proteínas divulgadas en la presente también son útiles como reactivos de investigación para identificar moduladores de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, tales como activadores o inhibidores de la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Brevemente, las muestras de prueba (compuestos, caldos, extractos y similares) se incorporan a los ensayos de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa para determinar su capacidad para inhibir la escisión del sustrato. Los inhibidores identificados de esta forma pueden utilizarse en la industria y en la investigación para reducir o evitar la proteólisis indeseada. Tal como con aldolasa, tales como enzimas piruvato aldolasa, tal como HMG y/o KHG aldolasas, los inhibidores pueden combinarse para aumentar el espectro de actividad. The proteins disclosed herein are also useful as research reagents for identifying aldolase enzyme modulators, such as pyruvate aldolase, such as HMG and / or KHG aldolase, such as activators or inhibitors of aldolase enzyme activity, such as pyruvate aldolase , such as HMG and / or KHG aldolase. Briefly, test samples (compounds, broths, extracts, and the like) are incorporated into aldolase enzyme assays, such as pyruvate aldolase, such as HMG and / or KHG aldolase to determine their ability to inhibit substrate cleavage. Inhibitors identified in this way can be used in industry and in research to reduce or prevent unwanted proteolysis. As with aldolase, such as pyruvate aldolase enzymes, such as HMG and / or KHG aldolases, inhibitors can be combined to increase the spectrum of activity.

Las enzimas divulgadas en la presente también son útiles como reactivos de investigación para digerir proteínas o para la secuenciación de proteínas. Por ejemplo, la aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa pueden usarse para romper polipéptidos en fragmentos más pequeños para secuenciación usando, por ejemplo, un secuenciador automatizado. The enzymes disclosed herein are also useful as research reagents for digesting proteins or for protein sequencing. For example, aldolase, such as pyruvate aldolase enzyme, such as HMG and / or KHG aldolase can be used to break polypeptides into smaller fragments for sequencing using, for example, an automated sequencer.

La invención también proporciona métodos para descubrir una nueva aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa utilizando los ácidos nucleicos, polipéptidos y anticuerpos divulgados en la presente. En algunas realizaciones, las bibliotecas de fagémidos se evalúan en busca del descubrimiento en base a expresión de aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa. En otras realizaciones, se evalúan las bibliotecas de fagos lambda en busca del descubrimiento en base a expresión de la aldolasa, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa. La evaluación de las bibliotecas de fagos o fagémidos puede permitir la detección de clones tóxicos; mejor acceso al sustrato; necesidad reducida de manipular un huésped, evitar la posibilidad de cualquier sesgo que resulte de la supresión masiva de la biblioteca; y, un crecimiento más rápido en densidades de clones bajas. La evaluación de las bibliotecas de fagos o fagémidos puede ser en fase líquida o en fase sólida. En algunas realizaciones, la invención proporciona la evaluación en fase líquida. Esto proporciona una mayor flexibilidad en condiciones de ensayo; flexibilidad adicional del sustrato; sensibilidad más alta para clones débiles; y facilidad de automatización durante la evaluación de fase sólida. The invention also provides methods for discovering a new aldolase, such as pyruvate aldolase enzyme, such as HMG and / or KHG aldolase using the nucleic acids, polypeptides and antibodies disclosed herein. In some embodiments, phagemid libraries are screened for discovery based on aldolase expression, such as pyruvate aldolase enzyme, such as HMG and / or KHG aldolase. In other embodiments, lambda phage libraries are screened for discovery based on expression of aldolase, such as pyruvate aldolase enzyme, such as HMG and / or KHG aldolase. Evaluation of phage or phagemid libraries may allow detection of toxic clones; better access to the substrate; reduced need to manipulate a host, avoid the possibility of any bias resulting from massive deletion of the library; and, faster growth at low clone densities. The evaluation of phage or phagemid libraries can be in liquid phase or solid phase. In some embodiments, the invention provides liquid phase evaluation. This provides greater flexibility under test conditions; additional substrate flexibility; highest sensitivity for weak clones; and ease of automation during solid phase evaluation.

También se describen métodos de evaluación que usan las proteínas y ácidos nucleicos divulgados en la presente y la automatización robótica para permitir la ejecución de miles de reacciones biocatalíticas y ensayos de detección en un corto período de tiempo, tal como por día, así como asegurar un alto nivel de precisión y reproducibilidad (ver la descripción de los arreglos, más adelante). Como resultado, puede producirse una biblioteca de compuestos derivados en cuestión de semanas. Para más información sobre la modificación de las moléculas, incluidas molécula pequeñas, ver PCT/US94/09174; la Patente de los Estados No. 6.245.547. Evaluation methods using the proteins and nucleic acids disclosed herein and robotic automation are also described to allow thousands of biocatalytic reactions and detection assays to be run in a short period of time, such as per day, and to ensure a high level of precision and reproducibility (see the description of the arrangements, below). As a result, a library of derived compounds can be produced in a matter of weeks. For more information on modifying molecules, including small molecules, see PCT / US94 / 09174; United States Patent No. 6,245,547.

En algunas realizaciones, los polipéptidos o fragmentos divulgados en la presente se obtienen a través de los procedimientos de enriquecimiento bioquímico o purificación. La secuencia de polipéptidos o fragmentos homólogos pueden determinarse por ensayos de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa (ver los Ejemplos 3, 4 y 5, más adelante), electrofóresis de gel y/o microsecuenciación. La secuencia del posible polipéptido o fragmento divulgado en la presente puede compararse con un polipéptido divulgado en la presente o un fragmento, tal como que comprende al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 o más aminoácidos consecutivos de los mismos usando cualquiera de los programas descritos anteriormente. In some embodiments, the polypeptides or fragments disclosed herein are obtained through the biochemical enrichment or purification procedures. The sequence of homologous polypeptides or fragments can be determined by aldolase enzyme assays, such as pyruvate aldolase, such as HMG and / or KHG aldolase (see Examples 3, 4 and 5, below), gel electrophoresis and / or microsequencing. The sequence of the possible polypeptide or fragment disclosed herein can be compared to a polypeptide disclosed herein or a fragment, such as comprising at least about 5, 10, 15, 20, 25, 30, 35, 40, 50, 75 , 100 or 150 or more consecutive amino acids thereof using any of the programs described above.

También se divulga un ensayo para identificar fragmentos o variantes divulgados en la presente, que retienen la función enzimática de los polipéptidos divulgados en la presente. Por ejemplo los fragmentos o variantes de dichos polipéptidos, pueden usarse para catalizar reacciones bioquímicas, que indican que el fragmento o variante retiene la actividad enzimática de un polipéptido divulgado en la presente. Un ejemplo de un ensayo para determinar si los fragmentos de las variantes retienen la actividad enzimática de los polipéptidos divulgados en la presente incluye las etapas de: poner en contacto el fragmento de polipéptido o variante con una molécula de sustrato en condiciones que permiten que el fragmento del polipéptido o variante funcione y detectar una disminución en el nivel de sustrato An assay is also disclosed to identify fragments or variants disclosed herein, which retain the enzymatic function of the polypeptides disclosed herein. For example, fragments or variants of such polypeptides can be used to catalyze biochemical reactions, indicating that the fragment or variant retains the enzymatic activity of a polypeptide disclosed herein. An example of an assay to determine if variant fragments retain the enzymatic activity of the polypeptides disclosed herein includes the steps of: contacting the polypeptide or variant fragment with a substrate molecule under conditions that allow the fragment of the polypeptide or variant work and detect a decrease in the level of substrate

o un aumento en el nivel del producto de reacción específico de la reacción entre el polipéptido y sustrato. or an increase in the level of the specific reaction product of the reaction between the polypeptide and substrate.

La presente divulgación explota las propiedades catalíticas únicas de las enzimas. Mientras que el uso de biocatalizadores (es decir, enzimas purificadas o brutas, células vivas o no vivas) en transformaciones químicas normalmente requiere la identificación de un biocatalizador particular que reacciona con un compuesto de partida específico, el presente método usa biocatalizadores seleccionados y condiciones de reacción que son específicas para grupos funcionales que están presentes en muchos compuestos de partida, tales como molécula pequeñas. Cada biocatalizador es específico para un grupo funcional o varios grupos funcionales relacionados y puede reaccionar con muchos compuestos de partida que contienen este grupo funcional. The present disclosure exploits the unique catalytic properties of enzymes. While the use of biocatalysts (i.e., purified or crude enzymes, living or non-living cells) in chemical transformations normally requires the identification of a particular biocatalyst that reacts with a specific starting compound, the present method uses selected biocatalysts and conditions of reaction that are specific for functional groups that are present in many starting compounds, such as small molecules. Each biocatalyst is specific for one functional group or several related functional groups and can react with many starting compounds that contain this functional group.

En algunas realizaciones, las reacciones biocatalíticas producen una población de derivados de un compuesto de partida único. Estos derivados pueden someterse a otra ronda de reacciones biocatalíticas para producir una segunda población de compuestos derivados. Miles de variaciones de la molécula pequeña original o compuesto pueden producirse con cada iteración de derivatización biocatalítica. In some embodiments, biocatalytic reactions produce a population of derivatives of a single starting compound. These derivatives can undergo another round of biocatalytic reactions to produce a second population of derived compounds. Thousands of variations of the original small molecule or compound can occur with each iteration of biocatalytic derivatization.

Las enzimas reaccionan en sitios específicos de un compuesto de partida sin afectar el resto de la molécula, un proceso que es difícil de lograr utilizando métodos químicos tradicionales. Este alto grado de especificidad biocatalítica proporciona los medios para identificar un único compuesto activo dentro de la biblioteca. La biblioteca se caracteriza por la serie de reacciones biocatalíticas utilizadas para producirlo, un denominado “historial biosintético”. La evaluación de la biblioteca en busca de actividades biológicas y la localización del historial biosintético identifica la secuencia de reacción específica que produce el compuesto activo. La secuencia de reacción se repite y la estructura del compuesto sintetizado determinado. Este modo de identificación, a diferencia de otras síntesis y abordajes de detección, no requiere las tecnologías de inmovilización y los compuestos pueden sintetizarse y evaluarse libres en la solución utilizando virtualmente cualquier tipo de ensayo de detección. Cabe señalar que el alto grado de especificidad de las reacciones enzimáticas en grupos funcionales permite la “localización” de reacciones enzimáticas específicas que forman la biblioteca producida biocatalíticamente. Enzymes react at specific sites in a starting compound without affecting the rest of the molecule, a process that is difficult to accomplish using traditional chemical methods. This high degree of biocatalytic specificity provides the means to identify a single active compound within the library. The library is characterized by the series of biocatalytic reactions used to produce it, a so-called "biosynthetic history". Evaluation of the library for biological activities and the location of the biosynthetic history identifies the specific reaction sequence that the active compound produces. The reaction sequence is repeated and the structure of the synthesized compound determined. This mode of identification, unlike other synthesis and detection approaches, does not require immobilization technologies and the compounds can be freely synthesized and evaluated in solution using virtually any type of detection assay. It should be noted that the high degree of specificity of enzymatic reactions in functional groups allows the “localization” of specific enzymatic reactions that form the biocatalytically produced library.

En algunas realizaciones, las etapas del procedimiento se realizan utilizando automatización robótica que permite la ejecución de miles de reacciones biocatalíticas y/o ensayos de detección por día así como asegurar un alto nivel de precisión y reproducibilidad. La automatización robótica también puede usarse para evaluar la actividad de aldolasa para determinar si un polipéptido está dentro del alcance acuerdo con la divulgación. Como resultado, en algunas realizaciones, puede producirse una biblioteca de compuestos derivados en cuestión de semanas que tomaría años producir utilizando métodos de detección química o enzimática “tradicionales”. In some embodiments, the process steps are performed using robotic automation that allows thousands of biocatalytic reactions and / or detection assays to be run per day as well as ensuring a high level of precision and reproducibility. Robotic automation can also be used to assess aldolase activity to determine if a polypeptide is within the scope of the disclosure. As a result, in some embodiments, a library of derived compounds can be produced in a matter of weeks that would take years to produce using "traditional" chemical or enzymatic detection methods.

Se describen además métodos para modificar molécula pequeñas, que comprenden poner en contacto un polipéptido codificado por un polinucleótido descrito en la presente o fragmentos enzimáticamente activos de los mismos con una molécula pequeña para producir una molécula pequeña modificada. Se evalúa una biblioteca de moléculas pequeñas modificadas para determinar si una molécula pequeña modificada se encuentra presente en la biblioteca, que exhibe una actividad deseada. Una reacción biocatalítica específica que produce la molécula pequeña modificada de actividad deseada eliminando sistemáticamente cada una de las reacciones biocatalíticas utilizadas para producir una porción de la biblioteca y evaluar luego la molécula pequeña producida en la porción de la biblioteca para determinar la presencia o ausencia de la molécula pequeña modificada con la actividad deseada. Las reacciones biocatalíticas específicas que producen la molécula pequeña modificada de actividad deseada opcionalmente se repite. Las reacciones biocatalíticas se llevan a cabo con un grupo de biocatalizadores que reaccionan con restos estructurales diferentes que se encuentran dentro de la estructura de una molécula pequeña, cada uno de los biocatalizadores es específico para un resto estructural o un grupo de restos estructurales relacionados; y cada uno de los biocatalizadores reaccionan con muchas moléculas pequeñas diferentes que contienen el resto estructural distinto. Further disclosed are methods of modifying small molecules, which comprise contacting a polypeptide encoded by a polynucleotide described herein or enzymatically active fragments thereof with a small molecule to produce a modified small molecule. A library of modified small molecules is evaluated to determine if a modified small molecule is present in the library, which exhibits desired activity. A specific biocatalytic reaction that produces the modified small molecule of desired activity by systematically eliminating each of the biocatalytic reactions used to produce a portion of the library and then evaluating the small molecule produced in the portion of the library to determine the presence or absence of the small molecule modified with the desired activity. Specific biocatalytic reactions that produce the modified small molecule of desired activity are optionally repeated. Biocatalytic reactions are carried out with a group of biocatalysts that react with different structural residues that are within the structure of a small molecule, each of the biocatalysts is specific for a structural residue or a group of related structural residues; and each of the biocatalysts reacts with many different small molecules that contain the different structural moiety.

Secuencias señal de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, dominios prepro y catalíticos Aldolase enzyme signal sequences, such as pyruvate aldolase, such as HMG and / or KHG aldolase, prepro and catalytic domains

La divulgación proporciona secuencias señal de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa (tales como péptidos señal (SP)), dominios prepro y dominios catalíticos (CD). Los SP, los dominios prepro y/o CD divulgados en la presente pueden ser péptidos aislados, sintéticos o recombinantes o pueden ser parte de una proteína de fusión, tal como un dominio heterólogo en una proteína quimérica. También se describen ácidos nucleicos que codifican estos dominios catalíticos (CD), dominios prepro y secuencias señal (SP, tal como un péptido que tiene una secuencia que comprende/que consiste en residuos amino terminales de un polipéptido divulgado en la presente). The disclosure provides aldolase enzyme signal sequences, such as pyruvate aldolase, such as HMG and / or KHG aldolase (such as signal peptides (SP)), prepro domains, and catalytic domains (CD). The SPs, prepro and / or CD domains disclosed herein can be isolated, synthetic, or recombinant peptides or can be part of a fusion protein, such as a heterologous domain in a chimeric protein. Nucleic acids encoding these catalytic domains (CD), prepro domains, and signal sequences (SP, such as a peptide having a sequence comprising / consisting of amino terminal residues of a polypeptide disclosed herein) are also described.

La invención proporciona secuencias señal aisladas, sintéticas o recombinantes (tales como péptidos señal) que consisten en o que comprenden una secuencia como se establece en los residuos 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 46 o 1 a 47, de un polipéptido divulgado en la presente, tal como polipéptidos divulgados en la presente, ver también la Tabla 1, los Ejemplos 4, 5 y 6, más adelante, y el Listado de Secuencias. Por ejemplo, la Tabla 1, anteriormente, establece secuencias señal (líderes) ejemplares divulgados en la presente, tal como en el polipéptido que tiene una secuencia como se establece en la SEQ ID NO:66, codificada, por ejemplo, por SEQ ID NO:65, tiene una secuencia señal que comprende (o que consiste en) los 27 residuos amino terminales o MSIVVTKIERAGAAAVAALRTSGVATV (SEQ ID NO:407) que corresponde a los primeros 27 aminoácidos de la SEQ ID NO:66. The invention provides isolated, synthetic or recombinant signal sequences (such as signal peptides) consisting of or comprising a sequence as set forth in residues 1 to 14, 1 to 15, 1 to 16, 1 to 17, 1 to 18, 1 to 19, 1 to 20, 1 to 21, 1 to 22, 1 to 23, 1 to 24, 1 to 25, 1 to 26, 1 to 27, 1 to 28, 1 to 28, 1 to 30, 1 to 31, 1 to 32, 1 to 33, 1 to 34, 1 to 35, 1 to 36, 1 to 37, 1 to 38, 1 to 40, 1 to 41, 1 to 42, 1 to 43, 1 to 44, 1 to 45, 1 46 or 1 to 47, of a polypeptide disclosed herein, such as polypeptides disclosed herein, see also Table 1, Examples 4, 5 and 6, below, and the Sequence Listing. For example, Table 1, above, sets forth exemplary signal (leader) sequences disclosed herein, such as in the polypeptide having a sequence as set forth in SEQ ID NO: 66, encoded, for example, by SEQ ID NO. : 65, has a signal sequence comprising (or consisting of) the 27 amino terminal residues or MSIVVTKIERAGAAAVAALRTSGVATV (SEQ ID NO: 407) corresponding to the first 27 amino acids of SEQ ID NO: 66.

Existen secuencias señal que comprenden los primeros 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 o más residuos amino terminales de un polipéptido divulgado en la presente. There are signal sequences that comprise the first 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 , 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60 , 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 or more amino terminal residues of a polypeptide disclosed herein.

Existen polipéptidos con o sin una secuencia señal y/o una secuencia prepro. En algunas realizaciones, existen polipéptidos con secuencias señal y/o secuencias prepro heterólogas. La secuencia prepro (incluida una secuencia divulgada en la presente usada como un dominio prepro heterólogo) puede localizarse en el extremo terminal amino There are polypeptides with or without a signal sequence and / or a prepro sequence. In some embodiments, there are polypeptides with heterologous signal sequences and / or prepro sequences. The prepro sequence (including a sequence disclosed herein used as a heterologous prepro domain) can be located at the amino terminus

o carboxi de la proteína. También existen señales de secuencia aisladas, sintéticas o recombinantes, secuencias prepro y dominios catalíticos (tales como “sitios activos”) que comprenden secuencias divulgadas en la presente. El polipéptido que comprende una secuencia señal divulgada en la presente puede ser una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgada en la presente u otra enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa u otra enzima u otro polipéptido. Los métodos para identificar las secuencias dominio “prepro” y las secuencias señal son bien conocidos en la técnica, ver Van de Ven (1993) Crit. Rev. Oncog. 4(2):115-136. Por ejemplo, para identificar una secuencia prepro, la proteína se purifica del espacio extracelular y la secuencia de la proteína N-terminal se determina y se compara con la forma sin procesar. or carboxy protein. There are also isolated, synthetic or recombinant sequence signals, prepro sequences, and catalytic domains (such as "active sites") that comprise sequences disclosed herein. The polypeptide comprising a signal sequence disclosed herein can be an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, disclosed herein or another aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase or another enzyme or another polypeptide. Methods for identifying "prepro" domain sequences and signal sequences are well known in the art, see Van de Ven (1993) Crit. Rev. Oncog. 4 (2): 115-136. For example, to identify a prepro sequence, the protein is purified from the extracellular space, and the sequence of the N-terminal protein is determined and compared to the raw form.

Las secuencias señal (SP) y/o secuencias prepro de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente pueden ser péptidos aislados, sintéticos o recombinantes, o secuencias unidas a otra enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa o una no aldolasa, tal como no piruvato aldolasa, por ejemplo, no HMG y/o no KHG aldolasa polipéptido, tal como una proteína de fusión (quimérica). Se divulgan además polipéptidos que comprenden secuencias señal de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente. En algunas realizaciones, polipéptidos que comprenden secuencias señal SP y/o prepro de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente comprenden secuencias heterólogas a una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgada en la presente (tal como una proteína de fusión que comprende una SP y/o prepro divulgada en la presente y secuencias de otra enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa o una no aldolasa, tal como no piruvato aldolasa, por ejemplo, proteína no HMG y/o no KHG aldolasa). También se divulgan enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgadas en la presente con SP y/o secuencias prepro heterólogas, tales como secuencias con una secuencia señal de levadura señal. Una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa divulgada en la presente puede comprender una SP y/o prepro heteróloga en un vector, tal como un vector de la serie pPIC (Invitrogen, Carlsbad, CA). The signal sequences (SP) and / or prepro sequences of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein can be isolated, synthetic or recombinant peptides, or sequences linked to another aldolase enzyme , such as pyruvate aldolase, such as HMG and / or KHG aldolase or a non-aldolase, such as non-pyruvate aldolase, eg, non-HMG and / or non-KHG aldolase polypeptide, such as a fusion protein (chimeric). Further disclosed are polypeptides comprising aldolase enzyme signal sequences, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein. In some embodiments, polypeptides comprising SP signal and / or aldolase enzyme prepro, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein comprise heterologous sequences to an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, disclosed herein (such as a fusion protein comprising an SP and / or prepro disclosed herein and sequences of another aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase or a non-aldolase, such as non-pyruvate aldolase, eg, non-HMG protein and / or non-KHG aldolase). Aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein with SP and / or heterologous prepro sequences, such as sequences with a signal yeast signal sequence, are also disclosed. An aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase disclosed herein can comprise a heterologous SP and / or prepro in a vector, such as a pPIC series vector (Invitrogen, Carlsbad, CA).

En algunas realizaciones, las secuencias SP y/o prepro divulgadas en la presente son identificadas siguiendo una identificación de péptidos nuevos de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Las vías por las cuales las proteínas se clasifican y se transportan a su ubicación celular adecuada a menudo se denominan vías que se dirigen a proteínas. Uno de los elementos más importantes en todos estos sistemas de direccionamiento es una secuencia de aminoácidos corta en el extremo amino de un polipéptido recientemente sintetizado denominado la secuencia señal. Esta secuencia señal dirige una proteína a su ubicación apropiada en la célula y se elimina durante el transporte o cuando la proteína alcanza su destino final. La mayoría de las proteínas lisosomales, de membrana o secretadas tienen una secuencia señal amino-terminal que les marca la traslocación hacia el lúmen en el retículo endoplasmático. El largo de las secuencias señal puede variar de aproximadamente 10 a 65, o más, residuos aminoácidos. Varios métodos para el reconocimiento de secuencias señal son conocidos por los expertos en la técnica. Por ejemplo, en algunas realizaciones, las señales de péptidos nuevos de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa se identifican por medio de un método denominado SignalP. SignalP usa una red neural combinada que reconoce ambas señales de péptidos y sus sitios de escisión. (Nielsen (1997) “Identification of prokaryotic and eukaryotic peptides signals and prediction of their cleavage sites”. Protein Engineering 10:1-6. In some embodiments, the SP and / or prepro sequences disclosed herein are identified by following an identification of novel aldolase peptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The pathways by which proteins are classified and transported to their proper cellular location are often called pathways that target proteins. One of the most important elements in all of these targeting systems is a short amino acid sequence at the amino terminus of a recently synthesized polypeptide called the signal sequence. This signal sequence directs a protein to its proper location in the cell and is removed during transport or when the protein reaches its final destination. Most of the lysosomal, membrane or secreted proteins have an amino-terminal signal sequence that marks the translocation towards the lumen in the endoplasmic reticulum. The length of the signal sequences can vary from about 10 to 65, or more, amino acid residues. Various methods for signal sequence recognition are known to those of skill in the art. For example, in some embodiments, signals from novel aldolase enzyme peptides, such as pyruvate aldolase, such as HMG and / or KHG aldolase, are identified by a method called SignalP. SignalP uses a combined neural network that recognizes both peptide signals and their cleavage sites. (Nielsen (1997) “Identification of prokaryotic and eukaryotic peptides signals and prediction of their cleavage sites.” Protein Engineering 10: 1-6.

En algunas realizaciones, las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa de acuerdo con la invención no tienen secuencias SP y/o “dominios” prepro. Se divulga además la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente que carece de todo o parte de una SP y/o dominio prepro. Pueden desearse secuencias de ácido nucleico que codifican una secuencia señal (SP) y/o prepro de una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa operativamente ligada a una secuencia de ácidos nucleicos de una aldolasa diferente, tal como enzima piruvato aldolasa, tal como HMG y/o KHG aldolasa u opcionalmente una secuencia señal (SP) y/o dominio prepro de una no aldolasa, tal como no piruvato aldolasa, por ejemplo, una proteína no HMG y/o no KHG aldolasa. In some embodiments, aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase according to the invention do not have prepro SP sequences and / or "domains". Also disclosed is the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein that lacks all or part of a SP and / or prepro domain. Nucleic acid sequences encoding a signal (SP) and / or prepro sequence of an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase operatively linked to a nucleic acid sequence of a different aldolase, such may be desired. as the pyruvate aldolase enzyme, such as HMG and / or KHG aldolase or optionally a signal sequence (SP) and / or prepro domain of a non-aldolase, such as non-pyruvate aldolase, for example, a non-HMG and / or non-KHG aldolase protein .

También se divulgan polipéptidos aislados, sintéticos o recombinantes que comprenden secuencias señal (SP), dominio prepro y/o dominios catalíticos (CD) divulgados en la presente y secuencias heterólogas. Las secuencias heterólogas son secuencias que no están naturalmente asociadas (tal como a una enzima) con una SP, dominio prepro y/o CD. La secuencia a la cual la SP, el dominio prepro y/o CD no se asocian naturalmente puede ser en las SP, dominio prepro y/o extremo amino terminal de CD, extremo carboxi terminal y/o ambos extremos en el SP y/o CD. En algunas realizaciones, la invención proporciona polipéptidos aislados, sintéticos o recombinantes que comprenden (o que consisten en) un polipéptido que comprende una secuencia señal (SP), un dominio prepro y/o un dominio catalítico (CD) divulgados en la presente con la condición de que no se asocien con ninguna secuencia a la cual no estén naturalmente asociadas (tal como una enzima aldolasa, tal como una secuencia de piruvato aldolasa, HMG y/o KHG aldolasa). De forma similar, existen ácidos nucleicos aislados, sintéticos o recombinantes que codifican estos polipéptidos. Así, en algunas realizaciones, el ácido nucleico aislado, sintético o recombinante divulgado en la presente comprende una secuencia de codificación para una secuencia señal (SP), un dominio prepro y/o un dominio catalítico (CD) divulgados en la presente y una secuencia heteróloga (es decir, una secuencia que no esté naturalmente asociada con una secuencia señal (SP), un dominio prepro y/o dominio catalítico (CD) divulgados en la presente). La secuencia heteróloga puede estar en el extremo terminal 3', extremo terminal 5' y/o en ambos extremos de la SP, el dominio prepro y/o la secuencia de codificación CD. Isolated, synthetic or recombinant polypeptides comprising signal sequences (SP), prepro domain and / or catalytic domains (CD) disclosed herein and heterologous sequences are also disclosed. Heterologous sequences are sequences that are not naturally associated (such as to an enzyme) with a SP, prepro domain and / or CD. The sequence to which the SP, the prepro domain and / or CD do not naturally associate can be in the SP, prepro domain and / or amino terminal end of CD, carboxy terminal end and / or both ends in the SP and / or CD. In some embodiments, the invention provides isolated, synthetic, or recombinant polypeptides that comprise (or consist of) a polypeptide that comprises a signal sequence (SP), a prepro domain, and / or a catalytic domain (CD) disclosed herein with the provided that they are not associated with any sequence to which they are not naturally associated (such as an aldolase enzyme, such as a pyruvate aldolase, HMG and / or KHG aldolase sequence). Similarly, there are isolated, synthetic, or recombinant nucleic acids that encode these polypeptides. Thus, in some embodiments, the isolated, synthetic or recombinant nucleic acid disclosed herein comprises a coding sequence for a signal sequence (SP), a prepro domain and / or a catalytic domain (CD) disclosed herein and a sequence heterologous (i.e., a sequence that is not naturally associated with a signal sequence (SP), a prepro domain and / or catalytic domain (CD) disclosed herein). The heterologous sequence may be at the 3 'end, the 5' end and / or at both ends of the SP, the prepro domain and / or the CD coding sequence.

Enzima aldolasa híbrida (quimérica), tal como piruvato aldolasa, tal como HMG y/o KHG aldolasas y bibliotecas de péptidos Hybrid (chimeric) aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolases and peptide libraries

En algunas realizaciones, la invención proporciona una enzima aldolasa híbrida, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa y proteínas de fusión, incluidas bibliotecas de péptidos, que comprenden secuencias divulgadas en la presente. Las bibliotecas de péptidos divulgadas en la presente pueden utilizarse para aislar modulares de péptidos (tales como activadores o inhibidores) de blancos, tales como sustratos, receptores, enzimas de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Las bibliotecas de péptidos divulgadas en la presente pueden utilizarse para identificar partes de unión formales, tales como ligandos, tales como citocinas, hormonas y similares. En algunas realizaciones, la invención proporciona proteínas quiméricas que comprenden una secuencia señal (SP), un dominio prepro y/o un dominio catalítico (CD) divulgados en la presente o una combinación de los mismos y una secuencia heteróloga (ver anteriormente). In some embodiments, the invention provides a hybrid aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, and fusion proteins, including peptide libraries, comprising sequences disclosed herein. The peptide libraries disclosed herein can be used to isolate modular peptides (such as activators or inhibitors) from targets, such as substrates, receptors, enzyme aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The peptide libraries disclosed herein can be used to identify formal binding parts, such as ligands, such as cytokines, hormones, and the like. In some embodiments, the invention provides chimeric proteins comprising a signal sequence (SP), a prepro domain and / or a catalytic domain (CD) disclosed herein or a combination thereof and a heterologous sequence (see above).

En algunas realizaciones, las proteínas de fusión divulgadas en la presente (tal como el resto de péptido) se estabilizan conformacionalmente (con respecto a péptidos lineales) para permitir una afinidad de unión más alta para los objetivos. Se describen además fusiones de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente y otros péptidos, incluidos péptidos conocidos y péptidos aleatorios. Pueden fusionarse de manera tal que la estructura de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasas no se perturbe considerablemente y que la conformación del péptido se estabilice metabólica o estructuralmente. Esto permite la creación de una biblioteca de péptidos que se monitorea fácilmente para determinar su presencia en las células y su cantidad. In some embodiments, the fusion proteins disclosed herein (such as the peptide moiety) are conformationally stabilized (relative to linear peptides) to allow for higher binding affinity for targets. Aldolase enzyme fusions, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein and other peptides, including known peptides and random peptides, are further described. They can be fused in such a way that the structure of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolases is not considerably disturbed and that the conformation of the peptide is metabolically or structurally stabilized. This allows the creation of a library of peptides that is easily monitored to determine their presence in cells and their quantity.

Variantes de secuencias de aminoácidos divulgadas en la presente pueden caracterizarse por una naturaleza predeterminada de la variación, una característica que los separa de una forma natural, tal como una variación alélica o entre especies de una enzima aldolasa, tal como una secuencia de piruvato aldolasa, HMG y/o KHG aldolasa. En algunas realizaciones, las variantes divulgadas en la presente exhiben la misma actividad biológica cualitativa que el análogo natural. De forma alternativa, las variantes pueden seleccionarse por tener características modificadas. En algunas realizaciones, mientras que el sitio o región para introducir una variación de la secuencia de aminoácidos es predeterminado, la mutación en sí misma no necesita ser determinada. Por ejemplo, para optimizar el rendimiento de una mutación en un sitio dado, la mutagénesis aleatoria puede llevarse a cabo en el codón o región objetivo y las variantes de enzima aldolasa expresadas, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa evaluadas para la combinación óptima de la actividad deseada. Las técnicas para realizar dicha mutaciones de sustitución en sitios predeterminados en el ADN que tiene una secuencia conocida son bien conocidas, como se describe por ejemplo en la presente, mutagénesis de cebador M13 y mutagénesis por PCR. La evaluación de los mutantes puede realizarse usando, por ejemplo ensayos de formación de enlaces carbono-carbono o escisión. En otras realizaciones, las sustituciones de aminoácidos pueden ser residuos únicos; las inserciones pueden realizarse en el orden de aproximadamente 1 a 20 aminoácidos, a pesar de que pueden realizarse más inserciones. Las eliminaciones pueden estar en un rango de aproximadamente 1 a aproximadamente 20, 30, 40, 50, 60, 70 residuos Variants of amino acid sequences disclosed herein can be characterized by a predetermined nature of the variation, a characteristic that separates them naturally, such as an allelic or interspecies variation of an aldolase enzyme, such as a pyruvate aldolase sequence, HMG and / or KHG aldolase. In some embodiments, the variants disclosed herein exhibit the same qualitative biological activity as the natural analog. Alternatively, variants can be selected for having modified characteristics. In some embodiments, while the site or region for introducing a variation of the amino acid sequence is predetermined, the mutation itself does not need to be determined. For example, to optimize the performance of a mutation at a given site, random mutagenesis can be carried out on the target codon or region and the expressed aldolase enzyme variants, such as pyruvate aldolase, such as HMG and / or KHG aldolase evaluated for the optimal combination of the desired activity. Techniques for making such substitution mutations at predetermined sites in DNA having a known sequence are well known, as described for example herein, M13 primer mutagenesis and PCR mutagenesis. Mutant evaluation can be performed using, for example, carbon-carbon bond formation or cleavage assays. In other embodiments, the amino acid substitutions can be single residues; insertions can be made in the order of about 1 to 20 amino acids, although more insertions can be made. Eliminations can be in the range of about 1 to about 20, 30, 40, 50, 60, 70 residues

o más. Para obtener un derivado final con las propiedades óptimas, pueden usarse sustituciones, eliminaciones, inserciones o cualquier combinación de las mismas. Generalmente, estos cambios se realizan en unos pocos aminoácidos para minimizar la alteración de la molécula. Sin embargo, pueden tolerarse mayores cambios en ciertas circunstancias. or more. To obtain a final derivative with optimal properties, substitutions, deletions, inserts, or any combination thereof may be used. Generally, these changes are made in a few amino acids to minimize disruption of the molecule. However, greater changes may be tolerated in certain circumstances.

Existe enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa donde la estructura central del polipéptido, la estructura secundaria o la estructura terciaria, tal como una estructura de hélice alfa u hoja beta, ha sido modificada. En algunas realizaciones, la carga o hidrofobicidad ha sido modificada. En algunas realizaciones, el volumen de una cadena lateral ha sido modificado. Los cambios importantes en la función o identidad inmunológica se obtienen mediante la selección de sustituciones que son menos conservadoras. Por ejemplo, pueden realizarse sustituciones que afectan más considerablemente: la estructura de la estructura central del polipéptido en el área de la alteración, por ejemplo una estructura de hélice alfa u hoja beta; una carga un sitio hidrófobo de la molécula, que puede estar en un sitio activo; o una cadena lateral. Se divulgan además sustituciones en polipéptidos divulgados en la presente donde (a) los residuos hidrófilos, tales como serilo o treonilo, se sustituyen por un residuo hidrófoba, tal como leucilo, isoleucilo, fenilalanilo, valilo o alanilo; (b) una cisteína o prolina se sustituye por cualquier otro residuo; Aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase exists where the central structure of the polypeptide, the secondary structure or the tertiary structure, such as an alpha helix or beta sheet structure, has been modified. In some embodiments, the charge or hydrophobicity has been modified. In some embodiments, the volume of a side chain has been modified. Significant changes in immune function or identity are obtained by selecting substitutions that are less conservative. For example, substitutions may be made that more significantly affect: the structure of the core structure of the polypeptide in the area of alteration, for example an alpha helix or beta sheet structure; a charges a hydrophobic site on the molecule, which may be at an active site; or a side chain. Further disclosed are substitutions in polypeptides disclosed herein where (a) hydrophilic residues, such as seryl or threonyl, are replaced by a hydrophobic residue, such as leucyl, isoleucil, phenylalanyl, valine or alanyl; (b) a cysteine or proline is replaced by any other residue;

(c)(c)
un residuo que tiene una cadena lateral electropositiva, tal como lisilo, arginilo o histidilo, se sustituye por un residuo electronegativo, tal como glutamilo o aspartilo; o (d) un residuo que tiene una cadena lateral voluminosa, tal como fenilalanina, se sustituye por uno que no tiene una cadena lateral, tal como glicina. Las variantes pueden exhibir la misma actividad biológica cualitativa (es decir, una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) a pesar de que las variantes pueden seleccionarse para modificar las características de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasas, según sea necesario.  a residue having an electropositive side chain, such as lysyl, arginyl, or histidyl, is replaced by an electronegative residue, such as glutamyl or aspartyl; or (d) a residue that has a bulky side chain, such as phenylalanine, is replaced by one that does not have a side chain, such as glycine. Variants can exhibit the same qualitative biological activity (i.e., an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase) although variants can be selected to modify the characteristics of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolases, as needed.

En algunas realizaciones, la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente comprende epítopos o etiquetas de purificación, secuencias señal u otras secuencias de fusión, etc. En algunas realizaciones, la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente puede fusionarse con un péptido aleatorio para formar un polipéptido de fusión. “Fusionado” u “operativamente ligado” en la presente significa que el péptido aleatorio y la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa están ligados, de forma tal que minimizan la alteración de la estabilidad de la enzima aldolasa, tal como piruvato aldolasa, tal como una estructura de HMG y/o KHG aldolasa, que por ejemplo retiene la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. El polipéptido de fusión (o polinucleótido de fusión que codifica el polipéptido de fusión) puede comprender también otros componentes, incluidos múltiples péptidos en múltiples aros. In some embodiments, the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein comprises purification tags or epitopes, signal sequences, or other fusion sequences, etc. In some embodiments, the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein can be fused with a random peptide to form a fusion polypeptide. "Fused" or "operably linked" herein means that the random peptide and the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase are bound, so as to minimize disruption of enzyme stability aldolase, such as pyruvate aldolase, such as a HMG and / or KHG aldolase structure, which for example retains the activity of aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase. The fusion polypeptide (or fusion polynucleotide encoding the fusion polypeptide) may also comprise other components, including multiple peptides in multiple rings.

En algunas realizaciones, los péptidos y ácidos nucleicos que los codifican son aleatorizados, ya sea completamente aleatorizados o sesgados en su aleatorización, tal como en frecuencia de nucleótidos/residuos generalmente o por posición. “Aleatorizado” significa que cada ácido nucleico y péptido consiste en nucleótidos esencialmente aleatorios y aminoácidos, respectivamente. En algunas realizaciones, los ácidos nucleicos que dan origen a los péptidos pueden sintetizarse químicamente, y por lo tanto pueden incorporar cualquier nucleótido en cualquier posición. Así, cuando los ácidos nucleicos se expresan para formar péptidos, cualquier residuo aminoácido puede incorporarse en cualquier posición. El proceso sintético puede diseñarse para generar ácidos nucleicos aleatorizados, para permitir la formación de todas o la mayoría de las combinaciones en el largo del ácido nucleico, formando así una biblioteca de ácidos nucleicos aleatorizados. La biblioteca puede proporcionar una población con una estructura lo suficientemente diversa de productos de expresión aleatorizados para influir en un rango que probablemente sea suficiente de respuestas celulares para proporcionar una o más células que exhiben una respuesta deseada. De esta forma, se divulgan bibliotecas de interacción lo suficiente grandes de forma tal que al menos uno de los miembros tendrán una estructura que le da afinidad por algunas moléculas, proteínas u otros factores. In some embodiments, the peptides and nucleic acids encoding them are randomized, either completely randomized or skewed in their randomization, such as nucleotide / residue frequency generally or by position. "Randomized" means that each nucleic acid and peptide consists of essentially random nucleotides and amino acids, respectively. In some embodiments, the nucleic acids that give rise to the peptides can be chemically synthesized, and therefore can incorporate any nucleotide at any position. Thus, when nucleic acids are expressed to form peptides, any amino acid residue can be incorporated at any position. The synthetic process can be designed to generate randomized nucleic acids, to allow the formation of all or most of the combinations in the length of the nucleic acid, thus forming a library of randomized nucleic acids. The library can provide a population with a sufficiently diverse structure of randomized expression products to influence a range of likely cellular responses sufficient to provide one or more cells that exhibit a desired response. In this way, large enough interaction libraries are disclosed so that at least one of the members will have a structure that gives it affinity for some molecules, proteins or other factors.

En algunas realizaciones, una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgada en la presente es una enzima de múltiples dominios que comprende una señal peptídica, un módulo de unión a carbohidratos, una enzima aldolasa, tal como un dominio catalítico de piruvato aldolasa, HMG y/o KHG aldolasa, un ligante y/o otro dominio catalítico. In some embodiments, an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase, disclosed herein is a multi-domain enzyme comprising a peptide signal, a carbohydrate binding module, an aldolase enzyme, such as a Pyruvate aldolase, HMG and / or KHG aldolase catalytic domain, a binder and / or other catalytic domain.

La invención proporciona métodos y secuencias para generar polipéptidos quiméricos que pueden codificar polipéptidos híbridos biológicamente activos (tal como una enzima aldolasa híbrida, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa). En algunas realizaciones, los polinucleótidos originales (tal como un ácido nucleico divulgado en la presente) codifican polipéptidos biológicamente activos. En algunas realizaciones, un método divulgado en la presente produce nuevos polipéptidos híbridos utilizando procesos celulares que integran la secuencia de los polinucleótidos originales de forma tal que el polinucleótido híbrido resultante codifique un polipéptido que demuestra actividades derivadas de, pero diferentes a, los polipéptidos biológicamente activos originales (tal como aldolasa o anticuerpo de acuerdo con la invención). Por ejemplo, los polinucleótidos originales pueden codificar una enzima particular (tal como aldolasa) de o que se encuentra en microorganismos diferentes, una enzima que codifica un primer polinucleótidos de un organismo o variante puede, por ejemplo, funcionar de manera efectiva en una condición ambiental particular, tal como alta salinidad, una enzima que codifica un segundo polinucleótido de un organismo diferente o variante puede funcionar de manera efectiva en una condición ambiental diferente, tal como temperaturas extremadamente altas. Un polinucleótido híbrido que contiene secuencias del primer y el segundo polinucleótido original puede codificar una enzima que exhibe características de ambas enzimas codificadas por los polinucleótido originales. Así, la enzima codificada por el polinucleótido híbrido divulgado en la presente puede funcionar de manera efectiva en condiciones ambientales compartidas por cada una de las enzimas codificadas por el primer y el segundo polinucleótido, tal como alta salinidad y temperaturas extremas. The invention provides methods and sequences for generating chimeric polypeptides that can encode biologically active hybrid polypeptides (such as a hybrid aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase). In some embodiments, the original polynucleotides (such as a nucleic acid disclosed herein) encode biologically active polypeptides. In some embodiments, a method disclosed herein produces novel hybrid polypeptides using cellular processes that integrate the sequence of the original polynucleotides such that the resulting hybrid polynucleotide encodes a polypeptide that demonstrates activities derived from, but different from, biologically active polypeptides. originals (such as aldolase or antibody according to the invention). For example, the original polynucleotides can encode a particular enzyme (such as aldolase) from or found in different microorganisms, an enzyme that encodes a first polynucleotide of an organism or variant can, for example, function effectively in an environmental condition In particular, such as high salinity, an enzyme encoding a second polynucleotide from a different or variant organism can function effectively under a different environmental condition, such as extremely high temperatures. A hybrid polynucleotide containing sequences of the original first and second polynucleotides can encode an enzyme that exhibits characteristics of both enzymes encoded by the original polynucleotides. Thus, the enzyme encoded by the hybrid polynucleotide disclosed herein can function effectively under ambient conditions shared by each of the enzymes encoded by the first and second polynucleotides, such as high salinity and extreme temperatures.

En algunas realizaciones, un polipéptido híbrido generado por un método divulgado en la presente puede exhibir una enzima especializada no exhibida en las enzimas originales. Por ejemplo, siguiendo la recombinación y/o reordenamiento reductivo de polinucleótidos que codifican enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasas, el polipéptido híbrido resultante codificado por un polinucleótido híbrido puede evaluarse en busca de actividad de enzima no aldolasa especializada, tal como no piruvato aldolasa, tal como enzima no HMG y/o no KHG-aldolasa, tal como actividades de hidrolasa, peptidasa, fosforilasa, etc., obtenidas de cada una de las enzimas originales. En algunas realizaciones, el polipéptido híbrido se evalúa para determinar dichas funcionalidades químicas que distinguen al polipéptido híbrido de los polipéptidos base originales, tal como la temperatura, pH o concentración de sal en la cual el polipéptido híbrido funciona. In some embodiments, a hybrid polypeptide generated by a method disclosed herein can exhibit a specialized enzyme not exhibited in the original enzymes. For example, by following the recombination and / or reductive rearrangement of polynucleotides encoding enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolases, the resulting hybrid polypeptide encoded by a hybrid polynucleotide can be screened for nonenzyme activity specialized aldolase, such as non-pyruvate aldolase, such as non-HMG and / or non-KHG-aldolase enzyme, such as hydrolase, peptidase, phosphorylase, etc. activities, obtained from each of the original enzymes. In some embodiments, the hybrid polypeptide is evaluated to determine such chemical functionalities that distinguish the hybrid polypeptide from the original base polypeptides, such as the temperature, pH, or salt concentration at which the hybrid polypeptide functions.

Se describe además un método para producir un polipéptido híbrido biológicamente activo y evaluar dicho polipéptido en busca de actividad mejorada: Also described is a method of producing a biologically active hybrid polypeptide and evaluating said polypeptide for enhanced activity:

1) introduciendo al menos un primer polinucleótido en enlace operativo y un segundo polinucleótido en enlace operativo, compartiendo al menos el primer y el segundo polinucleótidos al menos una región de una homología parcial, en una célula huésped adecuada; 1) introducing at least a first polynucleotide linkage operative and a second polynucleotide linkage operative, at least the first and second polynucleotides sharing at least one region of partial homology, into a suitable host cell;

2) cultivando la célula huésped en condiciones que promueven la reorganización de secuencias que resulta en un polinucleótido híbrido en enlace operativo; 2) culturing the host cell under conditions that promote sequence rearrangement resulting in an operably linked hybrid polynucleotide;

3) expresando un polipéptido híbrido codificado por el polinucleótido híbrido; 3) expressing a hybrid polypeptide encoded by the hybrid polynucleotide;

4) evaluando el polipéptido híbrido en condiciones que promueven la identificación de la actividad biológica mejorada; y 4) evaluating the hybrid polypeptide under conditions that promote the identification of enhanced biological activity; and

5) aislando un polinucleótido que codifica el polipéptido híbrido. 5) isolating a polynucleotide that encodes the hybrid polypeptide.

Aislar y descubrir enzimas aldolasa Isolate and discover aldolase enzymes

Existen métodos para aislar y descubrir aldolasa, tal como enzimas piruvato aldolasa, HMG y/o KHG aldolasa y los ácidos nucleicos que las codifican. Pueden aislarse polinucleótidos o enzimas de organismos individuales (“aislados”), conjuntos de organismos que se han cultivado en medios definidos (“cultivos de enriquecimiento”) u organismos sin cultivar (“muestras ambientales”). Los organismos pueden aislarse, por ejemplo, mediante ciclos de selección por afinidad (biopanning) in vivo (ver detalles más abajo). El uso de un abordaje independiente del cultivo para derivar polinucleótidos que codifican bioactividades novedosas a partir de muestras ambientales es más preferible porque permite acceder a recursos de biodiversidad sin explotar. Los polinucleótidos o enzimas también pueden aislarse a partir de uno cualquiera de numerosos organismos, tales como bacterias. Además de células enteras, los polinucleótidos o enzimas también pueden aislarse a partir de preparaciones enzimáticas brutas derivadas de cultivos de estos organismos, tales como bacterias. There are methods for isolating and discovering aldolase, such as pyruvate aldolase, HMG and / or KHG aldolase enzymes and the nucleic acids that encode them. Polynucleotides or enzymes can be isolated from individual organisms ("isolates"), pools of organisms that have been cultured in defined media ("enrichment cultures"), or uncultivated organisms ("environmental samples"). Organisms can be isolated, for example, by in vivo affinity selection (biopanning) cycles (see details below). Using a culture-independent approach to derive polynucleotides that encode novel bioactivities from environmental samples is more preferable because it allows access to untapped biodiversity resources. Polynucleotides or enzymes can also be isolated from any one of numerous organisms, such as bacteria. In addition to whole cells, polynucleotides or enzymes can also be isolated from crude enzyme preparations derived from cultures of these organisms, such as bacteria.

“Bibliotecas ambientales” se generan a partir de muestras ambientales y representan los genomas colectivos de organismos naturales obtenidos en la clonación de vectores que pueden propagarse en huéspedes procariotas adecuados. Dado que el ADN clonado se extrae inicialmente directamente de muestras ambientales, las bibliotecas no se limitan a la pequeña fracción de procariotas que pueden cultivarse en un cultivo puro. Además, una normalización del ADN ambiental presente en estas muestras podría permitir una representación más equitativa del ADN de todas las especies presentes en la muestra original. Esto puede aumentar drásticamente la eficacia de la búsqueda de genes interesantes de constituyentes menores de la muestra que pueden estar representados en órdenes de magnitud muy inferiores en comparación con la especie dominante. "Environmental libraries" are generated from environmental samples and represent the collective genomes of natural organisms obtained by cloning vectors that can be propagated into suitable prokaryotic hosts. Since cloned DNA is initially extracted directly from environmental samples, libraries are not limited to the small fraction of prokaryotes that can be grown in a pure culture. Furthermore, a normalization of the environmental DNA present in these samples could allow a more equitable representation of the DNA of all the species present in the original sample. This can dramatically increase the efficiency of the search for interesting genes from minor constituents of the sample that may be represented in orders of magnitude much lower compared to the dominant species.

En algunas realizaciones se detectan sistemáticamente bibliotecas génicas generadas a partir de uno o más microorganismos sin cultivar en busca de una actividad de interés. Las posibles vías que codifican moléculas bioactivas de interés se capturan en primer lugar en células procariotas en forma de bibliotecas de expresión génica. En algunas realizaciones, los polinucleótidos que codifican actividades de interés se aíslan de dichas bibliotecas y se introducen en una célula huésped. La célula huésped se cultiva en condiciones que promueven la recombinación y/o reordenamiento reductor, creando biomoléculas potencialmente activas con actividades novedosas o mejoradas. In some embodiments, gene libraries generated from one or more uncultivated microorganisms are routinely detected for an activity of interest. Possible pathways encoding bioactive molecules of interest are first captured in prokaryotic cells in the form of gene expression libraries. In some embodiments, polynucleotides encoding activities of interest are isolated from said libraries and introduced into a host cell. The host cell is cultured under conditions that promote reductive recombination and / or rearrangement, creating potentially active biomolecules with novel or improved activities.

La selección por afinidad in vivo puede realizarse utilizando máquinas basadas en FACS y no ópticas (tales como magnéticas). En algunas realizaciones se construyen bibliotecas de genes complejas con vectores que contienen elementos que estabilizan el ARN transcrito. Por ejemplo, la inclusión de secuencias que resultan en estructuras secundarias tales como horquillas, que son diseñadas para flanquear las regiones transcritas del ARN, serviría para mejorar su estabilidad, incrementando así su semivida dentro de la célula. Las moléculas de sonda utilizadas en el proceso de ciclos de selección por afinidad consisten en oligonucleótidos etiquetados con moléculas reporteras que solo fluorescen tras la unión de la sonda con una molécula objetivo. Estas sondas se introducen en las células recombinantes de la biblioteca usando uno de varios métodos de transformación. Las moléculas de las sondas se unen al ARNm objetivo transcrito, lo que resulta en moléculas heterodúplex de ADN/ARN. La unión de la sonda a un objetivo arrojará una señal fluorescente que es detectada y agrupada por la máquina de FACS durante el proceso de selección sistemática. In vivo affinity selection can be performed using FACS-based and non-optical (such as magnetic) machines. In some embodiments, complex gene libraries are constructed with vectors containing elements that stabilize the transcribed RNA. For example, the inclusion of sequences that result in secondary structures such as hairpins, which are designed to flank the transcribed regions of the RNA, would serve to improve its stability, thereby increasing its half-life within the cell. The probe molecules used in the affinity selection cycle process consist of reporter molecule-labeled oligonucleotides that only fluoresce upon probe binding to a target molecule. These probes are introduced into the recombinant cells in the library using one of several transformation methods. The molecules in the probes bind to the transcribed target mRNA, resulting in heteroduplex DNA / RNA molecules. Linking the probe to a target will yield a fluorescent signal that is detected and pooled by the FACS machine during the systematic screening process.

En algunas realizaciones se lleva a cabo una subclonación para aislar aun más secuencias de interés. En la subclonación, una porción de ADN es amplificada y digerida, generalmente por enzimas de restricción, para cortar la secuencia deseada, la cual se liga a un vector receptor y se amplifica. En cada etapa de la subclonación se examina la porción en busca de la actividad de interés con el fin de asegurar que el ADN que codifica la proteína estructural no haya quedado excluida. El inserto puede purificarse en cualquier etapa de la subclonación, por ejemplo, mediante electroforesis en gel antes de la ligadura en el vector o en donde las células que contienen el vector receptor y las células que no contienen el vector receptor se colocan en medio selectivo que contiene, por ejemplo, un antibiótico que matará a las células que no contienen el vector receptor. Los métodos específicos de subclonación de insertos de ADNc en vectores se conocen bien en la técnica (Sambrook et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor Laboratory Press (1989)). En otras realizaciones, las enzimas divulgadas en la presente son subclones. Estos subclones pueden diferir del clon base, por ejemplo, en longitud, una mutación o una etiqueta. In some embodiments, subcloning is performed to isolate even more sequences of interest. In subcloning, a portion of DNA is amplified and digested, generally by restriction enzymes, to cut the desired sequence, which binds to a receptor vector and is amplified. At each stage of subcloning the portion is examined for the activity of interest in order to ensure that DNA encoding the structural protein has not been excluded. The insert can be purified at any stage of subcloning, for example, by gel electrophoresis before ligation into the vector or where cells that contain the receptor vector and cells that do not contain the receptor vector are placed in selective medium that it contains, for example, an antibiotic that will kill cells that do not contain the receptor vector. Specific methods of subcloning cDNA inserts into vectors are well known in the art (Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)). In other embodiments, the enzymes disclosed herein are subclones. These subclones may differ from the base clone, for example, in length, a mutation, or a tag.

Los microorganismos de los cuales puede descubrirse, aislarse o prepararse el polinucleótido incluyen microorganismos procariotas, tales como Eubacteria y Archaebacteria y microorganismos eucariotas inferiores tales como hongos, algunas algas y protozoos. Los polinucleótidos pueden descubrirse, aislarse o prepararse a partir de muestras ambientales, en cuyo caso el ácido nucleico puede recuperarse sin cultivar un organismo o recuperarse de uno o más organismos cultivados. En algunas realizaciones, dichos microorganismos pueden ser extremófilos, tales como hipertermófilos, psicrófilos, psicrótrofos, halófilos, barófilos y acidófilos. Pueden usarse polinucleótidos que codifican enzimas aisladas de microorganismos extremófilos. Las enzimas de la presente invención pueden funcionar a temperaturas por encima de los 100°C, tales como las que se encuentran en manantiales calientes terrestres y respiraderos termales submarinos, o a temperaturas por debajo de 0°C, tales como las que se encuentran en las aguas árticas, en un ambiente salino saturado, tales como las que se encuentran en el Mar Muerto, a valores de pH cercanos a 0, tales como las que se encuentran en depósitos de carbón y manantiales geotérmicos ricos en azufre, o a valores de pH superiores a 11, tales como las que se encuentran en lodos de aguas servidas. En algunas realizaciones, las enzimas divulgadas en la presente tienen una alta actividad en una amplia gama de temperaturas y valores de pH. Microorganisms from which the polynucleotide can be discovered, isolated, or prepared include prokaryotic microorganisms, such as Eubacteria and Archaebacteria, and lower eukaryotic microorganisms such as fungi, some algae, and protozoa. Polynucleotides can be discovered, isolated, or prepared from environmental samples, in which case the nucleic acid can be recovered without culturing an organism or recovered from one or more cultured organisms. In some embodiments, said microorganisms may be extremophiles, such as hyperthermophiles, psychrophiles, psychotrophs, halophiles, barophiles, and acidophiles. Polynucleotides encoding enzymes isolated from extremophilic microorganisms can be used. The enzymes of the present invention can function at temperatures above 100 ° C, such as those found in terrestrial hot springs and underwater thermal vents, or at temperatures below 0 ° C, such as those found at Arctic waters, in a saturated saline environment, such as those found in the Dead Sea, at pH values close to 0, such as those found in coal deposits and sulfur-rich geothermal springs, or at higher pH values to 11, such as those found in sewage sludge. In some embodiments, the enzymes disclosed herein have high activity over a wide range of temperatures and pH values.

Los polinucleótidos seleccionados y aislados como se describió anteriormente se introducen en una célula huésped adecuada. Una célula huésped adecuada es cualquier célula que es capaz de promover la recombinación y/o reordenamiento reductor. En algunas realizaciones, los polinucleótidos seleccionados ya están en un vector que incluye secuencias control adecuadas. La célula huésped puede ser una célula eucariota superior, tal como una célula de mamífero, o una célula eucariota inferior, tal como una célula de levadura o, en algunas realizaciones, la célula huésped puede ser una célula procariota, tal como una célula bacteriana. La introducción del constructo en la célula huésped puede realizarse mediante transfección con fosfato de calcio, transfección mediada por DEAE-Dextrano o electroporación. The selected and isolated polynucleotides as described above are introduced into a suitable host cell. A suitable host cell is any cell that is capable of promoting recombination and / or reductive rearrangement. In some embodiments, the selected polynucleotides are already in a vector that includes suitable control sequences. The host cell may be an upper eukaryotic cell, such as a mammalian cell, or a lower eukaryotic cell, such as a yeast cell, or, in some embodiments, the host cell may be a prokaryotic cell, such as a bacterial cell. The introduction of the construct into the host cell can be carried out by transfection with calcium phosphate, DEAE-Dextran-mediated transfection or electroporation.

Ejemplos de huéspedes incluyen células bacterianas, tales como E. coli, Streptomyces, Salmonella typhimurium; células fúngicas, tales como levadura; células de insecto, tales como Drosophila S2 y Spodoptera Sf9; células animales, tales como CHO, COS o melanoma de Bowes; adenovirus; y células vegetales; ver detalles más arriba. Se considera que la selección de un huésped apropiado se encuentra dentro del alcance de los expertos en la técnica a partir de las enseñanzas de la presente. Examples of hosts include bacterial cells, such as E. coli, Streptomyces, Salmonella typhimurium; fungal cells, such as yeast; insect cells, such as Drosophila S2 and Spodoptera Sf9; animal cells, such as CHO, COS, or Bowes melanoma; adenovirus; and plant cells; see details above. Selection of an appropriate host is considered to be within the scope of those skilled in the art from the teachings herein.

Pueden emplearse varios sistemas de cultivo de células de mamífero para expresar proteína recombinante; ejemplos de sistemas de expresión de mamíferos incluyen las líneas COS-7 de fibroblastos de riñón de mono descritas en “SV40-transformed simian cells support the replication of early SV40 mutants” (Gluzman, 1981) y otras líneas celulares capaces de expresar un vector compatible, por ejemplo, las líneas celulares C127, 3T3, CHO, HeLa y BHK. Los vectores de expresión de mamíferos pueden comprender un origen de replicación, un promotor y potenciador adecuado y también los sitios de unión a ribosomas, sitios de poliadenilación, sitios donantes y aceptores de empalmes, secuencias de terminación transcripcional y secuencias no transcritas flanqueadoras 5' que se necesiten. Pueden usarse secuencias de ADN derivadas del empalme SV40 y los sitios de poliadenilación para proporcionar los elementos genéticos no transcritos necesarios. Various mammalian cell culture systems can be employed to express recombinant protein; examples of mammalian expression systems include the monkey kidney fibroblast COS-7 lines described in "SV40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1981) and other cell lines capable of expressing a compatible vector for example, the C127, 3T3, CHO, HeLa and BHK cell lines. Mammalian expression vectors can comprise a suitable origin of replication, a promoter and enhancer and also ribosome binding sites, polyadenylation sites, splice donor and acceptor sites, transcriptional termination sequences and 5 'flanking non-transcribed sequences that are needed. DNA sequences derived from the SV40 junction and polyadenylation sites can be used to provide the necessary untranscribed genetic elements.

En otras realizaciones se usan ácidos nucleicos, polipéptidos y métodos divulgados en la presente en vías bioquímicas o para generar novedosos polinucleótidos que codifiquen vías bioquímicas de uno o más operones o agrupamientos de genes de los mismos. Por ejemplo, las bacterias y muchos eucariotas tienen un mecanismo coordinado para regular genes cuyos productos participan en procesos relacionados. Los genes se agrupan en estructuras denominadas “agrupamientos de genes” en un solo cromosoma y se transcriben juntos bajo el control de una sola secuencia reguladora, incluido un solo promotor que inicia la transcripción de todo el agrupamiento. De esta forma, un agrupamiento de genes es un grupo de genes adyacentes que son idénticos o están relacionados, generalmente en cuanto a su función (un ejemplo de vía bioquímica codificada por un agrupamiento de genes son los policétidos). In other embodiments, nucleic acids, polypeptides, and methods disclosed herein are used in biochemical pathways or to generate novel polynucleotides encoding biochemical pathways of one or more operons or gene clusters thereof. For example, bacteria and many eukaryotes have a coordinated mechanism to regulate genes whose products participate in related processes. Genes are grouped into structures called "gene clusters" on a single chromosome and transcribed together under the control of a single regulatory sequence, including a single promoter that initiates transcription of the entire cluster. Thus, a gene cluster is a group of adjacent genes that are identical or related, generally in terms of their function (an example of a biochemical pathway encoded by a gene cluster is polyketides).

En algunas realizaciones, el ADN del agrupamiento de genes se aísla de diferentes organismos y se liga en vectores, tales como vectores que contienen secuencias reguladoras de la expresión que pueden controlar y regular la producción de una actividad de proteína o arreglo relacionado de proteína detectable de los agrupamientos de genes ligados. El uso de vectores que tienen una capacidad excepcionalmente grande para la introducción de ADN exógeno puede ser apropiado para su uso con dichos agrupamientos de genes y se describen a modo de ejemplo en la presente de forma de incluir el factor f (o factor de fertilidad) de E. coli. Este factor f de E. coli es un plásmido que afecta la transferencia de alta frecuencia de sí mismo durante la conjugación y es ideal para obtener y propagar establemente grandes fragmentos de ADN, tales como agrupamientos de genes de muestras microbianas mezcladas. En una realización se usan vectores de clonación, denominados “fósmidos” o vectores de cromosomas artificiales bacterianos (BAC). Estos derivan del factor f de E. coli, que es capaz de integrar establemente grandes segmentos de ADN genómico. Cuando se integran con el ADN de una muestra ambiental mezclada es posible obtener grandes fragmentos genómicos en forma de una “biblioteca de ADN ambiental” estable. Otro tipo de vector para su uso es un vector cósmido. Los vectores cósmidos se diseñaron originalmente para clonar y propagar grandes segmentos de ADN genómico. La clonación en vectores cósmidos se describe detalladamente en Sambrook et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor Laboratory Press (1989). Una vez ligados a un vector apropiado, pueden introducirse en una célula huésped adecuada dos o más vectores que contengan diferentes agrupamientos de genes de sintasa de policétidos. Las regiones de homología de secuencia parcial compartidas por los agrupamientos de genes promoverán procesos que resultan en la reorganización de la secuencia, lo que resulta en un agrupamiento de genes híbrido. Posteriormente, el agrupamiento de genes híbrido novedoso puede analizarse sistemáticamente para detectar actividades mejoradas que no se encontraban en los agrupamientos de genes originales. In some embodiments, the DNA from the gene cluster is isolated from different organisms and ligated into vectors, such as vectors that contain expression regulatory sequences that can control and regulate the production of a protein activity or related protein array detectable by linked gene clusters. The use of vectors that have an exceptionally large capacity for the introduction of exogenous DNA may be appropriate for use with such gene pools and are described by way of example herein to include factor f (or fertility factor) from E. coli. This E. coli factor f is a plasmid that affects high-frequency transfer of itself during conjugation and is ideal for obtaining and stably propagating large pieces of DNA, such as gene pools from mixed microbial samples. In one embodiment, cloning vectors, called "fossils" or bacterial artificial chromosome (BAC) vectors are used. These are derived from E. coli factor f, which is capable of stably integrating large segments of genomic DNA. When integrated with the DNA of a mixed environmental sample it is possible to obtain large genomic fragments in the form of a stable "environmental DNA library". Another type of vector for use is a cosmid vector. Cosmid vectors were originally designed to clone and propagate large segments of genomic DNA. Cloning into cosmid vectors is described in detail in Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989). Once ligated to an appropriate vector, two or more vectors containing different groupings of polyketide synthase genes can be introduced into a suitable host cell. Regions of partial sequence homology shared by gene clusters will promote processes that result in sequence rearrangement, resulting in a hybrid gene cluster. Subsequently, the novel hybrid gene cluster can be systematically analyzed to detect improved activities that were not found in the original gene clusters.

Los métodos para detectar sistemáticamente las distintas actividades enzimáticas son conocidos para los expertos en la técnica y se describen en la presente memoria descriptiva (ver los Ejemplos 1, 2 y 3 más adelante. Estos métodos pueden emplearse cuando se aíslan los polipéptidos y polinucleótidos divulgados en la presente. Methods for systematically detecting various enzyme activities are known to those skilled in the art and are described herein (see Examples 1, 2 and 3 below. These methods can be used when isolating the polypeptides and polynucleotides disclosed in the present.

Existen métodos para descubrir y aislar aldolasas, tales como piruvato aldolasa, tales como HMG y/o KHG aldolasa, There are methods for discovering and isolating aldolases, such as pyruvate aldolase, such as HMG and / or KHG aldolase,

o compuestos para modificar la actividad de estas enzimas, usando un abordaje de células enteras (ver descripción más abajo). Pueden detectarse sistemáticamente clones putativos que codifican aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa de bibliotecas de ADN genómico. or compounds to modify the activity of these enzymes, using a whole cell approach (see description below). Putative aldolase-encoding clones, such as pyruvate aldolase, such as HMG and / or KHG aldolase, can be systematically detected from genomic DNA libraries.

Metodologías de detección automática y dispositivos de monitoreo "en línea" Automatic detection methodologies and "online" monitoring devices

En la puesta en práctica de los métodos divulgados en la presente pueden usarse distintos aparatos y metodologías conjuntamente con los polipéptidos y ácidos nucleicos divulgados en la presente, por ejemplo para detectar sistemáticamente polipéptidos en busca de actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, para detectar sistemáticamente compuestos como posibles moduladores, tales como activadores In the implementation of the methods disclosed herein, various apparatus and methodologies may be used in conjunction with the polypeptides and nucleic acids disclosed herein, for example, to systematically detect polypeptides for enzyme aldolase activity, such as pyruvate aldolase, such such as HMG and / or KHG aldolase, to systematically detect compounds as possible modulators, such as activators

o inhibidores, de una actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, para anticuerpos que se unen a un polipéptido divulgado en la presente, para ácidos nucleicos que se hibridan con un ácido nucleico divulgado en la presente, para detectar sistemáticamente células que expresan un polipéptido divulgado en la presente y similares. Además de los distintos formatos descritos detalladamente más adelante para detectar muestras sistemáticamente, también pueden utilizarse formatos alternativos para poner en práctica los métodos divulgados en la presente. Estos formatos incluyen, por ejemplo, espectrómetros de masas, cromatógrafos, tales como HPLC de alto rendimiento y otras formas de cromatografía líquida, y formatos más pequeños, tales como placas de 1536 pocillos, placas de 384 pocillos, etc. Pueden adaptarse y utilizarse aparatos de detección sistemática de alto rendimiento para poner en práctica los métodos divulgados en la presente. Ver las Solicitudes de Patente de los Estados Unidos Nos. 20020001809 y 20050272044. or inhibitors, of an aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, for antibodies that bind to a polypeptide disclosed herein, for nucleic acids that hybridize to a nucleic acid disclosed herein. present, to systematically detect cells expressing a polypeptide disclosed herein and the like. In addition to the various formats described in detail below for screening samples systematically, alternative formats can also be used to implement the methods disclosed herein. These formats include, for example, mass spectrometers, chromatographs, such as high-performance HPLC and other forms of liquid chromatography, and smaller formats, such as 1536-well plates, 384-well plates, etc. High performance screening devices can be adapted and used to implement the methods disclosed herein. See United States Patent Applications Nos. 20020001809 and 20050272044.

Arreglos de capilares Capillary arrangements

Los ácidos nucleicos o polipéptidos divulgados en la presente pueden inmovilizarse o aplicarse a un arreglo. Los arreglos pueden usarse para detectar sistemáticamente o para monitorear bibliotecas de composiciones (tales como pequeñas moléculas, anticuerpos, ácidos nucleicos, etc.) en busca de su capacidad de unirse o modular la actividad de un ácido nucleico o polipéptido divulgado en la presente. Los arreglos de capilares, tales como el GIGAMATRIX™, Diversa Corporation, San Diego, Calif.; y los arreglos descritos, por ejemplo, en la Solicitud de Patente de los Estados Unidos No. 20020080350 A1; WO 0231203 A; WO 0244336 A, proporcionan un aparato alternativo para sostener y detectar sistemáticamente muestras. En algunas realizaciones, el arreglo de capilares incluye una pluralidad de capilares que forman un arreglo de capilares adyacentes, en donde cada capilar comprende al menos una pared que define un lumen para retener una muestra. El lumen puede ser cilíndrico, cuadrado, hexagonal o tener cualquier otra forma geométrica, siempre que las paredes formen un lumen para la retención de un líquido o muestra. Los capilares del arreglo de capilares pueden mantenerse juntos a una distancia muy próxima para formar una estructura plana. Los capilares pueden unirse, por ejemplo fusionarse (tal como cuando los capilares están hechos de vidrio), pegarse, unirse o fijarse lado a lado. Además, el arreglo de capilares puede incluir material intersticial colocado entre capilares adyacentes en el arreglo para formar un dispositivo plano sólido que contenga una pluralidad de agujeros pasantes. The nucleic acids or polypeptides disclosed herein can be immobilized or applied to an array. The arrays can be used to systematically detect or monitor libraries of compositions (such as small molecules, antibodies, nucleic acids, etc.) for their ability to bind or modulate the activity of a nucleic acid or polypeptide disclosed herein. Capillary arrays, such as the GIGAMATRIX ™, Diversa Corporation, San Diego, Calif .; and the arrangements described, for example, in United States Patent Application No. 20020080350 A1; WO 0231203 A; WO 0244336 A, provide an alternative apparatus for systematically holding and detecting samples. In some embodiments, the capillary array includes a plurality of capillaries that form an adjacent capillary array, where each capillary comprises at least one lumen-defining wall to retain a sample. The lumen can be cylindrical, square, hexagonal or have any other geometric shape, as long as the walls form a lumen for the retention of a liquid or sample. The capillaries in the capillary array can be held together at a very close distance to form a flat structure. The capillaries can be joined, for example fused (such as when the capillaries are made of glass), glued, joined or fixed side by side. In addition, the capillary array may include interstitial material placed between adjacent capillaries in the array to form a solid flat device containing a plurality of through holes.

Un Arreglo de capilares puede formarse con cualquier cantidad de capilares individuales, por ejemplo, en un rango de 100 a 4.000.000 de capilares. Más aun, a un Arreglo de capilares que tenga aproximadamente 100.000 capilares individuales o más puede dársele el tamaño y la forma estándar de una placa Microtiter® para que pueda ajustarse a equipos de laboratorio estándar. Los lúmenes se llenan manualmente o automáticamente usando acción capilar o microinyección usando una aguja delgada. Las muestras de interés pueden retirarse posteriormente de los capilares individuales para analizar o caracterizar adicionalmente. Por ejemplo, se coloca una sonda delgada similar a una aguja en comunicación fluida con un capilar seleccionado para agregar o retirar material del lumen. A Capillary Array can be formed with any number of individual capillaries, for example, in a range of 100 to 4,000,000 capillaries. Furthermore, a Capillary Array that has approximately 100,000 individual capillaries or more can be given the standard size and shape of a Microtiter® plate to fit standard laboratory equipment. The lumens are filled manually or automatically using capillary action or microinjection using a thin needle. Samples of interest can then be removed from the individual capillaries for further analysis or characterization. For example, a thin needle-like probe is placed in fluid communication with a selected capillary to add or remove material from the lumen.

En un ensayo de detección sistemática de un solo paso, los componentes del ensayo se mezclan para dar una solución de interés antes de la inserción en el arreglo de capilares. El lumen se llena mediante acción capilar cuando al menos una porción del arreglo se sumerge en una solución de interés. Las reacciones químicas o biológicas y/o la actividad en cada capilar se monitorean en busca de eventos detectables. A menudo, un evento detectable se denomina “acierto” que normalmente puede distinguirse de capilares que producen un “no acierto” mediante detección óptica. De esta forma, los Arreglos de capilares permiten una enorme detección en paralelo de “aciertos”. In a one-step screening test, the components of the assay are mixed to give a solution of interest prior to insertion into the capillary array. The lumen is filled by capillary action when at least a portion of the array is immersed in a solution of interest. Chemical or biological reactions and / or activity in each capillary are monitored for detectable events. Often, a detectable event is called a "hit" that can usually be distinguished from capillaries that produce a "no hit" by optical detection. In this way, the capillary arrays allow enormous parallel detection of "hits".

En un ensayo de detección sistemática de múltiples pasos puede introducirse un polipéptido o ácido nucleico, tal como un ligando, en un primer componente, el cual se introduce en al menos una porción de un capilar o Arreglo de capilares. Luego puede introducirse una burbuja de aire en el capilar detrás del primer componente. Posteriormente puede introducirse un segundo componente en el capilar, en donde el segundo componente se separa del primer componente mediante la burbuja de aire. El primer y el segundo componente pueden mezclarse luego mediante la aplicación de presión hidrostática en ambos lados del arreglo de capilar para hacer colapsar la burbuja. El arreglo de capilares luego puede monitorearse en busca de un evento detectable que resulte de la reacción o no reacción de los dos componentes. In a multi-step screening test, a polypeptide or nucleic acid, such as a ligand, can be introduced into a first component, which is introduced into at least a portion of a capillary or capillary array. Then an air bubble can be introduced into the capillary behind the first component. Subsequently, a second component can be introduced into the capillary, where the second component is separated from the first component by the air bubble. The first and second components can then be mixed by applying hydrostatic pressure on both sides of the capillary arrangement to collapse the bubble. The capillary arrangement can then be monitored for a detectable event that results from the reaction or non-reaction of the two components.

En un ensayo de detección sistemática de unión puede introducirse una muestra de interés como un primer líquido etiquetado con una partícula detectable en un capilar o arreglo de capilares, en donde el lumen del capilar está recubierto con un material de unión para unir la partícula detectable al lumen. Luego, el primer líquido puede retirarse del tubo capilar, con lo que la partícula detectable unida se mantiene dentro del capilar, y posteriormente puede introducirse un segundo líquido en el tubo capilar. El capilar luego puede monitorearse en busca de un evento detectable que resulte de la reacción o no reacción de la partícula con el segundo líquido. In a binding screening test, a sample of interest may be introduced as a first liquid labeled with a detectable particle into a capillary or capillary arrangement, where the capillary lumen is coated with a binding material to bind the detectable particle to the lumen. The first liquid can then be withdrawn from the capillary, whereby the attached detectable particle is held within the capillary, and a second liquid can subsequently be introduced into the capillary. The capillary can then be monitored for a detectable event that results from the reaction or non-reaction of the particle with the second liquid.

Arreglos o “Biochips” Fixes or "Biochips"

Los ácidos nucleicos o polipéptidos divulgados en la presente pueden inmovilizarse o aplicarse a un arreglo. Los arreglos pueden usarse para detectar sistemáticamente o para monitorear bibliotecas de composiciones (tales como pequeñas moléculas, anticuerpos, ácidos nucleicos, etc.) en busca de su capacidad de unirse o modular la actividad de un ácido nucleico o polipéptido divulgado en la presente. Por ejemplo, un parámetro monitoreado es expresión de transcrito de un gen de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa. Uno o más o todos los transcritos de una célula pueden medirse mediante hibridación de una muestra que comprende transcritos de la célula o ácidos nucleicos representativos de una célula o complementarios a transcritos de una célula, mediante hibridación con ácidos nucleicos inmovilizados en un arreglo o “biochip.” Mediante el uso de un “arreglo” de ácidos nucleicos en un microchip es posible cuantificar simultáneamente algunos o la totalidad de los transcritos. Alternativamente, los arreglos que comprenden ácido nucleico genómico también pueden usarse para determinar el genotipo de una cepa recientemente manipulada obtenida mediante los métodos divulgados en la presente. También pueden usarse "arreglos de polipéptidos” para cuantificar simultáneamente una pluralidad de proteínas. El presente método puede ponerse en práctica con cualquier “arreglo” conocido, también denominado “microarreglo” o “arreglo de ácidos nucleicos” o “arreglo de polipéptidos” o “arreglo de anticuerpos” o “biochip”, o una variación del mismo. Los arreglos son genéricamente una pluralidad de “lugares” o “elementos objetivo”, comprendiendo cada elemento objetivo una cantidad definida de una o más moléculas biológicas, tales como oligonucleótidos, inmovilizadas sobre un área definida de una superficie de sustrato para la unión específica a una molécula de muestra, tal como transcritos de ARNm. The nucleic acids or polypeptides disclosed herein can be immobilized or applied to an array. The arrays can be used to systematically detect or monitor libraries of compositions (such as small molecules, antibodies, nucleic acids, etc.) for their ability to bind or modulate the activity of a nucleic acid or polypeptide disclosed herein. For example, a monitored parameter is transcript expression of an aldolase enzyme gene, such as pyruvate aldolase, HMG, and / or KHG aldolase. One or more or all of the transcripts in a cell can be measured by hybridization of a sample comprising cell transcripts or nucleic acids representative of a cell or complementary to transcripts of a cell, by hybridization with nucleic acids immobilized in an array or "biochip". . " By using a nucleic acid "array" on a microchip it is possible to simultaneously quantify some or all of the transcripts. Alternatively, arrays comprising genomic nucleic acid can also be used to determine the genotype of a recently engineered strain obtained by the methods disclosed herein. "Polypeptide arrays" can also be used to simultaneously quantify a plurality of proteins. The present method can be practiced with any known "array", also called a "microarray" or "nucleic acid array" or "polypeptide array" or " antibody array "or" biochip ", or a variation thereof. Arrays are generically a plurality of" sites "or" target elements ", each target element comprising a defined amount of one or more biological molecules, such as oligonucleotides, immobilized on a defined area of a substrate surface for specific binding to a sample molecule, such as mRNA transcripts.

Los términos “arreglo” o “microarreglo” o “biochip” o “chip”, tal como se usan en la presente, son una pluralidad de elementos objetivo, comprendiendo cada elemento objetivo una cantidad definida de uno o más polipéptidos (incluidos anticuerpos) o ácidos nucleicos inmovilizados sobre un área definida de una superficie de sustrato, tal como detalla más adelante. The terms "array" or "microarray" or "biochip" or "chip", as used herein, are a plurality of target elements, each target element comprising a defined amount of one or more polypeptides (including antibodies) or nucleic acids immobilized on a defined area of a substrate surface, as detailed below.

En la puesta en práctica de los métodos divulgados en la presente puede incorporarse cualquier arreglo y/o método para fabricar y usar arreglos en todo o en parte, o variaciones de los mismos, tal como se describe, por ejemplo, en las Patentes de los Estados Unidos Nos. 6.277.628; 6.277.489; 6.261.776; 6.258.606; 6.054.270; 6.048.695; 6.045.996; 6.022.963; 6.013.440; 5.965.452; 5.959.098; 5.856.174; 5.830.645; 5.770.456; 5.632.957; 5.556.752; 5.143.854; 5.807.522; 5.800.992; 5.744.305; 5.700.637; 5.556.752; 5.434.049; ver también otros documentos, tales como WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958; ver también otras publicaciones, tales como Johnston (1998) Curr. Biol. 8:R171-R174; Schummer (1997) Biotechniques 23:1087-1092; Kern (1997) Biotechniques 23:120-124; Solinas-Toldo (1997) Genes, Chromosomes & Cancer 20:399-407; Bowtell (1999) Nature Genetics Supp. 21:25-32. Ver también las Solicitudes de Patente de los Estados Unidos Publicadas Nos. 20010018642; 20010019827; 20010016322; 20010014449; 20010014448; 20010012537; 20010008765. In practicing the methods disclosed herein, any arrangement and / or method for manufacturing and using arrangements in whole or in part, or variations thereof, may be incorporated as described, for example, in United States Nos. 6,277,628; 6,277,489; 6,261,776; 6,258,606; 6,054,270; 6,048,695; 6,045,996; 6,022,963; 6,013,440; 5,965,452; 5,959,098; 5,856,174; 5,830,645; 5,770,456; 5,632,957; 5,556,752; 5,143,854; 5,807,522; 5,800,992; 5,744,305; 5,700,637; 5,556,752; 5,434,049; see also other documents, such as WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958; see also other publications, such as Johnston (1998) Curr. Biol. 8: R171-R174; Schummer (1997) Biotechniques 23: 1087-1092; Kern (1997) Biotechniques 23: 120-124; Solinas-Toldo (1997) Genes, Chromosomes & Cancer 20: 399-407; Bowtell (1999) Nature Genetics Supp. 21: 25-32. See also United States Patent Applications Published Nos. 20010018642; 20010019827; 20010016322; 20010014449; 20010014448; 20010012537; 20010008765.

Anticuerpos y métodos de detección sistemática basados en anticuerpos Antibodies and antibody-based screening methods

Existen anticuerpos aislados, sintéticos o recombinantes que se unen específicamente a una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgada en la presente. Pueden usarse estos anticuerpos para aislar, identificar o cuantificar las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgadas en la presente o polipéptidos relacionados. Estos anticuerpos pueden usarse para aislar otros polipéptidos dentro del alcance de la divulgación u otras enzimas aldolasa relacionadas, tales como piruvato aldolasa, tal como HMG y/o KHG aldolasa. Los anticuerpos pueden diseñarse para unirse a un sitio activo de una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. De esta forma, existen métodos para inhibir enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa usando los anticuerpos divulgados en la presente (ver descripción más arriba con respecto a aplicaciones para composiciones de enzimas anti-aldolasa, tal como anti-piruvato aldolasa, tal como anti-HMG y/o anti-KHG aldolasa divulgadas en la presente). There are isolated, synthetic or recombinant antibodies that specifically bind to an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase, disclosed herein. These antibodies can be used to isolate, identify, or quantify aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein or related polypeptides. These antibodies can be used to isolate other polypeptides within the scope of the disclosure or other related aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase. Antibodies can be designed to bind to an active site of an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase. Thus, there are methods to inhibit aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase using the antibodies disclosed herein (see description above regarding applications for anti-aldolase enzyme compositions, such as anti-pyruvate aldolase, such as anti-HMG and / or anti-KHG aldolase disclosed herein).

El término “anticuerpo” incluye un péptido o polipéptido derivado o modelado de, o básicamente codificado por, un gen de inmunoglobulina o genes de inmunoglobulina, o fragmentos de los mismos, capaz de unirse específicamente a un antígeno o epítopo, ver Fundamental Immunology, Third Edition, W. E. Paul, ed., Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25:85-97. El término anticuerpo incluye porciones que se unen a antígenos, es decir, “sitios de unión a antígenos” (tales como fragmentos, subsecuencias, regiones determinantes de la complementariedad (CDR)) que retienen la capacidad de unirse al antígeno, incluidos (i) un fragmento Fab, un fragmento monovalente que consiste en los dominios VL, VH, CL y CH1; (ii) un fragmento F(ab')2, un fragmento bivalente que comprende dos fragmentos Fab enlazados por un puente de disulfuro en la región bisagra; (iii) un fragmento Fd que consiste en los dominios VH y CH1; (iv) un fragmento Fv que consiste en los dominios VL y VH de un solo brazo de un anticuerpo, (v) un fragmento dAb (Ward et al., (1989) Nature 341:544-546), que consiste en un dominio VH; y (vi) una región determinante de la complementariedad (CDR) aislada. También se incluyen como referencia anticuerpos de cadena simple en el término “anticuerpo”. The term "antibody" includes a peptide or polypeptide derived or modeled from, or encoded by, an immunoglobulin gene or immunoglobulin genes, or fragments thereof, capable of specifically binding to an antigen or epitope, see Fundamental Immunology, Third Edition, WE Paul, ed., Raven Press, NY (1993); Wilson (1994) J. Immunol. Methods 175: 267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25: 85-97. The term antibody includes portions that bind to antigens, ie, "antigen binding sites" (such as fragments, subsequences, complementarity determining regions (CDRs)) that retain the ability to bind to the antigen, including (i) a Fab fragment, a monovalent fragment consisting of the VL, VH, CL and CH1 domains; (ii) an F (ab ') 2 fragment, a bivalent fragment comprising two Fab fragments linked by a disulfide bridge in the hinge region; (iii) an Fd fragment consisting of the VH and CH1 domains; (iv) an Fv fragment consisting of the single arm VL and VH domains of an antibody, (v) a dAb fragment (Ward et al., (1989) Nature 341: 544-546), consisting of a domain VH; and (vi) an isolated Complementarity Determining Region (CDR). Single chain antibodies are also included by reference in the term "antibody".

Existen fragmentos de las enzimas divulgadas en la presente (tales como péptidos), incluidos fragmentos inmunogénicos (tales como subsecuencias) de un polipéptido divulgado en la presente. También existen composiciones que comprenden un polipéptido o péptido divulgado en la presente y adyuvantes o portadores y similares. There are fragments of the enzymes disclosed herein (such as peptides), including immunogenic fragments (such as subsequences) of a polypeptide disclosed herein. There are also compositions comprising a polypeptide or peptide disclosed herein and adjuvants or carriers and the like.

Los anticuerpos pueden usarse en inmunoprecipitación, tinción, columnas de inmunoafinidad y similares. Si se desea, las secuencias de ácidos nucleicos que codifican antígenos específicos pueden generarse mediante inmunización con posterior aislamiento de polipéptido o ácido nucleico, amplificación o clonación e inmovilización de polipéptido sobre un arreglo divulgado en la presente. Alternativamente, los métodos divulgados en la presente pueden usarse para modificar la estructura de un anticuerpo producido por una célula que ha de ser modificada, tal como aumentar o disminuir la afinidad de un anticuerpo. Más aun, la capacidad de hacer o modificar anticuerpos puede ser un fenotipo manipulado e introducido en una célula mediante los métodos divulgados en la presente. Antibodies can be used in immunoprecipitation, staining, immunoaffinity columns, and the like. If desired, nucleic acid sequences encoding specific antigens can be generated by immunization with subsequent isolation of polypeptide or nucleic acid, amplification or cloning, and immobilization of polypeptide on an array disclosed herein. Alternatively, the methods disclosed herein can be used to modify the structure of an antibody produced by a cell to be modified, such as increasing or decreasing the affinity of an antibody. Furthermore, the ability to make or modify antibodies can be a phenotype manipulated and introduced into a cell by the methods disclosed herein.

Los métodos de inmunización, producción y aislamiento de anticuerpos (policlonales y monoclonales) son conocidos para los expertos en la técnica y se describen en la bibliografía científica y de patentes; ver Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Stites (eds.) BASIC AND CLINICAL IMMUNOLOGY (7th ed.) Lange Medical Publications, Los Altos, Calif. (“Stites”); Goding, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2a ed.) Academic Press, New York, N.Y. (1986); Kohler (1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, New York. También pueden generarse anticuerpos in vitro, tal como mediante el uso de sitios de unión a anticuerpos recombinantes que expresan bibliotecas de exhibición de fagos, además de los métodos in vivo tradicionales que usan animales. Ver Hoogenboom (1997) Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26:27-45. Antibody immunization, production and isolation methods (polyclonal and monoclonal) are known to those skilled in the art and are described in the scientific and patent literature; see Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley / Greene, NY (1991); Stites (eds.) BASIC AND CLINICAL IMMUNOLOGY (7th ed.) Lange Medical Publications, Los Altos, Calif. ("Stites"); Goding, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2nd ed.) Academic Press, New York, N.Y. (1986); Kohler (1975) Nature 256: 495; Harlow (1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, New York. Antibodies can also be generated in vitro, such as by using recombinant antibody binding sites that express phage display libraries, in addition to traditional in vivo methods using animals. See Hoogenboom (1997) Trends Biotechnol. 15: 62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26: 27-45.

Los polipéptidos divulgados en la presente o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de los mismos también pueden usarse para generar anticuerpos que se unan específicamente a los polipéptidos o fragmentos. Los anticuerpos resultantes pueden usarse en procedimientos de cromatografía de inmunoafinidad para aislar o purificar el polipéptido o para determinar si el polipéptido está presente en una muestra biológica. En estos procedimientos, una preparación de proteína, tal como un extracto, o una muestra biológica se pone en contacto con un anticuerpo capaz de unirse específicamente a uno de los péptidos divulgados en la presente, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de los mismos. The polypeptides disclosed herein or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 or 150 consecutive amino acids thereof can also be used to generate antibodies that specifically bind to the polypeptides or fragments. The resulting antibodies can be used in immunoaffinity chromatography procedures to isolate or purify the polypeptide or to determine if the polypeptide is present in a biological sample. In these procedures, a protein preparation, such as an extract, or a biological sample is contacted with an antibody capable of specifically binding to one of the peptides disclosed herein, or fragments comprising at least 5, 10, 15 , 20, 25, 30, 35, 40, 50, 75, 100 or 150 consecutive amino acids thereof.

En procedimientos de inmunoafinidad, el anticuerpo se fija a un soporte sólido, tal como una perla u otra matriz en columna. La preparación de proteína se coloca en contacto con el anticuerpo en condiciones en las que el anticuerpo se une específicamente a uno de los polipéptidos divulgados en la presente o un fragmento del mismo. Después de un lavado para retirar las proteínas no específicamente unidas, los polipéptidos unidos específicamente se eluyen. In immunoaffinity procedures, the antibody is attached to a solid support, such as a bead or other column matrix. The protein preparation is placed in contact with the antibody under conditions where the antibody specifically binds to one of the polypeptides disclosed herein or a fragment thereof. After washing to remove non-specifically bound proteins, specifically bound polypeptides are eluted.

La capacidad de las proteínas en una muestra biológica de unirse al anticuerpo puede determinarse usando distintos procedimientos conocidos para los expertos en la técnica. Por ejemplo, la unión puede determinarse etiquetando el anticuerpo con una etiqueta detectable, tal como un agente fluorescente, una etiqueta enzimática o un radioisótopo. Alternativamente, la unión del anticuerpo a la muestra puede detectarse usando un anticuerpo secundario que tenga dicha etiqueta detectable en el mismo. Ensayos particulares incluyen ensayos de ELISA, ensayos tipo sándwich, radioinmunoensayos y Western Blots. The ability of proteins in a biological sample to bind to the antibody can be determined using various procedures known to those of skill in the art. For example, binding can be determined by labeling the antibody with a detectable label, such as a fluorescent agent, an enzyme label, or a radioisotope. Alternatively, binding of the antibody to the sample can be detected using a secondary antibody having such a detectable label thereon. Particular assays include ELISA assays, sandwich assays, radioimmunoassays, and Western Blots.

Los anticuerpos policlonales generados contra los polipéptidos divulgados en la presente, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de los mismos, pueden obtenerse mediante inyección directa de los polipéptidos en un animal o administrando los polipéptidos a un animal, por ejemplo, un animal no humano. El anticuerpo así obtenido puede unirse al polipéptido. De esta manera puede usarse incluso una secuencia que codifique solamente un fragmento del polipéptido para generar anticuerpos que puedan unirse a la totalidad del polipéptido nativo. Dichos anticuerpos pueden usarse para aislar el polipéptido de las células que expresan ese polipéptido. Polyclonal antibodies raised against the polypeptides disclosed herein, or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, or 150 consecutive amino acids thereof, can be obtained by direct injection of the polypeptides into an animal or by administering the polypeptides to an animal, eg, a non-human animal. The thus obtained antibody can bind to the polypeptide. In this way, even a sequence encoding only a fragment of the polypeptide can be used to generate antibodies that can bind to the entire native polypeptide. Such antibodies can be used to isolate the polypeptide from cells that express that polypeptide.

Para la preparación de anticuerpos monoclonales puede usarse cualquier técnica que proporcione anticuerpos producidos por cultivos de líneas celulares continuos. Ejemplos incluyen la técnica del hibridoma (Kohler and Milstein, Nature, 256:495-497, 1975), la técnica del trioma, la técnica del hibridoma de células B humano (Kozbor et al., Immunology Today 4:72, 1983) y la técnica de EBV-hibridoma (Cole, et al., 1985, in Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96). For the preparation of monoclonal antibodies, any technique that provides antibodies produced by cultures of continuous cell lines can be used. Examples include the hybridoma technique (Kohler and Milstein, Nature, 256: 495-497, 1975), the trioma technique, the human B cell hybridoma technique (Kozbor et al., Immunology Today 4:72, 1983) and the EBV-hybridoma technique (Cole, et al., 1985, in Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96).

Pueden adaptarse técnicas descritas para la producción de anticuerpos monocatenarios (Pat. de los Estados Unidos No. 4.946.778) para producir anticuerpos monocatenarios para los polipéptidos divulgados en la presente, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de los mismos. Alternativamente, pueden usarse ratones transgénicos para expresar anticuerpos humanizados para estos polipéptidos o fragmentos de los mismos. Techniques described for the production of single-chain antibodies (US Pat. No. 4,946,778) can be adapted to produce single-chain antibodies to the polypeptides disclosed herein, or fragments comprising at least 5, 10, 15, 20, 25 , 30, 35, 40, 50, 75, 100 or 150 consecutive amino acids thereof. Alternatively, transgenic mice can be used to express humanized antibodies to these polypeptides or fragments thereof.

Los anticuerpos generados contra los polipéptidos divulgados en la presente, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de los mismos, pueden usarse para detectar sistemáticamente polipéptidos de otros organismos y muestras. En estas técnicas, los polipéptidos del organismo se ponen en contacto con el anticuerpo y se detectan aquellos polipéptidos que se unen específicamente al anticuerpo. Puede usarse cualquiera de los procedimientos descritos anteriormente para detectar la unión a anticuerpos. Uno de dichos ensayos de detección sistemática se describe en Shulman H, Eberhard A, Eberhard C, Ulitzur S, Keinan E, Bioorg Med Chem. Lett. 2000 Oct. 16; 10(20):2353-6, Highly sensitive and rapid detection of antibody catalysis by luminescent bacteria. Antibodies generated against the polypeptides disclosed herein, or fragments comprising at least 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, or 150 consecutive amino acids thereof, can be used to detect systematically polypeptides from other organisms and samples. In these techniques, the polypeptides of the body are contacted with the antibody and those polypeptides that specifically bind to the antibody are detected. Any of the procedures described above can be used to detect binding to antibodies. One such screening test is described in Shulman H, Eberhard A, Eberhard C, Ulitzur S, Keinan E, Bioorg Med Chem. Lett. 2000 Oct. 16; 10 (20): 2353-6, Highly sensitive and rapid detection of antibody catalysis by luminescent bacteria.

Kits Kits

También existen kits que comprenden las composiciones, tales como ácidos nucleicos, cassettes de expresión, vectores, células, semillas o plantas o partes de plantas transgénicas, polipéptidos (tales como una enzima aldolasa) y/o anticuerpos divulgados en la presente. Los kits también contienen material instructivo que enseña las metodologías y los usos industriales, médicos y dietéticos divulgados en la presente, tal como se describe en la presente. There are also kits comprising the compositions, such as nucleic acids, expression cassettes, vectors, cells, seeds or transgenic plants or plant parts, polypeptides (such as an aldolase enzyme) and / or antibodies disclosed herein. The kits also contain instructional material that teaches the industrial, medical, and dietary uses and methodologies disclosed herein, as described herein.

Manipulación de células enteras y parámetros metabólicos de medición Whole cell manipulation and measurement metabolic parameters

Los métodos divulgados en la presente proporcionan la evolución de células enteras, o la manipulación de células enteras, de una célula para desarrollar una nueva cepa que tenga un nuevo fenotipo, tal como una actividad nueva o modificada de aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, mediante modificación de la composición genética de la célula. Ver la solicitud de Patente de los Estados Unidos No. 20040033975. The methods disclosed herein provide for the evolution of whole cells, or the manipulation of whole cells, of a cell to develop a new strain having a new phenotype, such as new or modified aldolase activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase, by modifying the genetic makeup of the cell. See United States Patent Application No. 20040033975.

La composición genética puede modificarse mediante la adición a la célula de un ácido nucleico divulgado en la presente, tal como una secuencia codificadora para una enzima divulgada en la presente. Ver WO0229032 y WO0196551. The genetic makeup can be modified by adding to the cell a nucleic acid disclosed herein, such as a coding sequence for an enzyme disclosed herein. See WO0229032 and WO0196551.

Para detectar un nuevo fenotipo, al menos un parámetro metabólico de una célula modificada se monitorea en la célula en “tiempo real” o “en línea”. En algunas realizaciones se monitorea en “tiempo real” o “en línea” una pluralidad de células, tal como un cultivo celular. En algunas realizaciones se monitorea en “tiempo real” o “en línea” una pluralidad de parámetros metabólicos. Los parámetros metabólicos pueden monitorearse usando las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgadas en la presente. To detect a new phenotype, at least one metabolic parameter of a modified cell is monitored in the cell in "real time" or "online". In some embodiments, a plurality of cells, such as a cell culture, are monitored in "real time" or "online". In some embodiments, a plurality of metabolic parameters are monitored in "real time" or "online". Metabolic parameters can be monitored using the aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein.

El análisis de flujos metabólicos (MFA) se basa en un marco de trabajo bioquímico conocido. Se construye una matriz metabólica linealmente independiente en base a la ley de la conservación de la masa y en la hipótesis del estado pseudoestacionario (PSSH) en los metabolitos intracelulares. En la puesta en práctica de los métodos divulgados en la presente se establecen redes metabólicas, incluyendo: Metabolic Flow Analysis (MFA) is based on a known biochemical framework. A linearly independent metabolic matrix is constructed based on the law of conservation of mass and on the hypothesis of the pseudo-stationary state (PSSH) in intracellular metabolites. In the implementation of the methods disclosed herein, metabolic networks are established, including:

--
identidad de todos los sustratos, productos y metabolitos intermedios de las vías  identity of all substrates, products and intermediate metabolites of the pathways

--
identidad de todas las reacciones químicas que interconvierten los metabolitos de las vías, la estequiometría de las reacciones de las vías,  identity of all chemical reactions that interconvert pathway metabolites, stoichiometry of pathway reactions,

--
la identidad de todas las enzimas que catalizan las reacciones, la cinética de las reacciones enzimáticas,  the identity of all the enzymes that catalyze the reactions, the kinetics of the enzymatic reactions,

--
las interacciones reguladoras entre componentes de las vías, tales como interacciones alostéricas, interacciones enzima-enzima, etc.,  regulatory interactions between pathway components, such as allosteric interactions, enzyme-enzyme interactions, etc.,

--
la compartimentalización intracelular de enzimas o cualquier otra organización supramolecular de las enzimas y  intracellular compartmentalization of enzymes or any other supramolecular organization of enzymes, and

--
la presencia de cualquier gradiente de concentración de metabolitos, enzimas o moléculas efectoras o barreras de difusión de su movimiento.  the presence of any concentration gradient of metabolites, enzymes or effector molecules or diffusion barriers of its movement.

Una vez construida la red metabólica para una cepa en particular puede introducirse la presentación matemática mediante noción de matriz para estimar los flujos metabólicos intracelulares si los datos metabolómicos en línea están disponibles. El fenotipo metabólico depende de los cambios de la totalidad de la red metabólica dentro de una célula. El fenotipo metabólico depende de cambios en la utilización de las vías con respecto a condiciones ambientales, regulación genética, estado de desarrollo del genotipo, etc. En algunas realizaciones de los métodos divulgados en la presente, luego del cálculo del MFA en línea, el comportamiento dinámico de las células, su fenotipo y otras propiedades se analizan investigando la utilización de las vías. Por ejemplo, si el suministro de glucosa aumenta y el oxígeno disminuye durante la fermentación de la levadura, la utilización de las vías respiratorias se reducirá y/o detendrá y dominará la utilización de las vías de fermentación. El control del estado fisiológico de los cultivos celulares serán posibles después del análisis de las vías. Los métodos divulgados en la presente pueden ayudar a determinar cómo manipular la fermentación mediante la determinación de cómo cambiar el suministro, la temperatura, el uso de inductores, etc. del sustrato para controlar el estado fisiológico de las células para moverse en la dirección deseable. En la puesta en práctica de los métodos divulgados en la presente, los resultados del MFA también pueden compararse con los datos de transcriptoma y proteoma para diseñar experimentos y protocolos para la manipulación metabólica o la transposición de genes, etc. Once the metabolic network for a particular strain has been constructed, the mathematical presentation can be introduced using the notion of matrix to estimate intracellular metabolic fluxes if online metabolomic data is available. The metabolic phenotype depends on changes in the entire metabolic network within a cell. The metabolic phenotype depends on changes in the use of the pathways with respect to environmental conditions, genetic regulation, state of development of the genotype, etc. In some embodiments of the methods disclosed herein, after calculating the MFA online, the dynamic behavior of the cells, their phenotype, and other properties are analyzed by investigating the use of the pathways. For example, if glucose supply increases and oxygen decreases during yeast fermentation, airway utilization will decrease and / or stop and dominate fermentation pathway utilization. Control of the physiological status of cell cultures will be possible after analysis of the pathways. The methods disclosed herein can help determine how to manipulate fermentation by determining how to change supply, temperature, use of inductors, etc. of the substrate to monitor the physiological state of the cells to move in the desirable direction. In implementing the methods disclosed herein, the MFA results can also be compared with the transcriptome and proteome data to design experiments and protocols for metabolic manipulation or gene transposition, etc.

En la puesta en práctica de los métodos divulgados en la presente puede conferirse y detectarse cualquier fenotipo modificado o nuevo, incluidas características nuevas o mejoradas en la célula. Puede monitorearse cualquier aspecto del metabolismo o crecimiento. In practicing the methods disclosed herein, any new or modified phenotype can be conferred and detected, including new or improved characteristics in the cell. Any aspect of metabolism or growth can be monitored.

Monitoreo de la expresión de un transcrito de ARNm Monitoring the expression of an mRNA transcript

En algunas realizaciones, el fenotipo manipulado comprende aumentar o reducir la expresión de un transcrito de ARNm (tal como un mensaje de enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa) o generar nuevos transcritos (tal como enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) en una célula. Esta expresión aumentada o reducida puede rastrearse mediante pruebas en busca de la presencia de una enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa de acuerdo con la invención o mediante ensayos de la actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. También pueden detectarse y cuantificarse transcritos de ARNm, o mensajes, mediante cualquier método conocido en la técnica, tales como Northern blot, reacciones de amplificación cuantitativa, hibridación con arreglos y similares. Las reacciones de amplificación cuantitativa incluyen, por ejemplo, PCR cuantitativa, incluida, por ejemplo, la reacción en cadena de polimerasa con transcripción inversa cuantitativa o RT-PCR; RT-PCR cuantitativa en tiempo real o “RT-PCR cinética en tiempo real” (ver Kreuzer (2001) Br. J. Haematol. 114:313-318; Xia (2001) Transplantation 72:907-914). In some embodiments, the manipulated phenotype comprises increasing or decreasing the expression of an mRNA transcript (such as an aldolase enzyme message, such as pyruvate aldolase, HMG and / or KHG aldolase) or generating new transcripts (such as aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase) in a cell. This increased or decreased expression can be traced by tests for the presence of an aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase according to the invention, or by assays for aldolase enzyme activity, such as pyruvate aldolase, such as HMG and / or KHG aldolase. MRNA transcripts, or messages, can also be detected and quantified by any method known in the art, such as Northern blotting, quantitative amplification reactions, hybridization with arrays, and the like. Quantitative amplification reactions include, for example, quantitative PCR, including, for example, the polymerase chain reaction with quantitative reverse transcription or RT-PCR; Quantitative real-time RT-PCR or "real-time kinetic RT-PCR" (see Kreuzer (2001) Br. J. Haematol. 114: 313-318; Xia (2001) Transplantation 72: 907-914).

En algunas realizaciones, el fenotipo manipulado es generado desactivando la expresión de un gen homólogo. La secuencia codificadora o uno o más elementos de control transcripcional del gen, tal como promotores o potenciadores, pueden desactivarse. De esta forma, la expresión de un transcrito puede eliminarse completamente o solo reducirse. In some embodiments, the manipulated phenotype is generated by disabling the expression of a homologous gene. The coding sequence or one or more transcriptional control elements of the gene, such as promoters or enhancers, can be turned off. In this way, the expression of a transcript can be completely eliminated or only reduced.

En algunas realizaciones, el fenotipo manipulado comprende aumentar la expresión de un gen homólogo. Esto puede llevarse a cabo desactivando un elemento de control negativo, incluido un elemento regulador transcripcional que actúa en cis- o trans-, o mutagenizando un elemento de control positivo. Uno o más o todos los transcriptos de una célula pueden medirse mediante hibridación de una muestra que comprende transcriptos de la célula o ácidos nucleicos que representan o complementan transcriptos de una célula, mediante hibridación de ácidos nucleicos inmovilizados en un arreglo. In some embodiments, the manipulated phenotype comprises increasing the expression of a homologous gene. This can be accomplished by deactivating a negative control element, including a cis- or trans-acting transcriptional regulatory element, or by mutagenizing a positive control element. One or more or all of the transcripts in a cell can be measured by hybridization of a sample comprising cell transcripts or nucleic acids that represent or complement transcripts of a cell, by hybridization of immobilized nucleic acids in an array.

Monitoreo de la expresión de polipéptidos, péptidos y aminoácidos Monitoring the expression of polypeptides, peptides and amino acids

En algunas realizaciones, el fenotipo manipulado comprende aumentar o reducir la expresión de un polipéptido (tal como una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa) o generar nuevos polipéptidos en una célula. Esta expresión aumentada o reducida puede rastrearse determinando la cantidad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa presente o mediante ensayos de actividad de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa. También pueden detectarse y cuantificarse polipéptidos, péptidos y aminoácidos mediante cualquier método conocido en la técnica, incluidos, por ejemplo, resonancia magnética nuclear (NMR), espectrofotometría, radiografía (radiomarcado de proteínas), electroforesis, electroforesis capilar, cromatografía líquida de alto rendimiento (HPLC), cromatografía en capa fina (TLC), cromatografía por hiperdifusión, distintos métodos inmunológicos, tales como inmunoprecipitación, inmunodifusión, inmuno-electroforesis, radioinmunoensayos (RIA), ensayos inmunoabsorbentes ligados a enzimas (ELISA), ensayos inmuno-fluorescentes, electroforesis en gel (tal como SDS-PAGE), tinción con anticuerpos, clasificador celular activado por fluorescencia (FACS), espectrometría de masas por pirólisis, espectrometría infrarroja por transformada de Fourier, espectrometría Raman, GC-MS y LC-electropulverización y espectrometrías de masas por electropulverización cap-LC en tándem y similares. También pueden detectarse sistemáticamente bioactividades novedosas usando métodos, o variaciones de los mismos, descritos en la Patente de los Estados Unidos No. In some embodiments, the manipulated phenotype comprises increasing or decreasing the expression of a polypeptide (such as an aldolase enzyme, such as pyruvate aldolase, HMG and / or KHG aldolase) or generating new polypeptides in a cell. This increased or decreased expression can be traced by determining the amount of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase present, or by assays for activity of the aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase. Polypeptides, peptides and amino acids can also be detected and quantified by any method known in the art, including, for example, nuclear magnetic resonance (NMR), spectrophotometry, radiography (radiolabeling of proteins), electrophoresis, capillary electrophoresis, high performance liquid chromatography ( HPLC), thin layer chromatography (TLC), hyperdiffusion chromatography, different immunological methods, such as immunoprecipitation, immunodiffusion, immuno-electrophoresis, radioimmunoassays (RIA), enzyme-linked immunosorbent assays (ELISA), immuno-fluorescent assays, electrophoresis in gel (such as SDS-PAGE), antibody staining, fluorescence activated cell sorter (FACS), pyrolysis mass spectrometry, Fourier transform infrared spectrometry, Raman spectrometry, GC-MS and LC-electrospray, and mass spectrometry by tandem cap-LC electrospray and the like. Novel bioactivities can also be systematically detected using methods, or variations thereof, described in US Patent No.

6.057.103. Más aun, como se detalla más adelante, pueden medirse uno, más de uno o todos los polipéptidos de una célula usando un arreglo de proteínas. 6,057,103. Furthermore, as detailed below, one, more than one or all of the polypeptides in a cell can be measured using a protein array.

Aplicaciones industriales, farmacéuticas y otras Industrial, pharmaceutical and other applications

Los polipéptidos divulgados en la presente (tales como los que tienen aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa) pueden catalizar la formación o escisión de enlaces carbono-carbono. Las enzimas divulgadas en la presente pueden ser catalizadores altamente selectivos. Existen procesos industriales que usan enzimas divulgadas en la presente, tales como en la industria farmacéutica o de los complementos nutricionales (de la dieta) y en la industria de alimentos y piensos, tales como en métodos para elaborar productos alimenticios y de piensos o aditivos para alimentos y piensos. Existen procesos que usan enzimas divulgadas en la presente en la industria médica, tal como para la fabricación de productos farmacéuticos o auxiliares o complementos dietéticos o complementos y aditivos alimenticios. The polypeptides disclosed herein (such as those with aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase) can catalyze the formation or cleavage of carbon-carbon bonds. The enzymes disclosed herein can be highly selective catalysts. There are industrial processes that use enzymes disclosed herein, such as in the pharmaceutical or nutritional (dietary) supplement industry and in the food and feed industry, such as in methods for making food and feed products or additives for food and feed. There are processes that use enzymes disclosed herein in the medical industry, such as for the manufacture of pharmaceutical or auxiliary products or dietary supplements or food supplements and additives.

Conversión de biomasa y producción de biocombustibles limpios Biomass conversion and clean biofuel production

Existen enzimas, tales como aldolasas, incluidas piruvato aldolasas tales como, a modo no taxativo, HMG y/o KHG aldolasas (incluidas mezclas o “cócteles” de enzimas) y métodos para la conversión de una biomasa o cualquier material lignocelulósico (por ejemplo, cualquier composición que comprenda celulosa, hemicelulosa y lignina) en combustibles (por ejemplo, bioetanol, biobutanol, biopropanol, biometanol, biodiésel), usando las enzimas divulgadas en la presente, además de alimentos para animales y humanos y productos químicos. De esta forma, las composiciones y los métodos divulgados en la presente alternativas o adyuvantes sustentables para usar como productos a base de petróleo, por ejemplo, una mezcla de bioetanol y gasolina. Existen organismos que expresan enzimas divulgadas en la presente para la participación en ciclos químicos que implican la conversión natural de biomasa. En una realización, las enzimas y los métodos para la conversión se usan en conjuntos de enzimas para la despolimerización eficaz de polímeros celulósicos y hemicelulósicos y obtención de restos de carbono metabolizables. Existen también métodos para descubrir e implementar las enzimas más eficaces para permitir estos importantes y nuevos procesos industriales de “conversión de biomasa” y energías alternativas. There are enzymes, such as aldolases, including pyruvate aldolases such as, but not limited to, HMG and / or KHG aldolases (including mixtures or "cocktails" of enzymes) and methods for the conversion of a biomass or any lignocellulosic material (eg, any composition comprising cellulose, hemicellulose, and lignin) in fuels (eg, bioethanol, biobutanol, biopropanol, biomethanol, biodiesel), using the enzymes disclosed herein, in addition to animal and human food and chemicals. Thus, the compositions and methods disclosed herein are sustainable alternatives or adjuvants for use as petroleum-based products, for example, a mixture of bioethanol and gasoline. There are organisms that express enzymes disclosed herein for participation in chemical cycles involving the natural conversion of biomass. In one embodiment, enzymes and methods for conversion are used in sets of enzymes for efficient depolymerization of cellulosic and hemicellulosic polymers and obtaining metabolizable carbon residues. There are also methods to discover and implement the most efficient enzymes to enable these important new industrial processes of "biomass conversion" and alternative energy.

Los métodos divulgados en la presente también incluyen tomar el material lignocelulósico convertido (procesado por enzimas de la invención) y convertirlo en combustible (por ejemplo, bioetanol, biobutanol, biopropanol, biometanol, biodiesel) mediante fermentación y/o síntesis química. En una realización, los azúcares producidos se fermentan y/o los productos no fermentables se gasifican. The methods disclosed herein also include taking the converted lignocellulosic material (processed by enzymes of the invention) and converting it into fuel (eg, bioethanol, biobutanol, biopropanol, biomethanol, biodiesel) by fermentation and / or chemical synthesis. In one embodiment, the sugars produced are fermented and / or the non-fermentable products are gasified.

Las enzimas divulgadas en la presente (incluidos, por ejemplo, organismos, tales como microorganismos, por ejemplo, hongos, levadura o bacterias, que generan y en algunas realizaciones secretan enzimas recombinantes divulgadas en la presente) pueden usarse o incluirse/integrarse en cualquier etapa de cualquier proceso de conversión de biomasa, por ejemplo, en cualquier paso, en varios pasos o incluirse en todos los pasos o en todos los siguientes métodos de procesos de conversión de biomasa o todas estas alternativas de biocombustible: The enzymes disclosed herein (including, for example, organisms, such as microorganisms, e.g., fungi, yeast, or bacteria, that generate and in some embodiments secrete recombinant enzymes disclosed herein) can be used or included / integrated at any stage from any biomass conversion process, for example, in any step, in several steps or included in all steps or in all the following methods of biomass conversion processes or all these biofuel alternatives:

Combustión directa: quema de material mediante calor directo y es la tecnología de biomasa más simple; puede ser muy económica si hay una fuente de biomasa cercana. Direct combustion: burning of material by direct heat and is the simplest biomass technology; It can be very economical if there is a biomass source nearby.

Pirólisis: es la degradación térmica de biomasa mediante calor en ausencia de oxígeno. En una realización, la biomasa se calienta hasta una temperatura entre aproximadamente 800 y 1400 grados Fahrenheit pero no se introduce oxígeno para apoyar la combustión que resulta en la creación de gas, fuel oil y carbón. Pyrolysis: is the thermal degradation of biomass by heat in the absence of oxygen. In one embodiment, the biomass is heated to a temperature between about 800 and 1,400 degrees Fahrenheit but no oxygen is introduced to support combustion resulting in the creation of gas, fuel oil, and coal.

Gasificación: puede usarse biomasa para producir metano a través de calentamiento o digestión anaeróbica. El gas de síntesis, una mezcla de monóxido de carbono e hidrógeno, puede derivar de la biomasa. Gasification: biomass can be used to produce methane through heating or anaerobic digestion. Synthesis gas, a mixture of carbon monoxide and hydrogen, can be derived from biomass.

Gas de vertedero: es generado por la descomposición (digestión anaeróbica) de basura enterrada en vertederos. Cuando el desecho orgánico se descompone genera gas que consiste en aproximadamente 50% de metano, el principal componente del gas natural. Landfill gas: is generated by the decomposition (anaerobic digestion) of garbage buried in landfills. When organic waste decomposes, it generates gas consisting of approximately 50% methane, the main component of natural gas.

Digestión anaeróbica: convierte materia orgánica en una mezcla de metano, el principal componente del gas natural, y dióxido de carbono. En una realización, la biomasa tal como aguas residuales (aguas servidas), estiércol o desechos del procesamiento de alimentos se mezcla con agua y se alimenta a un tanque digestor sin aire. Anaerobic digestion: converts organic matter into a mixture of methane, the main component of natural gas, and carbon dioxide. In one embodiment, biomass such as wastewater (wastewater), manure, or food processing waste is mixed with water and fed to an airless digester tank.

Fermentación Fermentation

Fermentación de alcohol: el alcohol de combustible se produce convirtiendo almidón en azúcar, fermentando el azúcar para obtener alcohol y luego separando la mezcla de alcohol y agua por destilación. Materias primas tales como trigo, cebada, patata y desperdicios de papel, aserrín y paja, que contienen azúcar, almidón o celulosa, pueden convertirse en alcohol mediante fermentación con almidón. Alcohol Fermentation: Fuel alcohol is produced by converting starch into sugar, fermenting the sugar to obtain alcohol, and then separating the mixture of alcohol and water by distillation. Raw materials such as wheat, barley, potato, and paper waste, sawdust, and straw, which contain sugar, starch, or cellulose, can be converted to alcohol by starch fermentation.

Transesterificación: Una reacción ejemplar para convertir aceite en biodiésel se denomina transesterificación. En el proceso de transesterificación se hace reaccionar un alcohol (como metanol) con aceites de triglicéridos que se encuentran en aceites vegetales, grasas animales o grasas recicladas, formando ésteres de alquilo de ácidos grasos (biodiésel) y glicerina. La reacción requiere de calor y un catalizador de base fuerte, tal como hidróxido de sodio o hidróxido de potasio. Transesterification: An exemplary reaction to convert oil to biodiesel is called transesterification. In the transesterification process, an alcohol (such as methanol) is reacted with triglyceride oils found in vegetable oils, animal fats, or recycled fats, forming alkyl esters of fatty acids (biodiesel) and glycerin. The reaction requires heat and a strong base catalyst, such as sodium hydroxide or potassium hydroxide.

Biodiésel: el biodiésel es una mezcla de ésteres de alquilo de ácidos grasos hecha a partir de aceites vegetales, grasas animal o grasas recicladas. El biodiésel puede usarse como combustible para vehículos en su forma pura, pero normalmente se usa como un aditivo para diésel de petróleo para reducir los niveles de particulados, monóxido de carbono, hidrocarburos y productos tóxicos del aire de vehículos con motores diésel. Biodiesel: Biodiesel is a mixture of fatty acid alkyl esters made from recycled vegetable oils, animal fats, or fats. Biodiesel can be used as a vehicle fuel in its pure form, but is normally used as an additive for petroleum diesel to reduce the levels of particulates, carbon monoxide, hydrocarbons, and toxic air products from vehicles with diesel engines.

Hidrólisis: incluye hidrólisis de un compuesto, por ejemplo, biomasa, tal como un material lignocelulósico, catalizado usando una enzima divulgada en la presente. Hydrolysis: Includes hydrolysis of a compound, eg, biomass, such as a lignocellulosic material, catalyzed using an enzyme disclosed herein.

Cogeneración: es la producción simultánea de más de una forma de energía usando un solo combustible y las mismas instalaciones. En una realización, la cogeneración de biomasa tiene más crecimiento potencial que la generación de biomasa sola porque la cogeneración produce calor y electricidad. Cogeneration: is the simultaneous production of more than one form of energy using a single fuel and the same facilities. In one embodiment, biomass cogeneration has more potential growth than biomass generation alone because the cogeneration produces heat and electricity.

En una realización, los polipéptidos divulgados en la presente tienen una actividad de aldolasa, incluida actividad de piruvato aldolasa, tal como, a modo no taxativo, actividad de HMG y/o KHG aldolasa, u otra actividad enzimática para generar biodiésel, bioetanol, biobutanol, biopropanol o biometanol a partir de un material orgánico, por ejemplo, una biomasa, tal como composiciones derivadas de plantas y animales, incluido cualquier cultivo agrícola u otra materia prima renovable, un residuo agrícola o un desecho animal, o los componentes orgánicos de desechos municipales e industriales, o microorganismos tales como algas o levadura. En una realización, los polipéptidos divulgados en la presente se usan en procesos para convertir biomasa lignocelulósica en etanol, butanol, propanol, metanol o se usan de otra forma en procesos para hidrolizar o digerir biomateriales de forma tal que pueden usarse como un biocombustible (incluidos bioetanol, biobutanol, biopropanol, biometanol o biodiésel), o para simplificar el procesamiento de la biomasa para obtener un combustible. En una realización alternativa, los polipéptidos divulgados en la presente se usan en procesos para un proceso de transesterificación haciendo reaccionar un alcohol (como metanol) con un aceite de triglicéridos en un aceite vegetal, grasa animal o grasas recicladas, formando ésteres de alquilo de ácidos grasos (biodiésel) y glicerina. En una realización, el biodiésel se obtiene a partir de aceite de soja o aceites de cocina reciclados. También pueden usarse grasas animales, otros aceites vegetales y otros aceites reciclados para producir biodiésel, dependiendo de sus costos y disponibilidad. En otras realizaciones se usan mezclas de todos los tipos de grasas y aceites para producir combustible biodiésel de la invención. In one embodiment, the polypeptides disclosed herein have aldolase activity, including pyruvate aldolase activity, such as, but not limited to, HMG and / or KHG aldolase activity, or other enzymatic activity to generate biodiesel, bioethanol, biobutanol , biopropanol or biomethanol from an organic material, for example, a biomass, such as compositions derived from plants and animals, including any agricultural crop or other renewable raw material, agricultural residue or animal waste, or organic components of waste municipal and industrial, or microorganisms such as algae or yeast. In one embodiment, the polypeptides disclosed herein are used in processes to convert lignocellulosic biomass to ethanol, butanol, propanol, methanol, or are otherwise used in processes to hydrolyze or digest biomaterials such that they can be used as a biofuel (including bioethanol, biobutanol, biopropanol, biomethanol or biodiesel), or to simplify the processing of biomass to obtain a fuel. In an alternative embodiment, the polypeptides disclosed herein are used in processes for a transesterification process by reacting an alcohol (such as methanol) with a triglyceride oil in a vegetable oil, animal fat, or recycled fats, forming alkyl esters of acids fatty (biodiesel) and glycerin. In one embodiment, the biodiesel is obtained from recycled soybean oil or cooking oils. Animal fats, other vegetable oils, and other recycled oils can also be used to produce biodiesel, depending on cost and availability. In other embodiments, mixtures of all types of fats and oils are used to produce biodiesel fuel of the invention.

También pueden usarse enzimas divulgadas en la presente en la refinación de glicerina. El producto derivado de la glicerina contiene catalizador sin reaccionar y jabones que son neutralizados con un ácido. Se retiran el agua y el alcohol para producir 50% a 80% de glicerina bruta. Los restantes contaminantes incluyen grasas y aceites sin reaccionar, que pueden procesarse utilizando los polipéptidos divulgados en la presente. En plantas de biodiésel grandes divulgadas en la presente, la glicerina puede purificarse adicionalmente, por ejemplo hasta 99% o más de pureza, para las industrias farmacéutica y cosmética. Enzymes disclosed herein can also be used in glycerin refining. The glycerin-derived product contains unreacted catalyst and soaps that are neutralized with an acid. Water and alcohol are removed to produce 50% to 80% crude glycerin. The remaining contaminants include unreacted fats and oils, which can be processed using the polypeptides disclosed herein. In large biodiesel plants disclosed herein, glycerin can be further purified, for example up to 99% or more purity, for the pharmaceutical and cosmetic industries.

El bioetanol, biobutanol, biopropanol, biometanol y/o biodiésel obtenidos utilizando los polipéptidos divulgados en la presente pueden usarse con oxigenadores de combustible para mejorar las características de la combustión. Agregar oxígeno resulta en una combustión más completa, lo que reduce las emisiones de monóxido de carbono. Este es otro beneficio ambiental de reemplazar los combustibles de petróleo por biocombustibles (por ejemplo, un combustible de la invención). Un bioetanol, biobutanol, biopropanol, biometanol y/o biodiésel elaborado utilizando las composiciones y/o métodos divulgados en la presente puede mezclarse con gasolina para formar una mezcla E10 (aproximadamente 5% a 10% de etanol y aproximadamente 90% a 95% de gasolina), pero puede usarse en concentraciones más altas, tales como E85 o en su forma pura. Un bioetanol, biobutanol, biopropanol, biometanol y/o biodiésel obtenido utilizando las composiciones y/o métodos divulgados en la presente pueden mezclarse con diésel de petróleo para formar una mezcla B20 (20% de biodiésel y 80% de diésel de petróleo), aunque pueden usarse otros niveles de mezcla hasta B100 (biodiésel puro). The bioethanol, biobutanol, biopropanol, biomethanol and / or biodiesel obtained using the polypeptides disclosed herein can be used with fuel oxygenators to improve combustion characteristics. Adding oxygen results in more complete combustion, which reduces carbon monoxide emissions. This is another environmental benefit of replacing petroleum fuels with biofuels (eg, a fuel of the invention). A bioethanol, biobutanol, biopropanol, biomethanol, and / or biodiesel made using the compositions and / or methods disclosed herein can be mixed with gasoline to form an E10 blend (approximately 5% to 10% ethanol and approximately 90% to 95% of gasoline), but can be used in higher concentrations, such as E85 or in its pure form. A bioethanol, biobutanol, biopropanol, biomethanol and / or biodiesel obtained using the compositions and / or methods disclosed herein can be mixed with petroleum diesel to form a B20 mixture (20% biodiesel and 80% petroleum diesel), although Other mix levels up to B100 (pure biodiesel) can be used.

Existen también procesos para elaborar etanol (“bioetanol”), butanol (“biobutanol”), propanol (“biopropanol”), metanol (“biometanol”) y/o diésel (“biodiésel”) a partir de composiciones que comprenden biomasa lignocelulósica. El material de biomasa de lignocelulosa puede obtenerse a partir de cultivos agrícolas, como un producto derivado de la producción de alimentos para humanos y animales o como productos de desechos lignocelulósicos, tales como residuos vegetales y papel de desecho. Ejemplos de fuentes vegetales o residuos vegetales adecuados para el tratamiento con polipéptidos divulgados en la presente incluyen kelp, algas, granos, semillas, tallos, hojas, vainas, cáscaras, mazorcas de maíz, residuos de maíz, paja, pastos (por ejemplo, pasto indio, tal como Sorghastrum nutans; o pasto varilla, por ejemplo, la especie Panicum, tal como Panicum virgatum) y similares, así como madera, astillas de madera, pulpa de madera y aserrín. Ejemplos de desechos de papel adecuados para el tratamiento con polipéptidos divulgados en la presente incluyen papel de fotocopias desechado, papel de impresoras de ordenadores, papel de cuadernos, papel de libretas, papel de máquinas de escribir y similares, así como periódicos, revistas, cartón y materiales de embalaje en base a papel. There are also processes for making ethanol ("bioethanol"), butanol ("biobutanol"), propanol ("biopropanol"), methanol ("biomethanol") and / or diesel ("biodiesel") from compositions comprising lignocellulosic biomass. Lignocellulose biomass material can be obtained from agricultural crops, as a product derived from the production of food for humans and animals, or as lignocellulosic waste products, such as plant residues and waste paper. Examples of plant sources or plant residues suitable for treatment with polypeptides disclosed herein include kelp, algae, grains, seeds, stems, leaves, pods, husks, corn cobs, corn residues, straw, grasses (eg grass Indian, such as Sorghastrum nutans; or rod grass, for example, the species Panicum, such as Panicum virgatum) and the like, as well as wood, wood chips, wood pulp, and sawdust. Examples of paper wastes suitable for treatment with polypeptides disclosed herein include discarded photocopy paper, computer printer paper, notebook paper, notebook paper, typewriter paper, and the like, as well as newspapers, magazines, cardboard and paper-based packaging materials.

En una realización, las enzimas y métodos divulgados en la presente pueden utilizarse junto con medios más “tradicionales” para obtener etanol, metanol, butanol, propanol y/o diésel a partir de biomasa, por ejemplo, como métodos que comprenden hidrolizar materiales lignocelulósicos sometiendo material lignocelulósico seco en un reactor a un catalizador compuesto por una disolución diluida de un ácido fuerte y una sal de metal; esto puede reducir la energía de activación, o la temperatura, de la hidrólisis de la celulosa para obtener rendimientos de azúcar más altos; ver, por ejemplo, las Patentes de los Estados Unidos Nos. 6.660.506; y 6.423.145. In one embodiment, the enzymes and methods disclosed herein can be used in conjunction with more "traditional" means to obtain ethanol, methanol, butanol, propanol and / or diesel from biomass, for example, as methods comprising hydrolyzing lignocellulosic materials by subjecting dry lignocellulosic material in a reactor to a catalyst consisting of a dilute solution of a strong acid and a metal salt; this can reduce the activation energy, or the temperature, of cellulose hydrolysis to obtain higher sugar yields; see, for example, United States Patent Nos. 6,660,506; and 6,423,145.

Otra realización que incorpora el uso de enzimas divulgadas en la presente comprende hidrolizar material lignocelulósico que contiene hemicelulosa, celulosa y lignina sometiendo el material a un paso de hidrólisis de una primera etapa en un medio acuoso a una temperatura y una presión seleccionadas de forma de producir principalmente la despolimerización de la hemicelulosa sin una despolimerización importante en la conversión de celulosa a glucosa. Esta etapa resulta en una suspensión en la que la fase acuosa líquida contiene monosacáridos disueltos que resultan de la despolimerización de hemicelulosa y una fase sólida que contiene celulosa y lignina. Un paso de hidrólisis de una segunda etapa puede comprender condiciones tales que al menos una porción importante de la celulosa se despolimerice, resultando dicho paso en una fase acuosa líquida que contiene los productos de la despolimerización de celulosa disueltos/solubles. Ver, por ejemplo, la Patente de los Estados Unidos No. 5.536.325. Las enzimas divulgadas en la presente pueden agregarse en cualquier etapa de este proceso ejemplar. Another embodiment incorporating the use of enzymes disclosed herein comprises hydrolyzing hemicellulose, cellulose and lignin containing lignocellulosic material by subjecting the material to a first stage hydrolysis step in an aqueous medium at a selected temperature and pressure in order to produce mainly the depolymerization of hemicellulose without a significant depolymerization in the conversion of cellulose to glucose. This step results in a suspension in which the liquid aqueous phase contains dissolved monosaccharides resulting from the depolymerization of hemicellulose and a solid phase containing cellulose and lignin. A second stage hydrolysis step may comprise conditions such that at least a significant portion of the cellulose is depolymerized, said step resulting in a liquid aqueous phase containing the dissolved / soluble cellulose depolymerization products. See, for example, United States Patent No. 5,536,325. The enzymes disclosed herein can be added at any stage of this exemplary process.

Otra realización que incorpora el uso de enzimas divulgadas en la presente comprende procesar un material de biomasa que contiene lignocelulosa mediante una o más etapas de hidrólisis de ácido diluido con aproximadamente 0,4% a 2% de ácido fuerte; y tratar un componente lignocelulósico sólido sin reaccionar del material de biomasa hidrolizado con ácido mediante deslignificación alcalina para producir precursores para termoplásticos y derivados biodegradables. Ver, por ejemplo, la Patente de los Estados Unidos No. 6.409.841. Las enzimas divulgadas en la presente pueden agregarse en cualquier etapa de este proceso ejemplar. Another embodiment incorporating the use of enzymes disclosed herein comprises processing a lignocellulose-containing biomass material by one or more acid hydrolysis steps diluted with about 0.4% to 2% strong acid; and treating an unreacted solid lignocellulosic component of the acid hydrolyzed biomass material by alkaline delignification to produce precursors for thermoplastics and biodegradable derivatives. See, for example, United States Patent No. 6,409,841. The enzymes disclosed herein can be added at any stage of this exemplary process.

Otra realización que incorpora el uso de enzimas divulgadas en la presente comprende prehidrolizar material lignocelulósico en un reactor de prehidrólisis; agregar un líquido ácido al material lignocelulósico sólido para preparar una mezcla; calentar la mezcla hasta la temperatura de reacción; mantener la temperatura de reacción durante un tiempo suficiente como para fraccionar el material lignocelulósico y obtener una porción solubilizada que contenga al menos aproximadamente 20% de la lignina del material lignocelulósico y una fracción sólida que contenga celulosa; retirar una porción solubilizada de la fracción sólida mientras se encuentra a la temperatura de reacción o una temperatura cercana en donde la celulosa en la fracción sólida se vuelve más adecuada para la digestión enzimática; y recuperar una porción solubilizada. Ver, por ejemplo, la Patente de los Estados Unidos No. 5.705.369. Las enzimas divulgadas en la presente pueden agregarse en cualquier etapa de este proceso ejemplar. Another embodiment incorporating the use of enzymes disclosed herein comprises prehydrolyzing lignocellulosic material in a prehydrolysis reactor; adding an acidic liquid to the solid lignocellulosic material to prepare a mixture; heat the mixture to reaction temperature; maintaining the reaction temperature for a time sufficient to fractionate the lignocellulosic material and obtain a solubilized portion containing at least about 20% of the lignin of the lignocellulosic material and a solid fraction containing cellulose; removing a solubilized portion of the solid fraction while it is at the reaction temperature or a temperature close to where the cellulose in the solid fraction becomes more suitable for enzymatic digestion; and recovering a solubilized portion. See, for example, United States Patent No. 5,705,369. The enzymes disclosed herein can be added at any stage of this exemplary process.

La invención proporciona métodos para obtener composiciones de combustibles para motor (por ejemplo, para motores de encendido por chispa) basadas en hidrocarburos líquidos mezclados con un alcohol de grado combustible obtenido utilizando una enzima o un método divulgado en la presente. En una realización, los combustibles obtenidos mediante el uso de una enzima divulgada en la presente comprenden, por ejemplo, mezclas de líquido de gas de carbón o líquido de gas natural-etanol, metanol, butanol, propanol y/o diésel. En una realización, un co-disolvente es 2-metiltetrahidrofurano (MTHF) derivado de biomasa. Ver, por ejemplo, la Patente de los Estados Unidos No. 6.712.866. The invention provides methods for obtaining engine fuel compositions (eg, for spark ignition engines) based on liquid hydrocarbons mixed with a fuel grade alcohol obtained using an enzyme or a method disclosed herein. In one embodiment, fuels obtained by using an enzyme disclosed herein comprise, for example, mixtures of carbon gas liquid or natural gas liquid-ethanol, methanol, butanol, propanol and / or diesel. In one embodiment, a co-solvent is biomass-derived 2-methyltetrahydrofuran (MTHF). See, for example, United States Patent No. 6,712,866.

En una realización, los métodos de la invención para la degradación enzimática de la lignocelulosa, por ejemplo, para la producción de etanol a partir de material lignocelulósico, también pueden comprender el uso de tratamiento ultrasónico del material de biomasa; ver, por ejemplo, la Patente de los Estados Unidos No. 6.333.181. In one embodiment, the methods of the invention for the enzymatic degradation of lignocellulose, for example, for the production of ethanol from lignocellulosic material, can also comprise the use of ultrasonic treatment of the biomass material; see, for example, United States Patent No. 6,333,181.

En otra realización, los métodos divulgados en la presente para producir bioetanol, biobutanol, biopropanol, biometanol y/o biodiésel a partir de un sustrato celulósico comprenden proporcionar una mezcla de reacción en forma de una suspensión que comprende un sustrato celulósico, una enzima divulgada en la presente y un agente de fermentación (por ejemplo, dentro de un recipiente de reacción, tal como un biorreactor de alimentación semicontinua de sólidos), y la mezcla de reacción se hace reaccionar en condiciones suficientes como para iniciar y mantener una reacción de fermentación (como se describe, por ejemplo, en la Solicitud de Patente de los Estados Unidos No. 20060014260). En una realización, los cálculos experimentales o teóricos pueden determinar una frecuencia de alimentación óptima. En una realización se proporcionan cantidades adicionales del sustrato celulósico y la enzima al recipiente de reacción a intervalos de acuerdo con la frecuencia de alimentación optimizada. In another embodiment, the methods disclosed herein for producing bioethanol, biobutanol, biopropanol, biomethanol, and / or biodiesel from a cellulosic substrate comprise providing a reaction mixture in the form of a suspension comprising a cellulosic substrate, an enzyme disclosed in it and a fermentation agent (eg, within a reaction vessel, such as a semi-continuous solids feed bioreactor), and the reaction mixture is reacted under conditions sufficient to initiate and maintain a fermentation reaction ( as described, for example, in United States Patent Application No. 20060014260). In one embodiment, experimental or theoretical calculations can determine an optimal feed frequency. In one embodiment, additional amounts of the cellulosic substrate and enzyme are provided to the reaction vessel at intervals according to the optimized feed frequency.

Un proceso ejemplar para la fabricación de biocombustibles (tal como bioetanol, biobutanol, biopropanol, biometanol, y/o biodiésel) se describe en las Solicitudes de Patente de los Estados Unidos Publicadas Nos. 20050069998; 20020164730; y en una realización comprende las etapas de moler la biomasa lignocelulósica (por ejemplo, hasta un tamaño de 15-30 mm), someter el producto obtenido a un pre-tratamiento de explosión de vapor (por ejemplo, a una temperatura de 190-230ºC) durante entre 1 y 10 minutos en un reactor; recoger el material pre-tratado en un ciclón o producto de manufactura relacionado; y separar las fracciones líquida y sólida por filtración en un filtro prensa, introducir la fracción sólida en un depósito de fermentación y agregar una o más enzimas divulgadas en la presente, por ejemplo, una celulasa y/o beta-glucosidasa (por ejemplo, disuelta en solución amortiguadora de citrato de pH 4,8). An exemplary process for the manufacture of biofuels (such as bioethanol, biobutanol, biopropanol, biomethanol, and / or biodiesel) is described in United States Patent Applications Published Nos. 20050069998; 20020164730; and in one embodiment it comprises the steps of grinding lignocellulosic biomass (for example, up to a size of 15-30 mm), subjecting the obtained product to a steam blast pre-treatment (for example, at a temperature of 190-230ºC). ) for between 1 and 10 minutes in a reactor; collecting pre-treated material in a cyclone or related manufacturing product; and separating the liquid and solid fractions by filtration on a filter press, introducing the solid fraction into a fermentation tank and adding one or more enzymes disclosed herein, eg, a cellulase and / or beta-glucosidase (eg, dissolved in citrate buffer solution pH 4.8).

Otro proceso ejemplar para fabricar biocombustibles (tales como bioetanol, biobutanol, biopropanol, biometanol y/o biodiésel) que comprende utilizar enzimas divulgadas en la presente implica pre-tratar un material de inicio que comprende una materia prima lignocelulósica que comprende al menos hemicelulosa y celulosa. En una realización, el material de inicio comprende patatas, soja (colza), cebada, centeno, maíz, avenas, trigo, remolacha o remolacha azucarera o un componente o desecho o producto derivado de la producción de alimentos o piensos. El material de inicio (“materia prima”) se hace reaccionar en condiciones que alteran la estructura de la fibra de la planta para producir al menos una hidrólisis parcial de la hemicelulosa y la celulosa. Las condiciones de alteración pueden comprender, por ejemplo, someter el material de inicio a una temperatura promedio de 180ºC a 270ºC a un pH de 0,5 a 2,5 durante un periodo de aproximadamente 5 segundos a 60 minutos; o una temperatura de 220ºC a 270ºC a un pH de 0,5 a 2,5 durante un periodo de 5 segundos a 120 segundos o equivalente. Esto genera una materia prima con mayor accesibilidad para su digestión por parte de una enzima, por ejemplo, una enzima celulasa de la invención. Patente de los Estados Unidos No. 6.090.595. Another exemplary process for making biofuels (such as bioethanol, biobutanol, biopropanol, biomethanol, and / or biodiesel) comprising using enzymes disclosed herein involves pre-treating a starting material comprising a lignocellulosic raw material comprising at least hemicellulose and cellulose . In one embodiment, the starting material comprises potatoes, soybeans (rapeseed), barley, rye, corn, oats, wheat, beets or sugar beets or a component or waste or product derived from food or feed production. The starting material ("raw material") is reacted under conditions that alter the structure of the plant fiber to produce at least a partial hydrolysis of hemicellulose and cellulose. The alteration conditions may comprise, for example, subjecting the starting material to an average temperature of 180 ° C to 270 ° C at a pH of 0.5 to 2.5 over a period of from about 5 seconds to 60 minutes; or a temperature of 220 ° C to 270 ° C at a pH of 0.5 to 2.5 over a period of 5 seconds to 120 seconds or equivalent. This generates a raw material with greater accessibility for its digestion by an enzyme, for example, a cellulase enzyme of the invention. United States Patent No. 6,090,595.

Condiciones ejemplares para la hidrólisis de material lignocelulósico incluyen reacciones a temperaturas entre aproximadamente 30ºC y 48ºC y/o un pH entre aproximadamente 4,0 y 6,0. Otras condiciones ejemplares incluyen una temperatura entre aproximadamente 30ºC y 60ºC y un pH entre aproximadamente 4,0 y 8,0. Exemplary conditions for the hydrolysis of lignocellulosic material include reactions at temperatures between about 30 ° C and 48 ° C and / or a pH between about 4.0 and 6.0. Other exemplary conditions include a temperature between about 30 ° C and 60 ° C and a pH between about 4.0 and 8.0.

Las enzimas divulgadas en la presente pueden catalizar reacciones con gran estereo-, regio- y quimio-selectividad. Las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente pueden manipularse para funcionar en distintos disolventes, operar con pHs extremos (por ejemplo, pHs altos y pHs bajos), temperaturas extremas (por ejemplo, altas temperaturas y bajas temperaturas), niveles de salinidad extremos (por ejemplo, alta salinidad y baja salinidad) y catalizar reacciones con compuestos que no están estructuralmente relacionados con sus sustratos fisiológicos naturales. The enzymes disclosed herein can catalyze reactions with high stereo-, regio-, and chemo-selectivity. The aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein can be manipulated to operate in different solvents, operate at extreme pHs (eg, high pHs and low pHs), extreme temperatures (eg, high temperatures and low temperatures), extreme salinity levels (eg, high salinity and low salinity) and catalyze reactions with compounds that are not structurally related to their natural physiological substrates.

Piensos y alimentos o aditivos para piensos y alimentos Feed and food or feed and food additives

Además de proporcionar auxiliares o complementos dietéticos, o complementos y aditivos alimenticios, existen composiciones y métodos para tratar piensos y alimentos humanos y animales y aditivos para alimentos y piensos usando un polipéptido divulgado en la presente, tal como una proteína que tiene actividad de enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgada en la presente, y/o los anticuerpos divulgados en la presente. Existen piensos para animales, alimentos y aditivos que comprenden enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente y/o anticuerpos divulgados en la presente. El animal puede ser cualquier animal de granja o cualquier animal. In addition to providing dietary aids or supplements, or food supplements and additives, there are compositions and methods for treating human and animal feed and food and feed and feed additives using a polypeptide disclosed herein, such as a protein having aldolase enzyme activity. , such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, and / or the antibodies disclosed herein. There are animal feeds, food and additives comprising aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein and / or antibodies disclosed herein. The animal can be any farm animal or any animal.

El aditivo para pienso animal divulgado en la presente puede ser un producto de la enzima granulado que puede mezclarse fácilmente con los componentes del pienso. De forma alternativa, los aditivos para pienso divulgados en la presente pueden formar un componente de una pre-mezcla. El producto de la enzima granulado divulgado en la presente puede estar recubierto o sin recubrir. El tamaño de las partículas de los granulados de la enzima puede ser compatible con el de los componentes del pienso y la pre-mezcla. Esto proporciona un medio seguro y conveniente para incorporar enzimas en los piensos. Alternativamente, el aditivo para pienso animal divulgado en la presente puede ser una composición líquida estabilizada. Esta puede ser una suspensión de base acuosa u oleosa. Ver la Patente de los Estados Unidos No. 6.245.546. The animal feed additive disclosed herein can be a granulated enzyme product that can be easily mixed with the feed components. Alternatively, the feed additives disclosed herein can form a component of a premix. The granulated enzyme product disclosed herein can be coated or uncoated. The particle size of the enzyme granules may be compatible with that of the feed and pre-mix components. This provides a safe and convenient means of incorporating enzymes into feed. Alternatively, the animal feed additive disclosed herein can be a stabilized liquid composition. This can be an aqueous or oily base suspension. See United States Patent No. 6,245,546.

Las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgadas en la presente, en la modificación de pienso o un alimento, pueden procesar el alimento o pienso in vitro (modificando los componentes del pienso o alimento) o in vivo. Los polipéptidos divulgados en la presente pueden agregarse a composiciones de pienso o alimento. The aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, in modifying feed or food, can process the food or feed in vitro (by modifying the components of the feed or food) or in alive. The polypeptides disclosed herein can be added to feed or food compositions.

En algunas realizaciones se agrega una enzima divulgada en la presente en combinación con otra enzima, tal como beta-galactosidasas, catalasas, lacasas, celulasas, otras aldolasas, endoglicosidasas, endo-beta-1,4-lacasas, amiloglucosidasas, glucosidasas, glucosa isomerasas, glicosiltransferasas, lipasas, fosfolipasas, lipooxigenasas, beta-lacasas, endo-beta-1,3(4)-lacasas, cutinasas, peroxidasas, amilasas, fitasas, glucoamilasas, pectinasas, reductasas, oxidasas, descarboxilasas, fenoloxidasas, ligninasas, pululanasas, arabinanasas, hemicelulasas, mananasas, xilolacasas, xilanasas, pectín acetil esterasas, rhamnogalacturonan acetil esterasas, proteasas, peptidasas, proteinasas, poligalacturonasas, rhamnogalacturonasas, galactanasas, pectín liasas, transglutaminasas, pectín metilesterasas, celobiohidrolasas y/o transglutaminasas Estos productos de digestión enzimáticos son más digeribles por el animal. De esta forma, las enzimas aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa divulgados en la presente pueden contribuir con la energía disponible del pienso o alimento o con la digestibilidad del alimento o pienso por medio de la descomposición de la celulosa. In some embodiments, an enzyme disclosed herein is added in combination with another enzyme, such as beta-galactosidases, catalases, laccases, cellulases, other aldolases, endoglycosidases, endo-beta-1,4-laccases, amyloglucosidases, glucosidases, glucose isomerases. , glycosyltransferases, lipases, phospholipases, lipoxygenases, beta-laccases, endo-beta-1,3 (4) -laccases, cutinases, peroxidases, amylases, phytases, glucoamylases, pectinases, reductases, oxidases, decarboxylases, lignins, lignins, arabininases, hemicellulases, mannanases, xylolacasses, xylanases, pectin acetyl esterases, rhamnogalacturonan acetyl esterases, proteases, peptidases, proteinases, polygalacturonases, rhamnogalacturinases, pectin liases, transglutainase, lactosetase, and transglutaminase, digestible by the animal. In this way, the aldolase enzymes, such as pyruvate aldolase, such as HMG and / or KHG aldolase disclosed herein, can contribute to the available energy of the feed or food or to the digestibility of the food or feed by decomposing the cellulose.

En otras realizaciones, la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente puede suministrarse expresando las enzimas directamente en cosechas de pienso transgénicas (tales como plantas y semillas transgénicas y similares), tales como granos, cereales, maíz, soja, colza, lupino y similares. Como se estableció anteriormente, existen plantas, partes de plantas y células de plantas transgénicas que comprenden una secuencia de ácidos nucleicos que codifican un polipéptido divulgado en la presente. En algunas realizaciones, el ácido nucleico se expresa de forma tal que la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, divulgada en la presente se produce en cantidades recuperables. La enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa puede recuperarse de cualquier planta o parte de planta. De forma alternativa, la planta o parte de planta que contiene el polipéptido recombinante puede usarse como tal para mejorar la calidad de un alimento o pienso, como por ejemplo mejorar el valor nutricional, la palatabilidad, etc. In other embodiments, the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein can be supplied by expressing the enzymes directly in transgenic feed crops (such as transgenic plants and seeds and the like), such as grains, cereals, corn, soybeans, rapeseed, lupine and the like. As stated above, there are transgenic plants, plant parts, and plant cells that comprise a nucleic acid sequence encoding a polypeptide disclosed herein. In some embodiments, the nucleic acid is expressed such that the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase, disclosed herein is produced in recoverable amounts. The aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase can be recovered from any plant or plant part. Alternatively, the plant or plant part containing the recombinant polypeptide can be used as such to improve the quality of a food or feed, such as improving nutritional value, palatability, etc.

En algunas realizaciones, la matriz de administración de enzimas divulgadas en la presente se encuentra en forma de partículas plurales discretas, granulados o gránulos. “Gránulos” significa partículas que están comprimidas o compactadas, por ejemplo mediante granulación, extrusión o compactación similar para retirar agua de la matriz. Dicha compresión o compactación de las partículas también promueve la cohesión interpartícula de las partículas. Por ejemplo, los gránulos pueden prepararse mediante granulación del sustrato en base a granos en un molino para granulados. Los granulados preparados de esta forma se muelen o desmenuzan hasta un tamaño de gránulo adecuado para su uso como adyuvante en pienso animal. Dado que está aprobada para su uso en pienso animal, la matriz puede usarse como diluyente para la administración de enzimas en pienso animal. In some embodiments, the enzyme delivery matrix disclosed herein is in the form of discrete plural particles, granules, or granules. "Granules" means particles that are compressed or compacted, for example by granulation, extrusion, or the like, to remove water from the matrix. Such compression or compaction of the particles also promotes interparticle cohesion of the particles. For example, granules can be prepared by granulating the grain-based substrate in a granulate mill. The granules prepared in this way are milled or minced to a granule size suitable for use as an adjuvant in animal feed. Since it is approved for use in animal feed, the matrix can be used as a diluent for the administration of enzymes in animal feed.

En algunas realizaciones, la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa contenida en la matriz de administración de enzimas y en los métodos es una enzima aldolasa termoestable, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa, tal como se describe en la presente, de forma de resistir la inactivación de la enzima aldolasa, tal como piruvato aldolasa, tal como HMG y/o KHG aldolasa durante la fabricación, en la que pueden emplearse temperaturas elevadas y/o vapor para preparar la matriz de administración de enzimas granulada. Durante la digestión de pienso que contiene la matriz de administración de enzimas, los fluidos digestivos acuosos provocarán la liberación de la enzima activa. También pueden incorporarse otros tipos de enzimas termoestables y complementos nutricionales que sean termoestables en la matriz de administración que han de ser liberados en cualquier tipo de condiciones acuosas. In some embodiments, the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase contained in the enzyme delivery matrix and in the methods is a thermostable aldolase enzyme, such as pyruvate aldolase, such as HMG and / or KHG aldolase, as described herein, in order to resist inactivation of the enzyme aldolase, such as pyruvate aldolase, such as HMG and / or KHG aldolase during manufacture, in which elevated temperatures and / or steam may be employed to prepare the granulated enzyme delivery matrix. During digestion of feed containing the enzyme delivery matrix, aqueous digestive fluids will cause the release of the active enzyme. Other types of thermostable enzymes and nutritional supplements that are thermostable can also be incorporated into the delivery matrix to be released under any type of aqueous conditions.

En algunas realizaciones se aplica un recubrimiento a las partículas de la matriz de la enzima con muchos fines diferentes, tales como agregar un sabor o complemento nutricional al pienso animal, retrasar la liberación de complementos y enzimas en el pienso animal en condiciones gástricas y similares. En algunas realizaciones, el recubrimiento se aplica para alcanzar un objetivo funcional, por ejemplo, cuando es deseable ralentizar la liberación de la enzima desde las partículas de la matriz o para controlar las condiciones en las que se liberará la enzima. La composición del material del recubrimiento puede ser tal que el mismo sea degradado selectivamente por el agente al cual es susceptible (tal como calor, ácido o base, enzimas u otro producto químico). De forma alternativa pueden aplicarse consecutivamente a las partículas de la matriz dos o más recubrimientos susceptibles a dichos diferentes agentes de degradación. In some embodiments, a coating is applied to the enzyme matrix particles for many different purposes, such as adding a flavor or nutritional supplement to the animal feed, delaying the release of supplements and enzymes into the animal feed under gastric and similar conditions. In some embodiments, the coating is applied to achieve a functional objective, for example, when it is desirable to slow down the release of the enzyme from the matrix particles or to control the conditions under which the enzyme will be released. The composition of the coating material may be such that it is selectively degraded by the agent to which it is susceptible (such as heat, acid or base, enzymes, or other chemical). Alternatively, two or more coatings susceptible to said different degradation agents can be applied consecutively to the matrix particles.

Existe también un proceso para preparar una matriz de liberación de enzimas. El proceso comprende proporcionar partículas plurales discretas de un sustrato en base a granos en un tamaño de partícula adecuado para su uso como una matriz liberadora de enzimas, en donde las partículas comprenden una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa codificada por una secuencia de aminoácidos divulgada en la presente. En algunas realizaciones, el proceso incluye compactar o comprimir las partículas de la matriz liberadora de enzimas para formar gránulos, lo cual se logra mayormente mediante granulación. El agente inhibidor de moho y de cohesión, en caso de usarse, puede agregarse en cualquier momento adecuado y, en algunas realizaciones, mezclarse con el sustrato en base a granos en las proporciones deseadas antes de la granulación del sustrato en base a granos. El contenido de humedad en el molino de granulado en algunas realizaciones se encuentra en los rangos establecidos anteriormente con respecto al contenido de humedad en el producto terminado y, en algunas realizaciones, es de aproximadamente 14-15%. En algunas realizaciones se agrega humedad a la materia prima en forma de una preparación acuosa de la enzima para ajustar la materia prima a este contenido de humedad. La temperatura en el molino de granulado en algunas realizaciones se lleva hasta aproximadamente 82°C con vapor. El molino de granulado puede operarse en cualquier condición que imparta trabajo suficiente a la materia prima para proporcionar granulados. El proceso de granulado en sí mismo es un proceso económico para eliminar agua de la composición que contiene las enzimas. There is also a process to prepare an enzyme release matrix. The process comprises providing discrete plural particles of a grain-based substrate in a particle size suitable for use as an enzyme-releasing matrix, wherein the particles comprise an enzyme aldolase, such as pyruvate aldolase, HMG and / or KHG aldolase. encoded by an amino acid sequence disclosed herein. In some embodiments, the process includes compacting or compressing the enzyme-releasing matrix particles to form granules, which is largely accomplished by granulation. The mold and cohesive inhibiting agent, if used, can be added at any suitable time and, in some embodiments, mixed with the grain-based substrate in the desired proportions prior to granulation of the grain-based substrate. The moisture content in the granulate mill in some embodiments is in the ranges set forth above with respect to the moisture content in the finished product and, in some embodiments, is approximately 14-15%. In some embodiments, moisture is added to the raw material in the form of an aqueous enzyme preparation to adjust the raw material to this moisture content. The temperature in the granulate mill in some embodiments is brought up to about 82 ° C with steam. The granulate mill can be operated in any condition that imparts sufficient work to the raw material to provide granules. The granulation process itself is an inexpensive process to remove water from the enzyme-containing composition.

Las composiciones y los métodos divulgados en la presente pueden ponerse en práctica conjuntamente con la administración de prebióticos, que son azúcares de alto peso molecular, tales como fructo-oligosacáridos (FOS); galacto-oligosacáridos (GOS), material GRAS (generalmente reconocido como seguro). Estos prebióticos pueden ser metabolizados por algunas bacterias ácido lácticas (LAB) probióticas. No son digeribles por la mayoría de los microbios intestinales. The compositions and methods disclosed herein can be practiced in conjunction with the administration of prebiotics, which are high molecular weight sugars, such as fructo-oligosaccharides (FOS); galacto-oligosaccharides (GOS), GRAS material (generally recognized as safe). These prebiotics can be metabolized by some probiotic lactic acid bacteria (LAB). They are not digestible by most gut microbes.

Tratamiento y procesamiento de alimentos Food processing and processing

Existen alimentos y piensos que comprenden enzimas divulgadas en la presente y métodos para usar enzimas divulgadas en la presente en el procesamiento de alimentos y piensos. Las enzimas aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasas divulgadas en la presente tienen numerosas aplicaciones en la industria del procesamiento de alimentos. Existen métodos para hidrolizar composiciones que comprenden celulosa incluyendo, por ejemplo, una célula de planta, una célula bacteriana, una célula de levadura, una célula de insecto o un animal o cualquier planta o parte de planta o cualquier alimento o pienso o un producto de desecho y similares. There are foods and feeds that comprise enzymes disclosed herein and methods of using enzymes disclosed herein in food and feed processing. The aldolase enzymes, such as pyruvate aldolase, HMG and / or KHG aldolases disclosed herein have numerous applications in the food processing industry. There are methods of hydrolyzing compositions comprising cellulose including, for example, a plant cell, a bacterial cell, a yeast cell, an insect cell or an animal or any plant or part of a plant or any food or feed or a product of waste and the like.

Por ejemplo, existen alimentos o piensos que comprenden una enzima aldolasa, tal como piruvato aldolasa, HMG y/o KHG aldolasa, divulgada en la presente, tal como en un pienso, un líquido, tal como una bebida (tal como un jugo de fruta o una cerveza), un pan o una masa o un producto panificado o un precursor de una bebida (tal como una cerveza o mosto). For example, there are foods or feeds that comprise an aldolase enzyme, such as pyruvate aldolase, HMG, and / or KHG aldolase, disclosed herein, such as in a feed, a liquid, such as a beverage (such as fruit juice or a beer), a bread or a dough or a baked product or a precursor of a drink (such as a beer or must).

Los procesos de tratamiento de alimentos divulgados en la presente también pueden incluir el uso de cualquier combinación de otras enzimas tales como triptofanasas o tirosina descarboxilasas, lacasas, catalasas, lacasas, otras aldolasas, celulasas, endoglicosidasas, endo-beta-1,4-lacasas, amiloglucosidasas, glucosidasas, glucosa isomerasas, glicosiltransferasas, lipasas, fosfolipasas, lipooxigenasas, beta-lacasas, endo-beta-1,3(4)-lacasas, cutinasas, peroxidasas, amilasas, fitasas, glucoamilasas, pectinasas, reductasas, oxidasas, descarboxilasas, fenoloxidasas, ligninasas, pululanasas, arabinanasas, hemicelulasas, mananasas, xilolacasas, xilanasas, pectín acetil esterasas, rhamnogalacturonan acetil esterasas, proteasas, peptidasas, proteinasas, poligalacturonasas, rhamnogalacturonasas, galactanasas, pectín liasas, transglutaminasas, pectín metilesterasas, celobiohidrolasas y/o transglutaminasas The food treatment processes disclosed herein may also include the use of any combination of other enzymes such as tryptophanases or tyrosine decarboxylases, laccases, catalases, laccases, other aldolases, cellulases, endoglycosidases, endo-beta-1,4-laccases. , amyloglucosidases, glucosidases, glucose isomerases, glycosyltransferases, lipases, phospholipases, lipoxygenases, beta-laccases, endo-beta-1,3 (4) -laccases, cutinases, peroxidases, amylases, phytases, glucoamylases, pectinases, reductases, , phenoloxidases, ligninases, pullulanases, arabinanases, hemicellulases, mannanases, xylolacases, xylanases, pectin acetyl esterases, rhamnogalacturonan acetyl esterases, proteases, peptidases, transinases, polygalacturonases, rhamnogalacturonases, galactanases, galactanases

Composiciones farmacéuticas y complementos dietéticos Pharmaceutical compositions and dietary supplements

Existen composiciones farmacéuticas y complementos dietéticos (tales como auxiliares dietéticos) que comprenden una aldolasa divulgada en la presente. La actividad de aldolasa comprende actividad de piruvato aldolasa, HMG y/o KHG aldolasa. En algunas realizaciones, las composiciones farmacéuticas y los complementos dietéticos (tales como auxiliares dietéticos) se formulan para la ingestión oral. There are pharmaceutical compositions and dietary supplements (such as dietary aids) that comprise an aldolase disclosed herein. Aldolase activity comprises pyruvate aldolase, HMG and / or KHG aldolase activity. In some embodiments, the pharmaceutical compositions and dietary supplements (such as dietary aids) are formulated for oral ingestion.

Los compuestos de tratamiento periodontal pueden comprender una enzima divulgada en la presente, tal como se describe en la Patente de los Estados Unidos No. 6.776.979. Las composiciones y métodos para el tratamiento o la profilaxis del síndrome del intestino ácido pueden comprender una enzima divulgada en la presente, tal como se describe en la Patente de los Estados Unidos No. 6.468.964. Periodontal treatment compounds may comprise an enzyme disclosed herein, such as described in US Patent No. 6,776,979. Compositions and methods for the treatment or prophylaxis of acid bowel syndrome can comprise an enzyme disclosed herein, as described in US Patent No. 6,468,964.

En otras realizaciones, apósitos para heridas, implantes y similares comprenden enzimas antimicrobianas (tales como antibióticas), incluida una enzima divulgada en la presente (incluidas, por ejemplo, secuencias divulgadas en la presente). Las enzimas divulgadas en la presente también pueden usarse en apósitos de alginato, apósitos de barrera antimicrobiana, apósitos para quemaduras, vendajes vendas de compresión, herramientas de diagnóstico, apósitos de gel, apósitos hidrocelulares (de espuma), apósitos hidrocoloides, apósitos I.V., campos de incisión, apósitos de baja adherencia, apósitos absorbentes de olores, vendas de pasta, apósitos post-operatorios, manejo de cicatrices, cuidado de la piel, apósitos de película transparente y/o cicatrización de heridas. Las enzimas divulgadas en la presente pueden usarse en la limpieza de heridas, en la preparación del lecho de heridas, para tratar úlceras por presión, úlceras en las piernas, quemaduras, úlceras de pie diabético, cicatrices, fijación I.V., heridas quirúrgicas y heridas menores. Las enzimas divulgadas en la presente pueden usarse en composiciones de desbridamiento enzimático estériles, tales como ungüentos. En varias realizaciones, la aldolasa se formula como un comprimido, gel, píldora, implante, líquido, aerosol, película, micela, polvo, alimento, granulado de pienso o como una formulación encapsulada. In other embodiments, wound dressings, implants, and the like comprise antimicrobial enzymes (such as antibiotics), including an enzyme disclosed herein (including, for example, sequences disclosed herein). The enzymes disclosed herein can also be used in alginate dressings, antimicrobial barrier dressings, burn dressings, compression bandages, diagnostic tools, gel dressings, hydrocellular (foam) dressings, hydrocolloid dressings, IV dressings, fields Incision, low-adhesion dressings, odor absorbent dressings, paste bandages, post-operative dressings, scar management, skin care, transparent film dressings and / or wound healing. The enzymes disclosed herein can be used in wound cleansing, in wound bed preparation, to treat pressure ulcers, leg ulcers, burns, diabetic foot ulcers, scars, IV fixation, surgical wounds, and minor wounds . The enzymes disclosed herein can be used in sterile enzyme debridement compositions, such as ointments. In various embodiments, aldolase is formulated as a tablet, gel, pill, implant, liquid, aerosol, film, micelle, powder, food, feed granulate, or as an encapsulated formulation.

Las composiciones farmacéuticas y los complementos dietéticos divulgados en la presente también pueden incluir el uso de cualquier combinación de otras enzimas, tales como beta-galactosidasas, catalasas, lacasas, celulasas, otras aldolasas, endoglicosidasas, endo-beta-1,4-lacasas, amiloglucosidasas, glucosidasas, glucosa isomerasas, glicosiltransferasas, lipasas, fosfolipasas, lipooxigenasas, beta-lacasas, endo-beta-1,3(4)-lacasas, cutinasas, peroxidasas, amilasas, fitasas, glucoamilasas, pectinasas, reductasas, oxidasas, descarboxilasas, fenoloxidasas, ligninasas, pululanasas, arabinanasas, hemicelulasas, mananasas, xilolacasas, xilanasas, pectín acetil esterasas, rhamnogalacturonan acetil esterasas, proteasas, peptidasas, proteinasas, poligalacturonasas, rhamnogalacturonasas, galactanasas, pectín liasas, transglutaminasas, pectín metilesterasas, celobiohidrolasas y/o transglutaminasas. The pharmaceutical compositions and dietary supplements disclosed herein may also include the use of any combination of other enzymes, such as beta-galactosidases, catalases, laccases, cellulases, other aldolases, endoglycosidases, endo-beta-1,4-laccases, amyloglucosidases, glucosidases, glucose isomerases, glycosyltransferases, lipases, phospholipases, lipoxygenases, beta-laccases, endo-beta-1,3 (4) -laccases, cutinases, peroxidases, amylases, phytases, glucoamylases, pectinases, reductases, Phenoloxidases, ligninases, pullulanases, arabinanases, hemicellulases, mannanases, xylolarases, xylanases, pectin acetyl esterases, rhamnogalacturonan acetyl esterases, proteases, peptidases, translutains, translutains, galactanases, galactanases, galactanases

Vías biosintéticas para producir R,R y otros estereoisómeros de monatina Biosynthetic pathways to produce R, R and other monatin stereoisomers

Tal como se describe, entre otros, en el documento WO 03/091396 A2 (ver las Figuras 1-3 y 11-13), la monatina puede producirse a partir de triptófano a través de una vía de múltiples etapas que implica conversiones biológicas (es decir, que facilita la reacción de un sustrato para formar un producto con un polipéptido). Una vía descrita implica convertir biológicamente el triptófano en indol-3-piruvato, convertir biológicamente indol-3-piruvato en ácido 2-hidroxi 2-(indol-3-ilmetil)-4-ceto glutárico (“MP”) y convertir biológicamente el MP en monatina. En algunas realizaciones, los polipéptidos divulgados en la presente pueden usarse para facilitar la reacción de indol-3-piruvato para formar MP. En algunas realizaciones, los polipéptidos divulgados en la presente pueden usarse para facilitar preferentemente la producción de R-MP. As described, inter alia, in WO 03/091396 A2 (see Figures 1-3 and 11-13), monatin can be produced from tryptophan via a multi-stage pathway involving biological conversions ( that is, it facilitates the reaction of a substrate to form a product with a polypeptide). One disclosed route involves biologically converting tryptophan to indole-3-pyruvate, biologically converting indole-3-pyruvate to 2-hydroxy 2- (indole-3-ylmethyl) -4-keto glutaric acid ("MP"), and biologically converting the MP in monatina. In some embodiments, the polypeptides disclosed herein can be used to facilitate the reaction of indole-3-pyruvate to form MP. In some embodiments, the polypeptides disclosed herein can be used to preferably facilitate the production of R-MP.

En algunas realizaciones, uno o más polipéptidos seleccionados de polipéptidos aislados o recombinantes de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ED NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 o fragmentos o subsecuencias de los mismos que tienen actividad de aldolasa pueden ser útiles para facilitar una reacción dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. En una realización, los polipéptidos con actividad de aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos. In some embodiments, one or more polypeptides selected from isolated or recombinant polypeptides of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12 , SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO : 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62 , SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO : 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112 , SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ED NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, S EQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 2 60, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334 or fragments or subsequences thereof that have aldolase activity may be useful in facilitating a reaction within a multistage pathway to producing a selected product of monatin, monatin derivatives, salts thereof, and combinations thereof as further defined in the claims. In one embodiment, aldolase-active polypeptides may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives , salts thereof and combinations thereof.

En otra realización, uno o más polipéptidos seleccionados de polipéptidos aislados o recombinantes con actividad de HMG aldolasa de cualquiera de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304 o fragmentos o subsecuencias de los mismos que tienen actividad de aldolasa pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos, tal como se define adicionalmente en las reivindicaciones. En una realización, los polipéptidos con actividad de HMG aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos. In another embodiment, one or more polypeptides selected from isolated or recombinant polypeptides with HMG aldolase activity of any of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, I KNOW Q ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304 or Fragments or subsequences thereof that have aldolase activity may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a step within a multi-step pathway to produce a selected monatin product derived from monatin, salts thereof, and combinations thereof, as further defined in the claims. In one embodiment, polypeptides with HMG aldolase activity may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product derived from monatin, salts thereof, and combinations thereof.

En otra realización adicional, uno o más polipéptidos seleccionados de polipéptidos aislados o recombinantes con actividad de KHG aldolasa de cualquiera de SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 o fragmentos o subsecuencias de las mismas que tienen actividad aldolasa pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos, tal como se define adicionalmente en las reivindicaciones. En una realización, los polipéptidos con actividad de KHG aldolasa pueden ser útiles para facilitar una reacción en la cual el indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos. In yet another embodiment, one or more polypeptides selected from isolated or recombinant polypeptides with KHG aldolase activity of any of SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO : 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330 , SEQ ID NO: 332 or SEQ ID NO: 334 or fragments or subsequences thereof having aldolase activity may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a step within a pathway of multiple steps to produce a selected monatin product, monatin derivatives, salts thereof, and combinations thereof, as further defined in the claims. In one embodiment, polypeptides with KHG aldolase activity may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, derivatives monatin, salts thereof and combinations thereof.

Adicionalmente, uno o más polipéptidos codificados por una o más secuencias de ácidos nucleicos que tienen al menos aproximadamente 95%, 96%, 97%, 98%, 99% o más, o una identidad de secuencia completa (100%) con un ácido nucleico divulgado en la presente, incluyendo SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos o combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. En una realización, el o los polipéptidos, o fragmentos o subsecuencias de los mismos con actividad de aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. Additionally, one or more polypeptides encoded by one or more nucleic acid sequences having at least about 95%, 96%, 97%, 98%, 99% or more, or full sequence identity (100%) with an acid nucleic acid disclosed herein, including SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO : 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47 , SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO : 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97 , SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID N O: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, I KNOW THAT ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 253, SEQ ID NO: 253, SEQ ID NO : 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271 , SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 303, SEQ ID NO: 303, SEQ ID NO : 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321 , SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives , salts thereof or combinations thereof as further defined in the claims. In one embodiment, the polypeptide (s), or fragments or subsequences thereof with aldolase activity may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to producing a selected product of monatin, monatin derivatives, salts thereof, and combinations thereof as further defined in the claims.

Uno o más polipéptidos con actividad de HMG aldolasa codificada por una secuencia de ácidos nucleicos que tiene al menos aproximadamente 95%, 96%, 97%, 98%, 99% o más, o una identidad de secuencia completa (100%) con un ácido nucleico de acuerdo con la invención, incluyendo SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de la misma o combinaciones de la misma tal como se define en las reivindicaciones. En una realización, el o los polipéptidos con actividad de HMG aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define en las reivindicaciones. One or more polypeptides with HMG aldolase activity encoded by a nucleic acid sequence having at least about 95%, 96%, 97%, 98%, 99% or more, or full sequence identity (100%) with a nucleic acid according to the invention, including SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13 , SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO : 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63 , SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO : 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a step within a multi-step pathway to produce a selected product of monatin, monatin derivatives, salts of the the same or combinations thereof as defined in the claims. In one embodiment, the HMG aldolase-active polypeptide or polypeptides may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives, salts thereof and combinations thereof as defined in the claims.

Uno o más polipéptidos con actividad de KHG aldolasa codificada por una secuencia de ácidos nucleicos que tiene al menos aproximadamente 95%, 96%, 97%, 98%, 99% o más, o una identidad de secuencia completa (100%) con un ácido nucleico tal como se define en las reivindicaciones, incluyendo SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. En una realización, el o los polipéptidos con actividad de KHG aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. One or more polypeptides with KHG aldolase activity encoded by a nucleic acid sequence having at least about 95%, 96%, 97%, 98%, 99% or more, or full sequence identity (100%) with a nucleic acid as defined in the claims, including SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO : 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335 , SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a step within a multi-step pathway to produce a product selected from monatin, monatin derivatives, salts thereof, and combinations thereof as further defined in the claims. In one embodiment, the polypeptide or polypeptides with KHG aldolase activity may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives, salts thereof and combinations thereof as further defined in the claims.

Asimismo, uno o más polipéptidos con actividad de aldolasa codificada por una secuencia de ácidos nucleicos se que hibrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como une tapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define en las reivindicaciones. En una realización, el o los polipéptidos con actividad de aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define en las reivindicaciones. Likewise, one or more polypeptides with aldolase activity encoded by a nucleic acid sequence hybridizes under stringent conditions with a nucleic acid of SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 11 7, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ IDNO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a cap within a pathway. multiple steps to produce a selected monatin product, monatin derivatives, salts thereof and combinations thereof as defined in the claims. In one embodiment, the aldolase-active polypeptide (s) may be useful to facilitate a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, derivatives monatin, salts thereof and combinations thereof as defined in the claims.

Uno o más polipéptidos con actividad de HMG aldolasa codificados por una secuencia de ácidos nucleicos que se hibrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:11, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define en las reivindicaciones. En una realización, el o los polipéptidos con actividad de HMG aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define en las reivindicaciones. One or more polypeptides with HMG aldolase activity encoded by a nucleic acid sequence that hybridizes under stringent conditions with a nucleic acid of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 , SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO : 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57 , SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO : 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107 , SEQ ID NO: 109, SEQ ID NO: 11, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO : 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151 , SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO : 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201 , SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO : 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251 , SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO : 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 , SEQ ID NO: 303, SEQ ID NO: 305, may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives, salts thereof and combinations thereof as defined in the claims. In one embodiment, the HMG aldolase-active polypeptide or polypeptides may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives, salts thereof and combinations thereof as defined in the claims.

Uno o más polipéptidos con actividad de KHG aldolasa codificados por una secuencia de ácidos nucleicos que se hibrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3 como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. En una realización, el o los polipéptidos con actividad de KHG aldolasa pueden ser útiles para facilitar una reacción en la cual indol-3-piruvato se convierte en MP como una etapa dentro de una vía de múltiples etapas para producir un producto seleccionado de monatina, derivados de monatina, sales de los mismos y combinaciones de los mismos tal como se define adicionalmente en las reivindicaciones. One or more polypeptides with KHG aldolase activity encoded by a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid of SEQ ID NO: 307, SEQ ID NO: 301, SEQ ID NO: 313 , SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337, and SEQ ID NO: 338 can be helpful in facilitating a reaction between indole-3-pyruvate and a source C3 carbon as a step within a multi-step pathway to produce a selected product of monatin, monatin derivatives, salts thereof, and combinations thereof as further defined in the claims. In one embodiment, the polypeptide or polypeptides with KHG aldolase activity may be useful in facilitating a reaction in which indole-3-pyruvate is converted to MP as a step within a multi-step pathway to produce a selected monatin product, monatin derivatives, salts thereof and combinations thereof as further defined in the claims.

Los polipéptidos con actividad de aldolasa descritos en la presente en la presente pueden ser útiles para facilitar una reacción entre indol-3-piruvato y una fuente de carbono C3. La fuente de carbono C3 puede ser, a modo no taxativo, oxaloacetato, piruvato o un derivado de piruvato, tal como fosfoenolpiruvato. En una realización, la fuente de carbono C3 es piruvato. The aldolase-active polypeptides described herein may be useful in facilitating a reaction between indole-3-pyruvate and a C3 carbon source. The C3 carbon source may be, non-exhaustively, oxaloacetate, pyruvate or a pyruvate derivative, such as phosphoenolpyruvate. In one embodiment, the C3 carbon source is pyruvate.

Ejemplos de enzimas útiles para la conversión del producto de reacción entre indol-3-piruvato y la fuente de carbono C3 a monatina incluyen miembros de las clases de enzimas: triptófano aminotransferasas (2.6.1.27), triptófano deshidrogenasas (1.4.1.19), D-aminoácido deshidrogenasas (1.4.99.1), glutamato deshidrogenasas (1.4.1.2-4), fenilalanina deshidrogenasa (EC 1.4.1.20), triptófano-fenilpiruvato transaminasas (2.6.1.28), o más generalmente miembros de la familia de la aminotransferasa (2.6.1.-) tal como aspartato aminotransferasa (EC 2.6.1.1), tirosina aminotransferasa (aromática) (2.6.1.5), D-triptófano aminotransferasa o D-alanina aminotransferasa (2.6.1.21) (ver la Figura 2 del documento WO 03/091396 A2). Esta reacción también puede llevarse a cabo usando reacciones químicas. La aminación del cetoácido (MP) se lleva a cabo por aminación reductiva usando amoníaco y cianoborohiduro de sodio. Las Figuras 11-13 del documento WO 03/091396 A2 muestran polipéptidos adicionales que pueden usarse para convertir MP a monatina, así como para proporcionar mayores rendimientos de monatina a partir de indol-3-piruvato o triptófano. En una realización, estas enzimas se utilizan para catalizar la conversión de MP, el producto de reacción entre indol-3-piruvato y piruvato, a monatina. Examples of enzymes useful for the conversion of the reaction product between indole-3-pyruvate and the C3 carbon source to monatin include members of the enzyme classes: tryptophan aminotransferases (2.6.1.27), tryptophan dehydrogenases (1.4.1.19), D -amino acid dehydrogenases (1.4.99.1), glutamate dehydrogenases (1.4.1.2-4), phenylalanine dehydrogenase (EC 1.4.1.20), tryptophan-phenylpyruvate transaminases (2.6.1.28), or more generally members of the aminotransferase family (2.6 .1.-) such as aspartate aminotransferase (EC 2.6.1.1), tyrosine aminotransferase (aromatic) (2.6.1.5), D-tryptophan aminotransferase or D-alanine aminotransferase (2.6.1.21) (see Figure 2 of document WO 03 / 091396 A2). This reaction can also be carried out using chemical reactions. The amination of the keto acid (MP) is carried out by reductive amination using ammonia and sodium cyanoborohydide. Figures 11-13 of WO 03/091396 A2 show additional polypeptides that can be used to convert MP to monatin, as well as to provide higher yields of monatin from indole-3-pyruvate or tryptophan. In one embodiment, these enzymes are used to catalyze the conversion of MP, the reaction product between indole-3-pyruvate and pyruvate, to monatin.

El perfil de sabor de una composición de monatina puede alterarse controlando la cantidad relativa de los varios estereoisómeros de monatina en la composición. La presente invención proporciona vías y sustancias para producir composiciones de monatina con un porcentaje deseado de Monatina R,R y/o (S,R)-monatina. The flavor profile of a monatin composition can be altered by controlling the relative amount of the various monatin stereoisomers in the composition. The present invention provides routes and substances to produce monatin compositions with a desired percentage of Monatin R, R and / or (S, R) -monatin.

La quiralidad de los compuestos de monatina producidos por las vías divulgadas puede verse afectada tanto por pH como por los polipéptidos usados para las conversiones biológicas. Los polipéptidos con actividad de aldolasa descritos en la presente, pueden utilizarse para controlar la quiralidad del carbono-2 de monatina (ver la Fórmula I anterior) en la reacción en la cual indol-3-piruvato se convierte en MP. The chirality of monatin compounds produced by the disclosed pathways can be affected by both pH and the polypeptides used for biological conversions. The aldolase-active polypeptides described herein can be used to control monatin carbon-2 chirality (see Formula I above) in the reaction in which indole-3-pyruvate is converted to MP.

Una vez que el producto de reacción de la reacción entre indol-3-piruvato y la fuente de carbono C3 se produce, puede agregarse el grupo amino estereoespecíficamente. La configuración R o S del carbono-4 (ver la Fórmula I anterior) puede generarse dependiendo de si se usa la ácido aromático D o L aminotransferasa. Muchas aminotransferasas son específicas para el isómero L; sin embargo, las D-triptófano aminotransferasas existen en ciertas plantas (Kohiba y Mito, Procedimientos del 8vo Simposio Internacional sobre Vitamina B6 y catálisis de carbonilo, Osaka, Japón 1990). Además, se han identificado las D-alanina aminotransferasas (2.6.1.21), Dmetionina-piruvato aminotransferasas (2.6.1.41) y (R)-3-amino-2-metilpropanoato aminotansferasas (2.6.1.61), (S)-3amino-2-metilpropanoato aminotransferasa (2.6.1.22) y D-fenilglicina aminotransferasa. Ciertas aminotransferasas pueden aceptar sólo el sustrato por esta reacción con una configuración particular en el carbono C2. Por lo tanto, incluso si la conversión al producto de reacción entre indol-3-piruvato y la fuente de carbono 3 no es estereoespecífica, la estereoquímica del producto final puede controlarse a través de la selección apropiada de aminotransferasa. Dado que las reacciones son reversibles, el producto de reacción sin reaccionar (isómero no deseado) puede reciclarse nuevamente en forma de sus constituyentes y una mezcla racémica del producto de reacción puede volver a formarse. Once the reaction product of the reaction between indole-3-pyruvate and the C3 carbon source is produced, the stereospecific amino group can be added. The R or S configuration of carbon-4 (see Formula I above) can be generated depending on whether aromatic acid D or L aminotransferase is used. Many aminotransferases are specific for the L-isomer; however, D-tryptophan aminotransferases exist in certain plants (Kohiba and Mito, Proceedings of the 8th International Symposium on Vitamin B6 and Carbonyl Catalysis, Osaka, Japan 1990). In addition, D-alanine aminotransferases (2.6.1.21), Dmethionine-pyruvate aminotransferases (2.6.1.41) and (R) -3-amino-2-methylpropanoate aminotansferases (2.6.1.61), (S) -3amino- have been identified. 2-methylpropanoate aminotransferase (2.6.1.22) and D-phenylglycine aminotransferase. Certain aminotransferases can accept only the substrate by this reaction with a particular configuration at the C2 carbon. Therefore, even if the conversion to the reaction product between indole-3-pyruvate and the carbon 3 source is not stereospecific, the stereochemistry of the final product can be controlled through the appropriate selection of aminotransferase. Since the reactions are reversible, the unreacted reaction product (unwanted isomer) can be recycled back to its constituents, and a racemic mixture of the reaction product can be re-formed.

Un ejemplo de un donante amino adecuado para la adición de un grupo amino a un producto de la reacción entre el indol-3-piruvato y la fuente de carbono C3 incluye, a modo no taxativo, un aminoácido, tal como alanina, aspartato, lisina, glutamato, glicina y triptófano. An example of an amino donor suitable for addition of an amino group to a product of the reaction between indole-3-pyruvate and the C3 carbon source includes, but is not limited to, an amino acid, such as alanine, aspartate, lysine , glutamate, glycine and tryptophan.

Con referencia ahora a las figuras, cabe señalar lo siguiente. Las gráficas de flujo identifican vías para producir monatina, pero no se limitan a un método particular para poner en práctica las vías. Por ejemplo, las vías pueden ponerse en práctica in vivo, in vitro o una combinación de los mismos. With reference now to the figures, the following should be noted. Flow charts identify pathways to produce monatin, but are not limited to a particular method of implementing the pathways. For example, the pathways can be practiced in vivo, in vitro, or a combination thereof.

Asimismo, poner en práctica las vías no requiere que cada uno de los componentes identificados (tales como reactivos y enzimas) sean proporcionados explícitamente por el profesional de la salud, en la medida en que se proporcionen suficientes componentes, o fuentes de compuestos, y condiciones de reacción de forma tal que la vía pueda proceder potencialmente. En otras palabras, por ejemplo, si una figura representa un proceso para producir una composición de monatina, que incluye producir indol-3-piruvato a partir de L-triptófano, producir ácido 2-hidroxi 2-(indol-3-ilmetil)-4-ceto glutárico (“precursor de monatina” o “MP”) a partir de indol-3-piruvato, y producir monatina a partir de MP, en donde cada reacción se facilita por medio de una enzima apropiada, se contempla que poner en práctica la vía incluye combinar L-triptófano con a-cetoglutarato y enzimas contempladas para facilitar las reacciones identificadas, y en condiciones adecuadas para que cada una de las reacciones ocurra sin proporcionar explícitamente también indol-3-piruvato o MP. En ese caso, el L-triptófano podría reaccionar con a-cetoglutarato para producir indol-3-piruvato. Debido a las condiciones fijadas y la enzima proporcionada, el indol-3-piruvato producido a partir de la reacción de L-triptófano podría reaccionar para formar MP, y luego debido a las condiciones establecidas y la enzima proporcionada, el MP producido a partir de la reacción de indol-3-piruvato podría reaccionar para formar monatina. Furthermore, implementing the pathways does not require that each of the identified components (such as reagents and enzymes) be explicitly provided by the healthcare professional, to the extent that sufficient components, or sources of compounds, and conditions are provided. of reaction so that the route can potentially proceed. In other words, for example, if a figure represents a process for producing a monatin composition, which includes producing indole-3-pyruvate from L-tryptophan, producing 2-hydroxy 2- (indole-3-ylmethyl) acid - 4-keto glutaric ("monatin precursor" or "MP") from indole-3-pyruvate, and producing monatin from MP, where each reaction is facilitated by an appropriate enzyme, it is contemplated that Practice the pathway includes combining L-tryptophan with α-ketoglutarate and contemplated enzymes to facilitate the identified reactions, and under conditions suitable for each reaction to occur without explicitly also providing indole-3-pyruvate or MP. In that case, L-tryptophan could react with α-ketoglutarate to produce indole-3-pyruvate. Due to the conditions set and the enzyme provided, the indole-3-pyruvate produced from the L-tryptophan reaction could react to form MP, and then due to the established conditions and the enzyme provided, the MP produced from the indole-3-pyruvate reaction could react to form monatin.

También cabe señalar que las vías representadas no requieren que el profesional de la salud proporcione explícitamente los materiales de partida o enzimas identificados. En otras palabras, se contempla que la práctica de cualquiera de las vías que identifican L-triptófano como un material de partida incluirían proporcionar un compuesto que puede producir L-triptófano, en condiciones adecuadas para que ocurra la producción de L-triptófano y combinar dicho compuesto con enzimas capaces de facilitar la serie de reacciones establecidas en condiciones que serían adecuadas para que ocurran dichas reacciones. Como otro ejemplo, se contempla también que poner en práctica la vía identificada incluiría proporcionar un microorganismo genéticamente manipulado para producir monatina de acuerdo con la vía descrita, y proporcionar condiciones apropiadas para que ocurra el proceso de fermentación. Por ejemplo, un microorganismo, que naturalmente produce grandes cantidades de L-triptófano, podría manipularse genéticamente para producir o sobreproducir una o más de las enzimas usadas para facilitar las reacciones en la vía a monatina, y se podrían proporcionar condiciones apropiadas para que así el microorganismo produzca monatina. It should also be noted that the pathways depicted do not require the health care provider to explicitly supply the identified starting materials or enzymes. In other words, it is contemplated that practicing any of the pathways that identify L-tryptophan as a starting material would include providing a compound that can produce L-tryptophan, under conditions suitable for L-tryptophan production to occur and combining such compound with enzymes capable of facilitating the series of reactions established under conditions that would be suitable for said reactions to occur. As another example, it is also contemplated that practicing the identified route would include providing a genetically engineered microorganism to produce monatin according to the described route, and providing appropriate conditions for the fermentation process to occur. For example, a microorganism, which naturally produces large amounts of L-tryptophan, could be genetically engineered to produce or overproduce one or more of the enzymes used to facilitate reactions on the monatin pathway, and appropriate conditions could be provided so that the microorganism produce monatin.

La Figura 1 identifica la realización particular en la que una aldolasa R-específica facilita la reacción de indol-3piruvato y piruvato para formar R-MP. La gráfica de flujo de la Figura 1 representa esquemáticamente un proceso de acuerdo con la invención para realizar una composición de monatina que incluye (R,R)-monatina. Como se muestra en la Figura 1, la vía general implica una reacción de triptófano para formar indol-3-piruvato para producir MP, y una reacción de MP para producir monatina, incluida (R,R)-monatina. Figure 1 identifies the particular embodiment in which an R-specific aldolase facilitates the reaction of indole-3-pyruvate and pyruvate to form R-MP. The flow chart in Figure 1 schematically represents a process according to the invention for making a monatin composition including (R, R) -monatin. As shown in Figure 1, the general route involves a reaction of tryptophan to form indole-3-pyruvate to produce MP, and a reaction of MP to produce monatin, including (R, R) -monatin.

La Figura 1 ilustra además permutaciones específicas de esta vía general, diseñadas para aumentar la producción de la forma R,R de monatina a costa de las formas S,S, R,S y S,R de monatina. En particular, la Figura 1 ilustra la realización en donde: la enzima aminotransferasa utilizada en la reacción de L-triptófano tiene mayor actividad y/o especificidad para dicha reacción con respecto a las reacciones de MP y monatina 4S o la oxidasa tiene mayor actividad y/o especificidad para el L-triptófano que para la monatina 4R; la enzima que facilita la reacción de indol-3piruvato es un polipéptido con actividad de aldolasa divulgado en la presente y la enzima que facilita la reacción de MP es una enzima D de especificidad amplia, preferiblemente evolucionada para funcionar de manera más eficiente con el isómero R de MP. Figure 1 further illustrates specific permutations of this general pathway designed to increase the production of monatin form R, R at the expense of monatin forms S, S, R, S, and S, R. In particular, Figure 1 illustrates the embodiment where: the aminotransferase enzyme used in the L-tryptophan reaction has greater activity and / or specificity for said reaction with respect to the reactions of MP and monatin 4S or the oxidase has greater activity and / or specificity for L-tryptophan than for 4R monatin; the enzyme that facilitates the reaction of indole-3-pyruvate is a polypeptide with aldolase activity disclosed herein and the enzyme that facilitates the reaction of MP is a broad specificity D enzyme, preferably evolved to function more efficiently with the R isomer of MP.

La Figura 1 también ilustra permutaciones particulares diseñadas para hacer más económica la producción de (R,R)monatina. Por ejemplo, en la Figura 1, el L-triptófano— a diferencia del D-triptófano o combinaciones de L- y Dtriptófano—se identifica como el material de partida. Mientras que la elección de la forma específica de triptófano no afecta la quiralidad de los compuestos de monatina finales en la composición de monatina (porque la reacción de triptófano forma indol-3-piruvato, que no tiene quiralidad), algunos pueden preferir utilizar L-triptófano como material de partida al menos porque el L-triptófano es actualmente menos costoso y puede obtenerse más fácilmente que el D-triptófano. Figure 1 also illustrates particular permutations designed to make the production of (R, R) monatin more economical. For example, in Figure 1, L-tryptophan — unlike D-tryptophan or combinations of L- and D-tryptophan — is identified as the starting material. While the choice of the specific form of tryptophan does not affect the chirality of the final monatin compounds in the monatin composition (because the tryptophan reaction forms indole-3-pyruvate, which has no chirality), some may prefer to use L- tryptophan as a starting material at least because L-tryptophan is currently less expensive and can be obtained more easily than D-tryptophan.

Enfocándonos ahora en la primera reacción que se muestra en la Figura 1, cuando el triptófano se convierte en indol-3-piruvato cualquiera de uno o más de alfa-cetoglutarato, oxaloacetato y piruvato reacciona para formar un aminoácido (glutamato, aspartato y alanina, respectivamente). La Figura 1 representa la realización en donde el material de partida de triptófano es L-triptófano, y el alfa-cetoglutarato, oxaloacetato y/o piruvato producen la forma isomérica L del aminoácido (tal como L-glutamato, L-aspartato y/o L-alanina, respectivamente). Focusing now on the first reaction shown in Figure 1, when tryptophan is converted to indole-3-pyruvate any one or more of alpha-ketoglutarate, oxaloacetate, and pyruvate reacts to form an amino acid (glutamate, aspartate, and alanine, respectively). Figure 1 depicts the embodiment where the tryptophan starting material is L-tryptophan, and alpha-ketoglutarate, oxaloacetate and / or pyruvate produce the L-isomeric form of the amino acid (such as L-glutamate, L-aspartate and / or L-Alanine, respectively).

Como se muestra en la Figura 1, un abordaje para mejorar la producción de derivados de (R,R)-monatina implica facilitar la reacción de L-triptófano con una enzima que tiene mayor especificidad, mayor actividad o ambas para triptófano a diferencia de MP o monatina, y facilita la reacción de MP con una enzima D. Como se divulga en el documento WO 03/091396 A2, ciertas enzimas pueden facilitar la reacción de triptófano para producir indol-3piruvato, así como la reacción de aminación de MP para producir monatina. El uso de una L-aminotransferasa en la etapa de aminación crea un centro quiral S en la posición C-4 de monatina, mientras que el uso de una enzima D crea un centro quiral en la posición C-4 de monatina. Por lo tanto, en el caso en el que L-aminotransferasa, que facilita la reacción de triptófano, es también activo en la reacción de MP, puede formarse (R,S)- y (S,S)-monatina, dependiendo de la forma de MP presente. Además, ciertas otras enzimas—las L-aminoácido oxidasas—pueden no sólo facilitar la reacción de triptófano para formar indol-3-piruvato, pero puede tener una actividad secundaria para la degradación de (R,R)-monatina. De acuerdo con algunas realizaciones, esta actividad secundaria de 4R es minimizada o eliminada. Una actividad secundaria de oxidasa en las formas 4S de monatina las reduciría o minimizaría del producto final y podría ser deseable dependiendo en la composición final deseada. Por consiguiente, cuanto mayor sea la especificidad y/o actividad de la enzima L seleccionada para triptófano con respecto al MP o monatina, mayor será la cantidad de R,R y S,R producida con respecto a la (S,S)- y (R,S)-monatina. As shown in Figure 1, an approach to improve the production of (R, R) -monatin derivatives involves facilitating the reaction of L-tryptophan with an enzyme that has higher specificity, higher activity, or both for tryptophan unlike MP or monatin, and facilitates the reaction of MP with a D enzyme. As disclosed in WO 03/091396 A2, certain enzymes can facilitate the reaction of tryptophan to produce indole-3-pyruvate, as well as the amination reaction of MP to produce monatina. The use of an L-aminotransferase in the amination stage creates a chiral center S at position C-4 of monatin, while the use of an enzyme D creates a chiral center at position C-4 of monatin. Therefore, in the case where L-aminotransferase, which facilitates the tryptophan reaction, is also active in the MP reaction, (R, S) - and (S, S) -monatin can be formed, depending on the MP form present. Furthermore, certain other enzymes — L-amino acid oxidases — may not only facilitate the reaction of tryptophan to form indole-3-pyruvate, but may have a secondary activity for the degradation of (R, R) -monatin. According to some embodiments, this secondary 4R activity is minimized or eliminated. Secondary oxidase activity in the 4S forms of monatin would reduce or minimize them in the final product and might be desirable depending on the desired final composition. Therefore, the greater the specificity and / or activity of the selected L enzyme for tryptophan with respect to MP or monatin, the greater the amount of R, R and S, R produced with respect to (S, S) - and (R, S) -monatin.

Enzimas adecuadas para la reacción de triptófano, de acuerdo con la realización ilustrada en la Figura 1, incluyen: Laminotransferasas capaces de facilitar una reacción de L-triptófano para formar indol-3-piruvato, y que tienen mayor especificidad para dicha reacción con respecto a la reacción de R-MP para formar isómeros 4S de monatina; y, Laminoácido oxidasas capaces de facilitar una reacción de L-triptófano para formar indol-3-piruvato, y que tienen mayor especificidad y/o actividad para dicha reacción con respecto a la reacción de isómeros 4R de monatina para formar MP, y equivalentes funcionales de cualquiera de los anteriores. Más específicamente, ejemplos no taxativos de enzimas adecuadas pueden seleccionarse de L-triptófano aminotransferasas (E.C. 2.6.1.27) y tirosina aminotransferasas (aromáticas) (EC 2.6.1.5) y L-aminoácido oxidasas (EC 1.4.3.2), y mutantes derivados de enzimas que tienen actividad de aspartato aminotransferasa. Suitable enzymes for the tryptophan reaction, according to the embodiment illustrated in Figure 1, include: Laminotransferases capable of facilitating a reaction of L-tryptophan to form indole-3-pyruvate, and having higher specificity for said reaction with respect to the reaction of R-MP to form 4S isomers of monatin; and, Lamino acid oxidases capable of facilitating a reaction of L-tryptophan to form indole-3-pyruvate, and which have greater specificity and / or activity for said reaction with respect to the reaction of 4R isomers of monatin to form MP, and functional equivalents. of any of the above. More specifically, non-exhaustive examples of suitable enzymes can be selected from L-tryptophan aminotransferases (EC 2.6.1.27) and tyrosine aminotransferases (aromatic) (EC 2.6.1.5) and L-amino acid oxidases (EC 1.4.3.2), and mutants derived from enzymes that have aspartate aminotransferase activity.

El Ejemplo 16 identifica una enzima específica, un polipéptido HEXaspC mutante que incluye una sustitución de Pro 9 por Tyr y una sustitución de Arg 122 por Gly útil para facilitar las reacciones de L-triptófano y a-KG, oxaloacetato, piruvato o combinaciones de los mismos para formar indol-3-piruvato y L-glutamato, L-aspartato y L-alanina, respectivamente. Otra enzima específica que tiene actividad “limitada” es TatA, la triptófano aminotransferasa de S. meliloti. Otras enzimas adecuadas para la reacción de triptófano de acuerdo con realizaciones preferidas de la vía que se muestra en la Figura 1 incluyen aquellas con las siguientes características: una enzima que transamina MP a 1/10 la tasa o menos que la tasa de L-triptófano como en el Ejemplo 16 o una enzima cuando se usa con una racemasa, como en Ejemplo 18, que produce más de 90% de los isómeros 4R de monatina. Example 16 identifies a specific enzyme, a mutant HEXaspC polypeptide that includes a substitution of Pro 9 for Tyr and a substitution of Arg 122 for Gly useful to facilitate the reactions of L-tryptophan and a-KG, oxaloacetate, pyruvate or combinations of them. themselves to form indole-3-pyruvate and L-glutamate, L-aspartate and L-alanine, respectively. Another specific enzyme that has "limited" activity is TatA, the S. meliloti tryptophan aminotransferase. Other suitable enzymes for the tryptophan reaction according to preferred embodiments of the pathway shown in Figure 1 include those with the following characteristics: an enzyme that transaminates MP at 1/10 the rate or less than the rate of L-tryptophan as in Example 16 or an enzyme when used with a racemase, as in Example 18, which produces more than 90% of the 4R isomers of monatin.

Ejemplos de enzimas que no tienen mayor especificidad para la conversión de L-triptófano a indol-3-piruvato en comparación con la conversión de MP a monatina incluyen: HEXAspC (Ejemplo 16), aminotransferasa de especificidad amplia de Leishmania major (WO 03/091396 A2), la aminotransferasa de porcinos(WO 03/091396 A2) y TatA de Rhodobacter sphaeroides (Ejemplo 18). Sin embargo, estas enzimas pueden evolucionar por ejemplo a través de mutagénesis para tener actividad limitada para R-MP y/o (R,R)-monatina con respecto al triptófano. Examples of enzymes that do not have higher specificity for the conversion of L-tryptophan to indole-3-pyruvate compared to the conversion of MP to monatin include: HEXAspC (Example 16), Leishmania major broad specificity aminotransferase (WO 03/091396 A2), porcine aminotransferase (WO 03/091396 A2) and TatA from Rhodobacter sphaeroides (Example 18). However, these enzymes can evolve through mutagenesis for example to have limited activity for R-MP and / or (R, R) -monatin with respect to tryptophan.

Si nos centramos ahora en la segunda reacción identificada en la Figura 1, la elección de la enzima para facilitar la reacción de indol-3-piruvato para formar MP determina la cantidad relativa de (R,R)-monatina con respecto a la (S,R)-monatina producida. En general, cuanto mayor sea la cantidad relativa de R-MP con respecto al S-MP producido, mayor será la cantidad relativa de (R,R)-monatina con respecto a la (S,R)-monatina producida (cuando una D-enzima facilita la reacción de MP para formar monatina). Cuando se desea una composición de monatina que tiene la forma R,R de monatina como su único componente de monatina, debería usarse una enzima que produce selectivamente R-MP a diferencia de S-MP (una “enzima R-específica”). Los polipéptidos con actividad de aldolasa descrita en la presente son útiles para producir selectivamente R-MP, a diferencia de S-MP. Varios ejemplos de enzimas aldolasa R-específicas se demuestran en la Tabla 1, anterior, en los Ejemplos 4, 5 y 6, más adelante, y en el Listado de Secuencias. If we now focus on the second reaction identified in Figure 1, the choice of enzyme to facilitate the reaction of indole-3-pyruvate to form MP determines the relative amount of (R, R) -monatin with respect to (S , R) -monatin produced. In general, the greater the relative amount of R-MP relative to the S-MP produced, the greater the relative amount of (R, R) -monatin relative to the (S, R) -monatin produced (when a D -enzyme facilitates the reaction of MP to form monatin). When a monatin composition having the R, R form of monatin as its sole monatin component is desired, an enzyme that selectively produces R-MP as opposed to S-MP (an "R-specific enzyme") should be used. The aldolase activity polypeptides described herein are useful for selectively producing R-MP, as opposed to S-MP. Several examples of R-specific aldolase enzymes are demonstrated in Table 1, above, in Examples 4, 5 and 6, below, and in the Sequence Listing.

Si nos centramos ahora en la última etapa de la vía identificada en la Figura 1, se muestra que la reacción de R-MP para formar (R,R)-monatina es facilitada por una D-aminotransferasa de amplia especificidad, por ejemplo D-alanina aminotransferasa (E.C. 2.6.1.21, que también se conoce como D-aminoácido aminotransferasa o D-aspartato aminotransferasa) o una D-aminoácido deshidrogenasa. Como se describe anteriormente, la conversión de MP a monatina es una reacción de aminación, que crea un centro quiral en el carbono C-4 de monatina. Donde la forma R-quiral se desea en la posición C-4, deberían usarse enzimas que producen centros quirales “R” en aminoácidos. If we now focus on the last stage of the pathway identified in Figure 1, it is shown that the reaction of R-MP to form (R, R) -monatin is facilitated by a broad specificity D-aminotransferase, for example D- alanine aminotransferase (EC 2.6.1.21, which is also known as D-amino acid aminotransferase or D-aspartate aminotransferase) or a D-amino acid dehydrogenase. As described above, the conversion of MP to monatin is an amination reaction, which creates a chiral center at the C-4 carbon of monatin. Where the R-chiral form is desired at the C-4 position, enzymes that produce chiral "R" centers in amino acids should be used.

De acuerdo con algunos casos, la D-aminotransferasa tiene mayor especificidad, mayor actividad o ambas para la R-MP que para indol-3-piruvato. De acuerdo con algunas realizaciones, la D-aminotransferasa tiene actividad limitada para el indol-3-piruvato. Las enzimas con dichas características pueden evolucionar o mutar de enzimas existentes, por ejemplo, como se muestra en el Ejemplo 16. According to some cases, D-aminotransferase has higher specificity, higher activity, or both for R-MP than for indole-3-pyruvate. According to some embodiments, D-aminotransferase has limited activity for indole-3-pyruvate. Enzymes with such characteristics can evolve or mutate from existing enzymes, for example, as shown in Example 16.

Los Ejemplos 9 a 12 ilustran la producción de (R,R)-monatina a partir de D-triptófano. Examples 9 to 12 illustrate the production of (R, R) -monatin from D-tryptophan.

La Figura 2 ilustra un método de producción de (R,R)-monatina y (S,R)-monatina. Mientras que en la realización de la Figura 1, la aldolasa usada en la reacción de indol-3-piruvato para formar R-MP afecta la relación entre R,R:S,R formada, en la realización de la Figura 2, la enzima D que facilita la conversión de MP a monatina determinada la relación entre R,R:S,R formada. De acuerdo con la vía de la Figura 2, si una enzima no estereoespecífica se usa para facilitar la conversión de indol-3-piruvato a MP, entonces tanto S-MP y R-MP pueden formarse. Si una aldolasa no estereoselectiva se utiliza para convertir indol-3-piruvato a MP, es necesaria una transaminasa estereoselectiva para convertir el MP a (R,R)-monatina o (S,R)-monatina. Como se muestra en la Figura 2, el uso de una Daminotransferasa o D-aminoácido deshidrogenasa que sea estereoespecífica para R-MP resulta en la producción de (R,R)-monatina. Figure 2 illustrates a production method of (R, R) -monatin and (S, R) -monatin. While in the Figure 1 embodiment, the aldolase used in the indole-3-pyruvate reaction to form R-MP affects the ratio of R, R: S, R formed, in the Figure 2 embodiment, the enzyme D that facilitates the conversion of MP to monatin determined the ratio between R, R: S, R formed. According to the pathway in Figure 2, if a non-stereospecific enzyme is used to facilitate the conversion of indole-3-pyruvate to MP, then both S-MP and R-MP can be formed. If a non-stereoselective aldolase is used to convert indole-3-pyruvate to MP, a stereoselective transaminase is required to convert the MP to (R, R) -monatin or (S, R) -monatin. As shown in Figure 2, the use of a Daminotransferase or D-amino acid dehydrogenase that is stereospecific for R-MP results in the production of (R, R) -monatin.

La Figura 3 ilustra otra vía alternativa para apuntar a una producción de (R,R)-monatina. La vía de la Figura 3 es una modificación de la vía de la Figura 1, en donde indol-3-piruvato se produce indirectamente, en vez de directamente, a partir de L-triptófano. Más específicamente, el L-triptófano se convierte en D-triptófano, y el D-triptófano se convierte luego a indol-3-piruvato. Figure 3 illustrates another alternative way to target (R, R) -monatin production. The pathway in Figure 3 is a modification of the pathway in Figure 1, where indole-3-pyruvate is produced indirectly, rather than directly, from L-tryptophan. More specifically, L-tryptophan is converted to D-tryptophan, and D-tryptophan is then converted to indole-3-pyruvate.

La conversión de L-triptófano a D-triptófano puede facilitarse por medio de una triptófano racemasa o equivalente funcional de la misma. El Ejemplo 15 proporciona fuentes potenciales de triptófano racemasas y métodos de detección para identificar dichas enzimas. También se contempla que una triptófano racemasa puede evolucionar (tal como por medio de mutagénesis o manipulación recombinante) para un mejor rendimiento a partir de una aminoácido racemasa existente. The conversion of L-tryptophan to D-tryptophan can be facilitated by means of a tryptophan racemase or functional equivalent thereof. Example 15 provides potential sources of tryptophan racemases and detection methods to identify such enzymes. It is also contemplated that a tryptophan racemase can evolve (such as by mutagenesis or recombinant manipulation) for better performance from an existing racemase amino acid.

Ejemplos no taxativos de triptófano racemasas incluyen homólogos o mutantes de aminoácido racemasas (EC 5.1.1.-), por ejemplo serina racemasa, en donde los homólogos o mutantes son capaces de convertir L-triptófano a D-triptófano. Ejemplos no taxativos de fuentes de las cuales la aminoácido racemasa puede derivar incluyen: microorganismos tales como Salmonella typhimurium, Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe, Bacillus cereus, Enterococcus gallinarum, Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, Aquifex pyrophilus, Lactobacilli, Streptococcus, Anabaena sp.,Pseudomonas striata, Lentinus edodes, Scapharca brouhtonii Desulfurococcus sp., Thermococcus sp. y Pseudomonas striata. Ejemplos no taxativos adicionales de fuentes de las cuales la aminoácido racemasa puede derivar incluyen gusano de seda, cerebro de rata o cerebro de ratón. Non-exhaustive examples of tryptophan racemases include homologs or amino acid mutants racemases (EC 5.1.1.-), for example serine racemase, where the homologs or mutants are capable of converting L-tryptophan to D-tryptophan. Non-exhaustive examples of sources from which the amino acid racemase may be derived include: microorganisms such as Salmonella typhimurium, Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe, Bacillus cereus, Enterococcus gallinarum, Pediococcus, Pediococcus, Pediococcus , Lactobacillus brevis, Aquifex pyrophilus, Lactobacilli, Streptococcus, Anabaena sp., Pseudomonas striata, Lentinus edodes, Scapharca brouhtonii Desulfurococcus sp., Thermococcus sp. and Pseudomonas striata. Additional non-exhaustive examples of sources from which the amino acid racemase may be derived include silkworm, rat brain, or mouse brain.

Ejemplos no taxativos de fuentes potenciales de las cuales las triptófano racemasas adecuadas pueden derivar incluyen: microorganismos tales como Pseudomonas, por ejemplo, Pseudomonas chlororaphis (Pseudomonas aurereofaciens) (ATCC 15926) y Burkholderia pyrrocina (ATCC15958). Ejemplos no taxativos adicionales de fuentes potenciales de las cuales las triptófano racemasas adecuadas pueden derivar incluyen plantas, por ejemplo plantas de tabaco, tales como Nicotiana tabacum, plantas de trigo, tales como, Triticum aestivum, remolachas, tomates y Sclerochiton ilicifolius. Non-limiting examples of potential sources from which suitable tryptophan racemases can be derived include: microorganisms such as Pseudomonas, for example, Pseudomonas chlororaphis (Pseudomonas aurereofaciens) (ATCC 15926) and Burkholderia pyrrocina (ATCC15958). Additional non-limiting examples of potential sources from which suitable tryptophan racemases can be derived include plants, for example tobacco plants, such as Nicotiana tabacum, wheat plants, such as, Triticum aestivum, beets, tomatoes and Sclerochiton ilicifolius.

La vía que se muestra en la Figura 3 tiene ciertos beneficios, incluyendo que incluso cuando la (R,R)-monatina es el producto deseado, puede usarse la misma enzima para la reacción que produce indol-3-piruvato que para la reacción que produce monatina. Es decir, en la vía ilustrada en la Figura 1, una L-aminotransferasa (o L-enzima adecuada) facilita la reacción que produce indol-3-piruvato, pero una D-aminotransferasa facilita la reacción que produce monatina. Por contraste, en la vía de la Figura 3, cierta D-aminotransferasa que facilita la reacción que produce indol-3-piruvato, también puede facilitar la reacción que produce monatina. Por consiguiente, en las vías de acuerdo con la Figura 3, pueden preferirse D-aminotransferasas de especificidad amplia cuando se desea usar la misma enzima para la reacción que forma indol-3-piruvato que para la reacción que forma monatina. Por contraste, en las vías de acuerdo con las Figuras 1, 2, 4, 6, 7 y 8, la producción de monatina puede proceder de manera más eficiente cuando se selecciona una D-aminotransferasa que tiene actividad limitada y/o especificidad para indol-3piruvato en comparación con R-MP. The route shown in Figure 3 has certain benefits, including that even when (R, R) -monatin is the desired product, the same enzyme can be used for the reaction that produces indole-3-pyruvate as for the reaction that produces monatin. That is, in the pathway illustrated in Figure 1, an L-aminotransferase (or suitable L-enzyme) facilitates the reaction that produces indole-3-pyruvate, but a D-aminotransferase facilitates the reaction that produces monatin. In contrast, in the pathway of Figure 3, a certain D-aminotransferase that facilitates the reaction that produces indole-3-pyruvate, can also facilitate the reaction that produces monatin. Accordingly, in the routes according to Figure 3, broad specificity D-aminotransferases may be preferred when it is desired to use the same enzyme for the indole-3-pyruvate-forming reaction as for the monatin-forming reaction. In contrast, in the pathways according to Figures 1, 2, 4, 6, 7 and 8, monatin production can proceed more efficiently when selecting a D-aminotransferase that has limited activity and / or specificity for indole -3 pyruvate compared to R-MP.

Otro beneficio de la vía representada esquemáticamente en la Figura 3 es que el producto aminoácido de la reacción acoplada a la reacción que produce indol-3-piruvato puede usarse ahora como un material de partida en la reacción acoplada a la reacción que produce monatina. Es decir, en la vía ilustrada en la Figura 1, el L-triptófano reacciona para producir indol-3-piruvato y al mismo tiempo oxaloacetato, alfa-cetoglutarato y/o piruvato reaccionan para producir un L-aminoácido. Dado que la reacción de R-MP para formar monatina se acopla con una reacción que utiliza un D-aminoácido como un sustrato, el L-aminoácido de la reacción que forma indol-3-piruvato no se recicla, en las condiciones que se muestran, para usar en la reacción acoplada a la reacción de R-MP. Por contraste, en la vía ilustrada en la Figura 3, la reacción de D-triptófano para formar indol-3-piruvato se acopla a una reacción que forma un producto D-aminoácido. Dicho D-aminoácido puede reciclarse para usar en la reacción acoplada a la reacción de R-MP. Esto permite el uso de cantidades no-estequiométricas de un aceptor amino en la etapa uno. En algunos casos de la invención, el D-aminoácido es D-alanina. Another benefit of the pathway schematically depicted in Figure 3 is that the amino acid product of the reaction coupled to the indole-3-pyruvate-producing reaction can now be used as a starting material in the reaction coupled to the monatin-producing reaction. That is, in the route illustrated in Figure 1, L-tryptophan reacts to produce indole-3-pyruvate and at the same time oxaloacetate, alpha-ketoglutarate and / or pyruvate react to produce an L-amino acid. Since the reaction of R-MP to form monatin couples with a reaction that uses a D-amino acid as a substrate, the L-amino acid of the indole-3-pyruvate-forming reaction is not recycled, under the conditions shown , for use in the reaction coupled to the R-MP reaction. In contrast, in the pathway illustrated in Figure 3, the reaction of D-tryptophan to form indole-3-pyruvate couples with a reaction that forms a D-amino acid product. Said D-amino acid can be recycled for use in the reaction coupled to the R-MP reaction. This allows the use of non-stoichiometric amounts of an amino acceptor in step one. In some cases of the invention, the D-amino acid is D-alanine.

Las Figuras 4 y 5 ilustran modificaciones adicionales de la vía que se muestra en la Figura 1, cuyas modificaciones están dirigidas a reciclar el producto aminoácido formado por la reacción acoplada con la reacción de L-triptófano con el reactivo aminoácido de la reacción acoplada a la reacción de MP con monatina. Figures 4 and 5 illustrate further modifications of the pathway shown in Figure 1, the modifications of which are aimed at recycling the amino acid product formed by the reaction coupled to the reaction of L-tryptophan with the amino acid reagent of the reaction coupled to the MP reaction with monatin.

Con referencia a la Figura 4, el reciclaje se logra proporcionando una enzima que puede facilitar la conversión de un L-aminoácido a un D-aminoácido y viceversa. Más específicamente, donde como se muestra en la Figura 4, a-KG reacciona para formar L-glutamato cuando L-triptófano reacciona para formar indol-3-piruvato, se puede proporcionar una glutamato racemasa (EC 5.1.1.3) o equivalente funcional que puede facilitar la conversión del Lglutamato a D-glutamato y viceversa. En dicho caso, el L-glutamato formado junto con la producción de indol-3piruvato se elimina en por su conversión a D-glutamato, y el D-glutamato formado a partir de la conversión de Lglutamato está disponible entonces como un sustrato para la reacción acoplada con el MP a la reacción de monatina. De manera similar, el a-KG formado en la reacción de D-glutamato está disponible como un sustrato para la reacción acoplada a la reacción de L-triptófano con indol-3-piruvato. With reference to Figure 4, recycling is accomplished by providing an enzyme that can facilitate the conversion of an L-amino acid to a D-amino acid and vice versa. More specifically, where as shown in Figure 4, a-KG reacts to form L-glutamate when L-tryptophan reacts to form indole-3-pyruvate, a glutamate racemase (EC 5.1.1.3) or functional equivalent can be provided which It can facilitate the conversion of Lglutamate to D-glutamate and vice versa. In that case, the L-glutamate formed together with the production of indole-3-pyruvate is removed in by its conversion to D-glutamate, and the D-glutamate formed from the conversion of Lglutamate is then available as a substrate for the reaction. coupled with the MP to the monatin reaction. Similarly, the a-KG formed in the D-glutamate reaction is available as a substrate for the reaction coupled to the reaction of L-tryptophan with indole-3-pyruvate.

Ejemplos no taxativos de fuentes potenciales de las cuales la glutamato racemasa puede derivar incluyen Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. coli, Aquifex pyrophilus y Bacillus subtilis. Más específicamente (también a modo no taxativo), la glutamato racemasa puede expresarse a partir de un ácido nucleico tal como el gen de pediococcus pentaosaceus murI (No. de Acceso de Genbank L22789), o glutamato racemasa de Lactobacillus brevis. Non-exhaustive examples of potential sources from which glutamate racemase may be derived include Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. coli, Aquifex pyrophilus, and Bacillus subtilis. More specifically (also by way of non-limitation), glutamate racemase can be expressed from a nucleic acid such as the pediococcus pentaosaceus murI gene (Genbank Accession No. L22789), or glutamate racemase from Lactobacillus brevis.

En el caso en el que el oxaloacetato reacciona para formar L-aspartato cuando el L-triptófano reacciona para formar indol-3-piruvato, puede proporcionarse una aspartato racemasa (EC 5.1.1.13) o equivalente funcional para convertir L-aspartato en D-aspartato. En dicho caso, el L-aspartato junto con la producción de indol-3-piruvato se elimina en por su conversión a D-aspartato, y el D-aspartato formado a partir de la conversión de L-aspartato está disponible entonces como un sustrato para la reacción acoplada a la reacción de MP con monatina. De manera similar, el oxaloacetato formado en la reacción de D-aspartato está disponible para actuar como un sustrato para la reacción acoplada a la reacción de L-triptófano con indol-3-piruvato. In the case where oxaloacetate reacts to form L-aspartate when L-tryptophan reacts to form indole-3-pyruvate, an aspartate racemase (EC 5.1.1.13) or functional equivalent can be provided to convert L-aspartate to D- aspartate. In that case, the L-aspartate together with the production of indole-3-pyruvate is removed in by its conversion to D-aspartate, and the D-aspartate formed from the conversion of L-aspartate is then available as a substrate for the reaction coupled to the reaction of MP with monatin. Similarly, the oxaloacetate formed in the D-aspartate reaction is available to act as a substrate for the reaction coupled to the reaction of L-tryptophan with indole-3-pyruvate.

Ejemplos no taxativos de enzimas adecuadas que tienen actividad de aspartato racemasa incluyen ASPR-101 (BioCatalytics, Inc., Pasadena, CA) y homólogos o mutantes de una aminoácido racemasa (EC 5.1.1.-) que es capaz de facilitar la conversión de L-aspartato a D-aspartato. Non-exhaustive examples of suitable enzymes having aspartate racemase activity include ASPR-101 (BioCatalytics, Inc., Pasadena, CA) and homologs or mutants of an amino acid racemase (EC 5.1.1.-) that is capable of facilitating the conversion of L-aspartate to D-aspartate.

Ejemplos no taxativos de fuentes potenciales de las cuales las racemasas de aspartato pueden derivar incluyen: Desulfurococcus, Thermococcus, molusco bivalvo Scapharca brouhtonii, Acinetobacter, Agrobacterium, Archaeoglobus, Bacillus, Bordetella, Bradyrhizobium, Brevibacterium, Burkholderia, Campylobacter, Candida, Caulobacter, Clostridium, Desulfitobacterium, Desulfotalea, Enterococcus, Erwinia, Escherichia, Ferroplasma, Helicobacter, Klebsiella, Lactobacillus, Mannheimia, Medicago, Mesorhizobium, Methanococcus, Methanosarcina, Oceanobacillus, Oenococcus, Pediococcus, Polaribacter, Pseudomonas, Pyrococcus, Ralsonia, Shigella, Sinorhizobium, Salmonella, Sphingomonas, Streptococcus, Thermoanaerobacter, Vibrio, Wolinella, Xanthomonas, Xanthobacter, Yersinia y Zymomonas. Non-exhaustive examples of potential sources from which aspartate racemases may derive include: Desulfurococcus, Thermococcus, bivalve mollusc Scapharca brouhtonii, Acinetobacter, Agrobacterium, Archaeoglobus, Bacillus, Closdetella, Bradyrhizobium, Brekibacterium, Burkbacterium, Burkbacterium, Burkibacterium, Burkbacterium, Burkibacterium, Burkbacterium, Burkibacterium, Burkbacterium, Caviar, Cactus Desulfitobacterium, Desulfotalea, Enterococcus, Erwinia, Escherichia, Ferroplasma, Helicobacter, Klebsiella, Lactobacillus, Mannheimia, Medicago, Mesorhizobium, Methanococcus, Oceanobacillus, Oenococcus, Pediococcus, Polaris Streptococcus, Thermoanaerobacter, Vibrio, Wolinella, Xanthomonas, Xanthobacter, Yersinia and Zymomonas.

En los casos en los que el piruvato reacciona para formar L-alanina cuando el L-triptófano reacciona para formar indol-3-piruvato, se puede proporcionar una alanina racemasa o equivalente funcional para convertir L-alanina a Dalanina. En dicho caso, la L-alanina formada junto con la producción de indol-3-piruvato se elimina por su conversión a D-alanina, y la D-alanina formada a partir de la conversión de L-alanina está disponible entonces para actuar como un sustrato para la reacción acoplada a la reacción de MP con monatina. De manera similar, el piruvato formado en la reacción de D-alanina está disponible para actuar como un sustrato para la reacción acoplada con el L-triptófano a la reacción de indol-3-piruvato. In cases where pyruvate reacts to form L-alanine when L-tryptophan reacts to form indole-3-pyruvate, an alanine racemase or functional equivalent can be provided to convert L-alanine to Dalanin. In that case, the L-alanine formed together with the production of indole-3-pyruvate is removed by its conversion to D-alanine, and the D-alanine formed from the conversion of L-alanine is then available to act as a substrate for the reaction coupled to the reaction of MP with monatin. Similarly, the pyruvate formed in the D-alanine reaction is available to act as a substrate for the L-tryptophan-coupled reaction to the indole-3-pyruvate reaction.

Ejemplos no taxativos de alanina racemasas adecuadas incluyen A8936 (Sigma-Aldrich, St. Louis, MO). Non-exhaustive examples of suitable alanine racemases include A8936 (Sigma-Aldrich, St. Louis, MO).

Ejemplos no taxativos de fuentes potenciales de las cuales la alanina racemasa puede derivar incluyen: Brucella Non-exhaustive examples of potential sources from which alanine racemase may be derived include: Brucella

abortus, abortus,
Streptococcus faecalis Salmonella typhimurium, Escherichia coli, Bacillus subtilis, Bacillus Streptococcus faecalis Salmonella typhimurium,  Escherichia coli, Bacillus  subtilis, Bacillus

stearothermophilus, stearothermophilus,
Pseudomonas aeruginosa, Vibrio cholerae, Schizosacc aroyces pombe, Bacillus Pseudomonas aeruginosa,  Vibrio  cholerae, Schizosacc aroyces pombe, Bacillus

cereus y Lentinus edodes. cereus and Lentinus edodes.

Los Ejemplos 18 y 21 ilustran el uso de las racemasas anteriores, su impacto en el aumento de la relación del producto de monatina deseado, y proporcionan fuentes potenciales para las enzimas racemasa. Examples 18 and 21 illustrate the use of the above racemases, their impact on increasing the ratio of the desired monatin product, and provide potential sources for the racemase enzymes.

Con respecto a la Figura 5, se usa una aminotransferasa de estereoinversión para facilitar la reacción de R-MP para formar monatina. A pesar de que típicamente la reacción de R-MP (o S-MP) para formar (R,R)-monatina (o (S,R)monatina) se acopla con la reacción de un D-aminoácido, una aminotransferasa de esteroinversión puede facilitar que las reacciones acopladas de R-MP (o S-MP) formen (R,R)-monatina (o (S,R)-monatina) usando un Laminoácido. De esta forma, el producto de L-aminoácido de la reacción de L-triptófano aminotransferasa puede usarse como un sustrato para la transaminación de MP a monatina, y el producto (es decir, oxaloacetato, piruvato y/o a-KG) de la reacción acoplada a la reacción de MP con monatina puede usarse como un material de partida para la reacción acoplada a la reacción de L-triptófano con indol-3-piruvato. Ejemplos no taxativos de aminotransferasas de estereoinversión que pueden usarse incluyen D-fenilglicina aminotransferasa (EC 2.6.1.72, también conocida como D-4-hidroxifenilglicina aminotransferasa) y D-metionina aminotransferasa (EC 2.6.1.41, también conocida como D-met-aminotransferasa y D-metionina-piruvato aminotransferasa). Ejemplos no taxativos de fuentes potenciales de las cuales la D-fenilglicina aminotransferasa puede derivar incluyen Pseudomonas, tales como Pseudomonas putida LW-4 y Pseudomonas stutzeri ST-201. Ejemplos no taxativos de fuentes potenciales de las cuales la D-metionina aminotransferasa puede derivar incluyen coliflor y maní. Referring to Figure 5, a stereoinvestment aminotransferase is used to facilitate the reaction of R-MP to form monatin. Although typically the reaction of R-MP (or S-MP) to form (R, R) -monatin (or (S, R) monatin) is coupled with the reaction of a D-amino acid, a steroinversion aminotransferase it can facilitate the coupled reactions of R-MP (or S-MP) to form (R, R) -monatin (or (S, R) -monatin) using a Lamino Acid. In this way, the L-amino acid product of the L-tryptophan aminotransferase reaction can be used as a substrate for transamination of MP to monatin, and the product (i.e., oxaloacetate, pyruvate, and / or a-KG) of the reaction coupled to the reaction of MP with monatin can be used as a starting material for the reaction coupled to the reaction of L-tryptophan with indole-3-pyruvate. Non-exhaustive examples of stereoinversion aminotransferases that can be used include D-phenylglycine aminotransferase (EC 2.6.1.72, also known as D-4-hydroxyphenylglycine aminotransferase) and D-methionine aminotransferase (EC 2.6.1.41, also known as D-met-aminotransferase) and D-methionine-pyruvate aminotransferase). Non-exhaustive examples of potential sources from which D-phenylglycine aminotransferase can be derived include Pseudomonas, such as Pseudomonas putida LW-4 and Pseudomonas stutzeri ST-201. Non-exhaustive examples of potential sources from which D-methionine aminotransferase can be derived include cauliflower and peanuts.

Los ejemplos 19 y 20 juntos proporcionan fuentes potenciales de enzimas de estereoinversión, y métodos de realización de dichas enzimas. Los ejemplos también proporcionan métodos de detección para identificar dichas enzimas. También se contempla que dichas enzimas pueden evolucionar de enzimas de estereoinversión que se conocen o se encuentran en la naturaleza. Como un ejemplo no taxativo, la aminotransferasa de estereoinversión puede ser un homólogo o mutante de una D-aminoácido aminotransferasa o un homólogo o mutante de una aminoácido racemasa (EC 5.1.1.-). Examples 19 and 20 together provide potential sources of stereoinvestment enzymes, and methods of making such enzymes. The examples also provide detection methods to identify such enzymes. It is also contemplated that such enzymes can evolve from stereoinvestment enzymes that are known or found in nature. As a non-exhaustive example, the stereoinvestment aminotransferase can be a homolog or mutant of a D-amino acid aminotransferase or a homolog or mutant of an amino acid racemase (EC 5.1.1.-).

Las Figuras 6-8 también ilustran modificaciones a la vía de la Figura 1. Las vías ilustradas en las Figuras 6-8 proporcionan métodos para impulsar reacciones de equilibro eliminando el subproducto de la reacción de triptófano y en algunos casos proporcionando un sustrato para la reacción de MP. Figures 6-8 also illustrate modifications to the pathway of Figure 1. The pathways illustrated in Figures 6-8 provide methods for driving equilibrium reactions by removing the by-product of the tryptophan reaction and in some cases providing a substrate for the reaction. of MP.

Con referencia a la Figura 6, la vía que se muestra elimina el producto L-aminoácido de la reacción acoplada a la reacción de triptófano convirtiéndolo en un L-aminoácido diferente, y luego proporciona un sustrato para la reacción acoplada a la reacción de MP convirtiendo el L-aminoácido recién formado en un D-aminoácido. Específicamente, se muestra que el L-triptófano reacciona junto con el oxaloacetato para formar indol-3-piruvato y L-aspartato. Un aspartato 4-descarboxilasa (EC 4.1.1.12) o equivalente funcional se usa para facilitar la conversión de L-aspartato a L-alanina y dióxido de carbono, y una enzima con actividad de alanina racemasa se usa para facilitar la conversión de L-alanina a D-alanina. Dicha D-alanina puede servir como un donante amino para la conversión de R-MP a monatina. Referring to Figure 6, the route shown removes the L-amino acid product from the reaction coupled to the tryptophan reaction by converting it to a different L-amino acid, and then provides a substrate for the reaction coupled to the MP reaction by converting the newly formed L-amino acid into a D-amino acid. Specifically, L-tryptophan is shown to react together with oxaloacetate to form indole-3-pyruvate and L-aspartate. An aspartate 4-decarboxylase (EC 4.1.1.12) or functional equivalent is used to facilitate the conversion of L-aspartate to L-alanine and carbon dioxide, and an enzyme with alanine racemase activity is used to facilitate the conversion of L- Alanine to D-Alanine. Said D-alanine can serve as an amino donor for the conversion of R-MP to monatin.

Con respecto a la Figura 7, la vía que se muestra ilustra métodos adicionales para eliminar el producto de Laminoácido de la reacción acoplada a la reacción de triptófano. Las realizaciones como se presentan en la figura producen un subproducto que no está disponible para reaccionar en la dirección inversa, por ejemplo debido a volatilidad (tal como dióxido de carbono) o por conversión espontánea en un producto final sin reaccionar. Un ejemplo de dicho abordaje incluye los casos en los que a-KG reacciona junto con L-triptófano para producir Lglutamato, puede proporcionarse una glutamato descarboxilasa (EC 4.1.1.15) o equivalente funcional que puede facilitar la conversión de de L-glutamato a 4-aminobutanoato (con dióxido de carbono como subproducto). Ejemplos no taxativos de fuentes potenciales de las cuales la L-glutamato descarboxilasa puede derivar incluyen: Clostridium perfringens, C. welchii o E. coli. With respect to Figure 7, the route shown illustrates additional methods for removing the Lamino Acid product from the reaction coupled to the tryptophan reaction. Embodiments as presented in the figure produce a by-product that is not available to react in the reverse direction, for example due to volatility (such as carbon dioxide) or by spontaneous conversion into an unreacted final product. An example of such an approach includes cases where a-KG reacts together with L-tryptophan to produce Lglutamate, a glutamate decarboxylase (EC 4.1.1.15) or functional equivalent can be provided that can facilitate the conversion of L-glutamate to 4 -aminobutanoate (with carbon dioxide as a by-product). Non-exhaustive examples of potential sources from which L-glutamate decarboxylase can be derived include: Clostridium perfringens, C. welchii or E. coli.

Otro ejemplo de dicho abordaje para continuar con la reacción de triptófano incluye donde oxaloacetato reacciona junto con L-triptófano, puede proporcionarse una aspartato descarboxilasa (EC 4.1.1.1.1) o equivalente funcional para facilitar la conversión de L-aspartato a -alanina (con dióxido de carbono como un subproducto). Another example of such an approach to continue the tryptophan reaction includes where oxaloacetate reacts together with L-tryptophan, an aspartate decarboxylase (EC 4.1.1.1.1) or functional equivalent can be provided to facilitate the conversion of L-aspartate to -alanine ( with carbon dioxide as a by-product).

Con referencia a la Figura 8, la vía que se muestra ilustra otros métodos adicionales para eliminar el producto Laminoácido de la reacción acoplada a la reacción de triptófano y que proporciona un sustrato para la reacción acoplada a la reacción de MP. Específicamente, en los casos en los que a-KG reacciona junto con L-triptófano para formar L-glutamato, puede proporcionarse una enzima con actividad de L-alanina aminotransferasa y piruvato, en donde la enzima L-alanina aminotransferasa facilita la reacción de piruvato y L-glutamato para formar L-alanina. También se puede proporcionar una alanina racemasa o equivalente funcional para facilitar la conversión de la Lalanina a D-alanina. Dicha D-alanina puede usarse como un sustrato junto con MP para formar monatina y piruvato. Ver los Ejemplos 18 y 21. Referring to Figure 8, the route shown illustrates additional methods of removing the Lamino Acid product from the reaction coupled to the tryptophan reaction and providing a substrate for the reaction coupled to the MP reaction. Specifically, in cases where a-KG reacts together with L-tryptophan to form L-glutamate, an enzyme with L-alanine aminotransferase and pyruvate activity may be provided, where the enzyme L-alanine aminotransferase facilitates the pyruvate reaction. and L-glutamate to form L-alanine. An alanine racemase or functional equivalent may also be provided to facilitate the conversion of Lalanine to D-alanine. Said D-alanine can be used as a substrate together with MP to form monatin and pyruvate. See Examples 18 and 21.

Vías biosintéticas para producir R,R y otros estereoisómeros de derivados de monatina Biosynthetic pathways to produce R, R and other stereoisomers of monatin derivatives

Los métodos de la invención descrita que usan polipéptidos con actividad de aldolasa descritos en la presente pueden usarse para facilitar la reacción entre un indol-3-piruvato sustituido y una fuente de carbono C3 tal como se define en las reivindicaciones. The methods of the disclosed invention using aldolase-active polypeptides described herein can be used to facilitate the reaction between a substituted indole-3-pyruvate and a C3 carbon source as defined in the claims.

Las enzimas útiles para facilitar una reacción entre un indol-3-piruvato sustituido y una fuente de carbono C3 incluyen uno o más polipéptidos con actividad de aldolasa de cualquiera de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 o fragmentos o subsecuencias de los mismos que tienen actividad de aldolasa. Useful enzymes to facilitate a reaction between a substituted indole-3-pyruvate and a C3 carbon source include one or more aldolase-active polypeptides of any of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 , SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO : 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56 , SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO : 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106 , SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 11 6, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ IDNO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334 or fragments or subsequences thereof having aldolase activity.

En una realización, uno o más polipéptidos con actividad de HMG aldolasa de cualquiera de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:202, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304 o fragmentos o subsecuencias de los mismos que tienen actividad de aldolasa pueden ser útiles para facilitar una reacción entre un indol-3-piruvato sustituido y una fuente de carbono C3 tal como se define adicionalmente en las reivindicaciones. In one embodiment, one or more polypeptides with HMG aldolase activity of any of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, I KNOW THAT ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO : 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162 , SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO : 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212 , SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO : 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262 , SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO : 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304 or fragments or subsequences thereof that have aldolase activity may be useful in facilitating a reaction between an indole-3 -substituted pyruvate and a C3 carbon source as further defined in the claims.

En otra realización, uno o más polipéptidos con actividad de KHG aldolasa de cualquiera de SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 o fragmentos o subsecuencias de los mismos que tienen actividad de aldolasa pueden ser útiles para facilitar una reacción entre un indol-3-piruvato sustituido y una fuente de carbono C3 tal como se define adicionalmente en las reivindicaciones. In another embodiment, one or more polypeptides with KHG aldolase activity of any of SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334 or fragments or subsequences thereof having aldolase activity may be useful in facilitating a reaction between a substituted indole-3-pyruvate and a C3 carbon source as further defined in the claims.

Alternativamente, uno o más polipéptidos con actividad de aldolasa codificada por una secuencia de ácidos nucleicos que tiene al menos aproximadamente 95%, 96%, 97%, 98%, 99%, o más, o una identidad de secuencia completa (100%) con un ácido nucleico, incluyendo SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre un indol-3-piruvato y una fuente de carbono C3 tal como se define en las reivindicaciones. Alternatively, one or more polypeptides with aldolase activity encoded by a nucleic acid sequence having at least about 95%, 96%, 97%, 98%, 99%, or more, or full sequence identity (100%) with a nucleic acid, including SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105 , SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO : 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155 , SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO : 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205 , SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID N O: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 can be useful to facilitate a reaction between an indole-3-pyruvate and a C3 carbon source as defined in the claims.

Uno o más polipéptidos con actividad de HMG aldolasa codificada por una secuencia de ácidos nucleicos que tiene al menos aproximadamente 95%, 96%, 97%, 98%, 99% o más, o una identidad de secuencia completa (100%) con un ácido nucleico, incluyendo SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO: 121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305 pueden ser útiles para facilitar una reacción entre un indol-3-piruvato y una fuente de carbono C3 tal como se define adicionalmente en las reivindicaciones. One or more polypeptides with HMG aldolase activity encoded by a nucleic acid sequence having at least about 95%, 96%, 97%, 98%, 99% or more, or full sequence identity (100%) with a nucleic acid, including SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107 , SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO : 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157 , SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO : 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207 , SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305 can be helpful in facilitating a reaction between an indole-3-pyruvate and a C3 carbon source as further defined in the claims.

Uno o más polipéptidos con actividad de KHG aldolasa codificada por una secuencia de ácidos nucleicos que tiene al menos aproximadamente 95%, 96%, 97%, 98%, 99% o más, o una identidad de secuencia completa (100%) con un ácido nucleico incluyendo SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre un indol-3-piruvato y una fuente de carbono C3 tal como se define adicionalmente en las reivindicaciones. One or more polypeptides with KHG aldolase activity encoded by a nucleic acid sequence having at least about 95%, 96%, 97%, 98%, 99% or more, or full sequence identity (100%) with a nucleic acid including SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321 , SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 may be useful in facilitating a reaction between an indole-3-pyruvate and a C3 carbon source as further defined in the claims.

Uno o más polipéptidos con actividad de aldolasa codificada por una secuencia de ácidos nucleicos que se hibrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre un indol-3-piruvato sustituido y una fuente de carbono C3 tal como se define en las reivindicaciones. One or more polypeptides with aldolase activity encoded by a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, I KNOW Q ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 may be useful in facilitating a reaction between a substituted indole-3-pyruvate and a C3 carbon source as defined in the claims.

Uno o más polipéptidos con actividad de HMG aldolasa codificada por una secuencia de ácidos nucleicos que se hibrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305 pueden ser útiles para facilitar una reacción entre un indol-3-piruvato sustituido y una fuente de carbono C3 tal como se define adicionalmente en las reivindicaciones. One or more polypeptides with HMG aldolase activity encoded by a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 , SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO : 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57 , SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO : 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107 , SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO : 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151 , SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO : 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201 , SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO : 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251 , SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 283, SEQ ID NO: 283, SEQ ID NO : 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 SEQ ID NO: 303, SEQ ID NO: 305 may be useful in facilitating a reaction between a substituted indole-3-pyruvate and a C3 carbon source as further defined in the claims.

En otra realización de la invención, uno o más polipéptidos con actividad de KHG aldolasa codificados por una secuencia de ácidos nucleicos que se hibrida en condiciones rigurosas con un ácido nucleico de SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 y SEQ ID NO:338 pueden ser útiles para facilitar una reacción entre un indol-3-piruvato y una fuente de carbono C3 tal como se define adicionalmente en las reivindicaciones. In another embodiment of the invention, one or more polypeptides with KHG aldolase activity encoded by a nucleic acid sequence that hybridizes under stringent conditions to a nucleic acid of SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 and SEQ ID NO: 338 can be helpful in facilitating a reaction between a indole-3-pyruvate and a C3 carbon source as further defined in the claims.

En una realización, el grupo sustituyente del indol-3-piruvato sustituido es un átomo de halógeno unido a cualquier átomo de carbono del anillo indol. En otra realización, el grupo sustituyente es un átomo de cloro unido a cualquier carbono del anillo indol. En otra realización adicional, el derivado de monatina es ácido 4-hidroxi-4-(6-metilindol-3ilmetil)glutámico. In one embodiment, the substituent group for the substituted indole-3-pyruvate is a halogen atom attached to any carbon atom in the indole ring. In another embodiment, the substituent group is a chlorine atom attached to any carbon in the indole ring. In yet another embodiment, the monatin derivative is 4-hydroxy-4- (6-methylindole-3-methylmethyl) glutamic acid.

Los polipéptidos que tienen actividad de aldolasa pueden usarse en una vía en la cual una o más etapas son una reacción de síntesis química. Por ejemplo, en algunas realizaciones, uno o más polipéptidos que tienen actividad de aldolasa pueden facilitar una reacción entre piruvato e indol-3-piruvato para proporcionar precursor de monatina. El precursor de monatina puede purificarse luego. Entonces puede utilizarse una reacción de aminación reductiva del precursor de monatina para proporcionar monatina. Polypeptides that have aldolase activity can be used in a route in which one or more steps is a chemical synthesis reaction. For example, in some embodiments, one or more polypeptides that have aldolase activity can facilitate a reaction between pyruvate and indole-3-pyruvate to provide monatin precursor. The monatin precursor can then be purified. A reductive amination reaction of the monatin precursor can then be used to provide monatin.

Los polipéptidos que tienen actividad de aldolasa así como otras enzimas usadas en el proceso para producir monatina y derivados de monatina pueden usarse en forma pura, bruta, aislada o de suspensión de sulfato de amonio. Polypeptides having aldolase activity as well as other enzymes used in the process to produce monatin and monatin derivatives can be used in pure, crude, isolated or suspension form of ammonium sulfate.

Los polipéptidos que tienen actividad de aldolasa pueden optimizarse usando los agentes de estabilización, incluyendo ditiotreitol (“DTT”) y -mercaptoetanol. Polypeptides that have aldolase activity can be optimized using stabilizing agents, including dithiothreitol ("DTT") and -mercaptoethanol.

La monatina o derivado de monatina que se produce que utiliza uno o más de los polipéptidos divulgados en la presente, es generalmente al menos aproximadamente 50 a aproximadamente 99% (R,R)-monatina o derivado de (R,R)-monatina, en peso de la monatina o derivado de monatina total producida. En otras realizaciones, la monatina The monatin or monatin derivative that is produced using one or more of the polypeptides disclosed herein, is generally at least about 50 to about 99% (R, R) -monatin or (R, R) -monatin derivative, by weight of the monatin or total monatin derivative produced. In other embodiments, the monatina

o derivado de monatina producido que utiliza uno o más de los polipéptidos divulgados en la presente, es mayor que 60% (R,R)-monatina o derivado de (R,R)-monatina, en peso de la monatina total producida; por ejemplo, la (R,R)monatina o derivado de (R,R)-monatina es 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or monatin derivative produced using one or more of the polypeptides disclosed herein, is greater than 60% (R, R) -monatin or (R, R) -monatin derivative, by weight of the total monatin produced; for example, the (R, R) monatin or derivative of (R, R) -monatin is 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , 96%, 97%, 98%

o 99% de la monatina o derivado de monatina total producida. Alternativamente, pueden combinarse varias cantidades de dos o más preparaciones de monatina o derivados de monatina de manera que resulte en una preparación que sea un porcentaje deseado de (R,R)-monatina o derivado de (R,R)-monatina. Por ejemplo, una preparación de monatina que es 60% (R,R)-monatina puede combinarse con una preparación de monatina que es 90% (R,R)-monatina; si se combinan cantidades iguales de 60% y 90% de (R,R)-monatina, la preparación de monatina resultante sería 75% (R,R)-monatina. or 99% of the monatin or total monatin derivative produced. Alternatively, various amounts of two or more preparations of monatin or monatin derivatives can be combined so as to result in a preparation that is a desired percentage of (R, R) -monatin or derivative of (R, R) -monatin. For example, a monatin preparation that is 60% (R, R) -monatin can be combined with a monatin preparation that is 90% (R, R) -monatin; if equal amounts of 60% and 90% of (R, R) -monatin are combined, the resulting monatin preparation would be 75% (R, R) -monatin.

La monatina o derivado de monatina, o un intermediario (incluido un precursor de monatina), producida utilizando uno o más polipéptidos divulgados en la presente, puede purificarse a partir de los componentes de la reacción. En una realización, la monatina, derivado de monatina o intermediario, tal como precursor de monatina, puede purificarse simplemente eliminando la sustancia que debe purificarse de la preparación de enzimas en la cual se sintetiza. Monatin or monatin derivative, or an intermediate (including a monatin precursor), produced using one or more polypeptides disclosed herein, can be purified from the components of the reaction. In one embodiment, monatin, monatin derivative or intermediate, such as monatin precursor, can be purified simply by removing the substance to be purified from the enzyme preparation in which it is synthesized.

En otras realizaciones, el intermediario, precursor de monatina, monatina o derivado de monatina se purifica a partir de la preparación en la cual se sintetizó de forma tal que la composición o preparación “purificada” resultante sea al menos aproximadamente 5-60% monatina en peso del total de los compuestos orgánicos. En otra realización, la monatina, derivado de monatina o intermediario, tal como un precursor de monatina, puede purificarse hasta un grado de pureza de al menos aproximadamente 70%, 80%, 90%, 95% o 99% en peso de los compuestos orgánicos totales. La monatina, derivado de monatina o el intermediario (incluido el precursor de monatina), producida utilizando uno o más de los polipéptidos divulgados en la presente, puede purificarse a partir de los componentes dela reacción por medio de cualquier método conocido por un experto en la técnica. Óptimamente, la monatina purificada o intermediario puede recristalizarse repetidamente hasta que se logre el grado deseado de pureza. In other embodiments, the monatin intermediate, precursor, monatin, or monatin derivative is purified from the preparation in which it was synthesized such that the resulting "purified" composition or preparation is at least about 5-60% monatin in weight of total organic compounds. In another embodiment, monatin, monatin derivative or intermediate, such as a monatin precursor, can be purified to a degree of purity of at least about 70%, 80%, 90%, 95% or 99% by weight of the compounds total organic. Monatin, derived from monatin or the intermediate (including monatin precursor), produced using one or more of the polypeptides disclosed herein, can be purified from the reaction components by any method known to one skilled in the art. technique. Optimally, the purified monatin or intermediate can be repeatedly recrystallized until the desired degree of purity is achieved.

Los siguientes ejemplos se ofrecen para ilustrar, a modo no taxativo, la invención reivindicada. The following examples are offered to illustrate, without limitation, the claimed invention.

EJEMPLOS EXAMPLES

Ejemplo 1 Example 1

Detección de monatina, precursor de monatina, triptófano, alanina, aspartato y glutamato El presente ejemplo describe los procedimientos utilizados para detectar la presencia de monatina, precursor de monatina (PM), triptófano, aspartato, alanina y glutamato. Asimismo, el presente ejemplo describe un procedimiento para separar y detectar los cuatro estereoisómeros de monatina. Detection of monatin, monatin precursor, tryptophan, alanine, aspartate and glutamate The present example describes the procedures used to detect the presence of monatin, monatin precursor (PM), tryptophan, aspartate, alanine and glutamate. Also, the present example describes a procedure for separating and detecting the four monatin stereoisomers.

Análisis del monitoreo de reacción múltiple (MRM) LC/MS/MS de monatina y triptófano Monatin and Tryptophan LC / MS / MS Multiple Reaction Monitoring (MRM) Analysis

Se realizaron análisis de mezclas para monatina y triptófano derivados de reacciones bioquímicas in vitro o in vivo mediante el uso de un instrumento de espectrometría de masas en tándem con cromatografía líquida (LC/MS/MS) Micromass de Waters que incluye un cromatógrafo para líquidos 2795 de Waters con un monitor de absorbancia 996 de fotodiodo (PDA) de Waters colocado en serie entre el cromatógrafo y un espectrómetro de masa de triple cuadrúpolo Quattro Ultima de Micromass. Se realizaron separaciones por LC utilizando una columna de cromatografía de fase inversa Xterra MS C8 de 2,1 mm x 250 mm a 40°C. La fase móvil de LC consistió en A) agua que contenía (i) 0,05% (v/v) de ácido trifluoroacético o (ii) 0,3% de ácido fórmico y 10 mM de formiato de amonio y B) metanol con (i) 0,05% (v/v) de ácido trifluoroacético o (ii) 0,3% de ácido fórmico y 10 mM de formiato de amonio. Analyzes of mixtures for monatin and tryptophan derived from in vitro or in vivo biochemical reactions were performed using a Waters Micromass liquid chromatography (LC / MS / MS) tandem mass spectrometry instrument including a 2795 liquid chromatograph. from Waters with a Waters 996 Photodiode Absorbance Monitor (PDA) placed in series between the chromatograph and a Micromass Quattro Ultima Triple Quadrupole Mass Spectrometer. LC separations were performed using a 2.1mm x 250mm Xterra MS C8 reverse phase chromatography column at 40 ° C. The LC mobile phase consisted of A) water containing (i) 0.05% (v / v) trifluoroacetic acid or (ii) 0.3% formic acid and 10 mM ammonium formate and B) methanol with (i) 0.05% (v / v) trifluoroacetic acid or (ii) 0.3% formic acid and 10mM ammonium formate.

Si la fase móvil de LC consistió en A) agua con un 0,05% (v/v) de ácido trifluoroacético y B) metanol con 0,05% (v/v) de ácido trifluoroacético, la elución en gradiente fue lineal desde el 5% B hasta el 35%B, durante 0-4 minutos, lineal desde el 35% B hasta el 60% B, durante 4-6,5 minutos, lineal desde el 60% B hasta el 90% B, durante 6,5-7 minutos, isocrática a 90% B, durante 7-11 minutos, lineal desde el 90% B hasta el 95% B, durante 11-12 minutos, lineal desde el 95% B hasta el 5% B, durante 12-13 minutos, con un período de reequilibrado de 2 minutos entre las series. La tasa de flujo fue de 0,25 mL/min y se monitoreó una absorbancia de PDA de 200 nm a 400 nm. Todos los parámetros de ESI-MS se optimizaron y seleccionaron en base a la generación de iones moleculares protonados ([M+H]+) de los analitos de interés, y la producción de iones de fragmentos característicos. Los siguientes parámetros instrumentales se utilizaron para el análisis del monitoreo de reacción múltiple (MRM) LC/MS/MS de monatina y triptófano: Capilar: 3,5 kV; Cono: 40 V; Hex 1: 20 V; Apertura: 0 V; Hex 2: 0 V, Temperatura de la Fuente: 100ºC; temperatura de desolvatación; 350°C; Gas de desolvatación: 500 L/h; Cono de gas: 50 L/h; Baja resolución de masas (Q1): 12,0; Alta resolución de masas (Q1): 12,0; Energía iónica: 0,2; Entrada: -5 V; Energía de colisión: 8; Salida: IV; Baja resolución de masas (Q2): 15; Alta resolución de masas (Q2): 15; Energía iónica (Q2): 3,5; Multiplicador: 650. Se utilizan cinco transiciones de MRM padre/hija monatina específicas para detectar específicamente las reacciones de monatina in vitro e in vivo. Las transiciones monitoreadas son 293,1 a 158,3, 293,1 a 168,2, 293,1 a 211,2, 293,1 a 230,2 y 293,1 a 257,2. El triptófano se monitorea con la transición MRM 204,7 a 146,4. Para la cuantificación estándar interna de monatina y triptófano, se analizaron cuatro patrones de calibración con cuatro proporciones diferentes de cada analito respecto de d5-triptófano y d5-monatina. Estos datos están sujetos a un análisis lineal de mínimos cuadrados para formar una curva de calibración para la monatina y el triptófano. A cada muestra se le agrega una cantidad fija de d5-triptófano y d5-monatina (la d5-monatina se sintetizó de d5-triptófano conforme a los procedimientos de la patente WO03/091396A2) y las proporciones de respuesta (monatina/d5-monatina; triptófano/d5-triptófano) utilizadas junto con las curvas de calibración descritas anteriormente para calcular la cantidad de cada analito en las mezclas. If the LC mobile phase consisted of A) water with 0.05% (v / v) trifluoroacetic acid and B) methanol with 0.05% (v / v) trifluoroacetic acid, the gradient elution was linear from 5% B to 35% B, for 0-4 minutes, linear from 35% B to 60% B, for 4-6.5 minutes, linear from 60% B to 90% B, for 6 , 5-7 minutes, isocratic at 90% B, for 7-11 minutes, linear from 90% B to 95% B, for 11-12 minutes, linear from 95% B to 5% B, for 12 -13 minutes, with a rebalancing period of 2 minutes between sets. The flow rate was 0.25 mL / min and a PDA absorbance of 200nm to 400nm was monitored. All ESI-MS parameters were optimized and selected based on the generation of protonated molecular ions ([M + H] +) from the analytes of interest, and the production of ions from characteristic fragments. The following instrumental parameters were used for the monatin and tryptophan LC / MS / MS Multiple Reaction Monitoring (MRM) analysis: Capillary: 3.5 kV; Cone: 40V; Hex 1:20 V; Aperture: 0V; Hex 2: 0 V, Source Temperature: 100ºC; desolvation temperature; 350 ° C; Desolvation gas: 500 L / h; Gas cone: 50 L / h; Low mass resolution (Q1): 12.0; High mass resolution (Q1): 12.0; Ionic energy: 0.2; Input: -5V; Collision energy: 8; Output: IV; Low mass resolution (Q2): 15; High mass resolution (Q2): 15; Ionic energy (Q2): 3.5; Multiplier: 650. Five specific monatin father / daughter MRM transitions are used to specifically detect monatin reactions in vitro and in vivo. The monitored transitions are 293.1 to 158.3, 293.1 to 168.2, 293.1 to 211.2, 293.1 to 230.2 and 293.1 to 257.2. Tryptophan is monitored with the MRM transition 204.7 to 146.4. For internal standard quantification of monatin and tryptophan, four calibration standards were analyzed with four different proportions of each analyte with respect to d5-tryptophan and d5-monatin. These data are subjected to a linear least squares analysis to form a calibration curve for monatin and tryptophan. A fixed amount of d5-tryptophan and d5-monatin is added to each sample (d5-monatin was synthesized from d5-tryptophan according to the procedures of patent WO03 / 091396A2) and the response ratios (monatin / d5-monatin ; tryptophan / d5-tryptophan) used in conjunction with the calibration curves described above to calculate the amount of each analyte in the mixtures.

Si la fase de LC fue A) agua con un 0,3% de ácido fórmico y 10 mM de formiato de amonio y B) metanol con un 0,3% de ácido fórmico y 10 mM de formiato de amonio, la elución en gradiente fue lineal de un 5% B a un 45% B, 08,5 minutos, lineal desde un 45% B a un 90% B, 8,5-0 minutos, isocrática desde un 90% B hasta un 90% B, 9-12,5 minutos, lineal desde un 95% B hasta un 5% B, 12,5-13 minutos, con un período de reequilibrado de 4 minutos entre las series. La tasa de flujo fue de 0,27mL/min, y la absorbancia de PDA se monitoreó desde 210 nm hasta 400 nm. Todos los parámetros de ESI-MS se optimizaron y seleccionaron en base a la generación de iones moleculares protonados ([M+H]+) de los analitos de interés y la producción de iones de fragmentos característicos. Los parámetros instrumentales utilizados para esta fase móvil secundaria son los mismos que los parámetros anteriores. Se utilizan cuatro transiciones MRM padre-hija monatina-específicas y una transición padre/hija triptófano específica para detectar específicamente las reacciones de monatina y triptófano in vivo e in vitro. Las transiciones monitoreadas son 293,1 a 158,0, 293,1 a 168,0, 293,1 a 211,5 y 293,1 a 257,0. El triptófano se monitorea con la transición MRM 205,2 a 146,1. Para la cuantificación estándar interna de monatina y triptófano, se analizaron cuatro patrones de calibración que contienen cuatro proporciones diferentes de cada analito respecto de d5-triptófano y d5monatina. Estos datos están sujetos a un análisis lineal de mínimos cuadrados para formar una curva de calibración para monatina y triptófano. A cada muestra se le agrega una cantidad fija de d5-triptófano y d5-monatina (la d5monatina se sintetizó de d5-triptófano conforme a los procedimientos de la patente WO03/091396 A2), y se utilizan las proporciones de respuesta (monatina/d5-monatina; triptófano/d5-triptófano) junto con las curvas de calibración descritas anteriormente para calcular la cantidad de cada analito en las mezclas. Las transiciones de masa padrehija monitoreadas para d5-triptófano y d5-monatina son 210,2 a 151,1, y 298,1 a 172,0, respectivamente. If the LC phase was A) water with 0.3% formic acid and 10 mM ammonium formate and B) methanol with 0.3% formic acid and 10 mM ammonium formate, the gradient elution it was linear from 5% B to 45% B, 08.5 minutes, linear from 45% B to 90% B, 8.5-0 minutes, isocratic from 90% B to 90% B, 9 -12.5 minutes, linear from 95% B to 5% B, 12.5-13 minutes, with a rebalancing period of 4 minutes between sets. The flow rate was 0.27mL / min, and the PDA absorbance was monitored from 210nm to 400nm. All ESI-MS parameters were optimized and selected based on the generation of protonated molecular ions ([M + H] +) from the analytes of interest and the production of ions from characteristic fragments. The instrumental parameters used for this secondary mobile phase are the same as the previous parameters. Four monatin-specific father-daughter MRM transitions and one specific father / daughter tryptophan transition are used to specifically detect monatin and tryptophan reactions in vivo and in vitro. The monitored transitions are 293.1 to 158.0, 293.1 to 168.0, 293.1 to 211.5 and 293.1 to 257.0. Tryptophan is monitored with the MRM 205.2 to 146.1 transition. For internal standard quantification of monatin and tryptophan, four calibration standards containing four different ratios of each analyte to d5-tryptophan and d5monatin were analyzed. These data are subjected to a linear least squares analysis to form a calibration curve for monatin and tryptophan. A fixed amount of d5-tryptophan and d5-monatin is added to each sample (d5monatin was synthesized from d5-tryptophan according to the procedures of patent WO03 / 091396 A2), and the response ratios (monatin / d5 are used -monatin; tryptophan / d5-tryptophan) together with the calibration curves described above to calculate the amount of each analyte in the mixtures. The monitored daughter-father mass transitions for d5-tryptophan and d5-monatin are 210.2 to 151.1, and 298.1 to 172.0, respectively.

Medición exacta de masa de monatina Exact measurement of monatin mass

Se realizó un análisis MS de alta resolución mediante el uso de un espectrómetro de masas de cuadrúpolo híbrido/tiempo de vuelo Q-Star de Applied Biosystems-Perkin Elmer. La masa medida para la monatina protonada utilizó triptófano como patrón interno de calibración de masa. La masa calculada de monatina protonada, en base a la composición básica C14H17N2O5 es 293,1137. La monatina producida utilizando el proceso biocatalítico descrito en los Ejemplos 2 y 3 mostró una masa medida de 293,1144. Este es un error de medición de la masa menor a 2 partes por millón (ppm), que proporciona prueba concluyente de la composición básica de la monatina producida por vía enzimática. High resolution MS analysis was performed using a Q-Star hybrid quadrupole / time-of-flight mass spectrometer from Applied Biosystems-Perkin Elmer. The mass measured for the protonated monatin used tryptophan as the internal mass calibration standard. The calculated mass of protonated monatin, based on the basic composition C14H17N2O5, is 293.1137. Monatin produced using the biocatalytic process described in Examples 2 and 3 showed a measured mass of 293.1144. This is a mass measurement error of less than 2 parts per million (ppm), which provides conclusive proof of the basic composition of monatin produced enzymatically.

Medición quiral LC/MS/MS (MRM) de monatina. Monatin chiral LC / MS / MS (MRM) measurement.

La determinación de la distribución de estereoisómeros de monatina en reacciones in vitro e in vivo se logró por derivatización con 1-fluoro-2-4-dinitrofenil-5-L-alanina amida (FDAA), seguida de la medición MRM LC/MS/MS de fase inversa. The determination of the distribution of monatin stereoisomers in in vitro and in vivo reactions was achieved by derivatization with 1-fluoro-2-4-dinitrophenyl-5-L-alanine amide (FDAA), followed by MRM LC / MS / measurement. Reverse phase MS.

Derivatización de monatina con FDAA Monatin derivatization with FDAA

En una muestra o patrón de 50 !L y en un patrón interno de 10 !L se agregaron 100 !L o 200 !L de un 1% de solución de FDAA en acetona. Se agregaron veinte o cuarenta !L de bicarbonato de sodio 1,0 M, respectivamente y la mezcla se incubó por 1 hora a 40°C mezclándose ocasionalmente. La muestra se removió y enfrió y neutralizó con 20 !L de HCI 2,0 M (se puede necesitar más HCI para realizar la neutralización de una mezcla biológica tamponada). Después de completar la desgasificación, las muestras estaban listas para analizar por LC/MS/MS. In a 50 µL sample or standard and an internal 10 µL standard, 100 µL or 200 µL of 1% FDAA solution in acetone were added. Twenty or forty µL of 1.0 M sodium bicarbonate were added, respectively, and the mixture was incubated for 1 hour at 40 ° C with occasional mixing. The sample was removed and cooled and neutralized with 20 µL of 2.0M HCI (more HCI may be required to neutralize a buffered biological mixture). After degassing was complete, the samples were ready for analysis by LC / MS / MS.

Monitoreo de reacción múltiple LC/MS/MS para la determinación de la distribución de estereoisómeros de monatina en reacciones in vitro e in vivo Monitoring of LC / MS / MS multiple reaction for determination of monatin stereoisomer distribution in in vitro and in vivo reactions

Se realizaron análisis utilizando la instrumentación de LC/MS/MS anteriormente descrita. Las separaciones por LC capaces de separar los cuatro estereoisómeros de monatina (específicamente FDAA-monatina) se realizaron en una columna de cromatografía de fase inversa de 2,0 x 250 mm (3 !m) de Phenomenex Luna C18 (2) a 40°C. La fase móvil de LC consistió en A) agua con un 0,05% (masa/volumen) de acetato de amonio y B) acetonitrilo. La elusión fue isocrática al 13% B, 0-2 minutos, lineal desde el 13% B hasta el 30% B, 2-15 minutos, lineal desde el 30% B hasta el 80% B, 15-16 minutos, isocrática al 80% B, 16-21 minutos, y lineal desde el 80% B hasta el 13% B, 21-22 minutos con un período de reequilibrado de 8 minutos entre las series. La tasa de flujo fue de 0,23 mL/min, y la absorbancia de PDA se monitoreó desde 200 nm hasta 400 nm. Todos los parámetros de la ESI-MS se optimizaron y seleccionaron en base a una generación de iones moleculares desprotonados ([M−H] −) de FDAA-monatina, y la producción de iones de fragmento característico. Analyzes were performed using the previously described LC / MS / MS instrumentation. LC separations capable of separating the four monatin stereoisomers (specifically FDAA-monatin) were performed on a 2.0 x 250 mm (3 µm) reverse phase chromatography column of Phenomenex Luna C18 (2) at 40 ° C. The LC mobile phase consisted of A) water with 0.05% (mass / volume) of ammonium acetate and B) acetonitrile. Elusion was isocratic at 13% B, 0-2 minutes, linear from 13% B to 30% B, 2-15 minutes, linear from 30% B to 80% B, 15-16 minutes, isocratic at 80% B, 16-21 minutes, and linear from 80% B to 13% B, 21-22 minutes with a rebalancing period of 8 minutes between sets. The flow rate was 0.23 mL / min, and the PDA absorbance was monitored from 200nm to 400nm. All ESI-MS parameters were optimized and selected on the basis of a generation of unprotonated molecular ions ([M − H] -) of FDAA-monatin, and the production of characteristic fragment ions.

Los siguientes parámetros instrumentales se utilizaron para el análisis de LC/MS de la monatina en el modo ESI/MS de ión negativo: Capilar: 2,0 kV; Cono; 25 V; Hex 1: 10 V; Apertura; 0 V; Hex 2: 0 V; Temperatura de la fuente: 100ºC; temperatura de desolvatación: 350°C; Gas de desolvatación: 500 L/h; Cono de gas: 50 L/h; Baja resolución de masas (Q1): 12,0; Alta resolución de masas (Q1): 12,0; Energía iónica: 0,2; Entrada: -5V; Energía de colisión: 20; Salida: 1V; Baja resolución de masas (Q2): 12; Alta resolución de masas (Q2): 12; Energía iónica (Q2): 3,0; Multiplicador: 650. Se utilizan tres transiciones padre-hija monatina-FDAA específicas para detectar específicamente las reacciones de FDAA-monatina in vitro e in vivo. Las transiciones monitoreadas para monatina son 543,2 a 268,1, 543,2 a 499,3, y 543,2 a 525,3. La transición de masa derivada del patrón interno de monatina fue 548,2 a 530,3. La identificación de los estereoisómeros de FDAA-monatina se basa en el tiempo de retención cromatográfica comparada con los estereoisómeros de monatina sintéticos purificados y los datos espectrales de la masa. Se utiliza un estándar interno para monitorear el progreso de la reacción y para confirmar el tiempo de retención del estereoisómero S,S. The following instrumental parameters were used for monatin LC / MS analysis in negative ion ESI / MS mode: Capillary: 2.0 kV; Cone; 25 V; Hex 1:10 V; Opening; 0 V; Hex 2: 0 V; Source temperature: 100ºC; desolvatation temperature: 350 ° C; Desolvation gas: 500 L / h; Gas cone: 50 L / h; Low mass resolution (Q1): 12.0; High mass resolution (Q1): 12.0; Ionic energy: 0.2; Input: -5V; Collision energy: 20; Output: 1V; Low mass resolution (Q2): 12; High mass resolution (Q2): 12; Ionic energy (Q2): 3.0; Multiplier: 650. Three specific father-daughter monatin-FDAA transitions are used to specifically detect FDAA-monatin reactions in vitro and in vivo. The monitored transitions for monatin are 543.2 to 268.1, 543.2 to 499.3, and 543.2 to 525.3. The mass transition derived from the monatin internal standard was 548.2 to 530.3. Identification of FDAA-monatin stereoisomers is based on chromatographic retention time compared to purified synthetic monatin stereoisomers and mass spectral data. An internal standard is used to monitor the progress of the reaction and to confirm the retention time of the S, S stereoisomer.

Detección por fluorescencia post columna con cromatografía líquida de aminoácidos que incluyen glutamato y alanina. Post-column fluorescence detection with liquid chromatography of amino acids including glutamate and alanine.

La cromatografía líquida con la detección por fluorescencia post columna (LC/OPA) para la determinación de glutamato y alanina en reacciones in vivo e in vitro se realizó en un sistema de LC 2690 de Waters o un equivalente combinado con un detector de fluorescencia mediante escaneo 474 y un módulo de reacción post columna de Waters. También se realizaron análisis semi cuantitativos de monatina y triptófano utilizando este procedimiento. Las separaciones de LC se realizaron en una columna de intercambio de iones cargados con interacción de sodio a 60ºC. La fase móvil A consistió en un tampón Na 328 de Pickering (Pickering Laboratories, Inc; Mountain View, CA) La fase móvil B consistió en un tampón Na 740 de Pickering. La elución en gradiente fue desde un 0% hasta 100% B, 0-20 minutos, isocrática al 100% B, 20-36 minutos y lineal desde un 100% B hasta un 0% B, 36-37 minutos, con al menos un período de reequilibrado de 5 minutos entre segmentos, dependiendo de la matriz de la muestra. La tasa de flujo para la fase móvil fue de 0,5 mL/min. La tasa de flujo para la solución de derivatización post columna de OPA fue de 0,5 mL/min. Las configuraciones del detector de fluorescencia fueron EX 338-340 nm y Em 420-425 nm. Se empleó norleucina como un patrón interno para el análisis. La identificación de aminoácidos se basó en los datos del tiempo de retención cromatográfica para patrones purificados. Liquid chromatography with post column fluorescence detection (LC / OPA) for the determination of glutamate and alanine in in vivo and in vitro reactions was performed on a Waters 2690 LC system or equivalent combined with a fluorescence detector by scanning 474 and a Waters post column reaction module. Semi-quantitative analyzes of monatin and tryptophan were also performed using this procedure. LC separations were performed on a sodium interaction charged ion exchange column at 60 ° C. Mobile phase A consisted of Pickering Na 328 buffer (Pickering Laboratories, Inc.; Mountain View, CA) Mobile phase B consisted of Pickering Na 740 buffer. Gradient elution was from 0% to 100% B, 0-20 minutes, isocratic at 100% B, 20-36 minutes and linear from 100% B to 0% B, 36-37 minutes, with at least a 5 minute rebalancing period between segments, depending on the sample matrix. The flow rate for the mobile phase was 0.5 mL / min. The flow rate for the OPA post-column derivatization solution was 0.5 mL / min. The fluorescence detector settings were EX 338-340 nm and Em 420-425 nm. Norleucine was used as an internal standard for the analysis. Amino acid identification was based on chromatographic retention time data for purified standards.

Detección de L- y D-aminoácidos por LC/MS/MS Detection of L- and D-amino acids by LC / MS / MS

Las muestras que contienen una mezcla de L- y D-aminoácidos como lisina, alanina, metionina, tirosina, leucina, fenilalanina, triptófano, glutamato, y aspartato obtenidas de experimentos de reacción bioquímica se trataron por primera vez con ácido fórmico para desnaturalizar la proteína. Posteriormente la muestra se centrifugó y filtró a través de un filtro de jeringa de nylon de 0,45 !m antes del análisis de LC/MS/MS. La identificación de L- y Daminoácidos se basó en el tiempo de retención y la detección selectiva de masa. La separación por LC se logró mediante el uso de un sistema de cromatografía líquida 2690 de Waters y una columna de cromatografía de 2,1 mm x 250mm Chirobiotic TAG de ASTEC con una temperatura de columna de 45°C. Las fases móviles A y B de la LC consistieron de un 0,25% de ácido acético y un 0,25% de ácido acético en metanol, respectivamente. Se utilizó una elución isocrática para todos los procedimientos para separar los isómeros L y D. La lisina se eluyó utilizando un 80% de fase móvil A y un 20% de fase móvil B. El glutamato, la alanina y la metionina se separaron con la elución del 60% de la fase móvil A y el 40% de la fase móvil B y una tasa de flujo de 0,25 mL/min. El aspartato, el triptófano, la tirosina, la leucina, y la fenilalanina se separaron isoméricamente con 30% de la fase móvil A y con un 70% de la fase móvil B con una tasa de flujo de 0,3 mL/min para todos menos la fenilalanina, que se utilizó a una tasa de flujo de 0,25 mL/min. Samples containing a mixture of L- and D-amino acids such as lysine, alanine, methionine, tyrosine, leucine, phenylalanine, tryptophan, glutamate, and aspartate obtained from biochemical reaction experiments were first treated with formic acid to denature the protein . The sample was then centrifuged and filtered through a 0.45 µm nylon syringe filter prior to LC / MS / MS analysis. The identification of L- and Daminoacids was based on retention time and selective mass detection. LC separation was accomplished using a Waters 2690 liquid chromatography system and an ASTEC 2.1mm x 250mm Chirobiotic TAG chromatography column with a column temperature of 45 ° C. Mobile phases A and B of the LC consisted of 0.25% acetic acid and 0.25% acetic acid in methanol, respectively. Isocratic elution was used for all procedures to separate the L and D isomers. Lysine was eluted using 80% mobile phase A and 20% mobile phase B. Glutamate, alanine and methionine were separated with the elution of 60% of mobile phase A and 40% of mobile phase B and a flow rate of 0.25 mL / min. Aspartate, tryptophan, tyrosine, leucine, and phenylalanine were separated isomerically with 30% of mobile phase A and 70% of mobile phase B with a flow rate of 0.3 mL / min for all minus phenylalanine, which was used at a flow rate of 0.25 mL / min.

El sistema de detección para el análisis de los L- y D-aminoácidos incluyó un detector de fotodiodo (PDA) 996 de Waters y un espectrómetro de masa de triple cuadrúpolo Quattro Ultima de Micromass. El PDA, que escanea de 195 a 350 nm, se colocó en serie entre el sistema de cromatografía y el espectrómetro de masa. Los parámetros para el espectrómetro de masa de triple cuadrúpolo Quattro Ultima de Micromass que funciona en modo de ionización positiva por electroasperción (+ESI) fueron los siguientes: Capilar: 3,0 kV; Cono: 20 V; Hex 1: 15 V; Apertura: 1 V; Hex 2: 0 V: Temperatura de fuente. 100ºC; temperatura de desolvatación: 350ºC; gas de desolvatación: 530 L/h; cono de gas: 30 L/h; Baja resolución de masas Q1: 12,5; Alta resolución de masas Q1: 12,5; Energía iónica 1: 0,2; Entrada: -5; Colisión: 8; Salida 1: 10; Baja resolución de masas Q2: 12,5; Alta resolución de masas Q2: 12,5; Energía iónica 2: 0,5; Multiplicador: 650 V. Los experimentos de MS/MS con un modo de Monitoreo de reacción múltiple (MRM) se establecieron para monitorear selectivamente las transiciones de reacción de 147.8 a 84.2 y de The detection system for analysis of L- and D-amino acids included a Waters 996 photodiode detector (PDA) and a Micromass Quattro Ultima triple quadrupole mass spectrometer. The PDA, which scans from 195 to 350 nm, was placed in series between the chromatography system and the mass spectrometer. The parameters for the Micromass Quattro Ultima triple quadrupole mass spectrometer operating in positive electrospray ionization (+ ESI) mode were as follows: Capillary: 3.0 kV; Cone: 20V; Hex 1:15 V; Aperture: 1V; Hex 2: 0 V: Source temperature. 100 ° C; desolvatation temperature: 350ºC; desolvation gas: 530 L / h; gas cone: 30 L / h; Low mass resolution Q1: 12.5; High mass resolution Q1: 12.5; Ionic energy 1: 0.2; Input: -5; Collision: 8; Exit 1: 10; Low mass resolution Q2: 12.5; High mass resolution Q2: 12.5; Ionic energy 2: 0.5; Multiplier: 650 V. MS / MS experiments with a Multiple Reaction Monitoring (MRM) mode were set up to selectively monitor reaction transitions from 147.8 to 84.2 and from

147.8 a 102.1 de glutamato, de 134,00 a 74,30 y de 134,00 a 88,2 para aspartato, de 147,3 a 85,0 para lisina, de 150,3 a 104,8 para metionina, de 182,3 a 137,0 para tirosina, de 132,3 a 87,0 para leucina y de 166,3 a 121,0 para fenilalanina. Cuando se enumeraron dos transiciones, las últimas se utilizaron para su cuantificación. Para el triptófano, se determinaron los experimentos de MS/MS con el modo de Monitoreo de reacción múltiple (MRM) para monitorear selectivamente las transiciones de reacción de 205,2 a 118,2, de 205,2 a 146,1 y de 205,2 a 188,2 y la transición desde 212.1 a 151,1 para el d8-DL-triptófano. La cuantificación de triptófano se logró determinando la proporción de la respuesta de analito de la transición de 205.2 a 146.1 en el patrón interno, d8-D, L-triptófano. En forma alternativa, la cuantificación de triptófano, glutamato y ácidos aspárticos se basaron en las respuestas de señal de m/z=146,5, m/z=102,1 y m/z=88,2, respectivamente, Glutamate 147.8 to 102.1, 134.00 to 74.30 and 134.00 to 88.2 for aspartate, 147.3 to 85.0 for lysine, 150.3 to 104.8 for methionine, 182 , 3 to 137.0 for tyrosine, 132.3 to 87.0 for leucine and 166.3 to 121.0 for phenylalanine. When two transitions were listed, the last ones were used for their quantification. For tryptophan, MS / MS experiments were determined with the Multiple Reaction Monitoring (MRM) mode to selectively monitor reaction transitions from 205.2 to 118.2, 205.2 to 146.1, and 205 , 2 to 188.2 and the transition from 212.1 to 151.1 for d8-DL-tryptophan. Quantification of tryptophan was achieved by determining the ratio of the analyte response of the transition from 205.2 to 146.1 in the internal standard, d8-D, L-tryptophan. Alternatively, the quantification of tryptophan, glutamate, and aspartic acids was based on the signal responses of m / z = 146.5, m / z = 102.1, and m / z = 88.2, respectively,

Producción de monatina y precursor de monatina (MP) para patrones y ensayos Monatin and monatin precursor (MP) production for standards and assays

Producción de monatina Monatin production

Una mezcla racémica de (R,R)-monatina y (S,S)-monatina se produjo en forma sintética como se describe en la Patente de los Estados Unidos No. 5.128.482. A racemic mixture of (R, R) -monatin and (S, S) -monatin was produced synthetically as described in US Patent No. 5,128,482.

La (R,R)-monatina y la (S,S)-monatina se separaron mediante derivatización e hidrólisis. En síntesis, la mezcla racémica de monatina se esterificó, el grupo libre de amino se bloqueó con Cbz, se formó una lactona, y la lactona S,S se hidrolizó selectivamente utilizando una enzima de proteasa inmovilizada. La monatina también se puede separar como se describe en Bassoli, A. et al., Eur. J. Org. Chem., 8:1652-1658 (2005). (R, R) -monatin and (S, S) -monatin were separated by derivatization and hydrolysis. In synthesis, the racemic monatin mixture was esterified, the free amino group was blocked with Cbz, a lactone was formed, and the S, S lactone was selectively hydrolyzed using an immobilized protease enzyme. Monatin can also be separated as described in Bassoli, A. et al., Eur. J. Org. Chem., 8: 1652-1658 (2005).

Producción de MP MP production

Se produjo R-MP mediante la transaminación de (R,R)-monatina utilizando una D-aminotransferasa de amplia gama AT-103 (BioCatalytics, Pasadena, CA) en un tampón de fosfato de potasio 0,1 M , mediante el uso de piruvato de sodio como el aceptor de amino. Se produjo S-MP mediante la transaminación de (S,S)-monatina utilizando una Laminotransferasa AT-102 (BioCatalytics, Pasadena, CA) en un tampón de fosfato de potasio 0,1 M mediante el uso de piruvato de sodio como el aceptor de amino. Ambas reacciones se realizaron a 30ºC y con un pH de aproximadamente 8,0-8,3 por aproximadamente 20 horas. Ambos compuestos se purificaron utilizando una escala preparativa HPLC con una resina hidrófoba (XADTM1600) de Rohm & Haas (Filadelfia, PA) que eluye en agua. Se obtuvieron las muestras que contienen más del 90% de precursor de monatina puro y se congelaron a seco. R-MP was produced by transamination of (R, R) -monatin using a wide range D-aminotransferase AT-103 (BioCatalytics, Pasadena, CA) in 0.1M potassium phosphate buffer, using sodium pyruvate as the amino acceptor. S-MP was produced by transamination of (S, S) -monatin using an AT-102 Laminotransferase (BioCatalytics, Pasadena, CA) in a 0.1 M potassium phosphate buffer using sodium pyruvate as the acceptor of amino. Both reactions were performed at 30 ° C and at a pH of about 8.0-8.3 for about 20 hours. Both compounds were purified using a preparative HPLC scale with a hydrophobic resin (XADTM1600) from Rohm & Haas (Philadelphia, PA) eluting in water. Samples containing more than 90% pure monatin precursor were obtained and frozen to dry.

Ejemplo 2 Example 2

Detección del precursor de monatina Monatin precursor detection

El presente ejemplo describe los procedimientos utilizados para separar y detectar los dos enantiómeros del precursor de monatina. The present example describes the procedures used to separate and detect the two enantiomers of the monatin precursor.

Método no quiral para la detección del precursor de monatina Non-chiral method for the detection of the monatin precursor

Las muestras de reacción en placas de 96 pocillos se inyectaron en una columna de 3,0 x 150mm, 3,5 µm de Agilent Zorbax RX-C18 utilizando un muestraedor automático CTCPal (LEAP Technologies, Carrboro, N.C.). Los productos se separaron utilizando un gradiente de H20/ACN (0,1% de ácido fórmico): Reaction samples in 96-well plates were injected onto a 3.0 x 150mm, 3.5 µm column of Agilent Zorbax RX-C18 using a CTCPal Autosampler (LEAP Technologies, Carrboro, N.C.). The products were separated using an H20 / ACN gradient (0.1% formic acid):

Las bombas LC-10ADvp (Shimadzu, Kioto, Japón) proporcionaron el gradiente a 0,8 mL/min. Los productos se detectaron utilizando un espectrómetro de masas de triple cuadrúpolo API4000 de Turbolon (Applied Biosystems, Foster City, CA). La vaporización de iones y el monitoreo múltiple de iones se realizó para los analitos de interés en el modo de ión negativo y cada análisis duró 6,5 minutos. LC-10ADvp pumps (Shimadzu, Kyoto, Japan) provided the gradient at 0.8 mL / min. Products were detected using an API4000 triple quadrupole mass spectrometer from Turbolon (Applied Biosystems, Foster City, CA). Ion vaporization and multiple ion monitoring was performed for analytes of interest in negative ion mode and each analysis lasted 6.5 minutes.

Piruvato = 87,1[M−H+] − Pyruvate = 87.1 [M − H +] -

Indol-3-piruvato = 202,1[M−H+] − Indole-3-pyruvate = 202.1 [M − H +] -

Producto = 290,0 [M−H+] – Product = 290.0 [M − H +] -

Análisis quiral por CE de precursores de monatina R y S Chiral analysis by EC of monatin precursors R and S

Se utilizó un instrumento de electroforesis capilar MDQ de P/ACE™ (Beckman Coulter, Fullerton, CA). Se utilizó el Kit de Desarrollo Quiral, que incluye pequeñas cantidades de varios selectores quirales, tampones necesarios y 2 capilares (Beckman, Fullerton, CA). En forma alternativa, para el ensayo de MP únicamente, se pueden obtener en forma separada los siguientes reactivos y otros suministros de Beckman Coulter (Fullerton, CA) o en otra parte: A P / ACE ™ MDQ capillary electrophoresis instrument (Beckman Coulter, Fullerton, CA) was used. The Chiral Development Kit was used, which includes small amounts of various chiral selectors, necessary buffers and 2 capillaries (Beckman, Fullerton, CA). Alternatively, for the MP assay only, the following reagents and other supplies may be obtained separately from Beckman Coulter (Fullerton, CA) or elsewhere:

Capilar revestido N-CHO; 50 µm de ID, 65 cm de longitud total o un capilar de sílice fundida. N-CHO coated capillary; 50 µm ID, 65 cm full length or a fused silica capillary.

25 mM de tampón de fosfato, pH 5. 25 mM phosphate buffer, pH 5.

25 mg de hidroxipropil--ciclodextrina Hydroxypropyl 25 mg - cyclodextrin

Una solución de acondicionamiento capilar de 10 ml (en forma alternativa se puede utilizar un 0,5% de solución de óxido de polietileno, Mw, 600.000 o 300.000 daltons) A 10 ml hair conditioning solution (alternatively 0.5% polyethylene oxide solution, Mw, 600,000 or 300,000 daltons can be used)

Análisis por electroforesis capilar (CE) Capillary Electrophoresis (CE) Analysis

Se utilizó un capilar neutral revestido, 50 !M ID, de 60 cm (50 cm para la detección) o 30 (20) cm junto con una detección de DAD (o UV simple) a 214 nm. El capilar de separación se calentó a 15ºC, y las muestras a 4ºC. El tampón de separación consistió en 20 mM de hidroxipropil--ciclodextrina, 25 mM de fosfato y un pH de 5. La inyección de la muestra generalmente fue de 0,5 psi, 5 s. La separación se realizó a 500V/cm, polaridad inversa (15 kV para un capilar de 30 cm, 30 kV para 60 cm). La corriente típica utilizada durante la separación fue de -28 !A. Los tiempos típicos de migración para los picos de MP fueron 3,5 minutos (20 cm de longitud efectiva) u 8 minutos (50 cm). A coated neutral capillary, 50 µM ID, 60 cm (50 cm for detection) or 30 (20) cm was used in conjunction with a DAD (or simple UV) detection at 214 nm. The separation capillary was heated to 15 ° C, and the samples to 4 ° C. The separation buffer consisted of 20 mM hydroxypropyl-cyclodextrin, 25 mM phosphate and a pH of 5. Sample injection was generally 0.5 psi, 5 s. The separation was performed at 500V / cm, reverse polarity (15 kV for a 30 cm capillary, 30 kV for 60 cm). The typical current used during the separation was -28! A. Typical migration times for the MP peaks were 3.5 minutes (20 cm effective length) or 8 minutes (50 cm).

Un paso opcional de limpieza/lavado/acondicionamiento capilar previo a las series de muestra utilizó H2O durante 4 minutos, HCl 0,1 M durante 1 minuto, H2O durante 1,5 minutos, solución de acondicionamiento capilar durante 4 minutos, H2O durante 1 minuto y tampón de separación durante 4 minutos. An optional hair cleaning / washing / conditioning step prior to the sample runs used H2O for 4 minutes, 0.1M HCl for 1 minute, H2O for 1.5 minutes, hair conditioning solution for 4 minutes, H2O for 1 minute and separation buffer for 4 minutes.

Un resumen del procedimiento de serie fue el siguiente: enjuague del tampón de separación por 1-2 minutos, inyección de muestra 5 s a 0,5 psi, separación durante 5-10 minutos a una polaridad de voltaje inversa de 15 o 30 kV dependiendo de la longitud capilar. A summary of the serial procedure was as follows: rinse the separation buffer for 1-2 minutes, sample injection 5 s at 0.5 psi, separation for 5-10 minutes at a reverse voltage polarity of 15 or 30 kV depending on capillary length.

Ejemplo 3 Example 3

Ensayo general de aldolasas de piruvato Pyruvate Aldolases General Assay

Un procedimiento ejemplar para medir la actividad de diferentes aldolasas de piruvato utiliza un sustrato general, 4carboxi-4-hidroxi-2-oxoadipato (CHA). El ensayo de CHA se adaptó de los ensayos de la literatura (por ejemplo, véase E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992). Un ensayo típico incluyó 50 mM de fosfato de sodio con un pH de 7.5, 1 mM de MgCl2, 1 mM de CHA, 10 !g/ml de D-lactato deshidrogenasa (LDH) de Lactobacillus leichmanii (Sigma-Aldrich, St. Louis, MO), 0,5 mM de NADH. El ensayo comenzó mediante la incorporación de enzima (generalmente entre 1 y 5 !L). La liberación de piruvato, junto con la formación de NAD+ se monitoreó permanentemente en un espectrómetro a 340 nm. An exemplary procedure to measure the activity of different pyruvate aldolases uses a general substrate, 4-carboxy-4-hydroxy-2-oxoadipate (CHA). The CHA assay was adapted from the literature assays (eg, see E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992). A typical assay included 50 mM sodium phosphate with a pH of 7.5, 1 mM MgCl2, 1 mM CHA, 10 µg / ml Lactobacillus leichmanii D-lactate dehydrogenase (LDH) (Sigma-Aldrich, St. Louis , MO), 0.5 mM NADH. The assay started by incorporating enzyme (generally between 1 and 5 µL). Pyruvate release, along with NAD + formation, was permanently monitored on a spectrometer at 340 nm.

El CHA se sintetizó de conformidad con el procedimiento descrito en Tack, B.F. Chapman, P.J., y S. Dagley. J. Biol. Chem. 247 6438-6443 (1972). CHA was synthesized according to the procedure described in Tack, B.F. Chapman, P.J., and S. Dagley. J. Biol. Chem. 247 6438-6443 (1972).

Una unidad de actividad enzimática, como aldolasa de piruvato, como enzima de aldolasa de HMG y/o KHG, se define como la cantidad que libera piruvato suficiente para reducir la absorbancia a 340 nm por una OD de 1 por 5 minuto. A unit of enzyme activity, such as pyruvate aldolase, as HMG and / or KHG aldolase enzyme, is defined as the amount that pyruvate releases sufficient to reduce the absorbance at 340 nm by an OD of 1 to 5 minutes.

Ejemplo 4 Example 4

Descubrimiento de nuevas ceto-hidroxi-glutarato (KHG) e hidroxi-metil-ceto-glutarato (HMG) aldolasas de las bibliotecas ambientales de Diversa Discovery of new keto-hydroxy-glutarate (KHG) and hydroxy-methyl-keto-glutarate (HMG) aldolases from the environmental libraries of Diversa

Más de 150 aldolasas únicas de HMG y 15 aldolasas de KHG se descubrieron controlando las bibliotecas de ADN More than 150 unique HMG aldolases and 15 KHG aldolases were discovered by monitoring DNA libraries

10 de Diversa. Estos genes de aldolasa se secuenciaron y subclonaron en un vector de expresión adecuado. Este vector se transformó posteriormente en un huésped de expresión adecuado para la producción de cantidades suficientes de la aldolasa para la caracterización de la enzima. Un conjunto seleccionado de aldolasas se testearon para la actividad en CHA y también para la formación de un precursor de monatina (MP). Todas las enzimas descubiertas y descritas en esta patente tienen potencial para su uso en otras reacciones que forman enlaces 10 of Diversa. These aldolase genes were sequenced and subcloned into a suitable expression vector. This vector was subsequently transformed into an expression host suitable for the production of sufficient amounts of aldolase for characterization of the enzyme. A selected set of aldolases were tested for activity in CHA and also for formation of a monatin precursor (MP). All of the enzymes discovered and described in this patent have potential for use in other bond-forming reactions.

15 carbono-carbono entre el aceptor de alfa-cetoácido y piruvato o el donante derivado de piruvato como se ejemplifica en el esquema de reacción general que aparece a continuación. Carbon-carbon between the alpha-keto acid acceptor and pyruvate or the pyruvate derived donor as exemplified in the general reaction scheme below.

Aldolasa Aldolasa

20 R = H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido R = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl

R2 = H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido R2 = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl

R3 = H, alquilo, alquilo sustituido, arilo, arilo sustituido, bencilo, bencilo sustituido, ácido carboxílico R3 = H, alkyl, substituted alkyl, aryl, substituted aryl, benzyl, substituted benzyl, carboxylic acid

Ejemplo 5 Example 5

Caracterización de las aldolasas seleccionadas Characterization of the selected aldolases

25 Las aldolasas seleccionadas se caracterizaron respecto de su capacidad para catalizar la conversión de indol-3piruvato y piruvato en el precursor de monatina (MP) como se muestra en el siguiente esquema: The selected aldolases were characterized with respect to their ability to catalyze the conversion of indole-3-pyruvate and pyruvate in the monatin precursor (MP) as shown in the following scheme:

Las figuras 13 y 14 muestran las actividades de 58 aldolasas diferentes en la formación del MP medido por LC/MS/MS. Figures 13 and 14 show the activities of 58 different aldolases in the formation of the MP measured by LC / MS / MS.

30 Las reacciones de aldol se realizaron con 20 mM de indol-3-piruvato ("I3P"), 50 mM de piruvato, 100 mM de fosfato de sodio con un pH de 7, 1 mM de MgCl2, 100 !g/mL de aldolasa. Las reacciones se incubaron a temperatura ambiente en la oscuridad. Las alícuotas (30 !L) se removieron varias veces y las reacciones se detuvieron mediante el almacenamiento de las muestras en hielo. Una porción de cada alícuota se sometió a un análisis de CE mientras que la porción restante se diluyó 1:1000 en un 50% de acetonitrilo y se sometió al análisis de LC/MS. The aldol reactions were performed with 20mM indole-3-pyruvate ("I3P"), 50mM pyruvate, 100mM sodium phosphate with a pH of 7.1mM MgCl2, 100 µg / mL of aldolase. Reactions were incubated at room temperature in the dark. The aliquots (30 µL) were removed several times and the reactions were stopped by storing the samples on ice. A portion of each aliquot was subjected to EC analysis while the remaining portion was diluted 1: 1000 in 50% acetonitrile and subjected to LC / MS analysis.

Tabla 2: Enantioselectividad de diferentes aldolasas para la formación de MP a partir de I3P y piruvato determinado por CE quiral Table 2: Enantioselectivity of different aldolases for the formation of MP from I3P and pyruvate determined by chiral CE

Aldolasa Aldolasa
% de R-MP (plazo de 23 horas) CHA (U/mg) (en base a la proteína total en lisado) Expresión relativa % of R-MP (23 hour deadline) CHA (U / mg) (based on total protein in lysate) Relative expression

SEQ ID NO: 28 (codificada por la SEQ ID NO: 27) SEQ ID NO: 28 (encoded by SEQ ID NO: 27)
98+ 31,8 ### 98+ 31.8 ###

SEQ ID NO: 116 (codificada por la SEQ ID NO: 115) SEQ ID NO: 116 (encoded by SEQ ID NO: 115)
95 304 ## 95 304 ##

SEQ ID NO: 76 (codificada por la SEQ ID NO: 75) SEQ ID NO: 76 (encoded by SEQ ID NO: 75)
50 424 ### fifty 424 ###

SEQ ID NO: 298 (codificada por la SEQ ID NO: 297) SEQ ID NO: 298 (encoded by SEQ ID NO: 297)
98+ 388 ## 98+ 388 ##

SEQ ID NO: 44 (codificada por la SEQ ID NO: 43) SEQ ID NO: 44 (encoded by SEQ ID NO: 43)
70 332 ## 70 332 ##

SEQ ID NO: 54 (codificada por la SEQ ID NO: 53) SEQ ID NO: 54 (encoded by SEQ ID NO: 53)
98+ 95 # 98+ 95 #

SEQ ID NO: 148 (codificada por la SEQ ID NO: 147) SEQ ID NO: 148 (encoded by SEQ ID NO: 147)
90 200 ## 90 200 ##

SEQ ID NO: 46 (codificada por la SEQ ID NO: 45) SEQ ID NO: 46 (encoded by SEQ ID NO: 45)
70 174 ## 70 174 ##

SEQ ID NO: 134 (codificada por la SEQ ID NO: 133) SEQ ID NO: 134 (encoded by SEQ ID NO: 133)
90 576 ### 90 576 ###

SEQ ID NO: 142 (codificada por la SEQ ID NO: 141) SEQ ID NO: 142 (encoded by SEQ ID NO: 141)
98+ 55 # 98+ 55 #

SEQ ID NO: 122 (codificada por la SEQ ID NO: 121) SEQ ID NO: 122 (encoded by SEQ ID NO: 121)
98+ 38 ## 98+ 38 ##

SEQ ID NO: 74 (codificada por la SEQ ID NO: 73) SEQ ID NO: 74 (encoded by SEQ ID NO: 73)
80 484 ### 80 484 ###

SEQ ID NO: 64 (codificada por la SEQ ID NO: 63) SEQ ID NO: 64 (encoded by SEQ ID NO: 63)
95 38 # 95 38 #

SEQ ID NO: 108 (codificada por la SEQ ID NO: 107) SEQ ID NO: 108 (encoded by SEQ ID NO: 107)
98+ 40 # 98+ 40 #

SEQ ID NO: 796(codificada por la SEQ ID NO: 95) SEQ ID NO: 796 (encoded by SEQ ID NO: 95)
98+ No detectado # 98+ Not detected #

SEQ ID NO: 126 (codificada por la SEQ ID NO: 125) SEQ ID NO: 126 (encoded by SEQ ID NO: 125)
95 124 ## 95 124 ##

SEQ ID NO: 80 (codificada por la SEQ ID NO: 79) SEQ ID NO: 80 (encoded by SEQ ID NO: 79)
98+ No detectado # 98+ Not detected #

SEQ ID NO: 36 (codificada por la SEQ ID NO: 35) SEQ ID NO: 36 (encoded by SEQ ID NO: 35)
98+ 80 ## 98+ 80 ##

Aldolasa Aldolasa
% de R-MP (plazo de 23 horas) CHA (U/mg) (en base a la proteína total en lisado) Expresión relativa % of R-MP (23 hour deadline) CHA (U / mg) (based on total protein in lysate) Relative expression

SEQ ID NO: 62 (codificada por la SEQ ID NO: 61) SEQ ID NO: 62 (encoded by SEQ ID NO: 61)
98+ No detectado # 98+ Not detected #

SEQ ID NO: 112(codificada por la SEQ ID NO: 111) SEQ ID NO: 112 (encoded by SEQ ID NO: 111)
98+ No detectado # 98+ Not detected #

SEQ ID NO: 130 (codificada por la SEQ ID NO: 129) SEQ ID NO: 130 (encoded by SEQ ID NO: 129)
98+ 38 ## 98+ 38 ##

SEQ ID NO: 94 (codificada por la SEQ ID NO: 93) SEQ ID NO: 94 (encoded by SEQ ID NO: 93)
98+ 47 ## 98+ 47 ##

SEQ ID NO: 102 (codificada por la SEQ ID NO: 101) SEQ ID NO: 102 (encoded by SEQ ID NO: 101)
No detectado No detectado # Not detected Not detected #

SEQ ID NO: 58 (codificada por la SEQ ID NO: 57) SEQ ID NO: 58 (encoded by SEQ ID NO: 57)
98+ 59 ## 98+ 59 ##

SEQ ID NO: 88 (codificada por la SEQ ID NO: 87) SEQ ID NO: 88 (encoded by SEQ ID NO: 87)
50 510 ### fifty 510 ###

SEQ ID NO: 50 (codificada por la SEQ ID NO: 49) SEQ ID NO: 50 (encoded by SEQ ID NO: 49)
98+ 144 ## 98+ 144 ##

SEQ ID NO: 106 (codificada por la SEQ ID NO: 105) SEQ ID NO: 106 (encoded by SEQ ID NO: 105)
98+ No detectado ## 98+ Not detected ##

SEQ ID NO: 40 (codificada por la SEQ ID NO: 39) SEQ ID NO: 40 (encoded by SEQ ID NO: 39)
40 406 ### 40 406 ###

SEQ ID NO: 42 (codificada por la SEQ ID NO: 41) SEQ ID NO: 42 (encoded by SEQ ID NO: 41)
98+ 92 ## 98+ 92 ##

SEQ ID NO: 278(codificada por la SEQ ID NO: 277) SEQ ID NO: 278 (encoded by SEQ ID NO: 277)
95 2,0 # 95 2.0 #

SEQ ID NO: 162 (codificada por la SEQ ID NO: 161) SEQ ID NO: 162 (encoded by SEQ ID NO: 161)
95 11,8 # 95 11.8 #

SEQ ID NO: 276 (codificada por la SEQ ID NO: 275) SEQ ID NO: 276 (encoded by SEQ ID NO: 275)
98+ 100,4 #### 98+ 100.4 ####

SEQ ID NO: 178 (codificada por la SEQ ID NO: 177) SEQ ID NO: 178 (encoded by SEQ ID NO: 177)
95 38,8 # 95 38.8 #

SEQ ID NO: 202 (codificada por la SEQ ID NO: 201) SEQ ID NO: 202 (encoded by SEQ ID NO: 201)
No detectado No detectado # Not detected Not detected #

SEQ ID NO: 166 (codificada por la SEQ ID NO: 165) SEQ ID NO: 166 (encoded by SEQ ID NO: 165)
98+ 85,5 ## 98+ 85.5 ##

SEQ ID NO: 218 (codificada por la SEQ ID NO: 217) SEQ ID NO: 218 (encoded by SEQ ID NO: 217)
95 49,1 ## 95 49.1 ##

SEQ ID NO: 224 (codificada por la SEQ ID NO: 223) SEQ ID NO: 224 (encoded by SEQ ID NO: 223)
98+ 23,2 # 98+ 23.2 #

SEQ ID NO: 226 (codificada por la SEQ ID NO: 225) SEQ ID NO: 226 (encoded by SEQ ID NO: 225)
98+ 128,3 # 98+ 128.3 #

Aldolasa Aldolasa
% de R-MP (plazo de 23 horas) CHA (U/mg) (en base a la proteína total en lisado) Expresión relativa % of R-MP (23 hour deadline) CHA (U / mg) (based on total protein in lysate) Relative expression

SEQ ID NO: 244 (codificada por la SEQ ID NO: 243) SEQ ID NO: 244 (encoded by SEQ ID NO: 243)
98+ 40,4 # 98+ 40.4 #

SEQ ID NO: 250 (codificada por la SEQ ID NO: 249) SEQ ID NO: 250 (encoded by SEQ ID NO: 249)
95 6,0 # 95 6.0 #

SEQ ID NO: 252 (codificada por la SEQ ID NO: 251) SEQ ID NO: 252 (encoded by SEQ ID NO: 251)
95 20,2 ## 95 20.2 ##

SEQ ID NO: 264 (codificada por la SEQ ID NO: 263) SEQ ID NO: 264 (encoded by SEQ ID NO: 263)
95 9,9 ## 95 9.9 ##

SEQ ID NO: 268 (codificada por la SEQ ID NO: 267) SEQ ID NO: 268 (encoded by SEQ ID NO: 267)
95 2,0 # 95 2.0 #

SEQ ID NO: 272 (codificada por la SEQ ID NO: 271) SEQ ID NO: 272 (encoded by SEQ ID NO: 271)
95 6,7 # 95 6.7 #

SEQ ID NO: 184 (codificada por la SEQ ID NO: 183) SEQ ID NO: 184 (encoded by SEQ ID NO: 183)
95 No detectado # 95 Not detected #

SEQ ID NO: 282 (codificada por la SEQ ID NO: 281) SEQ ID NO: 282 (encoded by SEQ ID NO: 281)
05 36,7 ### 05 36.7 ###

SEQ ID NO: 186 (codificada por la SEQ ID NO: 185) SEQ ID NO: 186 (encoded by SEQ ID NO: 185)
95 4,2 # 95 4.2 #

SEQ ID NO: 192 (codificada por la SEQ ID NO: 191) SEQ ID NO: 192 (encoded by SEQ ID NO: 191)
95 11,9 # 95 11.9 #

SEQ ID NO: 200 (codificada por la SEQ ID NO: 199) SEQ ID NO: 200 (encoded by SEQ ID NO: 199)
95 17,9 ## 95 17.9 ##

SEQ ID NO: 280 (codificada por la SEQ ID NO: 279) SEQ ID NO: 280 (encoded by SEQ ID NO: 279)
50 No detectado # fifty Not detected #

SEQ ID NO: 284 (codificada por la SEQ ID NO: 283) SEQ ID NO: 284 (encoded by SEQ ID NO: 283)
90 2,2 # 90 2.2 #

SEQ ID NO: 172 (codificada por la SEQ ID NO: 171) SEQ ID NO: 172 (encoded by SEQ ID NO: 171)
95 8,4 # 95 8.4 #

SEQ ID NO: 180 (codificada por la SEQ ID NO: 179) SEQ ID NO: 180 (encoded by SEQ ID NO: 179)
98+ 61,0 ### 98+ 61.0 ###

SEQ ID NO: 168 (codificada por la SEQ ID NO: 167) SEQ ID NO: 168 (encoded by SEQ ID NO: 167)
98+ 9,3 # 98+ 9.3 #

SEQ ID NO: 228 (codificada por la SEQ ID NO: 227) SEQ ID NO: 228 (encoded by SEQ ID NO: 227)
98+ 38,7 ### 98+ 38.7 ###

SEQ ID NO: 236(codificada por la SEQ ID NO: 235) SEQ ID NO: 236 (encoded by SEQ ID NO: 235)
95 13,1 # 95 13.1 #

SEQ ID NO: 238 (codificada por la SEQ ID NO: 237) SEQ ID NO: 238 (encoded by SEQ ID NO: 237)
98+ 22,3 ## 98+ 22.3 ##

SEQ ID NO: 240 (codificada por la SEQ ID NO: 239) SEQ ID NO: 240 (encoded by SEQ ID NO: 239)
95 No detectado # 95 Not detected #

Aldolasa Aldolasa
% de R-MP (plazo de 23 horas) CHA (U/mg) (en base a la proteína total en lisado) Expresión relativa % of R-MP (23 hour deadline) CHA (U / mg) (based on total protein in lysate) Relative expression

SEQ ID NO: 270 (codificada por la SEQ ID NO: 269) SEQ ID NO: 270 (encoded by SEQ ID NO: 269)
40 4,6 # 40 4.6 #

SEQ ID NO: 156(codificada por la SEQ ID NO: 155) SEQ ID NO: 156 (encoded by SEQ ID NO: 155)
98+ 133,0 ### 98+ 133.0 ###

Sírvase notar que las selectividades para R-MP de 98+% indican que no se detectó S-MP alguno. Dada la sensibilidad del ensayo de CE, los resultados indican que al menos el 98+% de MP formado es el enantiómero R. Por lo tanto, las enzimas que se indican con 98+% son al menos 98% selectivas hacia R-MP y pueden ser hasta Please note that the selectivities for R-MP of 98 +% indicate that no S-MP was detected. Given the sensitivity of the CE assay, the results indicate that at least 98 +% of MP formed is the R enantiomer. Therefore, the enzymes indicated with 98 +% are at least 98% selective towards R-MP and can be up to

5 100% selectivas. 5 100% selective.

La tabla 2 también muestra la actividad de las enzimas en un sustrato de aldolasa general, CHA, así como también la expresión relativa de cada enzima, como determina SDS-PAGE. Sírvase notar que varias enzimas no mostraron una actividad detectable en CHA, pero exhibieron actividad al generar un MP. Table 2 also shows the activity of the enzymes in a general aldolase substrate, CHA, as well as the relative expression of each enzyme, as determined by SDS-PAGE. Please note that several enzymes did not show detectable activity in CHA, but did show activity by generating a MP.

En resumen, las aldolasas muestran una amplia gama de actividades, expresiones y selecciones. Asimismo, hay 10 muchas aldolasas que muestran selectividades altamente finas (98% o más) para R-MP. In summary, aldolases display a wide range of activities, expressions, and selections. Also, there are 10 many aldolases that show highly fine selectivities (98% or more) for R-MP.

Ejemplo 6 (no reivindicado) Example 6 (not claimed)

Descubrimiento de aldolasas de piruvato en plantas Discovery of pyruvate aldolases in plants

Se diseñaron y utilizaron cebadores degenerados de PCR (ver a continuación) para extraer genes de aldolasa de ADNc preparado de Sclerochiton ilicifolius. Los extremos 5' y 3' de los genes se recuperaron y los genes de longitud Degenerate PCR primers (see below) were designed and used to extract aldolase genes from cDNA prepared from Sclerochiton ilicifolius. The 5 'and 3' ends of the genes were retrieved and the genes in length

15 total se amplificaron por PCR. Total 15 were amplified by PCR.

Cebador Primer

AARGTBTWGARGACAATG (SEQ ID NO: 335) AARGTBTWGARGACAATG (SEQ ID NO: 335)

GCDCAGAWCAAYGGRTGG (SEQ ID NO: 336) GCDCAGAWCAAYGGRTGG (SEQ ID NO: 336)

CCATCRSYATCDGCRTADAGCCA (SEQ ID NO: 337) CCATCRSYATCDGCRTADAGCCA (SEQ ID NO: 337)

GCRTADAGCCAYTCNCCRTC (SEQ ID NO: 338) GCRTADAGCCAYTCNCCRTC (SEQ ID NO: 338)

Ejemplo 7 (no reivindicado) Example 7 (not claimed)

Clonación de D-aminoácido aminotransferasa de Bacillus sphaericus Cloning of Bacillus sphaericus D-amino acid aminotransferase

La D-aminoácido aminotransferasa de Bacillus sphaericus (EC 2.6.1.21 también conocida como D-alanina Bacillus sphaericus D-amino acid aminotransferase (EC 2.6.1.21 also known as D-alanine

20 aminotransferasa o D-aspartato aminotransferasa) se produjo recombinantemente para su uso en ensayos combinados con varias aldolasas. Esta enzima es homóloga a las D-aminotransferasas anteriormente descritas para la producción de monatina (publicación de los Estados Unidos No. 20040063175 y publicación de los Estados Unidos No. 20050282260). Aminotransferase or D-aspartate aminotransferase) was produced recombinantly for use in combined assays with various aldolases. This enzyme is homologous to the D-aminotransferases previously described for the production of monatin (United States publication No. 20040063175 and United States publication No. 20050282260).

Cepas Strains

25 Se cultivó B. sphaericus (ATCC número 10208) en nutriente agar a 30°C durante 24 horas. Se colocaron grupos de colonias en 100 !L de agua estéril y se calentaron durante 5 minutos a 95°C para alterar las células. Se utilizaron tres !L en amplificaciones posteriores de Reacciones en Cadena de la Polimerasa (PCR). B. sphaericus (ATCC number 10208) was grown on nutrient agar at 30 ° C for 24 hours. Colony clusters were placed in 100 µL of sterile water and heated for 5 minutes at 95 ° C to alter the cells. Three µL were used in subsequent amplifications of Polymerase Chain Reactions (PCR).

Protocolo de Reacción en cadena de la polimerasa Polymerase chain reaction protocol

Se diseñaron cebadores para clonar en vectores pET 28b y pET 30a (Novagen, Madison, WI), utilizando los sitios Ncol y BamHI. La construcción pET 30 contiene una terminal N marcada con Histidina y Serina mientras que la construcción pET28 no está marcada. Primers were designed to clone into vectors pET 28b and pET 30a (Novagen, Madison, WI), using the Ncol and BamHI sites. The pET 30 construct contains an N-terminal labeled with Histidine and Serine while the pET28 construct is unlabeled.

Cebadores de Bacillus sphaericus: Bacillus sphaericus primers:

Terminal N: 5’-GATATACCATGGCATACTCATTATGGAATG-3’ (SEQ ID NO: 383) y terminal C: 5’-GTTATCGGATCCTTAGGCATTAATTGAAATTG-3’ (SEQ ID NO: 384) Terminal N: 5’-GATATACCATGGCATACTCATTATGGAATG-3 ’(SEQ ID NO: 383) and terminal C: 5’-GTTATCGGATCCTTAGGCATTAATTGAAATTG-3’ (SEQ ID NO: 384)

La región de codificación se amplificó utilizando el siguiente protocolo de PCR. En una reacción de 50 !l se utilizaron 3 !l de plantilla, 1,6 !l de cada cebador, 0,25 mM de cada dNTP, 3,5 U de Polimerasa de Alta Fidelidad (Roche, Indianápolis, IN) y un tampón IX de Expand™ con Mg. El programa del termociclador utilizado incluyó un arranque en caliente a 94°C durante 3 minutos, seguido de 8 repeticiones de las siguientes etapas: 94°C durante 30 segundos, 52°C durante 30 segundos, y 72°C durante 2 minutos. Se realizaron veintidós ciclos con una temperatura homogénea de 58ºC. Después de 30 ciclos, la muestra se mantuvo a 72°C durante 7 minutos y posteriormente se almacenó a 4ºC. Se obtuvieron los productos libres de PCR del tamaño correcto (aproximadamente 850 bp para dicho gen DAT). The coding region was amplified using the following PCR protocol. In a 50 µl reaction, 3 µl of template, 1.6 µl of each primer, 0.25 mM of each dNTP, 3.5 U of High Fidelity Polymerase (Roche, Indianapolis, IN) and a Expand ™ Buffer IX with Mg. The thermocycler program used included a warm start at 94 ° C for 3 minutes, followed by 8 repetitions of the following steps: 94 ° C for 30 seconds, 52 ° C for 30 seconds, and 72 ° C for 2 minutes. Twenty-two cycles were performed with a homogeneous temperature of 58 ° C. After 30 cycles, the sample was kept at 72 ° C for 7 minutes and was subsequently stored at 4 ° C. The correct size PCR-free products were obtained (approximately 850 bp for said DAT gene).

Clonación Cloning

Los productos PCR se purificaron utilizando un kit de purificación de PCR QIAquick de Qiagen (Qiagen, Valencia, CA) y se digirieron con BamHI y Ncol en un tampón BamHI (New England Biolabs, Ipswich, MA). The PCR products were purified using a Qiaquick PCR Purification Kit from Qiagen (Qiagen, Valencia, CA) and digested with BamHI and Ncol in BamHI buffer (New England Biolabs, Ipswich, MA).

El vector y los insertos digeridos se purificaron utilizando el Kit de Extracción de Gel QIAquick de Qiagen (Qiagen, Valencia, CA). Las ligaduras se realizaron utilizando el Kit de Ligadura Rápida de Roche (Roche, Indianápolis, IN) y se purificaron utilizando el kit de purificación de PCR QIAquick. Las ligaduras se transformaron en Escherichia coli de la cepa DH10B utilizando una cubeta de 0,2 cm y un sistema Gene Pulser II de Bio Rad como describe el manual de electroporación de Bio Rad (Bio Rad, Hercules, CA). Las células se recuperaron en 900 !L de SOC por 30 minutos a 37ºC a 225 rpm. Las células se ubicaron en placas de LB agar que contenían kanamicina (25!g/mL). The vector and the digested inserts were purified using the Qiaquick Gel Extraction Kit from Qiagen (Qiagen, Valencia, CA). Ligatures were performed using the Roche Rapid Ligation Kit (Roche, Indianapolis, IN) and purified using the QIAquick PCR Purification Kit. The ligatures were transformed into Escherichia coli from the DH10B strain using a 0.2 cm cuvette and a Bio Rad Gene Pulser II system as described in the Bio Rad electroporation manual (Bio Rad, Hercules, CA). Cells were recovered in 900 µL SOC for 30 minutes at 37 ° C at 225 rpm. Cells were plated on LB agar plates containing kanamycin (25 µg / mL).

El ADN plasmídico se purificó utilizando un kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se monitoreó respecto de los insertos correctos para la digestión de restricción con BamHI y Ncol. Las secuencias de plásmidos que parecían tener el inserto correcto se verificaron a través de la secuencia de terminación de la cadena didesoxi del ADN en Agencourt BioScience Corporation (Beverly, MA). La secuencia verificó la secuencia de codificación encontrada en la Región número de orden AF081278 de NCBI: 134.985 (gi: 3513754), que produce una proteína con una secuencia de aminoácido como enumera el número de orden AAC33964 (gi: 3513755). Plasmid DNA was purified using a Qiagen spin miniprep kit (Qiagen, Valencia, CA) and monitored for the correct inserts for restriction digestion with BamHI and Ncol. Plasmid sequences that appeared to have the correct insert were verified through the dideoxy DNA strand termination sequence at Agencourt BioScience Corporation (Beverly, MA). The sequence verified the coding sequence found in NCBI Region order number AF081278: 134,985 (gi: 3513754), which produces a protein with an amino acid sequence as listed by order number AAC33964 (gi: 3513755).

Expresión génica y ensayos Gene expression and assays

El ADN plasmídico se subclonó en el huésped de expresión de E.coli BL21 (DE3) (Novagen, Madison, WI). Los cultivos se desarrollaron y los plásmidos se aislaron utilizando el kit miniprep de Qiagen (Qiagen, Valencia, CA) y se analizaron mediante una digestión de restricción para confirmar la identidad. La inducción se produjo en un medio LB que contenía kanamicina (50 !g/mL). Las células se desarrollaron a una OD 600 entre 0,4 y 0,8, inducidas con 0,1 mM de IPTG (isopropil tiogalactósido) y se tomaron muestras a las 4 horas después de la inducción. Se prepararon extractos celulares conforme al protocolo que acompaña el reactivo de Novagen BugBuster™ (Novagen, Madison, WI) (con benzonucleasa y una mezcla de inhibidor de proteasa completo de Roche (Roche, Indianápolis, IN)). Se obtuvieron niveles muy altos de proteína soluble con el peso molecular previsto, como indica SDS-PAGE. Para algunas reacciones, el producto génico pET 30 se purificó utilizando cartuchos His-Bind conforme a los protocolos del fabricante (Novagen, Madison, WI). Las fracciones de eluyente se desalaron en columnas PD-10 (GE Healthcare, Piscataway, NJ) y se eluyeron en 25-100 mM de tampón de fosfato de potasio, con un pH de 7,5. Plasmid DNA was subcloned into the E. coli BL21 (DE3) expression host (Novagen, Madison, WI). Cultures were grown and plasmids were isolated using the Qiagen miniprep kit (Qiagen, Valencia, CA) and analyzed by restriction digestion to confirm identity. Induction occurred in LB medium containing kanamycin (50 µg / mL). The cells were grown to an OD 600 between 0.4 and 0.8, induced with 0.1 mM IPTG (isopropyl thiogalactoside) and samples were taken 4 hours after induction. Cell extracts were prepared according to the protocol accompanying the Novagen BugBuster ™ reagent (Novagen, Madison, WI) (with benzonuclease and a mixture of Roche's complete protease inhibitor (Roche, Indianapolis, IN)). Very high levels of soluble protein with the expected molecular weight were obtained, as indicated by SDS-PAGE. For some reactions, the pET 30 gene product was purified using His-Bind cartridges according to the manufacturer's protocols (Novagen, Madison, WI). The eluent fractions were desalted on PD-10 columns (GE Healthcare, Piscataway, NJ) and eluted in 25-100 mM of potassium phosphate buffer, with a pH of 7.5.

Los extractos celulares se analizaron para la actividad de D-aminotransferasa mediante la producción de alanina a partir de piruvato y D-triptófano utilizando el siguiente protocolo. Las reacciones de 1 mL se desarrollaron generalmente en 100mM de tampón de fosfato de potasio (pH 7,5), 50 !M de piridoxal fosfato, 25 mM de piruvato de sodio y 50 mM de D-triptófano. Las reacciones se iniciaron mediante la incorporación de extractos libres de células o enzimas purificadas y se incubaron durante entre 15 minutos y 24 horas a 30ºC con agitación suave. Se agregó ácido fórmico a la concentración definitiva de dos por ciento para detener la reacción y la proteína precipitada se eliminó mediante centrifugación. También se realizaron reacciones de control sin proteína agregada. También se utilizaron puntos de tiempo cero como controles negativos. Se detectó alanina utilizando una derivatización OPA como se describe en el Ejemplo 1. Cell extracts were analyzed for D-aminotransferase activity by producing alanine from pyruvate and D-tryptophan using the following protocol. The 1 mL reactions were generally carried out in 100mM of potassium phosphate buffer (pH 7.5), 50 µM of pyridoxal phosphate, 25 mM of sodium pyruvate and 50 mM of D-tryptophan. Reactions were initiated by incorporation of cell-free extracts or purified enzymes and incubated for 15 minutes to 24 hours at 30 ° C with gentle shaking. Formic acid was added at the final concentration of two percent to stop the reaction and the precipitated protein was removed by centrifugation. Control reactions without added protein were also performed. Zero time points were also used as negative controls. Alanine was detected using an OPA derivatization as described in Example 1.

Ejemplo 8 (ejemplo comparativo) Example 8 (comparative example)

Comparación de la Producción total de monatina y la distribución isomérica para los polipéptidos con actividad de aldolasa de SEQ ID NO: 8; SEQ ID NO: 4, SEQ ID NO: 12 y SEQ ID NO: 28 y ProA de C. testosteroni. Comparison of total monatin production and isomeric distribution for aldolase activity polypeptides of SEQ ID NO: 8; SEQ ID NO: 4, SEQ ID NO: 12 and SEQ ID NO: 28 and ProA from C. testosteroni.

Se adquirió transaminasa AT-103 (una D-aminotransferasa de amplia especificidad) de BioCatalytics (Pasadena, CA) y esta enzima o la enzima recombinante producida en el Ejemplo 7 se utilizó en reacciones combinadas con aldolasas de HMG para producir monatina a partir de D-triptófano y piruvato como se describe en la solicitud de patente de los Estados Unidos publicada No. 20050282260. La aldolasa ProA de C. testosteroni se utilizó como un aldolasa de referencia a los fines comparativos y se preparó como se describe en las solicitudes de patente no. 20040063175 y WO 03091396 A2 publicadas. Las aldolasas probadas se aislaron y transformaron como se describe en el Ejemplo 4 anterior. AT-103 transaminase (a broadly specific D-aminotransferase) was purchased from BioCatalytics (Pasadena, CA) and this enzyme or the recombinant enzyme produced in Example 7 was used in combined reactions with HMG aldolases to produce monatin from D tryptophan and pyruvate as described in published US patent application No. 20050282260. C. testosteroni aldolase ProA was used as a reference aldolase for comparative purposes and was prepared as described in patent applications not. 20040063175 and WO 03091396 A2 published. The aldolases tested were isolated and transformed as described in Example 4 above.

Para producir cantidades de muestra de cada aldolasa, se desarrollaron cultivos de 50 mL en un medio LB que contenía ampicilina (100 !g/mL) a una OD 600 de aproximadamente 0,5. Las cepas con SEQ ID NO: 7, SEQ ID NO: 3 y SEQ ID NO: 11 se indujeron con 100!M de IPTG. La cepa con SEQ ID NO:27 se indujo con 200 !g/L de anhidrotetraciclina. Las células se cultivaron durante 5 horas después de la inducción y los extractos celulares se prepararon conforme a los protocolos del fabricante (Novagen, Madison, WI, reactivo Bugbuster). Se agregaron inhibidores de benzonucleasa y proteasa. Las proteínas solubles en los extractos celulares se separaron en una Estación de Electroforesis Automatizada-Experion de Bio-Rad Laboratories y se analizaron para verificar su concentración y porcentaje utilizando la versión de Software de Experion 1.1.98.0. To produce sample amounts of each aldolase, 50 mL cultures were grown in LB medium containing ampicillin (100 µg / mL) at an OD 600 of approximately 0.5. Strains with SEQ ID NO: 7, SEQ ID NO: 3 and SEQ ID NO: 11 were induced with 100 µM of IPTG. The strain with SEQ ID NO: 27 was induced with 200 µg / L of anhydrotetracycline. Cells were cultured for 5 hours after induction and cell extracts were prepared according to the manufacturer's protocols (Novagen, Madison, WI, Bugbuster reagent). Inhibitors of benzonuclease and protease were added. Soluble proteins in cell extracts were separated on a Bio-Rad Laboratories Automated Electrophoresis-Experion Station and analyzed to verify their concentration and percentage using the Software version of Experion 1.1.98.0.

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 50 !g de aldolasa (proporcionada en extractos celulares salvo que se indique lo contrario), 4 mM de MgCl2, 50 mM de D-triptófano, 0,5 mg de Daminotransferasa de B. sphaericus purificada, 200 mM de piruvato de sodio, 100mM de tampón de fosfato de potasio con un pH de 7,5 y 0,05 mM de PLP. Los experimentos se desarrollaron por duplicado con controles negativos a los cuales no se les incorporó aldolasa. Las muestras se incubaron durante 1 hora, 2 horas y 24 horas (entre 17 y 20 horas) a 30ºC con una leve agitación. Se producen pequeñas cantidades de monatina (<0,5 ppm) sin aldolasa en reacciones de 24 horas, dadas las reacciones no enzimáticas catalizadas por magnesio y fosfato. Estos valores se restaron de las cifras reflejadas a continuación y se muestran los resultados promedio. Los únicos estereoisómeros detectados cuando se produce monatina utilizando estos procedimientos son los estereoisómeros R,R y S,R. El porcentaje de R,R se enumera a continuación y se determinó a través del área de pico de LC de fase inversa. Incorporated for each 1 mL of reaction mixture: approximately 50 µg of aldolase (provided in cell extracts unless otherwise indicated), 4 mM of MgCl2, 50 mM of D-tryptophan, 0.5 mg of Daminotransferase of B purified sphaericus, 200mM sodium pyruvate, 100mM potassium phosphate buffer with a pH of 7.5 and 0.05mM PLP. The experiments were carried out in duplicate with negative controls to which no aldolase was incorporated. The samples were incubated for 1 hour, 2 hours and 24 hours (between 17 and 20 hours) at 30ºC with slight shaking. Small amounts of monatin (<0.5 ppm) are produced without aldolase in 24-hour reactions, given magnesium and phosphate catalyzed nonenzymatic reactions. These values were subtracted from the figures reflected below and the average results are shown. The only stereoisomers detected when monatin is produced using these procedures are the R, R and S, R stereoisomers. The percentage of R, R is listed below and was determined through the reversed phase LC peak area.

Tabla 3: Total de monatina producida de D-triptófano y % de R,R Table 3: Total monatin produced from D-tryptophan and% of R, R

% de (R,R)-monatina % of (R, R) -monatin

89,7 89.7

79,0 79.0

94,8 94.8

93,8 93.8

100 100

98,65 98.65

100 100

97,35 97.35

86,45 86.45

63,1 63.1

La muestra de 18 horas de la SEQ ID NO: 28 también se analizó para la distribución estereoisomérica mediante el procedimiento de derivatización de FDAA enumerado en el Ejemplo 1, que dio un resultado de 94,9% de (R,R)monatina y 5,1% de (S,R)-monatina. The 18-hour sample of SEQ ID NO: 28 was also analyzed for stereoisomeric distribution by the FDAA derivatization procedure listed in Example 1, which gave a result of 94.9% (R, R) monatin and 5 0.1% (S, R) -monatin.

Se realizaron los mismos experimentos lado a lado utilizando L-triptófano como el sustrato inicial y combinando las aldolasas con L-aminotransferasa de especificidad amplia HexAspC producida como se describe en la solicitud de patente publicada No. 20050282260 y purificada. Las reacciones deberían principalmente generar (S,S)-monatina y (R,S)-monatina. Las reacciones también se complementaron con 10mM de alfa-cetoglutarato como el aceptor de amino para la transaminación de L-triptófano. Nuevamente, los resultados duplicados se promedian a continuación para la monatina total (restando los niveles básicos sin la presencia de aldolasa) y el porcentaje de (S,S)-monatina se refleja en base al área de pico de LC de fase inversa. En algunos casos, dado que las aldolasas son Respecíficas y producen poca monatina en total, las estimaciones de fase inversa de la distribución esteroisomérica son menos precisas por la asimetría del pico de triptófano que se puede coeluir con el pico de (S,S)-/(R,R)-monatina. Las tendencias aún son informativas al comparar la especificidad R de las aldolasas. Los resultados de mayores The same side-by-side experiments were performed using L-tryptophan as the initial substrate and combining the aldolases with L-aminotransferase of HexAspC broad specificity produced as described in published patent application No. 20050282260 and purified. Reactions should mainly generate (S, S) -monatin and (R, S) -monatin. Reactions were also supplemented with 10mM alpha-ketoglutarate as the amino acceptor for transamination of L-tryptophan. Again, the duplicate results are then averaged for total monatin (subtracting the basal levels without the presence of aldolase) and the percentage of (S, S) -monatin is reflected based on the peak area of reverse phase LC. In some cases, since aldolases are Specific and produce little monatin in total, the reversed phase estimates of the steroisomeric distribution are less accurate due to the asymmetry of the tryptophan peak that can co-elute with the (S, S) - peak. / (R, R) -monatin. The trends are still informative when comparing the R specificity of aldolases. The results of older

5 análisis utilizando el procedimiento de derivatización de FDAA se reflejan entre paréntesis para las distintas muestras y son más precisos. Las cifras totales de monatina por encima de aproximadamente 400 ppm son mayores que la gama lineal de la escala de los parámetros utilizados para cuantificar los resultados, por lo que son resultados cualitativos. La aldolasa ProA de C. testosteroni generalmente produce entre 95 y 100% de (S,S)-monatina como se refleja en la solicitud de Patente de los Estados Unidos No. 2005028266 publicada. The analyzes using the FDAA derivatization procedure are reflected in parentheses for the different samples and are more accurate. Total monatin figures above approximately 400 ppm are greater than the linear range of the parameter scale used to quantify the results, making them qualitative results. C. testosteroni aldolase ProA generally produces between 95 and 100% (S, S) -monatin as reflected in published US Patent Application No. 2005028266.

10 Tabla 4: Monatina total producida de L-triptófano y % de S,S 10 Table 4: Total monatin produced from L-tryptophan and% of S, S

% de (S,S)monatina % of (S, S) monatin

78,9 78.9

78,15 78.15

95,65 95.65

87,6 87.6

93,55 93.55

75 (59,35) 75 (59.35)

55,05 (18,9) 55.05 (18.9)

27,25 (19,1) 27.25 (19.1)

92,5 92.5

92,15 92.15

Se puede ver que la especificidad R del polipéptido con actividad de aldolasa de SEQ ID NO: 28 es relativamente alto en relación con la enzima ProA de referencia. Esto también se refleja en el bajo % de (S,S)-monatina producido a pesar del alto grado de especificidad de la aminotransferasa HexAspC para S-MPen estas reacciones. Las cifras It can be seen that the R specificity of the aldolase activity polypeptide of SEQ ID NO: 28 is relatively high relative to the reference ProA enzyme. This is also reflected in the low% (S, S) -monatin produced despite the high degree of specificity of the HexAspC aminotransferase for S-MP in these reactions. The numbers

15 totales de monatina, cuando se compara la producción de (S,S)-monatina respecto de la producción de (R,R)monatina no son indicativas de la actividad de aldolasa. La D-aminotransferasa es menos activa que HexAspC, especialmente en las concentraciones de MP que están presentes en estas reacciones. 15 monatin totals, when comparing (S, S) -monatin production with respect to (R, R) monatin production are not indicative of aldolase activity. D-aminotransferase is less active than HexAspC, especially at the MP concentrations that are present in these reactions.

Para mayor comparación del polipéptido con actividad de aldolasa de SEQ ID NO: 28 con la enzima ProA de C. testosteroni, se utilizaron varias proporciones de D-aminotransferasa respecto de aldolasa en reacciones que For further comparison of the aldolase-active polypeptide of SEQ ID NO: 28 with the enzyme C. testosteroni ProA, various ratios of D-aminotransferase to aldolase were used in reactions that

20 comenzaron con D-triptófano (no se realizaron muestras duplicadas para estos experimentos). Las reacciones se realizaron como se explica anteriormente. Para las reacciones en las cuales la concentración de aldolasa se mantuvo constante, se utilizó aproximadamente 50 !g. Para reacciones en las cuales la D-aminotransferasa se mantuvo constante, se utilizó 0,5 mg. Para la concentración de 2 y 10 mg/mL de D-aminotransferasa, se utilizó una enzima liofilizada. Para las dos concentraciones más altas de D-aminotransferasa se realizaron duplicados. 20 started with D-tryptophan (no duplicate samples were made for these experiments). Reactions were carried out as explained above. For reactions in which the aldolase concentration was kept constant, approximately 50 µg was used. For reactions in which D-aminotransferase was kept constant, 0.5 mg was used. For the concentration of 2 and 10 mg / mL D-aminotransferase, a lyophilized enzyme was used. Duplicates were performed for the two highest concentrations of D-aminotransferase.

Tabla 5: Efecto de la concentración de D-aminotransferasa en la producción de (R,R)-monatina Table 5: Effect of D-aminotransferase concentration on the production of (R, R) -monatin

--
% de (R,R)monatina % of (R, R) monatin

100 100

97,1 97.1

--
% de (R,R)monatina % of (R, R) monatin

100 100

96,5 96.5

100 100

96,5 96.5

100 100

97,3 97.3

99,1 99.1

96,5 96.5

78,7 78.7

61,1 61.1

79,0 79.0

62,5 62.5

73,8 73.8

68,1 68.1

73,1 73.1

71,9 71.9

59,7 59.7

67,5 67.5

92,3 92.3

69,8 69.8

84,9 84.9

67,5 67.5

84,2 84.2

68,7 68.7

Para los niveles de monatina superiores a 400 ppm, los resultados no se encuentran en la gama lineal de la curva estándar y son valores aproximados únicamente. La cantidad máxima de (R,R)-monatina producida, cuando se diluyó correctamente fue de 1100 ppm. El análisis estereoisómero de FDAA se realizó para el polipéptido con actividad de aldolasa de SEQ ID NO: 28 con muestras de D-aminotransferasa de 10 mg/mL. A las dos horas, la For monatin levels above 400 ppm, the results are not in the linear range of the standard curve and are approximate values only. The maximum amount of (R, R) -monatin produced, when properly diluted, was 1100 ppm. The FDAA stereoisomer analysis was performed for the aldolase activity polypeptide of SEQ ID NO: 28 with 10 mg / mL D-aminotransferase samples. At two hours, the

5 muestra contenía un 98,5% de (R,R)-monatina. A las 17 horas, la muestra contenía un 95,9% de (R,R)-monatina. El polipéptido con actividad de aldolasa de SEQ ID NO: 28 produjo porcentajes altos de (R,R)-monatina, aún después de plazos largos de incubación y utilizando grandes cantidades de aminotransferasa. Si se proporciona Daminotransferasa adecuada, el polipéptido con actividad de aldolasa de SEQ ID NO: 28 produce tanta monatina como la aldolasa ProA de C. testosteroni indicando una actividad específica similar. The sample contained 98.5% (R, R) -monatin. At 17 hours, the sample contained 95.9% (R, R) -monatin. The aldolase-active polypeptide of SEQ ID NO: 28 produced high percentages of (R, R) -monatin, even after long incubation periods and using large amounts of aminotransferase. If adequate Daminotransferase is provided, the aldolase-active polypeptide of SEQ ID NO: 28 produces as much monatin as C. testosteroni aldolase ProA indicating similar specific activity.

10 Tabla 6: Efecto de la concentración de aldolasa en la producción de (R,R)-monatina Table 6: Effect of aldolase concentration on the production of (R, R) -monatin

% de R,R monatina % of R, R monatin

100 100

97,4 97.4

97,3 97.3

95,7 95.7

93,3 93.3

78,2 78.2

73,2 73.2

64,1 64.1

63,0 63.0

62,5 62.5

61,5 61.5

88,1 88.1

74,7 74.7

78,2 78.2

67,8 67.8

70,1 70.1

63,9 63.9

Cuando se varía la concentración de aldolasa, no hay mucho aumento en la monatina total. El porcentaje de R,R disminuye con el tiempo y también con la concentración de aldolasa, especialmente cuando no hay suficiente Daminotransferasa. When the aldolase concentration is varied, there is not much increase in total monatin. The percentage of R, R decreases with time and also with the concentration of aldolase, especially when there is not enough Daminotransferase.

Para poder examinar la especificidad R de la aldolasa probada, los experimentos se realizaron partiendo de LIn order to examine the specificity R of the tested aldolase, the experiments were carried out starting from L

5 triptófano y aminotransferasa HexAspC, que se produjo y purificó como se describe en la solicitud de patente de los Estados Unidos publicada No. 20050282260. La HexAspc muestra una selectividad fuerte para la transaminación de S-MP versus R-MP, por lo tanto, los porcentajes por encima del 50% de (R,S)-monatina indican una aldolasa altamente estereoespecífica. Se proporcionaron diez mM de alfa-cetoglutarato como un aceptor de amino. Sin embargo, en concentraciones altas, la L-aminotransferasa también utiliza piruvato. En estas reacciones, Tryptophan and aminotransferase HexAspC, which was produced and purified as described in published US patent application No. 20050282260. HexAspc shows strong selectivity for transamination of S-MP versus R-MP, therefore, percentages above 50% (R, S) -monatin indicate a highly stereospecific aldolase. Ten mM of alpha-ketoglutarate was provided as an amino acceptor. However, at high concentrations, L-aminotransferase also uses pyruvate. In these reactions,

10 generalmente solo se producen (S,S)-monatina y (R,S)-monatina dentro de los límites de detección del protocolo de derivatización de FDAA. 10 (S, S) -monatin and (R, S) -monatin generally only occur within the detection limits of the FDAA derivatization protocol.

Tabla 7: Efecto de la concentración de L-aminotransferasa en la producción de (S,S)-monatina Table 7: Effect of L-aminotransferase concentration on the production of (S, S) -monatin

Aldolasa Aldolasa
Concentración de Daminotransferasa Tiempo Monatina total (ppm aproximado) % de Monatina S,S Daminotransferase concentration Weather Total monatin (approximate ppm) % of Monatina S, S

SEQ ID NO: 28 SEQ ID NO: 28
0,25 mg/ml 1 hora 13 33,8 0.25 mg / ml 1 hour 13 33.8

SEQ ID NO: 28 SEQ ID NO: 28
0,25 mg/ml 24 horas 127 34,2 0.25 mg / ml 24 hours 127 34.2

SEQ ID NO: 28 SEQ ID NO: 28
0,5 mg/ml 1 hora 31 30,9 0.5 mg / ml 1 hour 31 30.9

SEQ ID NO: 28 SEQ ID NO: 28
0,5 mg/ml 24 horas 272 26,8 0.5 mg / ml 24 hours 272 26.8

SEQ ID NO: 28 SEQ ID NO: 28
1 mg/ml 1 hora 34 20,3 1 mg / ml 1 hour 3. 4 20.3

SEQ ID NO: 28 SEQ ID NO: 28
1 mg/ml 24 horas 385 23,5 1 mg / ml 24 hours 385 23.5

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
0,25 mg/ml 1 hora 523 94.2 0.25 mg / ml 1 hour 523 94.2

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
0,25 mg/ml 24 horas 1817 93,7 0.25 mg / ml 24 hours 1817 93.7

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
0,5 mg/ml 1 hora 602 91,8 0.5 mg / ml 1 hour 602 91.8

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
0,5 mg/ml 24 horas 2122 89,9 0.5 mg / ml 24 hours 2122 89.9

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
1 mg/ml 1 hora 873 90,2 1 mg / ml 1 hour 873 90.2

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
1 mg/ml 24 horas 1237 82,6 1 mg / ml 24 hours 1237 82.6

SEQ ID NO: 8 SEQ ID NO: 8
0,25 mg/ml 1 hora 339 86,3 0.25 mg / ml 1 hour 339 86.3

SEQ ID NO: 8 SEQ ID NO: 8
0,25 mg/ml 24 horas 1499 88,0 0.25 mg / ml 24 hours 1499 88.0

SEQ ID NO: 8 SEQ ID NO: 8
0,5 mg/ml 1 hora 211 80,3 0.5 mg / ml 1 hour 211 80.3

SEQ ID NO: 8 SEQ ID NO: 8
0,5 mg/ml 24 horas 1328 83,1 0.5 mg / ml 24 hours 1328 83.1

Aldolasa Aldolasa
Concentración de Daminotransferasa Tiempo Monatina total (ppm aproximado) % de Monatina S,S Daminotransferase concentration Weather Total monatin (approximate ppm) % of Monatina S, S

SEQ ID NO: 8 SEQ ID NO: 8
1 mg/ml 1 hora 400 74,6 1 mg / ml 1 hour 400 74.6

SEQ ID NO: 8 SEQ ID NO: 8
1 mg/ml 24 horas 1370 79,0 1 mg / ml 24 hours 1370 79.0

Tabla 8: Efecto de la concentración de aldolasa en la producción de (S,S)-monatina Table 8: Effect of aldolase concentration on the production of (S, S) -monatin

Aldolasa Aldolasa
Concentración de aldolasa Tiempo Monatina total (ppm) % de Monatina S,S Aldolase concentration Weather Total monatin (ppm) % of Monatina S, S

SEQ ID NO: 28 SEQ ID NO: 28
25 !g/ml 1 hora 11 25,1 25! G / ml 1 hour eleven 25.1

SEQ ID NO: 28 SEQ ID NO: 28
25 !g/ml 24 horas 112 20,0 25! G / ml 24 hours 112 20.0

SEQ ID NO: 28 SEQ ID NO: 28
50 !g/ml 1 hora 18 31,8 50! G / ml 1 hour 18 31.8

SEQ ID NO: 28 SEQ ID NO: 28
50 !g/ml 24 horas 160 27,0 50! G / ml 24 hours 160 27.0

SEQ ID NO: 28 SEQ ID NO: 28
100 !g/ml 1 hora 33 33,2 100! G / ml 1 hour 33 33.2

SEQ ID NO: 28 SEQ ID NO: 28
100 !g/ml 24 horas 238 41,4 100! G / ml 24 hours 238 41.4

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
25 !g/ml 1 hora 305 86,4 25! G / ml  1 hour 305 86.4

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
25 !g/ml 24 horas 1094 87,5 25! G / ml  24 hours 1094 87.5

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
50 !g/ml 1 hora 575 90,9 50! G / ml 1 hour 575 90.9

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
50 !g/ml 24 horas 1449 89,9 50! G / ml 24 hours 1449 89.9

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
100 !g/ml 1 hora 817 93,6 100! G / ml 1 hour 817 93.6

ProA (purificada) de C. testosteroni ProA (purified) from C. testosteroni
100 !g/ml 24 horas 1360 89,7 100! G / ml 24 hours 1360 89.7

SEQ ID NO: 8 SEQ ID NO: 8
25 !g/ml 1 hora 134 70,7 25! G / ml  1 hour 134 70.7

SEQ ID NO: 8 SEQ ID NO: 8
25 !g/ml 24 horas 728 76,3 25! G / ml  24 hours 728 76.3

SEQ ID NO: 8 SEQ ID NO: 8
50 !g/ml 1 hora 197 80,0 50! G / ml  1 hour 197 80.0

SEQ ID NO: 8 SEQ ID NO: 8
50 !g/ml 24 horas 928 81,4 50! G / ml  24 hours 928 81.4

SEQ ID NO: 8 SEQ ID NO: 8
100 !g/ml 1 hora 279 86,7 100! G / ml 1 hour 279 86.7

SEQ ID NO: 8 SEQ ID NO: 8
100 !g/ml 24 horas 1383 86,8 100! G / ml 24 hours 1383 86.8

Para aldolasas que son altamente R-específicas, como el polipéptido con actividad de aldolasa de SEQ ID NO: 28, se produce menos monatina total y la mayor cantidad de aldolasa aumenta la monatina total (así como también el % de S,S). Estas aldolasas producen menos sustrato de S-MP, el sustrato preferido para la L-aminotransferasa utilizado. Para enzimas que son menos específicas para R, como ProA, la mayor cantidad de aldolasa no mejora significativamente la producción total de monatina o el % de (S,S)-monatina. Aumentar la cantidad de Laminotransferasa agregada disminuye el porcentaje de (S,S)-monatina producida. En base al análisis anterior, el polipéptido con actividad de aldolasa de SEQ ID NO: 8 se encuentra entre ProA y el polipéptido con actividad de aldolasa de SEQ ID NO: 28 en cuanto a la R-especificidad, que coincide con la información anterior donde el % de R-MP se mide para la etapa de aldol únicamente. For aldolases that are highly R-specific, such as the aldolase-active polypeptide of SEQ ID NO: 28, less total monatin is produced and the higher amount of aldolase increases total monatin (as well as% S, S). These aldolases produce less S-MP substrate, the preferred substrate for L-aminotransferase used. For enzymes that are less specific for R, such as ProA, the higher amount of aldolase does not significantly improve total monatin production or% (S, S) -monatin. Increasing the amount of Laminotransferase added decreases the percentage of (S, S) -monatin produced. Based on the above analysis, the polypeptide with aldolase activity of SEQ ID NO: 8 is between ProA and the polypeptide with aldolase activity of SEQ ID NO: 28 in terms of R-specificity, which coincides with the previous information where % R-MP is measured for the aldol stage only.

Subclonación de SEQ ID NO: 27 Subcloning of SEQ ID NO: 27

Los siguientes cebadores se utilizaron para ampliar en PCR el gen de aldolasa: 5'gaggagctcgagtcagacgtatttcagtcctttttc-3' (SEQ ID NO: 385) y 5'-agaagacatatgatttatcagccggggac-3' (SEQ ID NO: 386). La SEQ ID NO: 27 del gen de aldolasa codifica el polipéptido con actividad de aldolasa de SEQ ID NO: 28. El producto resultante de PCR se digirió con XhoI y NdeI para cortar en los sitios que habían sido integrados en los cebadores. El fragmento se purificó con gel (Kit de extracción de Gel QIAquick (Qiagen, Valencia, CA)) y se ligó (utilizando T4 ADN ligasa) con pET28b que había sido digerido con XhoI y NdeI y purificado con gel. La ligadura se transformó en células químicamente competentes TOP10F'. Las colonias que crecen en las placas se monitorearon para verificar insertos y varias aisladas con insertos se sometieron al análisis de secuencia del ADN (Agencourt, Beverly, MA). The following primers were used to PCR amplify the aldolase gene: 5'gaggagctcgagtcagacgtatttcagtcctttttc-3 '(SEQ ID NO: 385) and 5'-agaagacatatgatttatcagccggggac-3' (SEQ ID NO: 386). SEQ ID NO: 27 of the aldolase gene encodes the aldolase activity polypeptide of SEQ ID NO: 28. The resulting PCR product was digested with XhoI and NdeI to cut at the sites that had been integrated into the primers. The fragment was gel purified (QIAquick Gel Extraction Kit (Qiagen, Valencia, CA)) and ligated (using T4 DNA ligase) with pET28b which had been digested with XhoI and NdeI and gel purified. The ligation was transformed into chemically competent TOP10F 'cells. Colonies growing on the plates were monitored for inserts and several isolates with inserts were subjected to DNA sequence analysis (Agencourt, Beverly, MA).

Purificación del Polipéptido con actividad de aldolasa de SEQ ID NO: 28. Purification of the polypeptide with aldolase activity of SEQ ID NO: 28.

Los clones confirmados de aldolasa se transformaron en BL21 DE3 o BL21DE3 pLyss. Los cultivos de 24 horas desarrollados con el antibiótico correcto se diluyeron en un medio limpio (generalmente 1:100) y crecieron hasta alcanzar una DO600 de ~0,6 con una aireación a 37°C. Los cultivos se indujeron con 1mM de IPTG y se cambiaron a 30°C (con aireación) y se continuó con la incubación durante la noche. Las células se cultivaron mediante centrifugación. El sedimento celular se sometió a un ciclo de congelación-descongelación para ayudar a la lisis celular. El sedimento celular se lisó en BugBuster y Benzonasa (Novagen, Madison, WI) (conforme al protocolo del fabricante). El residuo celular se eliminó mediante centrifugación. El extracto proteico crudo se aplicó a una columna HisBind (Novagen, Madison, WI) que había sido preparado conforme al protocolo del fabricante. La columna se lavó y la proteína se eluyó conforme al protocolo del fabricante. La proteína purificada se desaló con columnas PD-10 (GE Healthcare, Piscataway, N.J.). El tampón utilizado para el intercambio consistió en 50 mM de fosfato de potasio con pH de 7,5, 100 mM de NaCI2, 4 mM de MgCl2. La proteína purificada se concentró con concentradores centrífugos Amicon (Millipore, Billerica, MA). Confirmed aldolase clones were transformed into BL21 DE3 or BL21DE3 pLyss. The 24-hour cultures grown with the correct antibiotic were diluted in a clean medium (generally 1: 100) and grown to an OD600 of ~ 0.6 with aeration at 37 ° C. Cultures were induced with 1mM IPTG and changed at 30 ° C (with aeration) and incubation was continued overnight. Cells were cultured by centrifugation. The cell pellet was subjected to a freeze-thaw cycle to aid cell lysis. The cell pellet was lysed at BugBuster and Benzonasa (Novagen, Madison, WI) (according to the manufacturer's protocol). Cell debris was removed by centrifugation. The crude protein extract was applied to a HisBind column (Novagen, Madison, WI) that had been prepared according to the manufacturer's protocol. The column was washed and the protein was eluted according to the manufacturer's protocol. The purified protein was desalted with PD-10 columns (GE Healthcare, Piscataway, N.J.). The buffer used for the exchange consisted of 50 mM potassium phosphate with a pH of 7.5, 100 mM NaCI2, 4 mM MgCl2. The purified protein was concentrated with Amicon centrifugal concentrators (Millipore, Billerica, MA).

Ejemplo 9 (ejemplo comparativo) Example 9 (comparative example)

Comparación de la producción total de monatina y la distribución isomérica para polipéptidos con actividad de aldolasa de SEQ ID NO: 40, SEQ ID NO: 298, SEQ ID NO: 36, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 96, SEQ ID NO: 54, SEQ ID NO: 122, SEQ ID NO: 142, SEQ ID NO: 130, SEQ ID NO: 112, SEQ ID NO: 94, SEQ ID NO: 80 y SEQ ID NO: 28. Comparison of total monatin production and isomeric distribution for polypeptides with aldolase activity of SEQ ID NO: 40, SEQ ID NO: 298, SEQ ID NO: 36, SEQ ID NO: 64, SEQ ID NO: 96, SEQ ID NO: 54, SEQ ID NO: 122, SEQ ID NO: 142, SEQ ID NO: 130, SEQ ID NO: 112, SEQ ID NO: 94, SEQ ID NO: 80 and SEQ ID NO: 28.

La transaminasa AT-103 (una D-aminotransferasa de especificidad amplia) se adquirió de BioCatalytics (Pasadena, CA) y esta enzima o la enzima recombinante producida en el Ejemplo 7 se utilizó en reacciones combinadas con aldolasas de HMG para producir monatina a partir de D-triptófano y piruvato como se describe en la solicitud de patente de los Estados Unidos publicada No. 20050282260. El polipéptido con actividad de aldolasa de SEQ ID NO: 28 (marcada con histidina) se utilizó como una aldolasa de referencia a los fines comparativos y se produjo y purificó como se describe al final del Ejemplo 8. Las otras aldolasas probadas se aislaron y transformaron como se describe en el Ejemplo 4 anterior. AT-103 transaminase (a broadly specific D-aminotransferase) was purchased from BioCatalytics (Pasadena, CA) and this enzyme or the recombinant enzyme produced in Example 7 was used in combined reactions with HMG aldolases to produce monatin from D-tryptophan and pyruvate as described in published US Patent Application No. 20050282260. The aldolase-active polypeptide of SEQ ID NO: 28 (labeled with histidine) was used as a reference aldolase for comparative purposes and was produced and purified as described at the end of Example 8. The other aldolases tested were isolated and transformed as described in Example 4 above.

Para producir cantidades de muestra de cada aldolasa, se desarrollaron cultivos de 25mL en un medio LB que contenía ampicilina (100 !g/mL), a una OD600 de aproximadamente 0,4. Las cepas se indujeron con 100 !M de IPTG. Las células se desarrollaron por 4 horas con posterioridad a la inducción, y los extractos celulares se prepararon conforme a los protocolos del fabricante (Novagen, Madison, WI, reactivo Bugbuster) con benzonucleasa. Las proteínas solubles en los extractos celulares se separaron en una Estación de Electroforesis Automática-Experion de Bio-Rad Laboratories (Bio-Rad, Hércules, CA) y se analizaron para verificar la concentración y el porcentaje utilizando la versión de Software de Experion 1.1.98.0. To produce sample amounts of each aldolase, 25mL cultures were grown in LB medium containing ampicillin (100 µg / mL), at an OD600 of approximately 0.4. The strains were induced with 100 µM of IPTG. Cells were grown for 4 hours post-induction, and cell extracts were prepared according to the manufacturer's protocols (Novagen, Madison, WI, Bugbuster reagent) with benzonuclease. The soluble proteins in the cell extracts were separated on a Bio-Rad Laboratories Automatic Experion Electrophoresis Station (Bio-Rad, Hercules, CA) and analyzed to verify concentration and percentage using the Software version of Experion 1.1. 98.0.

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 50 !g de aldolasa (proporcionada en extractos celulares salvo que se indique lo contrario), 4 mM de MgCl2, 50 mg/mL de D-triptófano, 2 mg de AT-103 (BioCatalytics, Pasadena, CA), 200 mM de piruvato de sodio, 100mM de tampón de fosfato de potasio con un pH de 7,5 y 0,05 mM de PLP. El D-triptófano no es soluble a esta concentración alta, pero se utilizó para garantizar que las reacciones se mantuvieran en cantidades de saturación de D-triptófano. Los experimentos se desarrollaron por duplicado con controles negativos donde no se incorporó aldolasa. Las muestras se incubaron durante 2 y 24 horas (entre 17 y 20 horas) a 30°C con una leve agitación. Las pequeñas cantidades de monatina se producen en 24 horas Incorporated for each 1 mL of reaction mixture: approximately 50 µg of aldolase (provided in cell extracts unless otherwise indicated), 4 mM of MgCl2, 50 mg / mL of D-tryptophan, 2 mg of AT-103 (BioCatalytics, Pasadena, CA), 200mM Sodium Pyruvate, 100mM Potassium Phosphate Buffer with a pH of 7.5 and 0.05mM PLP. D-tryptophan is not soluble at this high concentration, but was used to ensure that the reactions were maintained in saturated amounts of D-tryptophan. The experiments were carried out in duplicate with negative controls where aldolase was not incorporated. The samples were incubated for 2 and 24 hours (between 17 and 20 hours) at 30 ° C with slight shaking. Small amounts of monatin are produced in 24 hours

sin aldolasa (~0,5 ppm) dadas las reacciones no enzimáticas catalizadas por magnesio y fosfato. Los valores típicos no aldolase (~ 0.5 ppm) given magnesium and phosphate catalyzed nonenzymatic reactions. Typical values

para el % de (R,R)-monatina son 50% para estas muestras. Los valores de control negativo se restaron de los for the% of (R, R) -monatin they are 50% for these samples. Negative control values were subtracted from

números reflejados a continuación y se muestran los resultados medios. Los únicos estereoisómeros detectados numbers reflected below and average results are shown. The only stereoisomers detected

5 cuando se produce monatina utilizando estos procedimientos son los estereoisómeros R,R y S,R. El porcentaje de 5 when monatin is produced using these procedures are the R, R and S, R stereoisomers. The percentage of

R,R se enumera a continuación y se determinó mediante el área de pico de LC de fase inversa. Se desarrolló el R, R is listed below and was determined by the reversed phase LC peak area. The

mismo experimento después del almacenamiento de extractos celulares y del polipéptido purificado con actividad de same experiment after storing cell extracts and purified polypeptide with activity of

aldolasa de SEQ ID NO: 28 para 2 meses a -20º C. En este caso se utilizó 50 mM de D-triptófano como en el aldolase from SEQ ID NO: 28 for 2 months at -20ºC. In this case, 50 mM D-tryptophan was used as in the

Ejemplo 8. Se agregó el doble de cantidad de aldolasa con la excepción del polipéptido con actividad de aldolasa de 10 SEQ ID NO: 28 para el cual se utilizó 50 !g nuevamente. Estos resultados se reflejan a la derecha de la Tabla 9. Los Example 8. Twice the amount of aldolase was added with the exception of the polypeptide with aldolase activity of 10 SEQ ID NO: 28 for which 50 µg was used again. These results are reflected to the right of Table 9. The

resultados de la derivatización de FDAA para la distribución isomérica se reflejan entre paréntesis. FDAA derivatization results for the isomeric distribution are reflected in parentheses.

Tabla 9: monatina total producida a partir de D-triptófano y % de R,R Table 9: Total monatin produced from D-tryptophan and% R, R

% de (R,R)-monatina % of (R, R) -monatin

66,8 66.8

62,4 62.4

91,9 (91,6) 91.9 (91.6)

80,0 80.0

94,0 94.0

88,5 88.5

n/d n / a

89,2 89.2

96,9 96.9

98,5 98.5

96,0 96.0

97,3 97.3

98,2 (98,8) 98.2 (98.8)

96,9 96.9

97,8 (99,1) 97.8 (99.1)

94,4 94.4

95,9 95.9

96,8 96.8

93,3 93.3

82,9 82.9

98,5 (99,6) 98.5 (99.6)

% de (R,R)-monatina % of (R, R) -monatin

98,4 98.4

98,6 98.6

99,3 99.3

97,0 97.0

93,3 (96,4) 93.3 (96.4)

94,4 94.4

84,8 84.8

98,8 98.8

96,6 96.6

96,7 (99,6) 96.7 (99.6)

99,2 99.2

Se puede ver que algunas enzimas son más estables al almacenamiento que otras aldolasas, en base a las proporciones de actividad. Un producto secundario, más probablemente 4-hidroxi-4-metil glutamato también puede formarse durante estas reacciones. Las enzimas mencionadas se clasificaron según su especificidad hacia la It can be seen that some enzymes are more stable to storage than other aldolases, based on the proportions of activity. A secondary product, most likely 4-hydroxy-4-methyl glutamate, can also be formed during these reactions. The mentioned enzymes were classified according to their specificity towards

5 producción de monatina comparando sus áreas de pico en relación con el subproducto. Los resultados fueron el polipéptido con la actividad de aldolasa de SEQ ID NO: 122, SEQ ID NO: 80, SEQ ID NO: 108, SEQ ID NO: 96, SEQ ID NO: 122, SEQ ID NO: 130, SEQ ID NO: 36, SEQ ID NO: 94, SEQ ID NO: 298, SEQ ID NO: 40, SEQ ID NO: 142, SEQ ID NO: 54, SEQ ID NO: 64, SEQ ID NO: 28, SEQ ID NO: 62. Monatin production comparing its peak areas in relation to the by-product. The results were the polypeptide with aldolase activity of SEQ ID NO: 122, SEQ ID NO: 80, SEQ ID NO: 108, SEQ ID NO: 96, SEQ ID NO: 122, SEQ ID NO: 130, SEQ ID NO : 36, SEQ ID NO: 94, SEQ ID NO: 298, SEQ ID NO: 40, SEQ ID NO: 142, SEQ ID NO: 54, SEQ ID NO: 64, SEQ ID NO: 28, SEQ ID NO: 62 .

En base a los experimentos iniciales, los polipéptidos con actividad de aldolasa de SEQ ID NO: 298, SEQ ID NO: 54 Based on the initial experiments, the aldolase activity polypeptides of SEQ ID NO: 298, SEQ ID NO: 54

10 y SEQ ID NO: 42 parecían ser los más prometedores en términos del nivel de actividad y el % de (R,R)-monatina producida. Las enzimas se subclonaron en vectores de expresión pET con y sin marcas de histidina. 10 and SEQ ID NO: 42 appeared to be the most promising in terms of the level of activity and the% of (R, R) -monatin produced. Enzymes were subcloned into pET expression vectors with and without histidine tags.

Clonación de SEQ ID NO: 297, SEQ ID NO: 53 y SEQ ID NO: 41. Cloning of SEQ ID NO: 297, SEQ ID NO: 53 and SEQ ID NO: 41.

Cebadores utilizados para la clonación: Primers used for cloning:

Tabla 10 Table 10

La SEQ ID NO: 297, la SEQ ID NO: 53 y la SEQ ID NO: 41 se amplificaron por PCR y digirieron con las enzimas adecuadas (NdeI y BamHI para los productos en PCR que contienen SEQ ID NO: 297 y SEQ ID NO: 53, NcoI y BamHI para los productos en PCR que contienen SEQ ID NO: 41) y purificados con gel (Kit de extracción con Gel QIAquick (Qiagen, Valencia, CA)). La SEQ ID NO: 297 y la SEQ ID NO: 53 se ligaron individualmente en pET28 que había sido digerido con NdeI y BamHI y purificado con gel. La SEQ ID NO: 41 se ligó a pET30 que había sido digerido con NcoI y BamHI y purificado con gel. La ligadura se transformó en TOP10. Las colonias se monitorearon para verificar insertos. Las colonias aisladas con un inserto se sometieron al análisis de secuencia de ADN (Agencourt, Beverly, MA). SEQ ID NO: 297, SEQ ID NO: 53, and SEQ ID NO: 41 were PCR amplified and digested with the appropriate enzymes (NdeI and BamHI for the PCR products containing SEQ ID NO: 297 and SEQ ID NO : 53, NcoI and BamHI for the PCR products containing SEQ ID NO: 41) and gel purified (QIAquick Gel Extraction Kit (Qiagen, Valencia, CA)). SEQ ID NO: 297 and SEQ ID NO: 53 were individually ligated into pET28 which had been digested with NdeI and BamHI and gel purified. SEQ ID NO: 41 was ligated to pET30 which had been digested with NcoI and BamHI and gel purified. The ligature became TOP10. Colonies were monitored to verify inserts. Colonies isolated with an insert were subjected to DNA sequence analysis (Agencourt, Beverly, MA).

Purificación de Aldolasas Aldolase Purification

Los clones confirmados de aldolasas se transformaron en BL21 DE3 o BL21 DE3 pLysS. Los cultivos de 24 horas desarrollados con el antibiótico adecuado se diluyeron en un medio limpio (generalmente 1:100) y alcanzaron una OD 600 de ~0,6 con una aireación a 37ºC. Los cultivos posteriormente se indujeron con 1 mM de IPTG y se cambiaron a 30ºC (con aireación) y la incubación se continuó durante 24 horas. Las células se cultivaron mediante centrifugación. El sedimento celular básicamente se sometió a un ciclo de congelación-descongelación para ayudar a la lisis celular. El sedimento celular se lisó en BugBuster y Benzonasa (Novagen, Madison, WI) (conforme al protocolo del fabricante). El residuo celular se eliminó mediante centrifugación. El extracto proteico crudo se aplicó a una columna HisBind (Novagen, Madison, WI) que había sido preparada conforme al protocolo del fabricante. La columna se lavó y la proteína se eluyó conforme al protocolo del fabricante. La proteína purificada se desaló con columnas PD 10 (GE Healthcare, Piscataway, N.J.). El tampón utilizado para el intercambio consistió en 50 mM de fosfato de potasio con un pH de 7,5, 100 mM de NacI, y 4 mM MgCl2. La proteína purificada se concentró con concentradores centrífugos Amicon (Millipore, Billerica, MA). Confirmed aldolase clones were transformed into BL21 DE3 or BL21 DE3 pLysS. The 24-hour cultures grown with the appropriate antibiotic were diluted in a clean medium (generally 1: 100) and reached an OD 600 of ~ 0.6 with aeration at 37 ° C. Cultures were subsequently induced with 1mM IPTG and changed at 30 ° C (with aeration) and incubation was continued for 24 hours. Cells were cultured by centrifugation. The cell pellet was basically subjected to a freeze-thaw cycle to aid cell lysis. The cell pellet was lysed at BugBuster and Benzonasa (Novagen, Madison, WI) (according to the manufacturer's protocol). Cell debris was removed by centrifugation. The crude protein extract was applied to a HisBind column (Novagen, Madison, WI) that had been prepared according to the manufacturer's protocol. The column was washed and the protein was eluted according to the manufacturer's protocol. The purified protein was desalted with PD 10 columns (GE Healthcare, Piscataway, N.J.). The buffer used for the exchange consisted of 50 mM potassium phosphate with a pH of 7.5, 100 mM NacI, and 4 mM MgCl2. The purified protein was concentrated with Amicon centrifugal concentrators (Millipore, Billerica, MA).

Prueba de aldolasas purificadas Purified aldolases test

Las aldolasas purificadas se valuaron respecto de su capacidad para producir (R,R)-monatina a partir de Dtriptófano. Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 50 !g de aldolasa purificada, 4 mM de MgCl2, 50 mM de D-triptófano, 0,5 mg de D-aminotransferasa de B. sphaericus purificada, 200 mM de piruvato de sodio, 100mM de tampón de fosfato de potasio con un pH de 7,5 y 0,05 mM de PLP. Las muestras se tomaron a las 2 horas y a las 24 horas. Los resultados se reflejan en la Tabla 11 a continuación. The purified aldolases were assessed for their ability to produce (R, R) -monatin from Dtryptophan. Incorporated for each 1 mL of reaction mixture: approximately 50 µg of purified aldolase, 4 mM of MgCl2, 50 mM of D-tryptophan, 0.5 mg of purified B. sphaericus D-aminotransferase, 200 mM of pyruvate of sodium, 100mM potassium phosphate buffer with a pH of 7.5 and 0.05mM PLP. Samples were taken at 2 hours and at 24 hours. The results are reflected in Table 11 below.


Tabla 11: monatina total producida a partir de D-triptófano y % de R,R

Table 11: Total monatin produced from D-tryptophan and% R, R

Aldolasa (punto de tiempo) Aldolasa (time point)
Monatina total (ppm) % de (R,R)-monatina (área de pico de LC de fase inversa) % de (R,R)-monatina (derivatización de FDAA) Total monatin (ppm) % of (R, R) -monatin (reverse phase LC peak area) % of (R, R) -monatin (FDAA derivatization)

SEQ ID NO: 298 (2 horas) SEQ ID NO: 298 (2 hours)
16,95 88,5 n/d 16.95 88.5 n / a

SEQ ID NO: 298 (durante la noche) SEQ ID NO: 298 (overnight)
212 77,6 71 212 77.6 71

SEQ ID NO: 54 (2 horas) SEQ ID NO: 54 (2 hours)
12,05 96,7 n/d 12.05 96.7 n / a

SEQ ID NO: 54 (durante la noche) SEQ ID NO: 54 (overnight)
161,85 93,0 91,1 161.85  93.0 91.1

SEQ ID NO: 42 (2 horas) SEQ ID NO: 42 (2 hours)
20,95 80,3 n/d 20.95 80.3 n / a

SEQ ID NO: 42 (durante la noche) SEQ ID NO: 42 (overnight)
223,2 69,1 62,1 223.2 69.1 62.1

SEQ ID NO: 28 (2 horas) SEQ ID NO: 28 (2 hours)
14,25 95,8 n/d 14.25 95.8 n / a

SEQ ID NO: 28 (durante la noche) SEQ ID NO: 28 (overnight)
176,6 93,4 92,3 176.6 93.4 92.3

Los mismos experimentos se desarrollaron utilizando L-triptófano como el sustrato inicial y combinando las aldolasas con la L- aminotransferasa HexAspC de especificidad amplia producida y purificada como describe la solicitud de Patente de los Estados Unidos No. publicada 20050282260 (0,5 mg de proteína purificada). Los resultados se The same experiments were performed using L-tryptophan as the initial substrate and combining aldolases with the broad specificity L-aminotransferase produced and purified as described in US Patent Application No. 20050282260 (0.5 mg protein purified). The results are

demuestran a continuación en la Tabla 12 para la producción total de monatina (restando los niveles básicos sin presencia de aldolasa) y el porcentaje de (S,S)-monatina se demuestra en base al área de pico de LC de fase inversa. Las cifras superiores a 400 ppm están fuera de la gama lineal de la curva estándar, y son aproximados. They are shown below in Table 12 for the total monatin production (subtracting the basic levels without the presence of aldolase) and the percentage of (S, S) -monatin is shown based on the peak area of reverse phase LC. Figures above 400 ppm are outside the linear range of the standard curve, and are approximate.


Tabla 12: monatina total producida a partir de L-triptófano y % de S,S

Table 12: Total monatin produced from L-tryptophan and% S, S

Aldolasa (punto de tiempo) Aldolasa (time point)
Monatina total (ppm) % de (S,S)-monatina (área de pico de LC de fase inversa) % de (S,S)-monatina (derivatización de FDAA) Total monatin (ppm) % of (S, S) -monatin (reverse phase LC peak area) % of (S, S) -monatin (FDAA derivatization)

SEQ ID NO: 298 (1 hora) SEQ ID NO: 298 (1 hour)
186,6 64,0 n/d 186.6 64.0 n / a

SEQ ID NO: 298 (durante la noche) SEQ ID NO: 298 (overnight)
197,5 64,3 67,6 197.5 64.3 67.6

SEQ ID NO: 54 (1 hora) SEQ ID NO: 54 (1 hour)
70,4 36,5 n/d 70.4 36.5 n / a

SEQ ID NO: 54 (durante la noche ras) SEQ ID NO: 54 (overnight flush)
87,8 41,7 42,1 87.8 41.7 42.1

SEQ ID NO: 42 (1 hora) SEQ ID NO: 42 (1 hour)
401,1 80,9 n/d 401.1 80.9 n / a

SEQ ID NO: 42 (durante la noche) SEQ ID NO: 42 (overnight)
507,5 82,9 85,8 507.5 82.9 85.8

SEQ ID NO: 28 (1 hora) SEQ ID NO: 28 (1 hour)
56,2 30,1 n/d 56.2 30.1 n / a

SEQ ID NO: 28 (durante la noche) SEQ ID NO: 28 (overnight)
88,8 32,2 33,8 88.8 32.2 33.8

Estos datos y los datos de la (R,R)-monatina ilustran que para la especificidad R-MP, los polipéptidos con actividad de aldolasa tienen el siguiente orden: SEQ ID NO: 28, SEQ ID NO: 54, SEQ ID NO: 298, SEQ ID NO: 42. These data and the (R, R) -monatin data illustrate that for R-MP specificity, aldolase-active polypeptides have the following order: SEQ ID NO: 28, SEQ ID NO: 54, SEQ ID NO: 298, SEQ ID NO: 42.

Ejemplo 10 (ejemplo comparativo) Example 10 (comparative example)

Comparación de la producción total de monatina y la distribución isomérica para los polipéptidos con actividad de aldolasa de SEQ ID NO: 116, SEQ ID NO: 76, SEQ ID NO: 44, SEQ ID NO: 148, SEQ ID NO: 46, SEQ ID NO: 134, SEQ ID NO: 74, SEQ ID NO: 126, SEQ ID NO: 102, SEQ ID NO: 58, SEQ ID NO: 88, SEQ ID NO: 50, SEQ ID NO: 106, SEQ ID NO: 304, SEQ ID NO: 300 y SEQ ID NO: 28. Comparison of total monatin production and isomeric distribution for aldolase activity polypeptides of SEQ ID NO: 116, SEQ ID NO: 76, SEQ ID NO: 44, SEQ ID NO: 148, SEQ ID NO: 46, SEQ ID NO: 134, SEQ ID NO: 74, SEQ ID NO: 126, SEQ ID NO: 102, SEQ ID NO: 58, SEQ ID NO: 88, SEQ ID NO: 50, SEQ ID NO: 106, SEQ ID NO : 304, SEQ ID NO: 300 and SEQ ID NO: 28.

La enzima recombinante producida en el Ejemplo 7 se utilizó en reacciones combinadas con aldolasas de HMG para producir monatina a partir de D-triptófano y piruvato como describe la solicitud de patente de los Estados Unidos publicada No. 20050282260. El polipéptido con actividad de aldolasa de SEQ ID NO: 28 se utilizó como referencia en estos ensayos y había sido purificado como se describe en el Ejemplo 8. The recombinant enzyme produced in Example 7 was used in combined reactions with HMG aldolases to produce monatin from D-tryptophan and pyruvate as described in published US patent application No. 20050282260. The aldolase-active polypeptide of SEQ ID NO: 28 was used as a reference in these tests and had been purified as described in Example 8.

Para producir cantidades de muestra de cada aldolasa, se desarrollaron cultivos de 25 mL en un medio LB que contenía ampicilina (100 !g/mL), hasta alcanzar una DO600 de aproximadamente 0,5. Los cultivos se indujeron con 1mM de IPTG. Las células se cambiaron a 30ºC y se desarrollaron en 24 horas. Los extractos celulares se prepararon conforme a los protocolos del fabricante (Novagen, Madison, WI, reactivo Bugbuster) También se agregó benzonucleasa. Las proteínas solubles en los extractos celulares se separaron en una Estación de Electroforesis Automática Experion de Bio Rad Laboratories (Bio Rad, Hércules, CA) y se analizaron para la concentración y el porcentaje utilizando la versión de Software Experion 1.1.98.0. To produce sample amounts of each aldolase, 25 mL cultures were grown in LB medium containing ampicillin (100 µg / mL), until an OD600 of approximately 0.5 was reached. Cultures were induced with 1mM IPTG. Cells were changed at 30 ° C and developed within 24 hours. Cell extracts were prepared according to the manufacturer's protocols (Novagen, Madison, WI, Bugbuster reagent). Benzonuclease was also added. The soluble proteins in the cell extracts were separated on a Bio Rad Laboratories Experion Automatic Electrophoresis Station (Bio Rad, Hercules, CA) and analyzed for concentration and percentage using Software Experion version 1.1.98.0.

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 50 !g de aldolasa (proporcionada en extractos celulares salvo que se indique lo contrario), 4 mM de MgCl2, 50 mM de D-triptófano, 0,5 mg de Daminotransferasa de B. sphaericus purificada, 200 mM de piruvato de sodio, 100mM de tampón de fosfato de potasio con un pH de 7,5 y 0,05 mM de PLP. Se agregó ditioteitrol (DTT) (concentración definitiva de 2mM) a las muestras descritas a continuación. Los experimentos se desarrollaron por duplicado. Las muestras se incubaron durante 2 horas y durante la noche (20 horas) a 30ºC con una leve agitación. Los resultados medios se muestran a continuación. Los únicos estereoisómeros detectados cuando se produjo monatina utilizando estos procedimientos son los estereoisómeros R,R y S,R. El porcentaje de R,R se enumera a continuación y se determinó por el área de pico de LC de fase inversa. Incorporated for each 1 mL of reaction mixture: approximately 50 µg of aldolase (provided in cell extracts unless otherwise indicated), 4 mM of MgCl2, 50 mM of D-tryptophan, 0.5 mg of Daminotransferase of B purified sphaericus, 200mM sodium pyruvate, 100mM potassium phosphate buffer with a pH of 7.5 and 0.05mM PLP. Dithioteitrole (DTT) (final concentration of 2mM) was added to the samples described below. The experiments were carried out in duplicate. The samples were incubated for 2 hours and overnight (20 hours) at 30 ° C with slight shaking. The average results are shown below. The only stereoisomers detected when monatin was produced using these procedures are the R, R and S, R stereoisomers. The percentage of R, R is listed below and was determined by the peak area of reverse phase LC.

Tabla 13: monatina total producida a partir de D-triptófano y % de R,R Table 13: Total monatin produced from D-tryptophan and% R, R

% de (R,R)-monatina % of (R, R) -monatin

97 97

95 95

76 76

67 67

97 97

94 94

94 94

89 89

84 84

72 72

92 92

86 86

96 96

92 92

94 94

92 92

0 0

91 91

92 92

88 88

74 74

64 64

99 99

97 97

78 78

95 95

0 0

55 55

0 0

53 53

34 3. 4

% de (R,R)-monatina % of (R, R) -monatin

36 36

55 55

40 40

99 99

97 97

Los números de la producción total de monatina oscilaron entre 1 ppm y más de 200 ppm y el % de R,R osciló entre 0% y 99% . Dado que la aminotransferasa fue la misma para todas las aldolasas, el cambio de aldolasa puede afectar significativamente tanto la cantidad de monatina producida como la distribución estereoisomérica de la Total monatin production numbers ranged from 1 ppm to over 200 ppm and the% R, R ranged from 0% to 99%. Since aminotransferase was the same for all aldolases, aldolase change can significantly affect both the amount of monatin produced and the stereoisomeric distribution of the

5 monatina producida. El DTT (como en las muestras a continuación) pareció aumentar la cantidad de monatina total producida. 5 monatin produced. DTT (as in the samples below) seemed to increase the amount of total monatin produced.

Se realizaron los mismos experimentos que anteriormente utilizando L- triptófano como el sustrato de inicio y combinando las aldolasas (proporcionadas como extracto celular) con L- aminotransferasa HexAspC de amplia especificidad de parcialmente purificada (0,5 mg de HexAspC). Los resultados medios (de los duplicados) se reflejan 10 a continuación en la Tabla 14 para la producción total de monatina (restando los niveles básicos sin la presencia de aldolasa) y el % de (S,S)-monatina se refleja en base al área de pico de LC de fase inversa. Las cifras superiores a 400 ppm están fuera de la gama lineal de la curva estándar y son aproximados. El polipéptido purificado con actividad de aldolasa de SEQ ID NO: 28 se utilizó como referencia. Los polipéptidos con actividad de aldolasa de SEQ ID NO: 34 y la SEQ ID NO: 300 (derivado de planta) se utilizaron con y sin 2 mM de DTT. Shannon y Marcus The same experiments as above were performed using L-tryptophan as the starting substrate and combining the aldolases (provided as cell extract) with partially purified L-aminotransferase HexAspC (0.5mg HexAspC). The average results (of the duplicates) are reflected below in Table 14 for the total production of monatin (subtracting the basic levels without the presence of aldolase) and the% of (S, S) -monatin is reflected based on the reverse phase LC peak area. Figures above 400 ppm are outside the linear range of the standard curve and are approximate. The aldolase activity purified polypeptide of SEQ ID NO: 28 was used as a reference. The aldolase activity polypeptides of SEQ ID NO: 34 and SEQ ID NO: 300 (derived from plant) were used with and without 2mM DTT. Shannon and Marcus

15 (The Journal of Biological Chemistry 237; 3342-3347, 1962) utilizaron mercaptoetanol como un agente reductor en la purificación original de aldolasa de HMG de maní. 15 (The Journal of Biological Chemistry 237; 3342-3347, 1962) used mercaptoethanol as a reducing agent in the original purification of aldolase from peanut HMG.


Tabla 14: Monatina total producida a partir de L-triptófano y % de S,S

Table 14: Total monatin produced from L-tryptophan and% S, S

% de (S,S)-monatina % of (S, S) -monatin

47,9 47.9

56,4 56.4

90,6 90.6

89,0 89.0

55,0 55.0

61,7 61.7

71,5 71.5

74,4 74.4

79,3 79.3

83,3 83.3

69,2 69.2

74,1 74.1

51,4 51.4

58,8 58.8

56,7 56.7

% de (S,S)-monatina % of (S, S) -monatin

56,7 56.7

n/d n / a

61,1 61.1

71,9 71.9

75,5 75.5

90,1 90.1

88,8 88.8

30,8 30.8

38,6 38.6

31,0 31.0

34,4 34.4

n/d n / a

n/d n / a

n/d n / a

n/d n / a

75,2 75.2

83 83

63,6 63.6

71,6 71.6

35,1 35.1

40,4 40.4


Ejemplo 11 (no reivindicado)

Example 11 (not claimed)

Efecto del ditiotreitol (DTT) en la producción de monatina Effect of dithiothreitol (DTT) on monatin production

Varias de las enzimas en el Ejemplo 10 se eligieron para mayor estudio. Las aldolasas derivadas de planta Several of the enzymes in Example 10 were chosen for further study. Plant-derived aldolases

5 mostraron una mejora con la adición de DTT como agente reductor. Se notó que las aldolasas derivadas de microbios a partir de muestras ambientales también contienen un porcentaje alto de residuos de cisteína. Por lo tanto, se realizaron otros experimentos para ver si el DTT también aumentó la producción de monatina para aldolasas no de planta. 5 showed improvement with the addition of DTT as a reducing agent. It was noted that aldolases derived from microbes from environmental samples also contain a high percentage of cysteine residues. Therefore, other experiments were performed to see if DTT also increased monatin production for non-plant aldolases.

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 50 !g de aldolasa (proporcionada en For each 1 mL of reaction mixture, approximately 50 µg of aldolase (provided in

10 extractos celulares salvo que se indique lo contrario), 4 mM de MgCl2, 50 mM de D-triptófano, 2 mg de AT-103, 200 mM de piruvato de sodio, 100 mM de tampón de fosfato de potasio con un pH de 7,5 y 0,05 mM de PLP. Se agregó ditiotreitol (concentración definitiva de 2mM) a las muestras indicadas a continuación. Los experimentos se desarrollaron por duplicado. Las muestras se incubaron durante 2 horas a 30ºC con una leve agitación. Los resultados medios se muestran a continuación respecto de la monatina total como se determina por LC/MS/MS, con 10 cell extracts unless otherwise noted), 4mM MgCl2, 50mM D-tryptophan, 2mg AT-103, 200mM Sodium Pyruvate, 100mM Potassium Phosphate Buffer with a pH of 7 , 5 and 0.05 mM PLP. Dithiothreitol (final concentration of 2mM) was added to the samples indicated below. The experiments were carried out in duplicate. The samples were incubated for 2 hours at 30 ° C with slight shaking. The average results are shown below for total monatin as determined by LC / MS / MS, with

15 la producción básica de monatina (sin control de aldolasa) restada. 15 the basic monatin production (without aldolase control) subtracted.

Tabla 15: monatina total producida a partir de D-triptófano Table 15: Total monatin produced from D-tryptophan

Monatina total (ppm) Total monatin (ppm)

126 126

102 102

107 107

103 103

88 88

161 161

118 118

141 141

243 243

170 170

174 174

196 196

El control no aldolasa produjo 10 ppm de monatina total con y sin DTT, indicando que el DTT no afecta la reacción general mediante la reducción de subproductos y no afecta la actividad de D-aminotransferasa. Los polipéptidos con actividad de aldolasa de SEQ ID NO: 46, SEQ ID NO: 58, SEQ ID NO: 28 demostraron un beneficio a partir de la incorporación de DTT. El polipéptido con actividad de aldolasa de SEQ ID NO: 46 mostró el mayor beneficio, aproximadamente una actividad 1,8 veces más alta con 2 mM de DTT. Dos polipéptidos con actividad de aldolasa parecen haber sido inhibidos por el DTT (SEQ ID NO: 116 y SEQ ID NO: 50) a la vez que no se vio efecto alguno dentro del error experimental para el polipéptido con actividad de aldolasa de SEQ ID NO: 44. Sin embargo, es posible que para cada aldolasa utilizada exista una concentración óptima de DTT para detectar un beneficio de proporcionar el agente reductor. The non-aldolase control produced 10 ppm total monatin with and without DTT, indicating that DTT does not affect the overall reaction by reducing byproducts and does not affect D-aminotransferase activity. The aldolase activity polypeptides of SEQ ID NO: 46, SEQ ID NO: 58, SEQ ID NO: 28 demonstrated a benefit from DTT incorporation. The aldolase activity polypeptide of SEQ ID NO: 46 showed the greatest benefit, approximately 1.8-fold higher activity with 2mM DTT. Two aldolase-active polypeptides appear to have been inhibited by DTT (SEQ ID NO: 116 and SEQ ID NO: 50) while no effect was seen within the experimental error for the aldolase-active polypeptide of SEQ ID NO : 44. However, it is possible that for each aldolase used there is an optimal concentration of DTT to detect a benefit of providing the reducing agent.

El polipéptido con actividad de aldolasa de SEQ ID NO: 88 fue elegido para estudiar el efecto de la concentración de DTT en la producción de monatina. Se realizaron reacciones combinadas como anteriormente. Los resultados aparecen en la Figura 15. La concentración óptima de DTT en este ensayo osciló entre 2,5 y 5 mM para la cantidad de aldolasa incorporada. Lo interesante es que si no incluyó DTT, la cantidad de monatina producida fue casi tan alta como los 2,5 mM de DTT, pero incorporar cantidades subóptimas de DTT (0,5-1mM) realmente parece generar un efecto inhibidor así como también la incorporación de una alta cantidad de DTT (20mM). The aldolase-active polypeptide of SEQ ID NO: 88 was chosen to study the effect of DTT concentration on monatin production. Combined reactions were performed as above. The results appear in Figure 15. The optimal concentration of DTT in this assay ranged from 2.5 to 5 mM for the amount of aldolase incorporated. The interesting thing is that if it did not include DTT, the amount of monatin produced was almost as high as 2.5 mM DTT, but incorporating suboptimal amounts of DTT (0.5-1mM) really seems to have an inhibitory effect as well as incorporation of a high amount of DTT (20mM).

Ejemplo 12 Example 12

Comparación de la producción total de monatina y la distribución isomérica para los polipéptidos con actividad de aldolasa de SEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQ ID NO: 202, SEQ ID NO: 166, SEQ ID NO: 218, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO: 200, SEQ ID NO: 280, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270, SEQ ID NO: 156 y SEQ ID NO: 28. Comparison of total monatin production and isomeric distribution for aldolase activity polypeptides of SEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQ ID NO: 202, SEQ ID NO: 166, SEQ ID NO: 218, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO : 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO: 200, SEQ ID NO: 280, SEQ ID NO: 284 , SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270, SEQ ID NO: 156 and SEQ ID NO: 28.

La enzima recombinante producida en el Ejemplo 7 se utilizó en reacciones combinadas con aldolasas de HMG para producir monatina a partir de D-triptófano y piruvato como se describe en la solicitud de patente de los Estados Unidos publicada No. 20050282260. El polipéptido con actividad de aldolasa de SEQ ID NO: 28 se utilizó como referencia en estos ensayos y había sido purificada como se describe en el Ejemplo 8. The recombinant enzyme produced in Example 7 was used in combined reactions with HMG aldolases to produce monatin from D-tryptophan and pyruvate as described in published US patent application No. 20050282260. The polypeptide with activity of Aldolase from SEQ ID NO: 28 was used as a reference in these assays and had been purified as described in Example 8.

Para producir cantidades de muestra de cada aldolasa, se desarrollaron cultivos de 25 mL en un medio LB que contenía ampicilina (100 !g/mL), a una DO600 de aproximadamente 0,5. Los cultivos se indujeron con 1 mM de IPTG. Las células se cambiaron a 30ºC y se desarrollaron durante la noche. Los extractos celulares se prepararon utilizando un reactivo Bugbuster conforme a los protocolos del fabricante (Novagen, Madison, WI). También se incorporó benzonucleasa. Las proteínas solubles en los extractos celulares se separaron en una Estación de Electroforesis Automática - Experion de Bio-Rad Laboratories (Bio-Rad, Hércules, CA) y se analizaron para verificar la concentración y el porcentaje utilizando la versión de software de Experion 1.1.98.0. To produce sample amounts of each aldolase, 25 mL cultures were grown in LB medium containing ampicillin (100 µg / mL), at an OD600 of approximately 0.5. Cultures were induced with 1mM IPTG. Cells were changed at 30 ° C and developed overnight. Cell extracts were prepared using a Bugbuster reagent according to the manufacturer's protocols (Novagen, Madison, WI). Benzonuclease was also incorporated. The soluble proteins in the cell extracts were separated in an Automatic Electrophoresis Station - Experion from Bio-Rad Laboratories (Bio-Rad, Hercules, CA) and analyzed to verify the concentration and the percentage using the software version of Experion 1.1. 98.0.

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 200 !g de los polipéptidos con actividad de aldolasa de SEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQ ID NO: 202, SEQ ID NO: 5 SEQ ID NO: 166, SEQ ID NO: 218, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192 y SEQ ID NO: 200 Approximately 200 µg of the aldolase activity polypeptides of SEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQ ID NO were incorporated for each 1 mL of reaction mixture : 202, SEQ ID NO: 5 SEQ ID NO: 166, SEQ ID NO: 218, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192 and SEQ ID NO: 200

o 50 !g del polipéptido con actividad de aldolasa de SEQ ID NO: 280, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270 y SEQ ID NO:156 (proporcionado en extractos celulares salvo que se indique lo contrario), 4 mM de MgCl2, 50 mM 10 de D-triptófano, 0,5 mg de D-aminotransferasa de B. sphaericus purificada, 200 mM de piruvato de sodio, 100 mM de tampón de fosfato de potasio con un pH de 7,5 y 0,05 mM de PLP. Los experimentos se desarrollaron por duplicado. Las muestras se incubaron durante 2 horas y durante la noche (20 horas) a 30°C con una leve agitación. Los resultados medios aparecen a continuación. Los únicos estereoisómeros detectados cuando se produce monatina utilizando estos procedimientos son los estereoisómeros R,R y S,R. El porcentaje de R,R se enumera a or 50 µg of the aldolase activity polypeptide of SEQ ID NO: 280, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO : 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270 and SEQ ID NO: 156 (provided in cell extracts unless otherwise noted), 4mM MgCl2, 50mM 10 D- tryptophan, 0.5 mg purified B. sphaericus D-aminotransferase, 200 mM sodium pyruvate, 100 mM potassium phosphate buffer with a pH of 7.5 and 0.05 mM PLP. The experiments were carried out in duplicate. The samples were incubated for 2 hours and overnight (20 hours) at 30 ° C with slight shaking. The average results appear below. The only stereoisomers detected when monatin is produced using these procedures are the R, R, and S, R stereoisomers. The percentage of R, R is listed to

15 continuación y se determinó mediante el área de pico de LC de fase inversa. It was then continued and determined by the reversed phase LC peak area.


Tabla 16: monatina total producida a partir de D-triptófano y % de R,R

Table 16: Total monatin produced from D-tryptophan and% R, R

% de (R,R)-monatina % of (R, R) -monatin

100 100

96 96

100 100

98 98

100 100

98 98

98 98

94 94

0 0

91 91

89 89

71 71

99 99

96 96

98 98

93 93

95 95

84 84

99 99

98 98

95 95

89 89

% de (R,R)-monatina % of (R, R) -monatin

81 81

73 73

82 82

77 77

98 98

95 95

98 98

98 98

96 96

94 94

95 95

91 91

94 94

93 93

97 97

97 97

97 97

94 94

100 100

99 99

n/d n / a

61 61

100 100

= =
98 98

99 99

96 96

93 93

75 75

98 98

90 90

99 99

% de (R,R)-monatina % of (R, R) -monatin

95 95

96 96

90 90

97 97

90 90

100 100

96 96

91 91

83 83

88 88

71 71

98 98

97 97

Los números de la producción total de monatina fueron desde indetectable a más de 600 ppm y el % de R,R oscilaron entre el 61% y el 100%. Dado que la aminotransferasa fue la misma para todas las aldolasas, el cambio de aldolasa puede tener un impacto significativo tanto en la cantidad de monatina producida como en la distribución Total monatin production numbers ranged from undetectable to over 600 ppm and the% R, R ranged from 61% to 100%. Since aminotransferase was the same for all aldolases, aldolase change can have a significant impact on both the amount of monatin produced and the distribution

5 estereoisomérica de la monatina producida. Stereoisomeric of the monatin produced.

Se realizaron los mismos experimentos que anteriormente utilizando L-triptófano como el sustrato inicial y combinando las aldolasas (proporcionadas como extractos celulares) con L-aminotransferasa HexAspC de especificidad amplia producida y purificada como se describe en la solicitud de patente de los Estados Unidos publicada No. 20050282260 (0,5 mg de proteína purificada). Los resultados se reflejan en la Tabla 17 para la 10 producción total de monatina (restando los niveles básicos sin presencia de aldolasa) y el porcentaje de (S,S)monatina se refleja en base al área de pico de LC de fase inversa. Las cifras superiores a 400 ppm están fuera de la gama lineal de la curva estándar y son aproximadas. La Tabla 12 muestra los resultados para la enzima Respecífica de referencia, el polipéptido con actividad de aldolasa de SEQ ID NO: 28 que se ensayó al mismo tiempo. The same experiments as above were performed using L-tryptophan as the initial substrate and combining aldolases (provided as cell extracts) with broad specificity L-aminotransferase HexAspC produced and purified as described in published U.S. patent application No 20050282260 (0.5 mg of purified protein). The results are reflected in Table 17 for the total production of monatin (subtracting the basic levels without the presence of aldolase) and the percentage of (S, S) monatin is reflected based on the peak area of reverse phase LC. Figures above 400 ppm are outside the linear range of the standard curve and are approximate. Table 12 shows the results for the reference Specific enzyme, the aldolase activity polypeptide of SEQ ID NO: 28 that was tested at the same time.


Tabla 17: Monatina total producida a partir de L-triptófano y % de S,S

Table 17: Total monatin produced from L-tryptophan and% S, S

Aldolasa (punto de tiempo) Aldolasa (time point)
Monatina total (ppm) % de S,S monatina (área de pico de LC de fase inversa) % de (S,S)-monatina (derivatización de FDAA) Total monatin (ppm) Monatin S, S% (reverse phase LC peak area) % of (S, S) -monatin (FDAA derivatization)

SEQ ID NO: 278 (1 hora) SEQ ID NO: 278 (1 hour)
14,6 21,0 n/d 14.6 21.0 n / a

SEQ ID NO: 278 (durante la noche) SEQ ID NO: 278 (overnight)
7905 24,6 n/d 7905 24.6 n / a

SEQ ID NO: 162 (1 hora) SEQ ID NO: 162 (1 hour)
14 15,4 n/d 14 15.4 n / a

SEQ ID NO: 162(durante la noche) SEQ ID NO: 162 (overnight)
105,6 17,3 n/d 105.6 17.3 n / a

SEQ ID NO: 276 (1 hora) SEQ ID NO: 276 (1 hour)
35,8 10,2 n/d 35.8 10.2 n / a

SEQ ID NO: 276 (durante la noche) SEQ ID NO: 276 (overnight)
67,8 9 15,1 67.8 9 15.1

Aldolasa (punto de tiempo) Aldolasa (time point)
Monatina total (ppm) % de S,S monatina (área de pico de LC de fase inversa) % de (S,S)-monatina (derivatización de FDAA) Total monatin (ppm) Monatin S, S% (reverse phase LC peak area) % of (S, S) -monatin (FDAA derivatization)

SEQ ID NO: 218 (1 hora) SEQ ID NO: 218 (1 hour)
11,7 20,3 n/d 11.7 20.3 n / a

SEQ ID NO: 218(durante la noche) SEQ ID NO: 218 (overnight)
49,9 17,7 22,0 49.9 17.7 22.0

SEQ ID NO: 244 (1 hora) SEQ ID NO: 244 (1 hour)
6,2 18,0 n/d 6.2 18.0 n / a

SEQ ID NO: 244 (durante la noche) SEQ ID NO: 244 (overnight)
24,4 14,7 19,6 24.4 14.7 19.6

SEQ ID NO: 268 (1 hora) SEQ ID NO: 268 (1 hour)
6,3 24,1 n/d 6.3 24.1 n / a

SEQ ID NO: 268 (durante la noche) SEQ ID NO: 268 (overnight)
61,2 23,3 29,2 61.2 23.3 29.2

SEQ ID NO: 272 (1 hora) SEQ ID NO: 272 (1 hour)
5,7 20,5 n/d 5.7 20.5 n / a

SEQ ID NO: 272 (durante la noche) SEQ ID NO: 272 (overnight)
43,6 19,9 22,9 43.6 19.9 22.9

SEQ ID NO: 192 (1 hora) SEQ ID NO: 192 (1 hour)
6,8 19,0 n/d 6.8 19.0 n / a

SEQ ID NO: 192(durante la noche) SEQ ID NO: 192 (overnight)
56,4 20,0 24,4 56.4 20.0 24.4

SEQ ID NO: 172 (1 hora) SEQ ID NO: 172 (1 hour)
29,9 35,6 n/d 29.9 35.6 n / a

SEQ ID NO: 172(durante la noche) SEQ ID NO: 172 (overnight)
184,2 42,4 45,6 184.2 42.4 45.6

SEQ ID NO: 228 (1 hora) SEQ ID NO: 228 (1 hour)
59,6 23,9 n/d 59.6 23.9 n / a

SEQ ID NO: 228 (durante la noche) SEQ ID NO: 228 (overnight)
182 35,6 38,0 182 35.6 38.0


Ejemplo 13 (ejemplo comparativo)

Example 13 (comparative example)

Producción de monatina a partir de indol-3-piruvato utilizando una D-aminotransferasa Monatin production from indole-3-pyruvate using a D-aminotransferase

La transaminasa AT-103 fue parte de una biblioteca de transaminasas adquirida de BioCatalytics (Pasadena, CA) y AT-103 transaminase was part of a transaminase library purchased from BioCatalytics (Pasadena, CA) and

5 la enzima se probó para la producción de monatina en reacciones combinadas utilizando la ProA aldolasa de C. testosteroni. La aldolasa se preparó como se describe en la patente No. W0 03/091396 A2. La AT-103 es una Dtransaminasa de amplia especificidad (E.C. 2.6.1.21) de la especie Bacillus que requiere un D-aminoácido (como un D-glutamato, un D-aspartato o D-alanina) como el donante de aminoácido. Las enzimas y los componentes/sustratos adicionales se incorporaron directamente al tampón de reacción proporcionado en el kit que contenía 100 mM de 5 The enzyme was tested for the production of monatin in combined reactions using the C. testosteroni ProA aldolase. Aldolase was prepared as described in Patent No. W0 03/091396 A2. AT-103 is a broadly specific Dtransaminase (E.C. 2.6.1.21) of the Bacillus species that requires a D-amino acid (such as a D-glutamate, D-aspartate, or D-alanine) as the amino acid donor. Enzymes and additional components / substrates were directly incorporated into the reaction buffer provided in the kit containing 100 mM of

10 tampón de fosfato de potasio con un pH de 7,5, 100 mM de donante amino y 0,1 mM de PLP. A un mL de tampón de reacción se agregaron: 4 mg de indol-3-piruvato, 20 mg de piruvato, aproximadamente 50 !g de ProA proporcionada en un extracto celular, 1 !L 2 M de MgCl2, y 2 mg de enzima aminotransferasa. Las reacciones se realizaron por duplicado. Las reacciones se incubaron durante la noche a 30°C con una leve agitación (100 rpm). Las muestras se filtraron y sometieron a un análisis de LC/MS/MS de fase inversa como se describe en el Ejemplo 1. Los resultados 10 potassium phosphate buffer with a pH of 7.5, 100 mM amino donor and 0.1 mM PLP. To one mL of reaction buffer were added: 4 mg indole-3-pyruvate, 20 mg pyruvate, approximately 50 µg ProA provided in a cell extract, 1 µL 2M MgCl2, and 2 mg enzyme aminotransferase . Reactions were performed in duplicate. Reactions were incubated overnight at 30 ° C with slight shaking (100 rpm). The samples were filtered and subjected to reverse phase LC / MS / MS analysis as described in Example 1. The results

15 indicaron que aproximadamente 370 !g/mL de monatina se produjeron utilizando la enzima AT-103. Los resultados fueron posteriormente analizados para determinar las proporciones de S,R/R,S respecto de la (R,R)-/(S,S)-monatina en base a las áreas de pico de los dos grupos de estereoisómeros que se resuelven durante la separación cromatográfica. De la monatina total producida por AT-103, el 69% era (R,R)-/(S,S)-monatina en relación con los isómeros mezclados. Esta enzima es homóloga a la enzima DAT de Bacillus subtilis descrita en la patente No. WO 15 indicated that approximately 370 µg / mL monatin was produced using the enzyme AT-103. The results were subsequently analyzed to determine the proportions of S, R / R, S with respect to (R, R) - / (S, S) -monatin based on the peak areas of the two groups of stereoisomers that resolve. during chromatographic separation. Of the total monatin produced by AT-103, 69% was (R, R) - / (S, S) -monatin relative to the mixed isomers. This enzyme is homologous to the Bacillus subtilis DAT enzyme described in Patent No. WO

20 03/091396 A2 que se conoce por tener una amplia especificidad para D-aminoácidos. El análisis quiral se realizó utilizando la metodología FDAA descrita en el Ejemplo 1, que verificó que la D-aminotransferasa estaba produciendo principalmente (R,R)-monatina y alguna (S,R)-monatina como se esperaba. Otros experimentos de transaminación con (S,S)-monatina o (R,R)-monatina y a-cetoglutarato como sustratos verificaron que la enzima de BioCatalytics era altamente selectiva para la configuración-D del carbono 4 como se esperaba. En estos experimentos, no se detectó 03/201396 A2 which is known to have broad specificity for D-amino acids. Chiral analysis was performed using the FDAA methodology described in Example 1, which verified that D-aminotransferase was primarily producing (R, R) -monatin and some (S, R) -monatin as expected. Other transamination experiments with (S, S) -monatin or (R, R) -monatin and α-ketoglutarate as substrates verified that the BioCatalytics enzyme was highly selective for carbon 4-D configuration as expected. In these experiments, no

25 glutamato en la reacción con (S,S)-monatina y a-cetoglutarato como sustratos. Glutamate in reaction with (S, S) -monatin and α-ketoglutarate as substrates.

Para disminuir la cantidad de (S,S)-monatina o (R,S)-monatina producida como subproductos en reacciones combinadas con AT-103 (la D-transaminasa de amplia gama) y la ProA aldolasa, la aldolasa se purificó utilizando cartuchos His-Bind conforme a los protocolos del fabricante (Novagen, Madison, WI.). La enzima purificada preferentemente no debería contener actividades de L-aminotransferasa salvajes que pueden estar presentes en extractos celulares (como las actividades TyrB o AspC de E. coli nativas). Este eluyente His-Bind se desaló para eliminar imidazol utilizando columnas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ) y se eluyó en 50 mM de Tris-Cl con un pH de 7. Los experimentos se realizaron por duplicado en un volumen de 1 mL y contenían 100 mM de tampón Tris-Cl, pH de 7,8, 50 !g de ProA aldolasa, 4 mg de indol-3-piruvato, 1 o 2 mg de Daminotransferasa, 200 mM de piruvato de sodio, 2 mM de MgCl2, 3 mM de fosfato de potasio, 0,1 mM de PLP y 14,7 mg de D-glutamato. Los tubos se incubaron a 30ºC con una leve agitación. Se tomaron puntos de tiempo de dos horas y se congelaron inmediatamente a -20°C. El pH se ajustó a las dos horas de 5 hasta entre 7 y 8 utilizando NaOH y los ensayos se incubaron durante la noche. Las muestras se filtraron y analizaron para verificar la monatina como se describe en el Ejemplo 1. Las muestras de dos horas no mostraron cantidades detectables de monatina, probablemente a raíz del pH bajo. Las muestras de 24 horas contenían cerca de 190 ng/mL de monatina cuando se utilizó un 1 mg de D-aminotransferasa y cerca del 84% era (R,R)-monatina y el 16% era (S,R)-monatina. Cuando se utilizaron 2 mg de D-aminotransferasa, se produjeron 540 ng/mL de monatina, cerca del 71% era (R,R)-monatina. To decrease the amount of (S, S) -monatin or (R, S) -monatin produced as by-products in combined reactions with AT-103 (wide-range D-transaminase) and ProA aldolase, aldolase was purified using cartridges His-Bind according to the manufacturer's protocols (Novagen, Madison, WI.). The purified enzyme should preferably not contain wild-type L-aminotransferase activities that may be present in cell extracts (such as native E. coli TyrB or AspC activities). This His-Bind eluent was desalted to remove imidazole using PD-10 columns (G25 Sephadex, GE Healthcare, Piscataway, NJ) and eluted in 50mM Tris-Cl with a pH of 7. Experiments were performed in duplicate on a 1 mL volume and contained 100 mM Tris-Cl buffer, pH 7.8, 50 µg ProA aldolase, 4 mg indole-3-pyruvate, 1 or 2 mg Daminotransferase, 200 mM sodium pyruvate, 2mM MgCl2, 3mM potassium phosphate, 0.1mM PLP and 14.7mg D-glutamate. The tubes were incubated at 30 ° C with slight shaking. Two hour time points were taken and immediately frozen at -20 ° C. The pH was adjusted after two hours from 5 to 7 to 8 using NaOH and the assays were incubated overnight. The samples were filtered and analyzed to verify monatin as described in Example 1. The two-hour samples showed no detectable amounts of monatin, probably due to the low pH. The 24 hour samples contained about 190 ng / mL monatin when 1 mg D-aminotransferase was used and about 84% was (R, R) -monatin and 16% was (S, R) -monatin. When 2 mg D-aminotransferase was used, 540 ng / mL monatin was produced, about 71% was (R, R) -monatin.

Se realizaron experimentos similares utilizando un tampón de aminotransferasa de BioCatalytics (BioCatalytics, Pasadena, CA), que contenía 100 mM de fosfato de potasio con un pH de 7,5, 0,1 mM de PLP y 100 mM de Dglutamato. Se agregaron indol-3-piruvato sólido y D-aminotransferasa como se hizo anteriormente. Se agregó ProA aldolasa (50 !g), MgCl2, y 50 mM de piruvato de las soluciones concentradas. Los ensayos se trataron como se hizo anteriormente, a pesar de que no se necesitó un ajuste de pH en este caso. Se realizó un control negativo con la enzima y el tampón proporcionados por BioCatalytics, que no contenía monatina. Los resultados experimentales se reflejan en la Tabla 18. Similar experiments were performed using a BioCatalytics aminotransferase buffer (BioCatalytics, Pasadena, CA), containing 100mM potassium phosphate with a pH of 7.5, 0.1mM PLP and 100mM Dglutamate. Solid indole-3-pyruvate and D-aminotransferase were added as above. ProA aldolase (50 µg), MgCl2, and 50 mM pyruvate were added from the concentrated solutions. The assays were treated as above, although a pH adjustment was not required in this case. A negative control was performed with the enzyme and the buffer provided by BioCatalytics, which did not contain monatin. The experimental results are reflected in Table 18.


Tabla 18: Producción de monatina a partir de indol-3-piruvato en tampón de fosfato

Table 18: Monatin production from indole-3-pyruvate in phosphate buffer

Mg Daminotransferasa Mg Daminotransferase
Tiempo (horas) Monatina total (ng/mL) % de R,R Time (hours) Total monatin (ng / mL) % of R, R

0 0
2 0 n/d 2  0 n / a

1 one
2 6780 No determinado 2 6780 Undetermined

2 2
2 2
13170 55% 13170 55%

0 0
16 0 n/d 16  0 n / a

1 one
16 15000 No determinado 16 15000 Undetermined

2 2
16 28930 51% 16 28930 51%

La producción de monatina en un tampón de fosfato es claramente más elevada que en sistemas tamponados Tris. Monatin production in a phosphate buffer is clearly higher than in Tris buffered systems.

Para comparar las actividades del B. subtilis DAT clonado de la patente WO 03/091396 A2 con la enzima de BioCatalytics (AT-103) (BioCatalytics, Pasadena, CA), se realizaron ensayos adicionales. El gen dat de B.subtilis también se subclonó en pET30 para eliminar la marca de Histidina 6. Las enzimas marcadas y no marcadas se produjeron en BL21 (DE3) como se describe en la patente WO 03/091396 A2. Se realizaron extractos celulares y los ensayos de proteína total se desarrollaron para estimar la concentración de proteína como se describió anteriormente. Se realizaron reacciones duplicadas de un mL que contenían: 500 !g de D-aminotransferasa, 50 !g de ProA aldolasa, 100 mM de fosfato de potasio con un pH de 7,5, 3 mM de MgCl2, 4 mg de indol-3-piruvato, 200 mM de piruvato de sodio, 7,35 mg (50 mM) de D-glutamato y 0,1 mM de PLP. Las muestras se incubaron a 30°C durante 1, 2 y 24 horas y se filtraron para el análisis por LC/MS/MS. Las muestras solo contenían estereoisómeros S,R y R,R de monatina como determina el protocolo de derivatización FDAA descrito en el Ejemplo 1. Los resultados están resumidos en la Tabla 19 a continuación. El % de R,R se determinó por áreas de pico que se separaron mediante cromatografía de fase inversa. To compare the activities of the cloned B. subtilis DAT from WO 03/091396 A2 with the enzyme from BioCatalytics (AT-103) (BioCatalytics, Pasadena, CA), additional tests were performed. The B. subsubtilis dat gene was also subcloned into pET30 to remove the Histidine 6 label. Labeled and unlabeled enzymes were produced in BL21 (DE3) as described in WO 03/091396 A2. Cell extracts were made and total protein assays were performed to estimate protein concentration as previously described. Duplicate one mL reactions were performed containing: 500 µg D-aminotransferase, 50 µg ProA aldolase, 100 mM potassium phosphate with a pH of 7.5, 3 mM MgCl2, 4 mg indole-3 -pyruvate, 200 mM sodium pyruvate, 7.35 mg (50 mM) D-glutamate and 0.1 mM PLP. The samples were incubated at 30 ° C for 1, 2 and 24 hours and filtered for analysis by LC / MS / MS. The samples only contained monatin S, R and R, R stereoisomers as determined by the FDAA derivatization protocol described in Example 1. The results are summarized in Table 19 below. The% R, R was determined by peak areas that were separated by reverse phase chromatography.


Tabla 19: comparación de enzimas D-aminotransferasa

Table 19: Comparison of D-aminotransferase enzymes

% de (R,R)-monatina % of (R, R) -monatin

--
no determinado undetermined

no determinado undetermined

% de (R,R)-monatina % of (R, R) -monatin

no determinado undetermined

--
80-90% 80-90%

080% 080%

92,5% 92.5%

--
31 31

33 33

66 66

La eliminación de la marca de Histidina 6 parece haber mejorado la actividad de la D-aminotransferasa de B. subtilis. Sin embargo, el homólogo de la D-aminotransferasa de BioCatalytics claramente tuvo la actividad más alta. El homólogo de la D-aminotransferasa de BioCatalytics también demostró una mayor especificidad de sustrato para el precursor de R-monatina. Los mayores plazos de incubación parecen reducir el exceso enantiomérico de la R,R, monatina que se produce. Removal of the Histidine 6 tag appears to have improved B. subtilis D-aminotransferase activity. However, the BioCatalytics D-aminotransferase homolog clearly had the highest activity. The BioCatalytics D-aminotransferase homolog also demonstrated higher substrate specificity for the R-monatin precursor. The longer incubation periods seem to reduce the enantiomeric excess of R, R, monatin that is produced.

Dado que las enzimas de Bacillus D-aminotransferasa tienen una preferencia por el piruvato como un aceptor amino y por D-alanina como un donante amino, se esperaba que la D-alanina pudiera utilizarse como el donante amino para la conversión de MP en monatina con resultados mejores o similares. Se realizaron reacciones duplicadas de un mL que contenían: 500 !g de D-aminotransferasa, 50 !g de ProA aldolasa purificada, 100 mM de fosfato de potasio con un pH de 7,5, 3 mM de MgCl2, 4 mg de indol-3-piruvato, 100 mM de piruvato de sodio, 25 mM de Dglutamato o D-alanina y 0,1 mM de PLP. Las muestras se incubaron durante 2 horas y se trataron como se hizo anteriormente previo al análisis. Cuando se utilizó D-alanina como el donante amino, se produjeron niveles de monatina apenas más altos de lo esperado (23 frente a 21 ppm). Asimismo, se espera que las concentraciones altas de piruvato puedan inhibir la etapa de transaminación, por lo cual administrar dosis de piruvato en cantidades más pequeñas con el tiempo puede mejorar la proporción general de la producción de monatina. Se puede ver a partir de los datos anteriores que a pesar de que se utilizó la mitad del piruvato en este caso, en relación con la tabla anterior, se produjo una cantidad significativamente mayor de monatina. AT-103 es un ejemplo de una enzima con actividad limitada para S-MP. A pesar de que la ProA aldolasa utilizada en este estudio genera más que 90-95% de S-MP, AT-103 genera hasta 92% de (R,R)-monatina. Since Bacillus D-aminotransferase enzymes have a preference for pyruvate as an amino acceptor and for D-alanine as an amino donor, it was hoped that D-alanine could be used as the amino donor for the conversion of MP to monatin with better or similar results. Duplicate reactions of one mL were performed containing: 500 µg of D-aminotransferase, 50 µg of purified ProA aldolase, 100 mM of potassium phosphate with a pH of 7.5, 3 mM of MgCl2, 4 mg of indole. 3-pyruvate, 100 mM sodium pyruvate, 25 mM Dglutamate or D-alanine and 0.1 mM PLP. The samples were incubated for 2 hours and treated as before prior to analysis. When D-alanine was used as the amino donor, monatin levels were produced slightly higher than expected (23 vs. 21 ppm). Also, it is hoped that high concentrations of pyruvate can inhibit the transamination step, so administering pyruvate doses in smaller amounts over time can improve the overall proportion of monatin production. It can be seen from the above data that even though half the pyruvate was used in this case, relative to the table above, a significantly higher amount of monatin was produced. AT-103 is an example of an enzyme with limited activity for S-MP. Despite the fact that the ProA aldolase used in this study generates more than 90-95% of S-MP, AT-103 generates up to 92% of (R, R) -monatin.

Ejemplo 14 (ejemplo comparativo) Example 14 (comparative example)

Producción de (R,R)-monatina a partir de D-triptófano Production of (R, R) -monatin from D-tryptophan

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 60 !g de ProA aldolasa de C. testosteroni (proporcionada en extractos celulares como se describe en la patente WO 03/091396), 4 mM de MgCl2, 50 mM de D-triptófano, 0,5 mg de D-aminotransferasa (AT-103) de BioCatalytics (BioCatalytics, Pasadena, CA), 100 mM de piruvato de sodio, 100mM de tampón de fosfato de potasio con un pH de 7,5 o 100 mM de tampón de acetato de sodio con un pH de 8, 0,05 mM de PLP, 3 mM de fosfato de potasio (solamente para las reacciones de acetato) y 10 mM de a-cetoglutarato. Los experimentos se desarrollaron por duplicado con controles negativos en donde no se agregó aldolasa. Las muestras se incubaron durante la noche (20 horas) a 30°C con una leve agitación. El pH real de las muestras de acetato de sodio fue de aproximadamente 5, mientras que el pH definitivo para las muestras tamponadas de fosfato fue de aproximadamente 7. Ninguna de las aldolasas parecía tener una actividad significativa con un pH de 5; la muestra que contenía ProA aldolasa estaba apenas por encima del control negativo pero probablemente no estaba por encima del error experimental. En el fosfato de potasio, la ProA aldolasa produjo 73,4 ppm de monatina con una proporción R,R:S,R de 1,7:1 (~63% de R,R a partir de D-triptófano). Approximately 60 µg of C. testosteroni ProA aldolase (provided in cell extracts as described in WO 03/091396), 4 mM MgCl2, 50 mM D-tryptophan were incorporated per 1 mL of reaction mixture , 0.5mg D-aminotransferase (AT-103) from BioCatalytics (BioCatalytics, Pasadena, CA), 100mM Sodium Pyruvate, 100mM Potassium Phosphate Buffer with a pH of 7.5 or 100mM Buffer sodium acetate with a pH of 8, 0.05 mM PLP, 3 mM potassium phosphate (for acetate reactions only), and 10 mM a-ketoglutarate. The experiments were carried out in duplicate with negative controls where aldolase was not added. The samples were incubated overnight (20 hours) at 30 ° C with slight shaking. The actual pH of the sodium acetate samples was approximately 5, while the final pH for the phosphate buffered samples was approximately 7. None of the aldolases appeared to have significant activity at a pH of 5; the sample containing ProA aldolase was just above the negative control but was probably not above the experimental error. In potassium phosphate, ProA aldolase produced 73.4 ppm monatin with an R, R: S, R ratio of 1.7: 1 (~ 63% R, R from D-tryptophan).

Dado que las enzimas de Bacillus D-aminotransferasa tienen una preferencia por el piruvato como un aceptor amino y por D-alanina como un donante amino, se esperaba que la incorporación de alfa-cetoglutarato no fuera necesaria cuando se producía R,R o (S,R)-monatina a partir de D-triptófano. El experimento anterior se repitió (en 100 mM de tampón de fosfato de potasio) utilizando ProA aldolasa purificada (50-60 !g) y un tiempo de incubación de 2,5 horas. Se desarrollaron experimentos por duplicado con y sin alfa-cetoglutarato. Con la incorporación de 10 mM de alfacetoglutarato, se formaron 56,1 ppm de monatina a partir de D-triptófano (79,5% de R,R, 20,5% de S,R). Sin alfacetoglutarato, se formaron 102, 5 ppm de monatina (79% de R,R, 21% de S,R). Since Bacillus D-aminotransferase enzymes have a preference for pyruvate as an amino acceptor and for D-alanine as an amino donor, the incorporation of alpha-ketoglutarate was expected to be unnecessary when R, R or (S was produced , R) -monatin from D-tryptophan. The above experiment was repeated (in 100 mM potassium phosphate buffer) using purified ProA aldolase (50-60 µg) and an incubation time of 2.5 hours. Duplicate experiments were performed with and without alpha-ketoglutarate. With the incorporation of 10 mM alpha-ketoglutarate, 56.1 ppm monatin was formed from D-tryptophan (79.5% R, R, 20.5% S, R). Without alpha-ketoglutarate, 102.5 ppm monatin was formed (79% R, R, 21% S, R).

Ejemplo 15 (ejemplo comparativo) Example 15 (comparative example)

Triptófano racemasa Tryptophan racemase

La (R,R)-monatina ha sido producida utilizando D-aminotransferasa y una aldolasa cuando se utilizó D-triptófano como el material inicial (Ejemplo 14). Sin perjuicio de lo expuesto, el L-triptófano puede ser un material inicial preferido por varias razones. Por ejemplo, el L-triptófano puede ser más económico y estar más disponible que el Dtriptófano. La presente solicitud describe varios procedimientos para obtener un triptófano racemasa activo. Los rendimientos de (R,R)-monatina se mejoran utilizando una aldolasa R-específica, es decir, una aldolasa que en forma preferente o selectiva produce R-MP. La Figura 3 ilustra un procedimiento para producir (R,R)-monatina enriquecida con estereoisómeros a partir de L-triptófano utilizando triptófano racemasa, una D-aminotransferasa y una aldolasa R-específica. (R, R) -monatin has been produced using D-aminotransferase and an aldolase when D-tryptophan was used as the starting material (Example 14). Notwithstanding the foregoing, L-tryptophan may be a preferred starting material for several reasons. For example, L-tryptophan may be cheaper and more available than Dipryptophan. The present application describes various procedures for obtaining an active tryptophan racemase. The yields of (R, R) -monatin are improved using an R-specific aldolase, that is, an aldolase that preferentially or selectively produces R-MP. Figure 3 illustrates a procedure for producing stereoisomer-enriched (R, R) -monatin from L-tryptophan using tryptophan racemase, a D-aminotransferase, and an R-specific aldolase.

Una selección para un triptófano racemasa se crea construyendo una cepa que requeriría una racemasa activa para el crecimiento. Un triptófano auxótrofo necesita una fuente de L-triptófano cuando crece en un medio mínimo. Complementar el medio con D-triptófano es una forma de seleccionar para una racemasa que convierte D-triptófano en L-triptófano. Los triptófanos auxótrofos se probaron para el crecimiento en un medio mínimo complementado con D-triptófano. Las cepas, CAG18455 y CAG18579 del centro Coli Genetic Stock Center y NRRL12264 (también lipA-, ADE3 lisogenizado y curado de su plásmido) no crecieron cuando se complementaron con D-triptófano pero crecieron cuando se las complementó con L-triptófano. La E. coli puede utilizarse como un organismo huésped pero también pueden utilizarse otros organismos huésped como levadura, otra bacteria u otros organismos eucariotas. Un triptófano auxótrofo (especialmente NRRL12264 (también llamado lipA, ADE3 lisogenizado y curado de su plásmido)) crecerá en D-triptófano cuando se haya transformado con una D-aminotransferasa. Esto confirma la capacidad de la E. coli de transportar D-triptófano en la célula. A selection for a tryptophan racemase is created by constructing a strain that would require an active racemase for growth. An auxotrophic tryptophan needs a source of L-tryptophan when it grows in minimal medium. Supplementing the medium with D-tryptophan is one way to select for a racemase that converts D-tryptophan to L-tryptophan. Auxotrophic tryptophans were tested for growth in minimal medium supplemented with D-tryptophan. The strains, CAG18455 and CAG18579 from the Coli Genetic Stock Center and NRRL12264 (also lipA-, lysogenized and cured ADE3 from their plasmid) did not grow when supplemented with D-tryptophan but grew when supplemented with L-tryptophan. E. coli can be used as a host organism but other host organisms such as yeast, other bacteria, or other eukaryotic organisms can also be used. An auxotrophic tryptophan (especially NRRL12264 (also called lipA, lysogenized ADE3 and cured from its plasmid)) will grow into D-tryptophan when it has been transformed with a D-aminotransferase. This confirms the ability of E. coli to transport D-tryptophan in the cell.

Saicher y Lingens describieron la presencia de un triptófano racemasa en Pseudomonas aeruginosa (ATCC 15926). La triptófano racemasa también ha sido descrito en varias plantas, que incluyen tabaco, remolacha, tomate, y trigo y la enzima parece estar inducida por condiciones de estrés o sequía osmótica. La triptófano racemasa puede desempeñar una función en Sclerochiton ilicifolius en la vía de producción de la monatina nativa. Para aislar esta actividad de racemasa, se construye una biblioteca de expresión a partir de ATCC15926 (u otro organismo con actividad de triptófano racemasa) y la biblioteca se transforma en el triptófano auxótrofo. Una cepa se selecciona para su cultivo utilizando D-triptófano como la fuente de triptófano. Un procedimiento similar también se utiliza para monitorear muchas cepas con racemasas conocidas para buscar una racemasa con actividad en D-triptófano. Los ejemplos incluyen: alanina, serina y glutamato racemasas (T. Yoshimura y N. Esaki, "Amino Acid Racemases: Functions and Mechanisms". Journal of Bioscience and Bioengineering, Vol. 96, No. 2, 103-109, 2003). La alanina racemasa es PLP dependiente y ha sido clonada de la Salmonella typhimurium (gen dadB). Otras fuentes incluyen Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe y Bacillus cereus. Un hongo basidiomiceto, Lentinus edodes, también contiene una alanina racemasa de amplia actividad. La serina racemasa también es PLP dependiente y se encuentra en eucariotas (como el ADNc del gusano de seda, cerebro de rata, cerebro de ratón) así como en bacterias (Enterococcus gallinarum). La glutamato racemasa es PLP independiente y ha sido clonada de Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. coli, Aquifex pyrophilus, y Bacillus subtilis. La glutamato racemasa es muy específica y por lo tanto, aún los aminoácidos aspartato, asparagina, y glutamina de estructura similar no son sustratos para la enzima. También existen aspartato racemasas y son independientes de PLP. Estas enzimas se encuentran en cepas de Lactobacilli, Streptococcus, y algunas archaeas como las cepas de Desulfurococcus y Thermococcus. El molusco bivalvo Scapharca brouhtonii también contiene una aspartato racemasa. Otras racemasas encontradas en la biblioteca incluyen aminoácido racemasa (EC 5.1.1.10) de Anabaena sp. y Pseudomonas striata, prolina racemasa, fenilalanina racemasa multifuncional. Las epimerasas o racemasas relacionadas también se prueban. Las racemasas potenciales se prueban para garantizar que no sean D-triptófano aminotransferasas. Este monitoreo se realiza mediante análisis de secuencia y/o un ensayo de enzimas. Saicher and Lingens described the presence of a tryptophan racemase in Pseudomonas aeruginosa (ATCC 15926). Tryptophan racemase has also been described in several plants, including tobacco, beets, tomatoes, and wheat, and the enzyme appears to be induced by stress conditions or osmotic drought. Tryptophan racemase may play a role in Sclerochiton ilicifolius in the native monatin production pathway. To isolate this racemase activity, an expression library is constructed from ATCC15926 (or another organism with tryptophan racemase activity) and the library is transformed into the auxotrophic tryptophan. A strain is selected for cultivation using D-tryptophan as the source of tryptophan. A similar procedure is also used to monitor many strains with known racemases for a racemase with D-tryptophan activity. Examples include: alanine, serine, and glutamate racemases (T. Yoshimura and N. Esaki, "Amino Acid Racemases: Functions and Mechanisms". Journal of Bioscience and Bioengineering, Vol. 96, No. 2, 103-109, 2003). Alanine racemase is PLP dependent and has been cloned from Salmonella typhimurium (dadB gene). Other sources include Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe, and Bacillus cereus. A basidiomycete fungus, Lentinus edodes, also contains a highly active alanine racemase. Serine racemase is also PLP dependent and is found in eukaryotes (such as the silkworm, rat brain, mouse brain cDNA) as well as bacteria (Enterococcus gallinarum). Glutamate racemase is PLP independent and has been cloned from Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. coli, Aquifex pyrophilus, and Bacillus subtilis. Glutamate racemase is very specific and therefore even amino acids aspartate, asparagine, and glutamine of similar structure are not substrates for the enzyme. Aspartate racemases also exist and are independent of PLP. These enzymes are found in strains of Lactobacilli, Streptococcus, and some archaeas such as the Desulfurococcus and Thermococcus strains. The bivalve mollusk Scapharca brouhtonii also contains an aspartate racemase. Other racemases found in the library include amino acid racemase (EC 5.1.1.10) from Anabaena sp. and Pseudomonas striata, proline racemase, multifunctional phenylalanine racemase. Related epimerases or racemases are also tested. Potential racemases are tested to ensure they are not D-tryptophan aminotransferases. This monitoring is done by sequence analysis and / or an enzyme assay.

Las enzimas que pasan la prueba como una racemasa se monitorean para verificar la actividad en la monatina como describe el Ejemplo 17. Idealmente, se obtiene una enzima que es muy específica para triptófano y tiene actividad de racemasa escasa o nula en la monatina. Enzymes that pass the test as a racemase are monitored to verify monatin activity as described in Example 17. Ideally, an enzyme is obtained that is highly specific for tryptophan and has little or no racemase activity in monatin.

Una triptófano racemasa también puede evolucionar y/o mejorar (mediante mutagénesis o ingeniería recombinante) a partir de una racemasa, una transaminasa o una epimerasa existente. Asimismo, dado que se conocen las estructuras de cristal para las alanina aminotransferasas, estas se pueden utilizar como base para una mutagénesis racional basada en la estructura. El proceso descrito anteriormente se utiliza como una selección inicial para la actividad de triptófano racemasa y como una pantalla para una mejor actividad. A tryptophan racemase can also evolve and / or improve (by mutagenesis or recombinant engineering) from an existing racemase, transaminase, or epimerase. Also, since crystal structures for alanine aminotransferases are known, they can be used as the basis for rational structure-based mutagenesis. The process described above is used as an initial screen for tryptophan racemase activity and as a screen for better activity.

Bibliotecas de triptófano racemasa Tryptophan racemase libraries

Construcción de bibliotecas: Library construction:

Se obtuvieron Burkholderia pyrrocina (ATCC15958) y Pseudomonas chlororaphis (ATCC15926) de la American Type Culture Collection. Se desarrollaron como sugiere la ATCC y se preparó el ADN genómico conforme al procedimiento de Mekalanos JJ. (Duplicación y amplificación de genes tóxicos en Vibrio cholerae. Cell. 1983. Burkholderia pyrrocina (ATCC15958) and Pseudomonas chlororaphis (ATCC15926) were obtained from the American Type Culture Collection. They were developed as suggested by ATCC and genomic DNA was prepared according to the Mekalanos JJ procedure. (Duplication and Amplification of Toxic Genes in Vibrio cholerae. Cell. 1983.

35:253-63). El ADN genómico fue parcialmente digerido con la enzima de restricción Sau3AI. Los fragmentos 1-3 Kbp se purificaron con gel utilizando un Kit de Extracción de Gel QIAquick de Qiagen (Qiagen, Valencia, CA). El ADN purificado se ligó en pTrc99a (Amersham, Piscataway, NJ) que había sido digerido con BamHI y purificado como se indicó anteriormente. La ligadura se realizó a temperatura ambiente con una incubación de 24 horas utilizando una proporción molar inserto-vector de 3:1. La biblioteca ligada se transformó en células químicamente competentes TOP10F (Invitrogen, Carlsbad, CA) y se colocó en una placa en un medio LB con 100 !g/ml de ampicilina. Después de la incubación durante 24 horas de las placas de transformación, las colonias se sacaron de las placas, se lavaron con el medio LB líquido y el sedimento celular de tamaño adecuado se preparó utilizando un kit miniprep QIAquick de Qiagen (Qiagen, Valencia, CA). Se reunieron y prepararon cerca de 30.000 colonias. 35: 253-63). Genomic DNA was partially digested with the restriction enzyme Sau3AI. Fragments 1-3 Kbp were gel purified using a Qiaquick Gel Extraction Kit from Qiagen (Qiagen, Valencia, CA). The purified DNA was ligated into pTrc99a (Amersham, Piscataway, NJ) which had been digested with BamHI and purified as indicated above. Ligation was performed at room temperature with a 24 hour incubation using a 3: 1 insert-vector molar ratio. The ligated library was transformed into chemically competent TOP10F cells (Invitrogen, Carlsbad, CA) and plated on LB medium with 100 µg / ml ampicillin. After 24 hour incubation of the transformation plates, colonies were removed from the plates, washed with liquid LB medium, and the appropriately sized cell pellet was prepared using a QIAquick miniprep kit from Qiagen (Qiagen, Valencia, CA ). About 30,000 colonies were assembled and prepared.

El plásmido reunido se transformó en CAG18455 (trpC83:Tn10, rph-1) o CAG18579 (trpC:Tn10kan, rph-1). Ambas cepas son triptófano auxótrofos por lo que no crecerán en un medio mínimo M9 (Difco) salvo que el medio se vea complementado con triptófano. Los transformantes se colocaron en placas en un medio mínimo M9 complementado con D-triptófano. Esto selecciona para una cepa que puede convertir D-triptófano en L-triptófano. The pooled plasmid was transformed into CAG18455 (trpC83: Tn10, rph-1) or CAG18579 (trpC: Tn10kan, rph-1). Both strains are tryptophan auxotrophs so they will not grow in a minimal M9 medium (Difco) unless the medium is complemented with tryptophan. Transformants were plated on M9 minimal medium supplemented with D-tryptophan. This selects for a strain that can convert D-tryptophan to L-tryptophan.

Antes de la transformación de la biblioteca, las cepas se probaron para verificar su crecimiento en un medio mínimo con L-triptófano o D-triptófano. Las cepas se probaron para verificar su crecimiento en un medio mínimo complementado con D-triptófano y no se observó crecimiento alguno. Ambas cepas crecieron en medios idénticos complementados con L-triptófano en lugar de D-triptófano. Asimismo, un derivado de NRRL12264 (la cepa utilizada había sido curada del plásmido de operón triptófano, lisogenizado con ADE3, y eliminado para lipA, junto con otras mutaciones cromosómicamente codificadas (serB, �trpED, tnaA2, aroP) (esta cepa no pudo crecer en un medio mínimo complementado con D-triptófano pero creció en un medio idéntico complementado con L-triptófano en lugar de D-triptófano) se transformó con una aminotransferasa D-específica de Bacillus subtilis (WO 03/091396). La expresión de la D-aminotransferasa fue impulsada por el promotor T7. La cepa transformada pudo crecer en un medio mínimo M9 complementado con D-triptófano. Before transformation of the library, the strains were tested for growth in minimal medium with L-tryptophan or D-tryptophan. The strains were tested for growth in minimal medium supplemented with D-tryptophan and no growth was observed. Both strains grew in identical media supplemented with L-tryptophan instead of D-tryptophan. Also, a derivative of NRRL12264 (the strain used had been cured from the tryptophan operon plasmid, lysogenized with ADE3, and removed for lipA, along with other chromosomally encoded mutations (serB, �trpED, tnaA2, aroP) (this strain was unable to grow in minimal medium supplemented with D-tryptophan but grew in identical medium supplemented with L-tryptophan instead of D-tryptophan) was transformed with a Bacillus subtilis specific D-aminotransferase (WO 03/091396). -aminotransferase was driven by the T7 promoter The transformed strain was able to grow in M9 minimal medium supplemented with D-tryptophan.

Se monitorean las colonias que crecen en el medio D-triptófano. El plásmido se aísla y vuelve a transformarse en una cepa madre (CAG18455 o CAG 18579) para confirmar que el crecimiento en un medio D-triptófano depende del plásmido y no de una mutación del huésped. Se analizan las secuencias nucleotídicas de los plásmidos que complementan el triptófano auxótrofo. Los clones que se considera que tienen un gen de triptófano racemasa son analizados con posterioridad. Colonies growing on D-tryptophan medium are monitored. The plasmid is isolated and transformed back into a mother strain (CAG18455 or CAG 18579) to confirm that growth in D-tryptophan medium depends on the plasmid and not on a host mutation. The nucleotide sequences of the plasmids that complement the auxotrophic tryptophan are analyzed. Clones considered to have a tryptophan racemase gene are subsequently analyzed.

La triptófano racemasa de otras fuentes de tejido se aísla en una forma similar. Existen informes de colección de la actividad de la triptófano racemasa tanto en células en cultivo de tejido de tabaco (Nicotiana tabacum L. var. Wisconsin 38) (Miura, G. A. and Mills, S. E. The conversion of D-tryptophan to L-tryptophan in cell cultures of tobacco. Plant Physiol. 1971 47:483-487) como en extractos proteicos crudos de trigo (Triticum aestivum) (Rekoslavskaya, N. I., Yur'eve, O. V., Shibanova, L. A., y Salyaev, R. K. Synthesis and physiological function of Dtryptophan during wheat germination. Russian Journal of Plant Physiology 1997. 44:196-203) Una biblioteca de expresión de ADNc se crea a partir de tejido, como se describe en la colección y la biblioteca de expresión se utiliza para transformar un triptófano auxótrofo como se describió anteriormente. Tryptophan racemase from other tissue sources is isolated in a similar way. There are collection reports of tryptophan racemase activity both in cells in tobacco tissue culture (Nicotiana tabacum L. var. Wisconsin 38) (Miura, GA and Mills, SE The conversion of D-tryptophan to L-tryptophan in cell cultures of tobacco. Plant Physiol. 1971 47: 483-487) as in crude protein extracts of wheat (Triticum aestivum) (Rekoslavskaya, NI, Yur'eve, OV, Shibanova, LA, and Salyaev, RK Synthesis and physiological function of Dtryptophan during wheat germination. Russian Journal of Plant Physiology 1997. 44: 196-203) A cDNA expression library is created from tissue, as described in the collection, and the expression library is used to transform an auxotrophic tryptophan as previously described.

Ensayo de triptófano racemasa Tryptophan racemase assay

Los clones que se identifican como aquellos que potencialmente tienen triptófano racemasa se transforman en una cepa de E. coli comúnmente utilizada para la expresión de proteínas recombinantes, como BL21. Las células se desarrollan en el caldo LB a una densidad óptica 600 nm de 0,4-0,6. El promotor que impulsa la expresión de la racemasa es inducido con IPTG (0,1 mM de concentración definitiva). Después de la inducción, las células pueden expresar la proteína por 1 a 3 horas a 37ºC (con aireación). Las células se cultivan y alisan mediante filtro de émbolo, sonicación o a través de medios químicos (como BugBuster (Novagen, Madison, WI)). Las células lisadas se centrifugan para eliminar los restos celulares. El extracto clarificado se utilizó directamente en los ensayos. Clones that are identified as those that potentially have tryptophan racemase are transformed into a strain of E. coli commonly used for the expression of recombinant proteins, such as BL21. The cells are grown in the LB broth at a 600nm optical density of 0.4-0.6. The promoter that drives the expression of the racemase is induced with IPTG (0.1 mM of final concentration). After induction, cells can express the protein for 1 to 3 hours at 37 ° C (with aeration). Cells are cultured and smoothed by plunger filter, sonication, or by chemical means (such as BugBuster (Novagen, Madison, WI)). The lysed cells are spun to remove cell debris. The clarified extract was used directly in the trials.

Se agregan las cantidades variables de extracto en una solución de forma tal que la concentración definitiva es 50 mM de fosfato de potasio (ph 7,0) y 2 mM de L-triptófano. Se agrega piridoxal-5'-fosfato a una concentración definitiva de 10 !M. Las muestras se incuban y posteriormente se analizan por LC/MS. La presencia de un pico de D-triptófano cuando solo se utiliza L-triptófano como un sustrato indica un resultado positivo. La concentración de Dtriptófano debería aumentar con el aumento del tiempo hasta que se alcanza un equilibrio y la tasa debería aumentar también con la concentración de proteína hasta que la concentración de enzima es suficientemente alta que ya no se satura con el sustrato. El D-triptófano también puede convertirse en L-triptófano como se indicó anteriormente. Variable amounts of extract are added in a solution such that the final concentration is 50mM potassium phosphate (pH 7.0) and 2mM L-tryptophan. Pyridoxal-5'-phosphate is added at a final concentration of 10 µM. The samples are incubated and subsequently analyzed by LC / MS. The presence of a D-tryptophan peak when only L-tryptophan is used as a substrate indicates a positive result. Dryptoptophan concentration should increase with increasing time until equilibrium is reached and the rate should also increase with protein concentration until the enzyme concentration is high enough that it is no longer saturated with the substrate. D-tryptophan can also be converted to L-tryptophan as indicated above.

Un gen complementario puede codificarse para una D-aminotransferasa. (Un "gen complementario" es un gen que, cuando se expresa, anula una mutación en un organismo. Por ejemplo, si un organismo tiene mutación nula en uno de los genes necesarios para la síntesis del triptófano por la célula, un gen complementario podría ser uno que, cuando se expresa, permite que la cepa crezca en un medio mínimo (es decir, sin triptófano). Esta reacción requiere un alfa-cetoácido como un a-cetoglutarato, oxalacetato, o piruvato como un aceptor amino. Estos compuestos probablemente estén presentes en un extracto celular (en cantidades pequeñas). Estos compuestos pueden eliminarse utilizando una columna desaladora PD-10 (GE Healthcare, Piscataway, NJ) y el ensayo aún puede realizarse en extracto crudo. La actividad de triptófano racemasa se purifica utilizando una cromatografía de columna convencional. Finalmente, el marco abierto de lectura identificado como un triptófano racemasa potencial se clona en un vector de expresión con una marca de afinidad. La triptófano racemasa potencial posteriormente se purifica mediante cromatografía por afinidad. En ambos casos, la proteína purificada se utiliza en ensayos de enzima básicamente como se describió anteriormente. A complementary gene can be encoded for a D-aminotransferase. (A "complementary gene" is a gene that, when expressed, cancels out a mutation in an organism. For example, if an organism has a zero mutation in one of the genes necessary for the synthesis of tryptophan by the cell, a complementary gene might be one that, when expressed, allows the strain to grow in minimal medium (ie, without tryptophan.) This reaction requires an alpha-keto acid as an α-ketoglutarate, oxalacetate, or pyruvate as an amino acceptor. are present in a cell extract (in small amounts) These compounds can be removed using a PD-10 desalination column (GE Healthcare, Piscataway, NJ) and the assay can still be run in crude extract. Tryptophan racemase activity is purified using a Conventional column chromatography Finally, the open reading frame identified as a potential tryptophan racemase is cloned into an expression vector with an affinity tag. The potential is subsequently purified by affinity chromatography. In both cases, the purified protein is used in enzyme assays basically as described above.

Ingeniería genética inversa de triptófano racemasa Reverse Genetic Engineering of Tryptophan Racemase

La triptófano racemasa puede purificarse de fuentes vegetales o microbianas mediante técnicas de purificación proteica tradicionales que incluyen el fraccionamiento de sulfato de amonio y la cromatografía de columna convencional. Una vez que la proteína se ha purificado de forma tal que un muestreo puede aislarse en un gel 2-D, se utilizan técnicas de microsecuencia de péptidos o de secuencias de aminoácido convencionales del tipo Edman (ver golgi.harvard.edu/microchem/ para las descripciones de protocolos y el equipo utilizado para este tipo de trabajo). Sin embargo, en algunos casos, la secuencia de genoma del organismo no puede utilizarse como una fuente de la proteína para la purificación de proteínas porque dicha secuencia no se ha determinado aún. En dicha situación, el primer grupo de cebadores degenerados puede diseñarse en base a una secuencia disponible del relativo conocido más cercano de la fuente de proteína. El PCR y el genoma degenerados se desarrollan posteriormente conforme a los protocolos establecidos para aislar la secuencia de codificación de la triptófano racemasa. Tryptophan racemase can be purified from plant or microbial sources by traditional protein purification techniques including ammonium sulfate fractionation and conventional column chromatography. Once the protein has been purified such that a sample can be isolated on a 2-D gel, conventional peptide microsequence or amino acid sequence techniques of the Edman type are used (see golgi.harvard.edu/microchem/ for descriptions of protocols and equipment used for this type of work). However, in some cases, the body's genome sequence cannot be used as a source of the protein for protein purification because that sequence has not yet been determined. In such a situation, the first set of degenerate primers can be designed based on an available sequence of the closest known relative of the protein source. The degenerate PCR and genome are subsequently developed according to established protocols to isolate the coding sequence of tryptophan racemase.

Producción de monatina triptófano racemasa Monatin tryptophan racemase production

Se incorporaron por cada 1 mL de mezcla de reacción: aproximadamente 60 !g de ProA aldolasa de C. testosteroni (proporcionada en extractos celulares como se indica en la patente WO 03/091396 A2), 100 !L/mL de extracto celular de triptófano racemasa o 1 mg/mL de triptófano racemasa purificada, 4 mM de MgCl2, 50 mM de L-triptófano, 0,5 mg de D-aminotransferasa de BioCatalytics (AT-103) (BioCatalytics, Pasadena, CA), 100 mM de piruvato de sodio, 100mM de tampón de fosfato de potasio con un pH de 7,5, 0,05 mM de PLP y 10 mM de a-cetoglutarato. Dado que el piruvato es un aceptor amino aceptable para la D-aminotransferasa de especificidad amplia, el acetoglutarato es opcional. Los experimentos se desarrollan por duplicado con controles negativos en donde no se incorpora aldolasa o triptófano racemasa. Las muestras se incuban por 1 hora o durante la noche (20 horas) a 30°C con una leve agitación. Incorporated for each 1 mL of reaction mixture: approximately 60 µg of C. testosteroni ProA aldolase (provided in cell extracts as indicated in patent WO 03/091396 A2), 100 µL / mL of tryptophan cell extract racemase or 1 mg / mL tryptophan purified racemase, 4 mM MgCl2, 50 mM L-tryptophan, 0.5 mg D-aminotransferase from BioCatalytics (AT-103) (BioCatalytics, Pasadena, CA), 100 mM pyruvate sodium, 100mM potassium phosphate buffer with a pH of 7.5, 0.05mM PLP and 10mM a-ketoglutarate. Since pyruvate is an acceptable amino acceptor for broad specificity D-aminotransferase, acetoglutarate is optional. The experiments are carried out in duplicate with negative controls where aldolase or tryptophan racemase is not incorporated. The samples are incubated for 1 hour or overnight (20 hours) at 30 ° C with slight shaking.

La triptófano racemasa se prueba para verificar la actividad en la monatina. Un ensayo similar al del Ejemplo 17 se utilizó con monatina como sustrato y se comparó con la actividad de la enzima en el triptófano. La enzima ideal tiene actividad en el triptófano pero tiene actividad escasa o nula en otros aminoácidos, especialmente, glutamato y monatina. Si la enzima tiene una actividad significativa en la monatina, la enzima se puede mutagenizar para disminuir la actividad en la monatina y/o en el glutamato a la vez que mantiene la actividad de triptófano intacta o a un nivel lo suficientemente alto para que la enzima sea útil en la producción de monatina. Las técnicas que se pueden utilizar para la mutagénesis incluyen, a modo no taxativo, PCR propenso a cometer errores, una mutagénesis de sitio dirigido, la modelación para identificar objetivos de la mutagénesis dirigida a sitio (sitios que pueden incluirse en la unión de sustrato), el pasaje a través de cepas mutagénicas y la transposición de ADN. Tryptophan racemase is tested to verify monatin activity. An assay similar to that of Example 17 was used with monatin as a substrate and compared with the activity of the enzyme in tryptophan. The ideal enzyme has activity in tryptophan but has little or no activity in other amino acids, especially glutamate and monatin. If the enzyme has significant monatin activity, the enzyme can be mutagenized to decrease monatin and / or glutamate activity while keeping tryptophan activity intact or at a level high enough for the enzyme to be useful in monatin production. Techniques that can be used for mutagenesis include, but are not limited to, error-prone PCR, site-directed mutagenesis, modeling to identify targets for site-directed mutagenesis (sites that can be included in substrate binding) , passage through mutagenic strains and DNA transposition.

Las racemasas mutagenizadas pueden monitorearse para verificar la actividad de triptófano utilizando un ensayo sobre placa como se describió anteriormente. Los clones que retienen actividad de triptófano se monitorean para verificar una pérdida de actividad en la monatina. Mutagenized racemases can be monitored to verify tryptophan activity using a plaque assay as described above. Clones that retain tryptophan activity are monitored for loss of activity in monatin.

Ejemplo 16 (no reivindicado) Example 16 (not claimed)

Mutagénesis dirigida a sitio de HEXAspC HEXAspC site-directed mutagenesis

Resumen experimental Experimental summary

Se encontró que el hexamutante de E. coli AspC (HEXaspC) tenía una mejor actividad en comparación con AspC para la producción de (S,S)-monatina como se describe en el ejemplo 6 de la WO 03/091396 A2. El HEX (número de acceso:/AHFA gi:127190) contiene las siguientes mutaciones de AspC (numeración para E. coli): V35L, K37Y, T43I, N64L, T104S y N285S. Con base en el análisis estructural y los informes de la bibliografía (S. Rothman y J. Kirsch, The E. coli AspC hexamutant (HEXaspC) was found to have better activity compared to AspC for the production of (S, S) -monatin as described in Example 6 of WO 03/091396 A2. The HEX (accession number: / AHFA gi: 127190) contains the following AspC mutations (numbering for E. coli): V35L, K37Y, T43I, N64L, T104S and N285S. Based on structural analysis and literature reports (S. Rothman and J. Kirsch,

J. Mol. Biol. (2003), 327, 593-608; S. Rothman et al., Protein Science (2004), 13: 763-772), se crearon 5 mutantes adicionales que se esperaba que aumentaran la actividad cinética de los sustratos utilizados en la vía de producción de la monatina: L-triptófano, S-MP o ambos. Dos de los mutantes aumentaron las velocidades de transaminación para el triptófano y la (S,S)-monatina. Dos de los mutantes mostraron una mayor estereoselectividad para la formación de (S,S)-monatina mientras que uno era menos estereoselectivo. Con base en esto, se espera que la Daminotransferasa de amplia especificidad de Bacillus sp. que tiene mutaciones similares sea útil como la Daminotransferasa en las víass de (R,R)-monatina mostradas en la figura 3 y descritas en el ejemplo 15. Uno de los mutantes (HEXaspCP9T/R122G) presentó una actividad superior para la transaminación del L-triptófano, pero la actividad en la producción de (S,S)-monatina o en la transaminación de (S,S)-monatina disminuyó significativamente. Por consiguiente, se espera que esta enzima sea útil en la primera etapa de las vías de J. Mol. Biol. (2003), 327, 593-608; S. Rothman et al., Protein Science (2004), 13: 763-772), 5 additional mutants were created that were expected to increase the kinetic activity of the substrates used in the monatin production pathway: L-tryptophan, S-MP or both. Two of the mutants increased transamination rates for tryptophan and (S, S) -monatin. Two of the mutants showed increased stereoselectivity for (S, S) -monatin formation while one was less stereoselective. Based on this, the broad specificity Daminotransferase of Bacillus sp. having similar mutations is useful as Daminotransferase in the (R, R) -monatin pathways shown in Figure 3 and described in Example 15. One of the mutants (HEXaspCP9T / R122G) exhibited superior activity for transamination of L -tryptophan, but the activity in the production of (S, S) -monatin or in the transamination of (S, S) -monatin decreased significantly. Therefore, this enzyme is expected to be useful in the first stage of the pathways of

producción de la (R,R)-monatina mostradas en las figuras 1, 2, 4, 5, 6, 7 y 8 y descritas en los ejemplos 18 y 19. En general, la aminotransferasa que presenta una actividad similar a la de AspC sobre el L-triptófano y una actividad limitada sobre R-MP y S-MP sería útil para los procesos descritos en las figuras 1, 2, 4, 5, 6, 7 y 8. production of the (R, R) -monatin shown in Figures 1, 2, 4, 5, 6, 7 and 8 and described in Examples 18 and 19. In general, aminotransferase exhibiting an activity similar to that of AspC on L-tryptophan and limited activity on R-MP and S-MP would be useful for the processes described in Figures 1, 2, 4, 5, 6, 7 and 8.

Procedimientos y materiales Procedures and materials

El gen HEX clonado en pUC19 fue proporcionado por el profesor J. F. Kirsch (Departamento de Biología Molecular y Celular, Universidad de California, Berkeley, Berkeley, California 94720-3206) y se utilizó como la plantilla para la clonación del gen en pET23a. Véase James J. Onuffer y Jack F. Kirsch, Redesign of the substrate specificity of Escherichia coli aspartate aminotransferase to that of Escherichia coli tyrosine aminotransferase by homology modeling and site-directed mutagenesis, Protein Science, 4: 1750-1757 (1995). Véase también NCBI número de acceso 1AHF_A GI:1127190 (secuencia de aminoácido HEX). Se diseñaron los siguientes cebadores para clonar el gen HEX en el vector pET23a (Novagen, Madison, WI.): The HEX gene cloned into pUC19 was provided by Professor J. F. Kirsch (Department of Molecular and Cellular Biology, University of California, Berkeley, Berkeley, California 94720-3206) and used as the template for cloning the gene into pET23a. See James J. Onuffer and Jack F. Kirsch, Redesign of the substrate specificity of Escherichia coli aspartate aminotransferase to that of Escherichia coli tyrosine aminotransferase by homology modeling and site-directed mutagenesis, Protein Science, 4: 1750-1757 (1995). See also NCBI accession number 1AHF_A GI: 1127190 (HEX amino acid sequence). The following primers were designed to clone the HEX gene into the pET23a vector (Novagen, Madison, WI.):

Cebadores HEXaspC: HEXaspC primers:

'' ''

Terminal C: 5'-ATAACCGGATCCTTACAGCACTGCCACAATCG-3' (SEQ ID NO: 394) Terminal C: 5'-ATAACCGGATCCTTACAGCACTGCCACAATCG-3 '(SEQ ID NO: 394)

Se utilizó el siguiente protocolo de PCR para la amplificación de genes: En una reacción de 100 !L, se agregó 50 ng de plantilla de ADN, 1,0 !M de cada cebador, 0,2 mM de cada dNTP, 1 U Pfu Turbo Polimerasa (Stratagene, La Jolla, CA), y plantilla Pfu clonada una vez. El programa del termociclador utilizó un comienzo en caliente a 94ºC durante 5 minutos; seguido de 25 ciclos de una etapa desnaturalización a 94ºC (30 segundos), una etapa de recocido a 55ºC (1 minuto) y una etapa de extensión a 72ºC (2 minutos) y finalmente una etapa de acabado a 72ºC (7 minutos). Se utilizaron las técnicas de biología molecular estándar para clonar el producto de la PCR en pET23a mediante el uso de sitios de restricción NdeI y BamHI. The following PCR protocol was used for gene amplification: In a 100 µL reaction, 50 ng of DNA template was added, 1.0 µM of each primer, 0.2 mM of each dNTP, 1 U Pfu Turbo Polymerase (Stratagene, La Jolla, CA), and Pfu template cloned once. The thermocycler program used a warm start at 94 ° C for 5 minutes; followed by 25 cycles of a denaturation stage at 94ºC (30 seconds), an annealing stage at 55ºC (1 minute) and an extension stage at 72ºC (2 minutes) and finally a finishing stage at 72ºC (7 minutes). Standard molecular biology techniques were used to clone the PCR product into pET23a using the NdeI and BamHI restriction sites.

Se piensa que el residuo de triptófano en la posición 130 es importante para juntar las interacciones con el anillo de piridoxilo, pero además parece ser una fuente de impedimento estérico con el sustrato del precursor de S-monatina (MP), con base en las observaciones de modelado de proteína. Por consiguiente, se utilizó un aminoácido con una cadena lateral hidrófoba más pequeña (fenilalanina) para reemplazar al triptófano. El resto de las mutaciones se basó en los datos de cinética en la bibliografía, a pesar de que se crearon nuevas combinaciones de mutaciones deseables. Todas las mutaciones a HEXaspC, con la excepción de W130F, se realizaron mediante el uso del kit Multi-Change de Stratagene (Stratagene, La Jolla, CA) de acuerdo con las instrucciones del fabricante. La mutación de W130F se realizó mediante el uso del kit QuikChange de Stratagene (Stratagene, La Jolla, CA) de conformidad con las instrucciones del fabricante con la única excepción de que la temperatura de extensión para la reacción de PCR disminuyó a 66ºC. Los cebadores para el kit multi-change (multicambio) se diseñaron mediante el uso de la herramienta de diseño de cebadores multi-kit QuikChange en <www.stratagene.com>, excepto para los cebadores de mutación simple W130F. The tryptophan residue at position 130 is thought to be important in binding interactions with the pyridoxyl ring, but also appears to be a source of steric hindrance to the S-monatin precursor (MP) substrate, based on observations of protein modeling. Therefore, an amino acid with a smaller hydrophobic side chain (phenylalanine) was used to replace tryptophan. The rest of the mutations were based on kinetic data in the literature, although new combinations of desirable mutations were created. All mutations to HEXaspC, with the exception of W130F, were made using the Stratagene Multi-Change Kit (Stratagene, La Jolla, CA) according to the manufacturer's instructions. The W130F mutation was performed using the QuikChange kit from Stratagene (Stratagene, La Jolla, CA) in accordance with the manufacturer's instructions with the sole exception that the extension temperature for the PCR reaction decreased to 66 ° C. The primers for the multi-change kit (multi-change) were designed using the QuikChange multi-kit primer design tool at <www.stratagene.com>, except for the W130F single mutation primers.

Las secuencias de cebadores se enumeran a continuación en la tabla 20. Primer sequences are listed below in Table 20.

Tabla 20 Table 20

Cebador Primer
Secuencia (5’ a 3’) Sequence (5 ’to 3’)

aspCW130F_hacia atrás aspCW130F_backward
CGCTCTTATGGTTCGGTTTGCTTGGGTTGCTCACCC (SEQ ID NO: 395) CGCTCTTATGGTTCGGTTTGCTTGGGTTGCTCACCC (SEQ ID NO: 395)

aspCW130F_hacia adelante aspCW130F_forward
GGGTGAGCAACCCAAGCTTTCCGAACCATAAGAGCG (SEQ ID NO: 396) GGGTGAGCAACCCAAGCTTTCCGAACCATAAGAGCG (SEQ ID NO: 396)

R122G-1aR122G-1a
CAAAAAATACCAGCGTTAAGGGAGTGTGGGTGAGCAACC (SEQ ID NO: 397)  CAAAAAATACCAGCGTTAAGGGAGTGTGGGTGAGCAACC (SEQ ID NO: 397)

P9T_4aP9T_4a
CATTACCGCCGCTACTGCCGACCCGATTC (SEQ ID NO: 398)  CATTACCGCCGCTACTGCCGACCCGATTC (SEQ ID NO: 398)

I68V-1aI68V-1a
CACCAAAAATTACCTCGGCGTAGACGGCATCCCTGAATT (SEQ ID NO: 399)  CACCAAAAATTACCTCGGCGTAGACGGCATCCCTGAATT (SEQ ID NO: 399)

T156AaT156Aa
TGATGCGGAAAATCACGCTCTTGACTTCGATGCAC (SEQ ID NO: 400)  TGATGCGGAAAATCACGCTCTTGACTTCGATGCAC (SEQ ID NO: 400)

aDenota un cebador que se modificó mediante fosforilación 5' aDenotes a primer that was modified by 5 'phosphorylation

Expresión de los genes mutantes HEXaspC y análisis de la actividad enzimática Expression of HEXaspC mutant genes and analysis of enzyme activity

Se inocularon los cultivos líquidos (5 mL) del sistema de autoinducción 2 Novagen Overnight Express™ (Catálogo #71366-3; soluciones 1-6) (Novagen, Madison, WI) de las placas frescas o de las reservas de glicerol congeladas de las siguientes cepas: Liquid cultures (5 mL) of the Novagen Overnight Express ™ Autoinduction System 2 (Catalog # 71366-3; Solutions 1-6) (Novagen, Madison, WI) were inoculated from the fresh plates or from the frozen glycerol stocks of the following strains:

E. coli BL21(DE3)::HEXaspCpET23a E. coli BL21 (DE3) :: HEXaspCpET23a

E. coli BL21(DE3)::HEXaspCW130FpET23a E. coli BL21 (DE3) :: HEXaspCW130FpET23a

E. coli BL21(DE3)::HEXaspCT156ApET23a E. coli BL21 (DE3) :: HEXaspCT156ApET23a

E. coli BL21(DE3)::HEXaspCP9T/T156ApET23a E. coli BL21 (DE3) :: HEXaspCP9T / T156ApET23a

E. coli BL21(DE3)::HEXaspCP9T/R122GpET23a E. coli BL21 (DE3) :: HEXaspCP9T / R122GpET23a

E. coli BL21(DE3)::HEXaspCR122G/T156ApET23a. E. coli BL21 (DE3) :: HEXaspCR122G / T156ApET23a.

Los cultivos se incubaron a 37ºC a 230 rpm durante 6 a 8 horas. Se determinó la OD600 de cada cultivo y se calculó el volumen de cultivo necesario para obtener una OD600 de 0,03 a 0,05 en 25 mL. Los volúmenes calculados de cada cultivo líquido se transfirieron a matraces que contenían 25 mL del mismo medio. El sistema de autoinducción 2 Overnight Express™ es un medio completo, químicamente definido para la expresión de alto nivel con sistemas de expresión inducidos por IPTG que utilizan la lactosa como agente de inducción y no requieren el control del crecimiento celular. Los cultivos de Overnight Express se incubaron a 30ºC con agitación a 230 rpm durante 18 horas. Las células se cosecharon mediante centrifugación y se lavaron una vez con MOPS frío 50 mM, pH 7,0. A continuación, las células se lisaron mediante el uso de Bugbuster™ (libre de amina primaria) Reactivo de extracción (Novagen Catálogo #70923-3) (Novagen, Madison, WI) que contenía 1 !L/mL de benzonasa nucleasa (Novagen Catálogo #70746-3) (Novagen, Madison, WI), 5 !L/mL de Cóctel de inhibidores de proteasa grupo II (Novagen Catálogo #539132) (Novagen, Madison, WI) y 0,33 !L/10 mL r-Lisozima (Novagen Catálogo #71110-3) (Novagen, Madison, WI) de acuerdo con el protocolo recomendado de Novagen. Después de la incubación a 25ºC durante 15 minutos con agitación suave, los restos celulares de cada suspensión se sedimentaron mediante centrifugación a The cultures were incubated at 37 ° C at 230 rpm for 6 to 8 hours. The OD600 of each culture was determined and the volume of culture necessary to obtain an OD600 of 0.03 to 0.05 in 25 mL was calculated. The calculated volumes of each liquid culture were transferred to flasks containing 25 mL of the same medium. The Overnight Express ™ Autoinduction System 2 is a comprehensive, chemically defined medium for high level expression with IPTG-induced expression systems that use lactose as an induction agent and do not require control of cell growth. Overnight Express cultures were incubated at 30 with shaking at 230 rpm for 18 hours. Cells were harvested by centrifugation and washed once with cold 50 mM MOPS, pH 7.0. Cells were then lysed using Bugbuster ™ (Primary Amine Free) Extraction Reagent (Novagen Catalog # 70923-3) (Novagen, Madison, WI) containing 1 µL / mL benzase nuclease (Novagen Catalog # 70746-3) (Novagen, Madison, WI), 5 µL / mL Group II Protease Inhibitor Cocktail (Novagen Catalog # 539132) (Novagen, Madison, WI) and 0.33 µL / 10 mL r- Lysozyme (Novagen Catalog # 71110-3) (Novagen, Madison, WI) according to Novagen's recommended protocol. After incubation at 25 ° C for 15 minutes with gentle shaking, the cell debris from each suspension was pelleted by centrifugation at

21.000 g durante 15 minutos a 4ºC. El sobrenadante se decantó cuidadosamente y se analizó como el extracto libre de células. Las fracciones de cuerpo de inclusión se aislaron mediante la suspensión de las fracciones de restos celulares en un 30% de reactivo de extracción Bugbuster™ (libre de amina primaria), la centrifugación a 21.000×g durante 10 minutos; la suspensión de los gránulos centrifugados en un 10% de reactivo de extracción Bugbuster™ (libre de amina primaria), y la centrifugación nuevamente para aislar los gránulos lavados. Los extractos libres de células y las fracciones de cuerpo de inclusión se analizaron para verificar la expresión de proteínas por SDS-PAGE sobre geles con gradiente del 4 al 15% (BioRad # 161-1104, Hercules, CA). Para las muestras de extracto celular, se cargaron veinte microgramos de proteína soluble en cada ruta de gel (mezcladas previamente con tampón de carga de proteínas 1× y calentadas a 95ºC durante 5 minutos). Las fracciones de cuerpo de inclusión se disolvieron en tampón de carga de proteínas 1× (0,2 mL), se calentaron durante 10 minutos a 95ºC y se cargaron 5 !L de cada solución por ruta de gel. Se calculó la cantidad de cada mutante HEX en comparación con la proteína soluble total cargada en cada ruta mediante análisis de intensidad de banda con el uso de la herramienta de gel 1D de Labworks BioImaging (UVP, Inc. Upland, CA) y se informa a continuación: 21,000 g for 15 minutes at 4ºC. The supernatant was carefully decanted and analyzed as the cell-free extract. The inclusion body fractions were isolated by suspending the cell debris fractions in 30% Bugbuster ™ Extraction Reagent (primary amine free), centrifugation at 21,000 × g for 10 minutes; suspension of the centrifuged granules in 10% Bugbuster ™ extraction reagent (primary amine free), and centrifugation again to isolate the washed granules. Cell-free extracts and inclusion body fractions were analyzed to verify protein expression by SDS-PAGE on 4 to 15% gradient gels (BioRad # 161-1104, Hercules, CA). For cell extract samples, twenty micrograms of soluble protein was loaded into each gel pathway (pre-mixed with 1 × protein loading buffer and heated at 95 ° C for 5 minutes). The inclusion body fractions were dissolved in 1 × protein loading buffer (0.2 mL), heated for 10 minutes at 95 ° C, and 5 µL of each solution was loaded per gel route. The amount of each HEX mutant compared to the total soluble protein loaded in each pathway was calculated by band intensity analysis using the Labworks BioImaging 1D gel tool (UVP, Inc. Upland, CA) and reported to continuation:

Tabla 21 Table 21

Muestra Shows
proteína HEXaspC/ total proteína soluble HEXaspC protein / total soluble protein

E. coli BL21(DE3)::HEXaspCP9T/T156ApET23a CFE E. coli BL21 (DE3) :: HEXaspCP9T / T156ApET23a CFE
0,310 0.310

E. coli BL21(DE3)::HEXaspCP9T/R122ApET23a CFE E. coli BL21 (DE3) :: HEXaspCP9T / R122ApET23a CFE
0,145 0.145

E. coli BL21(DE3)::HEXaspCpET23a CFE E. coli BL21 (DE3) :: HEXaspCpET23a CFE
0,172 0.172

E. coli BL21(DE3)::HEXaspCR122A/T156ApET23a CFE E. coli BL21 (DE3) :: HEXaspCR122A / T156ApET23a CFE
0,174 0.174

E. coli BL21(DE3)::HEXaspCW130FpET23a CFE E. coli BL21 (DE3) :: HEXaspCW130FpET23a CFE
0,114 0.114

Muestra Shows
proteína HEXaspC/proteína soluble total HEXaspC protein / soluble protein  total

E. coli BL21(DE3)::HEXaspCT156ApET23a CFE E. coli BL21 (DE3) :: HEXaspCT156ApET23a CFE
0,120 0.120

El análisis de los geles mostró que el mutante HEXaspCR122A/T156A fue la única proteína que se encontró en cantidades sustanciales como cuerpos de inclusión. La proteína HEXaspCP9T/T156A proporcionó el nivel de expresión más alto, aproximadamente un 90% mejor que la proteína HEXaspC. Por el contrario, las proteínas W130F, T156A y P9T/R122G se expresaron en concentraciones inferiores a la HEXaspC. Analysis of the gels showed that the HEXaspCR122A / T156A mutant was the only protein found in substantial amounts as inclusion bodies. The HEXaspCP9T / T156A protein provided the highest level of expression, approximately 90% better than the HEXaspC protein. In contrast, W130F, T156A, and P9T / R122G proteins were expressed at lower concentrations than HEXaspC.

La actividad de las proteínas mutantes HEXaspC para la producción de S,S-monatina se midió mediante el uso de las siguientes condiciones de reacción: Cada 1 mL de reacción contenía 50 mM de TAPS, pH 8,2, 4 mM de MgCl2, 3 mM de fosfato de sodio, pH 8,0, 200 mM de piruvato de sodio (pH ajustado a 8), 5 mM de a-cetoglutarato (pH ajustado a 8), 50 mM de triptófano, 0,05 mM de piridoxal 3-fosfato, 50 !g/mL de ProA aldolasa (agregada como un extracto libre de células) y concentraciones variables (aproximadamente 50 y 500 !g/mL) de aminotransferasa (agregada como un extracto libre de células). Se utilizó agua desaireada para preparar las soluciones madre y para ajustar el volumen de las mezclas de reacción a 1,0 mL. Se agregó fosfato piroxidal justo antes de la adición de las enzimas. Los tubos de reacción se incubaron a 30ºC con leve agitación durante 4 horas. Las muestras (0,01 mL) se retiraron a las 1, 2 y 4 horas después de la adición de las enzimas, se filtraron y se analizaron mediante LC/MS/MS, como se describe en el ejemplo 1. La producción de monatina se normalizó con base en la cantidad de aminotransferasa presente en las reacciones. En las condiciones de estos ensayos, la HEXaspC y la HEXaspCT156A produjeron la mayor cantidad de monatina por mg de aminotransferasa mientras que la proteína P9T/R122G produjo la menor, seguida por la HEXaspCW130F. Las enzimas HEXaspCW130F y P9T/R122G mostraron la mayor estereoselectividad para S-MP (mayor que un 98% de S,S-monatina), incluso cuando se utilizaron altas concentraciones de enzimas (mayores que 300 !g/mL). El porcentaje de producto de S,S-monatina disminuyó a menos de un 90% en las reacciones enzimáticas que contenían la enzima P9T/T156A en una concentración elevada. Los otros mutantes mostraron una estereoselectividad de producto muy similar al mutante HEXaspC original (aproximadamente 95% de S,S-monatina). El análisis del producto de la reacción que contenía la enzima HEXaspC mediante el uso del reactivo de derivatización de la FDAA descrito en el ejemplo 1 mostró que el segundo estereoisómero formado fue la R,S-monatina. The activity of the HEXaspC mutant proteins for the production of S, S-monatin was measured using the following reaction conditions: Each 1 mL of reaction contained 50 mM TAPS, pH 8.2, 4 mM MgCl2, 3 mM sodium phosphate, pH 8.0, 200 mM sodium pyruvate (pH adjusted to 8), 5 mM a-ketoglutarate (pH adjusted to 8), 50 mM tryptophan, 0.05 mM pyridoxal 3- phosphate, 50 µg / mL ProA aldolase (added as a cell-free extract) and varying concentrations (approximately 50 and 500 µg / mL) of aminotransferase (added as a cell-free extract). Deaerated water was used to prepare the stock solutions and to adjust the volume of the reaction mixtures to 1.0 mL. Pyroxidal phosphate was added just prior to the addition of the enzymes. Reaction tubes were incubated at 30 ° C with gentle shaking for 4 hours. Samples (0.01 mL) were removed at 1, 2, and 4 hours after addition of the enzymes, filtered, and analyzed by LC / MS / MS, as described in Example 1. Monatin production it was normalized based on the amount of aminotransferase present in the reactions. Under the conditions of these assays, HEXaspC and HEXaspCT156A produced the highest amount of monatin per mg aminotransferase while P9T / R122G protein produced the lowest, followed by HEXaspCW130F. The HEXaspCW130F and P9T / R122G enzymes showed the highest stereoselectivity for S-MP (greater than 98% S, S-monatin), even when high concentrations of enzymes (greater than 300 µg / mL) were used. The percentage of S, S-monatin product decreased to less than 90% in the enzymatic reactions containing the enzyme P9T / T156A in a high concentration. The other mutants showed very similar product stereoselectivity to the original HEXaspC mutant (approximately 95% S, S-monatin). Analysis of the reaction product containing the HEXaspC enzyme using the FDAA derivatization reagent described in Example 1 showed that the second stereoisomer formed was R, S-monatin.

Ensayo de la actividad de la aminotransferasa de triptófano y monatina Assay of tryptophan and monatin aminotransferase activity

Los mutantes se probaron para verificar la actividad de transaminación mediante el uso de (S,S)-monatina y Ltriptófano como sustratos. La actividad de la aminotransferasa se midió mediante el seguimiento de la formación del coproducto de la reacción, glutamato, por HPLC con derivatización post columna con OPA como se describe en el ejemplo 1. La mezcla de reacción contenía, en 1,0 mL, 100 mM de tampón HEPPS, pH 8,0, 20 mM de alfacetoglutarato, 0,08 mM de piridoxal fosfato, 25 mM de triptófano o (S,S)-monatina y enzima (proporcionado como 2,5 mg de proteína de extractos celulares). Todos los componentes excepto la enzima se mezclaron juntos, la enzima se agregó para comenzar la reacción y la solución de reacción se incubó a 30ºC (agitación suave) durante 90 minutos. Las reacciones se realizaron por duplicado, con controles negativos donde no se agregaron enzimas. La reacción se detuvo mediante la adición de un 10% de ácido fórmico (concentración final), la mezcla se centrifugó a 21.000 rpm y el sobrenadante se extrajo cuidadosamente y se filtró. Los datos se corrigieron para los niveles de fondo de glutamato y para la dilución desde la adición de ácido para precipitar las proteínas, después se normalizaron por la cantidad de aminotransferasa mutante agregada. Cuando se utilizó triptófano como sustrato, el HEXaspC produjo 13,0 mM de glutamato por mg de aminotransferasa por hora. La actividad relativa, expresada como porcentaje de los mutantes es la siguiente: HEXaspCW130F (156%), HEXaspCT156A (151%), HEXaspCP9T/T156A (63,7%), HEXaspCP9T/R122G (116%) y HEXaspCR122G/T156A (107%). Cuando se utilizó (S,S)-monatina como sustrato, el HEXaspC produjo 7,43 mM de glutamato por mg de aminotransferasa por hora. La actividad relativa, expresada como porcentaje de los mutantes es la siguiente: HEXaspCW130F (113%), HEXaspCT156A (87,7%), HEXaspCP9T/T156A (67,3%), HEXaspCP9T/R122G (11,2%) y HEXaspCR122G/T156A (114%). Mutants were tested to verify transamination activity by using (S, S) -monatin and L-tryptophan as substrates. Aminotransferase activity was measured by monitoring the formation of the reaction co-product, glutamate, by HPLC with post-column derivatization with OPA as described in Example 1. The reaction mixture contained, in 1.0 mL, 100 mM HEPPS buffer, pH 8.0, 20 mM alpha-ketoglutarate, 0.08 mM pyridoxal phosphate, 25 mM tryptophan or (S, S) -monatin and enzyme (provided as 2.5 mg protein from cell extracts) . All components except the enzyme were mixed together, the enzyme was added to start the reaction, and the reaction solution was incubated at 30 ° C (gentle shaking) for 90 minutes. Reactions were performed in duplicate, with negative controls where no enzymes were added. The reaction was stopped by the addition of 10% formic acid (final concentration), the mixture was centrifuged at 21,000 rpm, and the supernatant was carefully removed and filtered. Data were corrected for background glutamate levels and for dilution from addition of acid to precipitate proteins, then normalized by the amount of mutant aminotransferase added. When tryptophan was used as a substrate, HEXaspC produced 13.0 mM glutamate per mg aminotransferase per hour. The relative activity, expressed as a percentage of the mutants, is as follows: HEXaspCW130F (156%), HEXaspCT156A (151%), HEXaspCP9T / T156A (63.7%), HEXaspCP9T / R122G (116%) and HEXaspCR122G / T156A (107%) ). When (S, S) -monatin was used as the substrate, HEXaspC produced 7.43 mM glutamate per mg aminotransferase per hour. The relative activity, expressed as a percentage of the mutants, is as follows: HEXaspCW130F (113%), HEXaspCT156A (87.7%), HEXaspCP9T / T156A (67.3%), HEXaspCP9T / R122G (11.2%) and HEXaspCR122G / T156A (114%).

El mutante HEXaspCP9T/R122G presentó una actividad superior para la conversión de triptófano a indol-3-piruvato, pero una actividad inferior para la transaminación de (S,S)-monatina. La proporción de triptófano para la actividad de monatina fue de 18,2 en comparación con 1,75 para HEXaspC, lo que lo hizo un candidato deseable para la producción de (R,R)-monatina con el uso de vías que requieren una L-aminotransferasa como las descritas en los ejemplos 18 y 19. Como tal, el HEXaspCP9T/R122G es un ejemplo de una aminotransferasa con actividad limitada sobre la (S,S)-monatina (y MP). The HEXaspCP9T / R122G mutant exhibited superior activity for the conversion of tryptophan to indole-3-pyruvate, but inferior activity for transamination of (S, S) -monatin. The tryptophan ratio for monatin activity was 18.2 compared to 1.75 for HEXaspC, making it a desirable candidate for the production of (R, R) -monatin with the use of pathways that require an L -aminotransferase as described in Examples 18 and 19. As such, HEXaspCP9T / R122G is an example of an aminotransferase with limited activity on (S, S) -monatin (and MP).

La mayoría de las mutaciones mejoró la actividad del L-triptófano, pero únicamente dos mutantes aumentaron la actividad del L-triptófano y la (S,S)-monatina (HEXaspCW130F y HEXaspCR122G/T156A). Debido a que 25 mM del sustrato se utilizó en estos ensayos, es más probable que las enzimas estuvieran saturadas y la actividad es una reflexión de kcat de las enzimas. No obstante, en las condiciones en las que se realizaron los ensayos para la producción de la (S,S)-monatina (anteriormente) es improbable que la concentración de S-MP sea suficiente para saturar la enzima, por consiguiente, no se refleja el aumento en kcat. Se ha informado que, para sustratos similares, que algunas de las mutaciones hicieron aumentar la kcat pero también aumentaron la Km aparente para el sustrato de aminoácido. Al utilizar el aumento de las concentraciones de los sustratos, se espera que estos dos mutantes proporcionen un beneficio en las tasas de producción de (S,S)-monatina en comparación con HEXaspC. La mutación de HEXaspCT156A parece tener tasas de transaminación de triptófano superiores sin tener un efecto significativo sobre la tasa de transaminación de MP en las condiciones anteriores para la producción de (S,S)monatina. Most mutations improved L-tryptophan activity, but only two mutants increased L-tryptophan activity and (S, S) -monatin (HEXaspCW130F and HEXaspCR122G / T156A). Because 25 mM of the substrate was used in these assays, the enzymes are more likely to be saturated and the activity is a kcat reflection of the enzymes. However, under the conditions under which the tests for the production of (S, S) -monatin (previously) were carried out, it is unlikely that the concentration of S-MP is sufficient to saturate the enzyme, therefore, it is not reflected the increase in kcat. It has been reported that, for similar substrates, that some of the mutations increased kcat but also increased the apparent Km for the amino acid substrate. By using increased concentrations of the substrates, these two mutants are expected to provide a benefit in (S, S) -monatin production rates compared to HEXaspC. The HEXaspCT156A mutation appears to have higher tryptophan transamination rates without having a significant effect on the MP transamination rate under the above conditions for monatin (S, S) production.

Mediante la comparación de las estructuras de HEXaspC y una de las enzimas de D-aminotransferasa de Bacillus sp. (ver, por ejemplo, S. Sugio, G. A. Petsko, J. M. Manning, K. Soda, y D. Ringe, Biochemistry 34 (1995) pp. 9661-9669), pueden trazarse las mutaciones W130F, R122G, T156A y HEX de AspC para los residuos correspondientes en la estructura de D-aminotransferasa. Se espera que mutaciones similares en la Daminotransferasa de amplia especificidad mejoren la producción global de (R,R)-monatina como se describe en el ejemplo 14. Por ejemplo, la funcionalidad proporcionada por el triptófano 130 en AspC es reemplazada por Daminotransferasas en Bacillus mediante enlace de hidrógeno entre las cadenas laterales de las serinas 179 a 181 y glutamato 166 (esquema de numeración YM-1). Para disminuir el impedimento estérico, puede mutarse el glutamato a un residuo de aspartato. Algunas D-aminotransferasas presentan un residuo de treonina en la posición 179, lo que aumentaría el impedimento estérico y debería evitarse. La enzima de B. sphearicus tiene una alanina en lugar de una serina en la posición 181, que también puede reducir el impedimento estérico. By comparing the structures of HEXaspC and one of the Bacillus sp. D-aminotransferase enzymes. (see, eg, S. Sugio, GA Petsko, JM Manning, K. Soda, and D. Ringe, Biochemistry 34 (1995) pp. 9661-9669), the W130F, R122G, T156A and HEX mutations of AspC can be traced for the corresponding residues in the D-aminotransferase structure. Similar broad-specific Daminotransferase mutations are expected to improve overall production of (R, R) -monatin as described in Example 14. For example, the functionality provided by tryptophan 130 in AspC is replaced by Daminotransferases in Bacillus by hydrogen bonding between the side chains of serines 179 to 181 and glutamate 166 (numbering scheme YM-1). To decrease steric hindrance, glutamate can be mutated to an aspartate residue. Some D-aminotransferases have a threonine residue at position 179, which would increase steric hindrance and should be avoided. The B. sphearicus enzyme has an alanine instead of a serine at position 181, which can also reduce steric hindrance.

La información adicional de los estudios de la aspartato aminotransferasa también puede aplicarse a la Daminotransferasa. Mientras que la enzima AspC tiene una arginina en el sitio activo que interactúa con la cadena lateral de los sustratos de dicarboxilato, la D-aminotransferasa tiene un asa de Ser240 a Ser243. Las cadenas laterales de Ser240, Tr242 y Ser243 siguen la misma dirección y forman un bolsillo con el grupo hidroxilo de Ser180 que proporciona una superficie para que los sustratos no polares y polares puedan interactuar. La Ser180 se encuentra implicada en la unión de PLP; no obstante, para mejorar la actividad de una D-aminotransferasa con R-MP, se puede modificar los residuos de Ser240, Tr242 o Ser243 para que acepten sustratos mayores o para favorecer a los sustratos cargados negativamente. Por ejemplo, la Tr242 puede mutarse a Ser para reducir la longitud de la cadena lateral. Uno de los residuos puede mutarse a lisina o arginina, como Ser243. Los residuos (numeración YM-1) Val30-Val36 se ubican en una hebra beta a lo largo del sitio activo de la D-aminotransferasa y también son importantes para la actividad. Se piensa que Tir31, Val33, Glu32 y Lis35 están de cara al sitio activo. Tir31, Glu32 y Val33 son invariables en todos los homólogos de Bacillus. Ro et al. (FEBS Lett 398 (1996) pp. 141145) mutagenizaron la Val33 a Ala y encontraron un leve aumento en la eficiencia catalítica para la transaminación de alfa-cetoglutarato y una eficiencia catalítica significativamente superior para los sustratos más voluminosos (impedimento estérico menor). En algunos homólogos Lis35 se reemplaza con Arg, pero el impedimento estérico es una preocupación, se prefiere el residuo de Lis. Las valinas 34 y 36 también son preferidas sobre las sustituciones conservadoras como la isoleucina, nuevamente debido al menor impedimento estérico para moléculas mayores como MP. Additional information from studies of aspartate aminotransferase may also apply to Daminotransferase. While the AspC enzyme has an arginine at the active site that interacts with the side chain of dicarboxylate substrates, D-aminotransferase has a loop from Ser240 to Ser243. The Ser240, Tr242 and Ser243 side chains follow the same direction and form a pocket with the Ser180 hydroxyl group that provides a surface for nonpolar and polar substrates to interact. Ser180 is involved in PLP binding; however, to enhance the activity of a D-aminotransferase with R-MP, residues of Ser240, Tr242, or Ser243 can be modified to accept larger substrates or to favor negatively charged substrates. For example, Tr242 can be mutated to Ser to reduce the length of the side chain. One of the residues can be mutated to lysine or arginine, like Ser243. The Val30-Val36 residues (YM-1 numbering) are located on a beta strand along the active site of D-aminotransferase and are also important for activity. Tir31, Val33, Glu32 and Lis35 are thought to be facing the active site. Tir31, Glu32 and Val33 are invariant in all Bacillus homologs. Ro et al. (FEBS Lett 398 (1996) pp. 141145) mutagenized Val33 to Ala and found a slight increase in catalytic efficiency for alpha-ketoglutarate transamination and significantly higher catalytic efficiency for more bulky substrates (minor steric hindrance). In some homologs Lis35 is replaced with Arg, but steric hindrance is a concern, Lis residue is preferred. Valines 34 and 36 are also preferred over conservative substitutions like isoleucine, again due to less steric hindrance for larger molecules like MP.

Ejemplo 17 (no reivindicado) Example 17 (not claimed)

Clonación, expresión y prueba de racemasas de glutamato y aspartato Cloning, expression and testing of glutamate and aspartate racemases

Este ejemplo describe los procedimientos utilizados para clonar y probar las enzimas de racemasas de aminoácidos, que pueden utilizarse para interconvertirse entre L-glutamato y D-glutamato (o L- y D-aspartato o L- y D-alanina). Las racemasas de glutamato, aspartato o alanina son útiles en una vía biosintética para producir (R,R)-monatina cuando una etapa en dicha vía produce un L-aminoácido (como L-glutamato, L-aspartato o L-alanina) y otra etapa en la vía consume un D-aminoácido (como D-glutamato, D-aspartato o D-alanina). La figura 4 ilustra una vía biosintética para producir (R,R)-monatina a partir de L-triptófano mediante el uso de una aminotransferasa específica para L-triptófano, una aldolasa R específica, una D-aminotransferasa y una glutamato racemasa (aspartato o alanina). This example describes the procedures used to clone and test amino acid racemase enzymes, which can be used to interconvert between L-glutamate and D-glutamate (or L- and D-aspartate or L- and D-alanine). Glutamate, aspartate, or alanine racemases are useful in a biosynthetic pathway to produce (R, R) -monatin when a step in that pathway produces an L-amino acid (such as L-glutamate, L-aspartate, or L-alanine) and another stage in the pathway consumes a D-amino acid (such as D-glutamate, D-aspartate or D-alanine). Figure 4 illustrates a biosynthetic pathway to produce (R, R) -monatin from L-tryptophan using a specific L-tryptophan aminotransferase, a specific R aldolase, a D-aminotransferase, and a glutamate racemase (aspartate or to the girl).

Los genes se clonaron en los vectores pET28 y pET30 para generar las proteínas sin marcar y las proteínas de fusión con terminal N escindible HIS6-marcador/T7-marcadores. Las proteínas resultantes se purificaron mediante el uso de cromatografía de afinidad por iones metálicos inmovilizados. Genes were cloned into vectors pET28 and pET30 to generate the unlabelled proteins and the HIS6-marker / T7-cleavable N-terminal fusion proteins. The resulting proteins were purified using immobilized metal ion affinity chromatography.

Resumen experimental Experimental summary

Los genes que codifican las racemasas de glutamato (EC 5.1.1.3) de Lactobacillus brevis (Genbank No. de acceso D29627, secuencia de ácidos nucleicos) y Pediococcus pentosaceus (gen murI) (Genbank No. de acceso L22789) se clonaron y se expresaron en E. coli. Los extractos se probaron para verificar la actividad en la conversión de Lglutamato a D-glutamato y D-glutamato a L-glutamato. La enzima aspartato racemasa de BioCatalytics (EC 5.1.1.13) (BioCatalytics, Pasadena, CA) también se probó para la interconversión entre L- y D-aspartato. Genes encoding the glutamate racemases (EC 5.1.1.3) from Lactobacillus brevis (Genbank Accession No. D29627, nucleic acid sequence) and Pediococcus pentosaceus (gene MurI) (Genbank Accession No. L22789) were cloned and expressed in E. coli. The extracts were tested to verify the activity in the conversion of L-glutamate to D-glutamate and D-glutamate to L-glutamate. BioCatalytics aspartate racemase enzyme (EC 5.1.1.13) (BioCatalytics, Pasadena, CA) was also tested for interconversion between L- and D-aspartate.

Aislamiento de ADN Genómico para la clonación Isolation of Genomic DNA for cloning

El ADN genómico de L. brevis (ATCC 8287D) se obtuvo de la colección de cultivos “American Type Culture Collection”. Se cultivó P. pentosaceus (ATCC 25745) a 37ºC en caldo MRS de lactobacilli y se utilizaron 2 ml para el aislamiento del ADN genómico mediante el uso del procedimiento de Mekalanos J J. de duplicación y ampliación de genes de toxina en células de Vibrio cholerae. 1983. 35:253-63. L. brevis genomic DNA (ATCC 8287D) was obtained from the American Type Culture Collection. P. pentosaceus (ATCC 25745) was cultured at 37 ° C in lactobacilli MRS broth and 2 ml was used for the isolation of genomic DNA using the Mekalanos J J. method of duplication and amplification of toxin genes in Vibrio cholerae cells. . 1983. 35: 253-63.

Protocolo de la reacción en cadena de la polimerasa Polymerase chain reaction protocol

Los cebadores se diseñaron con sitios de restricción 5’ y salientes para clonar a los vectores pET 28 y pET30 (Novagen, Madison, WI). Primers were designed with 5 'restriction sites and overhangs to clone vectors pET 28 and pET30 (Novagen, Madison, WI).

Cebadores de glutamato racemasa de L. brevis: L. brevis glutamate racemase primers:

Terminal N: 5'-GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG-3', (SEQ ID NO: 401), y Terminal N: 5'-GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG-3 ', (SEQ ID NO: 401), and

Terminal C: 5'-GCGGCGGTCGACGCAATTACAATTGTGTTTGTC-3'. (SEQ ID NO: 402). Terminal C: 5'-GCGGCGGTCGACGCAATTACAATTGTGTTTGTC-3 '. (SEQ ID NO: 402).

Cebadores de glutamato racemasa de P. pentosaceus: P. pentosaceus glutamate racemase primers:

Terminal N: 5'-GCGGCGCCATGGATGTATGTATAATTTTATTTAG-3', (SEQ ID NO: 403), y Terminal N: 5'-GCGGCGCCATGGATGTATGTATAATTTTATTTAG-3 ', (SEQ ID NO: 403), and

Terminal C: 5'-GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT-3' (SEQ ID NO: 404). Terminal C: 5'-GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT-3 '(SEQ ID NO: 404).

El gen derivado de L. brevis se amplificó mediante el uso del siguiente protocolo de PCR. En una reacción de 50 !L se utilizó 0,150 !g de plantilla, 1,6 !M de cada cebador, 0,4 mM de cada dNTP, 2,8 U de polimerasa Expand High Fidelity™ (Roche, Indianápolis, Ind.), 0,5 U de polimerasa Pfu (Stratagene, La Jolla, CA) y tampón 1× Expand™ con Mg. El programa termociclador utilizado incluyó un comienzo en caliente a 96ºC durante 3 minutos, 8 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 52ºC durante 45 segundos y 72ºC durante 2 minutos, seguidas por 22 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 60ºC durante 45 segundos y 72ºC durante 2 minutos. Después de 22 repeticiones la muestra se mantuvo a 72ºC durante 7 minutos y a continuación se almacenó a 4ºC. Este protocolo de PCR produjo un producto de aproximadamente 830 bp, a juzgar por la comparación con los marcadores de tamaño de ADN. The gene derived from L. brevis was amplified using the following PCR protocol. In a 50 µL reaction 0.150 µg of template, 1.6 µM of each primer, 0.4 mM of each dNTP, 2.8 U of Expand High Fidelity ™ polymerase (Roche, Indianapolis, Ind.) Were used. , 0.5 U of Pfu polymerase (Stratagene, La Jolla, CA) and 1 × Expand ™ buffer with Mg. The thermocycler program used included a warm start at 96ºC for 3 minutes, 8 repetitions of the following stages: 94ºC for 30 seconds, 52ºC for 45 seconds and 72ºC for 2 minutes, followed by 22 repetitions of the following stages: 94ºC for 30 seconds , 60ºC for 45 seconds and 72ºC for 2 minutes. After 22 repetitions the sample was kept at 72 ° C for 7 minutes and then stored at 4 ° C. This PCR protocol produced a product of approximately 830 bp, judging from the comparison with the DNA size markers.

El gen derivado de P. pentosaceus se amplificó mediante el uso del siguiente protocolo de PCR. En una reacción de 50 !L se agregó 0,15 !g de plantilla, 1,6 !M de cada cebador, 0,4 mM de cada dNTP, 2,8 U de polimerasa Expand High Fidelity™, 0,5 U de polimerasa y tampón 1× Expand™ con Mg. El programa termociclador utilizado incluyó un comienzo en caliente a 96ºC durante 3 minutos, seguido de 8 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 37ºC durante 45 segundos y 72ºC durante 2 minutos, seguidas por 8 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 45ºC durante 45 segundos y 72ºC durante 2 minutos, seguidas por 14 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 55ºC durante 45 segundos y 72ºC durante 2 minutos. Después de 14 repeticiones la muestra se mantuvo a 72ºC durante 7 minutos y a continuación se almacenó a 4ºC. Este protocolo de PCR produjo un producto de aproximadamente 840 bp, a juzgar por la comparación con los marcadores de tamaño de ADN. The P. pentosaceus-derived gene was amplified using the following PCR protocol. In a 50 µL reaction 0.15 µg of template, 1.6 µM of each primer, 0.4 mM of each dNTP, 2.8 U of Expand High Fidelity ™ polymerase, 0.5 U of polymerase and 1 × Expand ™ buffer with Mg. The thermal cycler program used included a warm start at 96ºC for 3 minutes, followed by 8 repetitions of the following stages: 94ºC for 30 seconds, 37ºC for 45 seconds and 72ºC for 2 minutes, followed by 8 repetitions of the following stages: 94ºC for 30 seconds, 45ºC for 45 seconds and 72ºC for 2 minutes, followed by 14 repetitions of the following steps: 94ºC for 30 seconds, 55ºC for 45 seconds and 72ºC for 2 minutes. After 14 repetitions the sample was kept at 72 ° C for 7 minutes and then stored at 4 ° C. This PCR protocol produced a product of approximately 840 bp, judging from the comparison with the DNA size markers.

Clonación Cloning

Los productos de la PCR se purificaron en geles del 0,8% TAE-agarosa mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). Los productos de la PCR se cuantificaron mediante el uso de un espectrofotómetro SmartSpec 3000™. Los productos se digirieron con enzimas de restricción NcoI y SalI de acuerdo con los protocolos recomendados del fabricante (Biolaboratorios de Nueva Inglaterra, Beverly, MA) y se purificaron en geles del 0,8% TAE-agarosa mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). Los vectores pET28 y pET30 se prepararon mediante digestión con las enzimas de restricción NcoI y SalI seguidos del tratamiento con fosfatasa alcalina sérica y purificación en geles del 0,8% TAE-agarosa mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). The PCR products were purified on 0.8% TAE-agarose gels using the Qiagen gel extraction kit (Qiagen, Valencia, CA). PCR products were quantified using a SmartSpec 3000 ™ spectrophotometer. The products were digested with restriction enzymes NcoI and SalI according to the manufacturer's recommended protocols (New England Biolaboratories, Beverly, MA) and purified on 0.8% TAE-agarose gels using the extraction kit in Qiagen gel (Qiagen, Valencia, CA). Vectors pET28 and pET30 were prepared by digestion with the restriction enzymes NcoI and SalI followed by treatment with serum alkaline phosphatase and purification in 0.8% TAE-agarose gels using the Qiagen gel extraction kit (Qiagen, Valencia, CA).

Los vectores e inserciones digeridos se ligaron mediante el uso del kit de ligadura rápida de ADN (Roche, Indianápolis, IN). Aproximadamente 50 ng de la inserción tratada, 100 ng del vector tratado (proporción de inserción a vector 3 a 1), 5 U de T4 ADN ligasa y 1× de tampón de ligación se incubaron durante 5 minutos a temperatura ambiente. Las reacciones de ligación se purificaron mediante el uso del kit de purificación del producto de la PCR altamente puro (Roche, Indianápolis, IN) y se utilizaron para transformar las células electrocompetentes DH10B de The digested vectors and inserts were ligated using the DNA Rapid Ligation Kit (Roche, Indianapolis, IN). Approximately 50 ng of the treated insert, 100 ng of the treated vector (3 to 1 insert to vector ratio), 5 U of T4 DNA ligase and 1 × ligation buffer were incubated for 5 minutes at room temperature. The ligation reactions were purified using the Highly Pure PCR Product Purification Kit (Roche, Indianapolis, IN) and used to transform the DH10B electrocompetent cells from

E. coli (Invitrogen, Carlsbad, CA). Se agregaron 10 !l de cada reacción de ligación a 40 !l de células DH10B y se transformaron mediante electroporación mediante el uso del impulsor de genes Bio-Rad II (Bio-Rad, Hercules, CA) en las siguientes condiciones: 2,5 kV, 25° F, 200 ohm en una cubeta de 0,2 cm. Las células se dejaron recuperar en 1 mL de medio SOC a temperatura ambiente durante 1 hora a 37ºC con agitación a 225 rpm. Las células se colocaron en placas LB que contenían kanamicina (50 !g/mL). E. coli (Invitrogen, Carlsbad, CA). 10 µl of each ligation reaction was added to 40 µl of DH10B cells and transformed by electroporation using the Bio-Rad II gene driver (Bio-Rad, Hercules, CA) under the following conditions: 2.5 kV, 25 ° F, 200 ohm in a 0.2 cm cuvette. The cells were allowed to recover in 1 mL of SOC medium at room temperature for 1 hour at 37 ° C with stirring at 225 rpm. Cells were plated on LB plates containing kanamycin (50 µg / mL).

El ADN plásmido se purificó a partir de los transformantes resultantes mediante el uso del kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se analizó para detectar las inserciones correctas mediante enzimas de restricción con NcoI y SalI. Las secuencias de plásmidos que parecen tener una inserción correcta se verificaron mediante el secuenciado de ADN de terminación de la cadena didesoxi. Plasmid DNA was purified from the resulting transformants using the Qiagen spin miniprep kit (Qiagen, Valencia, CA) and analyzed for correct insertions by restriction enzymes with NcoI and SalI. Plasmid sequences that appear to have a correct insertion were verified by dideoxy chain termination DNA sequencing.

Expresión y análisis génicos Gene expression and analysis

El ADN plásmido, verificado por análisis de secuencias, se subclonó en hospedadores de expresión de E. Coli BL21(DE3) (Novagen, Madison, WI). Los cultivos se desarrollaron. Los plásmidos se aislaron mediante el uso del kit miniprep de Qiagen (Qiagen, Valencia, CA) y se analizaron mediante enzimas de restricción para confirmar la identidad. Plasmid DNA, verified by sequence analysis, was subcloned into E. Coli BL21 (DE3) expression hosts (Novagen, Madison, WI). Cultures developed. Plasmids were isolated using the Qiagen miniprep kit (Qiagen, Valencia, CA) and analyzed by restriction enzymes to confirm identity.

La inducción en BL21(DE3) se realizó inicialmente con glutamato racemasas de L. brevis y P. pentosaceus en los vectores pET28 (sin marcar) y pET 30 (marcados con histidina). Se realizó un estudio temporal con cultivos desarrollados en 250 mL de kanamicina que contenía LB (50 mg/L) a una OD600 entre 0,5 y 0,6, inducidos con 100 mM de IPTG (isopropil tiogalactósido) y muestreados a las 0 y 3 horas después de la inducción. Las células procedentes de 600 !L (hora 0) y 275 !L (a las 3 horas) se volvieron a colocar en suspensión en tampón de dodecil sulfato de sodio que contenía 2-mercaptoetanol calentado a 95ºC durante 10 minutos y se enfriaron. Se analizaron por SDS-PAGE alícuotas de estas muestras de la proteína celular completa mediante el uso de un gel en gradiente del 4 al 15%. Induction in BL21 (DE3) was initially performed with glutamate racemases from L. brevis and P. pentosaceus in vectors pET28 (unlabeled) and pET 30 (labeled with histidine). A temporary study was conducted with cultures developed in 250 mL of kanamycin containing LB (50 mg / L) at an OD600 between 0.5 and 0.6, induced with 100 mM IPTG (isopropyl thiogalactoside) and sampled at 0 and 3 hours after induction. Cells from 600 µL (hour 0) and 275 µL (at 3 hours) were resuspended in sodium dodecyl sulfate buffer containing 2-mercaptoethanol heated at 95 ° C for 10 minutes and cooled. Aliquots of these whole cell protein samples were analyzed by SDS-PAGE using a 4 to 15% gradient gel.

Se prepararon también extractos celulares procedentes de los cultivos de 3 horas mediante la colocación en suspensión de los sedimentos celulares procedentes de 5 ml de cultivo en 0,625 ml de reactivo BugBusterTM de Novagen (Novagen, Madison, WI) que contenía 0,625 !l de benzonasa nucleasa y 3 !L de mezcla de inhibidor de proteasa grupo #3 (Calbiochem-Novabiochem Corp., San Diego, CA) a temperatura ambiente durante 20 minutos con leve agitación y centrifugación a 16.000 x g para eliminar el residuo celular. Los sobrenadantes (extractos celulares) se cargaron en geles con gradiente del 4 al 15% para el análisis de las proteínas celulares solubles. Cell extracts from the 3 hr cultures were also prepared by suspending cell pellets from 5 ml of culture in 0.625 ml of Buggen Reagent from Novagen (Novagen, Madison, WI) containing 0.625 µl of benzase nuclease and 3 µL of group # 3 protease inhibitor mixture (Calbiochem-Novabiochem Corp., San Diego, CA) at room temperature for 20 minutes with light agitation and centrifugation at 16,000 xg to remove cell debris. Supernatants (cell extracts) were loaded onto 4 to 15% gradient gels for analysis of soluble cell proteins.

Las muestras de las 3 horas de glutamato racemasas de L. brevis y glutamato racemasas de P. pentosaceus clonadas mostraron una proteína total y soluble que correspondió al tamaño correcto (aproximadamente 31 kDa). El producto génico en pET30 (marcado con histidina) de L. brevis se sobreexpresó a un nivel superior y también fue más soluble (>20% de proteína soluble) que el producto génico en pET 28 (sin marcar) de L. brevis, así como los productos génicos de P. pentosaceus en ambos vectores. El producto génico de P. pentosaceus mostró la misma sobreexpresión y solubilidad en los vectores pET28 y pET30, que fue significativamente inferior a la observada para el producto génico en pET30 de L. brevis. Cloned 3-hour samples of glutamate racemases from L. brevis and glutamate racemases from P. pentosaceus showed a total and soluble protein that corresponded to the correct size (approximately 31 kDa). The gene product in L. brevis pET30 (histidine labeled) was overexpressed at a higher level and was also more soluble (> 20% soluble protein) than the L. brevis gene product in pET 28 (unlabelled), thus like the gene products of P. pentosaceus in both vectors. The P. pentosaceus gene product showed the same overexpression and solubility in the pET28 and pET30 vectors, which was significantly lower than that observed for the L. brevis gene product in pET30.

Las células de los cultivos inducidos (250 mL) se centrifugaron y se lavaron una vez con NaCl al 0,85%. Los sedimentos celulares se volvieron a suspender en 5 mL/g de peso de células húmedas de reactivo BugBusterTM (Novagen, Madison, WI) que contenía 5 !l/ml de la mezcla de inhibidor de proteasa del conjunto nº 3 (Calbiochem-Novabiochem Corp., San Diego, CA) y 1 !l/ml de benzonasa nucleasa. Las muestras se incubaron a temperatura ambiente durante 20 minutos en un agitador orbital. El residuo celular insoluble se eliminó por centrifugación a Cells from the induced cultures (250 mL) were centrifuged and washed once with 0.85% NaCl. The cell pellets were resuspended in 5 mL / g wet cells of BugBusterTM Reagent (Novagen, Madison, WI) containing 5 µl / ml of set # 3 protease inhibitor mixture (Calbiochem-Novabiochem Corp ., San Diego, CA) and 1 µl / ml of benzase nuclease. The samples were incubated at room temperature for 20 minutes on an orbital shaker. Insoluble cell debris was removed by centrifugation at

16.000 x g durante 20 minutos a 4ºC. 16,000 x g for 20 minutes at 4 ° C.

Los extractos celulares se analizaron para verificar la actividad de la glutamato racemasa mediante el uso del siguiente protocolo. Las reacciones de 400-!L se llevaron a cabo en 10 mM de fosfato de potasio (pH 8,0), 0,2 mM de DTT y 10 mM de L-glutamato o D-glutamato. Las reacciones se iniciaron mediante la adición de 20-100 !L de extractos libres de células y se incubaron a temperatura ambiente. Se tomaron alícuotas de las muestras durante un periodo de tiempo de 1 minuto, 5 minutos, 10 minutos, 20 minutos y 1 hora (las muestras del minuto cero sirvieron como reacciones de control). Se agregó 2 M de ácido fórmico (25 !L) a cada alícuota de muestra de 40 !L para detener la reacción y la proteína precipitada se eliminó mediante centrifugación. Los sobrenadantes se extrajeron y congelaron a −80ºC hasta que se analizaron mediante LC/MS/MS. Cell extracts were analyzed to verify glutamate racemase activity using the following protocol. The 400-µL reactions were carried out in 10 mM potassium phosphate (pH 8.0), 0.2 mM DTT and 10 mM L-glutamate or D-glutamate. Reactions were initiated by the addition of 20-100 µL of cell-free extracts and incubated at room temperature. Aliquots of the samples were taken over a period of 1 minute, 5 minutes, 10 minutes, 20 minutes and 1 hour (the zero minute samples served as control reactions). 2M formic acid (25 µL) was added to each aliquot of 40 µL sample to stop the reaction and the precipitated protein was removed by centrifugation. Supernatants were removed and frozen at -80 ° C until analyzed by LC / MS / MS.

Los resultados de los ensayos de los extractos celulares de la inducción de pET30 con 100 mM de IPTG (3 horas) demuestran que las enzimas de L. brevis (Genbank acceso no. BAA06106.1 GI:468450) y P. pentosaceus (Genbank acceso no. AAA16761.1 GI:349029) tienen niveles significativos de actividad de racemasas en ambos isómeros de glutamato. La racemasa de P. pentosaceus (20 !L de extractos celulares) alcanzó el equilibrio entre L- y Dglutamato a los 10 a 20 minutos del comienzo con cualquiera de los sustratos. La enzima de L. brevis (20 !L de extractos celulares) también alcanzó el equilibrio en aproximadamente 20 minutos. The results of the assays of the cell extracts of the induction of pET30 with 100 mM IPTG (3 hours) demonstrate that the enzymes of L. brevis (Genbank access no. BAA06106.1 GI: 468450) and P. pentosaceus (Genbank access No. AAA16761.1 GI: 349029) have significant levels of racemase activity at both glutamate isomers. The P. pentosaceus racemase (20 µL from cell extracts) reached equilibrium between L- and Dglutamate at 10 to 20 minutes from the start with any of the substrates. The L. brevis enzyme (20 µL from cell extracts) also reached equilibrium in approximately 20 minutes.

Se analizó la enzima aspartato racemasa parcialmente purificada (catálogo #ASPR-101) comprada a BioCatalytics, Inc. (Pasadena, CA) para verificar la actividad en el L-aspartato y D-aspartato mediante el uso de un protocolo similar al que antecede. La enzima comercial mostró actividad de racemasa en ambos isómeros. Mediante el uso de 0,5-1 mg de enzima, se logró el equilibrio a los 20 a 60 minutos. Partially purified aspartate racemase enzyme (catalog # ASPR-101) purchased from BioCatalytics, Inc. (Pasadena, CA) was analyzed for activity on L-aspartate and D-aspartate using a protocol similar to the one above. The commercial enzyme showed racemase activity in both isomers. Using 0.5-1 mg enzyme, equilibrium was achieved within 20 to 60 minutes.

También se analizaron las tres racemasas (glutamato racemasa de L. brevis, glutamato racemasa de P. pentosaceus y aspartato racemasa de BioCatalytics) para verificar la actividad en la (S,S)-monatina mediante el uso del siguiente protocolo. Las reacciones de 400-!L se llevaron a cabo en 10 mM de fosfato de potasio (pH 8,0), 0,2 mM de DTT y 10 mM de (S,S)-monatina. Las reacciones se iniciaron mediante la adición de extractos libres de células (L. brevis y P. pentosaceus) o enzima purificada (aspartato racemasa de BioCatalytics) y se incubaron a temperatura ambiente. Se tomaron alícuotas de las muestras durante un periodo de tiempo de 1 minuto, 5 minutos, 10 minutos, 20 minutos y 1 hora (las muestras del minuto cero sirvieron también como muestras sin enzima). Se agregó 2 M de ácido fórmico (25 !L) a cada alícuota de muestra de 40 !L para detener la reacción y la proteína precipitada se eliminó mediante centrifugación. Los sobrenadantes se extrajeron y congelaron a −80ºC hasta que se analizaron mediante LC/MS/MS (ejemplo 1). No se notó ninguna disminución en la concentración de (S,S)-monatina a lo largo del tiempo ni hubo ningún aumento en la (S,R)-monatina (presente inicialmente como subproducto contaminante <5%, incluso en el control sin enzimas). Por consiguiente, ninguna de las racemasas analizadas mostró actividad con respecto a la monatina. The three racemases (glutamate racemase from L. brevis, glutamate racemase from P. pentosaceus and aspartate racemase from BioCatalytics) were also analyzed to verify activity in the (S, S) -monatin using the following protocol. The 400-µL reactions were carried out in 10 mM potassium phosphate (pH 8.0), 0.2 mM DTT and 10 mM (S, S) -monatin. Reactions were initiated by the addition of cell-free extracts (L. brevis and P. pentosaceus) or purified enzyme (aspartate racemase from BioCatalytics) and incubated at room temperature. Aliquots of the samples were taken over a period of 1 minute, 5 minutes, 10 minutes, 20 minutes and 1 hour (the zero minute samples also served as samples without enzyme). 2M formic acid (25 µL) was added to each aliquot of 40 µL sample to stop the reaction and the precipitated protein was removed by centrifugation. Supernatants were removed and frozen at −80 ° C until analyzed by LC / MS / MS (Example 1). No decrease in (S, S) -monatin concentration was noted over time nor was there any increase in (S, R) -monatin (initially present as a contaminating by-product <5%, even in the control without enzymes ). Consequently, none of the racemases analyzed showed activity with respect to monatin.

Ejemplo 18 (ejemplo comparativo) Example 18 (comparative example)

Producción de (R,R)-monatina a partir de L-triptófano mediante el uso de glutamato o aspartato racemasas Production of (R, R) -monatin from L-tryptophan using glutamate or aspartate racemases

Este ejemplo describe los procedimientos para producir (R,R)-monatina enriquecida estereoisoméricamente a partir de L-triptófano mediante el uso de una L-triptófano (L-tirosina o aromática) aminotransferasa, ProA aldolasa, glutamato o aspartato racemasa y D-aminoácido aminotransferasa de amplia especifidad. La figura 5 es un diagrama que ilustra la vía. Este enfoque de producción de (R,R)-monatina enriquecida estereoisoméricamente requiere una enzima para la etapa 1 que tenga una actividad reducida en la producción de monatina a partir del precursor de monatina (MP). Con base en resultados anteriores, se utilizaron los productos de genes tatA de Sinorhizobium meliloti y Rhodobacter sphaeroides descritos en el ejemplo 1 de WO 03/091396 A2. This example describes the procedures for producing stereoisomerically enriched (R, R) -monatin from L-tryptophan using an L-tryptophan (L-tyrosine or aromatic) aminotransferase, ProA aldolase, glutamate or aspartate racemase and D-amino acid broad specificity aminotransferase. Figure 5 is a diagram illustrating the path. This approach to stereoisomerically enriched (R, R) -monatin production requires an enzyme for step 1 that has reduced activity in monatin production from the monatin precursor (MP). Based on previous results, the gene products tatA of Sinorhizobium meliloti and Rhodobacter sphaeroides described in Example 1 of WO 03/091396 A2 were used.

Materiales y procedimientos Materials and procedures

Las glutamato racemasas de L. brevis y P. pentosaceus se produjeron en E. coli como se describe en el ejemplo 17. En algunos casos la versión marcada con His6 de estas enzimas se purificó mediante el uso de cartuchos His-Bind 900 de acuerdo con los protocolos del fabricante (Novagen, Madison, WI) y se desalaron para extraer el imidazol mediante el uso de columnas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ). Las enzimas se eluyeron en 25 mM de fosfato de potasio, pH 8,0. La aspartato racemasa (ASPR-101) y la D-aminotransferasa (AT-103) se compraron a BioCatalytics, Inc. (Pasadena, CA).Las tirosina (aromática) aminotransferasas de S. meliloti y R. sphaeroides se prepararon como se describe en el ejemplo 1 de WO 03/091396 A2.La ProA aldolasa de Comamonas testosteroni se preparó como se describe en el Ejemplo 4 de WO 03/091396 A2. La totalidad de los ensayos de proteínas se realizó mediante el uso de un ensayo de proteínas Bio-Rad de acuerdo con los protocolos del fabricante (Hercules, CA). The glutamate racemases from L. brevis and P. pentosaceus were produced in E. coli as described in Example 17. In some cases the His6-labeled version of these enzymes was purified using His-Bind 900 cartridges according to manufacturer's protocols (Novagen, Madison, WI) and desalted to extract imidazole using PD-10 columns (G25 Sephadex, GE Healthcare, Piscataway, NJ). Enzymes were eluted in 25 mM potassium phosphate, pH 8.0. Aspartate racemase (ASPR-101) and D-aminotransferase (AT-103) were purchased from BioCatalytics, Inc. (Pasadena, CA). Tyrosine (aromatic) aminotransferases from S. meliloti and R. sphaeroides were prepared as described in Example 1 of WO 03/091396 A2. The ProA aldolase from Comamonas testosteroni was prepared as described in Example 4 of WO 03/091396 A2. All of the protein assays were performed using a Bio-Rad protein assay according to the manufacturer's protocols (Hercules, CA).

Reducción en cantidad de (S,S)-monatina producida mediante el uso de racemasas Reduction in amount of (S, S) -monatin produced by using racemases

Las mezclas de reacción (1 mL de volumen, realizadas por duplicado) contenían 100 mM de tampón de fosfato de potasio (pH 8), 2 mM de MgCl2, 0,05 mM de piridoxal 5'-fosfato (PLP), 200 mM de piruvato de sodio, 5 mM de acetoglutarato u oxaloacetato de sodio, aproximadamente 280 !g/mL de TatA de S. meliloti proporcionado en un extracto celular, 1 mg/mL de D-aminotransferasa (AT-103) de BioCatalytics (BioCatalytics, Pasadena, CA), 100 !L/mL de extracto celular de glutamato racemasa o 1 mg/mL de aspartato racemasa y aproximadamente 100 !g/mL de ProA aldolasa proporcionada como extracto celular. Se agregó triptófano sólido a una concentración de 10,2 mg/ml. Los controles negativos no contenían racemasa. Las mezclas se incubaron a 30ºC (agitación a 250 rpm) durante 1 hora, 2 horas o durante la noche. Las muestras se centrifugaron para extraer el precipitado, se filtraron por jeringa y se almacenaron a −80ºC antes del análisis de la monatina mediante el uso del procedimiento de LC/MS/MS descrito en el ejemplo 1. La mayoría de las muestras contenía >95% de (S,S)-monatina, debido a las cantidades de L-aminotransferasa nativa presente en los extractos celulares. No obstante, las muestras que contenían racemasa tenían una cantidad reducida de monatina total como resultado de las enzimas de racemasa, lo que provocó que el L-glutamato estuviera menos disponible para la transaminación de MP. Sin racemasa, se produjo monatina de 15452355 ppm (predominantemente S,S) durante el lapso de tiempo. Con las racemasas presentes, se produjo únicamente monatina (aspartato racemasa) de 340-879 ppm (enzima de L. brevis), 444-531 ppm (enzima de P. pentosaceus) y 506-1460 ppm. Estos datos indican que las racemasas son activas en las condiciones de reacción requeridas para producir monatina. Para minimizar la formación de (S,S)-monatina a partir de enzimas de extracto celular como las aspartato aminotransferasas, se realizaron experimentos adicionales con enzimas purificadas y una mayor proporción de enzimas de D-aminotransferasa a L-aminotransferasa. The reaction mixtures (1 mL volume, performed in duplicate) contained 100 mM of potassium phosphate buffer (pH 8), 2 mM of MgCl2, 0.05 mM of pyridoxal 5'-phosphate (PLP), 200 mM of sodium pyruvate, 5 mM sodium acetoglutarate or oxaloacetate, approximately 280 µg / mL TatA from S. meliloti provided in a cell extract, 1 mg / mL D-aminotransferase (AT-103) from BioCatalytics (BioCatalytics, Pasadena , CA), 100 µL / mL of cellular extract of glutamate racemase or 1 mg / mL of aspartate racemase and approximately 100 µg / mL of ProA aldolase provided as a cell extract. Solid tryptophan was added at a concentration of 10.2 mg / ml. Negative controls did not contain racemase. The mixtures were incubated at 30 ° C (shaking at 250 rpm) for 1 hour, 2 hours or overnight. The samples were centrifuged to extract the precipitate, filtered by syringe and stored at −80 ° C before monatin analysis using the LC / MS / MS procedure described in Example 1. Most of the samples contained> 95 % of (S, S) -monatin, due to the amounts of native L-aminotransferase present in cell extracts. However, the samples containing racemase had a reduced amount of total monatin as a result of racemase enzymes, which made L-glutamate less available for transamination of MP. Without racemase, monatin of 15452355 ppm (predominantly S, S) was produced during the time span. With the racemases present, only monatin (aspartate racemase) of 340-879 ppm (L. brevis enzyme), 444-531 ppm (P. pentosaceus enzyme) and 506-1460 ppm was produced. These data indicate that the racemases are active under the reaction conditions required to produce monatin. To minimize the formation of (S, S) -monatin from cell extract enzymes such as aspartate aminotransferases, additional experiments were performed with purified enzymes and a higher ratio of D-aminotransferase to L-aminotransferase enzymes.

Conversión de L-triptófano en isómeros de monatina que contienen 4-R Conversion of L-tryptophan to monatin isomers containing 4-R

Los experimentos que anteceden se repitieron mediante el uso de aproximadamente 54 !g de L-aminotransferasa purificada (ya sea TatA de S. meliloti o R. sphaeroides), 1 mg de aspartato aminotransferasa (BioCatalytics, Pasadena, CA), 1 mg de D-aminotransferasa, oxaloacetato como el aceptante amino y 75 !g de aldolasa purificada. Las reacciones se realizaron por duplicado con un tiempo de muestreo de 2 horas y un tiempo de incubación durante la noche. Los controles negativos se realizaron con L-aminotransferasa de S. meliloti pero no racemasa. The foregoing experiments were repeated using approximately 54 µg of purified L-aminotransferase (either S. meliloti TatA or R. sphaeroides), 1 mg aspartate aminotransferase (BioCatalytics, Pasadena, CA), 1 mg D -aminotransferase, oxaloacetate as the amino acceptor and 75 µg of purified aldolase. Reactions were performed in duplicate with a sampling time of 2 hours and an incubation time overnight. Negative controls were performed with S. meliloti L-aminotransferase but not racemase.

Además de la cuantificación del pico de R,R/S,S y S,R/(R,S)-monatina basada en la cromatografía de fase inversa, se determinó el porcentaje de cada estereoisómero mediante el uso de la técnica de derivatización de la FDAA descrita en el ejemplo 1. Los resultados son los siguientes: In addition to the quantification of the R, R / S, S and S, R / (R, S) -monatin peak based on reverse phase chromatography, the percentage of each stereoisomer was determined by using the derivatization technique of the FDAA described in Example 1. The results are as follows:

Tabla 22 Table 22

L-Aminotransferasa L-Aminotransferase
Tiempo de incubación Monatina total (ppm) % S,S % R,R % R,S % S,R Incubation time Total monatin (ppm) % H.H % R, R % R, S % MR

TatA de S. meliloti TatA of S. meliloti
2 horas 17,1 10,2 58,1 0,8 31,0 2 hours 17.1 10.2 58.1 0.8 31.0

TatA de S. meliloti TatA of S. meliloti
2 horas 15,8 13,3 55,3 1,0 30,4 2 hours 15.8 13.3 55.3 1.0 30.4

TatA de S. meliloti TatA of S. meliloti
durante la noche 77,7 25,8 40,0 1,3 32,9 overnight 77.7 25.8 40.0 1.3 32.9

TatA de S. meliloti TatA of S. meliloti
durante la noche 67,9 29,4 37,3 1,5 31,8 overnight 67.9 29.4 37.3 1.5 31.8

TatA de R. sphaeroides TatA of R. sphaeroides
2 horas 241,2 96,3 2,3 0,8 0,6 2 hours 241.2 96.3 2.3 0.8 0.6

TatA de R. sphaeroides TatA of R. sphaeroides
2 horas 223,2 95,7 2,7 1,0 0,6 2 hours 223.2 95.7 2.7 1.0 0.6

TatA de R. sphaeroides TatA of R. sphaeroides
durante la noche 600,4 96,6 1,8 0,5 1,1 overnight 600.4 96.6 1.8 0.5 1.1

TatA de R. sphaeroides TatA of R. sphaeroides
durante la noche 618,5 96,1 2,1 0,5 1,3 overnight 618.5 96.1 2.1 0.5 1.3

sin control de racemasa no racemase control
2 horas 7,1 92,0 1,4 6,6 0,0 2 hours 7.1 92.0 1.4 6.6 0.0

sin control de racemasa no racemase control
2 horas 5,7 94,0 1,2 4,8 0,0 2 hours 5.7 94.0 1.2 4.8 0.0

sin control de racemasa no racemase control
durante la noche 44,6 93,5 1,3 4,7 0,5 overnight 44.6 93.5 1.3 4.7 0.5

sin control de racemasa no racemase control
durante la noche 37,5 95,4 0,9 3,7 0,0 overnight 37.5 95.4 0.9 3.7 0.0

La presencia de racemasa aumentó claramente la cantidad total de monatina producida cuando se utilizó TatA de S. meliloti como la enzima para la transaminación de L-triptófano. Los niveles de monatina aumentaron de un promedio de 6,4 a 16,5 ppm en el ensayo de 2 horas y de 41 a 73 ppm en el ensayo durante la noche. Además, el porcentaje de R,R formado aumentó de aproximadamente un 1% a tanto como un 58% mediante el uso de la enzima 10 racemasa. El S,R estereoisómero de monatina, otro poderoso edulcorante, fue el otro componente principal, lo que aumentó de casi 0 en los controles negativos a un 31%. El TatA de R. sphaeroides presentó más actividad en S-MP que la L-transaminasa de S. meliloti, lo que demostró la importancia de tener una enzima que presenta una alta especificidad de sustrato para el L-triptófano en comparación con MP cuando los isómeros 4-R de monatina son los productos deseados. Como aproximadamente un 10% de la monatina total fue 4S en el intervalo de tiempo de dos The presence of racemase clearly increased the total amount of monatin produced when TatA from S. meliloti was used as the enzyme for transamination of L-tryptophan. Monatin levels increased from an average of 6.4 to 16.5 ppm in the 2-hour test and from 41 to 73 ppm in the overnight test. Furthermore, the percentage of R, R formed increased from about 1% to as much as 58% by use of the enzyme racemase. The monatin S, R stereoisomer, another powerful sweetener, was the other major component, increasing from nearly 0 in negative controls to 31%. TatA from R. sphaeroides showed more activity in S-MP than L-transaminase from S. meliloti, which showed the importance of having an enzyme that has a high substrate specificity for L-tryptophan compared to MP when the 4-R isomers of monatin are the desired products. As approximately 10% of the total monatin was 4S in the time interval of two

15 horas, pudo considerarse que el TatA de S. meliloti tenía una actividad limitada en el MP. 15 hours, the S. meliloti TatA could be considered to have limited activity in the MP.

Los experimentos se repitieron con el TatA de S. meliloti purificado (54 !g) y la glutamato racemasa de L. brevis. Cuando se utilizó glutamato racemasa purificada, se utilizaron aproximadamente 64 !g por 1 mL de reacción. También se probaron los extractos celulares que contenían glutamato racemasa y se utilizaron 1,4 mg de proteína soluble. Se utilizó nuevamente un control negativo sin racemasa y todas las muestras se realizaron por duplicado. The experiments were repeated with the purified S. meliloti TatA (54 µg) and the L. brevis glutamate racemase. When purified glutamate racemase was used, approximately 64 µg per 1 mL reaction was used. Cell extracts containing glutamate racemase were also tested and 1.4 mg of soluble protein were used. A negative control without racemase was used again and all samples were made in duplicate.

20 Los resultados son los siguientes: 20 The results are as follows:

Tabla 23 Table 23

Glutamato racemasa Glutamate racemase
Tiempo de incubación Monatina total (ppm) % S,S % R,R % R,S % S,R Incubation time Total monatin (ppm) % H.H % R, R % R, S % MR

Glutamato racemasa Glutamate racemase
Tiempo de incubación Monatina total (ppm) % S,S % R,R % R,S % S,R Incubation time Total monatin (ppm) % H.H % R, R % R, S % MR

L. brevis (purificada) L. brevis (purified)
2 horas 3,3 49,1 34,2 3,7 13,0 2 hours 3.3 49.1 34.2 3.7 13.0

L. brevis (purificada) L. brevis (purified)
2 horas 3,6 47,9 35,2 3,5 13,4 2 hours 3.6 47.9 35.2 3.5 13.4

L. brevis (purificada) L. brevis (purified)
durante la noche 29,3 58,9 24,7 3,2 13,2 overnight 29.3 58.9 24.7 3.2 13.2

L. brevis (purificada) L. brevis (purified)
durante la noche 40,2 55,1 25,0 4,7 15,3 overnight 40.2 55.1 25.0 4.7 15.3

L. brevis (extracto celular) L. brevis (cell extract)
2 horas 10,5 45,8 35,9 1,1 17,2 2 hours 10.5 45.8 35.9 1.1 17.2

L. brevis (extracto celular) L. brevis (cell extract)
2 horas 10,5 47,4 33,9 1,1 17,6 2 hours 10.5 47.4 33.9 1.1 17.6

L. brevis (extracto celular) L. brevis (cell extract)
durante la noche 79,4 70,3 17,9 1,3 10,5 overnight 79.4 70.3 17.9 1.3 10.5

L. brevis (extracto celular) L. brevis (cell extract)
durante la noche 80,1 69,1 19,1 1,1 10,7 overnight 80.1 69.1 19.1 1.1 10.7

ninguno none
2 horas 2,7 84,1 7,1 6,3 2,4 2 hours 2.7 84.1 7.1 6.3 2.4

ninguno none
2 horas 3,2 84,9 6,0 6,8 2,2 2 hours 3.2 84.9 6.0 6.8 2.2

ninguno none
durante la noche 36,5 92,3 2,3 4,2 1,2 overnight 36.5 92.3 2.3 4.2 1.2

ninguno none
durante la noche 30,5 92,7 2,0 4,1 1,3 overnight 30.5 92.7 2.0 4.1 1.3

Nuevamente, es claro que la adición de la racemasa aumenta la monatina total producida a partir de L-triptófano, así como aumenta las cantidades relativas de isómeros de monatina que contienen 4R en comparación con la (S,S)monatina. El uso de aldolasa, racemasa y L-aminotransferasa purificada aumenta enormemente la capacidad de Again, it is clear that the addition of racemase increases the total monatin produced from L-tryptophan, as well as increases the relative amounts of 4R-containing monatin isomers compared to (S, S) monatin. The use of aldolase, racemase and purified L-aminotransferase greatly increases the capacity of

5 control de la formación de estereoisómeros deseada. La proporción de L a D aminotransferasa es también una forma de manipular la estereoquímica del producto final. Control of desired stereoisomer formation. The ratio of L to D aminotransferase is also a way to manipulate the stereochemistry of the final product.

Al comparar los resultados mostrados en las tablas 18 y 19 en el ejemplo 13 con los resultados con condiciones de reacción similares a las condiciones que anteceden, uno puede ver que se formaron aproximadamente 7 a 29 ppm de monatina a partir de indol-3-piruvato y los porcentajes de (R,R)-monatina formados fueron de aproximadamente 10 un 51 a un 90%. El uso de la aspartato racemasa aumentó la cantidad total de monatina producida de 16 a 78 ppm de monatina con un % de R,R de aproximadamente un 40 a un 58%. Además, se utilizó una materia prima más estable y menos costosa, L-triptófano. En el ejemplo 14, se produjeron aproximadamente 73 ppm de monatina a partir de D-triptófano en una proporción de R,R:S,R de aproximadamente 1,7:1. La cantidad total de isómeros 4R fue > al 80% de la monatina total. Debido a que la R,R-monatina y S,R-monatina son poderosos edulcorantes (1000 Comparing the results shown in Tables 18 and 19 in Example 13 with the results with reaction conditions similar to the above conditions, one can see that approximately 7 to 29 ppm monatin was formed from indole-3-pyruvate and the percentages of (R, R) -monatin formed were from about 10 to 51 to 90%. The use of aspartate racemase increased the total amount of monatin produced from 16 to 78 ppm monatin with a% R, R from about 40 to 58%. In addition, a more stable and less expensive raw material, L-tryptophan, was used. In Example 14, approximately 73 ppm monatin was produced from D-tryptophan in an R, R: S, R ratio of approximately 1.7: 1. The total amount of 4R isomers was> 80% of the total monatin. Because R, R-monatin and S, R-monatin are powerful sweeteners (1000

15 veces más dulce que la sacarosa) la capacidad de enriquecer estos isómeros sin la necesidad de sustratos de Daminoácidos costosos es crítica. 15 times sweeter than sucrose) the ability to enrich these isomers without the need for expensive Daminoacid substrates is critical.

Como se describe en los ejemplos 13 y 14, la D-alanina puede servir como donante amino para la transaminación de MP a monatina. Muchas L-aminotransferasas tienen la capacidad de utilizar piruvato como aceptante amino en cierta medida y producir L-alanina. Debido a que las reacciones mencionadas anteriormente utilizan altas 20 concentraciones de piruvato, es probable que cierta cantidad de piruvato se convierta en L-alanina. Por ejemplo, durante la transaminación de L-triptófano, se encontró que la enzima HexAsp descrita en el ejemplo 16 convierte de un 10 a un 18% del piruvato (concentraciones iniciales de 50 a 200 mM) a L-alanina en 2 horas si el cetoglutarato alfa se encuentra ausente. La enzima mostró una preferencia de 10 veces para el cetoglutarato alfa cuando ambos aceptores amino se encontraban presentes en concentraciones mayores (>50 mM). La AspC (descrita en WO 25 03/091396 A2) también produjo cierta cantidad de L-alanina a partir de piruvato. Por consiguiente, se espera que se pueda omitir la adición de cetoglutarato alfa u oxaloacetato en las reacciones anteriores y utilizar alanina racemasa (EC 5.1.1.1) en lugar de glutamato o aspartato racemasa. Las enzimas alanina racemasa se identificaron primero en As described in Examples 13 and 14, D-alanine can serve as an amino donor for transamination of MP to monatin. Many L-aminotransferases have the ability to use pyruvate as an amino acceptor to some extent and to produce L-alanine. Because the reactions mentioned above use high concentrations of pyruvate, a certain amount of pyruvate is likely to convert to L-alanine. For example, during transamination of L-tryptophan, the enzyme HexAsp described in Example 16 was found to convert 10 to 18% of pyruvate (initial concentrations 50 to 200 mM) to L-alanine in 2 hours if the Alpha ketoglutarate is absent. The enzyme showed a 10-fold preference for alpha ketoglutarate when both amino acceptors were present in higher concentrations (> 50mM). AspC (described in WO 25 03/091396 A2) also produced a certain amount of L-alanine from pyruvate. Therefore, it is expected that the addition of alpha ketoglutarate or oxaloacetate can be omitted in the above reactions and use alanine racemase (EC 5.1.1.1) instead of glutamate or aspartate racemase. Alanine racemase enzymes were first identified in

Brucella abortus y Streptococcus faecalis (Marr, A. G. y Wilson, P. W. Arch. Biochem. Biophys., 49 (1954) 424-433 y Wood, W. A. y Gunsalus, I. C. J. Biol. Chem., 190 (1951) 403-416). El gen dadB en Salmonella typhimurium se identificó como la fuente de actividad de alanina racemasa y pueden encontrarse varios cientos de homólogos en las bases de datos genómicas. Otras fuentes conocidas de actividad de alanina racemasa son Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe y Bacillus cereus. El hongo basidiomiceto, Lentinus edodes, también contiene una alanina racemasa de amplia actividad. Un homólogo termoestable de Bacillus stearothermophilus se encuentra disponible para su compra a Sigma-Aldrich (catálogo #A8936) (Sigma-Aldrich, St. Louis, MO) y ha sido inmovilizado para aplicaciones comerciales (Inagaki, K., Biochemistry, 25: 3268 1986). La alanina racemasa se convierte a una glutamato o aspartato racemasa mediante procedimientos aleatorios como PCR mutagénica, pasaje a través de cepas mutagénicas u otros procedimientos conocidos por los expertos en la técnica. Una evolución más centrada de la alanina racemasa se centra en los residuos del sitio activo, que incluyen Lis129, Met134 y residuos que incluyen entre Gli283 y Trp288 (numeración de Bacillus stearothermophilus). Brucella abortus and Streptococcus faecalis (Marr, A. G. and Wilson, P. W. Arch. Biochem. Biophys., 49 (1954) 424-433 and Wood, W. A. and Gunsalus, I. C. J. Biol. Chem., 190 (1951) 403-416). The dadB gene in Salmonella typhimurium was identified as the source of alanine racemase activity and several hundred homologs can be found in genomic databases. Other known sources of alanine racemase activity are Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe and Bacillus cereus. The basidiomycete fungus, Lentinus edodes, also contains a highly active alanine racemase. A thermostable Bacillus stearothermophilus homolog is available for purchase from Sigma-Aldrich (Catalog # A8936) (Sigma-Aldrich, St. Louis, MO) and has been immobilized for commercial applications (Inagaki, K., Biochemistry, 25: 3268. 1986). Alanine racemase is converted to a glutamate or aspartate racemase by random procedures such as mutagenic PCR, passage through mutagenic strains, or other procedures known to those skilled in the art. A more focused evolution of the alanine racemase focuses on active site residues, including Lis129, Met134, and residues including between Gli283 and Trp288 (Bacillus stearothermophilus numbering).

Ejemplo 19 (ejemplo comparativo) Example 19 (comparative example)

D-fenilglicina aminotransferasa (D-4-hidroxifenilglicina aminotransferasa) D-phenylglycine aminotransferase (D-4-hydroxyphenylglycine aminotransferase)

Como se muestra en la figura 3, la D-fenilglicina aminotransferasa es útil en una vía biosintética para la producción de monatina. Por ejemplo, la D-fenilglicina aminotransferasa produce (R,R)-monatina a partir de R-MP con Lglutamato como el donante amino. As shown in Figure 3, D-phenylglycine aminotransferase is useful in a biosynthetic pathway for monatin production. For example, D-phenylglycine aminotransferase produces (R, R) -monatin from R-MP with Lglutamate as the amino donor.

Síntesis de PCR de 4 D-hidroxifenilglicina aminotransferasa de P. stutzeri a partir de cebadores de oligonucleótidos PCR synthesis of P. stutzeri 4 D-hydroxyphenylglycine aminotransferase from oligonucleotide primers

Este ejemplo describe los procedimientos que se utilizaron para sintetizar la 4 D-hidroxifenilglicina aminotransferasa, una enzima estereoinversora que puede utilizarse para convertir el precursor de monatina R en (R,R)-monatina mediante el uso de L-glutamato como el donante amino. This example describes the procedures that were used to synthesize 4 D-hydroxyphenylglycine aminotransferase, a stereoinverting enzyme that can be used to convert the monatin precursor R to (R, R) -monatin by using L-glutamate as the amino donor.

Diseño de cebadores Primer design

La secuencia publicada (Genbank acceso No. AY319935, secuencia de ácidos nucleicos; Genbank acceso No. AAQ8290, secuencia de proteínas) para 4 D-hidroxifenilglicina aminotransferasa de Pseudomonas stutzeri (4 D-HPG AT) se utilizó como plantilla para el diseño de cebadores de PCR. De forma alternativa, la 4-D-hidroxifenilglicina aminotransferasa de Pseudomonas putida, (CAD42450 (proteína), AX467211 (nucleótido)) se utiliza como una plantilla de secuencia. Se diseñó un total de 34 cebadores directos y 35 cebadores inversos; los cebadores directos e inversos fueron 40 cebadores que compartían 20 pares de base superpuesta. Además, se diseñaron 2 cebadores externos con sitios de restricción 5' y salientes para clonar a los vectores pET 28 y pET30 (Novagen, Madison, WI). The published sequence (Genbank Access No. AY319935, nucleic acid sequence; Genbank Access No. AAQ8290, protein sequence) for Pseudomonas stutzeri 4-D-hydroxyphenylglycine aminotransferase (4-D-HPG AT) was used as a template for primer design. PCR. Alternatively, the 4-D-hydroxyphenylglycine aminotransferase from Pseudomonas putida, (CAD42450 (protein), AX467211 (nucleotide)) is used as a sequence template. A total of 34 forward primers and 35 reverse primers were designed; forward and reverse primers were 40 primers that shared 20 pairs of overlapping base. In addition, 2 external primers with 5 'restriction sites and overhangs were designed to clone vectors pET 28 and pET30 (Novagen, Madison, WI).

Cebadores externos 4 D-HPG AT de P. stutzeri: Terminal N (con sitio NdeI): P. stutzeri 4 D-HPG AT external primers: Terminal N (with NdeI site):

5'-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT-3' (SEQ ID NO: 405) y terminal C (con sitio XhoI): 5'-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT-3 '(SEQ ID NO: 405) and terminal C (with XhoI site):

5'-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT-3' (SEQ ID NO: 406). 5'-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT-3 '(SEQ ID NO: 406).

Protocolo de la reacción en cadena de la polimerasa Polymerase chain reaction protocol

La secuencia de genes de P. stutzeri se amplificó mediante el uso de los siguientes protocolos. La reacción de PCR primaria de 100 !L incluyó 0,05 !M de cada uno de los 69 cebadores internos, 0,4 mM de cada dNTP, 10 U de rTth Polimerasa XL (Roche, Indianápolis, IN), 0,625 U de Pfu polimerasa (Stratagene, La Jolla, CA), 1×XL de tampón y 1 mM de Mg(OAc)2. El programa termociclador utilizado incluyó un comienzo en caliente a 94ºC durante 3 minutos, 15 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 42ºC durante 30 segundos y 68ºC durante 15 segundos, seguidas por 10 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 52ºC durante 30 segundos y 68ºC durante 30 segundos, seguidas por 10 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 60ºC durante 30 segundos y 68ºC durante 1 minuto y 15 segundos. Después de los 10 ciclos finales la muestra se mantuvo a 68ºC durante 7 minutos y a continuación se almacenó a 4ºC. Este protocolo de PCR produjo un frotis de producto a aproximadamente 0,5 kb sobre un gel de TAE-agarosa al 0,8%. The P. stutzeri gene sequence was amplified using the following protocols. The 100 µL primary PCR reaction included 0.05 µM of each of the 69 internal primers, 0.4 mM of each dNTP, 10 U of rTth Polymerase XL (Roche, Indianapolis, IN), 0.625 U of Pfu polymerase (Stratagene, La Jolla, CA), 1 × XL buffer and 1 mM Mg (OAc) 2. The thermal cycler program used included a warm start at 94ºC for 3 minutes, 15 repetitions of the following stages: 94ºC for 30 seconds, 42ºC for 30 seconds and 68ºC for 15 seconds, followed by 10 repetitions of the following stages: 94ºC for 30 seconds , 52ºC for 30 seconds and 68ºC for 30 seconds, followed by 10 repetitions of the following steps: 94ºC for 30 seconds, 60ºC for 30 seconds and 68ºC for 1 minute and 15 seconds. After the final 10 cycles the sample was kept at 68 ° C for 7 minutes and then stored at 4 ° C. This PCR protocol produced a smear of product at approximately 0.5 kb on a 0.8% TAE-agarose gel.

La reacción de PCR secundaria se configuró mediante el uso de la reacción de PCR primaria como plantilla. La reacción de PCR secundaria de 100 !L incluyó 2,5 !L de la reacción de PCR primaria, 0,5 !M de cada uno de los 2 cebadores externos (con sitios de restricción NdeI y XhoI), 0,4 mM de cada dNTP, 10 U de rTth Polimerasa XL, 0,625 U de Pfu polimerasa, 1×XL tampón y 1 mM de Mg(OAc)2. El programa termociclador utilizado incluyó un comienzo en caliente a 94ºC durante 3 minutos, 10 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 52ºC durante 30 segundos y 68ºC durante 1 minuto y 30 segundos, seguidas por 15 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 60ºC durante 30 segundos y 68ºC durante 1 minuto y 30 segundos. Después de las repeticiones la muestra se mantuvo a 68ºC durante 7 minutos y a continuación se almacenó a 4ºC. Este protocolo de PCR produjo una banda de producto particular a aproximadamente 1,4 kb sobre un gel de TAEagarosa al 0,8%. The secondary PCR reaction was configured using the primary PCR reaction as a template. The 100 µL secondary PCR reaction included 2.5 µL of the primary PCR reaction, 0.5 µM of each of the 2 outer primers (with NdeI and XhoI restriction sites), 0.4 mM of each dNTP, 10 U of rTth Polymerase XL, 0.625 U of Pfu polymerase, 1 × XL buffer and 1 mM Mg (OAc) 2. The thermocycler program used included a warm start at 94ºC for 3 minutes, 10 repetitions of the following stages: 94ºC for 30 seconds, 52ºC for 30 seconds and 68ºC for 1 minute and 30 seconds, followed by 15 repetitions of the following stages: 94ºC for 30 seconds, 60ºC for 30 seconds and 68ºC for 1 minute and 30 seconds. After repetitions the sample was kept at 68 ° C for 7 minutes and then stored at 4 ° C. This PCR protocol produced a particular product band at approximately 1.4 kb on a 0.8% TAEagarose gel.

Los productos de la PCR se purificaron en geles TAE-agarosa al 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). El producto se clonó en TOPO y se transformó en células TOP 10 de acuerdo con el protocolo del fabricante (Invitrogen, Carlsbad, CA). El ADN plásmido se purificó a partir de los transformantes resultantes mediante el uso del kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se analizó para detectar las inserciones correctas mediante enzimas de restricción con NdeI y XhoI. Las secuencias de plásmidos que parecen tener una inserción correcta se verificaron mediante el secuenciado de ADN de terminación de la cadena didesoxi con los cebadores universales M13 directos y M13 inversos. De los 10 clones secuenciados, todos tenían al menos una mutación de la secuencia deseada. El mejor clon tenía una única mutación de par de base que resultó en un cambio de aminoácido. La secuencia de este clon se corrigió mediante el uso del protocolo de mutagénesis QuickChange de acuerdo con las recomendaciones del fabricante (Stratagene, La Jolla, CA). PCR products were purified on 0.8% TAE-agarose gels using the Qiagen Gel Extraction Kit (Qiagen, Valencia, CA). The product was cloned into TOPO and transformed into TOP 10 cells according to the manufacturer's protocol (Invitrogen, Carlsbad, CA). Plasmid DNA was purified from the resulting transformants using the Qiagen spin miniprep kit (Qiagen, Valencia, CA) and analyzed for correct insertions by restriction enzymes with NdeI and XhoI. Plasmid sequences that appear to have correct insertion were verified by dideoxy chain termination DNA sequencing with the forward M13 and reverse M13 universal primers. Of the 10 sequenced clones, all had at least one mutation of the desired sequence. The best clone had a single base pair mutation that resulted in an amino acid change. The sequence of this clone was corrected using the QuickChange mutagenesis protocol according to the manufacturer's recommendations (Stratagene, La Jolla, CA).

El clon TOPO corregido se digirió con enzimas de restricción NdeI y XhoI de acuerdo con los protocolos recomendados del fabricante (Biolaboratorios de Nueva Inglaterra, Beverly, MA) y se purificaron en geles de TAEagarosa AL 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). Los vectores pET28 y pET30 se prepararon mediante la digestión con enzimas de restricción NdeI y XhoI seguidos del tratamiento con fosfatasa alcalina sérica y purificación en geles de TAE-agarosa al 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). The corrected TOPO clone was digested with restriction enzymes NdeI and XhoI according to the manufacturer's recommended protocols (Biolaboratories of New England, Beverly, MA) and purified on 0.8% TAEagarose gels using the extraction kit. gel from Qiagen (Qiagen, Valencia, CA). Vectors pET28 and pET30 were prepared by digestion with restriction enzymes NdeI and XhoI followed by treatment with serum alkaline phosphatase and gel purification of 0.8% TAE-agarose using the Qiagen gel extraction kit (Qiagen , Valencia, CA).

Los vectores e inserciones digeridos se ligaron mediante el uso del kit de ligadura rápida NEB (Beverly, MA). Aproximadamente 50 ng de la inserción tratada, 100 ng del vector tratado (proporción de inserción a vector 3 a 1), 5 U de T4 ADN ligasa y 1× de tampón de ligación se incubaron durante 5 minutos a temperatura ambiente. La mezcla de ligación se transformó en células químicamente competentes TOP10F' (Invitrogen, Carlsbad, CA). Las células se dejaron recuperar en 0,25 mL de medio SOC a temperatura ambiente durante 1 hora a 37ºC con agitación a 225 rpm. Las células se colocaron en placas LB que contenían kanamicina (50 !g/mL). El ADN plásmido se purificó a partir de los transformantes resultantes mediante el uso del kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se analizó para detectar las inserciones correctas mediante enzimas de restricción con NdeI y XhoI. The digested vectors and inserts were ligated using the NEB Rapid Ligation Kit (Beverly, MA). Approximately 50 ng of the treated insert, 100 ng of the treated vector (3 to 1 ratio of insert to vector), 5 U of T4 DNA ligase and 1 × ligation buffer were incubated for 5 minutes at room temperature. The ligation mixture was transformed into TOP10F 'chemically competent cells (Invitrogen, Carlsbad, CA). The cells were allowed to recover in 0.25 mL of SOC medium at room temperature for 1 hour at 37 ° C with stirring at 225 rpm. Cells were plated on LB plates containing kanamycin (50 µg / mL). Plasmid DNA was purified from the resulting transformants using the Qiagen spin miniprep kit (Qiagen, Valencia, CA) and analyzed for correct insertions by restriction enzymes with NdeI and XhoI.

Expresión y análisis génicos Gene expression and analysis

El ADN plásmido se transformó en hospedadores de expresión de E. Coli BL21(DE3) (Novagen, Madison, WI). Los cultivos se desarrollaron y los plásmidos se aislaron mediante el uso del kit miniprep de Qiagen (Qiagen, Valencia, CA) y se analizaron mediante enzimas de restricción para confirmar la identidad. Plasmid DNA was transformed into E. Coli BL21 (DE3) expression hosts (Novagen, Madison, WI). Cultures were grown and plasmids were isolated using the Qiagen miniprep kit (Qiagen, Valencia, CA) and analyzed by restriction enzymes to confirm identity.

La inducción en BL21(DE3) se realizó inicialmente con 4 D-HPG de P. stutzeri en los vectores pET 28 (marcado con histidina) y pET 30 (sin marcar). Se realizó un estudio temporal con cultivos desarrollados en 250 mL de kanamicina que contenía LB (50 mg/L) a una OD600 de entre 0,5 y 0,6, inducidos con 100 mM de IPTG (isopropil tiogalactósido) y muestreados a las 0 y 3 horas después de la inducción. Un volumen adecuado de células procedentes de la hora 0 y la hora 3 se volvió a colocar en suspensión en 40 !L de tampón de dodecil sulfato de sodio que contenía 2mercaptoetanol y se calentó a 95ºC durante 10 minutos y se enfrió. Se analizaron por SDS-PAGE alícuotas de estas muestras de la proteína celular completa mediante el uso de un gel en gradiente del 4 al 15%. BL21 (DE3) induction was initially performed with P. stutzeri 4 D-HPG in vectors pET 28 (histidine labeled) and pET 30 (unlabeled). A temporary study was performed with cultures developed in 250 mL of kanamycin containing LB (50 mg / L) at an OD600 of between 0.5 and 0.6, induced with 100 mM IPTG (isopropyl thiogalactoside) and sampled at 0 and 3 hours after induction. A suitable volume of cells from hour 0 and hour 3 was resuspended in 40 µL of sodium dodecyl sulfate buffer containing 2-mercaptoethanol and heated at 95 ° C for 10 minutes and cooled. Aliquots of these whole cell protein samples were analyzed by SDS-PAGE using a 4 to 15% gradient gel.

Se prepararon también extractos celulares procedentes de los cultivos de 3 horas mediante la colocación en suspensión de los sedimentos celulares procedentes de 5 ml de cultivo en 0,625 ml de reactivo BugBusterTM de Novagen (Novagen, Madison, WI) que contenía 0,625 !l de benzonasa nucleasa y 3 !L de mezcla de inhibidor de proteasa conjunto #3 (Calbiochem-Novabiochem Corp., San Diego, CA) a temperatura ambiente durante 20 minutos con leve agitación y centrifugación a 16.000 x g para eliminar el residuo celular. Los sobrenadantes (extractos celulares) se cargaron en geles con gradiente del 4 al 15% para el análisis de las proteínas celulares solubles. Cuando fue requerido, la proteína se purificó mediante el uso de cartuchos His-Bind 900 de acuerdo con los protocolos del fabricante (Novagen, Madison, WI) y se desaló para extraer el imidazol mediante el uso de columnas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ). Cell extracts from the 3 hr cultures were also prepared by suspending cell pellets from 5 ml of culture in 0.625 ml of Buggen Reagent from Novagen (Novagen, Madison, WI) containing 0.625 µl of benzase nuclease and 3 µL of Joint Protease Inhibitor Mix # 3 (Calbiochem-Novabiochem Corp., San Diego, CA) at room temperature for 20 minutes with light agitation and centrifugation at 16,000 xg to remove cell debris. Supernatants (cell extracts) were loaded onto 4 to 15% gradient gels for analysis of soluble cell proteins. When required, the protein was purified using His-Bind 900 cartridges according to the manufacturer's protocols (Novagen, Madison, WI) and desalted to extract the imidazole using PD-10 columns (G25 Sephadex, GE Healthcare, Piscataway, NJ).

Organismos con D-fenilglicina aminotransferasa (DPGAT) Organisms with D-phenylglycine aminotransferase (DPGAT)

Los organismos del género Pseudomonas y géneros similares, con una D-fenilglicina aminotransferasa estereoinversora (también llamada D-4-hidroxifenilglicina aminotransferasa) se aíslan de la siguiente forma. Las muestras de suelo se incuban en placas petri con el siguiente medio: (por litro) 15 g de Agar, 3,4 g de KH2PO4, 3,55 g de Na2HPO4, 0,2 g de MgSO4.7H2O, 8 mg de CaCl2.2H2O, 10 mg de extracto de levadura, 1 ml de solución de elementos de traza 1000×, 1 g de D-fenilglicina (D-4-hidroxifenilglicina). Organisms of the genus Pseudomonas and similar genera, with a stereoinverting D-phenylglycine aminotransferase (also called D-4-hydroxyphenylglycine aminotransferase) are isolated as follows. The soil samples are incubated in petri dishes with the following medium: (per liter) 15 g of Agar, 3.4 g of KH2PO4, 3.55 g of Na2HPO4, 0.2 g of MgSO4.7H2O, 8 mg of CaCl2 .2H2O, 10 mg of yeast extract, 1 ml of 1000 × trace element solution, 1 g of D-phenylglycine (D-4-hydroxyphenylglycine).

Los aislados se probaron mediante PCR para detectar la presencia de una aminotransferasa estereoinversora (cebadores diseñados a partir de las D-fenilglicina aminotransferasas conocidas) o se enriquecieron adicionalmente para detectar la presencia de una aminotransferasa estereoinversora de la siguiente forma: los aislados de las placas se cultivaron en medio líquido como antecede menos el agar a 30ºC con agitación a una OD600 de aproximadamente 1,0. Las células se cosecharon mediante centrifugación y se lavaron dos veces con NaCl al 0,85%. Una muestra de 10 mg (peso húmedo) se suspendió en 1 ml de tampón de fosfato de potasio (pH 7,0) y 5 mM de D-fenilglicina (o D-4-hidroxifenilglicina). Se agregaron 15 mM de ácido acético (aminooxi) neutralizado para duplicar las muestras preparadas en la forma descrita anteriormente. El consumo de D-fenilglicina (o D-4hidroxiglicina) se midió mediante HPLC. Se seleccionaron los aislados capaces de degradar la D-feniliglicina (o D-4hidroxifenilglicina), pero que lo hacían en una proporción menor en la presencia de ácido acético (aminooxi) para un mayor análisis. Los aislados se probaron mediante PCR para verificar la presencia de aminotransferasa estereoinversora (cebadores designados a partir de las D-fenilglicina aminotransferasas conocidas). Isolates were tested by PCR to detect the presence of a stereoinverting aminotransferase (primers designed from known D-phenylglycine aminotransferases) or further enriched to detect the presence of a stereoinverting aminotransferase as follows: the isolates from the plates were Cultured in liquid medium as above minus agar at 30 ° C with shaking at an OD600 of about 1.0. Cells were harvested by centrifugation and washed twice with 0.85% NaCl. A 10 mg (wet weight) sample was suspended in 1 ml of potassium phosphate buffer (pH 7.0) and 5 mM of D-phenylglycine (or D-4-hydroxyphenylglycine). Neutralized 15 mM acetic acid (aminooxy) was added to duplicate the samples prepared as described above. The consumption of D-phenylglycine (or D-4-hydroxyglycine) was measured by HPLC. Isolates capable of degrading D-phenylglycine (or D-4-hydroxyphenylglycine), but which did so to a lesser extent in the presence of acetic acid (aminooxy), were selected for further analysis. Isolates were tested by PCR to verify the presence of stereoinverting aminotransferase (primers designated from known D-phenylglycine aminotransferases).

La presencia de aminotransferasa estereoinversora se confirmó mediante el desarrollo de un cultivo en un medio líquido como se describe anteriormente, la cosecha de las células y la preparación de un extracto bruto libre de células (CFE) y la prueba para detectar la actividad enzimática de D-fenilglicina aminotransferasa (o D-4hidroxifenilglicina aminotransferasa). Se agregó CFE a la mezcla de reacción con las siguientes concentraciones finales: CAPS 0,1 M (pH 9,5), 60 mM de L-glutamato (sal de sodio), 5 mM de benzoilformiato (o 4-hidroxibenzoato) y 50 !M de PLP. La reacción inversa se midió mediante la adición de CFE a la mezcla de reacción con las siguientes concentraciones: 50 mM de fosfato de potasio (pH 7,0), 60 mM de D-fenilglicina (o D-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 !M de PLP. Los ensayos se incubaron a 35ºC y se tomaron alícuotas en intervalos de tiempo y se detuvieron mediante ebullición durante 2 minutos. El producto se cuantificará mediante el procedimiento de HLPC de Gil-Av, E., Tishbee, A., Hare, P. E., Resolution of underivatized amino acids by reversed phase chromatography. The presence of stereoinverting aminotransferase was confirmed by developing a culture in a liquid medium as described above, harvesting the cells and preparing a crude cell-free extract (CFE) and the test to detect the enzymatic activity of D -phenylglycine aminotransferase (or D-4-hydroxyphenylglycine aminotransferase). CFE was added to the reaction mixture with the following final concentrations: 0.1M CAPS (pH 9.5), 60mM L-glutamate (sodium salt), 5mM benzoylformate (or 4-hydroxybenzoate) and 50 ! M from PLP. The reverse reaction was measured by adding CFE to the reaction mixture at the following concentrations: 50mM potassium phosphate (pH 7.0), 60mM D-phenylglycine (or D-4-hydroxyphenylglycine), 5mM of a-ketoglutarate, 50 µM of PLP. Assays were incubated at 35 ° C and aliquots were taken at time intervals and boiled for 2 minutes. The product will be quantified by the HLPC procedure of Gil-Av, E., Tishbee, A., Hare, P. E., Resolution of underivatized amino acids by reversed phase chromatography.

J. Am. Chem. Soc., 102: 5115-5117 (1980) o mediante los procedimientos descritos en el ejemplo 1 (medición de formación de glutamato). J. Am. Chem. Soc., 102: 5115-5117 (1980) or by the procedures described in Example 1 (measurement of glutamate formation).

Como una alternativa para los procedimientos basados en la PCR, la D-fenilglicina aminotransferasa estereoinversora se purifica a partir de la bacteria aislada mediante técnicas de purificación de proteínas convencionales que incluyen el fraccionamiento de sulfato de amonio y cromatografía de columna convencional. Una vez que la proteína ha sido purificada en un grado razonable, se utilizan técnicas de microsecuenciado de péptidos o secuenciado de aminoácidos tipo Edman convencional (véase golgi.harvard.edu/microchem/ para descripciones de los protocolos y equipamientos utilizados para este tipo de trabajo). Los cebadores degenerados se diseñan con base en la secuencia disponible del pariente más cercano conocido de la fuente de proteínas. A continuación se lleva a cabo la PCR degenerada y el paseo genómico de acuerdo con los protocolos establecidos para aislar la secuencia que codifica la D-fenilglicina aminotransferasa estereoinversora. As an alternative to PCR-based procedures, stereoinverting D-phenylglycine aminotransferase is purified from the isolated bacterium by standard protein purification techniques including ammonium sulfate fractionation and standard column chromatography. Once the protein has been purified to a reasonable degree, peptide microsequencing or conventional Edman-type amino acid sequencing techniques are used (see golgi.harvard.edu/microchem/ for descriptions of the protocols and equipment used for this type of work. ). Degenerate primers are designed based on the sequence available from the closest known relative of the protein source. Degenerate PCR and genomic walk are then performed according to established protocols to isolate the sequence encoding the stereoinverting D-phenylglycine aminotransferase.

Producción de monatina DPGAT DPGAT monatin production

Las D-hidroxifenilglicina aminotransferasas, como se describe en (1) y (2) anteriormente, se utilizan en extractos libres de proteínas brutos o purificados como se describe en (1) anteriormente. Las tirosina (aromática) aminotransferasas de S. meliloti y R. sphaeroides se prepararon como se describe en el ejemplo 1 de WO 03/091396 A2.La ProA aldolasa de Comamonas testosteroni se preparó como se describe en el ejemplo 4 de WO 03/091396 A2. La totalidad de los ensayos de proteínas se realizó mediante el uso de un ensayo de proteínas Bio-Rad de acuerdo con los protocolos del fabricante (Hercules, CA). D-hydroxyphenylglycine aminotransferases, as described in (1) and (2) above, are used in crude or purified protein-free extracts as described in (1) above. The S. aromiloti and R. sphaeroides tyrosine (aromatic) aminotransferases were prepared as described in Example 1 of WO 03/091396 A2. The ProA aldolase from Comamonas testosteroni was prepared as described in Example 4 of WO 03/091396 A2. All of the protein assays were performed using a Bio-Rad protein assay according to the manufacturer's protocols (Hercules, CA).

Las mezclas de reacción (1 mL de volumen, realizadas por duplicado) contenían 100 mM de tampón de fosfato de potasio (pH 8), 2 mM de MgCl2, 0,05 mM de piridoxal 5'-fosfato (PLP), 200 mM de piruvato de sodio, 5 mM de acetoglutarato de sodio, aproximadamente 280 !g/mL de TatA de S. meliloti proporcionado en un extracto celular, 100 !L/mL de extracto celular de D-hidroxifenilglicina aminotransferasa o 1 mg/mL de D-hidroxifenilglicina aminotransferasa purificada y aproximadamente 100 !g/mL de ProA aldolasa proporcionada como extracto celular. Se agregó triptófano sólido a una concentración de 10,2 mg/ml. Los controles negativos se configuraron sin Dhidroxifenilglicina aminotransferasa. Las muestras se incubaron a 30ºC con leve agitación durante aproximadamente 1 hora o durante la noche. Las muestras se centrifugaron para extraer el precipitado, se filtraron por jeringa y se almacenaron a −80ºC antes del análisis de la monatina mediante el uso del procedimiento de LC/MS/MS descrito en el ejemplo 1. The reaction mixtures (1 mL volume, performed in duplicate) contained 100 mM of potassium phosphate buffer (pH 8), 2 mM of MgCl2, 0.05 mM of pyridoxal 5'-phosphate (PLP), 200 mM of sodium pyruvate, 5 mM sodium acetoglutarate, approximately 280 µg / mL of S. meliloti TatA provided in a cell extract, 100 µL / mL of D-hydroxyphenylglycine aminotransferase cell extract or 1 mg / mL of D- Purified hydroxyphenylglycine aminotransferase and approximately 100 µg / mL ProA aldolase provided as a cell extract. Solid tryptophan was added at a concentration of 10.2 mg / ml. Negative controls were configured without Dhydroxyphenylglycine aminotransferase. The samples were incubated at 30 ° C with gentle shaking for approximately 1 hour or overnight. The samples were centrifuged to extract the precipitate, filtered by syringe and stored at -80 ° C before monatin analysis using the LC / MS / MS procedure described in Example 1.

Las D-hidroxifenilglicina aminotransferasas con una mayor actividad para la producción de monatina se preparan mediante técnicas de mutagénesis conocidas por los expertos en la técnica, que incluyen: PCR mutagénica, pasaje a través de cepas mutagénicas o mutagénesis dirigida al sitio. Las D-hidroxifenilglicina aminotransferasas mejoradas se seleccionan por el crecimiento en un medio mínimo con R,R-monatina como la fuente de nitrógeno. Inicialmente la selección se basó en el crecimiento pero como se seleccionaron las aminotransferasas mejoradas el análisis se basó en la velocidad de crecimiento. Es decir, se cultivaron las células con versiones mutadas del gen y el gen se expresó en un medio mínimo con R,R-monatina como la fuente de nitrógeno. Las velocidades de crecimiento celular con las versiones mutadas del gen se compararon con la versión sin mutar. Se seleccionaron las células con una velocidad de crecimiento más rápida y se analizó la aminotransferasa de forma adicional. La D-hidroxifenilglicina aminotransferasa se mutagenizó mediante técnicas disponibles como la PCR propensa a errores y el pasaje a través de las cepas mutagénicas o mediante procedimientos para los cuales se ha obtenido una licencia como reestructuración de ADN y otras tecnologías de evolución dirigida. D-hydroxyphenylglycine aminotransferases with increased activity for monatin production are prepared by mutagenesis techniques known to those skilled in the art, including: mutagenic PCR, passage through mutagenic strains, or site-directed mutagenesis. Enhanced D-hydroxyphenylglycine aminotransferases are selected for growth in minimal medium with R, R-monatin as the nitrogen source. Initially selection was based on growth but as the improved aminotransferases were selected the analysis was based on growth rate. That is, cells were cultured with mutated versions of the gene, and the gene was expressed in minimal medium with R, R-monatin as the nitrogen source. Cell growth rates with the mutated versions of the gene were compared to the unmutated version. Cells with a faster growth rate were selected and aminotransferase was further analyzed. D-hydroxyphenylglycine aminotransferase was mutagenized by available techniques such as error-prone PCR and passage through mutagenic strains or by procedures for which a license such as DNA restructuring and other directed evolution technologies has been obtained.

Ensayo de DPGAT DPGAT test

Se cultivaron las células con D-hidroxifenilglicina aminotransferasa recombinante, la proteína se expresó y las células se lisaron como se describe en el ejemplo 17 o mediante protocolos estándar. La proteína se expresó en su Cells were cultured with recombinant D-hydroxyphenylglycine aminotransferase, the protein was expressed, and cells were lysed as described in Example 17 or by standard protocols. The protein was expressed in its

receptor nativo mediante el uso de los procedimientos descritos (Wiyakrutta, W., Meevootisom, V. A stereoinverting D-phenylglycine aminotransferase from Pseudomonas stutzeri ST-201: purification, characterization, and application for D-phenylglycine synthesis. J. Biotechnol., 55: 193-203 (1997)). native receptor by using the procedures described (Wiyakrutta, W., Meevootisom, V. A stereoinverting D-phenylglycine aminotransferase from Pseudomonas stutzeri ST-201: purification, characterization, and application for D-phenylglycine synthesis. J. Biotechnol., 55 : 193-203 (1997)).

Se agregó extracto libre de células a la mezcla de reacción con las siguientes concentraciones finales: 100 mM de fosfato de potasio (pH 7,0 a 8,5), 60 mM de D-fenilglicina (o D-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 !M de PLP. Los ensayos se incubaron a temperatura ambiente, se tomaron alícuotas en intervalos de tiempo y se detuvieron mediante la adición de un volumen igual de ácido fórmico. El producto (L-glutamato) se cuantificó mediante los procedimientos descritos en el ejemplo 1. Cell-free extract was added to the reaction mixture with the following final concentrations: 100 mM potassium phosphate (pH 7.0 to 8.5), 60 mM D-phenylglycine (or D-4-hydroxyphenylglycine), 5 a-ketoglutarate mM, 50 µM PLP. The tests were incubated at room temperature, aliquoted at time intervals and stopped by adding an equal volume of formic acid. The product (L-glutamate) was quantified by the procedures described in Example 1.

Ejemplo 20 (ejemplo comparativo) Example 20 (comparative example)

Descubrimiento de un gen de D-metionina Aminotransferasa Discovery of a D-methionine aminotransferase gene

Antecedentes Background

Se considera que la D-metionina-piruvato aminotransferasa (EC 2.6.1.41) es otro ejemplo, aunque raro, de una transaminasa estereoinversora. Esta enzima cataliza la conversión reversible de la D-metionina y piruvato a Lalanina y 4-metiltio-2-oxobutanoato. El oxaloacetato, fenilpiruvato, 2-oxobutirato, 2-oxovalerato, 2-oxoheptanoato, glioxilato y oxoglutarato también puede servir como aceptantes amino. D-methionine pyruvate aminotransferase (EC 2.6.1.41) is considered to be another, albeit rare, example of a stereoinverting transaminase. This enzyme catalyzes the reversible conversion of D-methionine and pyruvate to Lalanine and 4-methylthio-2-oxobutanoate. Oxaloacetate, phenylpyruvate, 2-oxobutyrate, 2-oxovalerate, 2-oxoheptanoate, glyoxylate, and oxoglutarate can also serve as amino acceptors.

Se piensa que la transaminación de D o L metionina es parte de una vía para la producción de etileno en plantas superiores (coliflor, tomatera, manzano, guisante, banano, maní) así como microorganismos en el suelo (Escherichia coli, Pseudomonas pisi, Pseudomonas aeruginosa, Bacillus mycoides, Acinetobacter calcoaceticus, Aeromonas hydrophila B12E, Rhizobium trifolii N2P7, Penicillium digitatum, Saccharomyces cerevisiae, Corynebacterium D7F). Transamination of D or L methionine is thought to be part of a pathway for the production of ethylene in higher plants (cauliflower, tomato, apple, pea, banana, peanut) as well as microorganisms in the soil (Escherichia coli, Pseudomonas pisi, Pseudomonas aeruginosa, Bacillus mycoides, Acinetobacter calcoaceticus, Aeromonas hydrophila B12E, Rhizobium trifolii N2P7, Penicillium digitatum, Saccharomyces cerevisiae, Corynebacterium D7F).

D.C. Billington, B. T. Golding, y S. B. Primrose Biochem J. (1979) 182, 827-836. En las bacterias, la L-metionina se utiliza típicamente como el sustrato en los estudios de producción de etileno y se piensa que las enzimas de amplia especificidad como TyrB o AspC de E. coli son las responsables de la transaminación. No obstante, S. B. Primrose J. Gen. Microbiol. (1976), 95(1), 159-65 y S. B. Primrose J. Gen. Microbiol. (1977), 98, 519-528 mostraron que la cepa SPA O de E. coli (colección de cultivos de la Universidad de Warwick) produjo casi tanto etileno a partir de D-metionina como a partir de L-metionina en cultivos en lote. Debido a que no se identificó ninguna Daminotransferasa de amplia especificidad en E. coli, una posible explicación puede ser que la D-aminoácido deshidrogenasa de E. coli (codificada por el gen dadA) convierte a la D-metionina en 4-metiltio-2-oxobutanoato. También es posible que exista una metionina racemasa en E. coli; no obstante, ninguna enzima de dicho tipo ha sido descrita en la bibliografía. D.C. Billington, B. T. Golding, and S. B. Primrose Biochem J. (1979) 182, 827-836. In bacteria, L-methionine is typically used as the substrate in ethylene production studies and broadly specific enzymes such as TyrB or AspC from E. coli are thought to be responsible for transamination. However, S. B. Primrose J. Gen. Microbiol. (1976), 95 (1), 159-65 and S. B. Primrose J. Gen. Microbiol. (1977), 98, 519-528 showed that the E. coli strain SPA O (University of Warwick culture collection) produced almost as much ethylene from D-methionine as from L-methionine in batch cultures . Because no broadly specific Daminotransferase was identified in E. coli, one possible explanation may be that E. coli D-amino acid dehydrogenase (encoded by the dadA gene) converts D-methionine to 4-methylthio-2 -oxobutanoate. It is also possible that a methionine racemase exists in E. coli; however, no such enzyme has been described in the literature.

Contrariamente a E. coli, en las cabezuelas de coliflor (preparaciones de extracto mitocondrial) y en las semillas germinativas de maní, la producción de etileno fue mayor cuando se proporcionó D-metionina y piruvato al extracto enzimático en comparación con la L-metionina y piruvato (L. W. Mapson, J. F. March, and D. A. Wardale Biochem J (1969) 115, 653-661; J. I. Durham, P. W. Morgan, J. M. Prescott y d C. M. Lyman Phytochemistry (1973) 12, 21232126). Por consiguiente, la posibilidad de una combinación de metionina racemasa y una L-aminotransferasa no se encuentra respaldada por los datos. La actividad de la deshidrogenasa se descartó por diálisis de los extractos celulares de coliflor, no se encontró ningún NAD en las mezclas de ensayo. Se descartó la actividad de oxidasa ya que no se detectó consumo de oxígeno y no hubo ningún requisito de FAD. La D-metionina aminotransferasa de los tejidos de maní se purificó, mostró depender de PLP y mostró ser independiente de la actividad de la L-metionina aminotransferasa. Existe una posibilidad de que estas D-metionina—piruvato aminotransferasas produzcan efectivamente D-alanina como un subproducto (similar a las enzimas de Bacillus descritas en los ejemplos 13 y 14) y que las células contengan alanina racemasa para reciclar la D-alanina nuevamente a L-alanina (o un donante amino análogo). En cualquiera de los casos, el descubrimiento de la D-aminotransferasa de amplia especificidad en plantas más altas es ventajoso para el desarrollo de procesos que producen R,R monatina o (S,R)-monatina. Contrary to E. coli, in cauliflower heads (mitochondrial extract preparations) and in peanut sprouts, ethylene production was higher when D-methionine and pyruvate were provided to the enzyme extract compared to L-methionine and pyruvate (LW Mapson, JF March, and DA Wardale Biochem J (1969) 115, 653-661; JI Durham, PW Morgan, JM Prescott and d CM Lyman Phytochemistry (1973) 12, 21232126). Therefore, the possibility of a combination of methionine racemase and an L-aminotransferase is not supported by the data. Dehydrogenase activity was ruled out by dialysis of the cauliflower cell extracts, no NAD was found in the test mixtures. Oxidase activity was ruled out since no oxygen consumption was detected and there was no FAD requirement. D-methionine aminotransferase from peanut tissues was purified, shown to be dependent on PLP and shown to be independent of L-methionine aminotransferase activity. There is a possibility that these D-methionine-pyruvate aminotransferases actually produce D-alanine as a by-product (similar to the Bacillus enzymes described in Examples 13 and 14) and that cells contain alanine racemase to recycle D-alanine back to L-alanine (or an amino analog donor). In either case, the discovery of broadly specific D-aminotransferase in taller plants is advantageous for the development of processes that produce R, R monatin or (S, R) -monatin.

Resumen experimental Experimental summary

La D-metionina aminotransferasa se purifica parcialmente a partir de las cabezuelas de coliflor y de los embriones de maní germinativos mediante el uso de los protocolos de cromatografía estándar y del sistema Pharmacia AKTA Explorer. Las secuencias de proteínas de las proteínas homólogas se determinan mediante técnicas de huella genética LC/MS/MS y la búsqueda en la base de datos realizada por el centro Harvard Microchemistry. Las regiones codificadoras de los genes de la planta se clonan a partir de la biblioteca de ADNc mediante el uso de los protocolos de PCR estándar o mediante la síntesis del gen como se describe en el ejemplo 19. D-methionine aminotransferase is partially purified from cauliflower heads and germ peanut embryos using standard chromatography protocols and the Pharmacia AKTA Explorer system. Protein sequences of homologous proteins are determined by LC / MS / MS fingerprint techniques and database search by the Harvard Microchemistry Center. The coding regions of the plant genes are cloned from the cDNA library using standard PCR protocols or by gene synthesis as described in Example 19.

De forma alternativa, las bibliotecas de expresión de ADNc se construyen (Stratagene, La Jolla, CA) a partir de tejido de coliflor o semillas de maní desarrolladas en la presencia de D-metionina (y con producción de etileno). Las bibliotecas se transforman en auxótrofos de metionina de E. coli a partir del centro de linaje genético (Yale) de E. coli como las cepas RC519 o AB1931. Los plásmidos de las cepas capaces de crecer en un medio mínimo que contiene D-metionina contienen la región codificadora de interés (véase el ejemplo 15, una técnica de análisis análoga). Alternatively, cDNA expression libraries are constructed (Stratagene, La Jolla, CA) from cauliflower tissue or groundnut seeds grown in the presence of D-methionine (and with ethylene production). Libraries are transformed into E. coli methionine auxotrophs from the E. coli genetic lineage center (Yale) as strains RC519 or AB1931. The plasmids from the strains capable of growing in minimal medium containing D-methionine contain the coding region of interest (see Example 15, an analogous analysis technique).

Una vez que las regiones codificadoras de interés se obtienen y se expresan en una cepa de laboratorio estándar de Once the coding regions of interest are obtained and expressed in a standard laboratory strain of

E. coli, los productos génicos resultantes pueden utilizarse en ensayos para producir (R,R)-monatina como se describe en el ejemplo 19 en lugar de la D-hidroxifenilglicina aminotransferasa, con la excepción del pH que es de 7,5 (el pH óptimo para la aminotransferasa). Si la D-metionina aminotransferasa tiene un requisito estricto de sustratos donantes de D-aminoácido, la enzima puede utilizarse para preparar (R,R)-monatina como se describe en los ejemplos 13 y 14. Los genes pueden mutagenizarse y analizarse para detectar el aumento en la actividad como se describe en el ejemplo 19. E. coli, the resulting gene products can be used in assays to produce (R, R) -monatin as described in Example 19 in place of D-hydroxyphenylglycine aminotransferase, with the exception of the pH being 7.5 (the Optimal pH for aminotransferase). If D-methionine aminotransferase has a strict requirement for D-amino acid donor substrates, the enzyme can be used to prepare (R, R) -monatin as described in Examples 13 and 14. Genes can be mutagenized and analyzed to detect increased activity as described in Example 19.

Procedimientos Procedures

Aislamiento de coliflor Cauliflower insulation

Se extrajeron 400 gramos de cabezuelas de coliflor recién recogidas con 400 mL de una solución de sacarosa/tampón a 4ºC (0,4 M de sacarosa y 0,1 M de tampón de fosfato de sodio, pH 7,4) mediante la alternación de remojo y mezclado con el uso de una mezcladora. El residuo celular se extrajo por filtración con estopilla y la solución resultante se centrifugó a 40,000×g durante 30 minutos a 4ºC. El material sólido (que contenía organelos mitocondriales) se volvió a suspender en 20 mL de tampón de fosfato de sodio 10 mM, pH 7,4 y las enzimas se extrajeron con 200 mL de acetona fría (−30ºC). La suspensión se volvió a centrifugar y el precipitado se secó mediante el uso de Savant Speed Vac. El material sólido se disolvió en 10 mM de tampón de fosfato de sodio, pH 7,4 y la acetona residual se extrajo mediante el uso de una columna PD-10 (GE Healthcare, Piscataway, NJ). 400 grams of freshly collected cauliflower heads were extracted with 400 mL of a sucrose / buffer solution at 4 ° C (0.4M sucrose and 0.1M sodium phosphate buffer, pH 7.4) by alternating soaking and mixing with the use of a mixer. The cell debris was filtered off with cheesecloth and the resulting solution was centrifuged at 40,000 × g for 30 min at 4 ° C. The solid material (containing mitochondrial organelles) was resuspended in 20 mL of 10mM sodium phosphate buffer, pH 7.4, and the enzymes were extracted with 200 mL of cold acetone (−30 ° C). The suspension was recentrifuged and the precipitate was dried using Savant Speed Vac. The solid material was dissolved in 10 mM sodium phosphate buffer, pH 7.4, and the residual acetone was extracted using a PD-10 column (GE Healthcare, Piscataway, NJ).

La actividad de la aminotransferasa se analizó mediante la incubación de la preparación de enzimas con 5 mM de Dmetionina, 1 mM de piruvato, 0,05 mM de PLP y 2 mM de EDTA en 0,1 M de tampón de fosfato de sodio, pH 7,4. Los ensayos se realizaron a 25ºC durante 16 horas. El 4-Metiltio-2-oxobutanoato se midió a través de la formación del derivado de 2,4-dinitrofenilhidrazona, mediante el uso de LC/MS (m/z de 328) y metodologías similares descritas en el ejemplo 1. Se preparó una solución (p/v) al 0,4% de 2,4-dinitrofenilhidrazina en 2M de ácido sulfúrico y se agregó la mitad del volumen a la mezcla de ensayo después de la incubación. La mezcla se mezcló con leve agitación a 30ºC durante 30 minutos y el precipitado se recolectó mediante centrifugación y se analizó mediante LC/MS. Las fracciones de proteínas separadas mediante técnicas cromatográficas estándar se analizaron para verificar la actividad en una forma similar, pero la alanina coproducto se midió por la técnica de derivatización post columna con OPA descrita en el ejemplo 1. Aminotransferase activity was analyzed by incubating the enzyme preparation with 5mM Dmethionine, 1mM pyruvate, 0.05mM PLP and 2mM EDTA in 0.1M sodium phosphate buffer, pH 7.4. The tests were carried out at 25 ° C for 16 hours. 4-Methylthio-2-oxobutanoate was measured through the formation of the 2,4-dinitrophenylhydrazone derivative, using LC / MS (m / z 328) and similar methodologies described in Example 1. A 0.4% (w / v) solution of 2,4-dinitrophenylhydrazine in 2M sulfuric acid and half the volume was added to the test mixture after incubation. The mixture was mixed with gentle stirring at 30 ° C for 30 minutes and the precipitate was collected by centrifugation and analyzed by LC / MS. Protein fractions separated by standard chromatographic techniques were analyzed to verify activity in a similar way, but the co-product alanine was measured by the OPA post-column derivatization technique described in Example 1.

Aislamiento de maní (Arachia hypogea L. cv. Starr) Peanut Isolation (Arachia hypogea L. cv. Starr)

La enzima D-metionina aminotransferasa del homogenado de embriones de maní germinativo (menos las cotiledóneas) se purifica de conformidad con el procedimiento de J. I. Durham, P. W. Morgan, J. M. Prescott y C. M. Lyman Phytochemistry (1973) 12, 2123-2126. Los agentes reductores se utilizan durante la preparación de extractos brutos para estabilizar las enzimas y el residuo celular se elimina mediante centrifugación a 33,000×g. La fracción de un 35 a un 50% de sulfato de amonio se purifica de forma adicional mediante incubación a baja temperatura y mediante la eliminación de las proteínas en el precipitado. El sobrenadante se fracciona de forma adicional mediante el uso de acetona. Los grupos activos a continuación se purifican de forma adicional mediante cromatografía de filtración en gel (Sephadex 200, GE Healthcare, Piscataway, NJ). The enzyme D-methionine aminotransferase from the germ peanut embryo homogenate (minus cotyledons) is purified according to the procedure of J. I. Durham, P. W. Morgan, J. M. Prescott and C. M. Lyman Phytochemistry (1973) 12, 2123-2126. Reducing agents are used during the preparation of crude extracts to stabilize the enzymes and the cell debris is removed by centrifugation at 33,000 × g. The 35 to 50% ammonium sulfate fraction is further purified by incubation at low temperature and by removal of proteins in the precipitate. The supernatant is further fractionated using acetone. The active groups below are further purified by gel filtration chromatography (Sephadex 200, GE Healthcare, Piscataway, NJ).

A medida que las fracciones de proteínas se enriquecen con la proteína transaminasa, se utiliza la electroforesis en gel 2D para separar la enzima de interés para el microsecuenciado. Después de la elucidación de los homólogos, las regiones codificadoras en las secuencias de la planta depositadas en NCBI, la proteína D-aminotransferasa se produce recombinantemente en Escherichia coli mediante el uso de técnicas de biología molecular estándar. Se espera que los extractos celulares de las cabezuelas de coliflor o de las semillas de maní o de las enzimas homólogas producidas recombinantemente puedan utilizarse en la producción de (R,R)-monatina como se describe en el ejemplo 19 (si es una transaminasa estereoinversora) o en los ejemplos 13 y 14 (si es una D-aminotransferasa de amplia especificidad). As protein fractions are enriched with protein transaminase, 2D gel electrophoresis is used to separate the enzyme of interest for microsequencing. After elucidation of the homologs, the coding regions in the plant sequences deposited in NCBI, the protein D-aminotransferase is produced recombinantly in Escherichia coli by using standard molecular biology techniques. It is expected that the cell extracts of cauliflower heads or peanut seeds or recombinantly produced homologous enzymes can be used in the production of (R, R) -monatin as described in Example 19 (if it is a stereoinverting transaminase ) or in Examples 13 and 14 (if it is a broad specificity D-aminotransferase).

Ejemplo 21 (ejemplo comparativo) Example 21 (comparative example)

L-alanina aminotransferasa/ alanina racemasa/ D-alanina aminotransferasa L-alanine aminotransferase / alanine racemase / D-alanine aminotransferase

Las figuras 4, 6 y 8 ilustran las vías biosintéticas para producir (R,R)-monatina enriquecida estereoisoméricamente a partir de L-triptófano mediante el uso de una L-aminoácido aminotransferasa (como L-alanina-aminotransferasa y/o L-triptófano-aminotransferasa), una aldolasa R-específica, una alanina racemasa y una D-alanina aminotransferasa. Figures 4, 6 and 8 illustrate the biosynthetic pathways for producing stereoisomerically enriched (R, R) -monatin from L-tryptophan using an L-amino acid aminotransferase (such as L-alanine-aminotransferase and / or L-tryptophan -aminotransferase), an R-specific aldolase, an alanine racemase and a D-alanine aminotransferase.

En el ejemplo 16 se describe una aminotransferasa triptófano-específica. De forma alternativa, las tirosina (aromática) aminotransferasas de S. meliloti y R. sphaeroides se prepararon como se describe en el ejemplo 1 de WO 03/091396 A2.La ProA aldolasa de Comamonas testosteroni se preparó como se describe en el Ejemplo 4 de WO 03/091396 A2. La totalidad de los ensayos de proteínas se realizó mediante el uso de un ensayo de proteínas Bio-Rad de acuerdo con los protocolos del fabricante (Bio-Rad, Hercules, CA). La alanina racemasa se compró a Sigma-Aldrich (St. Louis, MO) (catálogo número A8936). La D-alanina aminotransferasa se compró a BioCatalytics (catálogo número AT-103) (BioCatalytics, Pasadena, CA). Example 16 describes a tryptophan-specific aminotransferase. Alternatively, the (aromatic) tyrosine aminotransferases of S. meliloti and R. sphaeroides were prepared as described in Example 1 of WO 03/091396 A2. The ProA aldolase from Comamonas testosteroni was prepared as described in Example 4 of WO 03/091396 A2. All of the protein assays were performed using a Bio-Rad protein assay according to the manufacturer's protocols (Bio-Rad, Hercules, CA). Alanine racemase was purchased from Sigma-Aldrich (St. Louis, MO) (catalog number A8936). D-Alanine Aminotransferase was purchased from BioCatalytics (Catalog Number AT-103) (BioCatalytics, Pasadena, CA).

Las L-alanina aminotransferasas se distribuyen ampliamente en eucariotas, bacterias y archaea. Se identificó que los siguientes organismos (con base en la homología de secuencia) contenían una L-alanina aminotransferasa (E.C. 2.6.1.2): Arabidopsis thaliana, Ashbya gossypii, Azotobacter vinelandii, Bifidobacterium longum, Caenorhabditis elegans, Candida albicans, Candida glabrata, Chlamydomonas reinhardtii, Cryptococcus neoformans, Debaryomyces hansenii, Homo sapiens, Hordeum vulgare, Kluyveromyces lactis, Magnaporthe grisea, Medicago truncatula, Mus musculus, Neurospora crassa, Oryza sativa, Phanerochaete chrysosporium, Pinus taeda, Pseudomonas putida, Pyrococcus abyssi, Pyrococcus furiosus, Pyrococcus horikoshii, Rattus norvegicus, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Takifugu rubripes, Trypanosoma cruzi, Vibrio cholerae, Vibrio parahaemolyticus, Vibrio vulnificus, Yarrowia lipolytica y Zea mays. Además, muchas aminotransferasas presentan un bajo nivel de actividad de alanina aminotransferasa y dado los altos niveles de L-glutamato y piruvato pueden convertirse en L-alanina y a-cetoglutarato. La enzima con baja actividad se mejora con técnicas de mutagénesis estándar como la PCR propensa a errores y el pasaje a través de las cepas mutagénicas o mediante técnicas de evolución dirigida. El gen para una L-alanina aminotransferasa se clona mediante el uso de cebadores de diseño disponibles públicamente y mediante el uso de técnicas estándar para amplificar, clonar, expresar y purificar el gen/enzima. L-alanine aminotransferases are widely distributed in eukaryotes, bacteria, and archaea. The following organisms (based on sequence homology) were identified as containing an L-alanine aminotransferase (EC 2.6.1.2): Arabidopsis thaliana, Ashbya gossypii, Azotobacter vinelandii, Bifidobacterium longum, Caenorhabditis elegans, Candida albicans, Candida glabrata, Chlamydom reinhardtii, Cryptococcus neoformans, Debaryomyces hansenii, Homo sapiens, Hordeum vulgare, Kluyveromyces lactis, Magnaporthe grisea, Medicago truncatula, Mus musculus, Neurospora crassa, Pyryasrocous, Pyus taedacoccus, Pus taedarocous Rattus norvegicus, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Takifugu rubripes, Trypanosoma cruzi, Vibrio cholerae, Vibrio parahaemolyticus, Vibrio vulnificus, Yarrowia lipolytica and Zea mays. Furthermore, many aminotransferases have a low level of alanine aminotransferase activity and given the high levels of L-glutamate and pyruvate they can be converted to L-alanine and a-ketoglutarate. The enzyme with low activity is improved with standard mutagenesis techniques such as error-prone PCR and passage through mutagenic strains or through directed evolution techniques. The gene for an L-alanine aminotransferase is cloned by using publicly available designer primers and by using standard techniques to amplify, clone, express and purify the gene / enzyme.

Las mezclas de reacción (1 mL de volumen, realizadas por duplicado) contenían 100 mM de tampón de fosfato de potasio (pH 8), 2 mM de MgCl2, 0,05 mM de piridoxal 5'-fosfato (PLP), 200 mM de piruvato de sodio, 5 mM de acetoglutarato de sodio, aproximadamente 280 !g/mL de TatA de S. meliloti proporcionado en un extracto celular (u otra aminotransferasa L-triptófano específica), 100 !L/mL de extracto celular de alanina racemasa o 1 mg/mL de alanina racemasa purificada, aproximadamente 280 !g/mL de D-alanina aminotransferasa proporcionada en un extracto celular y aproximadamente 100 !g/mL de ProA aldolasa proporcionada como extracto celular. Se agregó triptófano sólido a una concentración de 10,2 mg/ml. Los controles negativos se configuraron sin alanina racemasa. Las muestras se incubaron a 30ºC con leve agitación durante aproximadamente 1 hora o durante la noche. Las muestras se centrifugaron para extraer el precipitado, se filtraron por jeringa y se almacenaron a −80ºC antes del análisis de la monatina mediante el uso del procedimiento de LC/MS/MS descrito en el ejemplo 1. En estas mezclas de reacción, si la L-triptófano aminotransferasa puede utilizar a-cetoglutarato pero no piruvato, como aceptante amino, puede agregarse una L-alanina aminotransferasa que convierte el L-glutamato y piruvato a L-alanina y acetoglutarato, como se muestra en la figura 6. The reaction mixtures (1 mL volume, performed in duplicate) contained 100 mM of potassium phosphate buffer (pH 8), 2 mM of MgCl2, 0.05 mM of pyridoxal 5'-phosphate (PLP), 200 mM of sodium pyruvate, 5 mM sodium acetoglutarate, approximately 280 µg / mL of S. meliloti TatA provided in a cell extract (or other specific L-tryptophan aminotransferase), 100 µL / mL of alanine racemase cell extract or 1 mg / mL of purified alanine racemase, about 280 µg / mL of D-alanine aminotransferase provided in a cell extract and about 100 µg / mL of ProA aldolase provided as a cell extract. Solid tryptophan was added at a concentration of 10.2 mg / ml. Negative controls were configured without alanine racemase. The samples were incubated at 30 ° C with gentle shaking for approximately 1 hour or overnight. The samples were centrifuged to extract the precipitate, filtered by syringe and stored at −80 ° C before monatin analysis using the LC / MS / MS procedure described in Example 1. In these reaction mixtures, if the L-tryptophan aminotransferase can use α-ketoglutarate but not pyruvate, as the amino acceptor, an L-alanine aminotransferase can be added that converts L-glutamate and pyruvate to L-alanine and acetoglutarate, as shown in figure 6.

Ejemplo 22 Example 22

Subclonación de genes que codifican las aldolasas de la SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44 y 116 Subcloning of genes encoding aldolases of SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44 and 116

Los genes que codifican las aldolasas que tienen las secuencias de aminoácidos de la SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44 y 116 se subclonaron en el vector de expresión pET28b (Novagen, Madison, WI) con marcadores His con terminales N para permitir la purificación. La SEQ ID NO:275 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:276. La SEQ ID NO:243 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:244. La SEQ ID NO:217 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:218. La SEQ ID NO:227 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:228. La SEQ ID NO:161 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:162. La SEQ ID NO:49 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:50. La SEQ ID NO:73 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:74. La SEQ ID NO:43 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:44. La SEQ ID NO:115 es la secuencia del gen que codifica la aldolasa que tiene la secuencia de aminoácidos de la SEQ ID NO:116. Genes encoding aldolases having the amino acid sequences of SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44, and 116 were subcloned into the expression vector pET28b (Novagen, Madison, WI) with N-terminal His markers to allow purification. SEQ ID NO: 275 is the sequence of the gene encoding aldolase that has the amino acid sequence of SEQ ID NO: 276. SEQ ID NO: 243 is the gene sequence encoding aldolase that has the amino acid sequence of SEQ ID NO: 244. SEQ ID NO: 217 is the sequence of the gene encoding aldolase that has the amino acid sequence of SEQ ID NO: 218. SEQ ID NO: 227 is the sequence of the gene encoding aldolase that has the amino acid sequence of SEQ ID NO: 228. SEQ ID NO: 161 is the sequence of the gene encoding aldolase that has the amino acid sequence of SEQ ID NO: 162. SEQ ID NO: 49 is the gene sequence encoding aldolase that has the amino acid sequence of SEQ ID NO: 50. SEQ ID NO: 73 is the sequence of the gene encoding aldolase that has the amino acid sequence of SEQ ID NO: 74. SEQ ID NO: 43 is the gene sequence encoding aldolase that has the amino acid sequence of SEQ ID NO: 44. SEQ ID NO: 115 is the sequence of the gene encoding aldolase that has the amino acid sequence of SEQ ID NO: 116.

Los cebadores utilizados para la clonación se muestran en la tabla 24. The primers used for cloning are shown in Table 24.

Tabla 24 Table 24

ADN de aldolasa SEQ ID NO.: Aldolase DNA SEQ ID NO .:
cebador 5’ cebador 3’ primer 5 ’ primer 3 ’

275 275
5'-ATAAGACATATGCCTATCGTTGTTACGAAG3' (SEQ ID NO: 339) 5'-ATAAGAGGATCCTTATTCCTCGGGCAGCCGCT C-3' (SEQ ID NO: 340) 5'-ATAAGACATATGCCTATCGTTGTTACGAAG3 '(SEQ ID NO: 339) 5'-ATAAGAGGATCCTTATTCCTCGGGCAGCCGCT C-3 '(SEQ ID NO: 340)

243 243
5'-ATAAGACATATGAACAGACCTGTGGTTGTC -3' (SEQ ID NO: 341) 5'-ATAAGAGGATCCTTACAGGTACTTGAGACCGA G-3' (SEQ ID NO: 342) 5'-ATAAGACATATGAACAGACCTGTGGTTGTC -3 '(SEQ ID NO: 341) 5'-ATAAGAGGATCCTTACAGGTACTTGAGACCGA G-3 '(SEQ ID NO: 342)

ADN de aldolasa SEQ ID NO.: Aldolase DNA SEQ ID NO .:
cebador 5’ cebador 3’ primer 5 ’ primer 3 ’

217 217
5'-ATAAGACATATGAGCGTGGTCATCCGAAAC -3' (SEQ ID NO: 343) 5'-ATAAGAGGATCCTTACTTCGCTTTGTTATAGG C-3' (SEQ ID NO: 344) 5'-ATAAGACATATGAGCGTGGTCATCCGAAAC -3 '(SEQ ID NO: 343) 5'-ATAAGAGGATCCTTACTTCGCTTTGTTATAGG C-3 '(SEQ ID NO: 344)

227 227
5'-ATAAGACATATGAACAAG (SEQ ID NO: 345) 5'-ATAAGAGGATCCTTACAA (SEQ ID NO: 346) 5'-ATAAGACATATGAACAAG (SEQ ID NO: 345) 5'-ATAAGAGGATCCTTACAA (SEQ ID NO: 346)

161 161
5'-ATAAGACATATGAGCGTGGTCGTCACCGG3' (SEQ ID NO: 347) 5'-ATAAGAGGATCCTTAGCCGTTTTTCCCGTCGG TG-3' (SEQ ID NO: 348) 5'-ATAAGACATATGAGCGTGGTCGTCACCGG3 '(SEQ ID NO: 347) 5'-ATAAGAGGATCCTTAGCCGTTTTTCCCGTCGG TG-3 '(SEQ ID NO: 348)

49 49
5'-AGAAGACATATGATGAGCATCGTCGTCCA GAAC-3' (SEQ ID NO: 349) 5'-AGAAGAGGATCCTCAGACATATTTCAGGCCCT TG-3' (SEQ ID NO: 350) 5'-AGAAGACATATGATGAGCATCGTCGTCCA GAAC-3 '(SEQ ID NO: 349) 5'-AGAAGAGGATCCTCAGACATATTTCAGGCCCT TG-3 '(SEQ ID NO: 350)

73 73
5'-AGAAGACATATGATGAGCGTGGTCATCAC C-3' (SEQ ID NO: 351) 5'-ACAACAGGATCCCTATTTCTTCTCCGGCGTTT C-3' (SEQ ID NO: 352) 5'-AGAAGACATATGATGAGCGTGGTCATCAC C-3 '(SEQ ID NO: 351) 5'-ACAACAGGATCCCTATTTCTTCTCCGGCGTTT C-3 '(SEQ ID NO: 352)

43 43
5'-ATAATACATATGAGCGTC (SEQ ID NO: 353) 5'-ATAATAGGATCCTTAGAC (SEQ ID NO: 354) 5'-ATAATACATATGAGCGTC (SEQ ID NO: 353) 5'-ATAATAGGATCCTTAGAC (SEQ ID NO: 354)

115 115
5'-AGAAGACATATGATGTCG (SEQ ID NO: 355) 5'-AGAAGAGGATCCTCAGAT(SEQ ID NO: 356) 5'-AGAAGACATATGATGTCG (SEQ ID NO: 355) 5'-AGAAGAGGATCCTCAGAT (SEQ ID NO: 356)

Los genes que codifican las aldolasas anteriores se amplificaron mediante PCR y se digirieron con enzimas adecuadas (Nde I y BamH I) y se purificaron en gel (kit de extracción en gel QiAquick® (Qiagen, Valencia, CA)). Los digestos se ligaron individualmente a pET28 que había sido digerido con Nde I y BamH I y se purificaron en gel. La Genes encoding the above aldolases were amplified by PCR and digested with suitable enzymes (Nde I and BamH I) and gel purified (QiAquick® Gel Extraction Kit (Qiagen, Valencia, CA)). The digests were individually ligated to pET28 which had been digested with Nde I and BamH I and gel purified. The

5 ligación se transformó en células TOP10 (Invitrogen, Carlsbad, CA). El ADN miniprep de las colonias individuales se analizó para verificar la presencia de inserciones mediante el análisis de tamaño con el uso de electroforesis en gel de agarosa. Los aislados con una inserción se sometieron a análisis de secuencias de ADN (Agencourt, Beverly, MA). Ligation was transformed into TOP10 cells (Invitrogen, Carlsbad, CA). DNA miniprep from individual colonies was analyzed for the presence of insertions by size analysis using agarose gel electrophoresis. Isolates with an insert were subjected to DNA sequence analysis (Agencourt, Beverly, MA).

Purificación de aldolasas Aldolase purification

10 Los clones de aldolasa confirmados se transformaron en BL21(DE3) o BL21(DE3) pLysS. La inducción se llevó a cabo durante la noche en caldo Terrific a 30ºC. Los cultivos desarrollados durante la noche con el antibiótico adecuado se diluyeron en un medio fresco (típicamente 1:100) y se cultivaron a una OD600 de aproximadamente 0,6 con aireación a 37ºC. Los cultivos después se indujeron con 1 mM de IPTG y se cambiaron a 30ºC (con aireación) y la incubación continuó durante la noche. Las células se cosecharon mediante centrifugación. El sedimento celular se Confirmed aldolase clones were transformed into BL21 (DE3) or BL21 (DE3) pLysS. Induction was carried out overnight in Terrific broth at 30 ° C. Cultures grown overnight with the appropriate antibiotic were diluted in fresh medium (typically 1: 100) and grown at an OD600 of approximately 0.6 with aeration at 37 ° C. Cultures were then induced with 1mM IPTG and changed at 30 ° C (with aeration) and incubation continued overnight. Cells were harvested by centrifugation. The cell sediment is

15 sometió típicamente a un ciclo de congelado y descongelado para ayudar a la lisis celular. El sedimento celular se lisó en BugBuster y Benzonasa Nucleasa (Novagen, Madison, WI) (de acuerdo con el protocolo del fabricante). El residuo celular se eliminó mediante centrifugación. El extracto de proteína bruto se aplicó a una columna HIS-Bind de 10 mg de capacidad (Novagen, Madison, WI) que había sido preparada de acuerdo con el protocolo del fabricante. La columna se lavó y la proteína se eluyó de acuerdo con el protocolo del fabricante. La proteína 15 typically underwent a freeze-thaw cycle to aid cell lysis. The cell pellet was lysed in BugBuster and Benzonase Nuclease (Novagen, Madison, WI) (according to the manufacturer's protocol). Cell debris was removed by centrifugation. The crude protein extract was applied to a 10 mg HIS-Bind column (Novagen, Madison, WI) that had been prepared according to the manufacturer's protocol. The column was washed and the protein was eluted according to the manufacturer's protocol. The protein

20 purificada se desaló con columnas PD-10 (GE Healthcare, Piscataway, NJ) y se eluyó en 50 mM de tampón de fosfato de potasio, pH 7,5, que contenía 4 mM de MgCl2, 200 mM de NaCl. La proteína se concentró con concentradores de centrifugación Amicon (5000 MW de corte) (Millipore, Billerica, MA). Después de la concentración se notó que las aldolasas de la SEQ ID NO: 44, SEQ ID NO: 28 y SEQ ID NO: 276 mostraron un cierto nivel de precipitación, a pesar de que la actividad aún era bastante alta. Las proteínas se almacenaron a −80ºC hasta su Purified 20 was desalted with PD-10 columns (GE Healthcare, Piscataway, NJ) and eluted in 50mM potassium phosphate buffer, pH 7.5, containing 4mM MgCl2, 200mM NaCl. The protein was concentrated with Amicon centrifuge concentrators (5000 MW cut-off) (Millipore, Billerica, MA). After concentration it was noted that the aldolases of SEQ ID NO: 44, SEQ ID NO: 28 and SEQ ID NO: 276 showed a certain level of precipitation, although the activity was still quite high. Proteins were stored at −80ºC until

25 ensayo. 25 trial.

Los ensayos de proteínas se realizaron mediante el uso del kit Pierce BCA (Pierce, Rockford, IL) y el protocolo de placa de microvaloración con albúmina de suero bovino (“BSA”) como la proteína estándar. Se utilizó el sistema de electroforesis Experion Pro260 (Bio-Rad, Hercules, CA) o SDS-PAGE para estimar el porcentaje de aldolasa en la muestra purificada y para evaluar los niveles de expresión en el extracto celular soluble y en la proteína total. Protein assays were performed using the Pierce BCA Kit (Pierce, Rockford, IL) and the Bovine Serum Albumin Microtiter Plate ("BSA") protocol as the standard protein. The Experion Pro260 electrophoresis system (Bio-Rad, Hercules, CA) or SDS-PAGE was used to estimate the percentage of aldolase in the purified sample and to evaluate the expression levels in the soluble cell extract and in the total protein.

30 Prueba de las aldolasas purificadas 30 Test for purified aldolases

Las aldolasas purificadas se probaron para verificar su capacidad de producir (R,R)-monatina a partir de D-triptófano y se compararon con las aldolasas de la SEQ ID NO:28 y la SEQ ID NO:54 preparadas de la misma forma. Los ensayos se realizaron en tubos de microcentrifugadora (por duplicado) con proteína purificada, mediante el uso de la misma concentración de enzima por ensayo (50 !g/mL) con la excepción de la SEQ ID NO:244, para la cual se 5 utilizó 25 !g/mL. La SEQ ID NO:243 no se expresó bien y proporcionó menores cantidades de proteína purificada. Se utilizaron 2 mg/mL de AT-103 de BioCatalytics (BioCatalytics, Pasadena, CA) como la D-aminotransferasa. Cada 1 mL de mezcla de reacción se agregó lo siguiente: aldolasa, 4 mM de MgCl2, 50 mM de D-triptófano, Daminotransferasa, 200 mM de piruvato de sodio, 100 mM de tampón de fosfato de potasio, pH 7,5 y 0,05 mM de PLP. Las muestras se incubaron a 30ºC. Se tomaron muestras a los 30 minutos, a la hora, a las 3 horas y durante la The purified aldolases were tested to verify their ability to produce (R, R) -monatin from D-tryptophan and compared to aldolases of SEQ ID NO: 28 and SEQ ID NO: 54 prepared in the same way. The tests were performed in microcentrifuge tubes (in duplicate) with purified protein, using the same concentration of enzyme per test (50 µg / mL) with the exception of SEQ ID NO: 244, for which 5 used 25 µg / mL. SEQ ID NO: 243 was not well expressed and provided lower amounts of purified protein. 2 mg / mL AT-103 from BioCatalytics (BioCatalytics, Pasadena, CA) was used as the D-aminotransferase. The following was added to each 1 mL of reaction mixture: aldolase, 4 mM MgCl2, 50 mM D-tryptophan, Daminotransferase, 200 mM sodium pyruvate, 100 mM potassium phosphate buffer, pH 7.5 and 0 0.05 mM PLP. The samples were incubated at 30ºC. Samples were taken at 30 minutes, on the hour, at 3 hours and during the

10 noche (19 horas). La tabla 25 muestra los resultados promediados de la monatina total producida en cada intervalo de tiempo y el % de (R,R)-monatina producido, como se determina por las áreas de los picos de la fase inversa. En la columna 3 de la tabla 25, se realizó un análisis de derivatización adicional de la FDAA por LC/MS/MS como se describe en el ejemplo 1, para algunas de las reacciones y dichos resultados se muestran en el paréntesis. 10 night (19 hours). Table 25 shows the averaged results of the total monatin produced at each time interval and the% of (R, R) -monatin produced, as determined by the peak areas of the reverse phase. In column 3 of Table 25, an additional FDAA derivatization analysis by LC / MS / MS was performed as described in Example 1, for some of the reactions and these results are shown in parentheses.


Tabla 25: Monatina total producida a partir de D-triptófano y % de R,R

Table 25: Total monatin produced from D-tryptophan and% R, R

Aldolasa (horas) Aldolasa (hours)
Monatina total (ppm) % de (R,R)-monatina Total monatin (ppm) % of (R, R) -monatin

SEQ ID NO: 28 (0,5) SEQ ID NO: 28 (0.5)
16 99,1 16 99.1

SEQ ID NO: 28 (1) SEQ ID NO: 28 (1)
53,2 99,2 (99,0) 53.2 99.2 (99.0)

SEQ ID NO: 28 (3) SEQ ID NO: 28 (3)
207,8 98,6 (98,1) 207.8 98.6 (98.1)

SEQ ID NO: 28 (19) SEQ ID NO: 28 (19)
544,9 95,3 (93,2) 544.9 95.3 (93.2)

SEQ ID NO: 44 (0,5) SEQ ID NO: 44 (0.5)
46,2 88,0 46.2 88.0

SEQ ID NO: 44 (1) SEQ ID NO: 44 (1)
92,5 86,8 92.5 86.8

SEQ ID NO: 44 (3) SEQ ID NO: 44 (3)
319,7 76,4 319.7 76.4

SEQ ID NO: 44 (19) SEQ ID NO: 44 (19)
762,9 67,1 762.9 67.1

SEQ ID NO: 54 (0,5) SEQ ID NO: 54 (0.5)
35,3 96,2 35.3 96.2

SEQ ID NO: 54 (1) SEQ ID NO: 54 (1)
82,7 96,1 82.7 96.1

SEQ ID NO: 54 (3) SEQ ID NO: 54 (3)
280,1 92,9 280.1 92.9

SEQ ID NO: 54 (19) SEQ ID NO: 54 (19)
715,3 77,1 715.3 77.1

SEQ ID NO: 74 (0,5) SEQ ID NO: 74 (0.5)
51,1 92,6 51.1 92.6

SEQ ID NO: 74 (1) SEQ ID NO: 74 (1)
89,3 94,3 89.3 94.3

SEQ ID NO: 74 (3) SEQ ID NO: 74 (3)
269,5 89,9 269.5 89.9

SEQ ID NO: 74(19) SEQ ID NO: 74 (19)
701,9 76,2 701.9 76.2

SEQ ID NO: 50 (0,5) SEQ ID NO: 50 (0.5)
55,9 96,7 55.9 96.7

SEQ ID NO: 50 (1) SEQ ID NO: 50 (1)
96,5 96,2 96.5 96.2

SEQ ID NO: 50 (3) SEQ ID NO: 50 (3)
272,2 95,6 272.2 95.6

SEQ ID NO: 50 (19) SEQ ID NO: 50 (19)
645,8 88,5 645.8 88.5

SEQ ID NO: 162 (0,5) SEQ ID NO: 162 (0.5)
37,3 95,7 37.3 95.7

SEQ ID NO: 162 (1) SEQ ID NO: 162 (1)
75,0 97,1 75.0 97.1

SEQ ID NO: 162 (3) SEQ ID NO: 162 (3)
261,0 95,9 261.0 95.9

SEQ ID NO: 162 (19) SEQ ID NO: 162 (19)
633,1 87,0 633.1 87.0

SEQ ID NO: 276 (0,5) SEQ ID NO: 276 (0.5)
37,8 98,8 37.8 98.8

SEQ ID NO: 276 (1) SEQ ID NO: 276 (1)
71,2 99,3 (99,5) 71.2 99.3 (99.5)

SEQ ID NO: 276 (3) SEQ ID NO: 276 (3)
245,2 99,0 (99,0) 245.2 99.0 (99.0)

SEQ ID NO: 276 (19) SEQ ID NO: 276 (19)
585,4 96,7 (96,1) 585.4 96.7 (96.1)

SEQ ID NO: 244 (0,5) SEQ ID NO: 244 (0.5)
30,2 97,7 30.2 97.7

SEQ ID NO: 244 (1) SEQ ID NO: 244 (1)
46,4 98,3 (99,2) 46.4 98.3 (99.2)

SEQ ID NO: 244 (3) SEQ ID NO: 244 (3)
165 98,4 (98,7) 165 98.4 (98.7)

SEQ ID NO: 244 (19) SEQ ID NO: 244 (19)
572,5 95,6 (93,7) 572.5 95.6 (93.7)

SEQ ID NO: 228 (0,5) SEQ ID NO: 228 (0.5)
52 95,0 52 95.0

SEQ ID NO: 228 (1) SEQ ID NO: 228 (1)
81,7 96,5 81.7 96.5

SEQ ID NO: 228 (3) SEQ ID NO: 228 (3)
251 95,9 251 95.9

SEQ ID NO: 228 (19) SEQ ID NO: 228 (19)
723 87,1 723 87.1

sin aldolasa (0,5) without aldolase (0.5)
0 0

sin aldolasa (1) aldolase-free (1)
0 0

sin aldolasa (3) aldolase-free (3)
0,6 58,3 0.6 58.3

sin aldolasa (19) aldolase-free (19)
6,5 61,5 6.5 61.5

La aldolasa de la SEQ ID NO:276 mantuvo un alto nivel de actividad, así como la mayor estereoespecificidad para la producción de (R,R)-monatina. El almacenamiento de esta enzima en un tampón con la omisión de cloruro de sodio parece reducir el nivel de precipitación notado anteriormente. La concentración de magnesio en el tampón de The aldolase from SEQ ID NO: 276 maintained a high level of activity, as well as the highest stereospecificity for the production of (R, R) -monatin. Storage of this enzyme in a buffer with the omission of sodium chloride appears to reduce the level of precipitation noted above. The magnesium concentration in the buffer

5 almacenamiento no parece tener un impacto sobre el nivel de precipitación. Storage does not appear to have an impact on the level of precipitation.

Las aldolasas de la SEQ ID NO:276, SEQ ID NO: 28 y SEQ ID NO: 244, todas demostraron una alta actividad y una alta estereoselectividad para la producción de (R,R)-monatina. Estas tres enzimas se prepararon como se describe en el ejemplo 23 y se ensayaron anaerobiamente como se describe en el ejemplo 24, mediante el uso de recipientes de suero de 10 mL. Se realizaron ensayos de 7 mL mediante el uso de 0,05 mg/mL de cada aldolasa (purificada) y 2 10 mg/mL de D-aminotransferasa purificada de B. sphaericus preparada como se describe en el ejemplo 24. La actividad de cada aldolasa en la producción de monatina a partir de D-triptófano se comparó con la aldolasa HMG de The aldolases of SEQ ID NO: 276, SEQ ID NO: 28 and SEQ ID NO: 244 all demonstrated high activity and high stereoselectivity for the production of (R, R) -monatin. These three enzymes were prepared as described in Example 23 and anaerobically tested as described in Example 24, using 10 mL serum containers. 7 mL assays were performed using 0.05 mg / mL of each aldolase (purified) and 2 10 mg / mL of purified B. sphaericus D-aminotransferase prepared as described in Example 24. The activity of each aldolase in monatin production from D-tryptophan was compared to aldolase HMG from

S. meliloti preparada como se describe en el ejemplo 27. Se estimó la monatina total mediante el uso del procedimiento LC-OPA descrito en el ejemplo 1. El porcentaje de (R,R)-monatina formada se determinó mediante el uso del procedimiento de derivatización de la FDAA descrito en el ejemplo 1. Los resultados se muestran a S. meliloti prepared as described in Example 27. Total monatin was estimated using the LC-OPA procedure described in Example 1. The percentage of (R, R) -monatin formed was determined using the procedure of FDAA derivatization described in Example 1. Results are shown at

15 continuación en la tabla 26. 15 continued in table 26.

Tabla 26 Table 26

Aldolasa Aldolasa
Tiempo (horas) Monatina (g/L) % R,R formada Time (hours) Monatina (g / L) % R, R formed

S. meliloti S. meliloti
23 3,9 82,0 2. 3 3.9 82.0

SEQ ID NO: 28 SEQ ID NO: 28
23 4,0 84,6 2. 3 4.0 84.6

SEQ ID NO: 276 SEQ ID NO: 276
23 4,0 95,7 2. 3 4.0 95.7

SEQ ID NO: 244 SEQ ID NO: 244
23 3,7 88,8 2. 3 3.7 88.8

S. meliloti S. meliloti
47 4,5 76,2 47 4.5 76.2

SEQ ID NO: 28 SEQ ID NO: 28
47 4,3 84,6 47 4.3 84.6

SEQ ID NO: 276 SEQ ID NO: 276
47 4,3 93,2 47 4.3 93.2

SEQ ID NO: 244 SEQ ID NO: 244
47 4,5 85,2 47 4.5 85.2

Estos resultados demuestran que la aldolasa de la SEQ ID NO: 276 también produce niveles altos de (R,R)monatina en reacciones anaerobias de mayor volumen. These results demonstrate that the aldolase of SEQ ID NO: 276 also produces high levels of (R, R) monatin in higher volume anaerobic reactions.

Ejemplo 23 Example 23

Expresión y purificación de la aldolasa de la SEQ ID NO:276 Expression and purification of aldolase from SEQ ID NO: 276

La clonación del receptor BL21 (DE3)pLysS de E. coli que tiene el gen de la aldolasa enumerado como la SEQ ID NO:275 en el plásmido pET28b se describe anteriormente en el ejemplo 22. Cloning of the E. coli BL21 (DE3) pLysS receptor that has the aldolase gene listed as SEQ ID NO: 275 in plasmid pET28b is described above in Example 22.

La aldolasa de la SEQ ID NO:276 con un marcador de purificación HIS6 amino-terminal se produjo mediante el uso del sistema Overnight Express II de Biosciences EMD (Novagen, Madison, WI) (soluciones 1 a 6) que contenía 50 !g/mL de kanamicina en matraces de agitación. Este sistema de expresión induce la expresión de los sistemas inducidos por IPTG sin la necesidad de controlar el crecimiento celular. Después de la inoculación de alícuotas de 200 mL del medio (en matraces de 1 L) de los cultivos líquidos o placas de la construcción de aldolasa, los cultivos se incubaron a 30ºC durante la noche con agitación a 225 rpm. Cuando la OD600,n, alcanzó un mínimo de 6, las células se cosecharon mediante centrifugación y se lavaron una vez con tampón. The aldolase from SEQ ID NO: 276 with an amino-terminal HIS6 purification marker was produced using the Overnight Express II system from Biosciences EMD (Novagen, Madison, WI) (solutions 1 to 6) containing 50 µg / mL of kanamycin in shake flasks. This expression system induces the expression of IPTG-induced systems without the need to control cell growth. After inoculation of 200 mL aliquots of the medium (in 1 L flasks) from the liquid cultures or plates from the aldolase construct, the cultures were incubated at 30 ° C overnight with shaking at 225 rpm. When OD600, n, reached a minimum of 6, cells were harvested by centrifugation and washed once with buffer.

Para preparar el extracto libre de células que contenía la aldolasa, las células se suspendieron en 3 a 4 volúmenes de 100 mM de fosfato de potasio, pH 7,8 y después se mezclaron mediante el uso de un homogeneizador Microfluidics (Microfluidics, Newton, MA) (3 pasadas a 18.000 psi), con mantenimiento de la temperatura de la suspensión a menos de 15ºC. De forma alternativa, el extracto libre de células se preparó mediante el uso del reactivo de extracción BugBuster® de EMD Biosciences (libre de amina primaria) (Novagen, Madison, WI) que contenía 1 !L/mL de Benzonasa® Nucleasa, 5 !L/mL de mezcla de inhibidor de proteasa conjunto II y 0,033 !L/mL de rLisozima™ de acuerdo con el protocolo del fabricante. Todas las etapas de purificación subsiguientes se llevaron a cabo a 4ºC. La suspensión de células se centrifugó durante 20 a 30 minutos a 15.000-20.000×g para extraer los residuos celulares. Se aplicó una alícuota de 20 a 25 mL del extracto libre de células a una columna de 45 mL de la resina de flujo rápido GE Healthcare Chelating Sepharose™ (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que había sido equilibrada previamente con 100 mM de fosfato de potasio que contenía 200 mM de cloruro de sodio. Para generar níquel a partir de la resina, la resina se lavó con 150 mL de hexahidrato de sulfato de níquel (II) 200 mM y después con 150 mL de agua destilada. Después de cargar la muestra, la columna se lavó/eluyó con 150 mL del tampón de equilibración que contenía 25 mM de imidazol, 150 mL del tampón de equilibración que contenía 50 mM de imidazol y 150 mL del tampón de equilibración que contenía 500 mM de imidazol. La proteína marcada con HIS6 se eluyó en el último lavado. El lavado con 500 mM de imidazol se concentró con dispositivos de centrifugación con filtro Millipore/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) a 15-20 mL de acuerdo con las instrucciones del fabricante. El imidazol y el cloruro de sodio se extrajeron mediante el pasaje a través de las columnas desechables de GE Healthcare PDIO (GE Healthcare, Piscataway, NJ) (2,5 mL de muestra por columna) equilibrados previamente con 100 mM de fosfato de potasio, pH 7,8. La aldolasa purificada se eluyó con 3,5 mL por columna del mismo tampón. To prepare the cell free extract containing aldolase, cells were suspended in 3 to 4 volumes of 100 mM potassium phosphate, pH 7.8 and then mixed by using a Microfluidics homogenizer (Microfluidics, Newton, MA ) (3 passes at 18,000 psi), with maintenance of the suspension temperature below 15ºC. Alternatively, the cell-free extract was prepared using EMD Biosciences' BugBuster® Extraction Reagent (primary amine free) (Novagen, Madison, WI) containing 1 µL / mL Benzonasa® Nuclease, 5! L / mL mix Protease Inhibitor II mixture and 0.033 µL / mL rLisozyme ™ according to manufacturer's protocol. All subsequent purification steps were carried out at 4 ° C. The cell suspension was centrifuged for 20-30 minutes at 15,000-20,000 × g to remove cell debris. A 20 to 25 mL aliquot of the cell free extract was applied to a 45 mL column of GE Healthcare Chelating Sepharose ™ Rapid Flow Resin (Nickel (II) form) (GE Healthcare, Piscataway, NJ) that had been previously equilibrated with 100 mM potassium phosphate containing 200 mM sodium chloride. To generate nickel from the resin, the resin was washed with 150 mL of 200mM nickel (II) sulfate hexahydrate and then with 150 mL of distilled water. After loading the sample, the column was washed / eluted with 150 mL of the equilibration buffer containing 25 mM imidazole, 150 mL of the equilibration buffer containing 50 mM imidazole and 150 mL of the equilibration buffer containing 500 mM of imidazole. The HIS6-labeled protein was eluted in the last wash. The 500 mM imidazole wash was concentrated with Millipore / Amicon Centricon Plus-70 Filter (MWCO 10kDa) (Millipore, Billerica, MA) to 15-20 mL according to the manufacturer's instructions. Imidazole and sodium chloride were removed by passage through the GE Healthcare PDIO (GE Healthcare, Piscataway, NJ) disposable columns (2.5 mL sample per column) pre-equilibrated with 100 mM potassium phosphate, pH 7.8. The purified aldolase was eluted with 3.5 mL per column of the same buffer.

Se determinó la concentración de proteínas de cada fracción mediante el uso del kit de ensayo Pierce BCA (Pierce, Rockford, IL) mediante el uso de BSA como el estándar de proteína. Se determinó la pureza de cada fracción y el nivel de expresión en el extracto libre de células mediante el uso de un sistema de chip microcapilar Bio-Rad Experion (Bio-Rad, Hercules, CA) o mediante el uso de geles con gradiente de SDS-poliacrilamida del 4 al 15% de Bio-Rad en un aparato celular Mini PROTEAN® 3 (Bio-Rad, Hercules, CA). La proteína se visualizó en los geles de poliacrilamida mediante el uso de tinción de Coomassie G-250 de Bio-Rad Bio-Safe (Bio-Rad, Hercules, CA) y se destiñó con agua. Típicamente, este procedimiento produce aproximadamente 50 mg de enzima a partir de 400 mL de cultivo durante la noche que tiene de un 85 a un 95% de pureza, a juzgar por el software Experion. Se almacenaron alícuotas (1 a 5 mL) de la enzima purificada a −80ºC hasta su uso. La preparación de la enzima en esta forma redujo el nivel de precipitación de la enzima señalada anteriormente. La presencia de magnesio en el tampón de almacenamiento no tuvo ningún efecto sobre el nivel de precipitación. The protein concentration of each fraction was determined using the Pierce BCA Assay Kit (Pierce, Rockford, IL) using BSA as the protein standard. The purity of each fraction and the level of expression in the cell-free extract were determined by using a Bio-Rad Experion microcapillary chip system (Bio-Rad, Hercules, CA) or by using SDS gradient gels. -polyacrylamide from 4 to 15% of Bio-Rad in a Mini PROTEAN® 3 cellular device (Bio-Rad, Hercules, CA). Protein was visualized on polyacrylamide gels using Bio-Rad Bio-Safe Coomassie G-250 staining (Bio-Rad, Hercules, CA) and stained with water. Typically, this procedure produces approximately 50 mg of enzyme from 400 mL of culture overnight that is 85 to 95% pure, judging by the Experion software. Aliquots (1 to 5 mL) of the purified enzyme were stored at −80 ° C until use. Preparation of the enzyme in this form reduced the level of precipitation of the enzyme noted above. The presence of magnesium in the storage buffer had no effect on the level of precipitation.

Ejemplo 24 Example 24

Producción de (R,R)-monatina mediante el uso de aldolasa de la SEQ ID NO:276: Optimización de las condiciones de reacción Production of (R, R) -monatin by using aldolase of SEQ ID NO: 276: Optimization of reaction conditions

La D-alanina aminotransferasa de Bacillus sphaericus (ATCC cepa 10208) clonada en el ejemplo 7 se purificó como la proteína marcada con HIS6 como se describe a continuación mediante el uso del sistema EMD Biosciences Overnight Express System II (Novagen, Madison, WI) para su cultivo e inducción. El sistema EMD Biosciences Overnight Express System II (soluciones 1 a 6) (Novagen, Madison, WI) contenía 50 !g/mL de kanamicina en matraces de agitación. Este sistema de expresión induce la expresión de los sistemas inducidos por IPTG sin la necesidad de controlar el crecimiento celular. Después de la inoculación de alícuotas de 200 mL del medio (en matraces de 1 L) de los cultivos líquidos o placas de la construcción de aminotransferasa, los cultivos se incubaron a The Bacillus sphaericus D-alanine aminotransferase (ATCC strain 10208) cloned in Example 7 was purified as the HIS6-labeled protein as described below using the EMD Biosciences Overnight Express System II (Novagen, Madison, WI) to its cultivation and induction. The EMD Biosciences Overnight Express System II (solutions 1 to 6) (Novagen, Madison, WI) contained 50 µg / mL kanamycin in shake flasks. This expression system induces the expression of IPTG-induced systems without the need to control cell growth. After inoculation of 200 mL aliquots of the medium (in 1 L flasks) from the liquid cultures or plates from the aminotransferase construct, the cultures were incubated at

30ºC durante la noche con agitación a 225 rpm. Cuando la OD600 nm alcanzó un mínimo de 6, las células se cosecharon mediante centrifugación y se lavaron una vez con tampón. 30 ° C overnight with stirring at 225 rpm. When the OD600nm reached a minimum of 6, the cells were harvested by centrifugation and washed once with buffer.

Para preparar el extracto libre de células que contenía la D-alanina aminotransferasa, las células se suspendieron en 3 a 4 volúmenes de 100 mM de fosfato de potasio, pH 7,8, que contenía 50 !M de piridoxal fosfato (PLP) y después se mezclaron mediante el uso de un homogeneizador Microfluidics (Microfluidics, Newton, MA) (3 pasadas a 18.000 psi), con mantenimiento de la temperatura de la suspensión a menos de 15ºC. De forma alternativa, el extracto libre de células se preparó mediante el uso del reactivo de extracción BugBuster® de EMD Biosciences (libre de amina primaria) (Novagen, Madison, WI) que contenía 1 !L/mL de Benzonasa® Nucleasa, 5 !L/mL de mezcla de inhibidor de proteasa conjunto II y 0,033 !L/mL de rLisozima™ de acuerdo con el protocolo del fabricante. Todas las etapas de purificación subsiguientes se llevaron a cabo a 4ºC. El extracto celular se centrifugó durante 20 a 30 minutos a 15.000×g para extraer los residuos celulares. Se aplicó una alícuota de 20 a 25 mL del extracto libre de células a una columna de 45 mL de la resina de flujo rápido GE Healthcare Chelating Sepharose™ (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que había sido equilibrada previamente con 100 mM de fosfato de potasio que contenía 200 mM de cloruro de sodio y 50 !M de PLP. Para generar níquel a partir de la resina, la resina se lavó con 150 mL de hexahidrato de sulfato de níquel (II) 200 mM y después con 150 mL de agua destilada. Después de cargar la muestra, la columna se lavó/eluyó con 150 mL del tampón de equilibración que contenía 25 mM de imidazol, 150 mL del tampón de equilibración que contenía 50 mM de imidazol y 150 mL del tampón de equilibración que contenía 500 mM de imidazol. La proteína marcada con HIS6 se eluyó en el último lavado. El lavado con 500 mM de imidazol se concentró con dispositivos de centrifugación con filtro Millipore/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) a 15 a 20 mL de acuerdo con las instrucciones del fabricante. El imidazol y el cloruro de sodio se extrajeron mediante el pasaje a través de las columnas desechables de GE Healthcare PDIO (GE Healthcare, Piscataway, NJ) (2,5 mL de muestra por columna) equilibrados previamente con 100 mM de fosfato de potasio, pH 7,8, que contenía 0,5 !M de PLP. La aminotransferasa purificada se eluyó con 3,5 mL por columna del mismo tampón. To prepare the cell-free extract containing D-alanine aminotransferase, the cells were suspended in 3 to 4 volumes of 100 mM potassium phosphate, pH 7.8, containing 50 µM pyridoxal phosphate (PLP), and then they were mixed using a Microfluidics homogenizer (Microfluidics, Newton, MA) (3 passes at 18,000 psi), keeping the temperature of the suspension below 15 ° C. Alternatively, the cell-free extract was prepared using EMD Biosciences' BugBuster® Extraction Reagent (primary amine free) (Novagen, Madison, WI) containing 1 µL / mL Benzonasa® Nuclease, 5! L / mL mix Protease Inhibitor II mixture and 0.033 µL / mL rLisozyme ™ according to manufacturer's protocol. All subsequent purification steps were carried out at 4 ° C. The cell extract was centrifuged for 20-30 minutes at 15,000 xg to extract cell debris. A 20 to 25 mL aliquot of the cell free extract was applied to a 45 mL column of GE Healthcare Chelating Sepharose ™ Rapid Flow Resin (Nickel (II) form) (GE Healthcare, Piscataway, NJ) that had been previously equilibrated with 100 mM potassium phosphate containing 200 mM sodium chloride and 50 µM PLP. To generate nickel from the resin, the resin was washed with 150 mL of 200mM nickel (II) sulfate hexahydrate and then with 150 mL of distilled water. After loading the sample, the column was washed / eluted with 150 mL of the equilibration buffer containing 25 mM imidazole, 150 mL of the equilibration buffer containing 50 mM imidazole and 150 mL of the equilibration buffer containing 500 mM of imidazole. The HIS6-labeled protein was eluted in the last wash. The 500 mM imidazole wash was concentrated with Millipore / Amicon Centricon Plus-70 Filter (MWCO 10 kDa) (Millipore, Billerica, MA) to 15 to 20 mL according to the manufacturer's instructions. Imidazole and sodium chloride were removed by passage through the GE Healthcare PDIO (GE Healthcare, Piscataway, NJ) disposable columns (2.5 mL sample per column) pre-equilibrated with 100 mM potassium phosphate, pH 7.8, containing 0.5 µM PLP. The purified aminotransferase was eluted with 3.5 mL per column of the same buffer.

Se determinó la concentración de cada fracción mediante el uso del kit de ensayo Pierce BCA (Pierce, Rockford, IL) mediante el uso de BSA como el estándar de proteína. Se determinó la pureza de cada fracción y el nivel de expresión en el extracto libre de células mediante el uso de un sistema de chip microcapilar Bio-Rad Experion (Bio-Rad, Hercules, CA) o mediante el uso de geles con gradiente de SDS-poliacrilamida del 4 al 15% de Bio-Rad (Bio-Rad, Hercules, CA) en un aparato celular Mini PROTEAN® 3. La proteína se visualizó en geles de poliacrilamida mediante el uso de tinción de Coomassie G-250 de Bio-Rad Bio-Safe (Bio-Rad, Hercules, CA) y se destiñó con agua. Típicamente, este procedimiento produce aproximadamente 50 mg de enzima a partir de 200 mL de cultivo durante la noche que tiene de un 85 a un 90% de pureza, a juzgar por el software Experion y a partir del análisis de los geles SDS-PAGE. Se almacenaron alícuotas (1 a 5 mL) de la enzima purificada a −80ºC hasta su uso. The concentration of each fraction was determined using the Pierce BCA Assay Kit (Pierce, Rockford, IL) using BSA as the protein standard. The purity of each fraction and the level of expression in the cell-free extract were determined by using a Bio-Rad Experion microcapillary chip system (Bio-Rad, Hercules, CA) or by using SDS gradient gels. -4 to 15% polyacrylamide of Bio-Rad (Bio-Rad, Hercules, CA) in a Mini PROTEAN® 3 cellular apparatus. The protein was visualized in polyacrylamide gels using Bio-Coomassie G-250 staining. Rad Bio-Safe (Bio-Rad, Hercules, CA) and stained with water. Typically, this procedure produces approximately 50 mg of enzyme from 200 mL of culture overnight that is 85 to 90% pure, judging by the Experion software and from analysis of SDS-PAGE gels. Aliquots (1 to 5 mL) of the purified enzyme were stored at −80 ° C until use.

La aldolasa de la SEQ ID NO:276 (clonada en el ejemplo 22) se purificó como la proteína marcada con HIS6 como se describe en el ejemplo 23. The aldolase from SEQ ID NO: 276 (cloned in Example 22) was purified as the HIS6-labeled protein as described in Example 23.

El cofactor metálico preferido para la aldolasa de la SEQ ID NO:276 se determinó mediante el análisis de una variedad de metales divalentes. Las reacciones se llevaron a cabo anaerobiamente en frascos de suero de 10 mL con 7 mL de los volúmenes finales. La solución a granel que consistía en 100 mM de fosfato de potasio (pH 7,8), 200 mM de piruvato de sodio, 0,05 mM de PLP y Tween 80 (v/v) al 0,01%, se preparó a un volumen final de 48,8 mL y se roció con nitrógeno durante 30 minutos. El D-triptófano (143 mg; concentración final de 100 mM) se colocó en siete recipientes de suero de 10 mL. A cada uno de los recipientes se agregaron 0,014 mL de una solución a granel de 2 M de un catión metálico divalente, preparado a partir de sal de cloruro (concentración final de 4 mM). Para el control negativo, se agregaron 0,014 mL de dH2O. Los recipientes de suero se taparon con septos de goma y se rociaron con nitrógeno mediante 16 a 18 agujas estériles. En condiciones anaerobias, se agregaron 5,625 mL de la solución a granel anaerobia a cada frasco de suero anaerobio. Subsiguientemente, la D-alanina aminotransferasa de The preferred metal cofactor for aldolase of SEQ ID NO: 276 was determined by analysis of a variety of divalent metals. Reactions were carried out anaerobically in 10 mL serum bottles with 7 mL of final volumes. The bulk solution consisting of 100 mM potassium phosphate (pH 7.8), 200 mM sodium pyruvate, 0.05 mM PLP, and 0.01% Tween 80 (v / v), was prepared at a final volume of 48.8 mL and was sprayed with nitrogen for 30 minutes. D-tryptophan (143 mg; final concentration of 100 mM) was placed in seven 10 mL serum containers. 0.014 mL of a 2 M bulk solution of a divalent metal cation, prepared from chloride salt (final concentration of 4 mM), was added to each of the vessels. For the negative control, 0.014 mL of dH2O was added. The serum containers were capped with rubber septa and sparged with nitrogen using 16 to 18 sterile needles. Under anaerobic conditions, 5.625 mL of the anaerobic bulk solution was added to each vial of anaerobic serum. Subsequently, D-alanine aminotransferase from

B. sphaericus y la aldolasa de la SEQ ID NO:276 se agregaron anaerobiamente a cada frasco de suero a una concentración final de 2 mg/mL y 0,05 mg/mL, respectivamente. Las soluciones se incubaron a temperatura ambiente con mezclado suave durante 18 horas. La monatina final se analizó de conformidad con los procedimientos descritos en el ejemplo 1 mediante el uso del procedimiento de detección fluorescente de aminoácidos de cromatografía líquida post-columna. (Tabla 27). B. sphaericus and aldolase from SEQ ID NO: 276 were added anaerobically to each vial of serum at a final concentration of 2 mg / mL and 0.05 mg / mL, respectively. The solutions were incubated at room temperature with gentle mixing for 18 hours. The final monatin was analyzed according to the procedures described in Example 1 using the post-column liquid chromatography fluorescent amino acid detection procedure. (Table 27).

Tabla 27 Table 27

Cofactor metálico Metal cofactor
Monatina final (mM) a las 18 horas Final monatina (mM) at 6 p.m.

Ninguno (control negativo) None (negative control)
1,7 1.7

Magnesio Magnesium
10,6 10.6

Manganeso Manganese
10,0 10.0

Cofactor metálico Metal cofactor
Monatina final (mM) a las 18 horas Final monatina (mM) at 6 p.m.

Cobalto Cobalt
6,7 6.7

Zinc Zinc
4,9 4.9

Níquel Nickel
1,5 1.5

CalcioCalcium
0,7  0.7

Las condiciones de reacción para la aldolasa de la SEQ ID NO:276 se investigaron de forma adicional con un experimento factorial fraccional de dos niveles diseñado mediante el uso del software estadístico Design Expert The reaction conditions for aldolase of SEQ ID NO: 276 were further investigated with a two-level fractional factorial experiment designed using the Design Expert statistical software.

7.0.0 (Stat-Ease, Inc.; Minneapolis, MN). El diseño de análisis consistió en un único bloque de cinco factores a dos 7.0.0 (Stat-Ease, Inc .; Minneapolis, MN). The analysis design consisted of a single block of five factors to two

5 niveles con cuatro puntos centrales (20 ejecuciones en total). Los cinco factores para optimizarse fueron la concentración del cofactor metálico, el pH de reacción, la concentración de Tween® 80, la proporción de piruvato a triptófano y la concentración de aldolasa (Tabla 28). 5 levels with four central points (20 executions in total). The five factors to be optimized were the metal cofactor concentration, the reaction pH, the Tween® 80 concentration, the pyruvate to tryptophan ratio and the aldolase concentration (Table 28).

Los tubos de polipropileno cónicos (14 mL) que contenían 143 mg de D-triptófano se desoxigenaron en una cámara anaerobia (Coy Laboratory Products, Inc; Grass Lake, MI) durante la noche. Las soluciones a granel de 2 M de 10 MgCl2; 1 M de fosfato de potasio a un pH 7,0, 7,75 y 8,5; Tween® 80 (v/v) al10%; 2 M de piruvato de sodio y 10 mM de PLP (piridoxal 5'-fosfato) se prepararon en agua desgasificada y se equilibraron en la cámara anaerobia durante la noche. Las soluciones a granel de D-alanina aminotransferasa de B. sphaericus y la aldolasa de la SEQ ID NO:276 se descongelaron inmediatamente sobre hielo en una cámara anaerobia. Las soluciones a granel se agregaron a los tubos cónicos de 14 mL que contenían el D-triptófano para obtener las concentraciones 15 determinadas por el diseño estadístico (Tabla 28). El agua desgasificada se agregó a cada tubo para llevar el volumen final, junto con las adiciones de enzimas, a 7,0 mL. Los tubos se incubaron a temperatura ambiente en una cámara anaerobia con mezclado suave durante 24 horas. Se analizó la concentración de monatina y la pureza isomérica de acuerdo con los procedimientos descritos en el ejemplo 1, mediante el uso del procedimiento de detección fluorescente de aminoácidos de cromatografía líquida post-columna y del control de reacciones múltiples Conical polypropylene tubes (14 mL) containing 143 mg of D-tryptophan were deoxygenated in an anaerobic chamber (Coy Laboratory Products, Inc; Grass Lake, MI) overnight. 2M 10 MgCl2 bulk solutions; 1M potassium phosphate at pH 7.0, 7.75 and 8.5; Tween® 80 (v / v) 10%; 2M sodium pyruvate and 10mM PLP (pyridoxal 5'-phosphate) were prepared in degassed water and equilibrated in the anaerobic chamber overnight. Bulk solutions of B. sphaericus D-alanine aminotransferase and aldolase from SEQ ID NO: 276 were immediately thawed on ice in an anaerobic chamber. Bulk solutions were added to the 14 mL conical tubes containing the D-tryptophan to obtain the concentrations 15 determined by the statistical design (Table 28). Degassed water was added to each tube to bring the final volume, along with enzyme additions, to 7.0 mL. The tubes were incubated at room temperature in an anaerobic chamber with gentle mixing for 24 hours. Monatin concentration and isomeric purity were analyzed according to the procedures described in Example 1, using the post-column liquid chromatography fluorescent amino acid detection procedure and the multiple reaction control

20 por LC/MS/MS para la determinación de la distribución de estereoisómeros de monatina en el procedimiento de reacciones in vitro e in vivo (procedimiento de derivatización de la FDAA). 20 by LC / MS / MS for the determination of the distribution of monatin stereoisomers in the in vitro and in vivo reaction procedure (FDAA derivatization procedure).

Tabla 28 Table 28

Ejecución # Execution #
estándar # Bloque Mg (mM) pH TweenD® (%) Pir:Trp Aldolasa de la SEQ ID NO: 276 (mg/mL) standard # Block Mg (mM) pH TweenD® (%) Pir: Trp Aldolase from SEQ ID NO: 276 (mg / mL)

20 twenty
1 Bloque 1 5,00 7,75 0,01 2,00 0,05 one Block 1 5.00 7.75 0.01 2.00 0.05

8 8
2 Bloque 1 9,00 8,50 0,02 1,00 0,01 2 Block 1 9.00 8.50 0.02 1.00 0.01

3 3
3 3
Bloque 1 1,00 8,50 0,00 1,00 0,01 Block 1 1.00 8.50 0.00 1.00 0.01

16 16
4 Bloque 1 9,00 8,50 0,02 3,00 0,09 4 Block 1 9.00 8.50 0.02 3.00 0.09

7 7
5 Bloque 1 1,00 8,50 0,02 1,00 0,09 5 Block 1 1.00 8.50 0.02 1.00 0.09

12 12
6 Bloque 1 9,00 8,50 0,00 3,00 0,01 6 Block 1 9.00 8.50 0.00 3.00 0.01

6 6
7 Bloque 1 9,00 7,00 0,02 1,00 0,09 7 Block 1 9.00 7.00 0.02 1.00 0.09

2 2
8 Bloque 1 9,00 7,00 0,00 1,00 0,01 8 Block 1 9.00 7.00 0.00 1.00 0.01

15 fifteen
9 Bloque 1 1,00 8,50 0,02 3,00 0,01 9 Block 1 1.00 8.50 0.02 3.00 0.01

4 4
10 Bloque 1 9,00 8,50 0,00 1,00 0,09 10 Block 1 9.00 8.50 0.00 1.00 0.09

5 5
11 Bloque 1 1,00 7,00 0,02 1,00 0,01 eleven Block 1 1.00 7.00 0.02 1.00 0.01

1 one
12 Bloque 1 1,00 7,00 0,00 1,00 0,09 12 Block 1 1.00 7.00 0.00 1.00 0.09

13 13
13 13
Bloque 1 1,00 7,00 0,02 3,00 0,09 Block 1 1.00 7.00 0.02 3.00 0.09

Ejecución # Execution #
estándar # Bloque Mg (mM) pH TweenD® (%) Pir:Trp Aldolasa de la SEQ ID NO: 276 (mg/mL) standard # Block Mg (mM) pH TweenD® (%) Pir: Trp Aldolase from SEQ ID NO: 276 (mg / mL)

14 14
14 14
Bloque 1 9,00 7,00 0,02 3,00 0,01 Block 1 9.00 7.00 0.02 3.00 0.01

17 17
15 Bloque 1 5,00 7,75 0,01 2,00 0,05 fifteen Block 1 5.00 7.75 0.01 2.00 0.05

11 eleven
16 Bloque 1 1,00 8,50 0,00 3,00 0,09 16 Block 1 1.00 8.50 0.00 3.00 0.09

18 18
17 Bloque 1 5,00 7,75 0,01 2,00 0,05 17 Block 1 5.00 7.75 0.01 2.00 0.05

9 9
18 Bloque 1 1,00 7,00 0,00 3,00 0,01 18 Block 1 1.00 7.00 0.00 3.00 0.01

19 19
19 19
Bloque 1 5,00 7,75 0,01 2,00 0,05 Block 1 5.00 7.75 0.01 2.00 0.05

10 10
20 Bloque 1 9,00 7,00 0,00 3,00 0,09 twenty Block 1 9.00 7.00 0.00 3.00 0.09

El análisis estadístico de los datos indicó que el pH de reacción, la proporción piruvato:triptófano y la concentración de aldolasa fueron factores significativos que afectan la valoración de monatina, la pureza isomérica y la producción de carbono. Se generó una gráfica de conveniencia mediante el uso del software Design Expert en el cual se Statistical analysis of the data indicated that the reaction pH, pyruvate: tryptophan ratio, and aldolase concentration were significant factors affecting monatin titration, isomeric purity, and carbon production. A convenience graph was generated by using the Design Expert software in which

5 variaron los factores para maximizar los objetivos de una mayor valoración de monatina y una mayor pureza isomérica en las condiciones de exceso de piruvato. Las condiciones de reacción indicadas como óptimas fueron 1 mM de MgCl2, pH>8,0, Tween® 80 al 0,01% (v/v) y 0,01 mg/mL de aldolasa de la SEQ ID NO:276. Esta es una reducción de 5 veces en la cantidad típica de aldolasa utilizada, así como una reducción de 4 veces en la cantidad de metal divalente típicamente utilizado. 5 factors were varied to maximize the goals of higher monatin titration and higher isomeric purity under pyruvate excess conditions. The reaction conditions indicated as optimal were 1 mM MgCl2, pH> 8.0, Tween® 80 0.01% (v / v) and 0.01 mg / mL aldolase from SEQ ID NO: 276. This is a 5-fold reduction in the typical amount of aldolase used, as well as a 4-fold reduction in the amount of divalent metal typically used.

10 Se realizaron experimentos adicionales para determinar el intervalo de pH óptimo para el proceso de reacción. Las soluciones a granel de tampón EPPS 1M se prepararon en incrementos de unidades de pH de 0,2 entre un pH de 7,0 y 9,0. Estas soluciones se desgasificaron y se equilibraron en la cámara anaerobia durante la noche. Los tubos de polipropileno (14 mL) que contenían 143 mg de D-triptófano se desoxigenaron en una cámara anaerobia durante la noche. Las soluciones a granel de 2 M de MgCl2, Tween® 80 al 10% (v/v), 2 M de piruvato de sodio y 10 mM de Additional experiments were performed to determine the optimal pH range for the reaction process. Bulk 1M EPPS buffer solutions were prepared in pH unit increments of 0.2 between pH 7.0 and 9.0. These solutions were degassed and equilibrated in the anaerobic chamber overnight. Polypropylene tubes (14 mL) containing 143 mg of D-tryptophan were deoxygenated in an anaerobic chamber overnight. Bulk solutions of 2M MgCl2, Tween® 80 10% (v / v), 2M Sodium Pyruvate and 10mM

15 PLP se prepararon en agua desgasificada y se equilibraron en la cámara anaerobia. Las preparaciones de D-alanina aminotransferasa de B. sphaericus y de aldolasa de la SEQ ID NO:276 se descongelaron sobre hielo y se utilizaron inmediatamente en la cámara anaerobia. Las soluciones a granel se agregaron a los tubos cónicos de 14 mL para proporcionar una concentración final de 100 mM de EPPS, 200 mM de piruvato, 100 mM de triptófano, 1 mM de MgCl2, Tween® 80 al 0,01% (v/v), 0,05 mM de PLP, 2 mg/mL de D-alanina aminotransferasa de B. sphaericus y 0,01 15 PLP were prepared in degassed water and equilibrated in the anaerobic chamber. The B. sphaericus D-alanine aminotransferase and aldolase preparations of SEQ ID NO: 276 were thawed on ice and immediately used in the anaerobic chamber. Bulk solutions were added to the 14 mL conical tubes to provide a final concentration of 100 mM EPPS, 200 mM pyruvate, 100 mM tryptophan, 1 mM MgCl2, 0.01% Tween® 80 (v / v), 0.05 mM PLP, 2 mg / mL D-alanine aminotransferase from B. sphaericus and 0.01

20 mg/mL de la aldolasa de la SEQ ID NO:276 en un volumen total de 7 mL por tubo. Las reacciones se incubaron a temperatura ambiente en una cámara anaerobia con leve agitación durante 22 horas. Se extrajeron las muestras y éstas se analizaron para verificar la monatina como se describe en el ejemplo 1 mediante el uso del procedimiento de control de reacciones múltiples por LC/MS/MS (Tabla 29). 20 mg / mL of aldolase from SEQ ID NO: 276 in a total volume of 7 mL per tube. Reactions were incubated at room temperature in an anaerobic chamber with gentle shaking for 22 hours. Samples were removed and analyzed to verify monatin as described in Example 1 using the LC / MS / MS Multiple Reaction Control Procedure (Table 29).

Tabla 29 Table 29

pH de reacción reaction pH
Monatina (mM) a las 22 horas Monatina (mM) at 22 hours

7,0 7.0
5,8 5.8

7,2 7.2
9,9 9.9

7,8 7.8
14,0 14.0

8,0 8.0
14,2 14.2

8,2 8.2
14,3 14.3

8,4 8.4
12,6 12.6

8,6 8.6
12,3 12.3

8,8 8.8
10,8 10.8

9,0 9.0
11,1 11.1

Los resultados indicaron que la formación de monatina aumentó con el incremento del pH entre 7,0 y 8,0. La formación de monatina alcanzó un máximo en el intervalo de pH de 8,0 y 8,2 y disminuyó en un pH mayor a 8,4. Además, la pureza isomérica de monatina disminuyó en un pH mayor a 8,4. Results indicated that monatin formation increased with increasing pH between 7.0 and 8.0. Monatin formation peaked in the pH range of 8.0 and 8.2 and decreased at a pH greater than 8.4. Furthermore, the monomer isomeric purity decreased at a pH greater than 8.4.

Se realizó una mayor optimización de reacción mediante el uso de la aldolasa de la SEQ ID NO: 276 (0,01 mg/mL), 2 mg/mL de T243N 4978 DAT (sin marcar, del ejemplo 26), 1 mM de MgCl2, 200 mM de piruvato de sodio, 0,05 mM de PLP, Tween-80 al 0,01% y 100 mM de D-triptófano a pH 8,5. Las células utilizadas para producir la aldolasa y la D-aminotransferasa se abrieron en 50 mM de EPPS, pH 8,4, mediante el uso de un homogeneizador Microfluidics (Microfluidics, Newton, MA) (3 pasadas a 20.000 psi). Los residuos celulares se eliminaron mediante centrifugación (20.000×g durante 30 minutos) y los extractos celulares clarificados se utilizaron en las reacciones enzimáticas. No se utilizó ningún tampón adicional, pero las mezclas de reacción se ajustaron al pH 8,5 mediante el uso de hidróxido de sodio y se enjuagaron con nitrógeno antes de la adición de la enzima. Se llevaron a cabo reacciones de 250 mL en 0,7 L, seis para fermentadores agitados (Infors AG, Bottmingen, Suiza) a 30ºC mediante el uso de nitrógeno en el espacio de aire. Se agregó fosfato de potasio a una concentración final de 0, 5, 10, 20 y 50 mM. La adición de 5 a 10 mM de fosfato resultó ser óptima, la cual produjo 3,5 g/L de monatina (cuantificada por LC/MS/MS como se describe en ejemplo 1). Further reaction optimization was performed using aldolase SEQ ID NO: 276 (0.01 mg / mL), 2 mg / mL T243N 4978 DAT (unlabelled from Example 26), 1 mM MgCl2 , 200 mM sodium pyruvate, 0.05 mM PLP, 0.01% Tween-80 and 100 mM D-tryptophan at pH 8.5. The cells used to produce aldolase and D-aminotransferase were opened in 50 mM EPPS, pH 8.4, using a Microfluidics homogenizer (Microfluidics, Newton, MA) (3 passes at 20,000 psi). Cell debris was removed by centrifugation (20,000 × g for 30 min) and the clarified cell extracts were used in the enzyme reactions. No additional buffer was used, but the reaction mixtures were adjusted to pH 8.5 by using sodium hydroxide and rinsed with nitrogen before addition of the enzyme. Reactions of 250 mL in 0.7 L were carried out, six for stirred fermenters (Infors AG, Bottmingen, Switzerland) at 30 ° C using nitrogen in the air space. Potassium phosphate was added at a final concentration of 0, 5, 10, 20, and 50 mM. The addition of 5 to 10 mM phosphate was found to be optimal, which produced 3.5 g / L monatin (quantified by LC / MS / MS as described in example 1).

Ejemplo 25 (no reivindicado) Example 25 (not claimed)

Clonación de una nueva D-aminoácido aminotransferasa de Bacillus Cloning of a new Bacillus D-amino acid aminotransferase

Se produjo D-aminoácido aminotransferasa de Bacillus (“DAAT” o “DAT”) (EC 2.6.1.21, también conocida como Dalanina aminotransferasa o D-aspartato aminotransferasa) recombinantemente. Esta aminotransferasa se utilizó en ensayos acoplados con aldolasas para la producción de (R,R)-monatina. Esta enzima aminotransferasa es homóloga a las D-aminotransferasas descritas previamente para la producción de monatina (solicitud de los Estados Unidos publicada No. 20040063175 y solicitud publicada de los Estados Unidos No. 20050282260). El organismo ATCC 4978—Bacillus sphaericus depositado originalmente como Bacillus rotans—se solicitó a ATCC y se utilizó para preparar AND genómico. Se diseñaron cebadores degenerados en las regiones de conservación de secuencias de proteínas de D-aminotransferasas conocidas de Bacillus y se utilizaron para la amplificación de la reacción en cadena de la polimerasa (“PCR”) de la secuencia de genes de la DAAT interna de la cepa ATCC mencionada anteriormente. El paseo genómico se llevó a cabo mediante el uso del kit universal BD GenomeWalker™ (Clontech, Mountain View, CA). Los análisis de secuencias (Agencourt BioScience Corporation, Beverly, MA) verificaron una secuencia codificadora de longitud total para el gen de DAAT de ATCC 4978. La secuencia de ADN del gen de DAAT de ATCC 4978 es la SEQ ID NO:357 y se muestra a continuación. El gen de la SEQ ID NO:357 puede amplificarse a través de los protocolos de PCR estándar y clonarse mediante el uso de técnicas de ADN recombinante. El gen de la SEQ ID NO:357 puede además reconstruirse mediante cualquier procedimiento conocido por el entendido en la técnica, como los procedimientos de ensamblaje de PCR conocidos por el entendido en la técnica. Bacillus D-amino acid aminotransferase ("DAAT" or "DAT") (EC 2.6.1.21, also known as Dalanine aminotransferase or D-aspartate aminotransferase) was produced recombinantly. This aminotransferase was used in aldolase-coupled assays for the production of (R, R) -monatin. This aminotransferase enzyme is homologous to the D-aminotransferases previously described for the production of monatin (published US application No. 20040063175 and published US application No. 20050282260). ATCC 4978 — Bacillus sphaericus originally deposited as Bacillus rotans — was requested from ATCC and used to prepare genomic DNA. Degenerate primers in the conservation regions of known Bacillus D-aminotransferase protein sequences were designed and used for amplification of the polymerase chain reaction ("PCR") of the gene sequence of the internal DAAT of the ATCC strain mentioned above. The genomic walk was performed using the BD GenomeWalker ™ Universal Kit (Clontech, Mountain View, CA). Sequence analyzes (Agencourt BioScience Corporation, Beverly, MA) verified a full-length coding sequence for the ATAT 4978 DAAT gene. The DNA sequence of the ATCC 4978 DAAT gene is SEQ ID NO: 357 and is shown then. The gene in SEQ ID NO: 357 can be amplified through standard PCR protocols and cloned using recombinant DNA techniques. The gene of SEQ ID NO: 357 can also be reconstructed by any method known to the person skilled in the art, such as the PCR assembly procedures known to the person skilled in the art.

La secuencia de ADN de ATCC 4978 de DAAT es: (SEQ ID NO: 357) The DAAT ATCC 4978 DNA sequence is: (SEQ ID NO: 357)

La secuencia de aminoácidos del gen de DAAT de ATCC 4978 como se codifica por la secuencia de ADN anterior es la SEQ ID NO:358 y se muestra a continuación: The amino acid sequence of the ATAT 4978 DAAT gene as encoded by the DNA sequence above is SEQ ID NO: 358 and is shown below:

(SEQ ID NO: 358) (SEQ ID NO: 358)

La nueva D-aminotransferasa obtenida a partir de la cepa ATCC 4978 tiene una secuencia de proteínas que presenta diferentes cambios de residuos de aminoácidos al compararla con la secuencia de D-aminotransferasa publicada de ATCC 10208 de B. sphaericus. La DAAT de ATCC 4978 tiene únicamente un 72% de identidad con la The new D-aminotransferase obtained from the ATCC 4978 strain has a protein sequence that exhibits different changes of amino acid residues when compared to the published D-aminotransferase sequence of ATCC 10208 from B. sphaericus. The DAAT of ATCC 4978 has only 72% identity with the

10 DAAT de B. sphaericus (ATCC 10208). Mientras que esta cepa se enumera como B. sphaericus en la ATCC, se depositó como B. rotans. Con base en las alineaciones de las secuencias y las diferencias destacadas entre esta nueva DAAT y la DAAT de B. sphaericus, se identificaron varios residuos candidatos que pueden evaluarse por su rol (individualmente o en combinación) en la mayor actividad de DAAT para la biosíntesis de (R,R)-monatina, en estas, así como otras secuencias de DAAT. DAAT of B. sphaericus (ATCC 10208). While this strain is listed as B. sphaericus in the ATCC, it was deposited as B. rotans. Based on the sequence alignments and the prominent differences between this new DAAT and the B. sphaericus DAAT, several candidate residues were identified that can be evaluated for their role (individually or in combination) in the increased DAAT activity for biosynthesis of (R, R) -monatin, in these, as well as other DAAT sequences.

15 Ejemplo 26 (no reivindicado) Example 26 (not claimed)

Caracterización de mutantes de D-Aminotransferasa de ATCC 4978 Characterization of ATCC 4978 D-Aminotransferase Mutants

Resumen experimental Experimental summary

El nuevo gen de la D-aminotransferasa (descrito en el ejemplo 25) de la cepa ATCC 4978 de Bacillus se mutagenizó mediante el uso de procedimientos dirigidos al sitio. Los genes mutantes se expresaron y ensayaron para verificar The new D-aminotransferase gene (described in Example 25) from Bacillus strain ATCC 4978 was mutagenized using site-directed procedures. Mutant genes were expressed and tested to verify

20 las actividades de interés para las vías de producción de monatina, especialmente cuando se acopla a una o más aldolasas. 20 activities of interest to the monatin production pathways, especially when coupled to one or more aldolases.

Además de las ideas enumeradas en el ejemplo 16 para los objetivos de la mutagénesis dirigida al sitio, se desarrollaron otras ideas para el anclaje real de R-MP en el sitio activo de la estructura cristalina de YM-1, las In addition to the ideas listed in Example 16 for the purposes of site-directed mutagenesis, other ideas were developed for the actual anchoring of R-MP to the active site of the YM-1 crystal structure, the

alineaciones de secuencias de aminoácidos primarios se utilizaron para determinar si era probable que la proteína aminotransferasa 4978 tuviera características estructurales en dicha región. Se esperaba que las siguientes mutaciones adicionales fueran beneficiosas (mediante el uso de la numeración de aminoácidos de la aminotransferasa 4978). Se pensó que la mutagénesis de alanina 153 a arginina estabilizaría al segundo grupo carboxilo del sustrato (R-MP). Es probable que este cambio aumente el impedimento estérico, de forma tal de compensar esto, los residuos de serina en las posiciones 181 y 182 se cambiaron a alanina o glicina. También se manejó la hipótesis de que se podría introducir una arginina en la posición 180, 181 o 182 y convertir uno o más de los otros residuos de serina a alanina o glicina para hacer lugar para la cadena lateral de arginina más voluminosa. La fenilalanina en el aminoácido 200 se encuentra espacialmente cerca del lugar donde se predice que el R-MP se anclará en el sitio activo y existe una amplia variabilidad en este residuo entre las D-aminotransferasas que catalizan la transaminación de monatina bastante bien. Se pensó que las modificaciones de los aminoácidos en esta posición podrían ser útiles. Se predijo que la mutación de la leucina 151 a fenilalanina mejoraría potencialmente las interacciones con el anillo de indol del sustrato. Primary amino acid sequence alignments were used to determine whether the 4978 protein aminotransferase was likely to have structural features in that region. The following additional mutations were expected to be beneficial (using the amino acid numbering of aminotransferase 4978). Mutagenesis of alanine 153 to arginine was thought to stabilize the second carboxyl group in the substrate (R-MP). This change is likely to increase steric hindrance, to compensate for this, serine residues at positions 181 and 182 were changed to alanine or glycine. We also hypothesized that an arginine could be introduced at position 180, 181, or 182 and one or more of the other serine residues converted to alanine or glycine to make room for the more bulky arginine side chain. The phenylalanine at amino acid 200 is spatially close to the place where R-MP is predicted to anchor at the active site and there is wide variability in this residue among D-aminotransferases that catalyze monatin transamination quite well. Modifications of amino acids at this position were thought to be useful. The mutation of leucine 151 to phenylalanine was predicted to potentially improve interactions with the indole ring of the substrate.

Con base en la bibliografía, se partió de la hipótesis que la mutación de treonina 243 a aspargina puede mejorar la selectividad de R-MP para las reacciones de transaminación. De igual modo, se pensó que la mutagénesis de aspargina 100 a alanina puede mejorar la actividad específica de la enzima para las reacciones de transaminación de monatina (Ro, et al., FEBS Lett 398:141-145, (1996); Sugio, S, et al., Biochemistry 34:9661-9669, (1995); EP1580268). Based on the literature, it was hypothesized that the mutation of threonine 243 to aspargine can improve the selectivity of R-MP for transamination reactions. Likewise, it was thought that mutagenesis of aspargine 100 to alanine may improve the specific activity of the enzyme for monatin transamination reactions (Ro, et al., FEBS Lett 398: 141-145, (1996); Sugio, S, et al., Biochemistry 34: 9661-9669, (1995); EP1580268).

Lee et al. caracterizaron los mutantes de la región 141 a 144 (asa) y encontraron que las D-aminotransferasas con EYcY en lugar de LRcD (que es nativo para nuestra proteína) tienden a tener una Km inferior para los sustratos de ácido dicarboxílico. (Lee S G, Hong S P, Song J J, Kim S J, Kwak M S, Sung M H. Functional and structural characterization of thermostable D-amino acid aminotransferases from Geobacillus spp. Appl Environ Microbiol. 2006 Febrero; 72(2):1588-94). Debido a que el MP es un sustrato de ácido dicarboxílico, similar al alfa-ceto glutarato y las concentraciones de MP son bastante bajas en una mezcla de reacción de producción de monatina, una Km inferior podría ayudar potencialmente a la actividad de una DAT mutante para la producción de monatina. Lee et al. characterized mutants from region 141 to 144 (loop) and found that D-aminotransferases with EYcY instead of LRcD (which is native to our protein) tend to have a lower Km for dicarboxylic acid substrates. (Lee SG, Hong SP, Song JJ, Kim SJ, Kwak MS, Sung M H. Functional and structural characterization of thermostable D-amino acid aminotransferases from Geobacillus spp. Appl Environ Microbiol. 2006 February; 72 (2): 1588-94 ). Because MP is a dicarboxylic acid substrate, similar to alpha-keto glutarate, and MP concentrations are quite low in a monatin production reaction mixture, a lower Km could potentially aid the activity of a mutant DAT to monatin production.

A continuación se describen los procedimientos para crear los mutantes de D-aminotransferasa 4978, así como analizar los resultados con el uso de estos mutantes. The procedures for creating the D-aminotransferase 4978 mutants are described below, as well as analyzing the results with the use of these mutants.

Mutagénesis Mutagenesis

Los cebadores para mutagénesis se diseñaron de acuerdo con las sugerencias enumeradas en el kit Multi-Change de Stratagene (Stratagene, La Jolla, CA). Los cebadores se 5'-fosforilaron. La mutagénesis se realizó mediante el uso del kit Multi-Change de Stratagene (Stratagene, La Jolla, CA) de acuerdo con las instrucciones del fabricante. Las plantillas utilizadas para la mutagénesis fueron las construcciones de DAT 4978 de pET30 (sin marcar) o pET28 (marcado) descritas en el ejemplo 25. Las secuencias de cebadores se enumeran a continuación en la tabla 30: Mutagenesis primers were designed according to the suggestions listed in the Stratagene Multi-Change Kit (Stratagene, La Jolla, CA). The primers were 5'-phosphorylated. Mutagenesis was performed using the Stratagene Multi-Change Kit (Stratagene, La Jolla, CA) according to the manufacturer's instructions. The templates used for mutagenesis were the DAT 4978 constructs of pET30 (unlabeled) or pET28 (labeled) described in Example 25. The primer sequences are listed below in Table 30:

Tabla 30 Table 30

Nombre del mutante Mutant name
Cambio de aminoácido Cebador Amino acid change Primer

4978-22 4978-22
T243N GTGATTGTTTCATCAACGAATTCAGAAGTAACGCC (SEQ ID NO: 359) T243N GTGATTGTTTCATCAACGAATTCAGAAGTAACGCC (SEQ ID NO: 359)

10 10
T243R GTGATTGTTTCATCAACGCGTTCAGAAGTAACGCC (SEQ ID NO: 360) T243R GTGATTGTTTCATCAACGCGTTCAGAAGTAACGCC (SEQ ID NO: 360)

7 7
T243S GTGATTGTTTCATCAACGAGTTCAGAAGTAACGCC (SEQ ID NO: 361) T243S GTGATTGTTTCATCAACGAGTTCAGAAGTAACGCC (SEQ ID NO: 361)

19 19
T243A GTGATTGTTTCATCAACGGCTTCAGAAGTAACGCC (SEQ ID NO: 362) T243A GTGATTGTTTCATCAACGGCTTCAGAAGTAACGCC (SEQ ID NO: 362)

15 fifteen
N100A GTGCAGGCCCTCGTGCTCATATTTTCCCTGG (SEQ ID NO: 363) N100A GTGCAGGCCCTCGTGCTCATATTTTCCCTGG (SEQ ID NO: 363)

B B
T243Q GAAGTGATTGTTTCATCAACGCAGTCAGAAGTAACCGCCAATTAT C (SEQ ID NO: 364) T243Q GAAGTGATTGTTTCATCAACGCAGTCAGAAGTAACCGCCAATTAT C (SEQ ID NO: 364)

2 2
T243N/N100 los cebadores anteriores se utilizan juntos T243N / N100 the above primers are used together

Las células XL10-Gold de E.coli (Stratagene, La Jolla, CA) se transformaron y las preparaciones de plásmido purificadas resultantes se secuenciaron para verificar que se incorporaran las mutaciones correctas. E.coli XL10-Gold cells (Stratagene, La Jolla, CA) were transformed and the resulting purified plasmid preparations were sequenced to verify that the correct mutations were incorporated.

Expresión y ensayo Expression and essay

Las preparaciones de ADN plásmido que contenían los mutantes correctos o la DAT 4978 de tipo salvaje se transformaron en el huésped de expresión BL21(DE3) de E. coli (Novagen, Madison, WI). Los cultivos se desarrollaron mediante el uso de los protocolos descritos anteriormente, los plásmidos se aislaron mediante el uso del kit miniprep de Qiagen (Qiagen, Valencia, CA) y se analizaron mediante digestión restrictiva, como se describe anteriormente, para confirmar la presencia de una inserción. Plasmid DNA preparations containing either the correct mutants or wild-type DAT 4978 were transformed into the E. coli expression host BL21 (DE3) (Novagen, Madison, WI). Cultures were grown using the protocols described above, plasmids were isolated using the Qiagen miniprep kit (Qiagen, Valencia, CA) and analyzed by restrictive digestion, as described above, to confirm the presence of a insertion.

La inducción del gen de DAAT se realizó típicamente en un medio LB que contenía kanamicina (50 !g/mL). Las células se cultivaron a una OD600 nm de 0,4 a 0,8 a 37ºC., se indujeron con 0,1 mM de IPTG (isopropil tiogalactósido) y se muestrearon a las 3 a 4 horas después de la inducción. DAAT gene induction was typically performed in LB medium containing kanamycin (50 µg / mL). Cells were grown at an OD600nm of 0.4 to 0.8 at 37 ° C, induced with 0.1mM IPTG (isopropyl thiogalactoside) and sampled 3 to 4 hours after induction.

Los extractos celulares se prepararon con el reactivo BugBuster y benzonasa nucleasa (Novagen, Madison, WI). Se realizaron ensayos de 1 ml a 30ºC con leve agitación que contenían 10,2 mg de D-triptófano, 0,05 mM de PLP, 4 mM de MgCl2, 100 mM de tampón de fosfato de potasio, pH 7,5, aproximadamente 50 !g de aldolasa, 200 mM de piruvato y 0,150 a 0,5 mg/mL de D-aminotransferasa proporcionados como extractos celulares. La totalidad de los ensayos de proteínas se realizó mediante el uso del kit de proteínas totales Bio-Rad (Coomassie) (Bio-Rad, Hercules, CA) o el kit BCA de Pierce (Pierce, Rockford, IL) y el porcentaje de expresión de la D-aminotransferasa se estimó mediante SDS-PAGE o el sistema de electroforesis automatizada Experion de Bio-Rad (Bio-Rad, Hercules, CA). Se tomaron muestras a las 3 horas y durante la noche. Cell extracts were prepared with BugBuster reagent and benzase nuclease (Novagen, Madison, WI). 1 ml assays were performed at 30 ° C with gentle shaking containing 10.2 mg D-tryptophan, 0.05 mM PLP, 4 mM MgCl2, 100 mM potassium phosphate buffer, pH 7.5, approximately 50 µg aldolase, 200 mM pyruvate and 0.150 to 0.5 mg / mL D-aminotransferase provided as cell extracts. All protein assays were performed using the Bio-Rad (Coomassie) Total Protein Kit (Bio-Rad, Hercules, CA) or Pierce's BCA Kit (Pierce, Rockford, IL) and percent expression D-aminotransferase was estimated by SDS-PAGE or the Bio-Rad Experion Automated Electrophoresis System (Bio-Rad, Hercules, CA). Samples were taken at 3 hours and overnight.

La aldolasa R-específica de la SEQ ID NO: 28 se utilizó en ensayos con aproximadamente 0,150 mg/mL de Daminotransferasa. The R-specific aldolase of SEQ ID NO: 28 was used in assays with approximately 0.150 mg / mL Daminotransferase.

Los primeros ensayos mostraron que los siguientes mutantes (sin marcar) presentaron actividad de transaminación (en orden de mayor a menor): T243N, T243S, T243N/N100A, N100A. Se notó que el T243N parecía aumentar la estereo-pureza de la (R,R)-monatina producida. Los ensayos se repitieron mediante el uso de ProA aldolasa purificada de Comamonas testosteroni (100 !g/ml) y 0,50 mg/ml de mutantes de D-aminotransferasa (sin marcar, proporcionados como extracto celular). Se tomaron muestras a las 2 horas y durante la noche. Los resultados para las proteínas activas se muestran a continuación, se promediaron los resultados duplicados. El % de (R,R)-monatina se determinó por área de pico en HPLC de fase inversa y a continuación se midió mediante el uso del procedimiento de derivatización de la FDAA descrito en el ejemplo 1. En la columna 3 de la tabla 31, se realizó un análisis adicional de derivatización de la FDAA por LC/MS/MS como se describe en el ejemplo 1, para algunas de las reacciones y dichos resultados se muestran en el paréntesis. Únicamente la R,R y (S,R)-monatina se producen a partir de Dtriptófano. El mutante T243R no pareció producir monatina en las condiciones probadas y el mutante T243A produjo niveles muy bajos de monatina. The first tests showed that the following mutants (unlabeled) showed transamination activity (in order from highest to lowest): T243N, T243S, T243N / N100A, N100A. It was noted that T243N seemed to increase the stereo-purity of the (R, R) -monatin produced. The assays were repeated using ProA aldolase purified from Comamonas testosteroni (100 µg / ml) and 0.50 mg / ml D-aminotransferase mutants (unlabelled, provided as cell extract). Samples were taken at 2 hours and overnight. Results for active proteins are shown below, duplicate results were averaged. The% of (R, R) -monatin was determined by peak area on reverse phase HPLC and then measured by using the FDAA derivatization procedure described in Example 1. In column 3 of Table 31, Additional FDAA derivatization analysis by LC / MS / MS was performed as described in Example 1 for some of the reactions and these results are shown in parentheses. Only R, R and (S, R) -monatin are produced from Dipryptophan. The T243R mutant did not appear to produce monatin under the conditions tested and the T243A mutant produced very low levels of monatin.

Tabla 31 Table 31

Enzima sin marcar (tiempo – hora o durante la noche) Unmarked enzyme (time-hour or overnight)
Monatina total (ppm) % R,R Total monatin (ppm) % R, R

tipo salvaje 4978 (2 horas) wild guy 4978 (2 hours)
4,7 41,6 4.7 41.6

tipo salvaje 4978 (durante la noche) wild guy 4978 (overnight)
43,2 35,1 (30,9) 43.2 35.1 (30.9)

T243S (2 horas) T243S (2 hours)
55,0 37,4 (21,7) 55.0 37.4 (21.7)

T243S (durante la noche) T243S (overnight)
97,7 35,5 (29,8) 97.7 35.5 (29.8)

T243N (2 horas) T243N (2 hours)
73,2 86,7 (88,3) 73.2 86.7 (88.3)

T243N (durante la noche) T243N (overnight)
120,9 86,3 (86,1) 120.9 86.3 (86.1)

N100A (2 horas) N100A (2 hours)
12,0 40,8 12.0 40.8

N100A (durante la noche) N100A (overnight)
22,3 41 22.3 41

T243A (2 horas) T243A (2 hours)
0,8 ~100 0.8 ~ 100

A pesar de que los ensayos se realizaron con la estimación del porcentaje de D-aminotransferasa mediante el uso del software Experion de Bio-Rad es claro que los mutantes T243S y T243N presentan una actividad mayor en comparación con la enzima de tipo salvaje. El mutante T243N proporcionó además un beneficio adicional del aumento dramático del % de (R,R)-monatina formada. Esta enzima tiene una mayor preferencia para el R-MP en comparación con el S-MP en reacciones de transaminación. El mutante N100A no aumentó la actividad por sí solo o en combinación con T243N, contrariamente a lo que se sugirió en la bibliografía. El mutante V34A dirigido al sitio de la DAT 4978 sin marcar también se creó mediante el uso de procedimientos similares como se describe anteriormente. Se encontró que el mutante V34A dirigido al sitio tenía una actividad significativamente menor que la enzima de tipo salvaje en las condiciones probadas. Although the tests were performed with the estimation of the percentage of D-aminotransferase by using the Bio-Rad Experion software, it is clear that the T243S and T243N mutants show a higher activity compared to the wild type enzyme. The T243N mutant further provided an additional benefit of the dramatic increase in% of (R, R) -monatin formed. This enzyme has a higher preference for R-MP compared to S-MP in transamination reactions. The N100A mutant did not increase activity on its own or in combination with T243N, contrary to what was suggested in the literature. The unlabelled DAT 4978 site-directed V34A mutant was also created using similar procedures as described above. The site-directed V34A mutant was found to have significantly less activity than the wild-type enzyme under the conditions tested.

Otro punto de interés en los ensayos iniciales fue que la enzima de tipo salvaje pareció tener una mayor actividad cuando se produjo con un marcador His de terminal N. La mutagénesis subsiguiente se realizó en la versión marcada del gen. Además, los mutantes más prometedores anteriores se subclonaron en pET28b que tenía un marcador His con terminal N. Estos se purificaron con el uso de columnas HIS-bind de Novagen y del protocolo del fabricante con los tampones recomendados (Novagen, Madison, WI). El tampón de las fracciones de eluyente se intercambió, mediante el uso de columnas PD10 de GE Healthcare (GE Healthcare, Piscataway, NJ), con el tampón utilizado en los ensayos. Another point of interest in the initial assays was that the wild-type enzyme appeared to have increased activity when produced with an N-terminal His marker. Subsequent mutagenesis was performed in the labeled version of the gene. In addition, the most promising mutants above were subcloned into pET28b that had an N-terminus His marker. These were purified using Novagen HIS-bind columns and the manufacturer's protocol with the recommended buffers (Novagen, Madison, WI). The buffer of the eluent fractions was exchanged, using GE Healthcare PD10 columns (GE Healthcare, Piscataway, NJ), with the buffer used in the assays.

Se realizaron ensayos de 1 ml con D-aminotransferasa purificada (0,5 mg/ml) y aldolasa R-específica purificada de la SEQ ID NO:276 (50 !g/ml) a 30ºC con leve agitación y que contenían 10,2 mg de D-triptófano, 0,05 mM de PLP, 200 mM de piruvato, 4 mM de MgCl2 y 100 mM de tampón de fosfato de potasio, pH 7,5 Las muestras duplicadas se incubaron durante 2 horas y durante la noche. Como control positivo, se utilizó la DAT de Bacillus sphaericus (clonada en el ejemplo 7) en los mismos ensayos. Los resultados se presentan en la tabla 32: 1 ml assays were performed with purified D-aminotransferase (0.5 mg / ml) and purified R-specific aldolase from SEQ ID NO: 276 (50 µg / ml) at 30 ° C with slight agitation and containing 10.2 mg D-tryptophan, 0.05 mM PLP, 200 mM pyruvate, 4 mM MgCl2 and 100 mM potassium phosphate buffer, pH 7.5. Duplicate samples were incubated for 2 hours and overnight. As a positive control, the DAT of Bacillus sphaericus (cloned in Example 7) was used in the same tests. The results are presented in table 32:

Tabla 32 Table 32

Enzima - marcada (tiempo: hora o durante la noche) Enzyme - marked (time: hour or overnight)
Monatina total (ppm) % R,R Total monatin (ppm) % R, R

tipo salvaje 4978 (2 horas) wild guy 4978 (2 hours)
43 98,4 43 98.4

tipo salvaje 4978 (durante la noche) wild guy 4978 (overnight)
96,7 98,3 (95,9) 96.7 98.3 (95.9)

T243N (2 horas) T243N (2 hours)
197,5 100 197.5 100

T243N (durante la noche) T243N (overnight)
301,2 99,9 (99,6) 301.2 99.9 (99.6)

DAT de B. sphaericus (2 horas) B. sphaericus DAT (2 hours)
58,2 99,7 58.2 99.7

DAT de B. sphaericus (durante la noche) B. sphaericus DAT (overnight)
221,7 98,7 (96,6) 221.7 98.7 (96.6)

T243Q (2 horas) T243Q (2 hours)
7,1 100 7.1 100

T243Q (durante la noche) T243Q (overnight)
12,4 98,8 12.4 98.8

Los datos anteriores mostraron que el mutante T243N produce claramente la mayor cantidad de monatina a las 2 horas. A medida que pasa el tiempo, la proporción del control positivo del mutante T243N con respecto a la DAT de The above data showed that the T243N mutant clearly produces the highest amount of monatin at 2 hours. As time passes, the ratio of the positive control of the T243N mutant to the DAT of

B. sphaericus se reduce. Este resultado sugiere que el mutante T243N no es tan estable durante la reacción de monatina como la DAT de B. sphaericus. Cuando se analizó en condiciones similares, la enzima T243S (maracada, purificada) presentó niveles de actividad similares a los del mutante T243N; no obstante, el porcentaje de (R,R)monatina producido fue menor (97,2% en ambas 2 horas y durante la noche). El mutante T243N/N100A tiene una actividad menor a la del mutante T243N. No obstante, ambos T243S y T243N/N100A presentaron una actividad mayor a la de la DAT 4978 de tipo salvaje. B. sphaericus is reduced. This result suggests that the T243N mutant is not as stable during the monatin reaction as the B. sphaericus DAT. When analyzed under similar conditions, the enzyme T243S (branched, purified) exhibited activity levels similar to those of the T243N mutant; however, the percentage of (R, R) monatin produced was lower (97.2% in both 2 hours and during the night). The T243N / N100A mutant has less activity than the T243N mutant. However, both T243S and T243N / N100A exhibited higher activity than wild type DAT 4978.

Los ensayos de transaminación se realizaron para determinar qué proporciones de reacción se mejoraron mediante el uso del mutante T243N en lugar de la DAT de B. sphaericus. Se realizaron ensayos de 0,5 ml a 30ºC y se tomaron como intervalos de tiempo 1 hora, 2 horas y 5 horas. Los ensayos contenían 25 mM de monatina o Dtriptófano, 25 mM de piruvato, 100 mM de fosfato de potasio, pH 7,5, 50 !M de PLP y 0,1 mg de D-aminotransferasa (marcada, purificada). En el caso en el que se utilizaron menos de 100 !g de DAT, la cantidad de alanina se normalizó a 100 !g de D-aminotransferasa. Las muestras se trataron con ácido fórmico y se analizaron mediante LC-OPA para verificar la presencia del coproducto, alanina. Los resultados se muestran en las tablas 33 y 34. Transamination assays were performed to determine what reaction rates were improved by using the T243N mutant instead of the B. sphaericus DAT. 0.5 ml tests were carried out at 30 ° C and 1 hour, 2 hours and 5 hours were taken as time intervals. The assays contained 25 mM monatin or Dtryptophan, 25 mM pyruvate, 100 mM potassium phosphate, pH 7.5, 50 µM PLP and 0.1 mg D-aminotransferase (labeled, purified). In the case where less than 100 µg of DAT was used, the amount of alanine was normalized to 100 µg of D-aminotransferase. The samples were treated with formic acid and analyzed by LC-OPA to verify the presence of the co-product, alanine. The results are shown in Tables 33 and 34.


Tabla 33: Actividad de transaminación con (R,R)-monatina como sustrato

Table 33: Transamination activity with (R, R) -monatin as substrate

Enzima Enzyme
D-alanina (mM) D-Alanine (mM)

DAT 4978 tipo salvaje (2 horas) DAT 4978 wild type (2 hours)
0,54 0.54

DAT 4978 tipo salvaje (5 horas) DAT 4978 wild type (5 hours)
1,11 1.11

T243N/N100A (2 horas) T243N / N100A (2 hours)
1,32 1.32

T243N/N100A (5 horas) T243N / N100A (5 hours)
2,78 2.78

T243S (2 horas) T243S (2 hours)
1,5 1.5

T243S (5 horas) T243S (5 hours)
2,61 2.61

T243N (2 horas) T243N (2 hours)
1,26 1.26

T243N (5 horas) T243N (5 hours)
2,65 2.65

DAT de B. sphaericus (2 horas) B. sphaericus DAT (2 hours)
0,97 0.97

DAT de B. sphaericus (5 horas) B. sphaericus DAT (5 hours)
2,2 2.2

Tabla 34: Actividad de transaminación con D-triptófano como sustrato Table 34: Transamination activity with D-tryptophan as substrate

Enzima Enzyme
D-alanina (mM) D-Alanine (mM)

DAT 4978 de tipo salvaje (1 hora) DAT 4978 wild type (1 hour)
4,55 4.55

DAT 4978 de tipo salvaje (2 horas) DAT 4978 wild type (2 hours)
8,47 8.47

T243N/N100A (1 hora) T243N / N100A (1 hour)
8,52 8.52

T243N/N100A (2 horas) T243N / N100A (2 hours)
12,67 12.67

T243S (1 hora) T243S (1 hour)
4,89 4.89

T243S (2 horas) T243S (2 hours)
8,1 8.1

T243N (1 hora) T243N (1 hour)
7,19 7.19

T243N (2 horas) T243N (2 hours)
10,83 10.83

DAT de B. sphaericus (1 hora) B. sphaericus DAT (1 hour)
8,7 8.7

DAT de B. sphaericus (2 horas) B. sphaericus DAT (2 hours)
12,54 12.54

Para las reacciones de D-triptófano, los resultados muestran que algunas de las enzimas alcanzaron el equilibrio a las 2 horas. Las reacciones de (R,R)-monatina limitan claramente la velocidad y las mejoras a esta actividad tienen un impacto mayor sobre las velocidades de producción de monatina de D-triptófano. For D-tryptophan reactions, the results show that some of the enzymes reached equilibrium within 2 hours. The (R, R) -monatin reactions clearly limit the rate and improvements to this activity have a greater impact on the monatin production rates of D-tryptophan.

Se realizaron ensayos adicionales para examinar la estabilidad del mutante T243N de la DAT 4978. La enzima de Additional assays were performed to examine the stability of the D24 4978 T243N mutant.

10 tipo salvaje también pierde actividad con el paso del tiempo. El ejemplo 27 describe procedimientos para mejorar la estabilidad del mutante T243N de la D-aminotransferasa. Cuando las versiones recién preparadas marcadas y sin marcar del mutante T243N se prepararon y compararon con respecto a su actividad, se encontró que la versión sin marcar tenía una mejor estabilidad temporal, lo que la hace una mejor versión de la enzima para utilizarla en reacciones de producción de monatina. The wild guy also loses activity over time. Example 27 describes procedures to improve the stability of the T243N mutant of D-aminotransferase. When the freshly labeled and unlabelled versions of the T243N mutant were prepared and compared for activity, the unlabelled version was found to have better temporal stability, making it a better version of the enzyme for use in reactions of monatina production.

15 Se prepararon otros mutantes de la DAT 4978 mediante procedimientos comúnmente conocidos por los expertos en la técnica. No obstante, todas estas mutaciones resultaron en una proteína que era insoluble en las condiciones en que fueron preparadas y por consiguiente, no podían analizarse para verificar su actividad. Las mutaciones que resultaron en proteínas insolubles fueron: Other mutants of DAT 4978 were prepared by procedures commonly known to those skilled in the art. However, all these mutations resulted in a protein that was insoluble under the conditions in which they were prepared and therefore could not be analyzed to verify its activity. The mutations that resulted in insoluble proteins were:

S180 A/S181A/S182R; L151F; V34G; S181R; A153R/S181A/S182A; A153R/S182A; A153R/S182G; S180R/S181A/S182G; S180R/S181A/S182A; S180R/S181G/S182G; S180G/S181R/S182G; y S180A/S181R/S182A. Mutagénesis adicional Para crear el mutante F200M de DAT 4978, el marco de lectura abierto de la DAT 4978 de tipo salvaje del ejemplo S180 A / S181A / S182R; L151F; V34G; S181R; A153R / S181A / S182A; A153R / S182A; A153R / S182G; S180R / S181A / S182G; S180R / S181A / S182A; S180R / S181G / S182G; S180G / S181R / S182G; and S180A / S181R / S182A. Additional mutagenesis To create the F200M mutant from DAT 4978, the wild type DAT 4978 open reading frame from the example

25 (marcada) se amplificó con los cebadores 73 y 80 (a continuación) y la polimerasa de ADN PfuTurbo (Stratagene, 25 (labeled) was amplified with primers 73 and 80 (below) and PfuTurbo DNA polymerase (Stratagene,

La Jolla, CA) y se clonó en pCRII-Blunt (Invitrogen, Carlsbad, CA). Se verificó su secuencia (Agencourt, Beverly, La Jolla, CA) and cloned into pCRII-Blunt (Invitrogen, Carlsbad, CA). Their sequence was verified (Agencourt, Beverly,

MA). Las regiones 5' y 3' se amplificaron mediante el uso de los cebadores 80 y 96 y 99 y 103, respectivamente. El MA). The 5 'and 3' regions were amplified using primers 80 and 96 and 99 and 103, respectively. The

ADN amplificado a continuación se purificó en gel mediante el uso del kit de extracción en gel QIAquick de Qiagen Amplified DNA was then gel purified using Qiagen QIAquick Gel Extraction Kit

(Qiagen, Valencia, CA). El ADN amplificado se sometió nuevamente a PCR mediante el uso de los cebadores 80 y (Qiagen, Valencia, CA). Amplified DNA was again subjected to PCR using primers 80 and

99. El ADN amplificado se purificó en gel como se describe anteriormente y se clonó en pCRII Blunt y se verificó su secuencia. El marco de lectura abierto de la DAT se subclonó como un fragmento de enzima de restricción NdeI/XhoI en pET28b. 99. Amplified DNA was gel purified as described above and cloned into pCRII Blunt and its sequence verified. The DAT open reading frame was subcloned as a restriction enzyme fragment NdeI / XhoI in pET28b.

Tabla 35 Table 35

Número de cebador Primer number
Secuencia Sequence

73 73
CATATGAGTTATAGCTTATGGAATGACCAAATTGTGAATG (SEQ ID NO: 365) CATATGAGTTATAGCTTATGGAATGACCAAATTGTGAATG (SEQ ID NO: 365)

80 80
CTCGAGTGCGGCCGCAAGCTTGTCGACGGAGCTC (SEQ ID NO: 366) CTCGAGTGCGGCCGCAAGCTTGTCGACGGAGCTC (SEQ ID NO: 366)

96 96
AATATTTATGGAATTAAAGATGGCGTATTATACACACATCCAGCGAATAACATGATCTTAA ATGGTATTACACGTCAAGTAATCATTAAATGTGC (SEQ ID NO: 367) AATATTTATGGAATTAAAGATGGCGTATTATACACACATCCAGCGAATAACATGATCTTAA ATGGTATTACACGTCAAGTAATCATTAAATGTGC (SEQ ID NO: 367)

99 99
GGCCAGTGAATTGTAATACGACTCACTATAGGGC (SEQ ID NO: 368) GGCCAGTGAATTGTAATACGACTCACTATAGGGC (SEQ ID NO: 368)

103 103
CGCCATCTTTAATTCCATAAATATTTGAAGAAGAGCCTTCTG (SEQ ID NO: 369) CGCCATCTTTAATTCCATAAATATTTGAAGAAGAGCCTTCTG (SEQ ID NO: 369)

Los siguientes cebadores se diseñaron para mutagénesis dirigida al sitio adicional mediante el kit de mutagénesis dirigida al sitio QuikChange® (Stratagene, La Jolla, CA). La mutagénesis se realizó mediante el uso del kit Multi-Change de Stratagene (Stratagene, La Jolla, CA) de acuerdo con las instrucciones del fabricante. La plantilla utilizada para la mutagénesis fue la construcción de DAT 4978 de pET28 (marcado) descrita en el ejemplo 25. También se creó un mutante doble mediante el uso del mutante F200Y como plantilla y se realizó una ronda adicional de mutagénesis con el cebador T243N (enumerado anteriormente). The following primers were designed for additional site-directed mutagenesis using the QuikChange® site-directed mutagenesis kit (Stratagene, La Jolla, CA). Mutagenesis was performed using the Stratagene Multi-Change Kit (Stratagene, La Jolla, CA) according to the manufacturer's instructions. The template used for mutagenesis was the DAT 4978 construct of pET28 (labeled) described in Example 25. A double mutant was also created using the F200Y mutant as a template and an additional round of mutagenesis was performed with the T243N primer ( listed above).

Tabla 36 Table 36

Mutante Mutant
Oligo Oligo

141-LRcD144-> EYcY 141-LRcD144-> EYcY
GCAACATTTGTAGAAGACATTCGTTGGGAATACTGTTACATTAAATCATTAAATTTACTTG GTGCG (SEQ ID NO: 370) GCAACATTTGTAGAAGACATTCGTTGGGAATACTGTTACATTAAATCATTAAATTTACTTG GTGCG (SEQ ID NO: 370)

F200YF200Y
GTATTATACACACATCCAGCGAATAACTACATCTTAAATGGTATTACACGTCAAG (SEQ ID NO: 371)  GTATTATACACACATCCAGCGAATAACTACATCTTAAATGGTATTACACGTCAAG (SEQ ID NO: 371)

S244K S244K
GCAATGGATGAAGTGATTGTTTCATCAACGACTAAAGAAGTAACGCCAATTATCGACATA GATG (SEQ ID NO: 372) GCAATGGATGAAGTGATTGTTTCATCAACGACTAAAGAAGTAACGCCAATTATCGACATA GATG (SEQ ID NO: 372)

243-TS-244>NK 243-TS-244> NK
GCAATGGATGAAGTGATTGTTTCATCAACGAATAAAGAAGTAACGCCAATTATCGACATA GATG (SEQ ID NO: 373) GCAATGGATGAAGTGATTGTTTCATCAACGAATAAAGAAGTAACGCCAATTATCGACATA GATG (SEQ ID NO: 373)

243-TS-244>NR 243-TS-244> NR
GCAATGGATGAAGTGATTGTTTCATCAACGAATCGTGAAGTAACGCCAATTATCGACATA GATG (SEQ ID NO: 374) GCAATGGATGAAGTGATTGTTTCATCAACGAATCGTGAAGTAACGCCAATTATCGACATA GATG (SEQ ID NO: 374)

Las regiones codificadoras mutantes se verificaron por secuenciado de ADN (Agencourt). Los plásmidos a los que se les verificó la secuencia se transformaron en células BL21(DE3) (Novagen, Madison, WI). Mutant coding regions were verified by DNA sequencing (Agencourt). The plasmids to which the sequence was verified were transformed into BL21 (DE3) cells (Novagen, Madison, WI).

Expresión y ensayo Expression and essay

Los cultivos que contenían 100 ml de LB con 50 !g/ml de kanamicina en un matraz deflector de 500 ml inoculado con un ml de un cultivo durante la noche y cultivados a 37ºC a una densidad óptica (a 600 nm) de aproximadamente 0,6. La producción de proteína se indujo mediante IPTG a una concentración final de 1 mM. Las células se incubaron a 30ºC durante 4,5 horas después de la adición de IPTG. Las células se centrifugaron y congelaron a −80ºC. Las células (preparadas mediante el uso del reactivo BugBuster de Novagen (Novagen, Madison, WI) que contenía 1 !L/mL de benzonasa nucleasa, 5 !L/mL de mezcla de inhibidor de proteasa II y 0,033 !L/mL de rLisozima de acuerdo con el protocolo recomendado de Novagen) se mezclaron y se analizaron por SDS-PAGE. Los mutantes (141-LRcD-144->EYcY) y (243-TS-244->NR) resultaron en proteínas insolubles en las condiciones en las cuales se prepararon. El mutante 243-TS-244->NK no presentó actividad cuantificable en las condiciones probadas y es probablemente una enzima de actividad débil en comparación con el tipo salvaje como es el mutante S244K. Cultures containing 100 ml of LB with 50 µg / ml kanamycin in a 500 ml baffle flask inoculated with one ml of an overnight culture and grown at 37 ° C at an optical density (at 600nm) of approximately 0, 6. Protein production was induced by IPTG at a final concentration of 1 mM. Cells were incubated at 30 ° C for 4.5 hours after addition of IPTG. Cells were spun and frozen at -80 ° C. Cells (prepared using Novagen's BugBuster reagent (Novagen, Madison, WI) containing 1 µL / mL of benzase nuclease, 5 µL / mL of protease II inhibitor mixture and 0.033 µL / mL of rLisozyme according to the recommended Novagen protocol) they were mixed and analyzed by SDS-PAGE. Mutants (141-LRcD-144-> EYcY) and (243-TS-244-> NR) resulted in insoluble proteins under the conditions in which they were prepared. The 243-TS-244-> NK mutant showed no quantifiable activity under the conditions tested and is probably an enzyme with weak activity compared to the wild type as is the S244K mutant.

Las proteínas marcadas con His se purificaron de la siguiente forma. Las columnas HIS-bind (Novagen, Madison, WI) se equilibraron con 10 mL de fosfato de potasio 100 mM, pH 7,8, que contenía 200 mM de NaCl y 50 !M de PLP. Los extractos libres de células se cargaron en la columna. Las columnas se lavaron con 10mL de tampón de equilibración, 10 mL de tampón de equilibración que contenía 25 mM de imidazol y 10 mL de tampón de equilibración que contenía 50 mM de imidazol. Las proteínas se eluyeron con 5 ml de tampón de equilibración que contenía 500 mM de imidazol. Las proteínas se desalaron mediante el uso de columnas PD10 que se equilibraron en 100 mM de fosfato de potasio, pH 7,8 que contenía 50 !M de PLP. Las proteínas purificadas se concentraron y cuantificaron mediante el uso del ensayo Bradford (Bio-Rad, Hercules, CA). His-tagged proteins were purified as follows. The HIS-bind columns (Novagen, Madison, WI) were equilibrated with 10 mL of 100 mM potassium phosphate, pH 7.8, containing 200 mM NaCl and 50 µM PLP. Cell-free extracts were loaded onto the column. The columns were washed with 10mL of equilibration buffer, 10mL of equilibration buffer containing 25mM imidazole and 10mL of equilibration buffer containing 50mM imidazole. Proteins were eluted with 5 ml of equilibration buffer containing 500mM imidazole. Proteins were desalted using PD10 columns that were equilibrated in 100 mM potassium phosphate, pH 7.8 containing 50 µM PLP. Purified proteins were concentrated and quantified using the Bradford Assay (Bio-Rad, Hercules, CA).

Los mutantes de D-aminotransferasa se analizaron mediante el uso de 500 !g/ml de D-aminotransferasa, 50 !g/ml de aldolasa de la SEQ ID NO:276, 4 mM de MgCl2, 50 mM de fosfato de potasio, pH 8, 200 mM de piruvato de sodio, 0,05 mM de PLP y 20,4 mg/ml de D-triptófano para las condiciones de ensayo. El volumen final fue de 1,25 ml. Las muestras (200 !l) se tomaron después de 0,5, 1, 2 y 14 horas y se congelaron hasta que el experimento se completó. Las muestras se filtraron, se diluyeron de 1 a 10 y se analizaron mediante LC/MS/MS como se describe en el ejemplo 1. D-aminotransferase mutants were analyzed using 500 µg / ml D-aminotransferase, 50 µg / ml aldolase from SEQ ID NO: 276, 4 mM MgCl2, 50 mM potassium phosphate, pH 8,200 mM sodium pyruvate, 0.05 mM PLP and 20.4 mg / ml D-tryptophan for the test conditions. The final volume was 1.25 ml. Samples (200 µl) were taken after 0.5, 1, 2, and 14 hours and frozen until the experiment was completed. The samples were filtered, diluted from 1 to 10, and analyzed by LC / MS / MS as described in Example 1.

La D-aminotransferasa 4978 de tipo salvaje del ejemplo 25 se utilizó como una referencia para el porcentaje de actividad relativa. La tabla 37 muestra la actividad relativa de cada mutante en cada intervalo de tiempo. Wild type D-aminotransferase 4978 from Example 25 was used as a reference for the relative percentage of activity. Table 37 shows the relative activity of each mutant at each time interval.

Tabla 37 Table 37

D-aminotransferasa D-aminotransferase
tiempo (horas) % actividad time (hours) % exercise

4978 de tipo salvaje 4978 wild type
0,5 100 0.5 100

T243NT243N
0,5 270  0.5 270

F200MF200M
0,5 50  0.5 fifty

F200YF200Y
0,5 70  0.5 70

F200M/T243NF200M / T243N
0,5 183  0.5 183

S244K S244K
0,5 4 0.5 4

D-aminotransferasa D-aminotransferase
tiempo (horas) % actividad time (hours) % exercise

4978 de tipo salvaje 4978 wild type
1 100 one 100

T243NT243N
1 289  one 289

F200MF200M
1 55  one 55

F200YF200Y
1 81  one 81

F200M/T243NF200M / T243N
1 203  one 203

S244K S244K
1 6 one 6

4978 de tipo salvaje 4978 wild type
2 100 2 100

T243NT243N
2 266  2 266

F200YF200Y
2 79  2 79

F200M/T243NF200M / T243N
2 185  2 185

S244K S244K
2 6 2 6

4978 de tipo salvaje 4978 wild type
14 100 14 100

T243NT243N
14 254  14 254

F200MF200M
14 56  14 56

F200YF200Y
14 80  14 80

F200M/T243NF200M / T243N
14 168  14 168

S244K S244K
14 8 14 8


Ejemplo 27 (no reivindicado)

Example 27 (not claimed)

El T243N fue el mejor mutante de todos los probados para verificar la actividad en la producción de (R,R)-monatina. T243N was the best mutant of all tested to verify activity in (R, R) -monatin production.

Estabilización del mutante T243N de la D-aminotransferasa de la cepa ATCC 4978 Stabilization of the AT24 4978 strain D-aminotransferase mutant T243N

5 Como se muestra en el ejemplo 25, la actividad inicial de la DAT mutante T243N es significativamente mayor que para la DAT de B. sphaericus, pero la actividad disminuye más rápidamente. Experimentos adicionales, con el uso del protocolo anaerobio descrito a continuación, indicaron que la actividad inicial de la DAT mutante T243N, fue hasta 8 veces mayor que la DAT de B. sphaericus, no obstante, la actividad disminuyó rápidamente aún en las condiciones anaerobias. Los siguientes estudios se realizaron para tratar de mantener la mayor actividad durante un 5 As shown in Example 25, the initial activity of the T243N mutant DAT is significantly higher than for the B. sphaericus DAT, but the activity decreases more rapidly. Additional experiments, using the anaerobic protocol described below, indicated that the initial activity of the T243N mutant DAT was up to 8 times higher than the B. sphaericus DAT, however, the activity decreased rapidly even under anaerobic conditions. The following studies were conducted to try to maintain the highest activity during a

10 periodo extendido de tiempo. 10 extended period of time.

El mutante T243N de la D-aminotransferasa de la cepa 4978 (descrito en el ejemplo 25) y la aldolasa HMG de S. meliloti se purificaron como las proteínas marcadas con HIS6 como se describe a continuación. La aldolasa de la SEQ ID NO:276 se purificó como se describe en el ejemplo 23. The T243N mutant of the D-aminotransferase of strain 4978 (described in Example 25) and the S. meliloti aldolase HMG were purified as the HIS6-labeled proteins as described below. The aldolase from SEQ ID NO: 276 was purified as described in Example 23.

Purificación de DAT a partir de ATCC 4978 (mutante T243N) Purification of DAT from ATCC 4978 (T243N mutant)

15 El mutante T243N de la D-aminotransferasa de la cepa de ATCC 4978 con un marcador de purificación HIS6 amino terminal (descrito en el ejemplo 26) se produjo mediante el uso del sistema Overnight Express II de Biosciences EMD (soluciones 1 a 6) (Novagen, Madison, WI) que contenía 50 !g/mL de kanamicina en matraces de agitación. Este sistema de expresión induce la expresión de los sistemas inducidos por IPTG sin la necesidad de controlar el crecimiento celular. Después de la inoculación de alícuotas de 200 mL del medio (en matraces de 1 L) de los cultivos The AT24 4978 strain D-aminotransferase mutant T243N with an amino terminal HIS6 purification marker (described in Example 26) was produced using the Overnight Express II system from Biosciences EMD (solutions 1 to 6) ( Novagen, Madison, WI) containing 50 µg / mL kanamycin in shake flasks. This expression system induces the expression of IPTG-induced systems without the need to control cell growth. After inoculation of 200 mL aliquots of the medium (in 1 L flasks) from the cultures

20 líquidos o placas del receptor BL21(DE3) de E. coli que tiene el gen para la D-aminotransferasa mutante T243N de la cepa 4978 de ATCC en el plásmido pET28b, los cultivos se incubaron a 30ºC durante la noche con agitación a 225 rpm. Cuando la OD600 alcanzó un mínimo de 6, las células se cosecharon mediante centrifugación y se lavaron una vez con tampón. 20 liquids or plates of the E. coli BL21 (DE3) receptor bearing the gene for the mutant D-aminotransferase T243N of the ATCC strain 4978 in the plasmid pET28b, the cultures were incubated at 30 ° C overnight with shaking at 225 rpm . When the OD600 reached a minimum of 6, the cells were harvested by centrifugation and washed once with buffer.

El extracto libre de células se preparó mediante el uso del reactivo de extracción BugBuster® de EMD Biosciences (libre de amina primaria) (Novagen, Madison, WI) que contenía 1 !L/mL de Benzonasa® Nucleasa, 5 !L/mL de mezcla de inhibidor de proteasa conjunto II (Calbiochem—Novabiochem Corp., San Diego, CA) y 0,033 !L/mL de rLisozima™ (Novagen, Madison, WI) de acuerdo con el protocolo del fabricante. Todas las etapas de purificación subsiguientes se llevaron a cabo a 4ºC. El extracto celular se centrifugó durante 20 a 30 minutos a 15.000×g para extraer los residuos celulares. Se aplicó una alícuota de 20 a 25 mL del extracto libre de células a una columna de 45 mL de la resina de flujo rápido GE Healthcare Chelating Sepharose™ (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que había sido equilibrada previamente con 100 mM de fosfato de potasio que contenía 200 mM de cloruro de sodio y 50 !M de PLP. Para generar níquel a partir de la resina, la resina se lavó con 150 mL de hexahidrato de sulfato de níquel (II) 200 mM y después con 150 mL de agua destilada. Después de cargar la muestra, la columna se lavó/eluyó con 150 mL del tampón de equilibración que contenía 25 mM de imidazol, 150 mL del tampón de equilibración que contenía 50 mM de imidazol y 150 mL del tampón de equilibración que contenía 500 mM de imidazol. La proteína marcada con HIS6 se eluyó en el último lavado. El lavado con 500 mM de imidazol se concentró con dispositivos de centrifugación con filtro Millipore/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) a 15 a 20 mL de acuerdo con las instrucciones del fabricante. El imidazol y el cloruro de sodio se extrajeron mediante el pasaje a través de las columnas desechables de GE Healthcare PDIO (GE Healthcare, Piscataway, NJ) (2,5 mL de muestra por columna) equilibradas previamente con 100 mM de fosfato de potasio, pH 7,8, que contenía 0,5 !M de PLP. La aminotransferasa purificada se eluyó con 3,5 mL por columna del mismo tampón. Se determinó la concentración de cada fracción mediante el uso del kit de ensayo Pierce BCA (Pierce, Rockford, IL) mediante el uso de BSA como la el estándar de proteína. The cell free extract was prepared using the EMB Biosciences BugBuster® Extraction Reagent (primary amine free) (Novagen, Madison, WI) containing 1 µL / mL Benzonasa® Nuclease, 5 µL / mL mixture of protease inhibitor set II (Calbiochem — Novabiochem Corp., San Diego, CA) and 0.033 µL / mL rLisozyme ™ (Novagen, Madison, WI) according to the manufacturer's protocol. All subsequent purification steps were carried out at 4 ° C. The cell extract was centrifuged for 20-30 minutes at 15,000 xg to extract cell debris. A 20 to 25 mL aliquot of the cell free extract was applied to a 45 mL column of GE Healthcare Chelating Sepharose ™ Rapid Flow Resin (Nickel (II) form) (GE Healthcare, Piscataway, NJ) that had been previously equilibrated with 100 mM potassium phosphate containing 200 mM sodium chloride and 50 µM PLP. To generate nickel from the resin, the resin was washed with 150 mL of 200mM nickel (II) sulfate hexahydrate and then with 150 mL of distilled water. After loading the sample, the column was washed / eluted with 150 mL of the equilibration buffer containing 25 mM imidazole, 150 mL of the equilibration buffer containing 50 mM imidazole and 150 mL of the equilibration buffer containing 500 mM of imidazole. The HIS6-labeled protein was eluted in the last wash. The 500 mM imidazole wash was concentrated with Millipore / Amicon Centricon Plus-70 Filter (MWCO 10 kDa) (Millipore, Billerica, MA) to 15 to 20 mL according to the manufacturer's instructions. Imidazole and sodium chloride were removed by passage through the GE Healthcare PDIO (GE Healthcare, Piscataway, NJ) disposable columns (2.5 mL sample per column) pre-equilibrated with 100 mM potassium phosphate, pH 7.8, containing 0.5 µM PLP. The purified aminotransferase was eluted with 3.5 mL per column of the same buffer. The concentration of each fraction was determined using the Pierce BCA Assay Kit (Pierce, Rockford, IL) using BSA as the protein standard.

Se determinó la pureza de cada fracción y el nivel de expresión en el extracto libre de células mediante el uso de un sistema de chip microcapilar Bio-Rad Experion (Bio-Rad, Hercules, CA) o mediante el uso de geles con gradiente de SDS-poliacrilamida del 4 al 15% de Bio-Rad (Bio-Rad, Hercules, CA) en un aparato celular Mini PROTEAN® 3. La proteína se visualizó en geles de poliacrilamida mediante el uso de tinción de Coomassie G-250 de Bio-Rad Bio-Safe (Bio-Rad, Hercules, CA) y se destiñó con agua. Típicamente, este procedimiento produce aproximadamente 20 mg de enzima a partir de 200 mL de cultivo durante la noche que tiene de un 85 a un 90% de pureza, a juzgar por el software Experion y a partir del análisis de los geles SDS-PAGE. Se almacenaron alícuotas (1 a 5 mL) de la enzima purificada a −80ºC hasta su uso. The purity of each fraction and the level of expression in the cell-free extract were determined by using a Bio-Rad Experion microcapillary chip system (Bio-Rad, Hercules, CA) or by using SDS gradient gels. -4 to 15% polyacrylamide of Bio-Rad (Bio-Rad, Hercules, CA) in a Mini PROTEAN® 3 cellular apparatus. The protein was visualized in polyacrylamide gels using Bio-Coomassie G-250 staining. Rad Bio-Safe (Bio-Rad, Hercules, CA) and stained with water. Typically, this procedure produces approximately 20 mg of enzyme from 200 mL of culture overnight that is 85 to 90% pure, judging by the Experion software and from analysis of SDS-PAGE gels. Aliquots (1 to 5 mL) of the purified enzyme were stored at −80 ° C until use.

La purificación de la aldolasa de la SEQ ID NO:276 es como se describe en el ejemplo 23. The aldolase purification of SEQ ID NO: 276 is as described in Example 23.

Purificación de la aldolasa HMG de S. meliloti Purification of S. meliloti HMG aldolase

La aldolasa HMG de S. meliloti con un marcador de purificación HIS6 amino terminal (clonación descrita en la solicitud de los Estados Unidos publicada No. 20040063175 y WO 03091396 A2) se produjo mediante la inducción de los cultivos desarrollados en caldo de Luria-Bertani que contenía 50 mg/L de kanamicina con 0,2 mM de IPTG. Después de la inoculación de alícuotas de 800 mL del medio de cualquiera de los cultivos líquidos o placas del receptor BL21(DE3) de E. coli que tiene el gen para la aldolasa HMG de S. meliloti en pET30(Xa/LIC), los cultivos se incubaron a 37ºC con agitación a 225 rpm. Cuando la densidad óptica alcanzó una OD600nm de 0,5 a 0,75, se agregó IPTG y los cultivos se incubaron a 30ºC con agitación a 225 rpm durante 4 horas. Las células se cosecharon mediante centrifugación y se lavaron una vez con tampón. S. meliloti HMG aldolase with an amino terminal HIS6 purification marker (cloning described in published US application No. 20040063175 and WO 03091396 A2) was produced by induction of cultures grown in Luria-Bertani broth that it contained 50 mg / L kanamycin with 0.2 mM IPTG. After inoculation of 800 mL aliquots of the medium from any of the liquid cultures or plates of the E. coli BL21 (DE3) receptor that has the gene for the S. meliloti HMG aldolase gene in pET30 (Xa / LIC), the Cultures were incubated at 37 ° C with shaking at 225 rpm. When the optical density reached OD600nm from 0.5 to 0.75, IPTG was added and the cultures were incubated at 30 with shaking at 225 rpm for 4 hours. Cells were harvested by centrifugation and washed once with buffer.

Para preparar el extracto libre de células que contenía la aldolasa de S. meliloti, las células se suspendieron en 3 a 4 volúmenes de 50 mM de EPPS(N-(2-hidroxietil)piperazina-N'-(ácido 3-propanosulfónico), pH 8,2 que contenía 100 mM de NaCl y después se mezclaron mediante el uso de un homogeneizador Microfluidics (Microfluidics, Newton, MA) (3 pasadas a 18.000 psi), con mantenimiento de la temperatura de la suspensión a menos de 15ºC. La suspensión de células se centrifugó durante 20 a 30 minutos a 15.000-20.000×g para extraer los residuos celulares. La proteína marcada con HIS6 se purificó mediante el uso de columnas HIS-Bind® de EMD Biosciences (Novagen, Madison, WI) de acuerdo con el protocolo recomendado del fabricante con una excepción: las columnas se lavaron con una solución 1:1 de tampón de unión:tampón de lavado en lugar de tampón de lavado únicamente. La fracción de elución se concentró con dispositivos de centrifugación con filtro Millipore/Amicon Centricon Plus15 (MWCO 5 kDa) (Millipore, Billerica, MA) a 7 a 10 mL de acuerdo con las instrucciones del fabricante. El imidazol y el cloruro de sodio se extrajeron mediante el pasaje a través de las columnas desechables de GE Healthcare PD1O (GE Healthcare, Piscataway, NJ) (2,5 mL de muestra por columna) equilibrado previamente con 50 mM de EPPS, pH 8,2, que contenía 100 mM de NaCl. La aldolasa purificada se eluyó con 3,5 mL por columna del mismo tampón. Se determinó la concentración de proteínas de cada fracción mediante el uso del kit de ensayo Pierce BCA (Pierce, Rockford, IL) mediante el uso de BSA como el estándar de proteína. To prepare the cell free extract containing S. meliloti aldolase, the cells were suspended in 3 to 4 volumes of 50 mM EPPS (N- (2-hydroxyethyl) piperazine-N '- (3-propanesulfonic acid), pH 8.2 containing 100 mM NaCl and then mixed by using a Microfluidics homogenizer (Microfluidics, Newton, MA) (3 passes at 18,000 psi), with suspension temperature maintained below 15 ° C. Cell suspension was centrifuged for 20-30 minutes at 15,000-20,000 × g to remove cell debris HIS6-labeled protein was purified using HIS-Bind® columns from EMD Biosciences (Novagen, Madison, WI) according with the manufacturer's recommended protocol with one exception: columns were washed with 1: 1 binding buffer: wash buffer solution instead of wash buffer only Elution fraction was concentrated with Millipore filter centrifugation devices / Amicon Centricon Plus15 (MWCO 5k Da) (Millipore, Billerica, MA) at 7 to 10 mL according to the manufacturer's instructions. Imidazole and sodium chloride were removed by passage through GE Healthcare PD1O (GE Healthcare, Piscataway, NJ) disposable columns (2.5 mL sample per column) pre-equilibrated with 50 mM EPPS, pH 8 , 2, containing 100 mM NaCl. The purified aldolase was eluted with 3.5 mL per column of the same buffer. The protein concentration of each fraction was determined using the Pierce BCA Assay Kit (Pierce, Rockford, IL) using BSA as the protein standard.

Se determinó la pureza de cada fracción y el nivel de expresión en el extracto libre de células mediante el uso de geles con gradiente de SDS-poliacrilamida del 4 al 15% de Bio-Rad (Bio-Rad, Hercules, CA) en un aparato celular Mini PROTEAN® 3. La proteína se visualizó en geles de poliacrilamida mediante el uso de tinción de Coomassie G250 de Bio-Rad Bio-Safe (Bio-Rad, Hercules, CA) y se destiñó con agua. Típicamente, este procedimiento produce aproximadamente 15 a 20 mg de la enzima a partir de 800 mL de cultivo y es de un 85 a un 95% pura. Se almacenaron alícuotas (1 a 5 mL) de la enzima purificada a −80ºC hasta el uso. The purity of each fraction and the level of expression in the cell-free extract were determined by using gels with a gradient of SDS-polyacrylamide from 4 to 15% of Bio-Rad (Bio-Rad, Hercules, CA) in an apparatus Cellular Mini PROTEAN® 3. Protein was visualized on polyacrylamide gels using Bio-Rad Bio-Safe Coomassie G250 stain (Bio-Rad, Hercules, CA) and stained with water. Typically, this procedure produces approximately 15 to 20 mg of the enzyme from 800 mL of culture and is 85 to 95% pure. Aliquots (1 to 5 mL) of the purified enzyme were stored at −80 ° C until use.

Ensayos de producción de monatina Monatin production tests

Los tubos cónicos de polipropileno (14 mL) que contenían 143 mg de D-triptófano se desoxigenaron en una cámara anaerobia durante la noche. Las soluciones a granel de 1 M de tampón EPPS (pH 8,2), 2 M de MgCl2, 2 M de piruvato de sodio y 10 mM de PLP se prepararon en agua desgasificada y se equilibraron en la cámara anaerobia. 5 Las soluciones a granel de Tween 80 al 10% (v/v), Tween 20 al 1% (v/v), Triton X-100 al 1% (v/v), acetona al 100%, etanol al 100% y glicerol (p/v) al 50% se equilibraron en la cámara anaerobia junto con 0,7 g de trehalosa, inositol, sorbitol y eritritol en 2 mL de tubos de microcentrifugadora. Las preparaciones de las enzimas purificadas se descongelaron sobre hielo y se utilizaron inmediatamente en la cámara anaerobia. Las soluciones a granel se agregaron a los tubos cónicos de 14 mL para proporcionar una concentración final de 100 mM de EPPS, 200 mM de 10 piruvato, 100 mM de triptófano, 1 mM de MgCl2, 0,05 mM de PLP, 0,5 mg/mL de D-aminotransferasa y 0,01 mg/mL de aldolasa de la SEQ ID NO:276 o 0,05 mg/mL de aldolasa HMG de S. meliloti. Los componentes estabilizadores de enzima propuestos se agregaron en varias concentraciones finales (Tablas 38 y 39) para llevar el volumen final de reacción a 7 mL por tubo. Las reacciones se incubaron a temperatura ambiente en una cámara anaerobia con leve agitación durante 24 horas. Se extrajeron las muestras periódicamente y éstas se analizaron para verificar la Polypropylene conical tubes (14 mL) containing 143 mg of D-tryptophan were deoxygenated in an anaerobic chamber overnight. Bulk solutions of 1M EPPS buffer (pH 8.2), 2M MgCl2, 2M sodium pyruvate and 10mM PLP were prepared in degassed water and equilibrated in the anaerobic chamber. 5 Bulk solutions of Tween 80 10% (v / v), Tween 20 1% (v / v), Triton X-100 1% (v / v), 100% acetone, 100% ethanol and 50% glycerol (w / v) were equilibrated in the anaerobic chamber along with 0.7 g of trehalose, inositol, sorbitol and erythritol in 2 mL of microcentrifuge tubes. The purified enzyme preparations were thawed on ice and immediately used in the anaerobic chamber. Bulk solutions were added to the 14 mL conical tubes to provide a final concentration of 100 mM EPPS, 200 mM 10 pyruvate, 100 mM tryptophan, 1 mM MgCl2, 0.05 mM PLP, 0.5 mg / mL D-aminotransferase and 0.01 mg / mL aldolase from SEQ ID NO: 276 or 0.05 mg / mL aldolase HMG from S. meliloti. The proposed enzyme stabilizing components were added in various final concentrations (Tables 38 and 39) to bring the final reaction volume to 7 mL per tube. Reactions were incubated at room temperature in an anaerobic chamber with slight shaking for 24 hours. Samples were extracted periodically and these were analyzed to verify the

15 monatina como se describe en el ejemplo 1 mediante el uso del procedimiento de control de reacciones múltiples por LC/MS/MS. Se calcularon las velocidades iniciales a partir de las muestras extraídas entre las 0 y 3 horas después de la adición de la enzima. Monatin as described in Example 1 using the LC / MS / MS Multiple Reaction Control Procedure. Initial rates were calculated from samples drawn between 0 and 3 hours after addition of the enzyme.

Tabla 38 Table 38

Aditivo Additive
Múltiplo de la velocidad inicial de formación de monatina Múltiplo de la valoración final de monatina (20 horas) Multiple of the initial monatin formation rate Multiple of monatin final assessment (20 hours)

Ninguno None
1,0 1,0 1.0 1.0

Tween 80 al 0,01% (v/v) Tween 80 0.01% (v / v)
1,3 1,4 1.3 1.4

Tween 80 al 0,1% (v/v) Tween 80 0.1% (v / v)
1,3 1,5 1.3 1.5

Tween 20 al 0,01% (v/v) Tween 20 0.01% (v / v)
1,1 1,5 1.1 1.5

Tween X-100 al 0,01% (v/v) Tween X-100 0.01% (v / v)
1,1 1,2 1.1 1.2

Acetona al 5% (v/v) Acetone 5% (v / v)
0,4 0,3 0.4 0.3

Etanol al 5% (v/v) 5% ethanol (v / v)
0,7 0,5 0.7 0.5

Glicerol al 1% (p/v) Glycerol 1% (w / v)
1,9 1,1 1.9 1.1

Glicerol al 5% (p/v) Glycerol 5% (w / v)
1,4 1,4 1.4 1.4

0Glicerol al 10% (p/v) 0 10% glycerol (w / v)
1,1 1,7 1.1 1.7

Trehalosa al 10% (p/v) Trehalose 10% (w / v)
1,0 1,3 1.0 1.3

Inositol al 10% (p/v) Inositol 10% (w / v)
1,3 1,5 1.3 1.5

Sorbitol al 10% (p/v) Sorbitol 10% (w / v)
1,1 1,3 1.1 1.3

Eritritol al 10% (p/v) Erythritol 10% (w / v)
0,8 1,0 0.8 1.0

20 Tabla 39 (SEQ ID NO: 276 aldolasa) 20 Table 39 (SEQ ID NO: 276 aldolase)

Aditivo Additive
Múltiplo de la velocidad inicial de formación de monatina Múltiplo de la valoración final de monatina a las 22 horas Multiple of the initial monatin formation rate Multiple of the final assessment of monatina at 22 hours

Tween 80 al 0,01% (v/v) Tween 80 0.01% (v / v)
1,0 1,0 1.0 1.0

Glicerol al 1% (p/v) Glycerol 1% (w / v)
1,2 0,9 1.2 0.9

Glicerol al 5% (p/v) Glycerol 5% (w / v)
1,5 1,5 1.5 1.5

Glicerol al 10% (p/v) Glycerol 10% (w / v)
1,7 2,1 1.7 2.1

La adición de detergente al 0,01%-0,1% (v/v), como Triton X-100, Tween 20 o Tween 80, o poliol al 1% a 10% (p/v), como glicerol, trehalosa, inositol o sorbitol, mejoró la estabilidad de la D-aminotransferasa T243N durante la duración del experimento. Addition of 0.01% -0.1% (v / v) detergent, such as Triton X-100, Tween 20 or Tween 80, or 1% to 10% (w / v) polyol, such as glycerol, trehalose , inositol or sorbitol, improved the stability of T243N D-aminotransferase for the duration of the experiment.

Ejemplo 28 (no reivindicado) Example 28 (not claimed)

5 A: Clonación de racemasa de aminoácido de amplia especificidad (BAR) KT2440 de Pseudomonas putida 5 A: Cloning of broad specificity amino acid racemase (BAR) KT2440 from Pseudomonas putida

Se identificó una BAR en KT2440 de P. putida mediante el uso de la información en la bibliografía (Roise, D., Soda, K., Yagi, T., Walsch, C. T., Biochemistry 23, 5195-5201, (1984)). El sitio activo de una enzima de BAR de P. striata se secuenció y se informó —LTAVLKADAYGXGIGL (SEQ ID NO:375). Esta secuencia se utilizó para BLAST, la secuencia genómica de KT2440 de P. putida disponible en NCBI. Se identificó una proteína con una secuencia de A BAR was identified in P. putida KT2440 using the information in the literature (Roise, D., Soda, K., Yagi, T., Walsch, CT, Biochemistry 23, 5195-5201, (1984)). . The active site of a P. striata BAR enzyme was sequenced and reported —LTAVLKADAYGXGIGL (SEQ ID NO: 375). This sequence was used for BLAST, the P. putida KT2440 genomic sequence available from NCBI. A protein with a sequence of

10 consenso casi idéntica. Los cebadores se diseñaron para clonar el gen del ADN genómico obtenido de la colección de cultivos “American Type Culture Collection” (ATCC, Manassas, VA). 10 almost identical consensus. The primers were designed to clone the genomic DNA gene obtained from the American Type Culture Collection (ATCC, Manassas, VA).

(5'-AGAAGACATATGCCCTTTCGCCGTAGGG-3' (SEQ ID NO: 376 y (5'-AGAAGACATATGCCCTTTCGCCGTAGGG-3 '(SEQ ID NO: 376 and

5'-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3') (SEQ ID NO: 377)). 5'-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3 ') (SEQ ID NO: 377)).

La PCR se llevó a cabo en condiciones estándar y el producto de la PCR se purificó (kit de purificación de PCR PCR was carried out under standard conditions and the PCR product was purified (PCR purification kit

15 QIAquick, Qiagen, Valencia, CA). El producto de la PCR purificado se digirió con Nde I y BamH I. El producto de la PCR digerido se purificó en gel (kit de extracción en gel QIAquick, Qiagen, Valencia, CA) y se ligó a pET30 y pET28 que habían sido digeridos y purificados en gel en una forma similar. Los clones con inserciones se secuenciaron (Agencourt, Beverly, MA) y se identificaron los aislados con la secuencia correcta (pET30 KT2440 BAR y pET28 KT2440BAR) y se utilizaron en estudios posteriores. 15 QIAquick, Qiagen, Valencia, CA). The purified PCR product was digested with Nde I and BamH I. The digested PCR product was gel purified (QIAquick gel extraction kit, Qiagen, Valencia, CA) and ligated to pET30 and pET28 that had been digested and gel purified in a similar way. Clones with inserts were sequenced (Agencourt, Beverly, MA) and isolates with the correct sequence (pET30 KT2440 BAR and pET28 KT2440BAR) were identified and used in subsequent studies.

20 La secuencia de ADN de KT2440 BAR es: 20 The DNA sequence of KT2440 BAR is:

(SEQ ID NO: 378) La secuencia de aminoácidos de KT2440 BAR es: (SEQ ID NO: 378) The amino acid sequence of KT2440 BAR is:

(SEQ ID NO: 379) (SEQ ID NO: 379)

B) Purificación de KT2440 BAR de P. putida. B) Purification of KT2440 BAR from P. putida.

El plásmido de pET30 KT2440 BAR descrito anteriormente se transformó en DE3 pLysS (Invitrogen, Carlsbad, CA). La cepa resultante se cultivó en LB o caldo Terrific a 37ºC con aireación a una OD600nm de 0,4 a 0,6 y se indujo con 1 mM de IPTG. La incubación continuó durante 3 a 4 horas a 37ºC con aireación. Las células se cosecharon mediante centrifugación y el sedimento celular se almacenó a −80ºC hasta su uso. El sedimento celular se descongeló sobre hielo. Las células se lisaron con BugBuster (Novagen, Madison, WI) y benzonasa (Novagen, Madison, WI). El residuo celular se eliminó mediante centrifugación y el extracto libre de células se utilizó inmediatamente o se almacenó a −80ºC. El gen de KT2440 BAR también se clonó en los sitios NdeI-BamHI de pET28 y se transformó en BL21 DE3 pLysS. Esta construcción no pareció expresar proteínas solubles muy eficientemente, por lo que la versión sin marcar (pET30 KT2440 BAR) se estudió en estudios futuros. The KT2440 BAR pET30 plasmid described above was transformed into DE3 pLysS (Invitrogen, Carlsbad, CA). The resulting strain was grown in LB or Terrific broth at 37 ° C with aeration at OD600nm of 0.4 to 0.6 and induced with 1mM IPTG. Incubation continued for 3 to 4 hours at 37 ° C with aeration. Cells were harvested by centrifugation and the cell pellet was stored at -80 ° C until use. The cell pellet was thawed on ice. Cells were lysed with BugBuster (Novagen, Madison, WI) and benzonase (Novagen, Madison, WI). Cell debris was removed by centrifugation and the cell-free extract was either used immediately or stored at -80 ° C. The KT2440 BAR gene was also cloned into the NdeI-BamHI sites of pET28 and transformed into BL21 DE3 pLysS. This construct did not appear to express soluble proteins very efficiently, so the unlabeled version (pET30 KT2440 BAR) was studied in future studies.

El extracto se aplicó a una columna UnoQ (Bio-Rad, Hercules, CA) que había sido equilibrada con al menos 5 volúmenes de columna del tampón A (25 mM de fosfato de potasio, pH 8,0, 10 !M de piridoxal-5'-fosfato (PLP)). La columna se lavó con 2 volúmenes de columna del tampón A. La proteína se eluyó con un gradiente lineal del tampón B (tampón A+NaCl 1M) del tampón B del 0 al 100% sobre 20 volúmenes de columna y se recolectaron fracciones de 5ml del momento en que el gradiente comenzó. Las fracciones se analizaron mediante el uso del procedimiento Amplex Red descrito en el ejemplo 4 parte 7. En resumen, se combinó 100 !g de D-aminácido oxidasa (Sigma-Aldrich, St. Louis, MO), 0,05 mM de FAD, 25 mM de L-trp y un pequeño volumen de la fracción para analizarse en 50 !L de H2O y se agregó al tampón de reacción Amplex Red preparado como se indica en el protocolo del fabricante. Las fracciones con actividad se desalaron con una columna PD-10 (GE Healthcare, Piscataway, NJ) y se concentraron con concentradores de centrifugación Amicon (Millipore, Billercia, MA). La proteína purificada se almacenó a −80ºC. The extract was applied to a UnoQ column (Bio-Rad, Hercules, CA) that had been equilibrated with at least 5 column volumes of buffer A (25 mM potassium phosphate, pH 8.0, 10 µM pyridoxal- 5'-phosphate (PLP)). The column was washed with 2 column volumes of buffer A. The protein was eluted with a linear gradient of buffer B (buffer A + 1M NaCl) from buffer B from 0 to 100% over 20 column volumes and 5ml fractions were collected from the moment the gradient started. Fractions were analyzed using the Amplex Red procedure described in Example 4 Part 7. In summary, 100 µg D-amino acid oxidase (Sigma-Aldrich, St. Louis, MO), 0.05 mM FAD was combined. , 25 mM L-trp and a small volume of the fraction to be analyzed in 50 µL H2O and added to the Amplex Red reaction buffer prepared as indicated in the manufacturer's protocol. The fractions with activity were desalted with a PD-10 column (GE Healthcare, Piscataway, NJ) and concentrated with Amicon centrifuge concentrators (Millipore, Billercia, MA). The purified protein was stored at -80 ° C.

C) Producción y ensayo del mutante Y354A de alanina racemasa de Geobacillus stearothermophilus con actividad de triptófano racemasa. C) Production and assay of Geobacillus stearothermophilus alanine racemase mutant Y354A with tryptophan racemase activity.

La alanina racemasa de tipo salvaje de Geobacillus stearothermophilus (SEQ ID NO:380, mostrada a continuación, se clonó en pET30 y se utilizó como plantilla para la mutagénesis dirigida al sitio para realizar el cambio Y354A. El gen de la SEQ ID NO:380 puede amplificarse a través de los protocolos de PCR estándar y clonarse mediante el uso de técnicas de ADN recombinante estándar. El gen de la SEQ ID NO:380 puede además reconstruirse mediante cualquier procedimiento conocido por el entendido en la técnica, como los procedimientos de ensamblaje de PCR conocidos por el entendido en la técnica. Geobacillus stearothermophilus wild-type alanine racemase (SEQ ID NO: 380, shown below, was cloned into pET30 and used as a template for site-directed mutagenesis to effect the Y354A change. The gene of SEQ ID NO: 380 it can be amplified through standard PCR protocols and cloned by using standard recombinant DNA techniques.The gene in SEQ ID NO: 380 can also be reconstructed by any procedure known to those skilled in the art, such as assembly procedures PCR techniques known to those skilled in the art.

Las secuencias de ADN y aminoácidos de la alanina racemasa de tipo salvaje de Geobacillus stearothermophilus se muestran a continuación como la SEQ ID NO:380: The DNA and amino acid sequences of the wild-type alanine racemase from Geobacillus stearothermophilus are shown below as SEQ ID NO: 380:

(SEQ ID NO: 380) (SEQ ID NO: 380)

La secuencia de aminoácidos codificada de la alanina racemasa (Geobacillus stearothermophilus) se muestra a continuación como la SEQ ID NO:381: The encoded amino acid sequence of the alanine racemase (Geobacillus stearothermophilus) is shown below as SEQ ID NO: 381:

(SEQ ID NO: 381) (SEQ ID NO: 381)

La mutagénesis se realizó mediante el uso del kit de mutagénesis dirigida a múltiples sitios QuickChange (Stratagene, La Jolla, CA). El siguiente cebador mutagénico se utilizó para realizar el cambio Y354A, 5'10 gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-3' Mutagenesis was performed using the QuickChange multi-site directed mutagenesis kit (Stratagene, La Jolla, CA). The following mutagenic primer was used to make the Y354A change, 5'10 gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-3 '

(SEQ ID NO:382). (SEQ ID NO: 382).

La mutagénesis dirigida al sitio se realizó como se describe en el protocolo del fabricante. Se secuenciaron varios aislados (Agencourt, Beverly, MA) y se seleccionó un aislado con la secuencia correcta y se utilizó para el análisis adicional. Site-directed mutagenesis was performed as described in the manufacturer's protocol. Several isolates (Agencourt, Beverly, MA) were sequenced and an isolate with the correct sequence was selected and used for further analysis.

5 El mutante simple pET30Y354A se transformó en BL21(DE3)pLysS de E. coli. La proteína purificada se preparó de la siguiente forma: La cepa resultante se cultivó en LB o caldo Terrific (a 37ºC con aireación) a una OD600nm de 0,4 a 0,6 y se indujo con 1 mM de IPTG. La incubación continuó a 37ºC con aireación durante aproximadamente 3 horas. Las células se cosecharon mediante centrifugación y el sedimento celular se almacenó a −80ºC. 5 The single mutant pET30Y354A was transformed into BL21 (DE3) pLysS from E. coli. The purified protein was prepared as follows: The resulting strain was grown in LB or Terrific broth (at 37 ° C with aeration) at OD600nm of 0.4 to 0.6 and induced with 1mM IPTG. Incubation continued at 37 ° C with aeration for approximately 3 hours. Cells were harvested by centrifugation and the cell pellet was stored at -80 ° C.

El sedimento celular se descongeló sobre hielo y se volvió a suspender en un volumen adecuado de BugBuster The cell pellet was thawed on ice and resuspended in a suitable volume of BugBuster

10 (Novagen, Madison, WI) más Benzonasa nucleasa (Novagen, Madison, WI). El residuo celular se eliminó mediante centrifugación y el extracto libre de células se aplicó a una columna HIS-Bind (Novagen, Madison, WI) que había sido equilibrada con tampón de unión. La columna se lavó con tampón de unión y tampón de lavado y la proteína se eluyó con tampón de elusión (como lo indica el protocolo del fabricante). La proteína purificada se desaló mediante el uso de una columna PD-10 (GE Healthcare, Piscataway, NJ). La proteína se desaló en 50 mM de fosfato de 10 (Novagen, Madison, WI) plus Benzonase nuclease (Novagen, Madison, WI). Cell debris was removed by centrifugation and the cell-free extract was applied to an HIS-Bind column (Novagen, Madison, WI) that had been equilibrated with binding buffer. The column was washed with binding buffer and wash buffer and the protein was eluted with elution buffer (as indicated by the manufacturer's protocol). The purified protein was desalted by using a PD-10 column (GE Healthcare, Piscataway, NJ). The protein was desalted in 50 mM phosphate of

15 potasio, pH 8,0 y 10 !M de piridoxal-5'-fosfato de acuerdo con el protocolo del fabricante. La proteína se concentró mediante el uso del concentrador de centrifugación Amicon (Millipore, Billercia, MA). La proteína purificada y concentrada se dividió en alícuotas pequeñas y se almacenó a −80ºC hasta su uso. 15 potassium, pH 8.0 and 10 µM pyridoxal-5'-phosphate according to the manufacturer's protocol. The protein was concentrated using the Amicon centrifuge concentrator (Millipore, Billercia, MA). The purified and concentrated protein was divided into small aliquots and stored at -80 ° C until use.

El Y354A purificado se compare con la alanina racemasa de tipo salvaje (preparada en la forma descrita anteriormente) en los ensayos de alanina y triptófano. Los ensayos se realizaron a 37ºC in 50 mM de tampón de The purified Y354A is compared to the wild-type alanine racemase (prepared as described above) in the alanine and tryptophan assays. Assays were performed at 37 ° C in 50mM buffer

20 fosfato de potasio, pH 8 y 10 !M de PLP mediante el uso de 400 !L de proteína purificada concentrada (>1 mg/ml) y 50 mM de sustrato. La detección de D-alanina y D-triptófano se realizó mediante el uso de la metodología de aminoácido quiral descrita en el ejemplo 1. 20 potassium phosphate, pH 8 and 10 µM PLP by using 400 µL of concentrated purified protein (> 1 mg / ml) and 50 mM of substrate. Detection of D-alanine and D-tryptophan was performed using the chiral amino acid methodology described in Example 1.

Tabla 40 Table 40

Enzima Enzyme
Sustrato Tiempo D isómero producido (ppm) Substratum Weather D isomer produced (ppm)

Tipo salvaje Wild guy
L-triptófano 0 nd* L-tryptophan 0 na *

10 10
nd na

30 30
nd na

60 60
nd na

1080 1080
nd na

Y354A Y354A
0 nd 0 na

10 10
198 198

30 30
568 568

60 60
1386 1386

1080 1080
10080 10080

Tipo salvaje Wild guy
L-alanina 0 5140 L-Alanine 0 5140

10 10
5960 5960

30 30
6280 6280

60 60
6500 6500

1080 1080
5040 5040

Y354A Y354A
0 4760 0 4760

10 10
4980 4980

Enzima Enzyme
Sustrato Tiempo D isómero producido (ppm) Substratum Weather D isomer produced (ppm)

30 30
4980 4980

60 60
4200 4200

1080 1080
5000 5000

*nd = no detectado. * na = not detected.

Estos datos se analizaron sin el uso de un estándar interno; por consiguiente estos datos son semi-cuantitativos y deberían utilizarse a los efectos comparativos. Sin embargo, estos resultados muestran que la mutación simple del Y354A es suficiente para ampliar la especificidad de la alanina racemasa de forma tal que pueda catalizar la These data were analyzed without the use of an internal standard; therefore these data are semi-quantitative and should be used for comparative purposes. However, these results show that the simple Y354A mutation is sufficient to amplify the specificity of the alanine racemase in such a way that it can catalyze the

5 racemización de aminoácidos mediante el uso de sustratos alternativos. 5 racemization of amino acids through the use of alternative substrates.

D) Ensayo de la enzima BAR. D) BAR enzyme assay.

La enzima Bar se analizó de la siguiente forma. Los ensayos Amplex Red se prepararon en la forma descrita en este ejemplo. Se utilizó KT2440 BAR de P. putida a 200 !g (purificado como se describe en este ejemplo). La alanina racemasa de tipo salvaje de G. stearothermophilus y el Y354A se purificaron como se describe en este ejemplo y se The Bar enzyme was analyzed in the following way. Amplex Red Assays were prepared as described in this example. KT2440 BAR from P. putida at 200 µg (purified as described in this example) was used. The G. stearothermophilus wild-type alanine racemase and Y354A were purified as described in this example and

10 utilizó a 200 !g/mL o 1000 !g/mL. El CE es un extracto libre de células que se preparó como se describe en este ejemplo. Los resultados para el intervalo de tiempo de 60 minutos se muestran en la tabla 41 a continuación. 10 used at 200 µg / mL or 1000 µg / mL. CE is a cell-free extract that was prepared as described in this example. The results for the 60 minute time interval are shown in Table 41 below.

Tabla 41 Table 41

Enzima Enzyme
Lectura de fluorómetro (a los 60 minutos) Fluorometer reading (after 60 minutes)

BAR (200) BAR (200)
56943 56943

Y354A (200) Y354A (200)
7860 7860

Y354A (1000) Y354A (1000)
13587 13587

WT alanina racemasa (200) WT alanina racemasa (200)
3646 3646

WT alanina racemasa (1000) WT alanina racemasa (1000)
3639 3639

BAR CE (5 !l) BAR CE (5! L)
16228 16228

BAR CE (10 !l) BAR CE (10! L)
26662 26662

BAR CE (50 !l) BAR CE (50! L)
>58000 > 58000

Sin enzimas Without enzymes
1510 1510

15 La proteína purificada también se analizó para verificar la actividad de triptófano racemasa en 50 mM de fosfato de potasio, pH 8, 10 !M de PLP y 30 mM de L-triptófano como se describe anteriormente. Se utilizaron 200 !g/mL o 1000 !g/mL de enzima purificada en los ensayos (indicado en el paréntesis). Se analizó el D-triptófano mediante el uso del procedimiento de aminoácido quiral descrito en el ejemplo 1 para la detección. The purified protein was also analyzed to verify the activity of tryptophan racemase in 50 mM potassium phosphate, pH 8, 10 µM PLP and 30 mM L-tryptophan as described above. 200 µg / mL or 1000 µg / mL of purified enzyme was used in the assays (indicated in parentheses). D-Tryptophan was analyzed using the chiral amino acid procedure described in Example 1 for detection.

20 Tabla 42 20 Table 42

Enzima Enzyme
Tiempo D-triptófano (ppm) Weather D-tryptophan (ppm)

BAR (200) BAR (200)
0 0 0 0

5 5
172 172

10 10
410 410

20 twenty
844 844

Enzima Enzyme
Tiempo D-triptófano (ppm) Weather D-tryptophan (ppm)

30 30
1318 1318

60 60
2362 2362

120 120
2594 2594

240 240
2762 2762

1080 1080
2294 2294

Y354A (200) Y354A (200)
0 0 0 0

5 5
0 0

10 10
0 0

20 twenty
0 0

30 30
12 12

60 60
22 22

120 120
44 44

240 240
56 56

1080 1080
368 368

Y354A (1000) Y354A (1000)
0 0 0 0

5 5
0 0

10 10
12 12

20 twenty
18 18

30 30
40 40

60 60
80 80

120 120
146 146

240 240
218 218

1080 1080
1164 1164

El ensayo indicó que la enzima KT2440 BAR de P. putida es mucho más activa sobre el triptófano que la enzima derivada de G. stearothermophilus y su mutante Y354A. The assay indicated that the P. putida KT2440 BAR enzyme is much more active on tryptophan than the enzyme derived from G. stearothermophilus and its mutant Y354A.

E) Producción de monatina con KT2440 BAR de P. putida. E) Monatin production with KT2440 BAR from P. putida.

5 Se realizó un ensayo de producción de monatina con la KT2440 BAR purificada de P. putida (como se purifica anteriormente) (100 !g) o Y354A purificado (como se purifica anteriormente) (500 !g), D-aminotransferasa (BioCatalytics AT-103 (Pasadena, CA)) (500 !g) y la aldolasa de la SEQ ID NO:276) (como se purifica en el ejemplo 23) (50 !g). El experimento de producción de monatina que comienza con L-triptófano se realizó de la siguiente forma. Además de las enzimas anteriores, se agregó por 1 mL de mezcla de reacción lo siguiente: 4 mM de MgCl2, A monatin production assay was performed with the purified P. putida KT2440 BAR (as purified above) (100 µg) or purified Y354A (as purified above) (500 µg), D-aminotransferase (BioCatalytics AT -103 (Pasadena, CA)) (500 µg) and the aldolase of SEQ ID NO: 276) (as purified in Example 23) (50 µg). The monatin production experiment starting with L-tryptophan was performed as follows. In addition to the above enzymes, the following was added per 1 mL of reaction mixture: 4 mM MgCl2,

10 50 mM de L-triptófano, 100 mM de piruvato de sodio, 100 mM de tampón de fosfato de potasio, pH 7,5 y 0,05 mM de PLP. 10 50 mM L-tryptophan, 100 mM sodium pyruvate, 100 mM potassium phosphate buffer, pH 7.5, and 0.05 mM PLP.

Como control, el experimento se realizó en la forma descrita anteriormente sin racemasa y comenzó con D-triptófano en lugar de L-triptófano. En la tabla 43 a continuación se presenta un resumen de los resultados. As a control, the experiment was performed as described above without racemase and started with D-tryptophan instead of L-tryptophan. Table 43 below summarizes the results.

Tabla 43 Table 43

SustratoSubstratum
Racemasa Tiempo Monatina total % R,R % S,S % R,S % S,R  Racemasa Weather Total monatina % R, R % H.H % R, S % MR

L-Trp L-Trp
Y354A 2 horas Ninguno detectado Y354A 2 hours None detected

18 horas 18 hours
Ninguno detectado None detected

L-Trp L-Trp
BAR 2 horas Ninguno detectado PUB 2 hours None detected

18 horas 18 hours
38,6 ppm 92,1 5 2,9 38.6 ppm 92.1 5 2.9

L-Trp L-Trp
Ninguno 2 horas Ninguno detectado None 2 hours None detected

18 horas 18 hours
Ninguno detectado None detected

D-trp D-trp
Ninguno 2 horas 19,9 ppm Sin probar Sin probar Sin probar Sin probar None 2 hours 19.9 ppm Without trying Without trying Without trying Without trying

18 horas 18 hours
221,25 ppm 97,8 0,2 2 221.25 ppm 97.8 0.2 2

No se detectó monatina mediante el uso de Y354A en este experimento. Esta racemasa fue utilizada en el pasado (datos no mostrados) para producir monatina, pero se utilizaba un nivel mucho mayor de enzima (al menos 2 mg y hasta 10 mg para ver mayores niveles de monatina). La KT2440 BAR de P. putida se utilizó para producir monatina a partir de L-triptófano. Los 100 !g utilizados en este experimento no fueron suficientes para ver producción de monatina después de dos horas pero fue suficiente para ver producción de monatina después de 18 horas. La distribución de estereoisómeros indicó que la mayor parte de la monatina producida es el isómero R,R. No se produjo ningún isómero R,S. Este resultado indica que la KT2440 BAR no es capaz de racemizar de forma detectable el isómero R,R de monatina (la racemización del isómero R,R produciría el isómero R,S). Se produjo una cantidad significativa del isómero S,S en este experimento. Esto es probablemente debido al hecho de que el AT103 utilizado en este experimento no es altamente purificado y puede contener L-aminotransferasas del extracto celular y hay una gran cantidad de L-triptófano presente para servir como donante amino para la transaminación de S-MP. Monatin was not detected by using Y354A in this experiment. This racemase was used in the past (data not shown) to produce monatin, but a much higher level of enzyme was used (at least 2 mg and up to 10 mg to see higher monatin levels). The P. putida KT2440 BAR was used to produce monatin from L-tryptophan. The 100 µg used in this experiment was not enough to see monatin production after two hours but it was enough to see monatin production after 18 hours. The distribution of stereoisomers indicated that most of the monatin produced is the R, R isomer. No R, S isomer was produced. This result indicates that KT2440 BAR is unable to detectably racemize the R, R isomer of monatin (racemization of the R, R isomer would produce the R, S isomer). A significant amount of the S, S isomer was produced in this experiment. This is probably due to the fact that the AT103 used in this experiment is not highly purified and may contain L-aminotransferases from the cell extract and there is a large amount of L-tryptophan present to serve as an amino donor for the transamination of S-MP.

Ejemplo 29 (no reivindicado) Example 29 (not claimed)

Clonación y expresión de arginina racemasa de Pseudomonas taetrolens Cloning and expression of arginine racemase from Pseudomonas taetrolens

Resumen experimental Experimental summary

La arginina racemasa de Pseudomonas taetrolens (también conocida como P. graveolens) (Genbank No. de acceso AB096176, secuencia de ácidos nucleicos) y su mutante 1384M se clonaron, se expresaron y se analizaron para verificar su actividad en la conversión de L-triptófano a D-triptófano. Este gene s un 72% idéntico al gen de BAR de Pseudomonas taetrolens arginine racemase (also known as P. graveolens) (Genbank Accession No. AB096176, nucleic acid sequence) and its 1384M mutant were cloned, expressed and analyzed to verify their activity in L-tryptophan conversion D-tryptophan. This gene is 72% identical to the BAR gene of

P. putida de KT2440 y un 73% idéntico al gen de BAR de P. putida de NBRC 12996 descrito anteriormente. La secuencia de aminoácidos es un 72% idéntica a ambas proteínas de BAR de P. putida. P. putida from KT2440 and 73% identical to the BAR gene from P. putida from NBRC 12996 described above. The amino acid sequence is 72% identical to both P. putida BAR proteins.

Protocolo de la reacción en cadena de la polimerasa Polymerase chain reaction protocol

Se cultivó Pseudomonas taetrolens (ATCC 4683) en caldo nutriente a 28ºC con agitación a 225 rpm. La reacción en cadena de la polimerasa se realizó en todas las células mediante el uso de cebadores diseñados con sitios de restricción 5' y salientes para clonar a los vectores pET 28 y pET30 (Novagen, Madison, WI). Pseudomonas taetrolens (ATCC 4683) was grown in nutrient broth at 28 ° C with shaking at 225 rpm. Polymerase chain reaction was performed on all cells using primers designed with 5 'restriction sites and overhangs to clone vectors pET 28 and pET30 (Novagen, Madison, WI).

Las secuencias de cebadores fueron las siguientes: The primer sequences were as follows:

Terminal N: 5'-ATAATACATATGCCCTTCTCCCGTACCC-3' (SEQ ID NO: 408) y Terminal N: 5'-ATAATACATATGCCCTTCTCCCGTACCC-3 '(SEQ ID NO: 408) and

Terminal C: 5'-GCGGCGGGATCCTTACTGATCTTTCAGGATT-3' (SEQ ID NO: 409). Terminal C: 5'-GCGGCGGGATCCTTACTGATCTTTCAGGATT-3 '(SEQ ID NO: 409).

El gen derivado de P. taetrolens se amplificó mediante el uso del siguiente protocolo de PCR. Veinticinco !L de las células cultivadas se lisaron a 96ºC durante 10 minutos. El residuo celular se eliminó mediante centrifugación y el sobrenadante se utilizó como plantilla para la PCR. La reacción de 100 !L contenía 5 !L de plantilla (sobrenadante de células lisadas), 1,6 !M de cada cebador, 0,3 mM de cada dNTP, 10 U de rTth Polimerasa XL (Applied Biosystems, Foster City, CA), 1×XL de tampón y 1 mM de Mg(OAc)2. El programa termociclador utilizado incluyó un comienzo en caliente a 94ºC durante 3 minutos, 8 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 52ºC durante 30 segundos y 68ºC durante 2 minutos, seguidas por 22 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 58ºC durante 30 segundos y 68ºC durante 2 minutos. Después de las repeticiones la muestra se mantuvo a 68ºC durante 7 minutos y a continuación se almacenó a 4ºC. Este protocolo de PCR produjo un producto de 1230 bp. The P. taetrolens derived gene was amplified using the following PCR protocol. Twenty-five µL of cultured cells were lysed at 96 ° C for 10 minutes. Cell debris was removed by centrifugation and the supernatant was used as a template for the PCR. The 100 µL reaction contained 5 µL of template (lysed cell supernatant), 1.6 µM of each primer, 0.3 µM of each dNTP, 10 U of rTth Polymerase XL (Applied Biosystems, Foster City, CA ), 1 × XL buffer and 1 mM Mg (OAc) 2. The thermal cycler program used included a warm start at 94ºC for 3 minutes, 8 repetitions of the following stages: 94ºC for 30 seconds, 52ºC for 30 seconds and 68ºC for 2 minutes, followed by 22 repetitions of the following stages: 94ºC for 30 seconds , 58ºC for 30 seconds and 68ºC for 2 minutes. After repetitions the sample was kept at 68 ° C for 7 minutes and then stored at 4 ° C. This PCR protocol produced a 1230 bp product.

Clonación Cloning

Los productos de la PCR se purificaron en geles TAE-agarosa al 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). El producto se clonó en TOPO y se transformó en células TOP 10 de acuerdo con el protocolo del fabricante (Invitrogen, Carlsbad, CA). El ADN plásmido se purificó a partir de los transformantes resultantes mediante el uso del kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se analizó para detectar las inserciones correctas mediante enzimas de restricción con Nde I y BamH I. Las secuencias de plásmidos que parecen tener una inserción correcta se verificaron mediante el secuenciado de ADN de terminación de la cadena didesoxi con los cebadores universales M13 directos y M13 inversos. PCR products were purified on 0.8% TAE-agarose gels using the Qiagen Gel Extraction Kit (Qiagen, Valencia, CA). The product was cloned into TOPO and transformed into TOP 10 cells according to the manufacturer's protocol (Invitrogen, Carlsbad, CA). Plasmid DNA was purified from the resulting transformants using the Qiagen spin miniprep kit (Qiagen, Valencia, CA) and analyzed for correct insertions by restriction enzymes with Nde I and BamH I. Plasmid sequences that they appear to have a correct insertion were verified by dideoxy chain termination DNA sequencing with the forward M13 and reverse M13 universal primers.

El clon TOPO correcto se digirió con enzimas de restricción Nde I y BamH I de acuerdo con los protocolos recomendados del fabricante (Biolaboratorios de Nueva Inglaterra, Beverly, MA) y se purificaron en geles de TAEagarosa al 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). Los vectores pET28 y pET30 se prepararon mediante la digestión con enzimas de restricción Nde I y BamH I seguidos del tratamiento con fosfatasa alcalina sérica (Roche, Indianápolis, IN) y purificación en geles de TAE-agarosa al 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). Los vectores e inserciones digeridos se ligaron mediante el uso del kit de ligadura rápida de ADN (Roche, Indianápolis, IN). Aproximadamente 50 ng de la inserción tratada, 100 ng del vector tratado (proporción de inserción a vector 3 a 1), 5 U de T4 ADN ligasa y 1× de tampón de ligación se incubaron durante 5 minutos a temperatura ambiente. La reacción de ligación se desaló mediante el uso del kit de purificación del producto de la PCR altamente puro (Roche, Indianápolis, IN) y se utilizó para transformar las células electrocompetentes DH10B de E. coli (Invitrogen, Carlsbad, CA). Se agregaron 10 !l de cada reacción de ligación a 40 !l de células DH10B y se transformaron mediante electroporación mediante el uso del impulsor de genes Bio-Rad II en las siguientes condiciones: 2,5 kV, 25° !F, 200 ohm en una cubeta de 0,2 cm. Las células se dejaron recuperar en 1 mL de medio SOC a temperatura ambiente durante 1 hora a 37ºC con agitación a 225 rpm. Las células se colocaron en placas LB que contenían kanamicina (50 !g/mL). El ADN plásmido se purificó a partir de los transformantes resultantes mediante el uso del kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se analizó para detectar las inserciones correctas mediante enzimas de restricción con Nde I y BamH I. The correct TOPO clone was digested with restriction enzymes Nde I and BamH I according to the manufacturer's recommended protocols (Biolaboratories of New England, Beverly, MA) and purified on 0.8% TAEagarose gels using the kit. gel extraction from Qiagen (Qiagen, Valencia, CA). Vectors pET28 and pET30 were prepared by restriction enzyme Nde I and BamH I digestion followed by treatment with serum alkaline phosphatase (Roche, Indianapolis, IN) and purification on 0.8% TAE-agarose gels using the Qiagen gel extraction kit (Qiagen, Valencia, CA). The digested vectors and inserts were ligated using the DNA Rapid Ligation Kit (Roche, Indianapolis, IN). Approximately 50 ng of the treated insert, 100 ng of the treated vector (3 to 1 insert to vector ratio), 5 U of T4 DNA ligase and 1 × ligation buffer were incubated for 5 minutes at room temperature. The ligation reaction was desalted using the highly pure PCR product purification kit (Roche, Indianapolis, IN) and used to transform the E. coli DH10B electrocompetent cells (Invitrogen, Carlsbad, CA). 10 µl of each ligation reaction was added to 40 µl of DH10B cells and transformed by electroporation using the Bio-Rad II gene driver under the following conditions: 2.5 kV, 25 ° F, 200 ohm in a 0.2 cm cuvette. The cells were allowed to recover in 1 mL of SOC medium at room temperature for 1 hour at 37 ° C with stirring at 225 rpm. Cells were plated on LB plates containing kanamycin (50 µg / mL). Plasmid DNA was purified from the resulting transformants using the Qiagen spin miniprep kit (Qiagen, Valencia, CA) and analyzed for correct insertions by restriction enzymes with Nde I and BamH I.

Expresión y análisis génicos Gene expression and analysis

El ADN plásmido se transformó en el huésped de expresión de E. Coli BL21(DE3) pLysS (Novagen, Madison, WI). Los cultivos se desarrollaron y los plásmidos se aislaron mediante el uso del kit miniprep de Qiagen (Qiagen, Valencia, CA) y se analizaron mediante enzimas de restricción para confirmar la identidad. Plasmid DNA was transformed into the E. coli BL21 (DE3) pLysS expression host (Novagen, Madison, WI). Cultures were grown and plasmids were isolated using the Qiagen miniprep kit (Qiagen, Valencia, CA) and analyzed by restriction enzymes to confirm identity.

La inducción en BL21DE3 pLysS se realizó inicialmente en ambos vectores pET 28 (marcado con histidina) y pET 30 (sin marcar). Se realizó un estudio temporal con cultivos desarrollados a 37ºC en 100 mL de kanamicina que contenía LB (50 mg/L) a una OD600 de 0,5, inducidos con 100 mM de IPTG (isopropil tiogalactósido) y muestreados a las 0 y 3 horas después de la inducción. Las células procedentes de la hora 0 y la hora 3 se volvieron a colocar en suspensión en tampón de dodecil sulfato de sodio 1× que contenía 2-mercaptoetanol y se calentaron a 95ºC durante 10 minutos y se enfriaron. Se analizaron por SDS-PAGE alícuotas de estas muestras de la proteína celular completa mediante el uso de un gel en gradiente del 4 al 15%. Induction into BL21DE3 pLysS was initially performed in both vectors pET 28 (histidine labeled) and pET 30 (unlabeled). A temporary study was performed with cultures grown at 37ºC in 100 mL of kanamycin containing LB (50 mg / L) at an OD600 of 0.5, induced with 100 mM IPTG (isopropyl thiogalactoside) and sampled at 0 and 3 hours after induction. Cells from hour 0 and hour 3 were resuspended in 1 × sodium dodecyl sulfate buffer containing 2-mercaptoethanol and heated at 95 ° C for 10 minutes and cooled. Aliquots of these whole cell protein samples were analyzed by SDS-PAGE using a 4 to 15% gradient gel.

Se prepararon también extractos celulares procedentes de los cultivos de 3 horas mediante la colocación en suspensión de los sedimentos celulares procedentes de 5 ml de cultivo en reactivo BugBusterTM de Novagen que contenía benzonasa nucleasa y mezcla de inhibidor de proteasa grupo #3 (Calbiochem-Novabiochem Corp., San Diego, CA) a temperatura ambiente durante 20 minutos con leve agitación y centrifugación a 16.000 x g para eliminar el residuo celular. Los sobrenadantes (extractos celulares) se cargaron en geles con gradiente del 4 al 15% para el análisis de las proteínas celulares solubles. Cell extracts from the 3-hour cultures were also prepared by suspending cell pellets from 5 ml of culture in Novagen's BugBusterTM reagent containing benzonase nuclease and group # 3 protease inhibitor mixture (Calbiochem-Novabiochem Corp ., San Diego, CA) at room temperature for 20 minutes with light agitation and centrifugation at 16,000 xg to remove cell debris. Supernatants (cell extracts) were loaded onto 4 to 15% gradient gels for analysis of soluble cell proteins.

La muestra de las 3 horas de la arginina racemasa clonada de P. taetrolens mostró una banda de proteínas total que correspondió al tamaño correcto (aproximadamente 45 kDa) en el vector pET 30 (sin marcar). El producto de genes de P. taetrolens en pET 30 se sobreexpresó a un nivel mayor que el del producto de genes de P. taetrolens en pET 28 (marcado con histidina), pero ninguno de los vectores proporcionó una banda de proteínas solubles visible. The 3 hour sample of the cloned P. taetrolens arginine racemase showed a total protein band that corresponded to the correct size (approximately 45 kDa) in vector pET 30 (unlabeled). The P. taetrolens gene product in pET 30 was overexpressed to a higher level than the P. taetrolens gene product in pET 28 (histidine labeled), but none of the vectors provided a visible soluble protein band.

Las células de los cultivos inducidos (100 mL) se centrifugaron y se lavaron una vez con NaCl al 0,85%. Los sedimentos celulares se volvieron a suspender en 5 mL/g de peso de células húmedas de reactivo BugBusterTM (Novagen, Madison, WI) que contenía 5 !l/ml de la mezcla de inhibidor de proteasa del conjunto nº 3 (Calbiochem-Novabiochem Corp., San Diego, CA) y 1 !l/ml de benzonasa nucleasa. Las muestras se incubaron a temperatura Cells from the induced cultures (100 mL) were centrifuged and washed once with 0.85% NaCl. The cell pellets were resuspended in 5 mL / g wet cells of BugBusterTM Reagent (Novagen, Madison, WI) containing 5 µl / ml of set # 3 protease inhibitor mixture (Calbiochem-Novabiochem Corp ., San Diego, CA) and 1 µl / ml of benzase nuclease. The samples were incubated at temperature

ambiente durante 20 minutos en un agitador orbital. El residuo celular insoluble se eliminó por centrifugación a room for 20 minutes on an orbital shaker. Insoluble cell debris was removed by centrifugation at

16.000 x g durante 20 minutos a 4ºC. 16,000 x g for 20 minutes at 4 ° C.

Los extractos celulares se analizaron para verificar la actividad de la triptófano racemasa mediante el uso del siguiente protocolo. Se llevaron a cabo reacciones de 1 mL en 50 mM de fosfato de potasio (pH 8,0), 0,05 mM de 5 PLP y 30 mM L-triptófano. Las reacciones se iniciaron con la adición de extractos libres de células y se incubaron a 30ºC durante la noche. Se tomaron alícuotas de las muestras después de la incubación durante la noche (las muestras del minuto cero sirvieron como reacción de control). Se agregó ácido fórmico concentrado (5 !L) a cada alícuota de muestra de 250 !L para detener la reacción y la proteína precipitada se eliminó mediante centrifugación. Los sobrenadantes se extrajeron y congelaron a −80ºC hasta que se analizaron para detectar D-triptófano mediante Cell extracts were analyzed to verify tryptophan racemase activity using the following protocol. Reactions of 1 mL were carried out in 50 mM of potassium phosphate (pH 8.0), 0.05 mM of 5 PLP and 30 mM L-tryptophan. Reactions were started with the addition of cell-free extracts and incubated at 30 ° C overnight. Aliquots of the samples were taken after incubation overnight (the zero minute samples served as a control reaction). Concentrated formic acid (5 µL) was added to each 250 µL sample aliquot to stop the reaction and the precipitated protein was removed by centrifugation. Supernatants were removed and frozen at −80 ° C until analyzed for D-tryptophan by

10 el procedimiento de aminoácido quiral descrito en el ejemplo 1. 10 the chiral amino acid procedure described in Example 1.

Los resultados de los ensayos de los extractos celulares de la inducción depET28 y pET30 con 100 mM de IPTG (3 horas) demostraron que los clones de P. taetrolens muestran actividad de racemasa en L-triptófano. Nuevamente, la versión marcada de BAR parece ser menos activa y puede precipitarse o ser menos soluble que la versión sin marcar (pET28). La tabla 44 a continuación muestra los resultados iniciales, aunque no cuantitativos ya que se The results of assays of the cell extracts of depET28 and pET30 induction with 100 mM IPTG (3 hours) demonstrated that the P. taetrolens clones show racemase activity in L-tryptophan. Again, the tagged version of BAR appears to be less active and may precipitate or be less soluble than the unchecked version (pET28). Table 44 below shows the initial results, although not quantitative since they are

15 obtuvo una proteína muy poco soluble. 15 obtained a very poorly soluble protein.

Tabla 44 Table 44

Tratamiento Treatment
Intervalo de tiempo Sustrato Extracto de racemasa (200 !g) D-trp conc (!g/mL) Time interval Substratum Racemase extract (200! G) D-trp conc (! G / mL)

pET28/P. taetrolens pET28 / P. taetrolens
0 L-trp 500 !L nd 0 L-trp 500! L na

pET30/P. taetrolens pET30 / P. taetrolens
0 L-trp 500 !L nd 0 L-trp 500! L na

pET28/P. taetrolens pET28 / P. taetrolens
durante la noche L-trp 500 !L 140 overnight L-trp 500! L 140

pET30/P. taetrolens pET30 / P. taetrolens
durante la noche L-trp 500 !L 226 overnight L-trp 500! L 226

Se repitió la inducción de la construcción del pET30 (sin marcar) mediante el uso de las mismas condiciones como se menciona anteriormente y se observó una banda de proteínas solubles visible en SDS-PAGE. El ensayo se 20 repitió mediante el uso de las mismas condiciones descritas anteriormente y se obtuvieron los resultados como se muestra en la tabla 45 a continuación. The induction of the construction of pET30 (unlabelled) was repeated using the same conditions as mentioned above and a band of soluble proteins visible on SDS-PAGE was observed. The test was repeated using the same conditions as described above and the results were obtained as shown in Table 45 below.

Tabla 45 Table 45

Tratamiento Treatment
Intervalo de tiempo Sustrato Extracto de racemasa (!L) D-trp conc (!g/mL) Time interval Substratum Racemase extract (! L) D-trp conc (! G / mL)

P. taetrolenspET30 P. taetrolenspET30
0 L-trp 300 Nd 0 L-trp 300 Nd

P. taetrolenspET30 P. taetrolenspET30
0 L-trp 150 Nd 0 L-trp 150 Nd

P. taetrolenspET30 P. taetrolenspET30
2 horas L-trp 300 319 2 hours L-trp 300 319

P. taetrolenspET30 P. taetrolenspET30
2 horas L-trp 150 308 2 hours L-trp 150 308

P. taetrolenspET30 P. taetrolenspET30
Durante la noche L-trp 300 1586 Overnight L-trp 300 1586

P. taetrolenspET30 P. taetrolenspET30
Durante la noche L-trp 150 1658 Overnight L-trp 150 1658

Nuevamente, se observó que la duplicación de los volúmenes no escala a mayor actividad. Para futuros trabajos, se determinó la extracción de la proteína de Bugbuster lo más rápido posible después de la preparación de los extractos celulares y para almacenar la proteína en 50 mM de tampón de fosfato, pH 8 que contiene 0,01 mM de PLP. El detergente en Bugbuster puede inhibir la reacción o puede causar una pérdida de actividad tras el Again, it was observed that doubling of volumes does not escalate to increased activity. For future work, the extraction of the Bugbuster protein was determined as quickly as possible after the preparation of the cell extracts and to store the protein in 50 mM phosphate buffer, pH 8 containing 0.01 mM PLP. The detergent in Bugbuster may inhibit the reaction or may cause loss of activity after

5 almacenamiento. 5 storage.

La inducción de la construcción pET30 se llevó a cabo nuevamente y el extracto celular se procesó con cromatografía de intercambio de aniones (como en el ejemplo 28) para proporcionar un extracto puro. El ensayo se repitió con esta preparación parcialmente purificada. Los números en el paréntesis en la columna de extracto de racemasa de la tabla 46 a continuación indican la cantidad aproximada de enzima de racemasa parcialmente The induction of the pET30 construct was carried out again and the cell extract was processed with anion exchange chromatography (as in Example 28) to provide a pure extract. The test was repeated with this partially purified preparation. The numbers in the parentheses in the racemase extract column in Table 46 below indicate the approximate amount of racemase enzyme partially

10 purificada utilizada en el ensayo. Los resultados del ensayo se muestran en la tabla 46 a continuación. Purified 10 used in the assay. The test results are shown in Table 46 below.

Tabla 46 Table 46

Fuente de enzimas Enzyme source
Intervalo de tiempo Sustrato Extracto de racemasa D-trp conc (!g/mL) Time interval Substratum Racemase extract D-trp conc (! G / mL)

KT2440 KT2440
0 L-trp 75 !L (90 !g) nd 0 L-trp 75! L (90! G) na

NBRC 12996 NBRC 12996
0 L-trp 42 !L (200 !g) nd 0 L-trp 42! L (200! G) na

NBRC 12996 NBRC 12996
0 L-trp 21 !L (100 !g) nd 0 L-trp 21! L (100! G) na

P. taetrolens P. taetrolens
0 L-trp 108 !L (200 !g) nd 0 L-trp 108! L (200! G) na

P. taetrolens P. taetrolens
0 L-trp 54 !L (100 !g) nd 0 L-trp 54! L (100! G) na

KT2440 KT2440
2 horas L-trp 75 !L (90 !g) 661 2 hours L-trp 75! L (90! G) 661

NBRC 12996 NBRC 12996
2 horas L-trp 42 !L (200 !g) 408 2 hours L-trp 42! L (200! G) 408

NBRC 12996 NBRC 12996
2 horas L-trp 21 !L (100 !g) 208 2 hours L-trp 21! L (100! G) 208

P. taetrolens P. taetrolens
2 horas L-trp 108 !L (200 !g) 862 2 hours L-trp 108! L (200! G) 862

P. taetrolens P. taetrolens
2 horas L-trp 54 !L (100 !g) 547 2 hours L-trp 54! L (100! G) 547

KT2440 KT2440
durante la noche L-trp 75 !L (90 !g) 2386 overnight L-trp 75! L (90! G) 2386

NBRC 12996 NBRC 12996
durante la noche L-trp 42 !L (200 !g) 2382 overnight L-trp 42! L (200! G) 2382

NBRC 12996 NBRC 12996
durante la noche L-trp 21 !L (100 !g) 1706 overnight L-trp 21! L (100! G) 1706

P. taetrolens P. taetrolens
durante la noche L-trp 108 !L (200 !g) 2029 overnight L-trp 108! L (200! G) 2029

P. taetrolens P. taetrolens
durante la noche L-trp 54 !L (100 !g) 2099 overnight L-trp 54! L (100! G) 2099

La no linealidad de la muestra durante la noche en este caso es probablemente debido al hecho de que las The nonlinearity of the overnight sample in this case is probably due to the fact that the

15 reacciones están alcanzando el equilibrio. Claramente, la BAR de P. taetrolens tiene una actividad significativa para la racemización de triptófano, como la tienen la 12996 BAR y KT2440 BAR. Parece que la KT2440 BAR y la BAR de 15 reactions are reaching balance. Clearly, P. taetrolens BAR has significant activity for tryptophan racemization, as do 12996 BAR and KT2440 BAR. It seems that the KT2440 BAR and the BAR of

P. taetrolens tienen una actividad similar, que es levemente mayor a la de la 12996 BAR. P. taetrolens have a similar activity, which is slightly higher than that of 12996 BAR.

La secuencia de ADN de la arginina racemasa de P. taetrolens se muestra a continuación como la SEQ ID NO:410. La secuencia de PCR proporcionó dos cambios en comparación con la secuencia de NCBI publicada. The DNA sequence of the P. taetrolens arginine racemase is shown below as SEQ ID NO: 410. The PCR sequence provided two changes compared to the published NCBI sequence.

20 Específicamente, la secuencia de PCR contenía una adenosina en lugar de una guanina en la posición 902 y una citosina en lugar de una guanina en la posición 921. Estos cambios de ADN resultaron en una mutación silenciosa así como en un cambio de glicina a aspartato en la posición de aminoácido 301. 20 Specifically, the PCR sequence contained an adenosine instead of a guanine at position 902 and a cytosine instead of a guanine at position 921. These DNA changes resulted in a silent mutation as well as a change from glycine to aspartate at amino acid position 301.

(SEQ ID NO: 410) (SEQ ID NO: 410)

La proteína codificada por el gen de la SEQ ID NO:410 se analizó mediante el programa de predicción de péptidos señal Signal P 3.0 (www.cbs.dtu.dk/services/SignalP/) y se predijo una secuencia líder de 23 aminoácidos. I384M Mutagénesis de BAR de P. taetrolens La mutagénesis se llevó a cabo mediante el uso del kit de mutagénesis dirigida a múltiples sitios QuickChange The protein encoded by the gene in SEQ ID NO: 410 was analyzed by the Signal P 3.0 signal peptide prediction program (www.cbs.dtu.dk/services/SignalP/) and a leader sequence of 23 amino acids was predicted. I384M P. taetrolens BAR Mutagenesis Mutagenesis was performed using the QuickChange multi-site directed mutagenesis kit.

(Stratagene, La Jolla, CA), mediante el uso del gen de BAR de P. taetrolens en el pET30 que resulta en una proteína (Stratagene, La Jolla, CA), by using the P. taetrolens BAR gene in pET30 resulting in a protein

sin marcar. Se utilizó el siguiente cebador mutagénico para realizar el cambio 1384M: 5'-TACCCAGGCTGAGATGGAAGACATCAACG-3' (SEQ ID NO:411). unmarked. The following mutagenic primer was used to make the 1384M change: 5'-TACCCAGGCTGAGATGGAAGACATCAACG-3 '(SEQ ID NO: 411).

La mutagénesis dirigida al sitio se realizó como se describe en el protocolo del fabricante. Se secuenciaron varios aislados (Agencourt, Beverly, MA) y se seleccionó un aislado con la secuencia correcta y se utilizó para el análisis adicional. Site-directed mutagenesis was performed as described in the manufacturer's protocol. Several isolates (Agencourt, Beverly, MA) were sequenced and an isolate with the correct sequence was selected and used for further analysis.

El plásmido se transformó en células BL21(DE3) (Novagen, Madison, WI). La proteína recombinante se produjo en un medio Overnight Express II (Novagen, Madison, WI) que contenía 50 !g/mL de kanamicina de acuerdo con los protocolos del fabricante. Los extractos libres de células se prepararon mediante el uso de BugBuster (Novagen, Madison, WI) de acuerdo con los protocolos del fabricante, se desalaron y se analizaron para verificar el porcentaje de expresión de la proteína diana mediante el uso del procedimiento Experion descrito anteriormente. The plasmid was transformed into BL21 (DE3) cells (Novagen, Madison, WI). The recombinant protein was produced in Overnight Express II medium (Novagen, Madison, WI) containing 50 µg / mL kanamycin according to the manufacturer's protocols. Cell-free extracts were prepared using BugBuster (Novagen, Madison, WI) according to the manufacturer's protocols, desalted, and analyzed to verify the percent expression of the target protein using the Experion procedure described above. .

La totalidad de los ensayos de proteínas se realizó mediante el uso del kit BCA de Pierce (Pierce, Rockford, IL). Se realizaron ensayos de triptófano racemasa con la enzima mutante mediante el uso de la enzima de tipo salvaje preparada de la misma forma que un control positivo. Los ensayos contenían por mL: 30 mM de L-triptófano, 50 mM de fosfato de potasio, pH 8, 10 !M de PLP y aproximadamente 100 !g de proteína racemasa en un extracto libre de células. En el caso donde no se utilizaron 100 !g (con base en el porcentaje de expresión de Experion y los números de proteínas totales de Pierce), los resultados se normalizaron. Se tomaron muestras en el minuto 0, a los 30 minutos, a las 2 horas y durante la noche, se trataron con ácido fórmico al 2%, se filtraron y se diluyeron 1:10 para su análisis mediante el uso del procedimiento de aminoácido quiral descrito en el ejemplo 1. All protein assays were performed using the Pierce BCA Kit (Pierce, Rockford, IL). Tryptophan racemase assays were performed with the mutant enzyme using the wild-type enzyme prepared in the same manner as a positive control. The assays contained per mL: 30 mM L-tryptophan, 50 mM potassium phosphate, pH 8, 10 µM PLP, and approximately 100 µg of racemase protein in a cell-free extract. In the case where 100 µg was not used (based on the percentage of expression of Experion and the total protein numbers of Pierce), the results were normalized. Samples were taken at 0 minute, 30 minute, 2 hour, and overnight, treated with 2% formic acid, filtered, and diluted 1:10 for analysis using the chiral amino acid procedure described in example 1.

La enzima de tipo salvaje pareció producir 49,1 ppm de D-triptófano en 30 minutos, mientras que el mutante 1384M produjo 108 ppm. El intervalo de tiempo de 2 horas fue similar, la enzima de tipo salvaje produjo 229,4 ppm Dtriptófano contra 541,7 para el mutante 1384M. La mutación 1384M parece haber duplicado aproximadamente la actividad de BAR de P. taetrolens. El intervalo de tiempo durante la noche para el mutante también es mayor, pero a medida que las reacciones se aproximan al equilibrio la diferencia entre las actividades se reduce. Cuando se realizaron ensayos para la producción de monatina como en el ejemplo 28, el 1384M no pareció proporcionar ningún beneficio con respecto a la enzima de tipo salvaje de P. taetrolens. The wild-type enzyme appeared to produce 49.1 ppm D-tryptophan in 30 minutes, while the 1384M mutant produced 108 ppm. The 2 hour time interval was similar, the wild-type enzyme produced 229.4 ppm Dtryptophan versus 541.7 for the 1384M mutant. The 1384M mutation appears to have approximately doubled the BAR activity of P. taetrolens. The time interval during the night for the mutant is also longer, but as the reactions approach equilibrium the difference between activities decreases. When assayed for monatin production as in Example 28, 1384M did not appear to provide any benefit over P. taetrolens wild-type enzyme.

Ejemplo 30 (no reivindicado) Example 30 (not claimed)

Ensayo de extracto de A. caviae A. caviae extract assay

El ATCC 14486 de Aeromonas caviae se cultivó en un caldo de nutrientes a 37ºC. Las células del cultivo (200 mL) se centrifugaron y se lavaron una vez con NaCl al 0,85%. Los sedimentos celulares se volvieron a suspender en 5 mL/g de peso de células húmedas de reactivo BugBusterTM (Novagen, Madison, WI) que contenía 5 !l/ml de la mezcla de inhibidor de proteasa del conjunto nº 3 (Calbiochem-Novabiochem Corp., San Diego, CA) y 1 !l/ml de benzonasa nucleasa. Las muestras se incubaron a temperatura ambiente durante 20 minutos en un agitador orbital. El residuo celular insoluble se eliminó por centrifugación a 16.000 x g durante 20 minutos a 4ºC. El extracto libre de células se desaló sobre una columna PD-10 (GE Healthcare, Piscataway, NJ). Aeromonas caviae ATCC 14486 was grown in a nutrient broth at 37 ° C. The cells of the culture (200 mL) were centrifuged and washed once with 0.85% NaCl. The cell pellets were resuspended in 5 mL / g wet cells of BugBusterTM Reagent (Novagen, Madison, WI) containing 5 µl / ml of set # 3 protease inhibitor mixture (Calbiochem-Novabiochem Corp ., San Diego, CA) and 1 µl / ml of benzase nuclease. The samples were incubated at room temperature for 20 minutes on an orbital shaker. Insoluble cell debris was removed by centrifugation at 16,000 x g for 20 min at 4 ° C. The cell free extract was desalted on a PD-10 column (GE Healthcare, Piscataway, NJ).

Los extractos libres de células se analizaron para verificar la actividad de la triptófano racemasa mediante el uso del siguiente protocolo. Se llevaron a cabo reacciones de 1 mL en 50 mM de fosfato de potasio (pH 8,0), 0,05 mM de PLP y 30 mM L-triptófano. Las reacciones se iniciaron con la adición de extractos libres de células (de 100 !L o 500 !L) y se incubaron a 30ºC durante la noche. Se tomaron alícuotas de las muestras a las 2 horas y después de la incubación durante la noche (las muestras del minuto cero sirvieron como reacciones de control). Se agregó ácido fórmico concentrado (5 !L) a cada alícuota de muestra de 250 !L para detener la reacción y la proteína precipitada se eliminó mediante centrifugación. Los sobrenadantes se extrajeron y congelaron a −80ºC hasta que se analizaron para detectar D-triptófano mediante el procedimiento de aminoácido quiral descrito en el ejemplo 1. Cell-free extracts were analyzed to verify tryptophan racemase activity using the following protocol. Reactions of 1 mL were carried out in 50 mM potassium phosphate (pH 8.0), 0.05 mM PLP and 30 mM L-tryptophan. Reactions were initiated with the addition of cell free extracts (100 µL or 500 µL) and incubated at 30 ° C overnight. Aliquots of the samples were taken at 2 hours and after incubation overnight (the zero minute samples served as control reactions). Concentrated formic acid (5 µL) was added to each 250 µL sample aliquot to stop the reaction and the precipitated protein was removed by centrifugation. Supernatants were removed and frozen at −80 ° C until analyzed for D-tryptophan by the chiral amino acid procedure described in Example 1.

Los resultados del ensayo de los extractos celulares de A. caviae demostraron actividad de racemasa sobre Ltriptófano como se muestra en la tabla 47. Results of the assay of A. caviae cell extracts demonstrated racemase activity on L-tryptophan as shown in Table 47.

Tabla 47 Table 47

Tratamiento Treatment
Intervalo de tiempo sustrato Extracto de racemasa D-trp conc (!g/mL) Time interval substratum Racemase extract D-trp conc (! G / mL)

A. caviae A. caviae
0 L-trp 100 !L nd 0 L-trp 100! L na

A. caviae A. caviae
0 L-trp 500 !L nd 0 L-trp 500! L na

A. caviae A. caviae
2 horas L-trp 100 !L 2 2 hours L-trp 100! L 2

A. caviae A. caviae
2 horas L-trp 500 !L 19 2 hours L-trp 500! L 19

Tratamiento Treatment
Intervalo de tiempo sustrato Extracto racemasa de D-trp conc (!g/mL) Time interval substratum Racemasa extract of D-trp conc (! G / mL)

A. caviae A. caviae
durante la noche L-trp 100 !L 45 overnight L-trp 100! L Four. Five

A. caviae A. caviae
durante la noche L-trp 500 !L 130 overnight L-trp 500! L 130

Después de encontrar actividad en los extractos celulares de A. caviae, se diseñaron los cebadores degenerados (con base en las regiones conservadas de homólogos de BAR conocidos) para obtener el gen de BAR de estas especies. Las secuencias de cebador degenerado se muestran a continuación: After finding activity in A. caviae cell extracts, degenerate primers (based on conserved regions of known BAR homologs) were designed to obtain the BAR gene from these species. The degenerate primer sequences are shown below:

5 Aer deg F2: 5'-GCCAGCAACGARGARGCMCGCGT-3' (SEQ ID NO: 412); y Aer deg F2: 5'-GCCAGCAACGARGARGCMCGCGT-3 '(SEQ ID NO: 412); and

Aer deg R1: 5'-TGGCCSTKGATCAGCACA-3' (SEQ ID NO:413) Aer deg R1: 5'-TGGCCSTKGATCAGCACA-3 '(SEQ ID NO: 413)

donde K indica G o T, R indica A o G, S indica C o G y M indica A o C. where K indicates G or T, R indicates A or G, S indicates C or G, and M indicates A or C.

Los cebadores que anteceden se utilizaron para amplificar la PCR a fragmentos de ADN de 715 bp de ADN genómico de A. caviae (ATCC 14486). Se utilizó el siguiente protocolo de PCR: La reacción de 50 !L contenía 0,5 10 !L de plantilla (aproximadamente 100 ng de ADN genómico de A. caviae), 1,6 !M de cada cebador, 0,3 mM de cada dNTP, 10 U de rTth Polimerasa XL (Applied Biosystems, Foster City, CA), 1×XL de tampón, 1 mM de Mg(OAc)2 2,5 !L de dimetil sulfóxido. El programa termociclador utilizado incluyó un comienzo en caliente a 94ºC durante 3 minutos y 30 repeticiones de las siguientes etapas: 94ºC durante 30 segundos, 53ºC durante 30 segundos y 68ºC durante 2 minutos. Después de las 30 repeticiones la muestra se mantuvo a 68ºC durante 7 minutos y a The above primers were used to amplify the PCR to 715 bp DNA fragments of A. caviae genomic DNA (ATCC 14486). The following PCR protocol was used: The 50 µL reaction contained 0.5 10 µL of template (approximately 100 ng of A. caviae genomic DNA), 1.6 µM of each primer, 0.3 mM of each dNTP, 10 U of rTth Polymerase XL (Applied Biosystems, Foster City, CA), 1 × XL buffer, 1 mM Mg (OAc) 2 2.5 µL dimethyl sulfoxide. The thermocycler program used included a hot start at 94 ° C for 3 minutes and 30 repetitions of the following steps: 94 ° C for 30 seconds, 53 ° C for 30 seconds and 68 ° C for 2 minutes. After 30 repetitions the sample was kept at 68ºC for 7 minutes and at

15 continuación se almacenó a 4ºC. Este protocolo PCR generó el producto 715 bp. It was then stored at 4 ° C. This PCR protocol generated the 715 bp product.

Clonación Cloning

Los productos de la PCR se purificaron en geles TAE-agarosa al 0,8% mediante el uso del kit de extracción en gel de Qiagen (Qiagen, Valencia, CA). El producto se clonó en TOPO y se transformó en células TOP 10 de acuerdo con el protocolo del fabricante (Invitrogen, Carlsbad, CA). El ADN plásmido se purificó a partir de los transformantes PCR products were purified on 0.8% TAE-agarose gels using the Qiagen Gel Extraction Kit (Qiagen, Valencia, CA). The product was cloned into TOPO and transformed into TOP 10 cells according to the manufacturer's protocol (Invitrogen, Carlsbad, CA). Plasmid DNA was purified from transformants

20 resultantes mediante el uso del kit spin miniprep de Qiagen (Qiagen, Valencia, CA) y se analizó para detectar las inserciones correctas mediante enzimas de restricción con EcoR 1. Las secuencias de plásmidos que parecen tener una inserción correcta se verificaron mediante el secuenciado de ADN de terminación de la cadena didesoxi con los cebadores universales M13 directos. 20 resulting using the Qiagen spin miniprep kit (Qiagen, Valencia, CA) and analyzed for correct insertions by restriction enzymes with EcoR 1. Plasmid sequences that appear to have a correct insert were verified by sequencing of Dideoxy chain termination DNA with direct M13 universal primers.

La secuencia de ADN del producto de la PCR de A. caviae se muestra a continuación como la SEQ ID NO:414), 25 donde las regiones de secuencia de cebador degenerado se encuentran subrayadas: The DNA sequence of the A. caviae PCR product is shown below as SEQ ID NO: 414), 25 where the degenerate primer sequence regions are underlined:

(SEQ ID NO: 414), donde R indica A o G, S indica C o G y M indica A o C. (SEQ ID NO: 414), where R indicates A or G, S indicates C or G, and M indicates A or C.

La secuencia de aminoácidos de la enzima parcial BAR de A. caviae se muestra como la SEQ ID NO:415 a continuación. The amino acid sequence of the partial enzyme BAR of A. caviae is shown as SEQ ID NO: 415 below.

donde X es H, Q, N o K (SEQ ID NO:415). where X is H, Q, N or K (SEQ ID NO: 415).

El fragmento de proteína de consenso de la SEQ ID NO:415 es más de un 89% homólogo en el nivel de aminoácido con respecto a la secuencia TIGR publicada para A. hydrophila. Se esperaba que debido a que la proteína altamente relacionada de Aeromonas hydrophila mostraba una actividad de racemasa de amplia especificidad, así como los 10 extractos celulares de A. caviae, la región codificadora de longitud completa para A. caviae, una vez obtenida, produciría una racemasa que también tendría una amplia especificidad con actividad sobre triptófano. Se utilizaron los procedimientos de paseo genómico para obtener la secuencia de genes de longitud completa del gen de BAR de The consensus protein fragment of SEQ ID NO: 415 is more than 89% homologous at the amino acid level with respect to the published TIGR sequence for A. hydrophila. Because the highly related Aeromonas hydrophila protein exhibited broadly specific racemase activity, as well as the 10 A. caviae cell extracts, it was expected that the full length coding region for A. caviae, once obtained, would produce a racemase that would also have broad specificity with activity on tryptophan. Genomic walk procedures were used to obtain the full-length gene sequence of the BAR gene from

A. caviae mostrado a continuación como la SEQ ID NO:416. A. caviae shown below as SEQ ID NO: 416.

(SEQ ID NO: 416). La secuencia de aminoácidos para la BAR nativa de A. caviae se muestra a continuación como la SEQ ID NO:417. (SEQ ID NO: 416). The amino acid sequence for the native BAR of A. caviae is shown below as SEQ ID NO: 417.

5 1 mhkktllatl ifgllagqav aapylpladd hrngqeqtaa 41 nawlevdlga fehniqtlkn rlgdkgpqic aimkadaygh 81 gidllvpsvv kagipcigia sneearvare kgfegrlmrv 121 raatpdeveq alpykleeli gslesakgia diaqrhhtni 161 pvhiglnsag msrngidlrq ddakadalam lklkgitpvg 5 1 mhkktllatl ifgllagqav aapylpladd hrngqeqtaa 41 nawlevdlga fehniqtlkn rlgdkgpqic aimkadaygh 81 gidllvpsvv kagipcigia sneearvare kgfegrlmrv 121 raatpdeveq alpykleeli gslesakgia diaqrhhtni 161 pvhiglnsag msrngidlrq ddakadalam lklkgitpvg

10 201 imthfpveek edvklglaqf kldyqwlida gkldrsklti 241 haansfatle vpeayfdmvr pggiiygdti psyteykkvm 281 afktqvasvn hypagntvgy drtftlkrds llanlpmgys 321 dgyrramsnk ayvlihgqka pvvgktsmnt tmvdvtdikg 361 ikpgdevvlf grqgdaevkq sdleeyngal ladmytvwgy 10 201 imthfpveek edvklglaqf kldyqwlida gkldrsklti 241 haansfatle vpeayfdmvr pggiiygdti psyteykkvm 281 afktqvasvn hypagvvkkvkgkkvkgvkkvkgkvkgvvkgvqkvvgkvkvgvkvgvkvgvkvvvhvqvqvv

15 401 tnpkkikr. (SEQ ID NO: 417) 15 401 tnpkkikr. (SEQ ID NO: 417)

Se predice que los primeros 21 residuos de aminoácidos con terminal N de la SEQ ID NO:417 son un péptido señal mediante el uso del programa Signal P 3.0 (www.cbs.dtu.dk/services/SignalP/). Las pruebas experimentales confirmaron que el producto de expresión se secretó en el periplasma de E. coli y el péptido señal se escindió como se predijo. Cuando se clonó y expresó el gen de longitud completa mediante el uso de los procedimientos descritos anteriormente, se encontró que tenía una actividad comparable, pero mayor que la de la BAR de P. taetrolens. The first 21 N-terminal amino acid residues of SEQ ID NO: 417 are predicted to be a signal peptide using the Signal P 3.0 program (www.cbs.dtu.dk/services/SignalP/). Experimental tests confirmed that the expression product was secreted into the E. coli periplasm and the signal peptide was cleaved as predicted. When the full length gene was cloned and expressed using the procedures described above, it was found to have comparable activity, but greater than that of the P. taetrolens BAR.

Ejemplo 31 Example 31

Producción de la aldolasa de la SEQ ID NO: 276 en un huésped de expresión alternativo Production of the aldolase from SEQ ID NO: 276 in an alternative expression host

El gen de la SEQ ID NO: 275 se subclonó mediante el uso de procedimientos de biología molecular estándar en un derivado del vector pET23d (Novagen, Madison, WI) que contenía el gen metE de E. coli y el promotor insertado en el sitio de restricción NgoMIV y un segundo sitio de restricción pis que se agregó para una fácil extracción del gen beta lactamasa (baa). La construcción de este vector que contenía una inserción para un gen de oxigenasa mioinositol se describe en PCT WO2006066072 en los ejemplos 2 y 20. La inserción de aldolasa se confirmó mediante el secuenciado de ADN (Agencourt Bioscience Corporation; Beverly, MA) y el plásmido con la secuencia de inserción correcta se transformó en el receptor de expresión BW30384(DE3)�ompT�metE de E. coli. La construcción de este huésped de expresión y el protocolo de transformación también se describen en la PCT WO2006066072 (ejemplos 21 y 22). El gen de la aldolasa se expresó mediante el uso del sistema de autoinducción Overnight Express™ II de Novagen (Novagen, Madison, WI) que contenía 100 mg/L de ampicillina. Este sistema se describió en el ejemplo 24 para la expresión de la D-alanina aminotransferasa de Bacillus sphaericus (cepa ATCC 10208). Los extractos libres de células que contenían la aldolasa se produjeron mediante el uso del reactivo de extracción BugBuster™ de Novagen (libre de amina primaria) (Novagen, Madison, WI) que contenía 1 !L/mL de benzonasa nucleasa, 0,033 !L/mL de r-Lisozima y 5 !L/mL de mezcla de inhibidor de proteasa conjunto II de acuerdo con el protocolo recomendado del fabricante para la lisis celular. Las proteínas solubles en los extractos libres de células se separaron en una estación de electroforesis automatizada Experion de Bio-Rad (Bio-Rad, Hercules, CA) y se analizaron para verificar el porcentaje de expresión de proteínas solubles mediante el uso del software Experion versión 1.1.98.0 como se describe en el ejemplo 12. The gene in SEQ ID NO: 275 was subcloned using standard molecular biology procedures into a derivative of the pET23d vector (Novagen, Madison, WI) containing the E. coli metE gene and the promoter inserted at the site of NgoMIV restriction and a second pis restriction site that was added for easy extraction of the beta lactamase gene (baa). The construction of this vector containing an insert for a myoinositol oxygenase gene is described in PCT WO2006066072 in Examples 2 and 20. The aldolase insert was confirmed by DNA sequencing (Agencourt Bioscience Corporation; Beverly, MA) and plasmid with the correct insertion sequence it was transformed into the E. coli expression receptor BW30384 (DE3) �ompT�metE. The construction of this expression host and the transformation protocol are also described in PCT WO2006066072 (examples 21 and 22). The aldolase gene was expressed using the Novagen Overnight Express ™ II autoinduction system (Novagen, Madison, WI) containing 100 mg / L ampicillin. This system was described in Example 24 for the expression of Bacillus sphaericus D-alanine aminotransferase (strain ATCC 10208). Cell-free extracts containing aldolase were produced using Novagen's BugBuster ™ Extraction Reagent (Primary Amine Free) (Novagen, Madison, WI) containing 1 µL / mL benzase nuclease, 0.033 µL / mL of r-Lysozyme and 5 µL / mL of set II protease inhibitor mixture according to the manufacturer's recommended protocol for cell lysis. The soluble proteins in the cell-free extracts were separated on a Bio-Rad Experion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) and analyzed to verify the percentage of expression of soluble proteins using the Experion version software. 1.1.98.0 as described in Example 12.

Para intentar mejorar la expresión de aldolasa en E. coli, los codones dos a siete de la secuencia codificadora de ADN se mutaron para los cambios sugeridos en el análisis de la secuencia de tipo salvaje mediante el uso del algoritmo HY de E. coli ProteoExpert RTS de Roche. Estos cambios se realizaron mediante el uso del kit de mutagénesis dirigida a múltiples sitios QuikChange® o el kit de mutagénesis dirigida al sitio QuikChange® II XL (Stratagene, La Jolla, CA) de acuerdo con el protocolo sugerido del fabricante con 0,75 !L de solución Quik cada 25 !L de mezcla de reacción y la transformación a células ultracompetentes XL10-Gold®. Las mutaciones se generaron mediante el uso de cebadores (cada 45 nucleótidos de longitud) diseñados con el programa en la web de diseño de cebadores QuikChange® de Stratagene disponible en línea en www.stratagene.com.qcprimerdesign. To try to improve aldolase expression in E. coli, codons two to seven of the DNA coding sequence were mutated for the suggested changes in wild type sequence analysis using the E. coli ProteoExpert RTS HY algorithm Roche. These changes were made using either the QuikChange® Multiple Site-Directed Mutagenesis Kit or the QuikChange® II XL Site-Directed Mutagenesis Kit (Stratagene, La Jolla, CA) according to the manufacturer's suggested protocol at 0.75! L of Quik solution every 25 µL of reaction mix and transformation to ultracompetent XL10-Gold® cells. Mutations were generated using primers (every 45 nucleotides in length) designed with Stratagene's QuikChange® primer design website program available online at www.stratagene.com.qcprimerdesign.

Tabla 48 Table 48

Codón 1 Codon 1
Codón 2 Codón 3 Codón 4 Codón 5 Codón 6 Codón 7 Codon 2 Codon 3 Codon 4 Codon 5 Codon 6 Codon 7

Tipo salvaje Wild guy
ATG CCT ATC GTT GTT ACG AAG ATG CCT ATC GTT GTT ACG AAG

ProteoExpert #1 ProteoExpert # 1
ATG CCA ATT GTT GTA ACT AAA ATG CCA ATT GTT Gta ACT AAA

ProteoExpert #2 ProteoExpert # 2
ATG CCA ATT GTT GTT ACT AAA ATG CCA ATT GTT GTT ACT AAA

ProteoExpert #6 ProteoExpert # 6
ATG CCA ATT GTT GTA ACC AAA ATG CCA ATT GTT Gta ACC AAA

ProteoExpert #10 ProteoExpert # 10
ATG CCA ATT GTT GTT ACC AAA ATG CCA ATT GTT GTT ACC AAA

Las secuencias del gen de aldolasa con los cambios de codones anteriores se transformaron en el huésped de expresión BW30384(DE3)�ompT�metE de E. coli y después se expresaron mediante el uso del sistema de autoinducción 2 Novagen Overnight Express™ (Novagen, Madison, WI). Ninguna de estas mutaciones resultó en niveles más altos de expresión de genes al compararlas con la secuencia de tipo salvaje. Los resultados típicos de los extractos libres de células se analizaron mediante el software 1.1.98.0 Experion Pro260 de Bio-Rad mostrado en la tabla 49 a continuación, donde la columna titulada expresión de proteínas muestra los valores para el % total de proteínas solubles. The aldolase gene sequences with the above codon changes were transformed into the E. coli expression host BW30384 (DE3) �ompT�metE and then expressed using the Novagen Overnight Express ™ autoinduction system 2 (Novagen, Madison, WI). None of these mutations resulted in higher levels of gene expression when compared to the wild type sequence. The typical results of the cell-free extracts were analyzed using Bio-Rad's 1.1.98.0 Experion Pro260 software shown in Table 49 below, where the column titled protein expression shows the values for the total% of soluble proteins.

Los extractos libres de células (0,025 mg/mL de proteínas solubles por ensayo) se analizaron para verificar su capacidad de producir (R,R)-monatina a partir de 200 mM de piruvato de sodio y 100 mM de D-triptófano mediante el uso del protocolo descrito en el ejemplo 7. Las reacciones (volumen total de 7 mL ) se llevaron a cabo en tubos de polipropileno de 14 mL en una cámara anaerobia mediante el uso de D-aminotransferasa purificada de B. sphaericus (ATCC 10208) a una concentración final de 2 mg/mL. La concentración de monatina producida a la 1, 4 y 20 horas después de la adición de las enzimas se muestra en la tabla 49 a continuación. La tabla 49 muestra que el extracto libre de células generado a partir de la construcción que contenía la secuencia de aldolasa de tipo salvaje produjo una concentración de monatina a las 20 horas levemente mayor a la de los extractos libres de células a partir de las construcciones que tenían las mutaciones ProteoExpert. Las concentraciones de monatina se determinaron mediante el procedimiento de LC/MS/MS descrito en el ejemplo 1. Cell-free extracts (0.025 mg / mL soluble protein per assay) were analyzed to verify their ability to produce (R, R) -monatin from 200 mM sodium pyruvate and 100 mM D-tryptophan using of the protocol described in Example 7. Reactions (7 mL total volume) were carried out in 14 mL polypropylene tubes in an anaerobic chamber using purified B. sphaericus D-aminotransferase (ATCC 10208) at a final concentration of 2 mg / mL. The monatin concentration produced at 1, 4, and 20 hours after addition of the enzymes is shown in Table 49 below. Table 49 shows that the cell-free extract generated from the construct containing the wild-type aldolase sequence produced a slightly higher 20-hour monatin concentration than the cell-free extracts from the constructs that they had the ProteoExpert mutations. Monatin concentrations were determined by the LC / MS / MS procedure described in Example 1.

Tabla 49 Table 49

Expresión de proteínas (%)  Protein expression (%)
[Monatina] mM-1 hora [Monatina]; mM-4 horas [Monatina] mM-20 horas [Monatina] mM-1 hour [Monatina]; mM-4 hours [Monatina] mM-20 hours

Tipo salvaje Wild guy
22 2,1 4,2 13,4 22 2.1 4.2 13.4

ProteoExpert #1 ProteoExpert # 1
18 1,3 3,1 12,4 18 1.3 3.1 12.4

ProteoExpert #2 ProteoExpert # 2
18 2,1 4,7 11,6 18 2.1 4.7 11.6

ProteoExpert #6 ProteoExpert # 6
18 1,4 1,9 12,4 18 1.4 1.9 12.4

ProteoExpert #10 ProteoExpert # 10
20 1,8 1,8 11,7 twenty 1.8 1.8 11.7

Estos datos demuestran que la aldolasa de la SEQ ID NO: 276 puede producirse en un huésped de expresión alternativo sin inducción de IPTG. These data demonstrate that the aldolase of SEQ ID NO: 276 can be produced in an alternate expression host without IPTG induction.

El gen bla se extrajo del vector y las fermentaciones subsiguientes para producir aldolasa se realizaron sin el uso de antibiótico como se describe en la PCT WO2006066072 para otra enzima. Los niveles de expresión en las fermentaciones por lote alimentado a 30ºC alcanzaron un máximo a las 6 a 8 horas después de la inducción, lo que produjo la aldolasa de la SEQ ID NO: 276 al 25 al 30% de proteína soluble, de acuerdo con los datos de Experion. Los estudios de estabilidad no mostraron ninguna pérdida aparente de actividad de aldolasa cuando el producto de fermentación se dejó durante 6 horas a 15 o 30ºC (en condiciones de oxígeno limitado así como en condiciones aireadas) antes de la concentración y disrupción celular. Se encontró que la aldolasa era igualmente estable almacenada como un extracto libre de células o como un sedimento celular cuando se almacenó durante 5 días a −80ºC. No se requirió el lavado del sedimento celular antes del almacenamiento a −80ºC y en realidad causó una pequeña disminución en la actividad. Se encontró que las células que se volvieron a suspender en agua destilada, sobrenadante de fermentación o 100 mM de tampón de fosfato de potasio (pH 7,8) no presentaron pérdida en la actividad o en la concentración de proteínas (a juzgar por SDS-PAGE) cuando se almacenaron durante 11 días a temperatura ambiente o a 4ºC. El extracto libre de células producido en tampón de fosfato de potasio no mostró ninguna pérdida de actividad de aldolasa al almacenarse a 4ºC o a temperatura ambiente durante 5 días. Las células pueden abrirse en un tampón de fosfato, hasta un 25% de sobrenadante o agua con recuperación comparable de actividad de aldolasa; no obstante, se encontró que la adición de 1 mM de MgCl2 a agua mejora ligeramente la actividad de la aldolasa. Estos datos muestran que la proteína aldolasa es lo suficientemente estable para ser comercialmente útil. The bla gene was extracted from the vector and subsequent fermentations to produce aldolase were performed without the use of an antibiotic as described in PCT WO2006066072 for another enzyme. Expression levels in the fermentations per batch fed at 30 ° C peaked at 6 to 8 hours after induction, resulting in the aldolase of SEQ ID NO: 276 at 25-30% soluble protein, according to Experion data. Stability studies showed no apparent loss of aldolase activity when the fermentation product was left for 6 hours at 15 or 30 ° C (under oxygen limited conditions as well as under aerated conditions) before cell concentration and disruption. Aldolase was found to be equally stable when stored as a cell-free extract or as a cell pellet when stored for 5 days at −80 ° C. Washing the cell pellet prior to storage at −80 ° C was not required and actually caused a small decrease in activity. Cells resuspended in distilled water, fermentation supernatant, or 100 mM potassium phosphate buffer (pH 7.8) were found to show no loss in activity or protein concentration (judged by SDS- PAGE) when stored for 11 days at room temperature or at 4 ° C. The cell-free extract produced in potassium phosphate buffer showed no loss of aldolase activity when stored at 4 ° C or at room temperature for 5 days. Cells can be opened in phosphate buffer, up to 25% supernatant or water with comparable recovery of aldolase activity; however, the addition of 1mM MgCl2 to water was found to slightly improve aldolase activity. These data show that the protein aldolase is stable enough to be commercially useful.

LISTA DE SECUENCIAS SEQUENCE LIST

<110> Burke, Ellen Gort, Steven John Hicks, Paula M. Luginbuhl, Peter McFarlan, Sara C. Richardson, Toby Solheid, Christopher Weiner, David Zhao, Lishan <110> Burke, Ellen Gort, Steven John Hicks, Paula M. Luginbuhl, Peter McFarlan, Sara C. Richardson, Toby Solheid, Christopher Weiner, David Zhao, Lishan

<120> Aldolasas, ácidos nucleicos que las codifican y métodos para producir y usar las mismas <120> Aldolases, nucleic acids encoding them, and methods of producing and using them

10 10
<130> 2464.0190002/MAC/M-R <140> Se asignará <141> Adjunto <130> 2464.0190002 / MAC / M-R <140> Will be assigned <141> Attachment

15 fifteen
<150> 60/853,005 <151> <150> 60 / 853,005 <151>

<150> 60/799,460 <151> <150> 60 / 799,460 <151>

20 twenty
<160> 417 <160> 417

<170> PatentIn 3.1 <170> PatentIn 3.1

25 25
<210> 1 <211> 699 <212> ADN <213> Bacteria <210> 1 <211> 699 <212> DNA <213> Bacteria

30 30
<400> 1 <400> 1

35 35
<210> 2 <211> 232 <212> PRT <213> Desconocido <210> 2 <211> 232 <212> PRT <213> Unknown

40 40
<220> 201 <220> 201

<223> Aislado <223> Isolated

<220> 5 <221> DOMINIO <220> 5 <221> DOMAIN

<222> (8)...(165) <222> (8) ... (165)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

10 <400> 2 5 <210> 3 10 <400> 2 5 <210> 3

<211> 693 <211> 693

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 3 <400> 3

15 20 15 20
<210> 4 <211> 230 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 4 <211> 230 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

25 25
<220> <221> DOMINIO <222> (28)...(174) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (28) ... (174) <223> Desmethylmenaquinone methyltransferase

<400> 4 <400> 4

<210> 5 <210> 5

<211> 762 <211> 762

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 6 <210> 6

<211> 253 <211> 253

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(191) <222> (21) ... (191)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 6 <400> 6

<210> 7 <210> 7

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 7 5 <210> 8 <400> 7 5 <210> 8

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 8 <210> 9 <400> 8 <210> 9

<211> 552 <211> 552

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 9 <210> 11 <400> 9 <210> 11

<210> 10 <210> 10

<211> 184 <211> 184

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) <222> (21) ... (173)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (2)...(5) <222> (2) ... (5)

25 25
<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 10 <400> 10

<211> 645 <211> 645

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 11 <400> 11

<210> 12 <210> 12

<211> 214 <211> 214

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (10)...(162) <222> (10) ... (162)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

20 <400> 12 20 <400> 12

<210> 13 <210> 13

<211> 498 5 <212> ADN <211> 498 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 13 <400> 13

<210> 14 15 <211> 165 <210> 14 15 <211> 165

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<400> 14 <400> 14

5 5

<210> 15 <210> 15

<211> 723 <211> 723

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

10 10

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 15 <400> 15

5 <210> 16 5 <210> 16

<211> 240 <211> 240

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 15 <222> (19)...(188)  DOMAIN 15 <222> (19) ... (188)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221><221>
SITIO 20 <222> (155)...(158)  SITE 20 <222> (155) ... (158)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 16 <400> 16

<210> 17 <210> 17

<211> 792 5 <212> ADN <211> 792 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 17 5 <210> 18 <400> 17 5 <210> 18

<211> 263 <211> 263

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (39)...(205) <221> DOMAIN 15 <222> (39) ... (205)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 18 <400> 18

<210> 19 <210> 19

<211> 723 5 <212> ADN <211> 723 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 19 <210> 20 <400> 19 <210> 20

<211> 240 <211> 240

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>
10 <221> DOMINIO 10 <221> DOMAIN

<222> (30)...(197) <222> (30) ... (197)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>
15 <221> SITIO 15 <221> SITE

<222> (221)...(224) <222> (221) ... (224)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 20 <400> 20

<210> 21 <210> 21

<211> 444 5 <212> ADN <211> 444 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 21 <400> 21

<210> 22 15 <211> 148 <210> 22 15 <211> 148

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<400> 22 5 <210> 23 <400> 22 5 <210> 23

<211> 801 <211> 801

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 23 <400> 23

<210> 24 <210> 24

<211> 266 <211> 266

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (36)...(207) <222> (36) ... (207)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 24 <400> 24

<210> 25 <210> 25

<211> 741 5 <212> ADN <211> 741 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 25 <400> 25

<210> 26 15 <211> 246 <210> 26 15 <211> 246

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (38)...(202) 25 <223> Desmetilmenaquinona metiltransferasa <220> <222> (38) ... (202) 25 <223> Desmethylmenaquinone methyltransferase <220>

<221> SITIO <221> SITE

<222> (119)...(122) <222> (119) ... (122)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<220> <220>

<221> SITIO <221> SITE

<222> (179)...(182) <222> (179) ... (182)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 26 <400> 26

<210> 27 <210> 27

<211> 693 5 <212> ADN <211> 693 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 27 <400> 27

<210> 28 15 <211> 230 <210> 28 15 <211> 230

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (27)...(179) 25 <223> Desmetilmenaquinona metiltransferasa <222> (27) ... (179) 25 <223> Desmethylmenaquinone methyltransferase

<400> 28 <210> 29 <400> 28 <210> 29

<211> 756 <211> 756

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 29 <400> 29

<210> 30 <210> 30

<211> 251 <211> 251

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (28)...(184) <222> (28) ... (184)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 30 <400> 30

<210> 31 <210> 31

<211><211>
327 5 <212> ADN  327 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 31 <400> 31

<210> 32 <210> 32

<211><211>
109 5 <212> PRT  109 5 <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 32 <400> 32

<210> 33 15 <211> 681 <210> 33 15 <211> 681

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<400> 33 5 <210> 34 <400> 33 5 <210> 34

<211> 226 <211> 226

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (3)...(171) <221> DOMAIN 15 <222> (3) ... (171)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 34 <400> 34

<210> 35 <210> 35

<211> 681 5 <212> ADN <211> 681 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 35 <400> 35

<210> 36 15 <211> 226 <210> 36 15 <211> 226

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> <220> 20 <223> Obtained from an environmental sample <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 36 <210> 37 <400> 36 <210> 37

<211> 675 <211> 675

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 37 <400> 37

<210> 38 10 <211> 224 <210> 38 10 <211> 224

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) 20 <223> Desmetilmenaquinona metiltransferasa <222> (21) ... (173) 20 <223> Desmethylmenaquinone methyltransferase

<400> 38 <210> 39 <400> 38 <210> 39

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 39 5 <210> 40 <400> 39 5 <210> 40

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 40 <400> 40

<210> 41 <210> 41

<211> 672 <211> 672

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 43 <210> 43

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 43 <400> 43

<210> 45 <210> 45

<211> 672 <211> 672

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

10 <400> 41 10 <400> 41

<210> 42 <210> 42

<211> 223 <211> 223

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 42 <400> 42

10 15 10 15
<210> 44 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 44 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

<400> 44 <400> 44

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 45 10 <400> 45

15 <210> 46 15 <210> 46

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (20)...(172) <221> DOMAIN 25 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 46 <400> 46

<210> 47 <210> 47

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 47 <400> 47

<210> 48 15 <211> 223 <210> 48 15 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 25 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 25 <223> Desmethylmenaquinone methyltransferase

<400> 48 <210> 49 <400> 48 <210> 49

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 49 <400> 49

10 <210> 50 10 <210> 50

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (20)...(172) <221> DOMAIN 20 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 50 <400> 50

<210> 51 <210> 51

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 51 <400> 51

<210> 52 <210> 52

<211> 223 <211> 223

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 52 <400> 52

<210> 53 <210> 53

<211> 675 <211> 675

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 53 <400> 53

<210> 54 <210> 54

<211> 224 <211> 224

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) <222> (21) ... (173)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 54 <210> 55 25 <400> 54 <210> 55

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 55 5 <210> 56 <400> 55 5 <210> 56

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 56 <400> 56

<210> 57 <210> 57

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 57 <210> 58 <400> 57 <210> 58

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> 10 <221> DOMINIO <220> 10 <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 58 <210> 59 <400> 58 <210> 59

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 59 <210> 61 <400> 59 <210> 61

<210> 60 <210> 60

<211> 225 <211> 225

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 60 <400> 60

<211> 675 5 <212> ADN <211> 675 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 61 5 <210> 62 <400> 61 5 <210> 62

<211> 224 <211> 224

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (21)...(173) <221> DOMAIN 15 <222> (21) ... (173)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 62 <400> 62

5 5
<210> 63 <211> 693 <212> ADN <213> Desconocido <210> 63 <211> 693 <212> DNA <213> Unknown

10 10
<220> <220>

270 270

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 63 <210> 65 <400> 63 <210> 65

5 10 5 10
<210> 64 <211> 230 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 64 <211> 230 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

15 fifteen
<220> <221> DOMINIO <222> (21)...(173) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (21) ... (173) <223> Desmethylmenaquinone methyltransferase

<400> 64 <400> 64

<211> 672 <211> 672

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400><400>
65  65

<400><400>
67  67

10 10
<210> 66 <211> 223 <212> PRT <213> Desconocido <210> 66 <211> 223 <212> PRT <213> Unknown

15 fifteen
<220> <223> Obtenido a partir de una muestra ambiental <220> <223> Obtained from an environmental sample

20 25 20 25
<220> <221> SEÑAL <222> (1)...(27) <220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <400> 66 <220> <221> SIGNAL <222> (1) ... (27) <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase <400> 66

5 5
<210> 67 <211> 672 <212> ADN <213> Desconocido <210> 67 <211> 672 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental <220> <223> Obtained from an environmental sample

274 274

5 10 5 10
<210> 68 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 68 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

15 fifteen
<220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

<400> 68 <400> 68

<210> 69 <211> 672 <210> 69 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 69 <400> 69

10 15 10 15
<210> 70 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 70 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

25 25
<220> <221> SITIO <222> (149)...(152) <223> Sitio de N-glicosilación. Prosite id = PS00001 <220> <221> SITE <222> (149) ... (152) <223> N-glycosylation site. Prosite id = PS00001

<400> 70 <400> 70

5 5
<210> 71 <211> 672 <212> ADN <213> Desconocido <210> 71 <211> 672 <212> DNA <213> Unknown

10 10
<220> <220>

278 278

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 71 <210> 73 <400> 71 <210> 73

5 10 5 10
<210> 72 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 72 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

15 fifteen
<220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

<400> 72 <400> 72

<211> 690 <211> 690

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 73 <400> 73

10 <210> 74 10 <210> 74

<211> 229 <211> 229

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (20)...(172) <221> DOMAIN 20 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 74 <400> 74

<210> 75 <210> 75

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 75 5 <210> 76 <400> 75 5 <210> 76

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 76 <210> 77 <400> 76 <210> 77

<211> 681 <212> ADN <211> 681 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 77 <400> 77

10 <210> 78 10 <210> 78

<211> 226 <211> 226

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (22)...(174) <221> DOMAIN 20 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 78 <210> 79 <400> 78 <210> 79

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 79 <400> 79

5 10 5 10
<210> 80 <211> 225 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 80 <211> 225 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

15 fifteen
<220> <221> DOMINIO <222> (22)...(174) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (22) ... (174) <223> Desmethylmenaquinone methyltransferase

<400> 80 <400> 80

<210> 81 <210> 81

<211> 678 <211> 678

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 81 10 <400> 81

15 <210> 82 15 <210> 82

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (22)...(174) <221> DOMAIN 25 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 82 <400> 82

<210> 83 <210> 83

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 83 <400> 83

<210> 84 15 <211> 225 <210> 84 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) 25 <223> Desmetilmenaquinona metiltransferasa <222> (22) ... (174) 25 <223> Desmethylmenaquinone methyltransferase

<400> 84 <400> 84

<210> 85 <210> 85

<211> 699 <211> 699

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 87 <210> 87

<211> 672 <211> 672

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

10 <400> 85 10 <400> 85

<210> 86 <210> 86

<211> 232 <211> 232

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) <222> (21) ... (173)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 86 <400> 86

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 87 10 <400> 87

15 <210> 88 15 <210> 88

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (20)...(172) <221> DOMAIN 25 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 88 <210> 89 <400> 88 <210> 89

<211> 696 <212> ADN <211> 696 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 89 <400> 89

10 <210> 90 10 <210> 90

<211> 231 <211> 231

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (22)...(174) <221> DOMAIN 20 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 90 <400> 90

<210> 91 <210> 91

<211> 678 <211> 678

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 91 10 <400> 91

<210> 92 <210> 92

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 92 <400> 92

<210> 93 <210> 93

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 93 5 <210> 94 <400> 93 5 <210> 94

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 94 <400> 94

<210> 95 <210> 95

<211> 639 5 <212> ADN <211> 639 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 95 <400> 95

<210> 96 15 <211> 212 <210> 96 15 <211> 212

<212> PRT <212> PRT

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (9)...(161) <222> (9) ... (161)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 96 <400> 96

<210> 97 <210> 97

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 97 <400> 97

<210> 98 <210> 98

<211> 225 <211> 225

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 98 25 <400> 98

<210> 99 <210> 99

<211> 639 5 <212> ADN <211> 639 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 99 5 <210> 100 <400> 99 5 <210> 100

<211> 212 <211> 212

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (9) ... (161) <221> DOMAIN 15 <222> (9) ... (161)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 100 <210> 101 <400> 100 <210> 101

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 102 <210> 102

<211> 225 <211> 225

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (28) ... (174) <222> (28) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

20 <400> 102 20 <400> 102

<210> 103 <210> 103

<211> 678 <211> 678

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 103 10 <400> 103

<210> 104 <210> 104

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22) ... (174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 104 <400> 104

<210> 105 <210> 105

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 105 5 <210> 106 <400> 105 5 <210> 106

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 106 <400> 106

<210> 107 <210> 107

<211> 636 5 <212> ADN <211> 636 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 107 <400> 107

<210><210>
108 15 <211> 211  108 15 <211> 211

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (9)...(161) <222> (9) ... (161)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 108 <400> 108

<210> 109 <210> 109

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 109 <400> 109

<210><210>
110 10 <211> 225  110 10 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22) ... (174) 20 <223> Desmetilmenaquinona metiltransferasa <222> (22) ... (174) 20 <223> Desmethylmenaquinone methyltransferase

<400> 110 <400> 110

<210> 111 <210> 111

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 111 5 <210> 112 <400> 111 5 <210> 112

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 112 <400> 112

<210> 113 <210> 113

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 113 <400> 113

<210> 114 <210> 114

<211> 225 <211> 225

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 114 25 <400> 114

Leu 225 Leu 225

<210> 115 <210> 115

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 115 <400> 115

10 <210> 116 10 <210> 116

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (20)...(172) <221> DOMAIN 20 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 116 <210> 117 <400> 116 <210> 117

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 117 5 <210> 118 <400> 117 5 <210> 118

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 118 <210> 119 <211> 672 <400> 118 <210> 119 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 119 <210> 121 <400> 119 <210> 121

10 15 10 15
<210> 120 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 120 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (20) ... (172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

<400> 120 <400> 120

<211> 696 <212> ADN <211> 696 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 121 <400> 121

10 <210> 122 10 <210> 122

<211> 231 <211> 231

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (22)...(174) <221> DOMAIN 20 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 122 <400> 122

<210> 123 <210> 123

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 123 5 <210> 124 <400> 123 5 <210> 124

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 124 <400> 124

<210> 125 <210> 125

<211> 678 <211> 678

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 125 10 <400> 125

<210> 126 <210> 126

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22) ... (174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 126 <400> 126

Ser 225 To be 225

<210> 127 5 <211> 678 <210> 127 5 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> 10 <223> Obtenido a partir de una muestra ambiental <220> 10 <223> Obtained from an environmental sample

<400> 127 <400> 127

15 <210> 128 15 <210> 128

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (22)...(174) <221> DOMAIN 25 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 128 <400> 128

5 5
<210> 129 <211> 678 <212> ADN <213> Desconocido <210> 129 <211> 678 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental <400> 129 <220> <223> Obtained from an environmental sample <400> 129

344 344

5 <210> 130 5 <210> 130

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 130 <210> 131 <400> 130 <210> 131

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 131 <400> 131

<210> 132 10 <211> 223 <210> 132 10 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 20 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 20 <223> Desmethylmenaquinone methyltransferase

<400> 132 <400> 132

5 5
<210> 133 <211> 672 <212> ADN <213> Desconocido <210> 133 <211> 672 <212> DNA <213> Unknown

10 10
<220> <220>

348 348

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 133 <210> 135 <400> 133 <210> 135

5 10 5 10
<210> 134 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 134 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

15 fifteen
<220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

20 twenty
<220> <221> SITIO <222> (193)...(196) <223> Sitio de N-glicosilación. Prosite id = PS00001 <220> <221> SITE <222> (193) ... (196) <223> N-glycosylation site. Prosite id = PS00001

25 25
<220> <221> SITIO <222> (204)...(207) <223> Sitio de N-glicosilación. Prosite id = PS00001 <220> <221> SITE <222> (204) ... (207) <223> N-glycosylation site. Prosite id = PS00001

<400> 134 <400> 134

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 136 <210> 136

<211> 223 <211> 223

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

20 <400> 136 20 <400> 136

<210> 137 <210> 137

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 137 <400> 137

<210> 138 15 <211> 223 <210> 138 15 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222><222>
(20)...(172) 25 <223> Desmetilmenaquinona metiltransferasa  (20) ... (172) 25 <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222><222>
(149) ... (152) 30 <223> Sitio de N-glicosilación. Prosite id = PS00001  (149) ... (152) 30 <223> N-glycosylation site. Prosite id = PS00001

<400> 138 <400> 138

<210> 139 <210> 139

<211> 693 <211> 693

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 139 <400> 139

<210> 140 <210> 140

<211> 230 <211> 230

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (27)...(179) <222> (27) ... (179)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 140 25 <400> 140

<210> 141 <210> 141

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 141 <400> 141

<210> 142 <210> 142

<211> 223 <211> 223

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 142 25 <400> 142

5 5
<210> 143 <211> 672 <212> ADN <213> Desconocido <210> 143 <211> 672 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental 358 <220> <223> Obtained from an environmental sample 358

<400> 143 <400> 143

<210> 144 <210> 144

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (1) ... (21) <222> (1) ... (21)

<223> Motivo de firma 1 de las proteínas receptoras dependientes de TonB. Prosite id = PS00430 <223> Reason for signature 1 of the TonB-dependent receptor proteins. Prosite id = PS00430

<400> 144 <210> 145 <400> 144 <210> 145

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 145 <210> 147 <400> 145 <210> 147

<210> 146 <210> 146

<211> 223 <211> 223

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 146 <400> 146

<211> 675 <211> 675

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 147 <400> 147

<210> 148 10 <211> 224 <210> 148 10 <211> 224

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) 20 <223> Desmetilmenaquinona metiltransferasa <222> (21) ... (173) 20 <223> Desmethylmenaquinone methyltransferase

<400> 148 <210> 149 <400> 148 <210> 149

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 149 5 <210> 150 <400> 149 5 <210> 150

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22) ... (174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 150 <400> 150

<210> 151 <210> 151

<211> 675 <211> 675

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 151 <400> 151

<210> 152 <210> 152

<211> 224 <211> 224

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) <222> (21) ... (173)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 152 <210> 153 25 <400> 152 <210> 153

<211> 672 <211> 672

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 153 <400> 153

<210> 154 10 <211> 223 <210> 154 10 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 20 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 20 <223> Desmethylmenaquinone methyltransferase

<400> 154 <210> 155 <400> 154 <210> 155

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 155 <400> 155

10 <210> 156 10 <210> 156

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 20 <222> (20)...(172)  DOMAIN 20 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221><221>
SITIO 25 <222> (204)...(207)  SITE 25 <222> (204) ... (207)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 156 <210> 157 <400> 156 <210> 157

<211> 690 <211> 690

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 158 <210> 158

<211> 229 <211> 229

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

20 <220> 20 <220>

<221> SITIO <221> SITE

<222> (20)...(40) <222> (20) ... (40)

<223> Motivo de firma 1 de oxidasas multicobre. Prosite id = PS00079 <223> Reason for signature 1 of multi-copper oxidases. Prosite id = PS00079

25 <400> 158 <210> 159 25 <400> 158 <210> 159

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 159 <210> 161 <400> 159 <210> 161

<210> 160 <210> 160

<211> 223 <211> 223

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 160 <400> 160

<211><211>
699 5 <212> ADN  699 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 161 <400> 161

<210> 163 <210> 163

<211><211>
699 5 <212> ADN  699 5 <212> DNA

<210> 162 <210> 162

<211> 232 <211> 232

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 162 <400> 162

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 163 <400> 163

<210> 164 15 <211> 232 <210> 164 15 <211> 232

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

5 10 5 10
<220> <223> Obtenido a partir de una muestra ambiental <220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <400> 164 <220> <223> Obtained from an environmental sample <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase <400> 164

<210> 165 <210> 165

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 165 <400> 165

<210> 166 15 <211> 223 <210> 166 15 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 25 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 25 <223> Desmethylmenaquinone methyltransferase

<400> 166 <210> 167 <400> 166 <210> 167

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 167 5 <210> 168 <400> 167 5 <210> 168

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 168 <400> 168

<210> 169 <210> 169

<211> 672 2 <211> 672 2

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 169 <210> 171 10 <400> 169 <210> 171

<210> 170 <210> 170

<211> 223 <211> 223

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 170 <400> 170

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 171 <210> 173 <400> 171 <210> 173

<210> 172 <210> 172

<211> 223 <211> 223

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 172 <400> 172

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 173 5 <210> 174 <400> 173 5 <210> 174

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 174 <400> 174

<210> 175 <210> 175

<211> 672 5 <212> ADN <211> 672 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 175 <400> 175

<210> 176 15 <211> 223 <210> 176 15 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 176 <210> 177 <400> 176 <210> 177

<211> 675 <211> 675

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 177 10 <400> 177

<210> 178 15 <211> 224 <210> 178 15 <211> 224

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (21)...(173) 25 <223> Desmetilmenaquinona metiltransferasa <222> (21) ... (173) 25 <223> Desmethylmenaquinone methyltransferase

<400> 178 <400> 178

<210> 179 <210> 179

<211> 672 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 179 <400> 179

<210> 180 15 <211> 223 <210> 180 15 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 25 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 25 <223> Desmethylmenaquinone methyltransferase

<400> 180 <400> 180

<210> 181 <210> 181

<211> 687 <211> 687

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 181 10 <400> 181

<210> 182 <210> 182

<211> 228 15 <212> PRT <211> 228 15 <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> SEÑAL <221> SIGNAL

<222> (1)...(31) <222> (1) ... (31)

25 <220> 25 <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

30 <400> 182 <210> 183 <211> 693 30 <400> 182 <210> 183 <211> 693

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 183 <400> 183

10 15 10 15
<210> 184 <211> 230 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 184 <211> 230 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (21)...(173) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (21) ... (173) <223> Desmethylmenaquinone methyltransferase

<400> 184 <400> 184

<210> 185 <210> 185

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 185 5 <210> 186 <400> 185 5 <210> 186

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 186 <400> 186

<210> 187 <210> 187

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 187 <400> 187

<210> 188 15 <211> 225 <210> 188 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 188 <210> 189 <400> 188 <210> 189

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 189 <400> 189

<210> 190 <210> 190

<211> 225 <211> 225

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <400> 190 <210> 191 25 <400> 190 <210> 191

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 191 5 <210> 192 <400> 191 5 <210> 192

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 192 <400> 192

<210> 193 <210> 193

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 193 <400> 193

<210> 194 15 <211> 225 <210> 194 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 5 <223> Obtenido a partir de una muestra ambiental <220> 5 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) 10 <223> Desmetilmenaquinona metiltransferasa <222> (22) ... (174) 10 <223> Desmethylmenaquinone methyltransferase

<400> 194 <400> 194

<210> 195 <210> 195

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 195 <400> 195

<210> 196 15 <211> 225 <210> 196 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) 25 <223> Desmetilmenaquinona metiltransferasa <222> (22) ... (174) 25 <223> Desmethylmenaquinone methyltransferase

<400> 196 <212> ADN <400> 196 <212> DNA

<213> Desconocido <213> Unknown

<220> 10 <223> Obtenido a partir de una muestra ambiental <220> 10 <223> Obtained from an environmental sample

<400> 197 5 <210> 198 <400> 197 5 <210> 198

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 15 <222> (22)...(174)  DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221><221>
SITIO 20 <222> (197)...(200)  SITE 20 <222> (197) ... (200)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 198 <400> 198

<210> 199 <210> 199

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 199 5 <210> 200 <400> 199 5 <210> 200

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 15 <222> (22)...(174)  DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221><221>
SITIO 20 <222> (151)...(154)  SITE 20 <222> (151) ... (154)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 200 <400> 200

<210> 201 <210> 201

<211> 633 5 <212> ADN <211> 633 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 201 <400> 201

<210> 202 15 <211> 210 <210> 202 15 <211> 210

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> <220> 20 <223> Obtained from an environmental sample <220>

<221> DOMINIO <221> DOMAIN

<222> (6)...(158) <222> (6) ... (158)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 202 <400> 202

<210> 203 <211> 699 <210> 203 <211> 699

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 203 <400> 203

10 15 10 15
<210> 204 <211> 232 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 204 <211> 232 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (21)...(173) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (21) ... (173) <223> Desmethylmenaquinone methyltransferase

<400> 204 <400> 204

<210> 205 <210> 205

<211> 678 <211> 678

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 205 10 <400> 205

15 <210> 206 15 <210> 206

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (28) ... (174) <221> DOMAIN 25 <222> (28) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 206 <400> 206

<210> 207 <210> 207

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 207 <400> 207

<210> 208 15 <211> 225 <210> 208 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

5 <220> 5 <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

10 <220> 10 <220>

<221> SITIO <221> SITE

<222> (151)...(154) <222> (151) ... (154)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

15 <400> 208 <210> 209 15 <400> 208 <210> 209

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 209 <400> 209

<210> 210 15 <211> 225 <210> 210 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) 25 <223> Desmetilmenaquinona metiltransferasa <222> (22) ... (174) 25 <223> Desmethylmenaquinone methyltransferase

<400> 210 <210> 211 <400> 210 <210> 211

<211> 702 <211> 702

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 212 10 <211> 233 <210> 212 10 <211> 233

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 20 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 20 <223> Desmethylmenaquinone methyltransferase

<400> 212 <400> 212

<210> 213 <210> 213

<211> 690 5 <212> ADN <211> 690 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 213 5 <210> 214 <400> 213 5 <210> 214

<211> 229 <211> 229

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 214 <400> 214

<210> 215 <210> 215

<211> 702 5 <212> ADN <211> 702 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 215 <400> 215

<210> 216 15 <211> 233 <210> 216 15 <211> 233

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (20)...(172) 25 <223> Desmetilmenaquinona metiltransferasa <222> (20) ... (172) 25 <223> Desmethylmenaquinone methyltransferase

<400> 216 <400> 216

<210> 217 5 <211> 702 <210> 217 5 <211> 702

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> 10 <223> Obtenido a partir de una muestra ambiental <220> 10 <223> Obtained from an environmental sample

<400> 217 <400> 217

15 <210> 218 15 <210> 218

<211> 233 <211> 233

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (20)...(172) <221> DOMAIN 25 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 218 <400> 218

<210> 219 <210> 219

<211> 672 <211> 672

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 219 10 <400> 219

15 <210> 220 15 <210> 220

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (20)...(172) <221> DOMAIN 25 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 220 <210> 221 <211> 672 <400> 220 <210> 221 <211> 672

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 221 <400> 221

10 15 10 15
<210> 222 <211> 223 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 222 <211> 223 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (20)...(172) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (20) ... (172) <223> Desmethylmenaquinone methyltransferase

<400> 222 <400> 222

<210> 223 <210> 223

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 225 <210> 225

<211> 672 <211> 672

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

10 <400> 223 10 <400> 223

<210> 224 <210> 224

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 224 <400> 224

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 225 10 <400> 225

15 <210> 226 15 <210> 226

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (20)...(172) <221> DOMAIN 25 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 226 <400> 226

<210> 227 <210> 227

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 227 <400> 227

<210> 228 15 <211> 225 <210> 228 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) 25 <223> Desmetilmenaquinona metiltransferasa <220> <222> (22) ... (174) 25 <223> Desmethylmenaquinone methyltransferase <220>

<221> SITIO <221> SITE

<222> (151)...(154) <222> (151) ... (154)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 228 <210> 229 <400> 228 <210> 229

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 231 <210> 231

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

10 <400> 229 10 <400> 229

<210> 230 <210> 230

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (151)...(154) <222> (151) ... (154)

30 30
<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 230 <400> 230

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 231 10 <400> 231

15 <210> 232 15 <210> 232

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (22)...(174) <221> DOMAIN 25 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 232 <400> 232

<210> 233 <210> 233

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 233 <400> 233

<210> 234 <210> 234

<211> 225 <211> 225

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (151)...(154) <222> (151) ... (154)

20 twenty
<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 234 <400> 234

<210> 235 <210> 235

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 237 <210> 237

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

10 <400> 235 10 <400> 235

<210> 236 <210> 236

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 236 <400> 236

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 237 10 <400> 237

<210> 238 <210> 238

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 238 <400> 238

<210> 239 <210> 239

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 239 5 <210> 240 <400> 239 5 <210> 240

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 15 <222> (22)...(174)  DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221><221>
SITIO 20 <222> (151)...(154)  SITE 20 <222> (151) ... (154)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 240 <400> 240

<210> 241 <210> 241

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 241 <210> 242 <400> 241 <210> 242

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>
10 <221> DOMINIO 10 <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>
15 <221> SITIO 15 <221> SITE

<222> (151)...(154) <222> (151) ... (154)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 242 <400> 242

<210> 243 <210> 243

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 243 <400> 243

<210> 244 15 <211> 225 <210> 244 15 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222><222>
(22)...(174) 25 <223> Desmetilmenaquinona metiltransferasa  (22) ... (174) 25 <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222><222>
(151)...(154) 30 <223> Sitio de N-glicosilación. Prosite id = PS00001  (151) ... (154) 30 <223> N-glycosylation site. Prosite id = PS00001

<400> 244 <400> 244

<210> 245 <210> 245

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 245 <400> 245

<210> 246 <210> 246

<211> 225 <211> 225

<212> PRT 15 <213> Desconocido <212> PRT 15 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

20 <220> 20 <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

25 <220> 25 <220>

<221> SITIO <221> SITE

<222> (2)...(5) <222> (2) ... (5)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

30 <400> 246 <212> ADN 30 <400> 246 <212> DNA

<213> Desconocido <213> Unknown

<220> 10 <223> Obtenido a partir de una muestra ambiental <220> 10 <223> Obtained from an environmental sample

<400> 247 5 <210> 248 <400> 247 5 <210> 248

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 248 <400> 248

<210> 249 <210> 249

<211><211>
678 5 <212> ADN  678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 249 <400> 249

<210> 251 <210> 251

<211><211>
693 5 <212> ADN  693 5 <212> DNA

<210> 250 <210> 250

<211> 225 <211> 225

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (2)...(5) <222> (2) ... (5)

20 twenty
<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 250 <400> 250

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 251 <400> 251

<210> 252 15 <211> 230 <210> 252 15 <211> 230

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <222> (27)...(179) <221> DOMAIN <222> (27) ... (179)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (156)...(159) <222> (156) ... (159)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 252 <400> 252

<210> 253 <210> 253

<211> 702 <211> 702

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 253 <400> 253

10 15 10 15
<210> 254 <211> 233 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 254 <211> 233 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (21)...(173) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (21) ... (173) <223> Desmethylmenaquinone methyltransferase

25 25
<220> <221> SITIO <222> (229)...(232) <223> Sitio de N-glicosilación. Prosite id = PS00001 <220> <221> SITE <222> (229) ... (232) <223> N-glycosylation site. Prosite id = PS00001

<400> 254 <400> 254

5 5
<210> 255 <211> 681 <212> ADN <213> Desconocido <210> 255 <211> 681 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental <220> <223> Obtained from an environmental sample

<400> 255 <400> 255
478 478

5 <210> 256 5 <210> 256

<211> 226 <211> 226

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 256 <400> 256

<210> 257 <210> 257

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 257 5 <210> 258 <400> 257 5 <210> 258

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 258 <400> 258

<210> 259 <210> 259

<211> 579 5 <212> ADN <211> 579 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 259 <400> 259

<210> 260 15 <211> 192 <210> 260 15 <211> 192

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (1)...(132) 25 <223> Desmetilmenaquinona metiltransferasa <222> (1) ... (132) 25 <223> Desmethylmenaquinone methyltransferase

<400> 260 5 <210> 261 <400> 260 5 <210> 261

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 261 5 <210> 262 <400> 261 5 <210> 262

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 262 <210> 263 <211> 678 <400> 262 <210> 263 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 263 <210> 265 <211> 678 <400> 263 <210> 265 <211> 678

10 15 10 15
<210> 264 <211> 225 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 264 <211> 225 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (22)...(174) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (22) ... (174) <223> Desmethylmenaquinone methyltransferase

<400> 264 <400> 264

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 265 <400> 265

10 15 10 15
<210> 266 <211> 225 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 266 <211> 225 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (22)...(174) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (22) ... (174) <223> Desmethylmenaquinone methyltransferase

<400> 266 <400> 266

5 5
<210> 267 <211> 678 <212> ADN <213> Desconocido <210> 267 <211> 678 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental <400> 267 <220> <223> Obtained from an environmental sample <400> 267

491 491

5 <210> 268 5 <210> 268

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 268 <400> 268

<210> 269 <210> 269

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 269 <400> 269

<210> 270 <210> 270

<211> 225 <211> 225

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 270 <400> 270

<210> 271 <210> 271

<211> 678 <211> 678

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 271 <210> 273 10 <400> 271 <210> 273

<210> 272 <210> 272

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 272 <400> 272

<211><211>
678 5 <212> ADN  678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 273 <400> 273

<210> 275 <210> 275

<211><211>
690 5 <212> ADN  690 5 <212> DNA

<210> 274 <210> 274

<211> 225 <211> 225

5 5
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

10 10
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

15 fifteen
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (151)...(154) <222> (151) ... (154)

20 twenty
<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 274 <400> 274

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 275 5 <210> 276 <400> 275 5 <210> 276

<211> 229 <211> 229

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (20)...(172) <221> DOMAIN 15 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 276 <400> 276

<210> 277 <210> 277

<211> 678 <211> 678

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 277 <400> 277

<210> 278 <210> 278

<211> 225 <211> 225

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

20 twenty
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 278 <400> 278

<210> 279 <210> 279

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 281 <210> 281

<211> 678 <211> 678

<212><212>
ADN 5 <213> Desconocido  DNA 5 <213> Unknown

10 <400> 279 10 <400> 279

<210> 280 <210> 280

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 280 <400> 280

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 281 10 <400> 281

15 <210> 282 15 <210> 282

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

20 <220> 20 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 25 <222> (22)...(174) <221> DOMAIN 25 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 282 <210> 283 <211> 678 <400> 282 <210> 283 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 283 <210> 285 <400> 283 <210> 285

10 15 10 15
<210> 284 <211> 225 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 284 <211> 225 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (22) ... (174) <223> Desmetilmenaquinona metiltransferasa <220> <221> DOMAIN <222> (22) ... (174) <223> Desmethylmenaquinone methyltransferase

<400> 284 <400> 284

<211> 678 <211> 678

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 285 <400> 285

<210> 286 10 <211> 225 <210> 286 10 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) 20 <223> Desmetilmenaquinona metiltransferasa <222> (22) ... (174) 20 <223> Desmethylmenaquinone methyltransferase

<400> 286 <210> 287 <211> 678 <400> 286 <210> 287 <211> 678

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 288 <210> 288

<211> 225 <211> 225

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (22)...(174) <222> (22) ... (174)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221> SITIO <221> SITE

<222> (151)...(154) <222> (151) ... (154)

30 30
<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 288 <400> 288

<210> 289 <210> 289

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 289 5 <210> 290 <400> 289 5 <210> 290

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 15 <222> (22)...(174)  DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<220> <220>

<221><221>
SITIO 20 <222> (151)...(154)  SITE 20 <222> (151) ... (154)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 290 <400> 290

<210> 291 <210> 291

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 291 <400> 291

<210> 292 <210> 292

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

5 <220> 5 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 10 <222> (22) ... (174) <221> DOMAIN 10 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 292 <400> 292

5 5
<210> 293 <211> 678 <212> ADN <213> Desconocido <210> 293 <211> 678 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental 521 <220> <223> Obtained from an environmental sample 521

<400> 293 <400> 293

5 <210> 294 5 <210> 294

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 294 <210> 295 <400> 294 <210> 295

<211> 678 5 <212> ADN <211> 678 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 295 5 <210> 296 <400> 295 5 <210> 296

<211> 225 <211> 225

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (22)...(174) <221> DOMAIN 15 <222> (22) ... (174)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 296 <210> 297 <400> 296 <210> 297

<211> 672 <212> ADN <211> 672 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 297 <400> 297

10 <210> 298 10 <210> 298

<211> 223 <211> 223

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (20)...(172) <221> DOMAIN 20 <222> (20) ... (172)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 298 <210> 299 <400> 298 <210> 299

<211> 501 <211> 501

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 300 <210> 300

<211> 166 <211> 166

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (2)...(159) <222> (2) ... (159)

<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

20 <400> 300 <210> 301 20 <400> 300 <210> 301

<211> 501 5 <212> ADN <211> 501 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 301 <400> 301

<210> 302 15 <211> 166 <210> 302 15 <211> 166

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

5 10 5 10
<220> <223> Obtenido a partir de una muestra ambiental <220> <221> DOMINIO <222> (2)...(159) <223> Desmetilmenaquinona metiltransferasa <400> 302 <220> <223> Obtained from an environmental sample <220> <221> DOMAIN <222> (2) ... (159) <223> Desmethylmenaquinone methyltransferase <400> 302

<210> 303 <210> 303

<211> 501 <211> 501

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 304 <210> 304

<211> 166 <211> 166

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (2)...(159) <222> (2) ... (159)

25 25
<223> Desmetilmenaquinona metiltransferasa <223> Desmethylmenaquinone methyltransferase

<400> 304 <400> 304

5 <210> 305 5 <210> 305

<211> 639 <211> 639

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 305 <210> 306 <400> 305 <210> 306

<211> 212 5 <212> PRT <211> 212 5 <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (1)...(195) <222> (1) ... (195)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<220> <220>

<221> SITIO <221> SITE

<222> (32)...(41) <222> (32) ... (41)

<223> Sitio activo de KDPG y KHG aldolasas. Prosite id = PS00159 <223> Active site of KDPG and KHG aldolases. Prosite id = PS00159

<400> 306 <210> 307 <400> 306 <210> 307

<211> 639 <211> 639

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 307 <400> 307

10 15 10 15
<210> 308 <211> 212 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 308 <211> 212 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (2)...(199) <223> KDPG y KHG aldolasa <220> <221> DOMAIN <222> (2) ... (199) <223> KDPG and KHG aldolase

<400> 308 <400> 308

<210> 309 <210> 309

<211> 687 <211> 687

<212> ADN 5 <213> Desconocido <212> DNA 5 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

10 <400> 309 10 <400> 309

<210> 310 <210> 310

<211> 228 <211> 228

15 fifteen
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

20 twenty
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (16)...(215) <222> (16) ... (215)

25 25
<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<400> 310 <400> 310

<210> 311 <210> 311

<211> 600 5 <212> ADN <211> 600 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 311 <400> 311

<210> 312 15 <211> 200 <210> 312 15 <211> 200

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (4) ... (198) 25 <223> KDPG y KHG aldolasa <222> (4) ... (198) 25 <223> KDPG and KHG aldolase

<400> 312 <400> 312

5 5
<210> 313 <211> 681 <212> ADN <213> Desconocido <210> 313 <211> 681 <212> DNA <213> Unknown

10 10
<220> <220>

540 540

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 314 <210> 314

<211> 226 <211> 226

10 10
<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> <220>

15 fifteen
<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (12)...(207) <222> (12) ... (207)

20 twenty
<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<400> 314 <400> 314

<210> 315 <210> 315

<211> 576 5 <212> ADN <211> 576 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 315 <400> 315

<210> 316 15 <211> 192 <210> 316 15 <211> 192

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 20 <223> Obtenido a partir de una muestra ambiental <220> 20 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (9)...(192) 25 <223> KDPG y KHG aldolasa <220> <222> (9) ... (192) 25 <223> KDPG and KHG aldolase <220>

<221> SITIO <221> SITE

<222> (176)...(179) <222> (176) ... (179)

<223> Sitio de N-glicosilación. Prosite id = PS00001 <223> N-glycosylation site. Prosite id = PS00001

<400> 316 <400> 316

10 <210> 317 10 <210> 317

<211> 612 <211> 612

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 317 <400> 317

10 <210> 318 10 <210> 318

<211> 203 <211> 203

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

15 <220> 15 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 20 <222> (1)...(192) <221> DOMAIN 20 <222> (1) ... (192)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<400> 318 <210> 319 <400> 318 <210> 319

<211> 600 <211> 600

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 319 <400> 319

<210> 320 10 <211> 199 <210> 320 10 <211> 199

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222><222>
(1)...(186) 20 <223> KDPG y KHG aldolasa  (1) ... (186) 20 <223> KDPG and KHG aldolase

<220> <220>

<221> SITIO <221> SITE

<222><222>
(23)...(32) 25 <223> Sitio activo de KDPG y KHG aldolasas. Prosite id = PS00159  (23) ... (32) 25 <223> Active site of KDPG and KHG aldolases. Prosite id = PS00159

<220> <220>

<221> SITIO <221> SITE

<222><222>
(112)...(125) 30 <223> Residuo que forma una base de Schiff de KDPG y KHG aldolasas. Prosite id = PS00160  (112) ... (125) 30 <223> Residue that forms a Schiff base of KDPG and KHG aldolases. Prosite id = PS00160

<400> 320 <400> 320

5 5
<210> 321 <211> 654 <212> ADN <213> Desconocido <210> 321 <211> 654 <212> DNA <213> Unknown

10 10
<220> <223> Obtenido a partir de una muestra ambiental <220> <223> Obtained from an environmental sample

548 548

<400> 321 <400> 321

5 <210> 322 5 <210> 322

<211> 217 <211> 217

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (9)...(204) <221> DOMAIN 15 <222> (9) ... (204)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<400> 322 <210> 323 <400> 322 <210> 323

<211> 603 5 <212> ADN <211> 603 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 323 5 <210> 324 <400> 323 5 <210> 324

<211> 201 <211> 201

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221><221>
DOMINIO 15 <222> (9)...(201)  DOMAIN 15 <222> (9) ... (201)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<220> <220>

<221><221>
SITIO 20 <222> (40)...(49)  SITE 20 <222> (40) ... (49)

<223> Sitio activo de KDPG y KHG aldolasas. Prosite id = PS00159 <223> Active site of KDPG and KHG aldolases. Prosite id = PS00159

<400> 324 <210> 325 <211> 648 <400> 324 <210> 325 <211> 648

<212> ADN <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 325 <210> 327 <400> 325 <210> 327

10 15 10 15
<210> 326 <211> 215 <212> PRT <213> Desconocido <220> <223> Obtenido a partir de una muestra ambiental <210> 326 <211> 215 <212> PRT <213> Unknown <220> <223> Obtained from an environmental sample

20 twenty
<220> <221> DOMINIO <222> (1)...(200) <223> KDPG y KHG aldolasa <220> <221> DOMAIN <222> (1) ... (200) <223> KDPG and KHG aldolase

25 25
<220> <221> SITIO <222> (104)...(107) <223> Sitio de N-glicosilación. Prosite id = PS00001 <220> <221> SITE <222> (104) ... (107) <223> N-glycosylation site. Prosite id = PS00001

<400> 326 <400> 326

<211> 642 <211> 642

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 328 <210> 328

<211> 213 <211> 213

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (5)...(200) <222> (5) ... (200)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

20 <220> 20 <220>

<221> SITIO <221> SITE

<222> (37) ... (96) <222> (37) ... (96)

<223> Sitio activo de KDPG y KHG aldolasas. Prosite id = PS00159 <223> Active site of KDPG and KHG aldolases. Prosite id = PS00159

25 <400> 328 <210> 329 25 <400> 328 <210> 329

<211> 618 5 <212> ADN <211> 618 5 <212> DNA

<213> Desconocido <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 329 5 <210> 330 <400> 329 5 <210> 330

<211> 205 <211> 205

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

10 <220> 10 <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO 15 <222> (4)...(199) <221> DOMAIN 15 <222> (4) ... (199)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

<400> 330 <210> 331 <400> 330 <210> 331

<211> 663 <211> 663

<212> ADN <213> Desconocido <212> DNA <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<400> 331 <400> 331

<210> 332 10 <211> 220 <210> 332 10 <211> 220

<212> PRT <212> PRT

<213> Desconocido <213> Unknown

<220> 15 <223> Obtenido a partir de una muestra ambiental <220> 15 <223> Obtained from an environmental sample

<220> <220>

<221> DOMINIO <221> DOMAIN

<222> (15)...(211) 20 <223> KDPG y KHG aldolasa <222> (15) ... (211) 20 <223> KDPG and KHG aldolase

<400> 332 <210> 333 <400> 332 <210> 333

<211> 648 <211> 648

<212> ADN <212> DNA

<213> Desconocido <220> <213> Unknown <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

<210> 334 <210> 334

<211> 215 <211> 215

<212> PRT 10 <213> Desconocido <212> PRT 10 <213> Unknown

<220> <220>

<223> Obtenido a partir de una muestra ambiental <223> Obtained from an environmental sample

15 <220> 15 <220>

<221> DOMINIO <221> DOMAIN

<222> (12)...(206) <222> (12) ... (206)

<223> KDPG y KHG aldolasa <223> KDPG and KHG aldolase

20 <220> 20 <220>

<221> SITIO <221> SITE

<222> (44)...(53) <222> (44) ... (53)

<223> Sitio activo de KDPG y KHG aldolasas. Prosite id = PS00159 <223> Active site of KDPG and KHG aldolases. Prosite id = PS00159

25 <220> 25 <220>

<221> SITIO <221> SITE

<222> (133)...(146) <222> (133) ... (146)

<223> Residuo que forma una base de Schiff de KDPG y KHG aldolasas. Prosite id = PS00160 <223> Residue that forms a Schiff base of KDPG and KHG aldolases. Prosite id = PS00160

30 <400> 334 <210> 335 30 <400> 334 <210> 335

<211> 19 <211> 19

<212> ADN <213> Secuencia Artificial <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<220> <221> característica miscelánea <222> (1)..(19) <223> b es c, g o t <220> <221> miscellaneous characteristic <222> (1) .. (19) <223> b is c, g or t

<220> <221> característica miscelánea <222> (1)..(19) <223> y es c o t <220> <221> miscellaneous characteristic <222> (1) .. (19) <223> and is c or t

<220> <221> característica miscelánea <222> (1)..(19) <223> r es a o g <220> <221> miscellaneous characteristic <222> (1) .. (19) <223> r is a or g

<220> <221> característica miscelánea <222> (1)..(19) <223> w es a o t <220> <221> miscellaneous characteristic <222> (1) .. (19) <223> w is a or t

<400> 335 aargtbtwyg argacaatg <400> 335 aargtbtwyg argacaatg
19 19

<210> 336 <211> 18 <212> ADN <213> Secuencia Artificial <210> 336 <211> 18 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<220> <221> característica miscelánea <222> (1)..(18) <223> d es a, g o t <220> <221> miscellaneous characteristic <222> (1) .. (18) <223> d is a, g or t

<220> <221> característica miscelánea <222> (1)..(18) <223> y es c o t <220> <221> miscellaneous characteristic <222> (1) .. (18) <223> and is c or t

<220> <221> característica miscelánea <222> (1)..(18) <223> r es a o g <220> <221> miscellaneous characteristic <222> (1) .. (18) <223> r is a or g

<220> <221> característica miscelánea <222> (1)..(18) <223> w es a o t <220> <221> miscellaneous characteristic <222> (1) .. (18) <223> w is a or t

<400> 336 gcdcagawca ayggrtgg <400> 336 gcdcagawca ayggrtgg
18 18

<210> 337 <211> 23 <212> ADN <213> Secuencia Artificial <210> 337 <211> 23 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<220> <221> característica miscelánea <222> (1)..(23) <223> d es a, g o t <220> <221> miscellaneous characteristic <222> (1) .. (23) <223> d is a, g or t

<220> <221> característica miscelánea <222> (1)..(23) <223> y es c o t <220> <221> miscellaneous characteristic <222> (1) .. (23) <223> and is c or t

<220> <221> característica miscelánea <222> (1)..(23) <223> r es a o g <220> <221> miscellaneous characteristic <222> (1) .. (23) <223> r is a or g

<220> <221> característica miscelánea <222> (1)..(23) <223> s es c o g <220> <221> miscellaneous characteristic <222> (1) .. (23) <223> s is c or g

<400> 337 ccatcrsyat cdgcrtadag cca <400> 337 ccatcrsyat cdgcrtadag cca
23 2. 3

<210> 338 <211> 20 <212> ADN <213> Secuencia Artificial <210> 338 <211> 20 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<220> <221> característica miscelánea <222> (1)..(20) <223> d es a, g o t <220> <221> miscellaneous characteristic <222> (1) .. (20) <223> d is a, g or t

<220> <221> característica miscelánea <222> (1)..(20) <223> y es c o t <220> <221> miscellaneous characteristic <222> (1) .. (20) <223> and is c or t

<220> <221> característica miscelánea <222> (1)..(20) <223> r es a o g <220> <221> miscellaneous characteristic <222> (1) .. (20) <223> r is a or g

<220> <221> característica miscelánea <222> (1)..(20) <223> n es a, c, g o t <220> <221> miscellaneous characteristic <222> (1) .. (20) <223> n is a, c, g or t

<400> 338 gcrtadagcc aytcnccrtc<400> 338 gcrtadagcc aytcnccrtc
20  twenty

<210> 339 <211> 30 <212> ADN <213> Secuencia Artificial <210> 339 <211> 30 <212> DNA <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 339 ataagacata tgcctatcgt tgttacgaag <400> 339 ataagacata tgcctatcgt tgttacgaag
30 30

<210> 340 <211> 33 <212> ADN <213> Secuencia Artificial <210> 340 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 340 ataagaggat ccttattcct cgggcagccg etc <400> 340 ataagaggat ccttattcct cgggcagccg etc
33 33

<210> 341 <211> 30 <212> ADN <213> Secuencia Artificial <210> 341 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 341 ataagacata tgaacagacc tgtggttgtc <400> 341 ataagacata tgaacagacc tgtggttgtc
30 30

<210> 342 <211> 33 <212> ADN <213> Secuencia Artificial <210> 342 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 342 ataagaggat ccttacaggt acttgagacc gag <400> 342 ataagaggat ccttacaggt acttgagacc gag
33 33

<210> 343 <211> 30 <212> ADN <213> Secuencia Artificial <210> 343 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 343 ataagacata tgagcgtggt catccgaaac <400> 343 ataagacata tgagcgtggt catccgaaac
30 30

<210> 344 <211> 33 <212> ADN <213> Secuencia Artificial <210> 344 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 344 ataagaggat ccttacttcg ctttgttata ggc <400> 344 ataagaggat ccttacttcg ctttgttata ggc
33 33

<210> 345 <211> 30 <212> ADN <213> Secuencia Artificial <210> 345 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 345 ataagacata tgaacaagcc cgtggttgtg <400> 345 ataagacata tgaacaagcc cgtggttgtg
30 30

<210> 346 <211> 34 <212> ADN <213> Secuencia Artificial <210> 346 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 346 ataagaggat ccttacaagt acttgagacc gagg <400> 346 ataagaggat ccttacaagt acttgagacc gagg
34 3. 4

<210> 347 <211> 29 <212> ADN <213> Secuencia Artificial <210> 347 <211> 29 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 347 ataagacata tgagcgtggt cgtcaccgg <400> 347 ataagacata tgagcgtggt cgtcaccgg
29 29

<210> 348 <211> 34 <212> ADN <213> Secuencia Artificial <210> 348 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 348 ataagaggat ccttagccgt ttttcccgtc ggtg <400> 348 ataagaggat ccttagccgt ttttcccgtc ggtg
34 3. 4

<210> 349 <211> 33 <212> ADN <213> Secuencia Artificial <210> 349 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 349 agaagacata tgatgagcat cgtcgtccag aac <400> 349 agaagacata tgatgagcat cgtcgtccag aac
33 33

<210> 350 <211> 34 <212> ADN <213> Secuencia Artificial <210> 350 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 350 agaagaggat cctcagacat atttcaggcc cttg <400> 350 agaagaggat cctcagacat atttcaggcc cttg
34 3. 4

<210> 351 <211> 30 <210> 351 <211> 30

<212> ADN <213> Secuencia Artificial <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 351 agaagacata tgatgagcgt ggtcatcacc <400> 351 agaagacata tgatgagcgt ggtcatcacc
30 30

<210> 352 <211> 33 <212> ADN <213> Secuencia Artificial <210> 352 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 352 acaacaggat ccctatttct tctccggcgt ttc <400> 352 acaacaggat ccctatttct tctccggcgt ttc
33 33

<210> 353 <211> 30 <212> ADN <213> Secuencia Artificial <210> 353 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 353 ataatacata tgagcgtcgt cgttcagaac <400> 353 ataatacata tgagcgtcgt cgttcagaac
30 30

<210> 354 <211> 34 <212> ADN <213> Secuencia Artificial <210> 354 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 354 ataataggat ccttagacat atttgagccc cttc <400> 354 ataataggat ccttagacat atttgagccc cttc
34 3. 4

<210> 355 <211> 33 <212> ADN <213> Secuencia Artificial <210> 355 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 355 agaagacata tgatgtcggt tgtcgttcag aac <400> 355 agaagacata tgatgtcggt tgtcgttcag aac
33 33

<210> 356 <211> 31 <212> ADN <213> Secuencia Artificial <210> 356 <211> 31 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 356 agaagaggat cctcagatat acttcaggcc c <400> 356 agaagaggat cctcagatat acttcaggcc c
31 31

<210> 357 <210> 357

<211> 852 <211> 852

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> ATCC 4978 DAAT <223> ATCC 4978 DAAT

<210> 358 <210> 358

<211> 283 <211> 283

<212> PRT 15 <213> Secuencia Artificial <212> PRT 15 <213> Artificial Sequence

<220> <220>

<223> ATCC 4978 DAAT <223> ATCC 4978 DAAT

20 <400> 358 20 <400> 358

<210> 359 <211> 35 <212> ADN <213> Secuencia Artificial <210> 359 <211> 35 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 359 gtgattgttt catcaacgaa ttcagaagta acgcc <400> 359 gtgattgttt catcaacgaa ttcagaagta acgcc
35 35

<210> 360 <211> 35 <212> ADN <213> Secuencia Artificial <210> 360 <211> 35 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 360 gtgattgttt catcaacgcg ttcagaagta acgcc <400> 360 gtgattgttt catcaacgcg ttcagaagta acgcc
35 35

<210> 361 <211> 35 <212> ADN <213> Secuencia Artificial <210> 361 <211> 35 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 361 gtgattgttt catcaacgag ttcagaagta acgcc <400> 361 gtgattgttt catcaacgag ttcagaagta acgcc
35 35

<210> 362 <211> 35 <212> ADN <213> Secuencia Artificial <210> 362 <211> 35 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 362 gtgattgttt catcaacggc ttcagaagta acgcc <400> 362 gtgattgttt catcaacggc ttcagaagta acgcc
35 35

<210> 363 <211> 31 <212> ADN <213> Secuencia Artificial <210> 363 <211> 31 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 363 gtgcaggccc tcgtgctcat attttccctg g <400> 363 gtgcaggccc tcgtgctcat attttccctg g
31 31

<210> 364 <211> 45 <212> ADN <213> Secuencia Artificial <210> 364 <211> 45 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 364 gaagtgattg tttcatcaac gcagtcagaa gtaacgccaa ttatc <400> 364 gaagtgattg tttcatcaac gcagtcagaa gtaacgccaa ttatc
45 Four. Five

<210> 365 <211> 40 <212> ADN <213> Secuencia Artificial <210> 365 <211> 40 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 365 catatgagtt atagcttatg gaatgaccaa attgtgaatg <400> 365 catatgagtt atagcttatg gaatgaccaa attgtgaatg
40 40

<210> 366 <211> 34 <212> ADN <213> Secuencia Artificial <210> 366 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 366 ctcgagtgcg gccgcaagct tgtcgacgga gctc <400> 366 ctcgagtgcg gccgcaagct tgtcgacgga gctc
34 3. 4

<210> 367 <211> 95 <212> ADN <213> Secuencia Artificial <210> 367 <211> 95 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 367 <400> 367

<210> 368 <211> 34 <212> ADN <213> Secuencia Artificial <210> 368 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 368 ggccagtgaa ttgtaatacg actcactata gggc <400> 368 ggccagtgaa ttgtaatacg actcactata gggc
34 3. 4

<210> 369 <211> 42 <212> ADN <213> Secuencia Artificial <210> 369 <211> 42 <212> DNA <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 369 cgccatcttt aattccataa atatttgaag aagagccttc tg <400> 369 cgccatcttt aattccataa atatttgaag aagagccttc tg
42 42

<210> 370 <211> 66 <212> ADN <213> Secuencia Artificial <210> 370 <211> 66 <212> DNA <213> Artificial Sequence

<220> <220>

<223> Cebador mutagénico <223> Mutagenic Primer

<400> 370 <400> 370

<210> 371 <210> 371

<211> 55 <211> 55

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador mutagénico <223> Mutagenic Primer

<400> 371 gtattataca cacatccagc gaataactac atcttaaatg gtattacacg tcaag 55 <400> 371 gtattataca cacatccagc gaataactac atcttaaatg gtattacacg tcaag 55

<210> 372 <210> 372

<211> 64 <211> 64

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador mutagénico <223> Mutagenic Primer

<400> 372 <400> 372

<210> 373 <210> 373

<211> 64 <211> 64

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador mutagénico <223> Mutagenic Primer

<400> 373 <400> 373

<210> 374 <210> 374

<211> 64 <211> 64

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador mutagénico <223> Mutagenic Primer

<400> 374 <400> 374

<210> 375 <210> 375

<211> 16 <211> 16

<212> PRT <212> PRT

<213> P. striata <213> P. striata

<220> <220>

<221> característica miscelánea <221> miscellaneous feature

<222> (12)..(12) <222> (12) .. (12)

<223> Xaa puede ser cualquier aminoácido natural <223> Xaa can be any natural amino acid

<400> 375 <210> 379 <400> 375 <210> 379

<210> 376 <211> 28 <212> ADN <213> Secuencia Artificial <210> 376 <211> 28 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 376 agaagacata tgccctttcg ccgtaggg <400> 376 agaagacata tgccctttcg ccgtaggg
28 28

<210> 377 <211> 32 <212> ADN <213> Secuencia Artificial <210> 377 <211> 32 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 377 agaagaggat cctcagtcga cgagtatctt cg <400> 377 agaagaggat cctcagtcga cgagtatctt cg
32 32

<210> 378 <211> 1230 <212> ADN <213> Secuencia Artificial <210> 378 <211> 1230 <212> DNA <213> Artificial Sequence

<220> <223> KT2440 BAR <220> <223> KT2440 BAR

<400> 378 <400> 378

<211> 409 5 <212> PRT <211> 409 5 <212> PRT

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> KT2440 BAR <223> KT2440 BAR

<400> 379 <400> 379

<210> 380 <210> 380

<211> 1152 <211> 1152

<212> ADN <212> DNA

<213> Geobacillus stearothermophilus <213> Geobacillus stearothermophilus

<400> 380 <400> 380

5 <210> 381 5 <210> 381

<211> 384 <211> 384

<212> PRT <212> PRT

<213> Geobacillus stearothermophilus <213> Geobacillus stearothermophilus

10 <400> 381 10 <400> 381

<210> 382 <210> 382

<211> 43 <211> 43

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <223> Cebador mutagénico <220> <223> Mutagenic primer

<400> 382 gccatttgga aacgatcaac gcggaagtgc cttgcacgat cag <400> 382 gccatttgga aacgatcaac gcggaagtgc cttgcacgat cag
43 43

<210> 383 <211> 30 <212> ADN <213> Secuencia Artificial <210> 383 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 383 gatataccat ggcatactca ttatggaatg <400> 383 gatataccat ggcatactca ttatggaatg
30 30

<210> 384 <211> 32 <212> ADN <213> Secuencia Artificial <210> 384 <211> 32 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 384 gttatcggat ccttaggcat taattgaaat tg <400> 384 gttatcggat ccttaggcat taattgaaat tg
32 32

<210> 385 <211> 36 <212> ADN <213> Secuencia Artificial <210> 385 <211> 36 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 385 gaggagctcg agtcagacgt atttcagtcc tttttc <400> 385 gaggagctcg agtcagacgt atttcagtcc tttttc
36 36

<210> 386 <211> 29 <212> ADN <213> Secuencia Artificial <210> 386 <211> 29 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 386 agaagacata tgatttatca gccggggac <400> 386 agaagacata tgatttatca gccggggac
29 29

<210> 387 <211> 30 <212> ADN <213> Secuencia Artificial <210> 387 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 387 agaagacata tgggtgtcgt cgtccaaaac <400> 387 agaagacata tgggtgtcgt cgtccaaaac
30 30

<210> 388 <211> 31 <210> 388 <211> 31

<212> ADN <213> Secuencia Artificial <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 388 ataataggat ccttagacat atttgaggcc c <400> 388 ataataggat ccttagacat atttgaggcc c
31 31

<210> 389 <211> 28 <212> ADN <213> Secuencia Artificial <210> 389 <211> 28 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 389 ataatacata tgaagccggt ggtggtgc<400> 389 ataatacata tgaagccggt ggtggtgc
28  28

<210> 390 <211> 31 <212> ADN <213> Secuencia Artificial <210> 390 <211> 31 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 390 agaagaggat ccttagacat aggtgagccc c <400> 390 agaagaggat ccttagacat aggtgagccc c
31 31

<210> 391 <211> 26 <212> ADN <213> Secuencia Artificial <210> 391 <211> 26 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 391 ataataccat gggtgtcgtg gtccag <400> 391 ataataccat gggtgtcgtg gtccag
26 26

<210> 392 <211> 32 <212> ADN <213> Secuencia Artificial <210> 392 <211> 32 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 392 agaagaggat ccttagacat atttcaggcc cc <400> 392 agaagaggat ccttagacat atttcaggcc cc
32 32

<210> 393 <211> 30 <212> ADN <213> Secuencia Artificial <210> 393 <211> 30 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 393 gcggaacata tgtttgagaa cattaccgcc <400> 393 gcggaacata tgtttgagaa cattaccgcc
30 30

<210> 394 <210> 394

<211> 32 <211> 32

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 394 ataaccggat ccttacagca ctgccacaat cg 32 <400> 394 ataaccggat ccttacagca ctgccacaat cg 32

<210> 395 <210> 395

<211> 36 <211> 36

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 395 cgctcttatg gttcggtttg cttgggttgc tcaccc 36 <400> 395 cgctcttatg gttcggtttg cttgggttgc tcaccc 36

<210> 396 <210> 396

<211> 36 <211> 36

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 396 gggtgagcaa cccaagcttt ccgaaccata agagcg 36 <400> 396 gggtgagcaa cccaagcttt ccgaaccata agagcg 36

<210> 397 <210> 397

<211> 39 <211> 39

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 397 caaaaaatac cagcgttaag ggagtgtggg tgagcaacc 39 <400> 397 caaaaaatac cagcgttaag ggagtgtggg tgagcaacc 39

<210> 398 <210> 398

<211> 29 <211> 29

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 398 cattaccgcc gctactgccg acccgattc 29 <400> 398 cattaccgcc gctactgccg acccgattc 29

<210> 399 <210> 399

<211> 39 <211> 39

<212> ADN <212> DNA

<213> Secuencia Artificial <213> Artificial Sequence

<220> <220>

<223> Cebador <223> primer

<400> 399 <400> 399

caccaaaaat tacctcggcg tagacggcat ccctgaatt caccaaaaat tacctcggcg tagacggcat ccctgaatt
39 39

<210> 400 <211> 35 <212> ADN <213> Secuencia Artificial <210> 400 <211> 35 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 400 tgatgcggaa aatcacgctc ttgacttcga tgcac <400> 400 tgatgcggaa aatcacgctc ttgacttcga tgcac
35 35

<210> 401 <211> 35 <212> ADN <213> Secuencia Artificial <210> 401 <211> 35 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 401 gcggcgccat ggaaaatgat ccgattggtc taatg <400> 401 gcggcgccat ggaaaatgat ccgattggtc taatg
35 35

<210> 402 <211> 33 <212> ADN <213> Secuencia Artificial <210> 402 <211> 33 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 402 gcggcggtcg acgcaattac aattgtgttt gtc <400> 402 gcggcggtcg acgcaattac aattgtgttt gtc
33 33

<210> 403 <211> 34 <212> ADN <213> Secuencia Artificial <210> 403 <211> 34 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 403 gcggcgccat ggatgtatgt ataattttat ttag <400> 403 gcggcgccat ggatgtatgt ataattttat ttag
34 3. 4

<210> 404 <211> 36 <212> ADN <213> Secuencia Artificial <210> 404 <211> 36 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 404 gcggcggtcg acaaatttca ttattcattc taattt <400> 404 gcggcggtcg acaaatttca ttattcattc taattt
36 36

<210> 405 <211> 36 <212> ADN <213> Secuencia Artificial <210> 405 <211> 36 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

<400> 405 ggccggcata tgtcgatcct taacgactac aaacgt <400> 405 ggccggcata tgtcgatcct taacgactac aaacgt
36 36

5 5
<210> 406 <211> 36 <212> ADN <213> Secuencia Artificial <210> 406 <211> 36 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

15 fifteen
<400> 406 ggaaggctcg agtcatgatt ggtttccaga caaatt<210> 407 <211> 27 <212> PRT <213> Secuencia Artificial 36 <400> 406 ggaaggctcg agtcatgatt ggtttccaga caaatt <210> 407 <211> 27 <212> PRT <213> Artificial Sequence 36

<220> <223> Secuencia de Señal Sintética <220> <223> Synthetic Signal Sequence

<210> 408 <211> 28 <212> ADN <213> Secuencia Artificial <210> 408 <211> 28 <212> DNA <213> Artificial Sequence

<220> <223> Cebador <220> <223> Primer

35 35
<400> 408 ataatacata tgcccttctc ccgtaccc 28 <400> 408 ataatacata tgcccttctc ccgtaccc  28

<210> 409 <211> 31 <212> ADN <213> Secuencia Artificial <210> 409 <211> 31 <212> DNA <213> Artificial Sequence

45 Four. Five
<220> <223> Cebador <400> 409 gcggcgggat ccttactgat ctttcaggat t 31 <220> <223> Primer <400> 409 gcggcgggat ccttactgat ctttcaggat t 31

<210> 410 <211> 1230 <212> ADN <213> Secuencia Artificial <223> Arginina racemasa de Pseudomonas taetrolens <210> 410 <211> 1230 <212> DNA <213> Artificial Sequence <223> Arginine racemase from Pseudomonas taetrolens

55 55
<400> 410 <400> 410

5 5
<210> 411 <211> 29 <212> ADN <213> Secuencia Artificial <210> 411 <211> 29 <212> DNA <213> Artificial Sequence

10 10
<220> <223> Cebador <220> <223> Primer

15 20 15 20
<400> 411 tacccaggct gagatggaag acatcaacg <210> 412 <211> 23 <212> ADN <213> Secuencia Artificial <220> <223> Cebador 29 <400> 411 tacccaggct gagatggaag acatcaacg <210> 412 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer 29

<400> 412 <400> 412
586 586

gccagcaacg argargcmcg cgt gccagcaacg argargcmcg cgt
23 2. 3

5 5
<210> 413 <211> 18 <212> ADN <213> Secuencia Artificial <210> 413 <211> 18 <212> DNA <213> Artificial Sequence

10 10
<220> <223> Cebador <400> 413 tggccstkga tcagcaca 18 <220> <223> Primer <400> 413 tggccstkga tcagcaca  18

15 fifteen
<210> 414 <211> 716 <212> ADN <213> Secuencia Artificial <210> 414 <211> 716 <212> DNA <213> Artificial Sequence

20 twenty
<220> <223> Producto de la PCR de A. caviae <220> <223> PCR product of A. caviae

<210> 415 <210> 415

<211> 238 <211> 238

<212> PRT 30 <213> Aeromonas caviae <212> PRT 30 <213> Aeromonas caviae

<220> <220>

<221> CARACTERÍSTICA MISCELÁNEA <221> MISCELLANEOUS FEATURE

<222> (237)..(237) 35 <223> Xaa puede ser Phe, Gln, Asn o Lys <222> (237) .. (237) 35 <223> Xaa can be Phe, Gln, Asn or Lys

<400> 415 <400> 415

<210> 416 <210> 416

<211> 1227 <211> 1227

<212> ADN <212> DNA

<213> Aeromonas caviae <213> Aeromonas caviae

<400> 416 <400> 416

5 <210> 417 5 <210> 417

<211> 408 <211> 408

<212> PRT <212> PRT

<213> Aeromonas caviae <213> Aeromonas caviae

10 <400> 417 10 <400> 417

Claims (16)

REIVINDICACIONES 1.- Un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, sales de la misma y combinaciones de la misma en una vía de múltiples etapas, siendo los derivados de (R,R)-monatina compuestos de fórmula general (II): 1.- A method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, the derivatives being of (R, R) -monatin compounds of general formula (II): en donde Ra, Rb, Rc, Rd y Re representan cada uno independientemente cualquier sustituyente que se selecciona de un átomo de hidrógeno, un grupo hidroxilo, un grupo alquilo C1-C3, un grupo alcoxi C1-C3, un grupo amino o un átomo de halógeno, que se selecciona de un átomo de yodo, átomo de bromo, átomo de cloro o átomo de flúor, con la condición de que Ra, Rb, Rc, Rd, y Re no sean todos hidrógeno y en donde Rb yRc, y/o Rd yRe juntos forman un grupo alquileno C1-C4, wherein Ra, Rb, Rc, Rd and Re each independently represent any substituent that is selected from a hydrogen atom, a hydroxyl group, a C1-C3 alkyl group, a C1-C3 alkoxy group, an amino group or an atom of halogen, which is selected from an iodine atom, bromine atom, chlorine atom or fluorine atom, provided that Ra, Rb, Rc, Rd, and Re are not all hydrogen and where Rb and Rc, and / or Rd and Re together form a C1-C4 alkylene group, en donde where una reacción en la vía es facilitada por un polipéptido que se selecciona de un polipéptido aislado o recombinante que comprende la secuencia de aminoácidos de SEQ ID NO:276 o fragmentos o subsecuencias de la misma que tienen actividad de aldolasa. a pathway reaction is facilitated by a polypeptide that is selected from an isolated or recombinant polypeptide comprising the amino acid sequence of SEQ ID NO: 276 or fragments or subsequences thereof that have aldolase activity. 2.- El método de la reivindicación 1, en donde una reacción en la vía de múltiples etapas es facilitada, además, por uno o más polipéptidos que se seleccionan de polipéptidos aislados o recombinantes que comprenden la secuencia de aminoácidos de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO: 110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:278, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 o fragmentos o subsecuencias de los mismos que tienen actividad de aldolasa. 2. The method of claim 1, wherein a multi-stage pathway reaction is further facilitated by one or more polypeptides that are selected from isolated or recombinant polypeptides comprising the amino acid sequence of SEQ ID NO: 2 , SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO : 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52 , SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO : 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 104, SEQ ID NO: 106 , SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ I D NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO : 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 278, SEQ ID NO: 282, SEQ ID NO: 284 , SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO : 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334 or fragments or subsequences thereof that have aldolase activity. 3.- El método de la reivindicación 1, en donde una o más etapas en dicha vía de múltiples etapas es una etapa química. 3. The method of claim 1, wherein one or more stages in said multi-stage pathway is a chemical stage. 4.- El método de la reivindicación 1, en donde la reacción es una reaccion entre indol-3-piruvato y una fuente de carbono C3. 4. The method of claim 1, wherein the reaction is a reaction between indole-3-pyruvate and a C3 carbon source. 5.- El método de la reivindicación 4, en donde el o los polipéptidos se seleccionan de polipéptidos que comprenden la secuencia de aminoácidos de SEQ ID NO:4, SEQ ID NO:8, SEQ ID NO: 12, SEQ ID NO:28, SEQ ID NO:36, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:50, SEQ ID NO:54, SEQ ID NO:58, SEQ ID NO:64, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:80, SEQ ID NO:88, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 112, SEQ ID NO: 116, SEQ ID NO: 122, SEQ ID NO: 126, SEQ ID NO: 130, SEQ ID NO: 134, SEQ ID NO:142, SEQ ID NO:148, SEQ ID NO:156, SEQ ID NO:162, SEQ ID NO:166, SEQ ID NO: 168, SEQ ID NO: 172, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO:200, SEQ ID NO:218, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:244, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:264, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:278, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:298, SEQ ID NO:300 o SEQ ID NO:304 5. The method of claim 4, wherein the polypeptide (s) are selected from polypeptides comprising the amino acid sequence of SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 12, SEQ ID NO: 28 , SEQ ID NO: 36, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 50, SEQ ID NO: 54, SEQ ID NO: 58, SEQ ID NO: 64, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 80, SEQ ID NO: 88, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 106, SEQ ID NO : 108, SEQ ID NO: 112, SEQ ID NO: 116, SEQ ID NO: 122, SEQ ID NO: 126, SEQ ID NO: 130, SEQ ID NO: 134, SEQ ID NO: 142, SEQ ID NO: 148 , SEQ ID NO: 156, SEQ ID NO: 162, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 172, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO: 200, SEQ ID NO: 218, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO : 238, SEQ ID NO: 240, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272 , SEQ ID NO: 278, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 298, SEQ ID NO: 300 or SEQ ID NO: 304 6.- El método de la reivindicación 4, en donde la reacción produce ácido R-2-hidroxi-2-(indol-3-il-metil)-4cetoglutárico en lugar de ácido S-2-hidroxi-2-(indol-3-il-metil)-4-cetoglutárico. 6. The method of claim 4, wherein the reaction produces R-2-hydroxy-2- (indole-3-yl-methyl) -4-ketoglutaric acid instead of S-2-hydroxy-2- (indole- 3-yl-methyl) -4-ketoglutaric. 7.- El método de la reivindicación 6, en donde el o los polipéptidos se seleccionan de polipéptidos que comprenden la secuencia de aminoácidos de SEQ ID NO:28, SEQ ID NO:116, SEQ ID NO:298, SEQ ID NO:44, SEQ ID NO:54, SEQ ID NO:148, SEQ ID NO:46, SEQ ID NO: 134, SEQ ID NO: 142, SEQ ID NO: 122, SEQ ID NO:74, SEQ ID NO:64, SEQ ID NO: 108, SEQ ID NO:96, SEQ ID NO: 126, SEQ ID NO:80, SEQ ID NO:36, SEQ ID NO:62, SEQ ID NO: 112, SEQ ID NO: 130, SEQ ID NO:94, SEQ ID NO:58, SEQ ID NO:50, SEQ ID NO: 106, SEQ ID NO:42, SEQ ID NO:278, SEQ ID NO: 162, SEQ ID NO: 178, SEQ ID NO: 166, SEQ ID NO:218, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:244, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:264, SEQ ID NO:268, SEQ ID NO:272, SEQ ID NO: 184, SEQ ID NO:282, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO:200, SEQ ID NO:284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO:228, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240 o SEQ ID NO:156. 7. The method of claim 6, wherein the polypeptide (s) are selected from polypeptides comprising the amino acid sequence of SEQ ID NO: 28, SEQ ID NO: 116, SEQ ID NO: 298, SEQ ID NO: 44 , SEQ ID NO: 54, SEQ ID NO: 148, SEQ ID NO: 46, SEQ ID NO: 134, SEQ ID NO: 142, SEQ ID NO: 122, SEQ ID NO: 74, SEQ ID NO: 64, SEQ ID NO: 108, SEQ ID NO: 96, SEQ ID NO: 126, SEQ ID NO: 80, SEQ ID NO: 36, SEQ ID NO: 62, SEQ ID NO: 112, SEQ ID NO: 130, SEQ ID NO : 94, SEQ ID NO: 58, SEQ ID NO: 50, SEQ ID NO: 106, SEQ ID NO: 42, SEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 178, SEQ ID NO: 166 , SEQ ID NO: 218, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO: 200, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO : 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240 or SEQ ID NO: 156. 8.- El método de la reivindicación 1, en donde el producto se selecciona de (R,R)-monatina, sales de la misma y combinaciones de la misma. 8. The method of claim 1, wherein the product is selected from (R, R) -monatin, salts thereof, and combinations thereof. 9.- El método de la reivindicación 1, en donde la reacción facilitada por dicho polipéptido o polipéptidos se lleva a cabo en 1,0 a 10,0 mM de MgCl2 o a pH 7,0 hasta pH 11,5 o en 0,005% a 1% de detergente polisorbato. 9. The method of claim 1, wherein the reaction facilitated by said polypeptide or polypeptides is carried out in 1.0 to 10.0 mM MgCl2 or pH 7.0 to pH 11.5 or 0.005% at 1% polysorbate detergent. 10.- El método de la reivindicación 7, en donde la (R,R)-monatina se produce en cantidades mayores que la (S,S)monatina, (S,R)-monatina o (R,S)-monatina. 10. The method of claim 7, wherein (R, R) -monatin is produced in larger amounts than (S, S) monatin, (S, R) -monatin or (R, S) -monatin. 11.- El método de la reivindicación 1, en donde los fragmentos o subsecuencias de la misma tienen una actividad de aldolasa de al menos 0,2 mg MP/mg proteína/h. 11. The method of claim 1, wherein the fragments or subsequences thereof have an aldolase activity of at least 0.2 mg MP / mg protein / h. 12.- Un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, sales de la misma y combinaciones de la misma en una vía de múltiples etapas, siendo los derivados de (R,R)monatina compuestos de fórmula general (II): 12.- A method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, the derivatives being of (R, R) monatin compounds of general formula (II): en donde Ra, Rb, Rc, Rd y Re representan cada uno independientemente cualquier sustituyente que se selecciona de un átomo de hidrógeno, un grupo hidroxilo, un grupo alquilo C1-C3, un grupo alcoxi C1-C3, un grupo amino o un átomo de halógeno, que se selecciona de un átomo de yodo, átomo de bromo, átomo de cloro o átomo de flúor, con la condición de que Ra, Rb, Rc, Rd, y Re no sean todos hidrógeno y en donde Rb yRc, y/o Rd yRe juntos forman un grupo alquileno C1-C4, wherein Ra, Rb, Rc, Rd and Re each independently represent any substituent that is selected from a hydrogen atom, a hydroxyl group, a C1-C3 alkyl group, a C1-C3 alkoxy group, an amino group or an atom of halogen, which is selected from an iodine atom, bromine atom, chlorine atom or fluorine atom, provided that Ra, Rb, Rc, Rd, and Re are not all hydrogen and where Rb and Rc, and / or Rd and Re together form a C1-C4 alkylene group, en donde where una reacción en la vía es facilitada por un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que tiene un porcentaje de identidad de secuencia de al menos 95% con respecto a SEQ ID NO:275. a pathway reaction is facilitated by a nucleic acid sequence encoded polypeptide comprising a sequence having a percent sequence identity of at least 95% relative to SEQ ID NO: 275. 13.- El método de la reivindicación 12, en donde una reacción en una vía de múltiples etapas es facilitada, además, por al menos un polipéptido codificado por una secuencia de ácidos nucleicos que comprende una secuencia que tiene un porcentaje de identidad de secuencia de al menos 95% o más preferiblemente 100% con respecto a SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID NO:203, SEQ ID NO:205, SEQ ID NO:207, SEQ ID NO:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 o SEQ ID NO:338. 13. The method of claim 12, wherein a multi-stage reaction is further facilitated by at least one polypeptide encoded by a nucleic acid sequence comprising a sequence having a percent sequence identity of at least 95% or more preferably 100% with respect to SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, I KNOW THAT ID NO: 99, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO : 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133 , SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO : 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183 , SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO : 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235 , SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 277, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 or SEQ ID NO: 338. 14.- Un método que comprende: producir un producto elegido de (R,R)-monatina, derivados de (R,R)-monatina, sales de la misma y combinaciones de la misma en una vía de múltiples etapas, siendo los derivados de (R,R)monatina compuestos de fórmula general (II): 14.- A method comprising: producing a chosen product of (R, R) -monatin, derivatives of (R, R) -monatin, salts thereof and combinations thereof in a multi-stage route, the derivatives being of (R, R) monatin compounds of general formula (II): en donde Ra, Rb, Rc, Rd y Re representan cada uno independientemente cualquier sustituyente que se selecciona de un átomo de hidrógeno, un grupo hidroxilo, un grupo alquilo C1-C3, un grupo alcoxi C1-C3, un grupo amino o un átomo de halógeno, que se selecciona de un átomo de yodo, átomo de bromo, átomo de cloro o átomo de flúor, con la condición de que Ra, Rb, Rc, Rd, y Re no sean todos hidrógeno y en donde Rb yRc, y/o Rd yRe juntos forman un grupo alquileno C1-C4, wherein Ra, Rb, Rc, Rd and Re each independently represent any substituent that is selected from a hydrogen atom, a hydroxyl group, a C1-C3 alkyl group, a C1-C3 alkoxy group, an amino group or an atom of halogen, which is selected from an iodine atom, bromine atom, chlorine atom or fluorine atom, provided that Ra, Rb, Rc, Rd, and Re are not all hydrogen and where Rb and Rc, and / or Rd and Re together form a C1-C4 alkylene group, en donde where una reacción en la vía es facilitada por un polipéptido codificado por una secuencia de ácidos nucleicos que tiene suficiente homología de secuencia como para permanecer hibridada en condiciones rigurosas a un ácido nucleico de SEQ ID NO:275, en donde las condiciones rigurosas no son menos rigurosas que lavar con NaCl 0,15M durante 15 minutos a 72°C. a pathway reaction is facilitated by a nucleic acid sequence encoded polypeptide that has sufficient sequence homology to remain hybridized under stringent conditions to a nucleic acid of SEQ ID NO: 275, where stringent conditions are no less stringent than wash with 0.15M NaCl for 15 minutes at 72 ° C. 15.- Un método que comprende: producir un producto elegido de ácido R-2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico, sales del mismo y combinaciones del mismo en una vía, en donde una reacción en la vía es facilitada por un polipéptido elegido de polipéptidos aislados o recombinantes que comprenden la secuencia de aminoácidos de SEQ ID NO:276 o fragmentos o subsecuencias de la misma que tienen actividad de aldolasa, en donde dicho ácido R-2hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico, sales del mismo y combinaciones del mismo se utilizan para preparar un producto edulcorante. 15.- A method comprising: producing a chosen product of R-2-hydroxy 2- (indole-3-ylmethyl) -4-ketoglutaric acid, salts thereof and combinations thereof in one way, wherein a reaction in the pathway is facilitated by a polypeptide chosen from isolated or recombinant polypeptides comprising the amino acid sequence of SEQ ID NO: 276 or fragments or subsequences thereof having aldolase activity, wherein said R-2-hydroxy acid 2- (indole-3 -ylmethyl) -4-ketoglutaric, salts thereof and combinations thereof are used to prepare a sweetening product. 16.- El método de la reivindicación 15, en donde una reacción en la vía es facilitada, además, por uno o más polipéptidos que se seleccionan de polipéptidos aislados o recombinantes que comprenden la secuencia de aminoácidos de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO: 110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:278, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 o SEQ ID NO:334 o fragmentos o subsecuencias de la misma que tienen actividad de aldolasa, en donde dicho ácido R-2-hidroxi 2-(indol-3-ilmetil)-4-cetoglutárico, sales del mismo y combinaciones del mismo se utiliza para preparar un producto edulcorante. 16. The method of claim 15, wherein a reaction in the pathway is further facilitated by one or more polypeptides that are selected from isolated or recombinant polypeptides comprising the amino acid sequence of SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114 , SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO : 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164 , SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO : 198, SEQ ID NO: 200, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216 , SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID N O: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 278, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 or SEQ ID NO: 334 or fragments or subsequences thereof having aldolase activity, wherein said R-2-hydroxy 2- (indole-3-ylmethyl) -4-ketoglutaric acid, salts thereof and combinations thereof is used to prepare a sweetening product. FIG. 15 FIG. fifteen
ES09009627T 2006-03-07 2007-03-07 Aldolases, nucleic acids that encode them and methods to produce and use them Active ES2416104T3 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US77946006P 2006-03-07 2006-03-07
US779460P 2006-03-07
US85300506P 2006-10-20 2006-10-20
US853005P 2006-10-20

Publications (1)

Publication Number Publication Date
ES2416104T3 true ES2416104T3 (en) 2013-07-30

Family

ID=38283673

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09009627T Active ES2416104T3 (en) 2006-03-07 2007-03-07 Aldolases, nucleic acids that encode them and methods to produce and use them

Country Status (10)

Country Link
US (3) US8043837B2 (en)
EP (4) EP2112227B1 (en)
JP (1) JP5441417B2 (en)
CN (1) CN101437954B (en)
AU (1) AU2007223913B2 (en)
BR (1) BRPI0708673A2 (en)
CA (1) CA2643416C (en)
ES (1) ES2416104T3 (en)
MX (1) MX2008011477A (en)
WO (1) WO2007103389A2 (en)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7297800B2 (en) * 2001-12-27 2007-11-20 Ajinomoto Co., Inc. Process of producing glutamate derivatives
US7572607B2 (en) * 2002-04-23 2009-08-11 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
US8372989B2 (en) 2002-04-23 2013-02-12 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
CA2484871C (en) 2002-08-26 2010-11-30 Ajinomoto Co., Inc. Novel aldolase and production process of substituted .alpha.-keto acids
EP2050821A3 (en) 2002-12-09 2009-05-13 Ajinomoto Co., Inc. Mutated D-aminotransferase and method for producing optically active glutamic acid derivatives using the same
KR20060061811A (en) * 2003-08-01 2006-06-08 카아길, 인코포레이팃드 Monatin tabletop sweetener compositions and methods of making same
ES2285521T3 (en) * 2003-08-14 2007-11-16 Cargill, Incorporated GUM COMPOSITIONS THAT INCLUDE MONATINA AND PROCEDURES FOR THE PREPARATION OF THE SAME.
EP1657985A1 (en) * 2003-08-25 2006-05-24 Cargill Inc. Beverage compositions comprising monatin and methods of making same
CN103555782B (en) * 2003-10-21 2017-04-12 嘉吉有限公司 Production of monatin and monatin precursors
US7024796B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and apparatus for manufacture of fertilizer products from manure and sewage
US7685737B2 (en) * 2004-07-19 2010-03-30 Earthrenew, Inc. Process and system for drying and heat treating materials
US20070084077A1 (en) * 2004-07-19 2007-04-19 Gorbell Brian N Control system for gas turbine in material treatment unit
US7024800B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and system for drying and heat treating materials
US8158389B2 (en) 2005-04-20 2012-04-17 Cargill, Incorporated Products and methods for in vivo secretion of monatin
RU2007142666A (en) 2005-04-20 2009-05-27 Карджилл, Инкорпорейтед (Us) PRODUCTS AND METHODS FOR SECRET MONATINA IN VIVO
US8076108B2 (en) 2005-04-26 2011-12-13 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US7582455B2 (en) * 2005-04-26 2009-09-01 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US20070163316A1 (en) * 2006-01-18 2007-07-19 Earthrenew Organics Ltd. High organic matter products and related systems for restoring organic matter and nutrients in soil
US7610692B2 (en) * 2006-01-18 2009-11-03 Earthrenew, Inc. Systems for prevention of HAP emissions and for efficient drying/dehydration processes
AU2007223913B2 (en) 2006-03-07 2013-06-13 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
US20090198072A1 (en) * 2006-05-24 2009-08-06 Cargill, Incorporated Methods and systems for increasing production of equilibrium reactions
JP2009538145A (en) * 2006-05-24 2009-11-05 カーギル・インコーポレイテッド Method and system for increasing the yield of an equilibrium reaction
CN101239941B (en) * 2007-02-08 2012-02-29 味之素株式会社 Process for producing optically active compound
US8367847B2 (en) 2007-10-01 2013-02-05 Cargill, Incorporated Production of monatin enantiomers
US8076107B2 (en) * 2007-10-01 2011-12-13 Cargill, Incorporated Production of monatin stereoisomers
US8003361B2 (en) * 2007-10-01 2011-08-23 Cargill Incorporated Production of monatin enantiomers
US8541220B2 (en) 2008-01-03 2013-09-24 Verenium Corporation Isomerases, nucleic acids encoding them and methods for making and using them
US8709772B2 (en) 2008-01-03 2014-04-29 Verenium Corporation Transferases and oxidoreductases, nucleic acids encoding them and methods for making and using them
CN102282156B (en) * 2008-11-19 2017-03-15 国家政治研究所高级研究中心(高级研究中心) Transgenic plants and fungi capable of metabolizing phosphite as a phosphorus source
WO2011082365A2 (en) * 2009-12-30 2011-07-07 Cargill, Incorporated Improved bioreactor performance in the production of monatin
US9523105B2 (en) 2010-08-30 2016-12-20 Arzeda Corporation Fermentation route for the production of levulinic acid, levulinate esters and valerolactone and derivatives thereof
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
WO2014194129A2 (en) * 2013-05-29 2014-12-04 Brigham Young University Cell-free synthetic incorporation of non-natural amino acids into proteins
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
EP3330380A1 (en) * 2016-12-05 2018-06-06 Evonik Degussa GmbH Process for producing l-methionine from methional
BR112020024296A2 (en) 2018-08-27 2021-03-09 Regeneron Pharmaceuticals, Inc. METHODS FOR THE PRODUCTION OF A CONCENTRATED PROTEIN PURIFICATION INTERMEDIATE, FOR MONITORING AND CONTROL OF CRITICAL QUALITY ATTRIBUTES IN A PROTEIN PURIFICATION INTERMEDIATE AND TO MONITOR AND CONTROL THE EXCIPIENT LEVELS IN THE CULTURE AND CULTURE FLUID FLUID. PROTEIN, AND, PROTEIN PURIFICATION INTERMEDIATE
CN109161483A (en) * 2018-09-14 2019-01-08 江苏品品鲜生物科技有限公司 A kind of pleurotus eryngii quel strains rejuvenation screening technique
WO2020117715A1 (en) 2018-12-03 2020-06-11 Board Of Regents, The University Of Texas System Oligo-benzamide analogs and their use in cancer treatment
BR112021021193A2 (en) 2019-04-25 2022-01-04 Zymochem Inc Production of chemicals from renewable sources
CN111595923B (en) * 2020-04-29 2023-05-30 中国石油天然气股份有限公司 A Method for Determining the Thermal Cracking Degree of Crude Oil Using Petroleum Omics
CN112156719B (en) * 2020-08-26 2022-02-22 夏文杰 Amphoteric glycolipid biosurfactant and preparation method thereof
CN113025602A (en) * 2021-03-18 2021-06-25 绵阳晟氏健康科技有限公司 Immobilized arginine racemase and preparation method and application thereof
CN116172186B (en) * 2023-01-31 2025-07-22 贵州大学 Application of konjak glucomannan in preparation of high internal phase Pickering emulsion

Family Cites Families (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3002889A (en) 1960-06-20 1961-10-03 Kyowa Hakko Kogyo Kk Method of producing l-glutamic acid
US3128237A (en) 1961-02-24 1964-04-07 Ajinomoto Kk Process for producing l-glutamic acid by bacterial fermentation
US3399114A (en) 1964-08-22 1968-08-27 Asahi Chemical Ind Process for producing l-glutamic acid by using bacteria
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4371614A (en) 1980-08-22 1983-02-01 Ajinomoto Co., Inc. E.Coli bacteria carrying recombinant plasmids and their use in the fermentative production of L-tryptophan
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
WO1986005803A1 (en) 1985-03-30 1986-10-09 Marc Ballivet Method for obtaining dna, rna, peptides, polypeptides or proteins by means of a dna recombinant technique
US5780292A (en) 1987-04-29 1998-07-14 Alko Group Ltd. Production of phytate degrading enzymes in trichoderma
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
GB2205834B (en) 1987-06-15 1990-10-31 South African Inventions 3-(1-amino-1,3-dicarboxy-3-hydroxy-but-4-yl)-indole compounds
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
WO1989011212A2 (en) 1989-08-30 1989-11-30 Wm. Wrigley Jr. Company Method of controlling release of cyclamate in chewing gum and gum produced thereby
US5589583A (en) 1990-01-11 1996-12-31 Monsanto Company Plant promoter
ATE104961T1 (en) 1990-01-19 1994-05-15 Technology Finance Corp PROCESS FOR THE PREPARATION OF 3-(1-AMINO-1,3DICARBOXY-3-HYDROXY-BUT-4-YL)-INDOLE.
AU7791991A (en) 1990-04-24 1991-11-11 Stratagene Methods for phenotype creation from multiple gene populations
AU646877B2 (en) 1990-06-15 1994-03-10 Scios Nova Inc. Transgenic non-human mammal displaying the amyloid-forming pathology of alzheimer's disease
DE69132124T2 (en) 1990-11-23 2000-11-23 Aventis Cropscience N.V., Gent METHOD FOR TRANSFORMING MONOCOTYLED PLANTS
DE69131017T2 (en) 1990-12-20 1999-07-15 Ixsys, Inc., San Diego, Calif. OPTIMIZATION OF BINDING PROTEINS
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
CN1024903C (en) * 1991-06-07 1994-06-08 中国石油化工总公司 Nickel-sodium-sulfur/alumina catalyst for selective hydrogenation of diolefin to mono-olefin
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JPH05236997A (en) 1992-02-28 1993-09-17 Hitachi Ltd Polynucleotide capture chip
CA2127807A1 (en) 1992-11-20 1994-06-09 John Maliyakal Transgenic cotton plants producing heterologous bioplastic
US6264999B1 (en) 1993-09-30 2001-07-24 Wm. Wrigley Jr. Company Chewing gum containing erythritol and method of making
WO1995008914A1 (en) 1993-09-30 1995-04-06 Agracetus, Inc. Transgenic cotton plants producing heterologous peroxidase
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
JP3698742B2 (en) 1994-03-01 2005-09-21 協和醗酵工業株式会社 Process for producing optically active 4-hydroxy-2-ketoglutaric acid
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
EP0750671A1 (en) 1994-03-09 1997-01-02 Abbott Laboratories Transgenic animals producing oligosaccharides and glycoconjugates
NZ279676A (en) 1994-03-09 1998-04-27 Abbott Lab Humanized milk produced by non-human transgenic mammal transformed with a heterologous gene coding for human enzyme producing human oligosaccharides and glycoconjugates
US5750870A (en) 1994-06-17 1998-05-12 Agritope, Inc. Plant genetic transformation methods and transgenic plants
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
CA2198451A1 (en) 1994-09-01 1996-03-07 Gurparkash Singh Transgenic animal expressing a familial form of human amyloid precursor protein
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US5633440A (en) 1994-12-20 1997-05-27 Dna Plant Technology Corporation P119 promoters and their uses
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
CA2209617C (en) 1995-01-26 2002-05-28 Novo Nordisk A/S Animal feed additives comprising xylanase
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
JPH10510433A (en) 1995-06-06 1998-10-13 アイシス・ファーマシューティカルス・インコーポレーテッド Oligonucleotides with high chiral purity phosphorothioate linkages
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
US5962258A (en) 1995-08-23 1999-10-05 Diversa Corporation Carboxymethyl cellulase fromthermotoga maritima
US5721118A (en) 1995-10-31 1998-02-24 The Regents Of The University Of California, San Diego Mammalian artificial chromosomes and methods of using same
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6740506B2 (en) 1995-12-07 2004-05-25 Diversa Corporation End selection in directed evolution
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US20030215798A1 (en) 1997-06-16 2003-11-20 Diversa Corporation High throughput fluorescence-based screening for novel enzymes
US6358709B1 (en) 1995-12-07 2002-03-19 Diversa Corporation End selection in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US5697987A (en) 1996-05-10 1997-12-16 The Trustees Of Princeton University Alternative fuel
WO1997046313A1 (en) 1996-06-07 1997-12-11 Eos Biotechnology, Inc. Immobilised linear oligonucleotide arrays
US5728555A (en) 1996-09-30 1998-03-17 Monsanto Company Preparation of d-amino acids by direct fermentative means
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
CA2276064C (en) 1997-01-17 2013-12-17 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
WO1998041622A1 (en) 1997-03-18 1998-09-24 Novo Nordisk A/S Method for constructing a library using dna shuffling
CA2284253A1 (en) 1997-03-18 1998-09-24 Jesper Vind An in vitro method for construction of a dna library
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6333181B1 (en) 1997-04-07 2001-12-25 University Of Florida Research Foundation, Inc. Ethanol production from lignocellulose
CA2234412C (en) 1997-06-09 2008-09-02 Kyowa Hakko Kogyo Co., Ltd. Method for producing optically active compound
US5916780A (en) 1997-06-09 1999-06-29 Iogen Corporation Pretreatment process for conversion of cellulose to fuel ethanol
US7019827B2 (en) 1997-06-16 2006-03-28 Diversa Corporation GigaMatrix holding tray having through-hole wells
AUPO758297A0 (en) 1997-06-27 1997-07-24 Rowe, James Baber Control of acidic gut syndrome
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
EP1012335A4 (en) 1997-08-15 2004-06-09 Hyseq Inc Methods and compositions for detection or quantification of nucleic acid species
PT1012564E (en) 1997-09-11 2003-08-29 Bioventures Inc METHOD OF PRODUCTION OF HIGH DENSITY ARRANGEMENTS
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6399383B1 (en) 1997-10-28 2002-06-04 Maxygen, Inc. Human papilloma virus vectors
EP1030861A4 (en) 1997-10-31 2001-09-05 Maxygen Inc Modification of virus tropism and host range by viral genome shuffling
EP0921189B1 (en) 1997-11-14 2005-01-12 Sankyo Company Limited Transgenic animal allergy models and methods for their use
EP1036198B1 (en) 1997-12-08 2012-09-26 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
EP1054973A1 (en) 1998-02-11 2000-11-29 Maxygen, Inc. Antigen library immunization
MXPA00007893A (en) 1998-02-11 2002-10-23 Maxygen Inc Targeting of genetic vaccine vectors.
US6537749B2 (en) 1998-04-03 2003-03-25 Phylos, Inc. Addressable protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
WO2000000632A1 (en) 1998-06-29 2000-01-06 Phylos, Inc. Methods for generating highly diverse libraries
FR2782323B1 (en) 1998-08-12 2002-01-11 Proteus PROCESS FOR THE IN VITRO PRODUCTION OF RECOMBINANT POLYNUCLEOTIDE SEQUENCES, SEQUENCE BANKS AND SEQUENCES THUS OBTAINED
GB2340755B (en) 1998-08-24 2002-09-25 Cannon Rubber Ltd Breast pump insert
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1108781A3 (en) 1999-01-19 2001-09-12 Maxygen, Inc. Method for making character strings, polynucleotides and polypeptides
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
WO2000067796A1 (en) 1999-05-07 2000-11-16 Genentech, Inc. Treatment of autoimmune diseases with antagonists which bind to b cell surface markers
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
US20010008765A1 (en) 1999-12-06 2001-07-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
ES2166316B1 (en) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat PROCEDURE FOR THE PRODUCTION OF ETHANOL FROM LIGNOCELLULOSIC BIOMASS USING A NEW THERMOTOLERING YEAST.
WO2001096551A2 (en) 2000-06-14 2001-12-20 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US6423145B1 (en) 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
WO2002014261A2 (en) 2000-08-10 2002-02-21 Eli Lilly And Company 4-substituted d-glutamic acid derivatives for use as antibiotic
JP2002060382A (en) 2000-08-22 2002-02-26 Ajinomoto Co Inc Stereoisomer of monatin and use thereof, method for producing monatins and intermediate therefor
WO2002029032A2 (en) 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
IL150020A0 (en) 2000-10-10 2002-12-01 Diversa Corp High throughput or capillary-based screening for a bioactivity or biomolecule
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
EP1347770A4 (en) 2000-11-30 2005-10-19 Diversa Corp Method of making a protein polymer and uses of the polymer
US20060019913A1 (en) 2001-05-18 2006-01-26 Sirna Therapeutics, Inc. RNA interference mediated inhibtion of protein tyrosine phosphatase-1B (PTP-1B) gene expression using short interfering nucleic acid (siNA)
EP1446495A4 (en) 2001-10-01 2006-06-07 Diversa Corp Whole cell engineering using real-time metabolic flux analysis
JP2003171365A (en) 2001-11-30 2003-06-20 Ajinomoto Co Inc Method for producing monatin compound, its production intermediate, and new intermediate
RU2303030C2 (en) 2001-11-30 2007-07-20 Адзиномото Ко., Инк. Monatine non-natural stereoisomer salt crystals and their using
CN101671707A (en) 2001-12-27 2010-03-17 味之素株式会社 Process for producing glutamate derivatives
US7297800B2 (en) 2001-12-27 2007-11-20 Ajinomoto Co., Inc. Process of producing glutamate derivatives
WO2003059865A1 (en) 2001-12-27 2003-07-24 Ajinomoto Co., Inc. Processes for the preparation of glutamic acid compounds and intermediates thereof and novel intermediates used in the processes
JP2003292484A (en) 2002-04-01 2003-10-15 Ajinomoto Co Inc METHOD FOR PRODUCING gamma-HYDROXYAMINO ACID DERIVATIVE AND MONATINS
US8372989B2 (en) 2002-04-23 2013-02-12 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
EA009284B1 (en) 2002-04-23 2007-12-28 Каргилл, Инкорпорейтед Polypeptides and biosynthetic pathways
US7572607B2 (en) 2002-04-23 2009-08-11 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
CA2484871C (en) 2002-08-26 2010-11-30 Ajinomoto Co., Inc. Novel aldolase and production process of substituted .alpha.-keto acids
EP2050821A3 (en) 2002-12-09 2009-05-13 Ajinomoto Co., Inc. Mutated D-aminotransferase and method for producing optically active glutamic acid derivatives using the same
US6776979B2 (en) 2002-12-30 2004-08-17 Marvin B. Frager Periodontal treatment compound and method of use
CA2512752C (en) 2003-01-09 2012-05-29 Ajinomoto Co., Inc. Process for manufacturing a glutamic acid derivative and a pyroglutamic acid derivative and a novel intermediate in the manufacture thereof
JP4239600B2 (en) 2003-01-24 2009-03-18 味の素株式会社 Method for producing 2R-monatin
WO2004085624A2 (en) 2003-03-24 2004-10-07 Diversa Corporation Transaminases, deaminases and aminomutases and compositions and methods for enzymatic detoxification
JP2004331650A (en) 2003-04-14 2004-11-25 Kanazawa Univ Tlo Inc Manufacturing method of monatins
JP2004331644A (en) 2003-04-14 2004-11-25 Kanazawa Univ Tlo Inc Manufacturing method of monatins
JP4760375B2 (en) 2003-06-26 2011-08-31 味の素株式会社 Method for recovering IHOG and method for producing monatin
KR20060061811A (en) 2003-08-01 2006-06-08 카아길, 인코포레이팃드 Monatin tabletop sweetener compositions and methods of making same
ES2285521T3 (en) 2003-08-14 2007-11-16 Cargill, Incorporated GUM COMPOSITIONS THAT INCLUDE MONATINA AND PROCEDURES FOR THE PREPARATION OF THE SAME.
EP1657985A1 (en) 2003-08-25 2006-05-24 Cargill Inc. Beverage compositions comprising monatin and methods of making same
CN103555782B (en) * 2003-10-21 2017-04-12 嘉吉有限公司 Production of monatin and monatin precursors
JP4500977B2 (en) 2003-11-05 2010-07-14 味の素株式会社 Novel amino acid derivatives and sweeteners
JP5113978B2 (en) 2003-11-21 2013-01-09 味の素株式会社 Organic amine salt of glutamic acid derivative and use thereof
RU2351587C2 (en) 2004-02-27 2009-04-10 Адзиномото Ко., Инк. Method of monatin production
JP4604524B2 (en) 2004-03-16 2011-01-05 味の素株式会社 Mutant aldolase, and optically active IHOG and optically active monatin production method using the same
JP4604537B2 (en) 2004-03-31 2011-01-05 味の素株式会社 L-cysteine producing bacterium and method for producing L-cysteine
US20060014260A1 (en) 2004-05-07 2006-01-19 Zhiliang Fan Lower cellulase requirements for biomass cellulose hydrolysis and fermentation
US20060030003A1 (en) 2004-05-12 2006-02-09 Simon Michael R Composition and method for introduction of RNA interference sequences into targeted cells and tissues
US7338763B2 (en) 2004-06-02 2008-03-04 Eppendorf Array Technologies S.A. Method and kit for the detection and/or quantification of homologous nucleotide sequences on arrays
US7935377B2 (en) 2004-06-04 2011-05-03 Ajinomoto Co., Inc. Crystals of free (2R, 4R)-monatin and use thereof
US7799565B2 (en) 2004-06-07 2010-09-21 Protiva Biotherapeutics, Inc. Lipid encapsulated interfering RNA
CA2506247C (en) 2004-06-07 2012-02-21 Ajinomoto Co., Inc. Novel aldolase, and method for producing optically active ihog and monatin
US7635563B2 (en) 2004-06-30 2009-12-22 Massachusetts Institute Of Technology High throughput methods relating to microRNA expression analysis
KR101216575B1 (en) 2004-07-14 2012-12-31 아지노모토 가부시키가이샤 Crystal of (2R,4R)-monatin potassium salt and sweetener composition containing same
US20060019258A1 (en) 2004-07-20 2006-01-26 Illumina, Inc. Methods and compositions for detection of small interfering RNA and micro-RNA
JP2007284349A (en) 2004-07-27 2007-11-01 Ajinomoto Co Inc Method for producing monatin or salt thereof
WO2006038520A1 (en) 2004-10-05 2006-04-13 Ajinomoto Co., Inc. Process for producing amino acid derivative from hydroxyimino acid
JP4858171B2 (en) 2004-10-15 2012-01-18 味の素株式会社 Sweetener composition
WO2006093322A2 (en) 2005-03-03 2006-09-08 Ajinomoto Co., Inc. Method for manufacturing 4-hydroxy-l-isoleucine or a salt thereof
US8158389B2 (en) 2005-04-20 2012-04-17 Cargill, Incorporated Products and methods for in vivo secretion of monatin
RU2007142666A (en) 2005-04-20 2009-05-27 Карджилл, Инкорпорейтед (Us) PRODUCTS AND METHODS FOR SECRET MONATINA IN VIVO
US8076108B2 (en) * 2005-04-26 2011-12-13 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
WO2007133184A2 (en) 2005-04-26 2007-11-22 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US7582455B2 (en) 2005-04-26 2009-09-01 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
AU2007223913B2 (en) 2006-03-07 2013-06-13 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
EP2388316A3 (en) 2006-03-07 2012-03-14 Verenium Corporation Aldolases, nucleic acids encoding them and methods for making and using them
RU2338784C2 (en) 2006-03-24 2008-11-20 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) New aldolase, dna coding aldlase, cells transformed by dna, method of aldolase obtaining and method of obtaining of 4-hydroxy-l-isoleucine (versions)
US20090198072A1 (en) 2006-05-24 2009-08-06 Cargill, Incorporated Methods and systems for increasing production of equilibrium reactions
JP2009538145A (en) * 2006-05-24 2009-11-05 カーギル・インコーポレイテッド Method and system for increasing the yield of an equilibrium reaction
US7354746B1 (en) 2006-12-11 2008-04-08 Ajinomoto Co., Inc. Method for producing optically active IHOG and monatin
CN101239941B (en) 2007-02-08 2012-02-29 味之素株式会社 Process for producing optically active compound
US8076107B2 (en) 2007-10-01 2011-12-13 Cargill, Incorporated Production of monatin stereoisomers
US8003361B2 (en) 2007-10-01 2011-08-23 Cargill Incorporated Production of monatin enantiomers
US8367847B2 (en) 2007-10-01 2013-02-05 Cargill, Incorporated Production of monatin enantiomers
WO2011002469A1 (en) 2009-07-02 2011-01-06 Cargill, Incorporated Isomerases and epimerases and methods of using
CA2726928A1 (en) 2008-01-03 2009-07-16 Cargill, Incorporated Aminotransferase and oxidoreductase nucleic acids and polypeptides and methods of using
CA2754908A1 (en) 2009-03-12 2010-09-16 Cargill, Incorporated Compositions comprising monatin and calcium
JP2012527897A (en) 2009-05-28 2012-11-12 カーギル・インコーポレイテッド Monatin sweetened beverage that can be stored at room temperature for a long time
US20120264948A1 (en) 2009-12-30 2012-10-18 Cargill, Incorporated Membrane separation and purification of monatin
WO2011082365A2 (en) 2009-12-30 2011-07-07 Cargill, Incorporated Improved bioreactor performance in the production of monatin
EP2519406A4 (en) 2009-12-30 2014-03-26 Cargill Inc A polymer and methods of preparing and using a polymer
WO2011082353A1 (en) 2009-12-30 2011-07-07 Cargill, Incorporated Separation and purification of monatin
JP6449266B2 (en) 2013-06-21 2019-01-09 バイオ−ラッド・ラボラトリーズ・インコーポレーテッド Microfluidic system with fluid pickup

Also Published As

Publication number Publication date
WO2007103389A9 (en) 2007-11-01
EP2112227B1 (en) 2013-05-15
AU2007223913B2 (en) 2013-06-13
US20120009634A1 (en) 2012-01-12
CN101437954B (en) 2015-09-09
JP2009528842A (en) 2009-08-13
EP2316962A1 (en) 2011-05-04
EP2316962B1 (en) 2014-07-09
US20080020435A1 (en) 2008-01-24
CN101437954A (en) 2009-05-20
WO2007103389A2 (en) 2007-09-13
MX2008011477A (en) 2008-09-23
WO2007103389A3 (en) 2008-01-03
BRPI0708673A2 (en) 2011-06-07
EP2112227A1 (en) 2009-10-28
EP2322643B1 (en) 2014-07-09
US20150111260A1 (en) 2015-04-23
CA2643416C (en) 2016-07-26
US9518280B2 (en) 2016-12-13
CA2643416A1 (en) 2007-09-13
JP5441417B2 (en) 2014-03-12
EP1994161A2 (en) 2008-11-26
EP2322643A1 (en) 2011-05-18
AU2007223913A1 (en) 2007-09-13
US9005938B2 (en) 2015-04-14
US8043837B2 (en) 2011-10-25

Similar Documents

Publication Publication Date Title
ES2416104T3 (en) Aldolases, nucleic acids that encode them and methods to produce and use them
ES2383767T3 (en) Aldolases, nucleic acids that encode them and methods to produce and use them
AU2016201456A1 (en) Aldolases, nucleic acids encoding them and methods for making and using them
AU2013251189A1 (en) Aldolases, nucleic acids encoding them and methods for making and using them