MXPA02010012A - Celulosa sintetasas de maiz y usos de las mismas. - Google Patents
Celulosa sintetasas de maiz y usos de las mismas.Info
- Publication number
- MXPA02010012A MXPA02010012A MXPA02010012A MXPA02010012A MXPA02010012A MX PA02010012 A MXPA02010012 A MX PA02010012A MX PA02010012 A MXPA02010012 A MX PA02010012A MX PA02010012 A MXPA02010012 A MX PA02010012A MX PA02010012 A MXPA02010012 A MX PA02010012A
- Authority
- MX
- Mexico
- Prior art keywords
- plant
- polynucleotide
- sequence
- present
- nucleic acid
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
- C12N9/1059—Cellulose synthases (2.4.1.12; 2.4.1.29)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
- C12N15/8246—Non-starch polysaccharides, e.g. cellulose, fructans, levans
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Nutrition Science (AREA)
- Medicinal Chemistry (AREA)
- Botany (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
Abstract
La invencion proporciona acidos nucleicos celulosa sintetasa aislados y sus proteinas codificadas. La presente invencion proporciona los metodos y composiciones relacionados para alterar los niveles de celulosa sintetasa en las plantas. La invencion proporciona ademas los cassettes de expresion recombinantee, celulas huesped, plantas transgenicas, y composiciones de anticuerpo.
Description
CELULOSA SINTETASAS DE MAÍZ Y USOS DE LAS MISMAS
CAMPO TÉCNICO La presente invención generalmente se relaciona con la biología molecular de las plantas. Más específicamente, se relaciona con los ácidos nucleicos y métodos para modular su expresión en las plantas. ANTECEDENTES DE LA INVENCIÓN Los polisacáridos constituyen el volumen de las paredes celulares de la planta y han sido tradicionalmente clasificados en tres categorías: celulosa, hemicelulosa, y pectina. Fry, S. C. (1988), The growing plant cell wall: Chemical and metabolic analysis, New York, : Longman Scientific & Technical. Considerando que la celulosa está hecha en la membrana del plasma y directamente extendida en la pared celular, polímeros hemicelulosicos y pecticos son primero hechos en el aparato de Golgi y entonces exportados a la pared celular por exocitosis. Ray, P. M: ; et al . , (1976)
Ber. Deutsch. Bot. Ges, Bd. 89, 121-146. La variedad de uniones químicas en los polisacáridos hemicelulosicos y pecticos indican que debe haber decenas de sintasas del polisacárido en el aparato de Golgi. Darvill et al . , (1980)
The primary cells walls of flowering plants . In The Plant Cell (N. E. Tolbert, ed. ), Vol. 1 en la Serie: The biochemistry of plants : Un tratado comprensivo, eds. P. K. Stumpf y E.E. Conn (Nueva York: Academic Press), pp. 91-162.
Se ha encontrado, que la f íerza de doblado del tallo de mutantes normales y mutantes de tallo quebradizo de cebada, esta directamente correlacionada con la concentración de celulosa en la pared celular Kokubo, et al . , (1989), Plant
Physiology 91, 876-882; Kokubo, et al., (1991) Plant Physiology 97, 509-514. Como la composición del tallo contribuye a numerosos factores de calidad importante en el engendrando del maíz, lo que' se necesipa en el arte son productos y métodos para la manipulación de la concentración de celulosa en la pared celular y la calijdad del tallo de la planta y por eso alterando la calidad del tallo de la planta para proporcionar, por ejemplo, un aumento en la habilidad para mantenerse erguido o mejorando la conservación del forraje en el silo. La presente invención proporciona éstas y otras ventajas . SUMARIO DE LA INVENCIÓN Generalmente, es el objeto de la presente invención el de proporcionar ácidos nucleicos y proteínas que se relacionan con las celulosa sintetasas. Es un objeto de la presente invención proporcionar plantas transgenicas que comprenden ácidos nucleicos de la presente invención, y métodos para la modulación, en una planta transgenica, la expresión de los ácidos nucleicos de la presente invención Por consiguiente, en un aspecto la presente
invención relacionada con el aislamiento de un ácido nucleico que comprende a un miembro seleccionado del grupo que consiste (a) un polinucleótddo que tiene una identidad de secuencia especifica a un polinucleótido codificando un polipéptido de la presente invención; (b) un polinucleótido que es complementario del pclinucleótido de (a) ; y, (c) un polinucleótido que compren e un número especificado de nucleótidos contiguos de un polinucleótido de (a) o (b) . El ácido nucleico aislado puede ser ADN. En otros aspectos la presente invención se relaciona con: 1) los cassettes de expresión recombinante, que comprenden un ácido nucleico de la presente invención operablemente unido a un prcmotor, 2) una célula huésped en que se ha introducido el cassette de expresión recombinante, y 3) una planta transgenica que comprende el cassette de expresión recombinante. La célula huésped y planta son opcionalmente de maíz, trigo, arroz, o soja. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Apreciación global A. Ácidos nucleicos y proteína de la presente invención A menos que por otra parte se declare lo contrario, las secuencias de polinucleótido de polipéptido identificadas en la Tabla 1 representan polinucleótidos y polipéptidos de la presente invención. La Tabla 1 es una referencia cruzada de estos polinucleótidos y polipéptidos
para su nombre de gen y el r.úmero de identificación de base de datos interno. Un ácido nucleico de la presente invención comprende un polinucleótido de ia presente invención. Una proteína de la presente invención comprende un polipéptido de la presente invención. Tabla 2 proporciona un cálculo del por ciento de identidad/similaridad de las secuencias referenciadas de polinucleótido/polipéptido pera identificar homólogos usando métodos tales como el descubierto en el Ejemplo 4. TABLA 1 Base de datos, Polinucleótido Polipéptido
Nombre de gen ID NO: SEQ ID NO: SEQ ID NO:
Celulosa sintetasa Cdpgs 5 (cesA-3 Celulosa sintetasa Cqrael9(cesA-9,
B. Utilidad ejemplar de la presente invención La presente invención proporciona utilidad en tales aplicaciones ejemplares como la mejora de calidad del tallo para mejorar la posición o ensilaje(forraje conservado en silo) . Más allá, la preisente invención mantiene una concentración aumentada de, celulosa en el pericarpio, mientras endureciendo el grano y así mejorando su habilidad en el manejo.
Definiciones Pueden denotarse un'idades, prefijos, y símbolos en su forma SI aceptada. A menos que por otra parte se indique lo contrario, los ácidos nuc eicos son escritos de izquierda a derecha en orientación 5 ' a 3 ' ; las secuencias de aminoácidos son escritas de izquierda a derecha en orientación amino a carboxi, respectivamente. Rangos numéricos recitados dentro de la especificación son inclusivos de los números qae definen el rango e incluyen cada entero dentro del rango definido. Los aminoácidos pueden ser referidos aquí dentro por cada uno de sus tres símbolos de la carta conocidos normalmente o por los símbolos de la carta-uno recomendados por la IUPAC-IUBMB Comisión de Nomenclatura de Nucleótidos, igualmente, pueden ser referidos por sus códigos comúnmente aceptados de la carta-simple. A menos que por otra parte se proporcione, software, eléctrico, y términos electrónicos son usados aquí como se definen en
The New IEEE Standard Dictionary of Electrical and
Electronics Terms (5h edition, 1993) . Los términos definidos debajo son definidos más totalmente en conjunto por referencia a la especificación. Títulos de la sección proporcionados a lo largo de la especificación no son limitaciones a los varios objetos y modalidades de la presente invención. Por "amplificado" se entiende la construcción de
copias múltiples de una secuencia de un ácido nucleico o múltiples copias complementarias a la secuencia del ácido nucleico usando por lo menos una de las secuencias del ácido nucleico como plantilla. Dos sistemas de amplificación incluyen los sistemas de reacción polimerasa en cadena (PCR) , reacción ligasa en cadena (LGR) , la secuencia acida nucleica basada en la amplificación (NASBA, Cangene, Mississauga, Ontario) , los sistemas Q- Beta Replicasa, sistemas de amplificación basado-transcripción (TAS) , y amplificación de desplazamiento de cuerda (SDA) . Vea, por ejemplo, Diagnostic Molecular Microbiology: Principies and Applications, D. H. el Persing et al . , Ed. , American Society for Microbiology, Washington, D.C. (1993) . El| producto de amplificación es llamado un amplicon. Como se usa aquí, la "orientación contrasentido" incluye la referencia a una secuencia del polinucleótido doble que es operablemente unida a un promotor en una orientación dónde la cuerda contrasentido se transcribe. La cuerda contrasentido es suficientemente complementaria a un producto de la transcripción endógena tal que esa traducción del producto de la transcripción endógena se inhibe a menudo. Por "codificando" o "poniendo en código", con respecto a un ácido nucleico especificado, significa comprendiendo la información para la traducción en la proteína especificada. Un ácido nucleico codificando una
proteína puede comprender las secuencias no-traducidas (por ejemplo, intrones) dentro de las regiones traducidas del ácido nucleico, o puede faltar tales secuencias no-traducidas interviniendo (por ejemplo, como en el cDNA) . La información por que una proteína se pone en código es especificada por el uso de codones. Típicamente, la secuencia del aminoácido se pone en código por el ácido nucleico usando el código genético "universal, Sin embargo, variantes del código universal, como está presente en alguna planta, animal, y mitocondria fungal, la bacteria Mycoplasma capricolum, o el ciliado Macronucleus, puede usarse cuando el ácido nucleico se expresa en eso. Cuando el ácido nucleico es preparado o alterado sintéticamente, la ventaja puede aprovecharse de preferencia de codones conocidos del huésped intencional dónde el ácido nucleico será expresado. Por ejemplo, aunque pueden expresarse secuencias de ácidos nucleicos de la presente invención en plantas de especies monocotiledóneas dicotiledóneas, pueden modificarse las secuencias para responder a las preferencias del codon específicas y preferencias de contenido de GC de monocotiledóneas o dicotiledóneas como estas preferencias se han mostrado para diferir (Murray et al . , Nucí . Acids Res . 17: 477-498 (1989)). Así, el codon preferido del maíz para un aminoácido particular puede derivarse a partir de las
secuencias del gen conocidas del maíz. El uso de codon de maíz para 28 genes a partir de las plantas de maíz se lista en la tabla 4 de Murray et al . , supra. Como se usa aquí "La sucesión de cuerpo entero" en referencia a un polinucleótido especificado o su proteína puesta en código significa qie tiene la secuencia entera del aminoácido nativo (no-sintético) , endógeno, biológicamente (por ejemplo, estructuralm=nte o catalíticamente) forma activa de la proteína especificada. Los métodos para determinar si una secuencia es de cuerpo entero son bien conocidos en el arte, incluyendo tales técnicas ejemplares como los manchas septentrional y occidental, primera extensión, protección de Sl, y protección de ribonucleasa. Por ejemplo, vea Plant Molecular Biology: A Laboratory Manual , Clark, Ed. , Springer-Verlag, Berlín (1997). La Comparación para conocer secuencias homólogos de cuerpo entero (ortólogos y/o parologos) pueden también ser usadas para identificar secuencias de cuerpo entero de la presente invención. Adicionalmente, secuencias consenso del acuerdo general típicamente presentes en las regiones no traducidas 5' y 3' del mRNA ayuda en la identificación de un polinucleótido de cuerpo entero. Por ejemplo, la secuencia de consenso ANNNNAUGG dónde el codon subrayado representa la metionina N-terminal, ayuda en la determinación si el polinucleótido tiene una terminación 5' completa. Las
secuencias consenso en la terminación 3 ' , tal como las secuencias de poliadenilación, ayuda en la determinación si el polinucleótido tiene una completa terminación 3 ' Como se usa aquí, ' heterologos" en referencia a un ácido nucleico es un ácido nucleico que se origina de una especie extranjera, o, si parte de las mismas especies, se modifica substancialmente a partir de su forma nativa en composición y/o sitio genómico por intervención humana. Por ejemplo, un promotor operablemente unido a un gene heterologo estructural es de una especie diferente a partir de la cual el gen estructural fue derivado, o, si parte de las mismas especies, uno o los dos se modifican substancialmente de su forma original. Una proteína heterologa puede originarse a partir de especies extranjeras o, si de parte de las mismas especies, se modifica substancialmente de su forma original por intervención humana. Por la "célula huésped" se entiende una célula que contiene un vector y soporta la replicación(repetición) y/o expresión del vector. Las células del huésped pueden ser células procarioticas tales como E. coli , o células eucarioticas tales como levadura, insecto, anfibio, o células de mamífero. Preferentemente, las células huésped son células de plantas monocotiledóneae o dicotiledóneas. Una célula huésped monocotiledónea particularmente preferida es una célula huésped de maíz.
El término "introducido" incluye referencia a la incorporación de un ácido nucleico en una célula eucariótica o célula procariótica dónde el ácido nucleico puede incorporarse en el genoma de la célula (por ejemplo, cromosoma, plasmido, píastide o ADN mitocondrial) , convertido en un replicón autónomo, o temporalmente expresado (por ejemplo, mRNA transfectado) . El término incluye tal introducción del ácido nucleico como la "transfección", "transformación" y "transducción". El término "aislado" se refiere a material, tal como un ácido nucleico una proteína, que son: (1) substancialmente o esencialmente libre de componentes que normalmente acompañan o actúan recíprocamente con él como son encontrados en su ambiente natural. El material aislado opcionalmente comprende material no encontrado con el material en su ambiente natural; o (2) si el material está en su ambiente natural, el material ha sido sintéticamente alterado o sintéticamente producido por la intervención humana deliberada y/o puesto en una situación diferente dentro de la célula. La alteración sintética o creación del material puede ser realizado, sobre el material dentro de o aparte partiendo de su estado natural. Por ejemplo, un ácido nucleico naturalmente-ocurriendo se vuelve un ácido nucleico aislado si es alterado o producido por los métodos no-naturales, sintéticos, o si se transcribe de ADN que ha sido
alterado producido por los métodos no-naturales, sintéticos. El ácido nucleico aislado también puede producirse por el re-arreglo sintético ("barajando") de una parte o partes de uno o mas formas allelicas del gen de interés. Igualmente, un ácido nucleico naturalmente-encontrado (por ejemplo, un promotor) se aisla si este es introducido a un sitio diferelnte del genoma. Ácidos nucleicos que se "aislan", como se define aquí, son también referidos como ácidos nucleicos "heterologos". Por ejemplo, vea Compounds and Methods for Site Directed Mutagenesis in Eukariotic Cells, K iec, U. S. Patent No. 5,565,350; In Vivo Sequence Targeting in Eukaryotic Cells, Zarling et al., WO
93/22443 (PCT/US93/03868) . Como es usado aquí, el "ácido nucleico" incluye la referencia un desoxlirribonucleótido polímero ribonucleótido, o quimeras del mismo, en cualquier forma simple- o doble-cordon, y a menos que por otra parte se limite, abarca análogos conocidos que tienen la naturaleza esencial de nucleótidos naturales en que ellos híbridizan a los ácidos nucleicos simple-cordón de una manera similar a los nucleótidos naturalmente encontrados (por ejemplo, péptidos de los ácidos nucleicos) Por "biblioteca de ácido nucleico" se entiende una colección de ADN aislado o moléculas de ARN que comprenden y substancialmente representan el fragmento transcrito entero
de un genoma de un organismo especificado, tejido, o de un tipo de célula a partir de ese organismo. Construcción de bibliotecas de ácidos nucleicos ejemplares, como las bibliotecas de cADN y genomica, se enseña en las referencias de la biología molecular estaidar como Berger y Kimmel, Guide to Molecular Cloning Teckniqí es, Methods in Enzymology, Vol. 152, Academia Press, Inc., San Diego, CA (Berger); Sambrook et al . , Molecular Cloning-A Laboratory Manual , 2 ed. , Vol. 1-3 (1989); y Current Protocols in Molecular Biology, F. M. Ausubel et al . , Eds., Current Protocols, a joint venture betwen Greene Publishing Associates, Inc. y John Wiley & Sons, Inc. (1994) . Como se usa aquí "operablemente unido" incluye referencia a una unión funcional entre un promotor y una segunda secuencia, en donde la secuencia del promotor comienza y media la transcripción de la secuencia de ADN que corresponde a la segunda secuencia. Generalmente, los medios operablemente unidos que las secuencias de ácidos nucleicos a uniéndose son contiguas y, dónde necesario para unir dos regiones de proteína codificadas, contiguas y en el mismo marco de lectura. Como se usa aquí, el término "planta" incluye la referencia a las plantas enteras, partes de la planta u órganos (por ejemplo, las tíojas, los tallos, las raíces, etc.), células de la planta, semillas y progenie del mismo.
La célula de la planta, como se usa aquí, además incluye, sin limitación, células obtenidas a partir de o encontradas en: semillas, suspensión o medios de cultivo, embriones, regiones meristemáticas, tejido cal oso, hojas, raíces, retoños, gametofitos, esporofitos, polLen y microesporas . Las células de las plantas también pueden entenderse para incluir las células modificadas, tales como protoplastos, obtenidos a partir de los tejidos mencionados. La clase de plantas que pueden usarse en los métodos de la invención generalmente es tan amplia como la clase de plantas más dóciles a las técnicas de transformación, incluyendo ambas plantas monocotiledóneas y dicotiledóneas . Una planta particularmente preferida es Zea mayz. Como se usa aquí, "polinucleótido" incluye referencia a un desoxiribopolinucleotido, ribopolinucleotido, o quimeras o análogos de los mismos que tienen la naturaleza esencial de un desoxi- o ribo- nucleótido natural en que ellos se híbridizan, bajo las condiciones de hibridación severas, para substancialmente la misma secuencia de nucleótidos como el nucleótido naturalmente encontrado y/o permite la traducción en el mismo amino ácido (s) como el nucleótido (s) naturalmente encontrado. Un polinucleótido puede ser de cuerpo entero o una subsequencia de un gen estructural nativo o heterol?oggoo oo regulador. A menos que por otra parte se indique lo contrario, el término incluye la
proteína, que la proteína es específicamente reactiva a los anticuerpos sacados a la misma proteína pero consistiendo completamente en aminoácidoe naturalmente encontrados . Los términos "polipéptido" , "péptido" y "proteína" también son inclusivas de modificaciones incluyendo, pero no limitando a, glicosilación, atadura del lípido, sulfación, gamma-carboxilación de residuos de ácido glutámico, hidroxilación y
ADP-ribosilación. Además, esta invención contempla el uso de ambas variantes aminadas terminales de la proteína, conteníendo-metionina y sin-metionina, de la invención Como se usa aquí el termino "promotor" incluye referencia a una región de ADN en contraflujo a partir del inicio de la transcripción e involucrado en el reconocimiento y enlazamiento de ARN polimerasa y otras proteínas para comenzar la transcripción Una "planta promotor" es un promotor capaz de comenzar la transcripción en las células de la planta si o no su origen es una célula de la planta. Las plantas promotores ejemplares incluyen, pero no se limitan a, aquéllas que se obtienen de Las plantas, viruses de plantas, y bacterias que comprenden los genes expresados en las células de la planta tales como Agrobacterium o Rhizobium. Los ejemplos de promotores bajo el control de desarrollo incluyen a los promotores que preferencialmente inician la transcripción en ciertos tejidos, tales como hojas, raíces, o semillas. Tales promotores son referidos como "tejido
preferido" . Los promotores que inician la transcripción únicamente en ciertos tejidos son referidos como "tejido específico" Una "célula tipo" promotor específico principalmente maneja la expresión en ciertos tipos de célula en uno o mas órganos, por ejemplo, células vasculares en raíces u hojas. Un promotor v inducible" o "represible" es un promotor que está bajo control medioambiental. Los ejemplos de condiciones medioambientales que pueden efectuar la transcripción por los promotores inducibles incluyen condiciones anaerobias o la preseíncia de luz . Los promotores tejido específico, tejido preferiiddoo,, tipo celular específico y los promotores inducibles constituyen la clase de promotores "no-constitutivos" . Un promotor "constitutivo" es un promotor que es activo ba: o la mayoría de las condiciones medioambientales . Como se usa aquí el termino "recombinantee" incluye la referencia a una célula ? vector que ha sido modificada por la introducción de un ác:.do nucleico heterologo o que la célula se deriva de una célula modificada. Así, por ejemplo, las células recombinantees expresan genes que no se encuentran en forma idéntico dentro del nativo (no-recombinantee) forma de los genes nativos celulares o expresados que son por otra parte anormalmente expresados, expresados-bajo o no expresados en absoluto como resultado de la intervención humana. El ¡término "recombinantee" como se
usa aquí no abarca la alteración de la célula o vector por los eventos naturalmente encontrados (por ejemplo, mutación espontánea, transformación/transducción/transposición natural) como aquellos encontrados sin la intervención humana, Como se usa aquí un "cassette de expresión recombinantee" es un ácido nucleico construido, generado recombinanteemente sintéticamente, con una serie de elementos ácidos nucleicos especificados que permiten la transcripción de un ácido nucleico particular en una célula del huésped. El cassette de expresión recombinantee puede incorporarse en un plasmido cromosoma, ADN mitocondrial, plastido de ADN, virus, o fragmento de ácido nucleico, Típicamente, la porción del cassette de expresión recombinantee de un vector de expresión incluye, entre otras secuencias, un ácido nucleico a ser transcrito, y un promotor. El término "residua" o "residuo de aminoácido" o "aminoácido" se usan intercambiablemente aquí para referirse a u? aminoácido que está incorporado en una proteína, polipeptido, o peptido (colectivamente "proteína"). El aminoácido puede ser un aminoácido naturalmente encontrado y, a menos que por otra parte se limite, puede abarcar análogos no-naturales de aminoácidos naturales que pueden funcionar de una manera similar como los aminoácidos naturalmente
encontrados . El término "hibridizar selectivamente" incluye la referencia a la hibridación, bajo las condiciones de hibridación severas, de una secuencia de ácido nucleico a una secuencia especifica de ácido nucleico para un mayor grado perceptiblemente (por ejemplo, por lo menos el 2-pliegue encima del fondo) que su hibridación a las secuencias de ácido nucleicos no-designado y a la exclusión sustancial de ácidos nucleicos no-designados. Las secuencias selectivamente híbridizadas tienen típicamente sobre por lo menos el 80% de identidad de la secuencia, preferentemente 90% de identidad de la secuencia, y más preferentemente 100% de identidad de la secuencia (es decir, co plsmentario) entre sí. El término "condiciones severas" o "condiciones severas de hibridación" incluyen la referencia a condiciones bajo las cuales la exploración será híbridada selectivamente a su secuencia designada para un mayor grado de perceptibilidad que para otras secuencias (por ejemplo, por lo menos el 2-pliegue sobre el antecedente) . Las condiciones severas son secuencia-dependientes y será diferente en circunstancias diferentes. Controlando la estrechez de la hibridación y/o lavando lc.s condiciones, las secuencias designadas pueden ser identificadas las cuales son 100% complementarias la sonda (sondeando homólogo) . Alternativamente, pueden ajustarse las condiciones de
La especificidad es típicamente la función de lavados de post-hibridación, los factores críticos son la fuerza iónica y temperatura de la disolución del lavado final. Para los híbridos de ÁDN-ADN, la Tm puede aproximarse de la ecuación de Meinkoth y Wahl, Anal . Biochem. , 138:267- 284 (1984): la Tm = 81.5SC + 16.6 (log M) + 0.41 (%GC) - 0.61
(%form) - 500/L; en donde M es la molaridad de los cationes monovalentes, %GC es el porcentaje de nucleótidos guanosina y citosina en el ADN, %form es el porcentaje de formamida en la disolución de hibridación, y L es la longitud del híbrido en pares de base. La Tm es la temperatura (bajo la fuerza iónica definida y pH) a la cual el 50% de una secuencia designada complementaria se híbridiza a una sonda perfectamente equilibrada. La Tm es reducida por aproximadamente laC para cada 1% de desequilibrio; así, pueden ajustarse Tm, hibridación y/o condiciones del lavado para híbridizar a las secuencias de identidad deseada. Por ejemplo, si se buscan secuencias con > 90% de identidad, la Tm puede disminuirse 10aC. Generalmente, se seleccionan las condiciones severas para ser aproximadamente 5aC menores que el punto de fusión termal (Tm) para la secuencia específica y su complemento a una fuerza iónica y pH defini Lcdo. Sin embargo, las condiciones muy severas pueden utilizar una hibridación y/o lavado en 1,
2, 3, o 4aC menor que el pinto de fusión termal (Tm) ; las condiciones ligeramente severas pueden utilizar una
hibridación y/o lavado en 6, 7, 8, 9, o 10aC menor que el punto de fusión termal (Tm) las condiciones de estrechez bajas pueden utilizar una hibridación y/o lavado en 11, 12,
13, 14, 15, o 20aC menor que el punto de fusión termal (Tm) . Usando la ecuación, hibridación y composiciones del lavado, y
Tm deseada, aquellos de hábilidad ordinaria entenderán que se describen variaciones inherentemente en la estrechez de hibridación y/o disoluciones del lavado. Si el grado deseado de desigualación de resultados en una Tm de menos de 45aC (disolución acuosa) o 32aC (disolución de formamida) se prefiere aumentar la concentración de SSC para que una temperatura más alta pueda usarse. Pueden aplicarse hibridación y/o condiciones del lavado para por lo menos 10, 30, 60, 90, 120, o 240 minu:os. Una guía extensiva para la hibridación de ácidos nucleicos se encuentra en Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization wi th Nucleic Aícid Probes, Part I, Chapter 2,
"Overview of principies of hybridization and strategy of nucleic acid probé assays", Elsevier, New York (1993); y Current Protocols in Molecular Biology, Chapter 2, Ausubel, et al . , Eds.,. Greene Publisbing y Wiley-Interscience, New
York (1995) . Como se usa aquí, el termino "planta transgenica" incluye la referencia a una planta que comprende dentro de su genoma un polinucleótido heterologo. Generalmente, los
polinucleótidos heterologos se integra establemente dentro del genoma tal que el polinvcleótido se pasa adelante a las generaciones sucesivas. Les polinucleótidos heterologos pueden integrarse en el genoma solo o como parte de un cassette de expresión recopbinantee. "Transgenico" se usa para incluir cualquier célula, línea celular, callo, tejido, parte de la planta o plantai, el genotipo del cual ha sido alterado por la presencia de ácido nucleico heterologo que incluye esos transgenicos inicialmente alterados así como aquellos creados por cruces sexuales o por propagación asexual del transgenico inicial. El término "transgenico" como se usa aquí no abarca la alteración del genoma
(cromosomático o extra-cr?>mosomático) por los métodos convencionales de cría de plantas o por los eventos naturalmente encontrados como la fertilización-cruzada aleatoria, infección viral no-recombinantee, transformación bacteriana no-recombinantee, transposición no-recombinantee, o mutación espontánea. Como se usa aquí, el termino "vector" incluye la referencia a un ácido nucleico usado en la introducción de un polinucleotido de la presente invención en una célula del huésped. Los vectores son a menudo los replicones. Los vectores de expresión permiten la transcripción de un ácido nucleico insertada en ellos. Los siguientes términos se usan para describir las
relaciones de la secuenbia o secuencia entre un polinucleótido/polipéptido de la presente invención con una referencia polinucleótido/polipéptido: (a) "secuencia o secuencia de referencia", (b) "ventana de comparación", (c) "secuencia o secuencia de identidad", y (d) "porcentaje de identidad de la secuencia o sscuencia" (a) Como se usa aquí, la "secuencia de referencia' es una secuencia definida usada como una base para la comparación de la secuencia con un polinucleótido/polipéptido de la presente invención. Una secuencia de referencia puede ser un subconjunto o la integridad de una secuencia especificada; por ejemplo, como un segmento de un cADN de cuerpo entero o secuencia el gen, o el cADN completo o secuencia del gen. (b) Como se usa aquí, "ventana de comparación" incluye la referencia a un inmediato y especificó segmento de una secuencia del polinucleótido/polipéptido, en donde la secuencia del polinucleótido/polipéptido puede compararse a una secuencia de referencia y en donde la porción de la secuencia del polinucleótidd/polipéptido en la ventana de comparación puede comprender sumas o
(substracciones) tachaduras (es decir, huecos) comparadas con la secuencia de referencie. (qué no comprende sumas o substracciones) para la aLineación óptima de las dos secuencias. Generalmente, la ¡ventana de comparación es por lo
menos 20 residuos inmediatos de nucleótidos/amino ácidos en longitud, y opcionalmente puede ser 30, 40,50, 100, o más largos. Aquellos de habilidad en el arte entienden que para evitar una similitud alta a una secuencia de referencia debido a la inclusión de huecos en la secuencia del polinucleótido/polipéptido, una hueco penalizado es típicamente introducido y se substrae del número de conincidencias . Los métodos de alineación de secuencias para comparación son muy conocidos en el arte. La alineación óptima de secuencias ,para comparación puede dirigirse por el algoritmo de la homología l cal de Smith y Waterman, Adv. Appl . Math. 2 : 482 (1981); por el algoritmo de homología de alineación de Needleman y Wunsch, J. Mol . Biol . 48: 443 (1970) ; por la búsqueda para el método de similitud de Pearson y Lipman, Proc. Nati . Acad. Sci . 85: 2444 (1988); por las aplicaciones informat:.zadas de estos algoritmos, incluyendo, pero no limitando a: CLUSTAL en el PC/Gene program por Intelligenetics, Mountain View, California, ; GAP, BESTFIT, BLAST, FASTA, y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group (GCG) , 575 Science
Dr., Madison, Wisconsin, USA; el programa CLUSTAL se describe bien por Higgins and Sharp, Gene 73: 237-244 (1988); Higgins and Sharp, CABIOS 5: 151-153 (1989); Corpet, et al . , Nucleic Acids Research 16: 10881-90 (1988); Huang, et al . , Computer
Applications in the Biosciences 8 : 155-65 (1992 ) , y Pearson, et al . , Methods in Molecular Biology 24: 307-331 (1994). La familia de programas BLAST que pueden usarse para las búsquedas de similitud de base de datos incluye: BLASTN para búsqueda de secuencias o secuencias de nucleótido contra las secuencias de nucLeótido de base de datos; BLASTX para búsqueda de secuencias de nucleótido contra las secuencias de proteína de baee de datos; BLASTP para búsqueda de secuencias de proteína contra las secuencias de base de datos de proteína; TBLASTN para búsqueda de secuencias de proteína contra las secuencias de nucleótido de base de datos; y TBLASTX para búsqueda de secuencias de nucleótido contra las secuencias nucleótido de base de datos. Vea,
Current Protocols in Molecul [ar Biology, Chapter 19, Ausubel, et al . , Eds., Greene Publishing and Wiley-Interscience, New York (1995); Altschul et a,!., J. Mol . Biol . , 215:403-410 (1990); y, Altschul et al . , Nucleic Acids Res . 25:3389-3402 (1997) . El software para realizar los análisis BLAST está públicamente disponible, por ejemplo, a través de Información del Centro Nacional para la Biotecnología (http: //www.ncbi.nlm.nih.gov /) . Este algoritmo involucra primero la identificación de los pares de secuencia altos (HSPs) mediante la identificación de palabras cortas de longitud W en la secuencia buscada, el cual equilibrio o
expectativa (E) de 10, un atajo de 100, M=5, N = -4, y una comparación de ambos cordons . Para las secuencias de aminoácido, los el programe. BLASTP usa como los valores predeterminados un palabra larga (W) de 3, una expectativa (E) de 10, y una cuenta de matriz BLOSUM62 (vea Henikoff & Henikoff (1989) Proc. Nati . Acad. Sci . USA. 89:10915) Además para calculer el porcentaje de la identidad de la secuencia, el algorit o BLAST realiza también un análisis estadístico de la similitud entre dos secuencias (vea, por ejemplo, Karlin & P.ltschul, Proc. Nat 'l . Acad. Sci USA. 90:5873-5877 (1993)) Una medida de similitud proporcionada por el algoritmo BLAST es la probabilidad de la suma más pequeña (P(N)) que ¡proporciona una indicación de la probabilidad por la cual un squilibrio entre dos nucleotidos o secuencias de aminoácido ocurriría por casualidad. Las búsquedas de BLAST asumen que pueden planearse las proteínas como las secuencias aleatorias. Sin embargo, muchas proteínas reales comprenden regiones de secuencias no al azar que pueden ser tractos homopolimericos, el corto-período repite, o las regiones enriquecidas en uno o más aminoácidos. Pueden alinearse tales regiones de baja-complejidad entre las proteínas no relacionadas aunque otras regiones de la proteína son completamente disímiles. Pueden emplearse varios programas de filtro de baja-complejidad para reducir tales alineaciones de ba a-complejidad. Por ejemplo,
el SEG (Wooten y Federhen, Comput . Chem. , 17:149-163 (1993)) y XNU (Claverie y Estados, Comput . Chem. , 17:191-201 (1993)) pueden emplearse los filtros de baja-complejidad exclusivamente (solos) o en combinación. A menos que por otra parte se declare lo contrario, los valores de identidad/sim laridad de nucleótido y proteína proporcionados aquí son calculados usando GAP (GCG Versión 10) bajo los valores predeterminados. El GAP (Programa de Alineación Global) también puede usarse para comparar un polinucleótido o polipéptido de la presente invención con una secuencia de referencia. El GAP usa el algoritmo de Needleman y Wunsch (JJ Mol . Biol . 48
443-453, 1970) para encontrar la alineación de dos secuencias completas que aumentan al máximo el número de equilibrio y minimizan el número de huecos. El GAP considera todas las posibles alineaciones y posiciones del hueco y crea la alineación con el número más grande de bases emparejadas y el menor numero de huecos. Permite para la provisión de una penalización de creación de hueco y una penalización de extensión de hueco en las unidades de bases emparejadas. El
GAP debe hacer una ganancia pe creación de hueco penalizada por el número de equilibrio para cada hueco que se inserta.
Si una penalizada extensión de hueco mayor que cero es escogido, el GAP debe, además, hacer una ganancia para cada hueco insertado de la longitud del hueco cronometra la
penalización de extensión de hueco. Los valores predeterminados para la penalización de creación de hueco y valores de la penalización de la extensión del hueco en la Versión 10 del paquete de software de Wisconsin Genetics para las secuencias de la proteína son 8 y 2, respectivamente. Para las secuencias de nucleótido la penalización de creación de hueco predefinida es 50 mientras la penalización de extensión de hueco predefinida es 3. Las penalizaciones de la creación del hueco y la extensión del hueco pueden expresarse como un entero seleccionaid»o del grupo de enteros que consisten de 0 a 100. Así, por ejemplo, las penalizaciones para la creación del hueco y la extensión de hueco pueden ser cada una independientemente: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,
10, 15, 20, 30, 40,50,60 o maVor El GAP presenta a un miembro de la familia de alineaciones más buenas. Puede haber muchos miembros de esta familia, pero ningún otro miembro tiene una calidad buena. El GAP despliega cuatro figuras de mérito para las alineaciones: Calidad, Proporción, Identidad, y Similitud. La Calidad es el métrico aumentado al máximo para encuadrar las secuencias . La proporción es la calidad dividida por el número de bases en el segmento más corto. La Jdentidad por ciento es el por ciento de los símbolos que realmente emparejan. La Similitud por ciento es el por ciento de los símbolos que son similares. Se ignoran símbolos que están enfrente de los
polinucleótido en la ventana de comparación puede comprender adiciones o substracciones (es decir, huecos) como se compara con la secuencia de referencia (la cual no comprende adiciones o substracciones) oara la alineación óptima de las dos secuencias. El porcentaje es calculado determinando el número de posiciones al cual la base, del ácido nucleico, idéntica o el residuo del aminoácido ocurre en ambas secuencias para rendir el numero de posiciones emparejadas, mientras dividiendo el número de posiciones emparejadas por el número total de posiciones en la ventana de comparación y multiplicando el resultado per 100 para obtener el porcentaje de identidad de la secuencia. Utilidades La presente invención proporciona, entre otras cosas, las composiciones y métodos para modular (es decir, aumentando o disminuyendo) el nivel de polinucleótidos y polipéptidos de la presente invención en las plantas . En particular, los plinucleotidos y polipéptidos de la presente invención pueden expresarse temporalmente o espacialmente, por ejemplo, en las fases de desarrollo, en tejidos, y/o en cantidades que son atípicas de las plantas diseñadas no-recombinanteemente. La presente invención también proporciona ácidos nucleicos aislados que comprenden polinucleótidos de longitud suficiente y complementariedad para un polinucleótido de la
presente invención para usar como sondas o primeras de amplificación en la detección, cuantificación o aislamiento de transcripciones del gen. Por ejemplo, pueden usarse ácidos nucleicos aislados de la invención presente como las sondas en la detección de deficiencias en el nivel de mARN en las selección para las plantas transgenicas deseadas, para la detección de mutaciones en el gen (por ejemplo., substituciones, substraccior :..es , o adiciones) , para el monitoreo sobre regulación de expresión o cambios en la actividad de la enzima protegiendo ensaye de compuestos, para la detección de cualquier número de variantes allelicas (polimorfismos) , ortólogos, o paralogos del gen, o para el sitio dirigió la mutagénesis en las células eucarióticas (vea, por ejemplo, la U.S. Pat. No. 5,565,350). También pueden usarse los ácidos nucleicos aislados de la presente invención para la expresión recombinantee de sus polipeptidos codificados, o para el uso como inmunogenos en la preparación y/o protegiendo de anticuerpos. También pueden emplearse los ácidos nucleicos aislados de la presente invención para el uso en sentido o supresión contrasentido de uno o más genes de la presente invención en una célula huésped, tejido, o planta. La atadura de agentes químicos que ligan, intercalan, pegúese y/o también unión chuzada para los ácidos nucleicos aislados de la presente invención pueden ser también usados para modular la transcripción o traducción.
La presente invención también proporciona proteínas aisladas que comprenden ua polipéptido de la presente invención (por ejemplo, prep oenzima, proenzima, o enzimas) . La presente invención también proporciona proteínas que comprenden un epitope por lo menos de un polipéptido de la presente invención. Las proteínas de la presente invención pueden emplearse en los ensayos para agonistas de la enzima o antagonistas de la función de la enzima, o para el uso como inmunogenos o antígenos :?ara obtener los anticuerpos específicamente inmunoreact vos con una proteína de la presente invención. Tales anticuerpos pueden usarse en los ensayos para los niveles de expresión, para identificación y/o aislamiento de ácidos nucleicos de la presente invención a partir* de las bibliotecas de expresión, para la identificación de polipéptidos homólogos de otras especies, o para purificación de polipéptldos de la presente invención. Los ácidos nucleicos aislados y polipeptidos de la presente invención pueden ussarse sobre un amplio rango de tipos de planta, particularmente monocotiledoneas tales como las especies de la familia Gramineae, incluso Hordeum, Sécale, Oryza, Triticum, Sorgum (por ejemplo., S. bicolor) y
Zea (por ejemplo, Z. mays) , y dicotiledóneas como Glycine. El ácido nucleico aislado y las proteínas de la presente invención también pueden usarse en las especies del genero: Cucúrbita, Rosa, Vitis, Juglans, Fragaria, Lotus,
Medicago, Onobrychis, Trifo?ium, Trigonella, Vigna, Ci trus,
Linum, Geranium, Manihot, Daucus, Arabidopsis, Brassica, Raphanus, Sinapis, Atropa, Capsicum, Datura, Hyoscyamus, Lycopersicon, Nicotiana, Solanum, Petunia, Digitalis, Majorana, Ciahorium, Helianthus, Lactuca, Bromus, Asparagus,
Antirrhinum, Heterocallis, Nemes is, Pelar gonium, Panieum,
Pennisetum, Ranunculus, Senecio, Salpiglossis, Cucumis,
Browallia, Pisum, Phaseolus, Lolium, y Avena . Ácidos nucleicos La presente invención proporciona, entre otras cosas, ácidos nucleicos aislados de ARN, ADN, y análogos y/o quimeras de los mismos, que comprenden un polinucleótido de la presente invención. Un polinucleótido de la presente invención es inclusivo de aquellos en la Tabla 1 y: (a) Un polinucleótido aislado que pone en código un polipéptido de la presente invención tales como esos referenciados en Tabla . '. , incluyendo polinucleótidos ejemplares de la presente invención; (b) Un polinucleóti o aislado que es el producto de amplificación de una biblioteca de ácido nucleico de la planta usando pares de primeros el cual selectivamente se hibridiza bajo condiciones severas a los sitios dentro de un polinucleótido de la presente invención; (c) Un polinucleótido aislado que selectivamente se
híbridiza a un polinucleótido de (a) o (b) ; (d) Un polinucleótido aislado que tiene una identidad de secuencia especificada con polinucleótidos de (a), (b) o (c); (e) Un polinucleótido aislado que pone en código una proteína que tiene un número especificado de aminoácidos inmediatos a partir de un polipéptido prototipo, en donde la proteína se reconoce especí ticamente por antisera elicited sacado por la presentación de la proteína y en donde la proteína no es detectablemente inmunoreactiva para ant sera la cual ha sido totalmente immunosorbed con la proteína; (f) Las secuencias complementarias de polinucleótidos de (a) , (b) , (c), (d) o (e); y (g) Un polinucleótido aislado que comprende por lo menos un número específico de nucleótidos inmediato a partir de un polinucleótido de (a), (b) , (c) , (d) , (e) o (f) ; (h) Un polinucleótido aislado de una biblioteca de cADN de cuerpo entero enriquecida que tiene la propiedad físico-química de híbridizar selectivamente a un polinucleótido de (a), (b) , (c) , (d) , (e) , (f) o (g) ; (i) Un polinucleótiio aislado hecho por el proceso de: 1) proporcionando una biblioteca de acida nucleico de cuerpo entero enriquecida, 2) híbridizando selectivamente el polinucleótido a un polinucleótido de (a) , (b) , (c) , (d) , (e) , (f) , (g) o (h) , por eso aislando el polinucleótido a
invención proporciona un ácido nucleico aislado que comprende un polinucleótido de la presente invención, en donde el polinucleótidos se ampli ican, bajo condiciones de amplificación de ácido nucleico, a partir de una biblioteca de ácido nucleico de la planta. Las condiciones de amplificación de ácido nucleico para cada uno de la variedad de métodos de amplificación es bien conocido por aquellos con habilidad ordinaria en el arte. La biblioteca de ácido nucleico de la planta pueda construirse a partir de una monocotiledónea tal como una cosecha de cereal. Los cereales ejemplares incluyen maíz, sorgo, alfalfa, cañóla, trigo, o arroz. La biblioteca de ácido nucleico de la planta también puede construirse de una dicotiledónea tal como la soja. Las líneas de Zea mayz B73, PHRE1, A632, BMS-P2#10, W23, y Mol7 son conocidos y públicamente disponibles. Pueden obtenerse otras líneas de maíz públicanente conocidas y disponibles de Maize Genetics Cooperation (Urbana, IL) . Las líneas de trigo están disponibles de Wheat Genetics Resource Center
(Manhattan, KS) . La biblioteca de ácido nucleico puede ser una biblioteca del cADN, una biblioteca genomica, o una biblioteca generalmente construida partir de las transcripciones nucleares en cualquier fase de proceso del intron. Las bibliotecas de cADN pueden normalizarse para aumentar la representación de cADNs relativamente raro. En
las modalidades optativas, I la biblioteca del cADN se construye usando un método de síntesis de cADN de cuerpo entero enriquecido. Los ejemplos de tales métodos incluyen Oligo-Capping (Maruyama, K. and Sugano, S. Gen 138: 171-174, 1994), Biotinylated CAP Trapper (Carninci, et al. Genomics 37: 327-336, 1996), y CAP Retention Procedure (Edery, E., Chu, L.L., et al . Molecular and Cellular Biology: 3363-3371, 1995) . Rápidamente se desarrollan tejidos o las células rápidamente se dividen son preferidos para usarse como una fuente de mARN para la construcción de una biblioteca de cADN. Las fases del crecimiento del maíz son descritas en "How a Corn Plant Develops Special Report No. 48, Iowa
State University of Science and Technology Cooperative
Extensión Service, Ames, Iowa , Reprinted february 1993. Un polinucleótido de esta modalidad (o subsequencias de la misma) puede obtenerse, por ejemplo, usando primeros de amplificación los cuales son selectivamente hibridizados y el primero extendido, bajo condiciones de amplificación de ácido nucleico, a por lo menos dos sitios dentro de un polinucleótido de la presente invención, o a dos sitios dentro del ácido nucleico el cual el costado y comprende un polinucleótido de la presente invención, o a un sitio dentro de un polinucleótido de la presente invención y un sitio dentro del ácido nucleico que lo comprende. Los métodos para obtener terminaciones 5' y/o
3 ' de una inserción del vector son bien conocidos en el arte . Vea, por ejemplo, RACE (Rapad Amplification of Complementary Ends) como se describe en Frohman, M. A., in PCR Protocols: A Guide to Methods and ApplJcations , M. A. Innis, D. H. 5 Gelfand, J. J. Sninsky, T. J. White, Eds. (Academia Press,
Inc., San Diego), pp. 28-38 (1990)); también vea, U.S. Pat
No. 5,470,722, y Current Protocols in Molecular Biology, Unit
15.6, Ausubel, et al . , Eds. , Greene Publishing and Wiley- Interscience, New York (1995) ; Frohman and Martin, Techniques 10 1:165 (1989). Opcionalmente, los primeros son complementarios a una subsequencia del ácido nucleico designado los cuales ellos amplifican pero pueden tener una identidad de secuencia que va de aproximadamente 85% a 99% relativo a la secuencia
15 del polinucleótido al cual ellos son diseñados para templar a. Como aquellos experimentados en el arte apreciarán, los sitios a los cuales los pares del primeros serán selectivamente hibridiz dos son escogidos tal que un solo ácido nucleico inmediato puede formarse bajo las condiciones
20 de amplificación de ácido nucleico deseadas. Se selecciona la longitud del primeros en el nucleótidos del grupo de enteros que consisten de por lo meros 15 a 50. Así, los primeros pueden ser por lo menos 15, 18, 20, 25, 30, 40, o 50 nucleótidos en longitud. Aquellos de habilidad reconocerán
25 que una secuencia de osl primeros alargada puede emplearse
-.A*
para aumentar especificidad de unión (es decir, templando) a una secuencia designada. Unei secuencia no-templada en la terminación 5' de un primeros (una "cola") puede agregarse, por ejemplo, para introducir un sitio clonando en las terminaciones finales del amplicón. Los productos de¡ amplificación pueden ser traducidos usando sistemas de expresión bien conocidos por aquellos con habilidad en el arte. Los productos de traducción resultantes pueder. confirmarse como polipéptidos de la presente invención me¿Liante, por ejemplo, ensayando para la actividad catalítica apropiada (por ejemplo, actividad específica y/o especificidad del substrato) , o verificando la presencia de uno o más epitopes los cuales son específicos a un polipéptido de la presente invención. Los métodos para la síntesis de roteína a partir de plantillas derivadas de PCR son conocidas en el arte y disponibles comercialmente. Por ejemplo, vea Amersham Life Sciences, Ine, Catalog' 97, p.354. Los polinucleótidos de la presente invención incluyen aquellos amplificados usando los siguientes pares de primeros : SEQ ID NOS: 3 y 4, los cuales rinden un amplicon que comprende una secuencia teniendo identidad sustancial a SEQ ID NO: 1; y SEQ ID NOS: 7 y 8, los cuales rinden un amplicon
que comprende una secuencia teniendo identidad sustancial a SEQ ID NO: 5. C. Polinucleótidos los cuales selectivamente hibridizan para un polinucleótido de (A) o (E¡) Como se indica en (c) , anteriormente, la presente invención proporciona ácidos nucleicos aislados que comprenden polinucleótidos de la presente invención, en donde los polinucleótidos selecti amente híbridizados, bajo las condiciones de hibridación selectivas, a un polinucleótido de las secciones (A) o (B) como se discutió anteriormente. Así, los polinucleótidos de esta modalidad pueden usarse encarnación para aislamiento detección, y/o cuantificación de ácidos nucleicos que comprenden los polinucleótidos de (A) o (B) . Por ejemplo, pueden usarse polinucleótidos de la presente invención para identificar, aislar, o amplificar los clones parcialmente o de cuerpo entero en una biblioteca depositada. En algunas modalidades, los polinucleótidos son genomicos o secuencias aisladas de cADN o por otra parte complementarias a cADN a partir de una biblioteca de ácido nucleico dicotiledónea o monocotiledónea. Las especies ejemplares de monocotiledóneas y dicotiledóneas incluyen, pero no es son limitantes a: el maíz, cañóla, soja, algodón, trigo, sorgo, girasol, alfalfa, avenas, caña de azúcar, mijo, cebada, y arroz. La biblioteca de cADN comprende 50% a 95% de secuencias de cuerpo entero (por ejemplo por lo menos 50%,
60%, 70%, 80%, 90%, o 95% de secuencias de cuerpo entero) . Las bibliotecas de cADN pueden normalizarse para aumentar la representación de secuencias raras. Ver por ejemplo, U.S. Patent No. 5,482,845. Las condiciones de hibridación de estrechez bajas son típicamente, pero no exclusivamente, empleadas con secuencias que tienen una secuencia de identidad reducida relativa a las secuencias complementarias . Pueden emplearse las condic Iones de estrechez moderadas y altas opcionalmente para las secuencias de mayor identidad. Las condiciones deestrechez bajas permiten hibridación selectiva de secuencias que tienen 70% a 80% de identidad de la secuencia aproximadamente y pueden emplearse para identificar secuencias ortologas o secuencias paralogas. D. Polinucleótidos que tieµen una identidad de secuencia específica con los polinuclec tidos de (A) , (B) o (C) Como se indica en (d) , anteriormente, la presente invención proporciona ácidos nucleicos aislados que comprenden polinucleótidos de la presente invención, en donde los polinucleótidos tienen una identidad especificada al nivel de nucleótido a un polinucleótido como se descubre anteriormente en las seicciones (A) , (B) , o (C) , anteriormente. Por ejemplo, puede calcularse la identidad usando los algoritmos BLAST, CLUSTALW, o GAP bajo las condiciones de valor predeterminado. El porcentaje de identidad para una secuencia de referencia es por lo menos
50% redondeado además al entero más cercano, puede expresarse como un entero seleccionado del grupo de enteros que consisten de 50 a 99. Así, por ejemplo, el porcentaje de identidad a una secuencia de referencia puede ser por lo menos 60%, 70%, 75%, 80%, 85%, 90%, o 95%. Opcionalmente, les polinucleótidos de esta modalidad pondrán en código ?an polipéptido que compartirá un epitope con un polipéptido puesto en código por los polinucleótidos de las secciones (A), (B) , o (C) . Así, estos polinucleótidos codifican un primer polipéptido que sacan producción de antisera que comprende anticuerpos que son específicamente reactivo para un segundo polipéptido codificando para un polinucleótido de (A) , (B) , o (C) . Sin embargo, el primer polipéptido no liga para antisera levantado contra sí mismo cuando el antisera ha sido totalmente immunosorbido con el primer polipéptido. Por lo tanto, pueden usarse los polinucleotidos de esta modalidad para generar anticuerpos para el uso en, por ejemplo, la selección de bibliotecas de expresión para ácidos nucleicos que comprenden los polinucleóbidos de (A) , (B) , o (C) , o para la purificación de, o inmunoensayos para, polipéptidos codificados por los polinucleótidos de (A) , (B) , o (C) . Los polinucleótidos de esta modalidad comprenden secuencias de ácidos nucleicos que pueden emplearse para la hibridación selectiva para un polinucleótido codificando un polipéptido
de la presente invención. Polipéptidos protegidos, para enlazamiento especifico a antisera, pueden lograrse convenientemente usando las bibliotecas de despliegue del péptido. Este método involucra la selección de colecciones grandes de péptidos para miembros individuales que tienen la función o estructura deseada. El anticuerpo protegido de las bibliotecas de despliegue del péptido es bien conocido en el arte. Las secuencias del péptido desplegadas pueden ser de 3 a 5000 o más aminoácidos en longitud, frecuentemente de 5-100 aminoácidos de longitud, y a menudo de aproximadamente 8 a 15 aminoácidos de largo. Además de los métodos sintéticos químicos directos para la generación de bibliotecas de péptidos, varios métodos de ADN recombinantee se han descrito. Un tipo involucra el despliegue de una secuencia del péptido en la superficie de un bacteriófago o célula. Cada bacteriófago o célula contiene la secuencia del nucleótido codificando la parfticular secuencia desplegada del péptido. Se describen tales métodos en la publicación de patente PCT Nos. 91/17271, 91/18980, 91/19818, y 93/08278.
Otros sistemas para la generación de bibliotecas de péptidos tienen aspectos de ambos métodos de síntesis, síntesis química in vi tro y métodos recombinantees . Vea, la publicación de patente PCt Nos. 92/05258, 92/14843, y 97/20078. También vea, U.S. Patent 5,658,754; y 5,643,768
Bibliotecas de péptidos desplegados, vectores, y equipos de la selección están comercialmente disponibles a partir de tales proveedores como Invitrogen (Carlsbad, CA) . E. Pol inucleot idos codificando una pro teína que tiene una subsequencia de un polipéptido prototipo y reactivo-cruzado para el polipéptido prototipc Como se indica en (e) , anteriormente, la presente invención proporciona ácidos nucleicos aislados que comprenden polinucleótidos de la presente invención, en donde los polinucleótidos codifican una proteína que tiene una subsequencia de aminoácidos inmediatos de un polipéptido prototipo de la presente invención tal como se proporciona en (a) , anteriormente. Se selecciona la longitud de aminoácidos inmediatos del polipéptido del prototipo del grupo de enteros que consisten de por lo menos 10 al número de aminoácidos dentro de la secuencia del prototipo. Así, por ejemplo, el polinucleótido puede codificar un polipéptido que tiene una subsequencia que tiene por lo menos 10, 15, 20, 25, 30, 35, 40, 45, o 50, aminoácidos inmediatos del polipéptido prototipo. Además, el número de tales subsequencias codificadas por un polinucleótido de la modalidad instantánea puede ser cualquier entero seleccionado del grupo que consiste de 1 a 20, tales como 2, 3, 4, o 5. Las subsequencias pueden separarse por cualquier entero de nucleótidos a partir de 1 al número de nucleótidos en la
secuencia tal como por lo me?bs 5, 10, 15, 25, 50, 100, o 200 nucleótidos . Las proteínas codificadas por polinucleótidos de esta modalidad, cuando se presentan como un inmunogeno, saque la producción de anticuerpoe los cuales específicamente se ligan a un polipéptido prototipo tal como pero no limitado a, un polipéptido codificado por el polinucleotido de (a) o (b) , anteriormente. Generalmente, sin embargo, una proteína codificada por un polinucleotiido de esta modalidad no liga a antisera levantado contra el | polipéptido prototipo cuando el antisera ha sido totalmente jlnmunosorbido con el polipéptido prototipo. Los métodos dé hacer y ensayar para el enlazamiento anticuerpo especificidad/afinidad son bien conocidos en el arte. Lps formatos del inmunoensayo ejemplares incluyen ELISA inmunoensayos competitivos, radioinmunoensayos , western blots borrones occidentales, ensayo inmunofluorescente indjirecto y similares En un método de ensayo preferido, totalmente inmunosorbed y agrupado antisera el cual es sacado para el polipéptido prototipo puede ser usado en un ensayo bligatorio (enlazante) competitivo para probar la proteína. La concentración del polipéptido prototipo requerida para inhibir el 50% de la encuademación del antisera para el polipéptido prototipo es determinada. Si la cantidad de la proteína requerida para inhibir la encuademación es menor
que dos veces la cantidad de proteína del prototipo, entonces se dice que la proteína liga específicamente al antisera sacado para el inmunogeno. De acuerdo con, las proteínas de la presente invención abrazan variantes allelicas, variantes conservadoramente modifi|cadas, y modificaciones recombinantees menores para lin polipéptido prototipo. Un polinucleótido de la presente invención opcionalmente codifica una proteína que tiene un peso molecular como la proteína no-glicosilada dentro del 20% del peso del molecular de los polipeptidos no-glicosilados de cuerpo entero de la presente invención. El peso molecular puede determinarse rápidamente mediante el SDS-PAGE bajo condiciones reductoras. Opcicnalmente, el peso molecular está dentro del 15% de un polipéptido de longitud llena de la presente invención, más preferentemente dentro del 10% o 5%, y el de mayor preferencia dentro del 3%, 2%, o 1% de un polipéptido de longitud llena de la presente invención. Opcionalmente, los polinucleótidos de esta modalidad codificaran una proteína que tiene una actividad enzimática específica por lo menos 50%, 60%, 80% o 90% de un extracto celular que comprende al polipéptido nativo, endógeno de cuerpo entero de la presente invención. Además, las proteínas codificadas por los polinucleótidos de esta modalidad tendrán opcionalin te una constante de afinidad substancialmente similar (Km T) y/o actividad catalítica (es
decir, la constante de proporción microscópica, kcat) como la proteina nativa endógena, de cuerpo entero. Aquellos de habilidad en el arte reconocerán que ese valor del kcat/Km determina la especificidad para competir por substratos y es a menudo llamado la constante, de especificidad. Las proteínas de esta modalidad pueden tener un valor de kcat/Km por lo menos del 10% de un polipéptido de cuerpo entero de la presente invención como se determino usando el substrato endógeno de ese polipéptido. Opcionalmente, el valor de kcat/ m será por lo menos del 20%, 30%, 40%, 50% y más preferentemente por lo menos 60%, 70%, 80%, 90% o 95% el valor de kcat/Km del polipéptido de cuerpo entero de la presente invención. La dete ninación de kcat, Km, y kca/Km pueden ser determinados por cualquier número de medios bien conocido por aquellos con habilidad en el arte. Por ejemplo, las proporciones iniciales (es decir, el primer 5% o menos de la reacción) puede determinarse usando técnicas de muestreo y mezclado rápido (por ejemplo, flujo-continuo, flujo-estacionario, o técnicas de apagado rápido) , fotolisis de llamarada, o métodos de relajación (por ejemplo, saltos de temperatura) junto con tales métodos ejemplares de medición como espectrofotometria, espectrofluorimetria, resonancia magnética nuclear, o procedimientos radioactivos. Valores cinéticos se obtienen convenientemente usando un graficador Lineweaver-Burk o de Eadie-Ho|fstee.
F. Polinucleótidos complementarios a los polinucleótidos de
(A) - (E) Como se indica en (f), anteriormente, la presente invención proporciona ácidos nucleicos aislados que comprenden los polinucleótidos complementarios a los polinucleótidos de los párrafos anteriores, A-E. Como aquellos de habilidad en el arte reconocerán, las secuencias complementarias par-base a lo largo de la integridad de su longitud con las secciones de polinucleótidos (A)-(E) (es decir, tienen el 100% de identidad de la secuencia sobre su longitud entera) . Las bases complementarias asociadas a través de enlaces de hidrógeno en doble stranded de ácidos nucleicos. Por ejemplo, los siguientes pares de bases son complementarias: guanina y citosina; adenina y tiamina; y adenina y uracilo. G. Polinucleótidos, los cuales, son subsequencias de los polinucleótidos (A) - (F) Como se indica en (g) , anteriormente, la presente invención proporciona ácidos nucleicos aislados que comprenden polinucleótidos los cuales comprenden por lo menos 15 bases inmediatas a partir' de los polinucleótidos de las secciones (A) a (F) como se discutió anteriormente. La longitud del polinucleótido se da como un entero seleccionado a partir del grupo que consiste de por lo menos 15 para la longitud de la secuencia de ácido nucleico a partir de la
cual el polinucleótido es una subsequencia de. Así, por ejemplo, los polinucleótidos de la presente invención son inclusivos de polinucleótidos que comprenden al menos 15, 20, 25, 30, 40, 50, 60, 75, o 100 nucleótidos inmediatos en longitud de los polinucleótidos de (A)-(F). Opcionalmente, el número de tales subsequencias codificadas por un polinucleótido de la modalidad instantánea puede ser cualquier entero seleccionado del grupo que consiste de 1 a 20, tal como 2, 3, 4, o 5. Las subsequencias pueden separarse por cualquier entero de nucleótidos de 1 al número de nucleótidos en la secuencia tal como por lo menos 5, 10, 15, 25, 50, 100, o 200 nucleótidos. Subsequencias pueden hacerse mediante métodos sintéticos in vi tro, biosintetico in vi tro, o en métodos recombinantees in vivo . En las modalidades optativas, las subsequencias pueden ser hechas por amplificación de ácido nucleico. Por ejemplo, se construirán los primeros de ácidos nucleicos para selectivamente híbridizar a una secuencia (o su complemento) dentro de, o co-extensivo con, la región codificada. Las subsequencias de la presente invención pueden comprender características estructurales de la secuencia a partir de la cual se deriva. Alternativamente, las subsequencias pueden carecer de ciertas características estructurales de la secuencia más grande a partir de la cual
esta se deriva tal como un Pol;i (A) cola. Opcionalmente, una subsequencia a partir de uh polinucleótido codificando un polipéptido que tiene al menos un epitope en común con una secuencia de polipéptido prototipo como se proporciona en (a) , anteriormente, puede codifi:car un epitope en común con la secuencia prototipo, Alternativamente ,, las subsequencias no pueden codificar un epi :ope en común con la secuencia prototipo pero pueden usarse para aislar la secuencia más grande mediante, por ejemolo, la hibridación de ácido nucleico con la secuencia a partir de la cual esta se deriva.
Subsequencias pueden usarse para modular o descubrir la expresión del gen mediante la introducción de compuestos dentro de las subsequencias que ligan, intercalan, pegúese y/o unión cruzada a los ácidos nucleicos. Los compuestos ejemplares incluyen acridina, psoralen, fenantrolina, naftoquinona, daunomicin o cloroetilaminoaril conjugados H. Polinucleótidos a partir de una biblioteca de cADN de cuerpo entero enriquecida cjue tiene la propiedad físico-química de híbridizar selectivamente para un polinucleótido de (A) - (G) Como se indica en (h) , anteriormente, la presente invención proporciona un polinucleótido aislado de una biblioteca de cADN de cuerpo entero enriquecida que tiene la propiedad fisico-química de híbridizar selectivamente a un polinucleotido de los párrafob (A) , (B) , (C) , (D) , (E) , (F) o
(G) como se discutió anteriormente. Los métodos de construcción de las bibliotecas de cADN de cuerpo entero enriquecidas son conocidos en el arte y se discutieron brevemente debajo. La biblioteca de cDNA comprende 50% a 95% de secuencias de cuerpo entero por lo menos (por ejemplo, por lo menos 50%, 60%, 70%, 80%, 90%, o 95% de secuencias de cuerpo entero) . La biblioteqa de cADN puede construirse de una variedad de tejidos de una monocotiledonea o dicotiledónea en una variedad de fases de desarrollo. Las especies ejemplares incluyen maíz, trigo, arroz, cañóla, soja, algodón, sorgo, girasol, alfalfa, avenas, caña de azúcar, mijo, cebada, y arrpz. Los métodos de hibridación selectivamente, bajo las condiciones de hibridación selectiva, un polinucleótido de una biblioteca de cuerpo entero enriquecida para un polinucleótido de la presente invención se conoce por aquellos con habilidad ordinaria en el arte. Cualquier número de condiciones de estrechez puede emplearse para permitir la hibridación selectiva. En las modalidades optativas, la estrechez permite hibridación selectiva de secuencias que tienen por lo menos 70%, 75%, 80%, 85%, 90%, 95%, o 98% de identidad de la secuencia sobre la longitud de la región hibridada. Las bibliotecas de cADN de cuerpo entero enriquecidas pueden ser normalizadas para aumentar la representación de secuencias raras I. Productos de polinucleótido hechos por un proceso de
aislamiento de cADN Como se indica en (I) , anteriormente, la presente invención proporciona un polinucleótido aislado hecho por el proceso de: 1) proporcionando una biblioteca acida nucleica de cuerpo entero enriquecida] 2) híbridando el polinucleótido selectivamente a un polinucleótido de los párrafos (A) , (B) ,
(C), (D), (E), (F), (G) O (H como se discutió anteriormente, y por eso aislando el polinucleótido de la biblioteca de ácido nucleico. Las bibliotecas de ácidos nucleicos de cuerpo entero enriquecidas se construyen como se discutió en el párrafo (G) y debajo de. Las condiciones de hibridación selectivas son como se discutió en el párrafo (G) . Los procedimientos de purificación de ácidos nucleicos son bien conocidos en el arte. La purificación puede ser convenientemente lograda usando métodos de fase-sólida; tale métodos se conocen bien por aquellos con habilidad en el arte y los equipos están disponibles de los proveedores comerciales tales como Advanced Biotechnologies (Surrey, UK) Por ejemplo, un polinucleóti o de los párrafos (A)-{H) puede inmovilizarse en un soporte s51ido como una membrana, cuenta, o partícula. Por ejemplo, vea por ejemplo U.S. Patent No.
5,667,976. El producto polinucleótido del presente proceso es selectivamente híbridado a u polinucleótido inmovilizado y el soporte sólido se aisla subsecuentemente de los polinucleotidos no-híbridados por los métodos incluidos, pero
no limitando a, centrifugación, separación magnética, filtración, electroforesis, y similares. Construcción de Ácidos Nucleicos Pueden hacerse los ácidos nucleicos aislados de la presente invención usando (a) los métodos recombinantees estándar, (b) las técnicas sintéticas, o combinaciones de los mismos. En algunas modalidades, se clonaran los polinucleotidos de la presente invención, se amplificarán, o por otra parte se construirá!, a partir de una monocotiledonea tal como maíz, arroz, o trigo, o una dicotiledónea como la soja. Los ácidos nucleicos pueden comprender las secuencias convenientemente edemas de un polinucleótido de la presente invención. Por ejemplo, un sitio multi-clonación que comprende uno o más sitios de restricción de endonucleasa puede insertarse en el ácido nucleico para ayudar en el aislamiento del polinucleótido. También, pueden insertarse las secuencias traducibles para ayudar en el aislamiento del polinucleótido traducido de la presente invención. Por ejemplo, una secuencia de marcador de hexa-histidina proporciona un medio conveniente para purificar las proteínas de la presente invención. Un polynucleotide de la presente invención puede atarse a un vector, adaptador, o montador por duplicar y/o expresión de un polynucleotide de la presente invención. Pueden agregarse secuencias adicionales para tal
genómico. El aislamiento de ARN y la construcción de cADN y bibliotecas genomitas es bien conocido por aquellos con habilidad ordinaria en el arte. Vea, por ejemplo, Plant
Molecular Biology: A Laboratory Manual, Clark, Ed. , Springer-Verlag, Berlín (1997); y, Current Protocols in Molecular Biology, Ausubel, et al., Ed ., Greene Publishing and Wiley- Interscience, New York (1995) Al . Bibliotecas de cDNA de cuerpo entero enriquecidas Se han descrito ve.rios protocolos de síntesis de cADN los cuales proporcionar, bibliotecas de cADN de cuerpo entero enriquecidas. Las bibliotecas de cADN de cuerpo entero enriquecidas se construyen para comprender al menos 600%, y más preferentemente por lo menos 70%, 80%, 90% o 95% inserciones de cuerpo entero entre clones que contienen las inserciones . La longitud de inserción en tales bibliotecas puede ser por lo menos 2, 3, 4, 5, 6, 7, 8, 9, 10 o más kilobase de pares. Los vectores para acomodar inserciones de estos tamaños son conocidos en el arte y están disponibles comercialmente. Por ejemplo, vea Stratagene's lambda ZAP Express (clonación de vector cADN con 0 a 12 kb de capacidad de clonación) . Un método ejemplar de construcción mayor que 95% pura biblioteca del cADN de cuerpo entero se describe por Carninci et al . , Genomics, 37:327-336 (1996). Otros métodos para la producción de bibliotecas de cuerpo entero son conocidos en el arte. Por ejemplo, vea Edery et al . , Mol .
Cell Biol . , 15(6) :3363-3371 (1995); y, PCT Application WO
96/34981. A2 Bibliotecas de cADN normal izadas o substraídas Una biblioteca de cADN no-normalizada representa la población de mARN del tejido a partir del cual fueron hechas . Desde que las únicas clones son fuera-numeradas por copias derivadas de los genes favorablemente expresados, su aislamiento puede ser laborioso. La normalización de una biblioteca de cADN es el proceso de creación de una biblioteca en el cual cada clon se representa más igualmente, La construcción de bibliotecas normalizadas se describe en
Ko, Nucí . Acids Res . , 18(19) 5705-5711 (1990); Patanjali et al . , Proc. Nati . Acad. U. S.A. , 88:1943-1947 (1991); U.S.
Patents No. 5,482,685, 5,482 ,845, y 5,637,685. En un método ejemplar descrito por Soares et al . , normalization resulted in reduction of the abundante of clones from a range of tour orders of magnitude to a narrow range of only 1 order of magnitude Proc. Nati , Ac d. Sci . U. S.A. , 91:9228-9232 (1994) . Las bibliotecas de cADN substraídas son otro medio para aumentar la proporción de especies de cADN menos abundantes. En este procedimiento, cADN preparado de una piscina de mARN se vacía ae secuencias presentes en una segunda piscina de mARN por hibridación. Los híbridos cADN:mARN son removidos y el cADN que permanece no-hibridado
en la piscina es enriquecido para las secuencias únicas a esa piscina. Vea, Foote et al . , Plant Molecular Biology: A Laboratory Manual , Clark, Ed., Springer-Verlag, Berlín
(1997); Kho y Zarbl, Tec nigiie, 3 (2): 58-63 (1991); Sive y St, John, Nucí . Acids Res . , 16(22) :10937 (1988); Current Protocols in Molecular Biology, Ausubel, et al . , Eds., Greene Publishing and Wiley-Interscience, ?ew York (1995) ; y, Swaroop et al . , Nucí . Acids Res . , 19)8):1954 (1991). Los equipos de substracción de cD?A están comercialmente disponibles. Por ejemplo, yea PCR-Select (Clontech, Palo Alto, CA) . Para construir las bibliotecas genomicas, se generan segmentos grandes de AD? genomico por fragmentación, por ejemplo usando endonucleasas de restricción, y son ligados con el vector de AD? para formar concatemers que pueden empaquetarse en el vector apropiado. Las metodologías para lograr estas termi4aciones, y los métodos de secuenciación para verificar la secuencia de ácidos nucleicos son bien conocidos en el arte. Los ejemplos de técnicas de biología molecular apropiadas e instrucciones suficientes para dirigir a las personas de habilidad a través de mucha construcción, clonación, y protegiendo las metodologías se encuentran en Sambrook, et al . , Molecular Cloning: A
Laboratory Manual , 2 Ed. , Cold Spring Harbor Laboratory Vols. 1-3 (1989), Methods in Enzymology, Vol. 152: Guide to
Molecular Cloning Techniques, Berger y Kimmel, Eds., San
Diego: Academia Press Ine, (1987), Current Protocols in
Molecular Biology, Ausubel, bt al., Eds., Greene Publishing and Wiley-Interscience, New York (1995); Plant Molecular Biology: A Laboratory Manual , Clark, Ed., Springer-Verlag, Berlín (1997) . Los equipos para la construcción de bibliotecas de genomicas también están comercialmente disponibles . El cADN o bibliot ca genomica puede ser screened usando una sonda basada en la secuencia de un polinucleotido de la presente invención tciles como aquellos descubiertos aquí . Pueden usarse las so:das para híbridar con el ADN genomico o secuencias del cADN para aislar genes homólogos en las mismas o diferentes es Lpecies de planta. Aejuellos de habilidad en el arte apreciarán eme pueden emplearse varios grados de estrechez de hibridación en el ensayo; y o la hibridación o el medio de lavado pueden ser severos , También pueden amplificarse los ácidos nucleicos de interés a partir de muéstiras de ácido nucleico usando técnicas de \ amplificación. Por ejemplo, la tecnología de cadena de reacción polimerasa (PCR) puede usarse para amplificar las secuencias de polinucleótidos de la presente invención y genes relacionados directamente a partir del ADN genomico o bibliotecas de cADN. PCR y otros métodos de amplificación in vitro también pueden ser útiles, por
ejemplo, para clonar secuencias de ácido nucleico que codifican para las proteínas a ser expresadas, para hacer ácidos nucleicos para usarse como sondas para detectar la presencia de mARN deseado en las muestras, para sequenciacion de ácido nucleico, o para otros propósitos. El gen T4 32 proteico (Boehringer Mánnheim) puede usarse para mejorar el rendimiento de productos PCR largos . Se han descrito les métodos de la selección PCR-basados. Wilfinger et al. describe un método PCR-basado en el cual el cADN más largo se identifica en el primer paso para que puedan eliminarse las clones incompletas a partir del estudio. BioTechniques, 22(3): 481-486 (1997). Tales métodos son particularmente eficac:es en combinación con una metodología de construcción de cADN de cuerpo entero, anteriormente. B. Métodos sintéticos para construir ácidos nucleicos Los ácidos nucleieos aislados de la presente invención también pueden ser preparados por síntesis química directa mediante métodos tales como el método del fosfotriester de Narang et al . , Meth. Enzymol . 68: 90-99 (1979); el método del fosfodiester de Brown et al . , Meth.
Enzymol . 68: 109-151 (1979); el método de la dietilfosforoamidita de Beaucage et al . , Tetra . Lett . 22:
1859-1862 (1981); el método de fosforoamidita triester fase solida descrito por Beaucage y Caruthers, Tetra. Letts .
22(20): 1859-1862 (1981), por ejemplo, usando un sintetizador automatizado, por ejemplo, como se describe en Needham-VanDevanter et al . , Nucleic Acids Res . , 12: 6159-6168 (1984); y, el método con soporte sólido de U.S. Patent No. 4,458,066 La síntesis química generalpente produce un oligonucleotido simple stranded. Esto puede convertirse en una doble stranded de ADN por hibridación con. una secuencia complementaria, o por polimerización con ADN pclimerasa usando la strand simple como una plantilla. Una perdona de habilidad reconocerá que mientras la síntesis química de ADN es mejor empleada para secuencias de aproximadamente 100 bases o menos, las secuencias más largas pueden ser obtenidas por ligación de secuencias más cortas, Cassettes de expresión recambinantee La presente invención además proporciona cassettes de expresión recombinantee que comprenden un ácido nucleico de la presente invención. Una secuencia de ácido nucleico que codifica para el polipéptido deseado de la presente invención, por ejemplo un cADN o una secuencia genomica que ponen en código un polipéptido de longitud llena de la presente invención, puede usarse para construir un cassette de expresión recombinantee que puede introducirse en la célula del huésped deseado. Un cassette de expresión recombinantee comprenderá típicamente un polinucleótido de la presente invención operablemente unido a la iniciación
transcripcional regulador de las secuencias que dirigirán la transcripción del polinucleótido en la célula del huésped intencional, tales como los tejidos de una planta transformada. Por ejemplo, los Rectores de expresión de planta pueden incluir (1) un gen de la planta clonado bajo el control transcripcional de las secuencias reguladoras 5' y 3' y (2) un marcador selectablje dominante. Tales vectores de expresión de la planta también pueden contener, si se desea, un promotor regulador de la región (por ejemplo, un inducible o constitutivo, medioambientalmente- o desarrolladoramente-regulado, célula- tejido-especifico/selectivo de expresión) , un sitio de partida de la iniciación de la transcripción, un sitio de enlazamiento de ribosoma, una señal de procesamiento de ARN, un sitio de terminación de la transcripción, y/o una señal de poliadenilación. Un fragmento de promotor de planta puede emplearse qué dirigirá la expresión de un polinucleótido de la presente invención en todos los tejidos de una planta regenerada. Tales promotores son refleridos aquí como promotores
"constitutivos" y son activos bajo la mayoría de las condiciones medioambientales estados de desarrollo diferenciación de la céllula. Ejemplos de promotores constitutivos incluyen el virus del mosaico de la coliflor (CaMV) 35S región de iniciación de transcripción, el promotor
1'- o 2'- derivado a partir de T-ADN de Agrobacterium turne faeciens, el promotor ubiquitin 1, el promotor Smas, el promotor alcohol cinnamilo deshidrogenasa (U.S. Patent No. 5,683,439 americana), el promotor Nos, el promotor pEmu, el promotor rubisco, y el promotor GRPI-8 Alternativamente, el promotor de la planta puede dirigir la expresión de un polinucleótido de la presente invención en un tejido específico o puede estar por otra parte bajo el control medioambiental o de desarrollo más preciso. Tales promotores son referidos aquí como los promotores "inducibles". Coidiciones medioambientales que pueden efectuar la transcripción por los promotores inducibles incluyen los ataciues patógenos, las condiciones anaerobias, o la presencia ie luz. Ejemplos de promotores inducibles son el promotor Achí eme es inducible por hipoxia o tensión de frío, el promoter de Hsp70 que es inducible por la tensión de calor, y el promotor PPDK eme es inducible por la luz, Los ejemplos de promotores bajo control de desarrollo incluyen a los promotores eme únicamente inician la transcripción, o prefererjcialmente, en ciertos tejidos, tales como las hojas, raíces, fruta, semillas, o flores. Los promotores ejemplares incluyen al promotor 5126 antera-específico (U.S. Patent Nos. 5,689,049 y 5,689,051), promotor del glb-1, y el promotor gamma-zein. También vea, por
ejemplo, las aplicaciones U.S. Patent 60/155,859 y 60/163,114. El funcionamiento de un promotor puede variar, también dependiendo de su localización en el genoma. Así, un promotor inducible puede volverse totalmente o parcialmente constitutivo en ciertas situaciones. Promotores heterologos y no-heterologos (es decir, endógenos) pueden emplearse para dirigir expresión de los ácidos nucleicos de la presente invención. Estos promotores también pueden usarse, por ejemplo, en los cassettes de expresión recombinantee para manejar la expresión de contrasentido de los ácidos nucleicos para reducir, aumentar, o alterar la concentración y/o composición de las proteínas de la presente invención en un tejido deseado. Así, en algunas modalidades, el ácido nucleico construido comprenderá un promotor, funcional en una célula de la planta, operablemente unido a un polinucleótido de la presente invención. Los promotores útiles en estas modalidades incluyen promotores endógenos que dirigen la expresión de un polipéptido de la presente invención. En algunas modalidades, pueden introducirse ácidos nucleicos aislados que sirven como promotor o elementos intensificadores en la posición apropiada (generalmente flujo ascendente) de una forma no-heterologa de un polinucleótido de la presente invención para regular la expresión hacia arriba o hacia abajo de un polinucleótido de la presente
eucariotico. Una secuencia del intron puede agregarse a la región 5 ' no traducida o la secuencia codificada de la secuencia codificada parcial para aumentar la cantidad del mensaje maduro que se acumula en el citosol. La inclusión de un intron empalmablemente er. la unidad de transcripción en ambas estructuras de exprési:on, planta y animal, se han mostrado para aumentar la expresión del gen en ambos niveles: mARN y proteína hasta 1000-pJegar . Buchman y Berg, Mol . Cell Biol . 8: 4395-4405 (1988); Callis et al . , Genes Dev. 1: 1183- 1200 (1987) . Tal mejora del intron de expresión del gen es típicamente más grande cuandc se pone cerca de la terminación 5' de la unidad de transcripción. El uso de introns de maíz Adhl-S intron 1, 2, y 6, intron Bronze-1 son conocidos en el arte. Generalmente vea, The Maize Handbook, Chapter 116,
Freeling and Walbot, Eds., Springer, New York (1994) . El vector comprende las secuencias a partir de un polinucleótido de la presente invención ípicamente comprenderá un gen marcador que confiere un fenotipo selectable en las células de la planta. Los vectores típicos útiles para la expresión de genes en las plantas más altas es bien conocido en el arte e incluye vectores derivados del plasmido (Ti) tumor-inducción de Agrobacterium tumefaciene descrito por Rogers et al . , Meth. in Enzymol . , 153:253-277 (1987) Un polinucleótido ¡de la presente invención puede
expresarse en sentido orientación o contra sentido como se desee. Se apreciará que el control de expresión del gen en sentido orientación o contra sentido pueden tener un impacto directo en las características observables de la planta. Puede usarse la tecnología contrasentido convenientemente para inhibir la expresión del gen en las plantas . Para lograr esto, un segmento de ácido nucleico del gen deseado se clona y operablemente se une a un promotor tal que la contra sentido del cordón de ARN se: transcribirá. La estructura se transforma entonces en las plantas y los cordones contrasentido de ARN se produce. En las células de la planta, se ha mostrado que el contresentido ARN inhibe la expresión del gen previniendo la acumulación de mRNA el cual codifica la enzima de interés, vea, por ejemplo, Sheehy et al . , Proc. Nat 'l . Acad. Sci . (USA) 85: 8805-8809 (1988); y Hiatt et al . , U.S. Patent ?o. 4,801,340. Otro método de supresión es la supresión sentido (es decir, co-supresión) . La introducción de ácido nucleico configurada en sentido orientación ha mostrado ser un medio eficaz mediante el cual se bloquea la transcripción de genes designados. Para un ejemplo del uso de este método para modular la expresión de genes endógenos vea, ?apoli et al . , The Plant Cell 2: 279-289 (1990) y la U.S. Patent ?o. 5,034,323. También pueden usarse moléculas de ARN catalíticas
o ribozimas para inhibir expresión de genes de la planta. Es posible diseñar ribozimas que específicamente aparea con virtualmente cualquier ARN designado y se pega el al fosfodiester espinazo a una situación específica, mientras funcionalmente inactivando el AR? designado. Llevando a cabo esta hendidura, la ribozima no es alterada por si misma, y es así capaz de reciclar y pegerse otras moléculas, haciéndole una verdadera enzima. La inclusión de secuencias de ribozima dentro del RNAs contrasentido' confiere actividad AR?- pegándose en ellos, por eso se aumenta la actividad de las estructuras. El diseño y uso de ribozimas AR?-específico se describen en Haseloff et al . , Nature 334: 585-591 (1988). Una variedad de agentes de reticulación, agentes alquilantes y especies generadoras de radicales como los grupos colgantes en los polinucleótidos de la presente invención pueden usarse para ligar, etiquetar, detectar, y/o anclar los ácidos nucleicos. Por ejemplo, Vlassov, V. V., et al . , Nucleic Acids Ree . (1986 l 14:4065-4076, describe enlaces covalentes de un fragmento de AD? simple-cordón con los derivado alquilados de nucleótidos complementarios para las secuencias designadas. Un informe de trabajo similar por el miemo grupo es que por Knorre, D. G. , et al . , Biochimie (1985) 67:785-789. Iverson y Dervan también mostraron secuencia-específica de heijdidura de AD? simple-cordón mediada por la incorporación de un nucleótido modificado el
cual fue capaz de activar la hendidura (JJ Am . Chem. Soc.
(1987) 109:1241-1243). Meyer R. B., et al . ; JJ Am. Chem.
Soc. (1989) 111:8517-8519, el efecto de reticulación covalente para un nucleótido designado que usa a un agente alquilante complementario al simple-cordón de secuencia del nucleótido designado. Una reticulación fotoactivada para oligonucleotides simple-cordón mediada por psoralen se descubrió por Lee, B. L., et al . , Biochemistry (1988)
27:3197-3203. el Uso de reti Lculación en la formación de la triple-hélice que forma las sondas también se descubrió por
Home, et al . , J. Am. Chem. Soc. (1990) 112:2435-2437. El uso de N4, N4-etanocitosina co:no un agente alquilante para reticular la simple-cordón de oligonucleotidos también se ha descrito por Webb y Matteue:ci, J. Am. Chem. Soc. (1986) 108:2764-2765; Nucleic Acids Res . (1986) 14:7661-7674;
Feteritz et al . , J. Am. Chen. Soc. 113:4000 (1991). Varios compuestos para ligar, detectar, etiquetar, y/o pegar los ácidos nucleicos son conocidcs en el arte. Por ejemplo, vea
U.S. Patent Nos . 5,543,507; 5,672,593; 5,484,908; 5,256,648; y, 5,681941. Proteínas Las proteínas aisladas de la presente invención comprenden un polipéptido que tiene por lo menos 10 aminoácidos de un polipéptido de la presente invención (o las variantes conservadoras del mismo) tales como aquéllas
codificadas por cualquiera de los polinucleótidos de la presente invención como discute más totalmente arriba (por ejemplo, Tabla 1) . Las proteínas de la presente invención o variantes de las mismas pueden comprender cualquier número de residuos de aminoácido inmediatos a partir de un polipéptido de la presente invención, en donde ese número se selecciona del grupo de enteros que consisten de 10 al número de residuos en un polipéptido de cuerpo entero de la presente invención. Opcionalmente, eeta subsecuencia de aminoácidos inmediatos es por lo menos 15, 20, 25, 30, 35 o 40 aminoácidos en longitud, a menudo por lo menos 50, 60, 70, 80 o 90 aminoácidos en longitv.d. Además, el número de tales subsecuencias puede ser cualquier entero seleccionado del grupo que consiste de 1 a 20, como 2 , 3 , 4 o 5. La presente invención proporciona una proteína que comprende un polipéptido que tiene una secuencia especificada identidad/similitud con un polipéptido de la presente invención. El porcentaje de identidad/similitud de la secuencia es un entero seleccionado del grupo que consiste de de 50 a 99. Los valores de identidad/similitud de secuencia ejemplares incluyen 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% y 95%. Puede determinarse la identidad de la secuencia usando, por ejemplo, los algoritmos GAP, CLUSTALW, o BLATS. Como aquellos de hcibilidad apreciarán, la presente invención incluye, pero no se limita a, polipéptidos
catalíticamente activos de la presente invención (es decir, enzimas) . Polipéptidos catalíticamente activos tienen una actividad específica de por lo menos 20%, 30% o 40% y preferentemente de al menos 50%, 60% o 70%, y el más preferido es de por lo menos 80%, 90% o 95% del polipéptido, nativo, endógeno (no-sintético) . Además, la especificidad del substrato (kcat/Km) es opcionalmente substancialmente similar al polipéptido endógeno nativo (no-sintético) . Típicamente, el Km será por lo menos el 30%, 40% o 50%, del polipéptido endógeno nativo (no-sintético) ; y más preferentemente por lo menos 60%, 70%, 80% o 90%. Los métodos de ensayo y medidas de cuantificación de la actividad enzimática y especificidad del substrato (kca/Km) , es bien conocido por aquellos con habilidad en el arte. Generalmente, las proteínas de la presente invención, cuando se presentan como un inmunogeno, saque producción de un anticuerpo específicamente reactivo para un polipéptido de la presente invención. Además, las proteínas de la preeente invención no ligarán para antisera levantado contra un polipéptido de la preeente invención el cual ha sido totalmente immunosorbido con el mismo polipéptido. inmunoensayos para la determinación de enlazamiento son bien conocidos por aquellos con habilidad en el arte. Un inmunoensayo preferido es un inmunoensayo competitivo. Así, las proteínas de la presente invención pueden emplearse como
inmunogenos para la Construcción de anticuerpos inmunoreactivos para una proteína de la presente invención para tales utilidades ejemplares como inmunoensayos o técnicas de purificación de proteína. Expresión de proteínas en células huésped Usando los ácidos nucleicos de la presente invención, uno puede exprés.r una proteína de la presente invención en una célula diseñada recombinanteemente tal como bacteria, levadura, insecto, mamífero, o preferentemente las células de la planta. Las células producen la proteína en una condición no-natural (por ej mplo, en cantidad, composición, situación, y/o tiempo) , porque ellas han sido genéticamente alterados a través de la intervención humana para hacer que. Se espera que aquellos de habilidad en el arte sean conocedores en los numerosoe sistemas de expresión disponible para la expresión de una ácido nucleico codificando a una proteína de presente invención. Ningún esfuerzo por describir en detalle varios de los métodos conocidos para la expresión de proteínas en procariotes o eucariotes se hará. En breve resumen, la expresión de ácidoe nucleicoe aielados codificando a una proteína de la preeente invención se logrará típicamente por la unión operablemente, por ejemplo, el ADN o cADN para un promotor (el cual es o constitutivo o regulatable) , seguido por la incorporación en un vector de expresión. Los /ectores pueden ser convenientes
para la repetición e integración en procariotes o eucariotee, La expreeión típica de los vectores contienen transcripción y terminadores de traducción, secuencias de iniciación, y promotores útiles para la regulación de la expresión del ADN que codificando una proteína de la presente invención. Para obtener altos niveles de expresión de un gen clonado, es deseable construir vectores de expresión que contienen, al mínimo, un promotor fuerte para dirigir la transcripción, un sitio de unión de riboeoma para iniciación traduccional, y un terminador de transcripción/traducción. Una pereona con habilidad reconocerá que pueden haceree modificaciones a una proteína de la presente invención sin disminuir su actividad biológica. Algunas modificaciones pueden hacerse facilitar la clonación, expresión, o incorporación de la molécula objetivo en una proteína de fusión.' Tales modificaciones son bien conocidas por aquellos con habilidad en el arte e incluyen, por ejemplo, una metionina agregada al amino terminal para proporcionar un sitio de iniciación, o aminoácidos adicionales (por ejemplo, poli His) puesto en cualquier terminal para crear la purificación de secuenciae convenientemente localizadas. También pueden introducirse sitios de restricción o codones de terminación Síntesis de proteínas Las proteínas de la presente invención pueden construirse usando los métodos sintéticos no-celulares. La
eíntesis de proteínas en faee eólida de menos de aproximadamente 50 aminoácidos en longitud pueden ser logradas atando el aminoácido C-terminal de la secuencia a un soporte insoluble seguido por la adición secuencial de los aminoácidos restantes en la secuencia. Las técnicas para la síntesis de fase eólida son descritas por Barany y Merrifield, Solid-phaee Pepti de Syntheeis, pp. 3-284 en The
Peptides : Análieie, Sínteeie, Biology Vol . 2 : Special
Methode in Peptide Synthesis, PartA. ; Merrifield, et al . , JJ Am. Chem. Soc. 85: 2149-2156 (1963), y Stewart et al . , Solid
Phase Peptide Syntheeie, 2 ed. , Pierce Chem. Co., Rockford, III. (1984). Lae proteínae de mayor longitud pueden eer sintetizadas por condensación de las terminaciones amino y carboxi de fragmentos más coi tos . Los métodos para formación de enlaces de péptido por la activación de una terminación carboxi final (por ejemplo, por el uso del reactivo de acoplamiento N,N'-dicicilohexilcarbodiimida) se conoce por aquellos con habilidad. Purificación de proteínas Lae proteínae de la presente invención pueden eer purificadae por técnicae estádar bien conocidae por aquelloe con habilidad en el arte. Las proteínas producidas recombinantemente de la presente invención pueden expresaree directamente o pueden expresaree como una proteína de fusión. La proteína recombinantee ee purifica por una combinación de
lisis celular (por ejemplo, eonicación, prensa francesa) y cromatografía de afinidad. Para los productos de fusión, la digeetión eubsecuente de la proteína de fusión con una enzima proteolítica apropiada libera la proteína recombinante deseada. Las proteínas de |esta invención, recombinante sintética, puede purificarse a pureza sustancial por técnicas normales bien conocidas en el arte, incluyendo solubilización detergente, precipitación s slectiva con tales substancias como eulfato de amonio, cromatografía de columna, métodos de inmunopurificación, y otros Vea, por ejemplo, R. Scopes,
Protein Purification, : Principies and Practice, Springer- Verlag: New York (1982); Deutscher, Guide to Protein
Purification, Academic Press (1990) . Por ejemplo, pueden levantarse los anticuerpos a las proteínas como ee deecribe aquí. La purificación a partir de E. coli puede lograree siguiendo los procedimientos en U.S. Patent No. 4,511,503. La proteína puede aielarse entonces de célulae que expresan la proteína y ademáe puede puriflicarse por las técnicas estándar de química de proteína como se describe aquí . La detección de la proteína expresada se logra por métodos conocidoe en el arte e incluyen, por ejemplo, radioinmunoensayoe, técnicas manchando occidental o inmunoprecipitatión Introducción de ácidos nucleipos en células huésped El método de introducir un ácido nucleico de la
presente invención en una célula huésped no es crítico a la invención instantánea. Se usan métodoe de transformación o transfección convenientemente. De acuerdo con, una amplia variedad de métodos que se hc.n desarrollado para insertar una secuencia de ADN en el geno a de una célula huésped para obtener la transcripción y/o traducción de la secuencia para efectuar los cambios del fe otipicos en el organismo. Así, cualquier método que proporciona una introducción eficaz de un ácido nucleico, puede empl Learse, A. Transformación de la planta Un ácido nucleico que comprende un polinucleótido de la preeente invención se introduce opcionalmente en una planta. Generalmente, el polinucleótido se incorpora primero en un cassette de expresión recombinante o vector. Pueden introducirse ácidos nucleicos aisladoe de la preeente invención en las plantas de acuerdo con las técnicas conocidas en el arte. Las técnicas para la transformación de una amplia variedad de especíes mayores de plantas son bien conocidas y descritas en la 1iteratura técnica, científica, y de patente. Por ejemplo, vea ?/eieing et al . , Ann . Rev. Genet .
22: 421-477 (1988). Por ejemplo, la eetructura de ADN puede introducirse directamente en el ADN genomico de la célula de la planta usando técnicas tales como electroforación, foración con polietilenglicol (PEG) , bombardeo de partículas, entrega de fibra de silicio, o microinyección de planta,
células de protoplastoe o callo embriogenico. Vea, por ejemplo, Tomes, et al., Dire¿t DNA Transfer into Intact Plant Cells Via Microprojectile Bombardment. pp.197-213 in Plant Cell Tiseue, and Organ Cultura, Fundamental Methods. Eds. 0. L. Gamborg and G.C. Phillips. Springer-Verlag Berlín
Heidelberg Nueva York, 1995,; vea, U.S. Patent ?o. 5,990,387 la introducción de estructuras de AD? que usan la precipitación con PEG se descjriben en Paszkoweki et al . , Embo 3: 2717-2722 (1984). Se describen técnicas de electroforación en Fromm et el . , Proc. Nati . Acad. Sci . (USA) 82: 5824 (1985). Se describen técnicas de transformación balística en Klein et al . , Na ture 327: 70-73 (1987) . Técnicas de transformación mediadas con
Agrobacterium turne fac i ene se describen bien en la literatura científica. Vea, por ejemplo Horsch et al . , Science 233: 496-498 (1984); Fraley et al . , Proc. Nati . Acad. Sci . (USA) 80: 4803 (1983); y, Plant Molecular Biology: A Laboratory Manual , Chapter 8, Clark, Ed. , Springer-Verlag, Berlín (1997). Las estructuras de AD? pueden combinarse con T-AD? conveniente que flanquea las regiones e introducirse en un huéeped vector convencional de Agrobacteri un turne faciene . La función de virulencia del huésped Agroba cterium tumefaciens que dirigirá la inserción de la eetructura y marcador adyacente en la planta AD? celular cuando la célula se infecta por la bacteria, Vea, U.S. Patent ?o. 5,591,616 Aúneme
Agrobacterium es principalmente útil en el dicotiledóneas, ciertas monocotiledóneas pueden ser transformadas por
Agr oba c t eri um. Por ejemplo, la transformación de
Agrobacterium de maíz se describe en U.S. Patent No. 5,550,318. Otros métodos de transfección o transformación incluyen (1) transformación mediada por Agrobacterium rhizogenee (vea, por ejemplo, Lichtenstein and Fuller In: Genetic Engineering, vol. 6, PWJ Rigby, Ed. , London, Academic Press, 1987,; y Lichtenstein, C . P. , and Draper, J . , In: DNA Cloning, Vol. II, D. M. GJober , Ed., Oxford, IRI Prees, 1985), Aplication PCT/US87/02512 (WO 88/02405 published april
7 1988) describe el uso de A. rhizogenee cordón A4 y su plasmido Ri junto con los vectores pARC8 o pARC16 de A. tumefaciene (2) captación de AD? mediado por liposomae (vea, por ejemplo, Freeman et al . , Plant Cell Phyeiol . 25: 1353
1984)), (3) el método del vórtice (vea, por ejemplo, Kindle,
Proc. Nati . Acad. Sci . , (USA) 87: 1228 (1990) El ADN también puqde introducirse en lae plantas por traneferencia directa de ADN en el polen como se describe por Zhou et al . , Methode in Enzymology, 101:433 (1983); D.
Hees, Intern . Rev. Cytol . , 107:367 (1987); el Luo et al .
Plant Mol . Biol . Repórter, 6:165 (1988). La expresión de polipéptido codificando ge:?es puede obtenerse por la inyección del ADN en los órganos reproductores de una planta
como se deecribe por el Pena et al . , Nature, 325.:274 (1987)
El ADN también puede inyectarse directamente en las células de embriones inmaduros y la rehidratación de embriones desecadoe como ee deecribe por Neuhaue et al . , Theor. Appl . Genet . , 75:30 (1987); y Benbrook et al . , in Proceedinge Bio Expo 1986, Butterworth, Stor.eham, Mass., pp. 27-54 (1986). Una variedad de virusee de plantas que pueden emplearse como vectores es conocida en el arte e incluye el virus del moeaico de la coliflor (CaMV) , geminivirus, virus del mosaico de (brome), y virue del moeaico del tabaco. JB. Tranefección de procariotée, eucariotes menores y célulae animalee Células huésped animales y eucarioticas menoree
(por ejemplo, levadura) son competentes o dieron competente para la transfección por varios medios. Hay varios métodos muy conocidos para introducir ADN en las células animales Éstos incluyen: precipitación de fosfato de calcio, fusión de las células del destinatario con protoplastos bacterianos que contienen ADN, tratamiento de las células del destinatario con liposomas que contienen ADN, dextran de DEAE, electroforación, biolisticae y micro-inyección de ADN directamente en lae célulae . Las células transfectadas son bien cultivadas por medios bien conocidos en el arte. Kuchler, R.J., Biochemical Methods in Cell Cul ture and Virology, Dowden, Hutchinson and Ross, Inc. (1977)
Regeneración de planta transgenica Las células de la planta, las cuales resultan directamente o son derivadas a partir de técnicas de introducción de ácido nucleico pueden cultivarse para regenerar una planta entera que poeee el genotipo introducido. Tales técnicas de regeneración confían a menudo en la manipulación de ciertas fitohormonas en un medio de cultivo para crecimiento de :ejido. Por ejemplo, lae células de las plantas pueden regenerarse, a partir de células eimplee, tejido del callo o discos de la hoja de acuerdo con técnicas estándar para cultivo de tejidos de las plantas. Se sabe bien en el arte que pueden cultivarse varias células, tejidos, y órganos de casi cualquier planta con éxito para regenerar una planta entera. La regeneración de una planta a partir de cultivo de protoplastos se describe en Evans et al . , Protoplaste leolation and Cul tura, Handbook of Plant Cell Cul tura, Macmillan Publishing Co., New York, pp. 124-176 (1983); y Binding, Regeneration of Plants, Plant Protoplasts, CRC Press, Boca Ratón, pp., 2L-73 (1985). La regeneración de plantas a partir de simplee protoplaetoe de la planta o de varios explantas es bien conocida en el arte. Vea, por ejemplo, Methode for Plant Molecular Biology, A. Weissbach and H. Weieebach, ede., Academic Prese, Inc., San Diego, Calif. (1988). Esta regeneración y el proceso de crecimiento incluye los pasos de
selección de células transformantes y retoños, arraigando los retoños transformantes y crecimiento de las plántulas en la tierra. Para el cultivo de células de maíz y regeneración vea generalmente, The Maize Handbook, Freeling and Walbot, Eds., Springer, New York (1994) ; Corn and Corn Improvement, 3rd edition, Sprague and Dudley Eds., American Society of Agronomy, Madison, Wieconein (1988) . Para la traneformación y regeneración de maíz vea, G?]*don-Kamm et al . , The Plant Cell , 2:603-618 (1990) La regeneración de plantae que contienen el polinucleótido de la presente invención e introducido por Agrobacterium a partir de las hojas de las plántula (explants) puede lograrse como se describe por Horsch et al . , Science,
227:1229-1231 (1985). En eete procedimiento, loe transformantes son crecidos en preeencia de un agente de selección y en un medio que ijnduce la regeneración de retoños en las especiee de la planta a traneformarse como se deecribe por Fraley et al . , Proc. Nati . Acad. Sci . (USA) , 80:4803
(1983) . Este procedimiento produce los retoños típicamente dentro de dos a cuatro semanas y estos retoños transformantee ee tranefieren entonces a un medio apropiado para la inducción- de raíz que contiene el agente selectivo y un antibiótico para prevenir el crecimiento bacteriano. Lae plantas transgenicas de la presente invención pueden eer fértiles o estériles
Una persona con habilidad reconocerá que después de que el caseette de expresión recombinantee está incorporado establemente en las plantas transgenicas y confirmado para ser operable, puede introdúcirse en otras plantas por el cruce sexual . Cualquiera de varias técnicas de cría normalee puede usaree, dependiendo de las especies a ser cruzadas. En las cosechas vegetativamente propagadas, lae plantae transgenicas maduras pueden eer propagadae por la toma de cortes o por técnicas de cultivo de tejidos para producir múltiples plantas idénticas La selección de transgenicae deseables se hace y se obtienen nuevae variedadee que se propagan vegetativamente parla uso comercial. En la semilla las cosechas propagadas, les plantas maduras transgenicas pueden ser cruzadae consigo-miemae para producir un homocigoto de la planta producida. La planta innata produce semilla que contiene el n evo ácido nucleico heterologo recientemente introducido. Sstas semillas pueden crecerse para producir plantas ?ue producirían el fenotipo seleccionado. Las partes obtenidas a partir de la planta regenerada, como flores, eemillae, hojae, ramae, fruta, y similares son incluidas en la invención, con tal de que eetae partes comprenden células que comprenden el ácido nucleico aislado de la presente invención. La descendencia y variantes, y los mutantes de las plantas regeneradas también están incluidos dentro del alcance de la invención,
proporciona que esas partes comprenden las secuencias de ácido nucleico introducidas . Las plantas transgenicas expresando un polinucleótido de la presente invención puede protegerse para la transmisión del ácido nucleico de la presente invención por, por ejemplo, técnicas estándar de detección y ADN. La expresión al nivel de ARN puede determinarse inicialmente para identificar y cuantificar la expresión-positiva en las plantas. Pueden emplearee técnicas estándar para el análisis de AR? y pueden ser incluidas ensayoe de amplificación PCR ueando primeros de oligonucleotido diseñados para amplificar únicamente las plantillas de ARN heterologas y ensayoe de hibridación de la disolución usando sondas heterologas ácido nucleico-específicas. Las plantas ARN-positivas pueden entonces analizarse para expresión de proteína por análisis de manchado occidental usando los anticuerpos específicamente reactivos de la presente invección. Además, en la hibridación in ei tu e inmunocitoquímica de acuerdo con los protocolos estándar puede hacerse usando sonda de polinucleótido ácido nucleico especifico y anticuerpos, respectivamente, para localizar sitios de expresión dentro del tejido transgenico. Generalmente, normalmente ee protegen variae líneas transgenicas para el ácido nucleico incorporado para identificar y seleccionar lae plantae con loe perfiles de expresión más apropiados
Una modalidad preferida es una planta transgenica que es el homocigoto para ác:.do nucleico heterologo agregado; es decir, una planta tranegenica que contiene dos secuencias de ácido nucleico agregadas, un gen en el mismo sitio en cada cromosoma de un par del cromosoma. Una planta transgenica homocigoto puede obteners : por cópula (autofecundación) sexualmente a una planta transgenica heterocigoto que contiene un simple ácido nucleico heterologo agregado, germinando alguna de las semi lias producidas y analizando las plantas resultantes producidas para alterar la expresión de un polinucleótido de la presente invención relativa al control de la planta (es decir, nativo, no-transgenico)
Cruzando-atrás a una planta paternal y fuera-cruzando con una planta no-transgenica también esta contemplado. Nivelee de modulación y/o compoeición del polipéptido La presente invención ademáe proporciona un método para la modulación (es decir , aumentando o disminuyendo) la concentración o proporción de los polipéptidos de la presente invención en una planta o parte de la misma. La modulación puede efectuarse aumentando o disminuyendo la concentración y/o la proporción de los polipéptidos de la presente invención en una planta. El método comprende la introducción, en una célula de la planta de un caseette de expreeión recombinante que comprende un polinucleótido de la presente invención como se describe anteriormente para obtener una
célula de la planta transgenica, cultivando la célula de la plantav tranegenica bajo condiciones de crecimiento de celular de la planta transgenica, e induciendo o reprimiendo la •expresión de un polinucleótido de la presente invención en la planta transgenica durante un tiempo suficiente para modular la concentración y/o las proporciones de los polipéptidos en la planta transgenica o parte de la planta, En algunas modalidades, la concentración y/o proporciones de los polipépt dos de la presente invención en una planta puede modularse aJ.terando, in vivo o in vi tro, el promotor de un gen regula la expresión del gen hacia arriba- hacia abajo-. En algunas modalidades, las regiones codificadas de genes nativos de la presente invención pueden alterarse vía substitución, adición, inserción, o substracción para disminuir la actividad de la enzima codificada. Por ejemplo, veei K iec, U.S. Patent 5,565,350;
Zarling et al . , PCT/US93/038 8. Y en algunas modalidades, un ácido nucleico aislado (por e ;jemplo, un vector) comprendiendo una secuencia del promotor eis transfectado en una célula de la planta. Como consecuencia , una célula de la planta que comprende el promotor operabl s ente unido a un polinucleótido de la presente invención ee selecciona para por medios conocidoe por aquelloe con ha ilidad en el arte como, pero no limitó a, mancha del eur, eecuenciación de ADN, o análieis PCR usando loe primeros específicos para el promotor y para
el gen y detectando los amplicones producidos de allí. Una planta o parte de la planta, alterada o modificada por las modalidades anteriores es desarrollada bajo condiciones de formación de planta durante un tiempo suficiente para modular la concentración y/o proporc :Iones de los polipéptidos de la presente invención en la planta. Las condiciones de formación de planta son bien conocidas en el arte y se discuten brevemente, eupra . En general, la conóentración o las proporciones de oe polipéptidos se aumentan o disminuyen por al menos 5%, 10%, 20%, 30%, 40%, 50%, 60% ¡, 70%, 80% o 90% relativo a una planta de control nativa, perte de la planta, o célula que carece del cassette de expresión recombinante mencionado. La modulación en la presente invención puede ocurrir durante y/o subsecuente al crecimiento de: la planta a la fase deseada de deearrollo. La modulación del ácido nucleico de expreeión temporalmente y/o en tej i ios en particular puede ser controlada empleando el promotor apropiado operablemente unido a un polinucleótido de: la presente invención en, por ejemplo, orientación sentido o contrasentido como se discutió con mayor detalle, eupra . La inducción de expresión de un polinucleótido de la presente invención también puede controlarse por la administración exógena de una cantidad eficaz de compuesto inductor. Los promotores de inducibles y los compuestos inductores los cuales activan la expresión a
partir de estos promotores son bien conocidos en el arte. En las modalidades preferidas, los polipéptidos de la presente invención son modulados en monocotiledóneas, particularmente maíz. UTRs y preferencia de codon En general, se ha encontrado la eficacia traduccional para eer regulada por loe elementos de la secuencia específicos en la región 5' no-codificada o no traducida (5' UTR) del ARN Los motivos de la eecuencia poeitivos incluyen las secuencias consenso de iniciación traduccional (Kozak, Nucleic Acide Res .15:8125 (1987)) y la estructura (cap) 7-metilguanosina (Drumond et al . ; Nucleic Acide Ree . 13:7375 (1985)). Jos elementos negativos incluyen la estructura UTR 5' intramolecular tallo-vuelta (Muesing et al . , Cell 48:691 (1987)) y secuencias AUG o marcos cortos abiertos de lectura precedidos por un UTR 5' apropiado
(Kozak, supra, Rao et al . , Mol . and Cell Biol . 8:284 (1988)).
De acuerdo con, la presente invención proporciona regiones no traducidas 5' y/o 3' para la modulación de la traducción de secuencias heterologas codificadas. Además, los segmentoe de polipéptido-codificado de loe polinucleótidos de la presente invención puede modificarse para alterar el ?so del codon. El uso del codon alterado puede emplearse para alterar la eficacia traduccional y/o perfeccionar la secuencia codificada para la
expresión en un huésped dése do tal como para perfeccionar el uso del codon en una secuencia heterologa para la expreeión en el maíz. El ueo de codon en las regiones codificadas de los polinucleótidoe de la presente invención puede ser analizada eetadíeticamente usando paquetee de eoftware comercialmente dieponibles tales como "Codon Preferente" disponible de University of Wisconsin Genetics Computer Group
(vea Devereaux et al . , Nucleí c Acide Ree . 12: 387-395 (1984)) o MacVector 4.1 (Eastman Kodak Co., New Haven, Conn.). Así, la presente invención proporciona un uso de codon de frecuencia característica de la región codificada de por lo menos uno de los polinucleótildos de la presente invención. El número de polinucleótidos que pueden usaree para determinar una frecuencia del ueo de codon puede eer cualquier entero de 1 al número de polinucleótidoe de la preeente invención como ee proporciona aquí. Opcionalmente, loe polinucleótidoe eerán lae eecuencias de cuerpo entero. Un número ejemplar de secuencias para el análisis estadíetico puede eer por lo menos 1, 5, 10, 20, 50 o 100. Secuencia lenta La preeente invención proporciona métodoe para la secuencia lenta usando polinucleótidos de la presente invención, y composiciones reisultantee de allí. La eecuencia lenta se describe en la publicación PCT No. WO 97/20078. Vea también, Zhang, J.- H., et al . Proc. Nati . Acad. Sci . USA
94 : 4504-4509 ( 1997 ) Generalmente, la secuencia lenta proporciona medios para la generación de bibliotecas de polinucleótidos que tienen una característica deseada que puede seleccionarse o puede protegerse para. Se generan bibliotecas de polinucleótidos recombinantes de una población de polinucleótidos de la secuencia relacionado que comprende regiones de la eecuencia cue tienen la identidad de la secuencia sustancial y pueden ser reco binadas homólogamente in vi tro o in vivo. La población de secuencia-recombinada de polinucleótidos comprende una sub-población de polinucleótidos que posee caracterí ticas ventajoeae o deeeadae y qué pueden eeleccionaree mediante una selección conveniente o método protegido. Las características pueden ser cualquier propiedad o atributo capaz de seleccionarse para o detectado en un sis ema protegido y puede incluir propiedades de: una prote?na codificada, un elemento transcripcional, una secuencia que controla la transcripción, ARN procesando, estabilidad de ARN, estructura de cromatina, traducción, u otra propiedad de la expresión de un gen o transgen, un elemento repli.cativo, un elemento proteína-enlazante, o similares, ta.es como cualquier rasgo que confiera una propiedad selecc:.onable o detectable. En algunas modalidades, la característica seleccionada será un Km disminuido y/o Kcat incrementado sobre la proteína tipo-salvaje como se proporciona aquí. En otras modalidades, una
proteína o polinucleótido generados a partir de la secuencia lenta tendrán una afinidad ligando enlazante mayor que el polinucleótido no-lento tipp-salvaje. El aumento en tales propiedades puede ser por lo menos 110%, 120%, 130%, 140% o por lo menos 150% del valor del tipo-salvaje. Secuencias genérica y consenso Los polinucleótidos y polipéptidos de la presente invención incluyen aquellos que tienen: (a) una secuencia genérica de por lo menos dos polinucleótidos o polipéptidos homólogos, respectivamente, de la presente invención; y, (b) una secuencia coneenso de por lo menos tres polinucleótidos o polipéptidoe homólogos, respectivamente, de la presente invención. La secuencia genérica de la presente invención comprende cada especie de polipéptido o polinucleótido abrazada por el polipéptiio genérico o secuencia del polinucleótido, respectivame:?te. Lae eepeciee individuales abarcadae por un polinucleótido que tiene un aminoácido o secuencia conseneo de ácido nucleico puede uearse para generar anticuerpos o producir sondas de ácido nucleico o primeros para proteger para homólogos en otras especies, genero, familias, órdenes, clases, fila, o reinos. Por ejemplo, un polinucleótido que tiene una secuencia consenso a partir de un gen de una familia de Zea maye puede usarse para generar anticuerpo o sondas de ácido nucleico o primeros a otras especiee de Gramineae como el trigo, arroz o sorgo.
Alternativamente, un polinucleótido que tiene una secuencia consenso generado de los genes ortólogos puede uearse para identificar o aielar ortólogos de otro taxa. Típicamente, un polinucleótido que tiene una secuencia consenso eerá por lo menos 9, 10, 15, 20, 25, 30 o 40 aminoácidos en longitud, o 20, 30, 40, 50, 100 o 150 nucleótidos en longitud. Como aquellos con habilidad en el arte eetán conecientee, una eubstitución conservadora del aminoácido puede usarse para aminoácidos que difieren entre la secuencia alineada pero son del miemo grupo de la eubetitución conservadora .como se discute anteriormente. Opcionalmente, no más de 1 o 2 aminoácidos conservadores ee eustituyen para cada 10 aminoácidos de longitud de la secuencia consenso. Secuencias similareis usadas para la generación de una secuencia genérica o conejenso incluyen cualquier número y combinación de variantes allejlicas del mismo gen, ortólogo, o secuencias paralogas como ee proporciona aquí. Opcionalmente, lae eecuenciae eimilares usadas en la generación de una secuencia genérica o consenso son identificadas usando la probabilidad de la suma máe: pequeña (P(N)) del algoritmo BLAST. Se listan varios proveedores de software del análisis-secuencia en el capítulo 7 de Current Protocols in Molecular Biology, F.M Ausubel et al . , :3de . , Current Protocole, a joint venture between Greene Publishing Aeeociates, Inc. and John Wiley & Sons, Inc. (Suplemento 30) . Una secuencia de
polinucleótido es considerada similar a una secuencia de referencia si la probabilidad de la suma más pequeña en una comparación del ácido nucleico de prueba al ácido nucleico de referencia es menor dé aproximadamente 0.1, más preferentemente menor de aproximadamente 0.01, o 0.001, y el más preferido menor de aproximadamente 0.0001, o 0.00001. Pueden alinearse los pollnucleótidoe similares y una eecuencia genérica o consenso generada ueando el software de alineación de secuencia múltiple disponible de varios proveedoree comercialee como Genetice Computer Group' e (Madieon, Wl) PILEUP eoftware, Vector NTI's (North Bethesda,
MD) ALIGNX, Genecode' s (Ann Arbor, MI) SEQUENCHER. Convenientemente, pueden usarse parámetros predefinidos de tales software para generar secuencias genéricas o conseneo. Aplicaciones mecanizadas La presente invención proporciona máquinas, estructura de datoe, y procesos para planear o analizar los polinucleótidos y polipéptidos de la presente invención. A. Maquinas : datos, estructura de los datos, proceeoe, y funcionee La presente invención proporciona una máquina que tiene un memoria que comprende: 1) datos que representan una secuencia de un polinucleótido o polipéptido de la preeente invención, 2) una eetructura de datos que refleja la organización eubyacente y estructura de los datos y facilita
el acceso al programa a elementos de los datos que corresponden a componentes del subalterno lógicos de la secuencia, 3) los procesoe para efectuar el ueo, análieis, planeación de la secuencia, y 4) opcionalmente, una función o utilidad para el polinucleótido o polipéptido. Así, la presente invención proporciona una memoria para guardar datos que pueden ser accesados por un programa de la computadora para implementar un proceso pjara efectuar el uso, análisis, o modelación de una secuencia de un polinucleótido, con la memoria que comprende datos que representan la secuencia de un polinucleótido de la presente invención. La máquina de la presente invención es típicamente una computadora digital. La término "computadora" incluye una o varias computadoras portátiles o de escritorio, estaciones de trabajo de computadora, servidores (incluyendo servidores de intranet o internet) , sistemae informáticos grandes, y cualquiera sistema integrado que comprende cualquiera de los anteriores, independientemente de si el proceso, memoria, entrada, o rendimiento de la computadora son remotos o locales, así como cualquier gestión de redes que interconecta loe móduloe de la computadora. El término "computadora" ee exclueivo de computadorae de ELa oficina de patentes y marcas de los Estados Unidos o la oficina de patentes europea cuando loe datos que representan a la secuencia de polipéptidos o polinucleótido de la presente invención se usa para las
búsquedas de patentabilidad. La presente invención contempla la proporción de los datos como una secuencia de un polinucleótido de la presente invención incluyendo en una computadora el medio legible. Como aquellos de habilidad en el arte serán conscientes, la forma de nemoria de una máquina de la presente invención, o la modalidad particular del medio legible de la computadora, no es elemento crítico de la invención y puede tomar una variedad de formas . La memoria de tal máquina incluye, pero r.o se limita a, ROM, o RAM, o medioe legibles de computadora tales como, pero no limitando a, loe medioe de comunicación! magnéticos tales como discos de computadora o unidades de disco duro, o medios de comunicación tales como CD-RO]Yls, DVDs, y similares, La presente invención además contempla proporcionar una estructura de los datos que también se contiene en la memoria. La estructura de los datos puede definirse por los programas de la computadora que definen los procesos (vea debajo) o puede definire e por la programación de almacenamiento de los datos separados y recuperación programa los subprogramas, o sistemas. Así, la preeente invención proporciona una memoria para almacenar una estructura de datos que puede accesaree por una computadora programada para implementar un proceso para efectuar el uso, análisis, o modelación de una secuencia de un polinucleótido. La memoria
comprende datos que representan un polinucleótido que tiene la secuencia de un polinucleótido de la presente invención. Loe datos se guardan dentro de la memoria. Además, una estructura de datoe, guardada dentro de la memoria, es asociada con los datos que reflejan la organización subyacente y eetructura de los datos para facilitar el acceso del programa a elementos de [los datos que corresponden a los subalterno-componentee lógicce de la eecuencia. La eetructura de loe datos permite identificar el polinucleótido y manipularla por tales programas. En una modalidad extensa, la presente invención proporciona una estructura de los datos que contiene datos que representan una secuencia de un polinucleótido de la presente invención guardada dentro de un medio legible por una computadora. Los datos de la estructura son organizados para reflejar la estructuración lógica de la secuencia, para que la secuencia se analice ácilmente por los programae del software capaz de acceear a la eetructura de loe datos. En particular, la estructura de los datos de la presente invención organiza las secuencias de referencia de la presente invención de una manera que permite a las herramientas del software para realizar una amplia variedad de análisis usando los elementos lógicoe y subalterno-elementos de cada secuencia. Un ejemplo de tal estructura de datos se parece una
información y pueden estructurarse de esta manera, tal como información relacionada a la secuencia entera, por ejemplo, si la secuencia es una longitud llena el gen viral, un gen de guarda de casa mamífero o ur. EST a partir de un clon X, la información relacionada con las regionee de flujo deecendente no codificadas 3', por ejemplo, estructura de alfiler de pelo, y la información relacionada a los varios dominios de la región codificada, por ejemplo, dedo de Cinc. Esta estructura de: los datos es una estructura abierta y ee baetante robusta para acomodar datoe recientemente generados y el conocimiento adquirido. Tal estructura también es una estructura flexible. Puede arreglarse abajo a un cordón 1-D para facilitar datos que minan y pasos del análisie, tal como agrupación, repetitivo-enmascaramiento, y análisis HMM. Entretanto, tal estructura de datos también puede extender los atributos asociados en las dimensionee múltiples. Pueden eetablecerse los indicadores entre loe atributos dimeneionados cuando se necesita facilitar la dirección y procesamiento de los datos en una base de reconocimiento genomita comprensiva. Además, tal estructura de datos ee objeto-orientada. El polimorfismo puede representarse por una ::amilia o clase de secuencia de objetos cada uno de los cuales tiene una estructura interna como se discutió anteriormente. Los rasgoe comunee están abstraídos y asignados al objleto del padre, considerando que
cada objeto del niño repreeer.ta una variante eepecífica de la familia o claee. Tal eetrucbura de datos permite recuperar los datos eficazmente, poner al día e integrar por las aplicaciones del software aeociadas con la base de datos de la secuencia y/o base de reconocimiento. La presente invención contempla proporcionar procesos para efectuar análisis y modelación, las cuales son descritas en la eección siguiente. Opcionalmente, la presente invención contempla 10 ademáe que la máquina de la preeente invención incluirá de alguna manera una utilidad o funcionará para el polinucleótido o ' polipéptidc» de la preeente invención. La función o utilidad del poli ucleótido o polipéptido pueden eer una función o utilidad para los datos de la secuencia,
15 per ee, del material tangible. Función ejemplar o utilidades incluyen el nombre (por la Unión Internacional de Bioquímica y Biología Molecular: reglas de nomenclatura) o la función de la enzima o proteína repreeentada por el polinucleótido o polipéptido de la preeente invención; la
20 ruta metabólica de la proteína representada por el polinucleótido o polipéptido de la presente invención; el substrato o producto o papel eetructural de la proteína repreeentadoe por el polinucleótido o polipéptido de la preeente invención; o, el fenotipo (por ejemplo, un raego
25 agronómico o farmacológico) afectado por la modulación de la
expresión o actividad de la proteína representadas por el polinucleótido o polipéptido de la presente invención. B. Modelación y análieie computacional La preeente invención proporciona un proceso de modelación y análisis de datos representativoe de un polinucleótido o secuencia ie polipéptido de la preeente invención. El proceeo comprende la entrada de los datos de la secuencia de un polinucleóti?lo o polipéptido de la preeente invención en una maquina que tiene un sistema de hardware o eoftware para modelación análisie, deearrollando la estructura de datos para facilitar el acceso a los datos de la secuencia, -manipulando lo datos para modelar o analizar la estructura o actividad del polinucleótido o polipéptido, y desplegando los resultados de la modelación o análisis. Así, la preeente invención proporciona proceso para efectuar el uso, análisie, o modelacion de una secuencia del polinucleótido o eu secuenci del • péptido derivada a través del uso de una computadora que tiene una memoria. El proceso comprende 1) colocar dentro de la memoria los datos que representan un polinucleótido que tiene la secuencia de un polinucleótido de la preeente invención, desarrollando dentro de la memoria una eetructura ie datos asociados con los datos y reflejando la organización subyacente y la estructura de loe datos para facilitar el acceso del programa a elementos de los datos que corresponden a los subalterno-componentes
lógicos de la secuencia, 2) programando la computadora con un programa que contiene las instrucciones suficientes para llevar a cabo el proceeo para efectuar el uso, análisis, o modelación de la secuencia deil polinucleótido o la secuencia del péptido, y, 3) ejecutando el programa en la computadora mientras concediendo el acceso del programa a loe datos y para la estructura de los datoe dentro de la memoria. Una variedad de herramientas de modelación y análieis son bien conocidas en el arte y están disponibles comercialmente. Incluido entre las herramientas de modelación/análisie eetán los métodos para: 1) reconocer las secuencias eolapadae (por ejemplo, de un proyecto de secuenciación) con un polinucleótido de la presente invención y crea una alineación llamada "contig"; 2) identificar los sitios para la enzima de restricción de un polinucleótido de la presente invención; 3) identificar loe productos de una Tl ribonucleasa de digestión de m polinucleótido de la presente invención; 4) identificar los primeros PCR con la mínima mismo-complementariedad; 5) computar las dietanciae de loe paree entre lae eecuencias en una alineación, reconstrucción filogentica de árboles ueando loe métodos de distancia, y calcular el grado de divergencia de dos regiones de proteína codificadas; 6) identificar los modelos como regiones codificadas, terminaciones, repeticiones, y otros modelos conseneo en polinucleótidoe de la preeente invención; 7)
identificar la estructura secundaria de ARN; 8) identificar loe motivoe de la secuencia, punto isoeléctrico, estructura secundaria, hidrofobicidad, y antigenicidad en polipéptidos de la presente invención; 9) traducción de polinucleótidos de la preeente invención y posterior-conetrucción de polipéptidos de la preeente invención; y 10) comparación de doe proteínas o secuencias de ácido nucleico e identificación de puntos de similitud o desigualdad entre ellas Los procesos para efectuar análisis y modelación pueden produciree independientemente o pueden obteneree de loe proveedores comerciales. Se proporcionan análisis ejemplares y herramientas de modelación en los productos tales como InforMax (Bethesda, MD) Vector NTI Suite (Versión 5.5), Intelligenetics (Mountain View, CA) PC/Gene program, and Genetics Computer Group' s (Madieon, Wl) Wisconsin Package
(Versión 10.0); estas herramientas, y las funciones que ellas realizan, (como se proporciona y deecubre por loe programas y la literatura que los acompaña) son incorporados aquí para referencia y se describen en mayor detalle en la sección C que sigue. Así, en una modalidad extenea, la preeente invención proporciona una maquina-lectora de medioe que contienen un programa de computadora y datos, comprendiendo un programa guardado en los medios que contienen las instrucciones suficiente para implementar un proceso para
efectuar el uso, análisie, o modelación de una representación de un polinucleótido o sec:uencia del péptido. Los datos almacenados en los medios representan una secuencia de un polinucleótido que tiene la Secuencia de un polinucleótido de la presente invención. Loe medios también incluyen una estructura de datos que refl.eja la organización subyacente y la estructura de los datos para facilitar el acceso del programa a elementos de los datos que corresponden a los subalterno-componentes lógicos de la secuencia, la estructura de los datos al ser inherente en el programa y de la manera en que el programa organiza y accede a los datos C. Búsquedae de la homología Como un ejemplo de tal análisis comparativo, la presente invención proporciona un proceso de identificación de un candidato homologo (es decir, un ortólogo o paralogo) de un polinucleótido o polipéptido de la presente invención. El proceeo comprende la entrada de los datos de la secuencia de un polinucleótido o polipéptido de la preeente invención en una máquina que tiene un sistema de hardware o software para el análisie de la secuencia, desarrollando estructuras de datos para facilitar el acceso a loe datoe de la eecuencia, manipulando los datos para analizar la estructura del polinucleótido o polipéptido, y desplegando los resultados del análisis. Un candidato homologo tiene probabilidad estadísticamente significante de tener la misma
función biológica (por ejemplo, cataliza la misma reacción, uniones a homólogos de proteínas/ácidos nucleicoe, tiene un papel eetructural similar) como la eecuencia de referencia a la cual ee compara. De acuerdo con, los polinucleótidos y polipéptidos de la, resente invención tienen utilidad en la identificación de homólogos en animales u otras especies de plantas, particularmente aquellos en la familia Gramineae tal como, pero no limitado a, sorgo, trigo o arroz. El proceso de la presente invención comprende obtención de datos que representan una secuencia de prueba de polinucleótido o polipéptido, Las secuenciae de prueba pueden obtenerse a partir de un ácido nucleico de un animal planta. Las secuencias ie prueba pueden obtenerse directamente o indirectamente de la secuencia de las bases de datos incluyendo, pero no limitando a, aquellos tales co o: GenBank, EMBL, GenSeq, SWISS-PROT, o aquellos disponibles en-línea por la vía UK Human Genome Mapping Project (HGMP) Genome Web. En algunas modalildades la secuencia de prueba se obtiene a partir de especies de la planta diferentes del maíz cuya función es incierta pero se comparará a la secuencia de prueba para determinar la similitud de la secuencia o identidad de la secuencia. Loe datos de la secuencia de prueba se ingresan dentro de una máquina, tal como una computadora, conteniendo: i datos que representan una secuencia de referencia y, ií) un sistema de hardware o
software de comparación de secuencia para comparar la secuencia de referencia* y la secuencia de prueba para similitud o identidad de la secuencia. Los sietemae de comparación de secuencia ejemplares se proporcionan para en el software de análisie de secuencia tales como aquellos proporcionados por Genetics Computer
Group (Madison, Wl) o InforMax (Bethesda, MD) , o
Intelligenetics (Mountain View, CA) . Opcionalmente, la comparación de la secuencia se establece usando los programas BLAST o GAP suite. Generalmer.te, un valor de probabilidad de suma más pequeño (P(N)) de menos de 0.1, o alternativamente, menos de 0.01, 0.001, 0.0001, o 0.00001 usando la colección de algoritmos BLAST 2.0 bajo los parámetros predefinidos identifica la secuencia de prueba como un candidato homologo (es decir, un alíelo, ortólogo, o paralogo) de la secuencia de referencia. Aquellos de habilidad en el arte reconocerán que un candidato homologo tiene una probabilidad estadística aumentada de tener la misira o similar función como el gen/proteína representada por la eecuencia de prueba. La eecuencia de referencia puede eer la eecuencia de un polipéptido o un polinucleótido de la presente invención. La secuencia de referencia o la eecuencia de prueba es opcionalmente por lo menos 25 aminoácidos o por lo menos 100 nucleótidos en ongitud. La longitud de las eecuencias de referencia o prueba puede ser la longitud del
polinucleótido o polipépti do descrita, respectivamente, anteriormente en las secciones tituladas los "Ácidos nucleicos" (particularmente la sección (g) ) , y "Proteínae"
Como aquellos de habilidad en el arte eetán conecientes, la mayor identidad/eimilitud de la eecuencia entre una secuencia de referencia de función conocida y una secuencia de prueba, la mayor probabilidad de que la secuencia de prueba tendrá la misma o similar función como la eecuencia de referencia. Los resultadoe de la comparación entre la secuencias de prueba y de referencia eon los fabricados (por ejemplo, desplegado, impreso, grabado) vía cualquiera de uno de varios diepositivos del rendimient ;o y/o medios (por ejemplo, computador, monitor, dieco duro, o lector de medios) Detección de ácidos nucleicos La presente invención además proporciona métodos para la detección de un polinucleótido de la presente invención en una muestra de ácido nucleico sospechosa de contener un polinucleótido de la presente invención, tal como un lisado celular de una plan a, particularmente un lisado de maíz. En algunas modalidades, un gen cognado de un polinucleótido de la presente; invención o porción del miemo puede amplificaree previamente al paeo de contactación de la mueetra de ácido nucleico con un polinucleótido para formar un complejo de hibridación. El polinucleótido hibridado bajo condiciones severas para un gen codificando un polipéptido de
la presente invención, La formación del complejo de hibridación se usa para detectar un gen que codifica un polinucleótido de la preeente invención en la muestra de ácido nucleico. Aquellos de habilidad apreciarán que un ácido 5 nucleico aislado que comp?|ende un polinucleótido de la presente invención carecerá de hibridación-cruzada en las secuencias en común con genes no-blanco que rendirían un
• resultado positivo falso, La detección del complejo de hibridación puede lograrse usando cualquier número de métodos 10 bien conocidos. Por ejemplo, la muestra de ácido nucleico, o una porción del mismo, puede eneayarse por hibridación de formatos que incluyen pero no se limita a, la fase de disolución, fase sólida, faee mixta, o eneayoe de hibridación in eitu. 15 La etiqueta detecteble conveniente para el uso en la presente invención incluye cualquier composición detectable por medios eepectroscópico, radioisotopico, fotoquímico, bioquímico, irmiunoquimico, medios eléctricos, ópticos o químicos. Las etiquetas útiles en la presente
20 invención incluyen biotin para marcar con el estreptavidin etiquetado conjugado, las cuentas magnéticas, tintes fluorescentes, radioetiquetas, enzimae, y etiquetae colorimetricas . Otras etiquetae incluyen ligandos que ee unen a los anticuerpos etiquetadob con los fluoroforos, agentes
25 del quimioluminescentes, y enzimas. Etiquetando los ácidos
nucleicoe de la preeente invención se logra prontamente tal como por el uso de primeros PCR etiquetados. Aunque la presente invención se ha descrito en un poco de detalle por vía de la ilustración y ejemplo para los propósitos de claridad de entendimiento, será obvio que pueden practicarse ciertos cambios y modificaciones dentro del alcance de las reivindicaciones añadidas, Ejemplo 1 Este ejemplo describe la construcción de una biblioteca de cADN El ARN total puede aislaree de loe tejidos de maíz con el reactivo TRIzol (Life Technology Inc. Gaithersburg, MD) usando una modificación del procedimiento de ieotiocianato/fenol-ácido de guanidina deecrita por Chomczyneki y Sacchi (Chomczynski, P., y Sacchi, N. Anal .
Biochem. 162,156 (1987)). En breve, se pulverizan lae muestrae de tejido de planta en el nitrógeno líquido antes de la adición del reactivo de TRIzol, y entonces además homogenizada con un morterio y pietilo. La adición de cloroformo seguida por la céntrifugación ee dirige para la separación de una fase acuoe ac y una fase orgánica. El ARN total se recupera por precipitlación con alcohol isopropílico de la fase acuosa. La selección de poli (A) + ARN del ARN total se realiza usando el sistema PolyATact de (Promega Corporation.
Madieon, Wl) . Loe primeroe Biotinylated oligo (dT) se usan para híbridar a las colas poli (A) 3' en el mARN. Los híbridos se capturan usando estreptavidin acoplado a las partículas paramagnéticas y una posición de la separación magnética. El mARN se lava entonces a las condicionee de estrechez altas y se eluye por agua desionizadaj RNaea-libre. Pueden lograree eír.teeis de cADN y conetrucción de bibliotecae de cADN unidireccionalee ueando Super Script Plaemad Syetem (Life Technology Inc. Gaithereburg, MD) . El primer cordón de cADN ee sintetiza imprimando un primeros oligo (dT) que contiene un sitio Not I. La reacción se cataliza por Super Script Reverse Tranecriptase II a 45SC. El segundo cordón de cADN se etiqueta con alfa-32P-dCTP y una porción de la reacción analizada por electroforesis en gel agarosa para determinar los tamaños del cADN. Las moléculas de cADN más pequeñas que 500 pares de bases y los adaptadores no ligados son removidos por cromatografía con Sephacryl-S400. Las moléculas del cADN (seleccionadas son ligadas en el vector pSPORTl entre los sitios Not I y Sal I Alternativamente, l|as bibliotecae de cADN pueden ser preparadas por cualquiera de muchoe métodos dieponibles, Por ejemplo, los cAD?s pueden: introducirse en loe vectores del plasmido preparando las bibliotecae de cADN primero por preparación de lae bibliotecas de cAD? en vectores Uni-ZAP™XR de acuerdo con el protocolo del fabricante (Stratagene
Cloning Syetems, La Jolla, CA) . Las bibliotecas Uni-ZAP?TMX,R se convierten en las bibliotecas del plasmido de acuerdo con el protocolo proporcionado por Stratagene. En la conversión, se contendrán lae ineerciones iel cADN en el plasmido vector pBluescript. Además, los cADNs pueden introducirse directamente en los vectores precortado Bluescript II SK(+) (Stratagene) usando T4 ADN ligasa (New England Biolabs) , seguida por la transfección en las células DH10B de acuerdo con el protocolo del fabricar!te (GIBCO BRL Products) . Una vez que las inserciones de cADN están en los vectores plasmido, los plasmido cADNe se prfeparan a partir de colonias bacterianas escogidas al azar que contienen plasmidos pBluescript recombinantees , o las secuencias de cDNA insertadas se amplifican vía reacción cadena polimerasa usando los primeroe eepecíficos para secuencias del vector que flanquean las secuencias |de cADN insertadas . La inserción de ADNe amplificada o plasmicjloe ADNs eon eecuenciadae en lae reacciones de secuenciación de primer generar eecuencias parciales de cADN (etiqueta de secuencia expreeada o "ESTs"; vea a Adame et al . , (1991) Science 252:1651-1656). Loe ESTs resultantes se analizan usando un secuenciador fluorescente
Perkin Elmer Modelo 377. Ejemplo 2 Este método describe la conetrucción de una biblioteca de cADN decuetpo entero enriquecida. Una
biblioteca de cADN de cuerpo entero enriquecida que usa una de dos variaciones del método de Caminci et al . , Genomice 37: 327-336, 1996. Estas variaciones están basadas en la introducción química de un grupo biotina en el residuo diol de la estructura 5' de gorra de mARN eucariótico para seleccionar el primer cordón de cAD? de cuerpo entero. La selección ocurre entrampando el residuo de biotina en los eitioe de gorra ueando lae c entas magnéticas estreptavidin- recubiertas seguidas por tratamiento RNasa I para eliminar el cADNs incompletamente sintetizado. El segundo cordón de cADN se eintetiza ueando los procedimientos eetablecidos tales como aquellos proporcionadoe en Life Techologies' (Rockville, MD) "Super Script Plaemad System for cD?A Síntesis and Plaemad Cloning" kit. Se han mostrado bibliotecas hechas por este método para contener 50% a 70% de cAD?s de cuerpo entero. Los primeros métodos de síntesis de cordón se detallan debajo. Un asterisco denota que el reactivo se obtuvo de Life Technologies, Inc. A . Primer cordón de cADN método de eínteeie 1 (con trehaloea) mARN (lOug) 25µl *Not I primero (5ug! lOµl *5x ls cordón buffe c 43µl *0.1m DTT 20µl *dNTP mix lOmm lOµl
BSA 10ug/ µl lµl Trehalosa (eaturada) 59.2µl RNaea inhibidor (Promega) 1.8µl *Superscript II RT ~200u/ µl 20µl 100 % glicerol 18µl Agua 7 µl El mAR? y el primero ?ot I se mezclan y deenaturalizan a 65aC durante 10 min. Elloe ee enfrían entoncee en loe hieloe y o|tros componentes se agregan al tubo. La incubación es a 45aC durante 2 min. Veinte microlitros de RT (transcriptaea reversa) se agrega a la reacción y se inicia el programa en el termocycler (MJ
Reeearch, Waltham, MA) : Paeo 1 45aC lOmin Paeo 2 45aC -0.3aC/c:j.clo, 2 segundos/ciclo, Paeo 3 ir a 2 por 33 ciclos Paso 4 35aC 5min Paso 5 45aC 5min Paeo 6 45aC 0.2aC/ciclo, 1 sec/ciclo, Paeo 7 ir a 7 por 49 ciclos Paeo 8 55aC 0.1aC/cislo, 12 sec/ciclo, Paeo 9 ir a 8 por 49 ciclos Paso 10 55aC 2min Paso 11 60aC 2min Paso 12 ir a 11 por 9 veces
almacenado a -20aC. C. Oxidization del grupo di?l de mARN para el etiquetado de biotina El primer cordón de cADN es hilado abajo y lavado una vez con EtOH al 70%. Los pellets reeuependidoe en 23.2µl de DEPC tratados con agua y colocadoe sobre hielo. Preparar 100 mM de NaI04 fresco, y entonces agregar los reactivos siguientes : mRNA: lst cADN (iniciar n 20µg mARN) 46.4µl 10OmM NaI04 (recien preparados) 2.5µl NaOAc 3M pH4.5 l.lµl Para hacer lOOmM NaI04, use 21.39µg de NaI04 para lµl de agua. Envuelva el tubo en papel aluminio e incube en el hielo durante45min. Después de la incubación, la reacción ee precipita entonces en: 5M NaCl lOµl 20%SDS 0.5µl isopropanol 61µl Incube en el hielo durante por lo menos 30 min, entonces hílelo abajo a velocidad máxima a 4aC durante 30 min y lavado una vez con etanol al 70% y entonces etanol al 80%. D. Biotinilación del grupo diol del mARN Resuspender el ADN en HOµl de DEPC tratado con
agua, entoncee agregar los reactivos siguientes: 20% SDS 5µl 2M NaOAc pH 6.1 5µl lOmm biotin hidrazida (recien preparada) 300µl Envuelva en papel aluminio e incube toda la noche a temperatura ambiente. E. tratamiento RNaea I Precipitar ADN en: 5M NaCl lOµl 2M NaOAc pH 6.1 75µl mARN.-cADN biotinilado 420µl 100% EtOH (2.5Vol) 1262.5µl (Realice esta precipitación en dos tubos y sepárense los 420µl de ADN en 210µl cada uno, agregue 5µl de 5M NaCl, 37.5µl de 2M NaOAc pH 6.1, y 531.25µl de EtOH 100%). Almacenar a -20aC durante por lo menos 30 min. Hile abajo el AD? a 4aC a velocidad máxima durante 30 min. y lávese dos veces con EtOH al 80%, entonces disuelva el AD? en 70µl de RNasa libre de agua. Agrupe dos tubos y termine con 140µl. Agregue los reactivos siguientes : RNasa Uno lOU/µl 40µl lst CDNA : R?A 140µl 10X buffer 20µl Incube a 37SC durante 15min. Agregue 5µl de 40µg/µl tAR? de levadura a cada
muestra para capturación. F. Capturacion de lst cADN de longi tud llena Bloquear las cuentas con el tARN de levadura: Cuentae lml tARN de levadura 40µg/µl 5µl Incubar en hielo durante 30min con mezclado, lavar
3 vecee con lml de 2M NaCl, 5 OmmEDTA, pH 8.0, Resuspender las cuentas en 800µl de 2M NaCl, 50mm
EDTA, pH 8.0, agregar RNasa I mueetra tratada con 200µl, e incubar la reacción durante 30min a temperatura ambiente. Capturar las cuentas usando la posición magnética, salvar el sobrenadante, e iniciar los lavados siguientes: 2 lavados con ?aCl 2M, 50mm EDTA, pH 8.0, 1 ml cada vez, 1 lavado con 0.4% SDS, 50µg/ml tRNA, 1 lavado con lOmm Tris-Cl pH 7.5, 0.2mm EDTA, lOmm
NaCl, 20% glicerol, 1 lavado con 50µg/ml tRNA, 1 lavado con el lst cADN buffer G. Síntesis del eegundo cordón de cADN Resuspender las cuentas en: * SX primer buffer 8µl * O. lmM DTT 4µl *10mm dNTP mezcla 8µl *5X 2do buffer 60µl
100% EtOH 750µl EtOH 100% 600µl glicógeno lµg/µl 2µl glycogen lµg/µl 2µl H. Ligación del adaptador Sal J Reeuspender la pelotilla en 26µl de agua y usar lµl para el gel TAE. Preparar la reacción como sigue 2do cordonde cDNA 25µl *5X T4 ADN ligasa buffer lOµl * Sal I adaptadores lOµl * T4 ADN ligasa 5µl Mezcle suavemente, incube la reacción toda la noche a 16aC, Agregue 2µl de ligaea segundo día e incube a la temperatura ambiente durante 2 hrs (opcional) . Agregue 50µl de agua a la reacción y use lOOµl de fenol para limpiar el ADN, se transfieren 90µl de la fase superior en un nuevo tubo y se precipitan en: Glicógeno lµg/µl 2µl Fase superior ADN 90µl NH40ac 7.5M 50µl EtOH 100% 300µl precipite toda la noche a -20aC hile abajo la pelo illa a 4eC y lave en EtOH al 70%, seque la pelotilla. I. Digestión de Not I
suficientes, estae ee fijan sobre membranas de nylon de 22 x
22 c usando el Q-bot. Cada membrana sostiene 9,216 o 36,864 colonias . Estas membranae ee colocan sobre una placa de agar con un antibiótico apropiado . Las placas se incuban toda la noche a 37aC. Deepués de eme se recuperan las colonias en el segundo día, estos filtros se colocan sobre un filtro de papel premo ado con disolación desnaturalizante durante cuatro minutos, entonces incubadas encima de un baño de agua hirviente durante cuatro minutos adicionales. Los filtros se ponen entonces en el papel filtro premojado con disolución neutralizante durante cuatro minutos. Después de que la disolución en exceso es removida mediante la colocación de. loe filtroe en loe papelee filtro secos durante un minuto, el lado de la colonia de los filtros se pone en disolución
Proteinasa K, incubada a 37aC durante 40-50 minutos. Los filtros se colocan en papeles filtro secoe para secar toda la noche. El ADN es entonces reticulado a la membrana de nylon por tratamiento con luz UV. La hibridación de la colonia se dirige como se describe por Sambrook, J., Fritsch, E.F. and Maniatis, T., (in Molecular Cloning: A Laboratory Manual, 2nd Edition) . Las sondas siguientes pueden usaree en la hibridación de la colonia: 1. El primer cordón de cADN a partir del miemo
tejido como la biblioteca fue hecho a partir de la remoción de los clones más redundantes 2. 48-192 de los clones de cADN más redundantes de la misma biblioteca basada en loe datos de secuenciación anteriores . 3. Los 192 clones de cADN más redundantes en la base de datoe de la eecuencia entera de maíz. 4. Un oligonucleotijdo Sal-A20: TCG ACC CAC GCG TCC
GAA AAA AAA AAA AAA AAA AAA, remueve los clones que contienen una cola poli A pero no cADN. 5. Loe clonee de cADN derivados a partir de mARN. La imagen de la auto radiografía se examina en la computadora y la señal de intensidad y la dirección de la colonia fría de cada colon:.a se analiza. Re-formación de colonias frías a partir de 384 placas a 96 placas es conducido usando Q-bot. Ejemplo 4 Este ejemplo describe identificación del gen a partir de una búsqueda de homplogía por computadora. Las identidadee del gen pueden ser determinadas por conducción del BLAST (Baeic Local Alignment Search Tool;
Altechul, S. F., et al., (1993) J. Mol. Biol. 215:403-410; también vea www.ncbi.nlm.nih. gov/BLAST/) las búsquedas bajo loe parámetros predefinidoe para la eimilitud para secuencias contenidas en la base de datos "nr" de BLAST (comprendiendo
las traducciones no-redundantes GenBank CDS, las eecuenciae derivadae de la eetructura -dimensional Brookhaven Protein Data Bank, la última deecarga mayor de la base de datos SUISS-PROT protein sequence, EMBL, y basee de datos de DDBJ) . Las secuencias de cDNA se analizan para similitud para que todas lae eecuencias de ADN públicamente disponibles contenidas en la base de datjos "nr" que uea el algoritmo de BLASTN. Las eecuenciae de AD ee traducen en todoe loe marcos de lectura y se comparan para la similitud a todae lae eecuencias de la proteína públicamente disponibles contenidas en la base de datos "nr" eme usa el algoritmo de BLASTX
(Gish, W. y States, D. J. Náture Genetice 3:266-272 (1993)) proporcionado por NCBI . En algunos casos, los datos de la secuenciación de dos o más clones contienen segmentos traslapados de ADN se usan para construir las secuencias de ADN inmediatae. Pueden realizarse alineaciones de la secuencia y cálculos de por ciento de identidad usando el programa Megalign de LASERGENE de bioinformatics computing euite (DNASTAR Inc., Madison, Wl) La alineación múltiple de las secuenciae puede realizarse usando el método de alineación
Cluetal de (Higgins and Sharp (1989) CABIOS. 5:151-153) con los parámetros predefinidos HUECO (GAP) PENALTY=10, LONGITUD del HUECO (GAP) PENALTY=10) . Los parámetros predefinidos para alineaciones de pares (pairwise) que usan el método Clustal
7i'Ü¡Í,lÍ? jA Í. . ,
ATCC 97366. El segmento de ADN a partir de pML103 contiene un fragmento de promotor de 1.05 kb de Sall-Ncol del gen de maíz 27 kD zein y un fragmento de 0.96 kb de Smal-Sall a partir de la terminación 3 'del gen de maiz 10 kD zein en el vector pGem9Zf (+) (Promega) . El vector e inserción de ADN pueden ligarse a 15aC toda la noche, esencialmente como se describe por (Maniatis) . El ADN ligado puede entonces usarse para transformar el E. coli XLl-blue (Epicurian Coli XLl Blue: Stratagene) . Las bacterias transformantes pueden ser protegidas (screened) por La digestión de enzima de reetricción del plasmado de ADN y el análieie de secuencia de nucleótido limitado que usan el método de terminación de cadena dideoxi (Sequenase DNA Sequencing Kit; U. S. Biochemical) . La estructura de plasmido resultante comprende un transgene codificado, en la dirección 5' a 3', el promotor de maíz 27 kD zein, un fragmento de cADN codificando los polipéptidos instantáneoe, y La región 10 kD zein 3'. Pueden introducirse loe tranegenes descritos anteriormente en lae célulae de maíz por el procedimiento eiguiente. Pueden desecarse los embriones de maíz inmaduros de cariopsae en vías de deearrollo derivado de los cruces de maíz producido por las líneas H99 y LH132. Los embriones se aislan 10 a 11 días deepuée de la polinización cuando ellos tienen de 1.0 a 1.5 mm de longitud. Los embriones se ponen entonces con el eje-lateral que enfrenta abajo y en contacto
con el medio de N6 agarosa-solidificado (Chu et al . (1975) Sci . Sin . Peking.18 : 659-668) l Los embriones se colocan en la oscuridad a 27aC. Callos embriogenicos friable eme coneiete en masas de células no diferenciadas con los proembrioides somático y embrioide llevado sobre estructuras suepensoras proliferadas a partir del scutellum de estos embriones inmaduros. El callo embriogénico aislado de las plántulas primarias puede cultivarse en el medio de N6 y eub-cultivado en este medio cada 2 a 3 semanas El plasmido p35S/?c de (Hoechst Ag, Francfort, Germany) o el equivalente puede usarse en los experimentoe de traneformación para proporcionar un marcador eeleccionable. Este plasmido contiene al gen Pat (vea la publicación de patente europea 0 242 236) qué codifica la fosfinótricin acetil traneferaea (PAT) . La enzima PAT confiere la reeietencia a loe inhibidores herbicidal glutamina eintetaea tales como el fosfinotricin 1 gen pate en p35S/Ac está bajo el control del promotor 35S a partir del Virus del Mosaico de la Coliflor (Odell et al . ( 1985) Nature 313:810-812) y la región 3' del gen nopalina e intetasa a partir de T-ADN del plaemido Ti de AgroJbacterium umefaeciene . El método de bombardeo de partícula (Klein et al . (1987) Nature 327:70-73) puede usarse para transferir los genes al cultivo de células de callo. De acuerdo con este método, las partículas de oro (lµm en diámetro) son
. ii.iiMn.i. A . A , .. .
recubiertas con ADN usando la técnica siguiente. Diez µg de plasmido de ADNs se agregan a 50 µL de una suspeneión de partículas de oro (60 mg por mL) . Cloruro de calcio (50 µL de una dieolución 2.5M) y spermidine libre de base (20 µL de una disolución l.OM) ee agregan a las partículas. La suspensión es vórtice durante la adición de estas disoluciones. Despuée de 10 minutoe, loe tuboe ee centrifugan brevemente (5 seg a 15,000rpm) y los sobrenadantes removidos. Las partículas son reeuspendidos en 200µL de etanol absoluto, centrifugado de nuevo y el sobrenadante removido. El etanol del enjuague ee realiza de nuevo y lae partículas resuspendidas en un volumen final de 30µL de etanol una alícuota de (5µL) de las partículas de oro ADN-recubiertas pueden colocarse en el centro de un disco volante Ka ton de (Bio-Rad Labs) . Las partículas se aceleran entonces en el tejido de maíz con un Biolistic PDS-1000/He (Bio-Rad Inetruments, Hercules CA) , usando una presión de helio de 70.306 kg/cm2 (1000 psi), una distancia del hueco de 0.5cm y una distancia volante de 1. Ocm. Para el bombardeo, del tejido embriogénico en papel filtro eobre medio de agarosa-solidificada N6. El tejido se coloca como un capa delgada y cubriendo un área circular de aproximadamente 5cm de diámetro. Las cajas de petri que contienen el tejido pueden ponerse en la cámara del PDS-1000/He aproximadamente 8cm a partir de la pantalla tope. El
Uu?? .*-..
aire en la cámara ee evacúa entoncee a un vacío de 81.12cm(28 pulgadas) de Hg. El macro acarreadorr se acelera con un onda de choque de helio usando une. membrana de ruptura que estalla cuando la presión de He en el tubo de choque alcanza 70.306 kg/cm2 (1000 psi) . Siete días después del bombardeo el tejido puede transferirse a un medio de N6 que contiene glufosinato (2mg por litro) y carece de caseíµa o prolina. El tejido continúa creciendo despacio en este medio. Después de 2 semanas adicionales el tejido puede transferiree a un medio de N6 fresco que contiene glufoeinato. Deepués de 6 eemanas, pueden identificarse áreas de aproximadamente 1 centímetro de diámetro de callos activamente crecientes en algunas de las placas que contienen el iredio glufosinato-complementado. Estos callos pueden continuar creciendo cuando son sub-cultivadoe 'en el medio eelectivo. Las plantas pueden regenerarse a partir de los callos transgenicos mediante primero la transferencia de los clustere de tejido al medio de N6 complementado con 0.2mg por litro de 2,4-D. Después de dos semanas el tejido puede transferiree al medio de regeneración (Fromm et al . , (1990)
Bio/Technology 8:833-839) Ejemplo 6 Eete ejemplo describe la expresión de transgenes en las células dicotiledóneas. Un caeeette de expreeión eemilla-
fe&t ».-, .
que codifican polipéptidos instantáneoe . Para inducir embriones somáticoe, cotiledcnes, 3-5 mm en longitud dieecada a partir de la superficie esterilizada, semillas inmaduras del cultivar de la soja A2872, puede cultivarse en la luz u oscuridad a 26aC en un medie de agar apropiado durante 6-10 semanae . Los embriones somáticos los cuales producen embriones secundarioe son entoncee cortadoe y colocados en un medio líquido conveniente. Deepués de la selección repetida para los racimos de embriones somáticoe que ee multiplicaron como embrionee tempranoe, embrionee en eetadio globular, las suepeneiones se mantienen como se describe debajo. La suspeneión embriogénica de cultivoe de eoja cultiva puede eer mantenida en 35mL de medioe de cultivo líquido en un agitador rotatorio, a 150 rpm, a 26aC con luz fluorescente en un horario de 16:8 horas dia/noche. Los cultivos son subcultivados cada dos eemanas inoculando aproximadamente 35mg de tejido en 35 mL de medio de cultivo líquido. La suepeneión de cultivoe de soja embriogénica pueden ser transformados entonces por el método de bombardeo de partícula (Klein et al . , (L987) Nature (London) 327:70-73, U.S. Patent No. 4,945,050 americana). Un instrumento Du Pont Biolistic PDS 1000/HE reconvereión de helio) puede usarse para estas transformaciones Un gen marcador seleccionable que puede uearee para
ü £ jaatul ,
facilitar la transformación de la soja es un tranegene compuesto de promotor 35S Virue del Moeaico de la Coliflor (Odell et al . , (1985) Nature 313:810-812), el gen higromicin fosfotraneferaea del plasmiao pJR225 (de E. coli ; Gritz et al . , (1983) Gene 25: 179-188 ) y la región 3 ' del gen de la nopalina sintetasa del a partir de T-ADN del plasmido Ti de
Agrobacterium tumefaeciene . El cassette de expresión de semilla que comprende la región del faseolin 5', el fragmento codificando polipéptidos ins :antáneoe y la región faseolin 3' puede aielaree como un fragmento de restricción. Este fragmento puede insertarse entonces en un único sitio de restricción, del vector que lleva el gen marcador. A 50µL de una euspeneión de 60mg/mL con lµm de partículae de oro ee agregan (en el orden) : 5µL ADN (1 µg/µL) , 20µl de espermidina (0.1M), y 50µL de CaCl2 (2.5M). La preparación de la partícula es entonces agitada durante tres minutoe, hilado en una microfuga durante 10 eegundos y los sobrenadantes removidos . Las partículas de ADN-recubiertas se lavan entoncee una vez en 400µL de etanol al 70% y resuependidae en 40µL ce etanol anhidro. La suspeneión de ADN/particulae puede eer eonicada tree veces durante un segundo cada vez. Cinco micro!.itros de las partículas de oros ADN-recubiertas son entonces pargados en cada disco del macro portador. Aproximadamente 30Ó-400mg de una suepensión de
cultivo de dos eemanas de "edad" se pone en una caja petri vacía de 60x15 mm y el líquido reeidual removido del tejido con una pipeta. Para cada experimento de transformación, se bombardean normalmente aproximadamente 5-10 placae de tejido. La preeión de ruptura de metíbrana ee fija en 77.336 Kg/cm2 (1100 psi) y la cámara se evacúa a un vacío de 81.12cm (28 pulgadas) de mercurio. El tejido se pone aproximadamente a
8.89cm (3.5 pulgadae) fuera de la pantalla de retención y bombardeada tres veces . El bombardeo siguiente, el tejido puede ser dividido por la miLtad y puede poneree atrás en el líquido y cultivado como se describe anteriormente. Cinco a siete díae después del bombardeo, los medios de cultivo líquidos pueden intercambiarse con los medios de cultivo frescos, y once a doce días deepués del bombardeo con medios de cultivo frescoe que contienen 50mg/mL de higromicin. Eete medio de cultivo selectivo puede refrescarse semanalmente. Siete a ocho semanas después del bombardeo, el tejido verde, transformado puede observarse creciendo a partir del no transformado, los racimos necroticos embriogénicos. El tejido verde aislado es removido e inoculado en los frascoe individuales para generar nuevo tejido clonalmente propagado, suspensiones de cultivo transformadas embriogénicamente. Cada nueva línea puede tratarse como un evento de transformación independiente. Estae euspeneiones pueden ser entonces subcultivadas y pueden mantenerse como los racimos de
embriones inmaduros o pueden, regenerarse en plantas enteras mediante maduración y germinación de embriones somáticos individuales . Ejemplo 7 Este ejemplo describe la expreeión de un transgene en células microbianas Pueden insertaree, loe cDNAs codificando polipéptidos instantáneoe, en el vector de expresión T7 E. coli pBT430. Eete vector ee un derivado de pET-3a (Rosenberg et al . (1987) Gene 56:125-135 ) el cual emplea el bacteriófago T7 AR? polimeraea/T7 sistema promotor. El plasmido pBT430 se construyó primero destruyendo el EcoR I y los sitios Hind III en el pET-3a en sus posiciones originales. Un oligonucleotido adaptador que contiene EcoR I y los sitios Hind III se insertó al sitio BamH I de pÉT-3a. Eeta creación pET-3aM con loe únicoe eitios para clonación adicionales para la inserción de genes en el vector de expresión. Entonces, el sitio Nde I en la posición de iniciación de traducción se convirtió a un sitio Neo I usando mutagenesis oligonucleotide-dirigido. La secuencia de ADN de pET-3aM en esta región, 5'-CATATGG, se convirtió a 5'-CCCATGG en pBT430 El plasmido ADN que contiene un cDNA puede digerirse apropiadamente pare, soltar un fragmento de ácido nucleico que codifica la proteína. Este fragmento puede purificarse entonces en un NuSieve GTG 1% gel agarosa de bajo
punto de fusión (FMC) . El buffer y agarosa contienen lOµg/ml de bromuro de etidium para la vieualización del fragmento de ADN. El fragmento puede purificaree entoncee del gel de agaroea por la digestión con GELase (Epicentre Technologies) de acuerdo con las instrucci.ones del fabricante, precipitado en etanol, secado y resuependido en 20µL de agua. Los oligonucleotidos adaptadores apropiados pueden ser ligados al fragmento usando T4 ADN ligasa (New England Biolabs, Beverly,
MA) . El fragmento que contiene los adaptadoree ligadoe puede purificaree de los adaptadores en exceso ueando agaroea de bajo punto de fueión como se describes anteriormente. El vector pBT430 ee digiere, desfoeforilado con fosfatasa alcalina (?EB) y deeproteinizada con fenol/cloroformo como se describe anteriormente. El vector pBT430 preparado y el fragmento pueden ser entonces ligados a 16°C durante 15 horas seguidas por la transformación en las células DH5 electrocompetentes (GIBCO BRL) . Los transformantes pueden seleccionarse en placas de agar que contienen medios de cultivo LB y lOOµg/mL de ampicilina. Se protegen los transformantes que contienen el gen codificando los polipéptidos instantáneos entonces para la orientación correcta con respecto al promotor T7 mediante el análisis de enzima de restricción. Para la expresión de alto nivel, un clon del plasmido con la inserción del cAD? en la correcta orientación
JÉ* .-. -í .
relativa al promotor T7 puede traneformarse en E. coli strain
BL21 (DE3) (Studier et al . (1986) J. Mol . Biol . 189: 113- 130) . Los cultivoe eon crecidoe en medio de cultivo LB que contienen ampicilina (lOOmg/L) a 25aC. A una densidad óptica a 600 nm de aproximadamente L, IPTG (inductor, isopropiltio- ß-galactosido) puede agregarse a una concentración final de 0.4mM y la incubación puede continuarse durante 3 h a 25a. Las células son entonces cosechadas mediante centrifugación y re-suspendidas en 50µL de Tris-HCl 50mM a pH 8.0 que contiene O.l M DTT y 0.2mM de fluoruro de fenil metiisulfonilo. Una cantidad pequeña de cuentas de vidrio de lmm puede agregarse y la mezcla sonicarse 3 veces durante aproximadamente 5 segundoe cada vez con un eo?icador microprobe. La mezcla se centrifuga y la concentración de la proteína del sobrenadante ee determina. Un microgramo de proteína del fragmento eoluble del cultivo puede eer separado por electroforesis en gel con SDS-poliacrilamida. Pueden obeervarse los geles para bandas de proteínas que emigran al peso molecular esperado, Ejemplo 8 Este ejemplo describe un procedimiento para identificar plantas que contienen Mu ineertadae en loe genee de interée y una estrategia para identificar la función de esos genes. Este ejemplo es hasado en el trabajo con el gen CQRAD17, deecrito en U.S. Patent Aplication 09/371,383 y deecubierta allí como Seq. ID No. 25, el cual es un miembro
de la misma familia del gen como el SEQ ID Nos. 1 y 5 de la aplicación presente. Una pejrsona de habilidad en el arte podría concebir prontamente el ueo de este procedimiento con las secuencias descubiertas en la aplicación actual. El Sistema de Utilidad de RaegO para Maíz [The Trait Utility System for Corn] (TUSC) es un método que emplea las técnicas genéticas y moleculares para facilitar el estudio de función del gen en el maíz. Estudiando la función del gen implica que la secuencia del gen ya es conocida, aeí el método trabaja en la marcha atráe: de la eecuencia al fenotipo. Eete tipo de aplicación es llamado como "genética reversa o inversa" la cual contrasta con los métodos "delanteros" que se diseñan para identificar y aislar el gene(s) responsable para un rasgo particular (fenotipo) . Pioneer H-Bred Internacional Inc., tiene una colección, propietario, de ADN genómico de maíz de aproximadamente 42,000 planltas individuales Fl (Reverse genetics for Maite, Meeley, R. and Briggs, S., 1995, Maiz Genet. Coop. ?ewslett. 69:67, 82) . El genoma de cada uno de eetoe individuoe contiene copiae múltiples de la familia del elemento transponible, Mutator {Mu) La familia Mu es altamente mutagénica; en presencia del elemento activo z-DR, estos elementos transponen a lo largo del genoma, insertando en las regiones génicas, y rompiendo a menudo la función del gen. Coleccionando el ADN genómico de un número grande
(42,000) de individuos, Pioneer ha congregado una biblioteca del genoma mutagenizado de maíz. Los eventos dé inserción de Mu son predominantemente heterocigoqos; dado la naturaleza recesiva de la mayoría de las mutaciónee ineercionales, lae plantas Fi aparece el tipo-salvaje. Cada una de las plantas Fi es el mismo para producir semillas F2, las cuales son colectadas. Generando la descendencia de F2, las mutaciones insercionales eegregadae en una moda Mendeliana para ser utilizadas para investigar el efecto de un alíelo mutante en el fenotipo. El sistema TUSC se ha usado con éxito por varios laboratorios para identificar la función de una variedad de genes
(clonando y caracterizando el gen del maíz Anl, Bensen, R.J., et al., 1995, Plant Cell; 7:75-84; Divereification of C-function activity in maize fJLower development, Mena, M. , et al . , 1996, Science 274 : 1537rl540; Analyeie of a chemical plant defenee mechaniem in grasses, Frey, M. , et al., 1997, Science 277:696-699; The control of maize spikelet merietem fate by the APETALA2-like gene indeterminate epikelet 1, Chuck, G., Meeley, R.B., and Hake, S., 1998, Genes & Development 12:1145-1154; A SecY homologue is required for the elaboration of the chloroplast thylakoid membrane and for normal chloroplaet gene expreseion, Roy, L.M. and Barkan, A., 1998, J. Cell Biol. 141:1-11) PCR Screening para lias inserciones Mu en CQRAD17
combinado en lae piecinas de 48 plantae cada una, ee sujetó a PCR con GSPl o GSP2 y Mu TIR . Se sujetaron las piscinas que fueron confirmadas para ser positivo por hibridación del punto-borrón ueando cDNA de CQRAD17 como una (probé) sonda fueron sometidos a análisie mancha-en gel en el orden para determinar el tamaño de 1 -oe fragmentos amplificados. Las piscinas en las cuales los fragmentos limpios fueron identificados se sometí .erpn a análisis extenso para identificar las plantas individualee dentro de eeas piscinae que contuvieron la inserción (ee) Mu . Lae eemillae a par ir de plantae Fi identificadae de esta manera se plantaron en el campo. Discos de hoja de veinte plantas en cada fila F2 fueron colectados y el ADN genómico fue aislado. Las mismas veinte plantas fueron las mismas y la semilla de F3 salvadas . El ADN agrupado (de 20 plantae) de cada uno de las doce filae ee eometió a PCR usando primeros GSPl o GSPJ2 y Mu TIR como ee menciono anteriormente. Tres piscinas identificadae para contener las inserciones Mu fueron sometidas al análisis de planta individual y homocigotos dentificados . Los sitios de inserción Mu sitioe con las secuencias de la firma circundantee ee identifican debajo : Alíelo 1: TCTTCACCA- l-GGTCCTTCG Allelo 2: GTCGAAATT- Wu-TTCTTCAGC Alíelo 3: GCTCACGGG- Mu- GAAGTTTAT
Todas las tres insercionee eetán dentro de 200 nucleótidoe de cada otra qué leen el marco al aire libre, sugiriendo que eeta región ejn el gen podría representar una mancha caliente para la inee ción Mu . Una de lae ineercionee, alíelo 3, está en la región predicha para codificar para un dominio de transmembrana. Se espera que cada una de estas inserciones vuelva inactivo el gen. Los ejemplos anteriores se proporcionan para ilustrar la invención pero no limitan su alcance. Otras variantes de la invención estarán rápidamente claras a una persona de habilidad ordinaria en el arte y abarcarán por las reivindicaciones añadidas. Toias las publicaciones, patentes, solicitudes de patentes, y programas de computo citadas aquí eetán incorporadae por la preeente para referencia.
Claims (1)
- REIVINDICACIONES 1. Un ácido nucíeico aislado que comprende un polinucleótido que tiene por lo menos 80% de identidad de la secuencia, como se determina por el algoritmo GAP bajo los parámetros predefinidos, para un polinucleótido de SEQ ID NO: 1. Un ácido nucleico aislado que comprende un polinucleótido que tiene por lo menos 80% de identidad de la secuencia, como se determina por el algoritmo GAP bajo los parámetros predefinidos, para un polinucleótido de SEQ ID NO: 5. 3. Un polinucleótido que codifica un polipéptido seleccionado del grupo que consiste de SEQ ID NOS: 2 y 6. 4. Un polinucleótído seleccionado de grupo que consiste de SEQ ID NOS: 1 y 5. 5. Un polinucleótido que es complementario a un polinucleótido de SEQ ID NO. l o SEQ ID NO. 5. 6. Un caseette de expresión recombinantee, que comprende a un miembro de cualquiera de lae reivindicaciones 1 a 5, operablemente unidos, en sentido o contra-sentido u orientación, a un promotor. 7. Una célula huéeped que comprende el cassette de expresión recombinantee de la reivindicación 6 8. Uña planta transgenica que comprende el cassette de expresión recombinantee de la reivindicación 6. 9. La planta transgenica de la reivindicación 8, en donde dicha planta es una monocotiledónea. 10. La planta transgenica de la reivindicación 8, en donde dicha planta es una dicotiledónea. 11. La planta transgenica de la reivindicación 8, en donde dicha planta se seLecciona del grupo que consiete de: maíz, soja, girasol, orgo, cañóla, trigo, alfalfa, algodón, arroz, cebada, mijo, cacahuete, y cacao. 12. Una semilla de la planta transgenica de la reivindicación 8 13. Un método de modulación del nivel de celulosa sintetasa en una célula de la planta, que comprende: (a) introducción de un caseette de expreeión recombinantee, en una célula de la planta, de la reivindicación 6; (b) cultivar la célula de la planta bajo condiciones de desarrollo cel lar de la planta; y (c) inducción de expresión de dicho polinucleótido durante un tiempo suficiente para modular el nivel de celulosa sintetasa en dicha célula de la planta. 14. El método de la reivindicación 13, en donde la célula de la planta es de maíz, trigo, arroz, o soja. 15. Un método de modulación del nivel de celulosa sintetaea en una planta, que comprende, : (a) introducción | de un caeeette de expresión recombinantee, en una cejlula de la planta, de la reivindicación 6; (b) cultivar la célula de la planta bajo condiciones de desarrollo celular de la planta; (c) regeneración de una planta a partir de dicha célula de la planta; y (d) inducción de la expresión de dicho polinucleótido durante un ti||empo euficiente para modular el nivel de celuloea sintetasa dicha planta. 16. El método de la reivindicación 15, en donde la planta es maíz, trigo, arroz, o soja. 17. Una proteína aislada que comprende a un miembro seleccionado del grupo que consiste de: (a) un polipéptido seleccionado del grupo que consiete de SEQ ID NOS: 2 y 6 (b) un polipéptido que tiene por lo menos 80% de identidad de la eecuencia, y ¡teniendo por lo menos un epitope en común con, un polipéptido seleccionado a partir del grupo que coneiete de SEQ ID NOS: 2 y 6, en donde dicha identidad de la secuencia es determinada por el algoritmo GAP bajo los parámetroe predefinidos; y, (c) por lo menos un polipéptido codificado por un miembro de cualquiera de las reivindicaciones 1 a 5. 18. Un método de modificación de la expreeión de celulosa sintetaea en un gen en una planta de maíz que comprende : (a) identificación, a partir de una población de maíz, plantas mutagenizadas con el elemento transponible Mu, eeae plantae que contienen uno o más insercionee de Mu dentro de un polinucleótido de cualquiera de lae reivindicaciones 1 a 5; (b) seleccionar aquellas plantas que mueetran la expreeión del gen celuloea sintetasa modificada. 19. El método de lá reivindicación 18, en donde la expreeión del gen celuloea si:ntetasa ee regula-hacia abajo. 20. El método de reivindicación 18, en donde la expresión del gen celulosa sintetasa se regula-hacia arriba,
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US55048300A | 2000-04-14 | 2000-04-14 | |
| PCT/US2001/011951 WO2001079516A2 (en) | 2000-04-14 | 2001-04-12 | Maize cellulose synthases and uses thereof |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MXPA02010012A true MXPA02010012A (es) | 2003-04-25 |
Family
ID=24197364
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MXPA02010012A MXPA02010012A (es) | 2000-04-14 | 2001-04-12 | Celulosa sintetasas de maiz y usos de las mismas. |
Country Status (6)
| Country | Link |
|---|---|
| EP (1) | EP1272650A2 (es) |
| AU (1) | AU2001253413A1 (es) |
| CA (1) | CA2406381C (es) |
| HU (1) | HUP0301659A3 (es) |
| MX (1) | MXPA02010012A (es) |
| WO (1) | WO2001079516A2 (es) |
Families Citing this family (60)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6867352B2 (en) | 1998-07-14 | 2005-03-15 | E. I. Du Pont De Nemours And Company | Plant cellulose synthases |
| US20040068767A1 (en) * | 1998-08-17 | 2004-04-08 | Pioneer Hi-Bred International, Inc. | Maize cellulose synthases and uses thereof |
| WO2003026389A2 (en) | 2001-09-27 | 2003-04-03 | Pioneer Hi-Bred International, Inc. | Manipulation of plant polysaccharide synthases |
| AU2004252481B2 (en) * | 2003-06-06 | 2011-01-27 | Arborgen Inc. | Compositions and methods for regulating polysaccharides of a plant cell |
| US7947877B2 (en) | 2008-05-14 | 2011-05-24 | Monosanto Technology LLC | Plants and seeds of spring canola variety SCV328921 |
| US7935870B2 (en) | 2008-05-14 | 2011-05-03 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV354718 |
| US8829282B2 (en) | 2008-05-14 | 2014-09-09 | Monsanto Technology, Llc | Plants and seeds of spring canola variety SCV425044 |
| US7964774B2 (en) | 2008-05-14 | 2011-06-21 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV384196 |
| US8466342B2 (en) | 2009-06-09 | 2013-06-18 | Pioneer Hi Bred International Inc | Early endosperm promoter and methods of use |
| US8071848B2 (en) | 2009-06-17 | 2011-12-06 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV218328 |
| BR112012009044A2 (pt) | 2009-10-26 | 2015-09-01 | Pioneer Hi Bred Int | Molécula de ácido nucléico isolada, cassete de expressão, vetor, célula vegetal, planta, semente transgênica, método para expressão de um polinucleotídeo em uma planta ou célula vegetal e método para expressão de um polinucleotídeo, preferencialmente em tecidos somáticos de óvulo de uma planta |
| US8138394B2 (en) | 2010-02-26 | 2012-03-20 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV431158 |
| US8148611B2 (en) | 2010-02-26 | 2012-04-03 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV453784 |
| US8143488B2 (en) | 2010-02-26 | 2012-03-27 | Monsanto Technoloy LLC | Plants and seeds of spring canola variety SCV470336 |
| US8581048B2 (en) | 2010-03-09 | 2013-11-12 | Monsanto Technology, Llc | Plants and seeds of spring canola variety SCV119103 |
| US8153865B2 (en) | 2010-03-11 | 2012-04-10 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV152154 |
| US8513487B2 (en) | 2011-04-07 | 2013-08-20 | Zenon LISIECZKO | Plants and seeds of spring canola variety ND-662c |
| US8513494B2 (en) | 2011-04-08 | 2013-08-20 | Chunren Wu | Plants and seeds of spring canola variety SCV695971 |
| US8507761B2 (en) | 2011-05-05 | 2013-08-13 | Teresa Huskowska | Plants and seeds of spring canola variety SCV372145 |
| US8513495B2 (en) | 2011-05-10 | 2013-08-20 | Dale Burns | Plants and seeds of spring canola variety SCV291489 |
| WO2013096818A1 (en) | 2011-12-21 | 2013-06-27 | The Curators Of The University Of Missouri | Soybean variety s05-11268 |
| WO2013096810A1 (en) | 2011-12-21 | 2013-06-27 | The Curators Of The University Of Missouri | Soybean variety s05-11482 |
| US9006515B2 (en) | 2012-01-06 | 2015-04-14 | Pioneer Hi Bred International Inc | Pollen preferred promoters and methods of use |
| WO2013103371A1 (en) | 2012-01-06 | 2013-07-11 | Pioneer Hi-Bred International, Inc. | Ovule specific promoter and methods of use |
| US8802935B2 (en) | 2012-04-26 | 2014-08-12 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV942568 |
| US8878009B2 (en) | 2012-04-26 | 2014-11-04 | Monsanto Technology, LLP | Plants and seeds of spring canola variety SCV318181 |
| US8859857B2 (en) | 2012-04-26 | 2014-10-14 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV259778 |
| US8835720B2 (en) | 2012-04-26 | 2014-09-16 | Monsanto Technology Llc | Plants and seeds of spring canola variety SCV967592 |
| US20150259696A1 (en) | 2012-10-11 | 2015-09-17 | Shane E. Abbitt | Guard cell promoters and uses thereof |
| EA028528B1 (ru) | 2013-03-13 | 2017-11-30 | Пайонир Хай-Бред Интернэшнл, Инк. | Внесение глифосата для борьбы с сорняками у brassica |
| WO2014153254A2 (en) | 2013-03-14 | 2014-09-25 | Pioneer Hi-Bred International Inc. | Compositions and methods to control insect pests |
| CN105473605A (zh) | 2013-03-15 | 2016-04-06 | 先锋国际良种公司 | Phi-4多肽及其使用方法 |
| CA2920339C (en) | 2013-08-16 | 2023-10-24 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| MX359027B (es) | 2013-09-13 | 2018-09-12 | Pioneer Hi Bred Int | Proteinas insecticidas y metodos para su uso. |
| US10227608B2 (en) | 2014-02-07 | 2019-03-12 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins from plants and methods for their use |
| CA2955828A1 (en) | 2014-08-08 | 2016-02-11 | Pioneer Hi-Bred International, Inc. | Ubiquitin promoters and introns and methods of use |
| CA2961733A1 (en) | 2014-09-17 | 2016-03-24 | Pioneer Hi-Bred International, Inc. | Compositions and methods to control insect pests |
| CN107108705B (zh) | 2014-10-16 | 2021-05-25 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
| WO2016099916A1 (en) | 2014-12-19 | 2016-06-23 | E. I. Du Pont De Nemours And Company | Polylactic acid compositions with accelerated degradation rate and increased heat stability |
| RU2740312C2 (ru) | 2015-01-15 | 2021-01-13 | Пайониэ Хай-Бред Интернешнл, Инк. | Инсектицидные белки и способы их применения |
| CN116333064A (zh) | 2015-05-19 | 2023-06-27 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
| CN107771181A (zh) | 2015-06-16 | 2018-03-06 | 先锋国际良种公司 | 用以防治昆虫有害生物的组合物和方法 |
| BR122023016256B8 (pt) | 2015-08-06 | 2024-04-30 | Du Pont | Polipeptídeo inseticida recombinante, polinucleotídeo recombinante, construto de dna, método de obtenção de uma planta transgênica ou célula de planta transgênica, composição, proteína de fusão, método para controlar uma praga, método para inibir crescimento ou para exterminar uma população de pragas e uso do polipeptídeo |
| CN108513584A (zh) | 2015-08-28 | 2018-09-07 | 先锋国际良种公司 | 苍白杆菌介导的植物转化 |
| WO2017105987A1 (en) | 2015-12-18 | 2017-06-22 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| CA3004056C (en) | 2015-12-22 | 2024-01-23 | Pioneer Hi-Bred International, Inc. | Tissue-preferred promoters and methods of use |
| EP3960863B1 (en) | 2016-05-04 | 2024-11-13 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| US20190185867A1 (en) | 2016-06-16 | 2019-06-20 | Pioneer Hi-Bred International, Inc. | Compositions and methods to control insect pests |
| RU2019101793A (ru) | 2016-06-24 | 2020-07-24 | Пайонир Хай-Бред Интернэшнл, Инк. | Регуляторные элементы растений и способы их применения |
| CN109788735A (zh) | 2016-07-01 | 2019-05-21 | 先锋国际良种公司 | 来自植物的杀昆虫蛋白及其使用方法 |
| US20210292778A1 (en) | 2016-07-12 | 2021-09-23 | Pioneer Hi-Bred International, Inc. | Compositions and methods to control insect pests |
| CA3038806A1 (en) | 2016-11-01 | 2018-05-11 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| JP2020536515A (ja) | 2017-09-25 | 2020-12-17 | パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド | 組織優先的プロモーター及びその使用方法 |
| BR112020018644A2 (pt) | 2018-03-12 | 2020-12-29 | Pioneer Hi-Bred International, Inc. | Uso de fatores morfogênicos para o aprimoramento de edição de genes |
| WO2019178038A1 (en) | 2018-03-14 | 2019-09-19 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins from plants and methods for their use |
| CN115850420A (zh) | 2018-03-14 | 2023-03-28 | 先锋国际良种公司 | 来自植物的杀昆虫蛋白及其使用方法 |
| CA3096516A1 (en) | 2018-05-22 | 2019-11-28 | Pioneer Hi-Bred International, Inc. | Plant regulatory elements and methods of use thereof |
| BR112020026640A2 (pt) | 2018-06-28 | 2021-04-06 | Pioneer Hi-Bred International, Inc. | Métodos para selecionar plantas transformadas |
| US20210395758A1 (en) | 2018-10-31 | 2021-12-23 | Pioneer Hi-Bred International, Inc. | Compositions and methods for ochrobactrum-mediated plant transformation |
| BR112022027035A2 (pt) | 2020-07-14 | 2023-04-11 | Pioneer Hi Bred Int | Proteínas inseticidas e métodos para uso das mesmas |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AUPO069996A0 (en) * | 1996-06-27 | 1996-07-18 | Australian National University, The | Manipulation of plant cellulose |
| WO2000004166A2 (en) * | 1998-07-14 | 2000-01-27 | E.I. Du Pont De Nemours And Company | Plant cellulose synthases |
| EP1105502B1 (en) * | 1998-08-17 | 2007-10-17 | Pioneer Hi-Bred International, Inc. | Maize cellulose synthases and uses thereof |
-
2001
- 2001-04-12 MX MXPA02010012A patent/MXPA02010012A/es active IP Right Grant
- 2001-04-12 HU HU0301659A patent/HUP0301659A3/hu unknown
- 2001-04-12 EP EP01926909A patent/EP1272650A2/en not_active Withdrawn
- 2001-04-12 AU AU2001253413A patent/AU2001253413A1/en not_active Abandoned
- 2001-04-12 CA CA002406381A patent/CA2406381C/en not_active Expired - Fee Related
- 2001-04-12 WO PCT/US2001/011951 patent/WO2001079516A2/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| HUP0301659A2 (hu) | 2003-08-28 |
| EP1272650A2 (en) | 2003-01-08 |
| WO2001079516A2 (en) | 2001-10-25 |
| CA2406381A1 (en) | 2001-10-25 |
| CA2406381C (en) | 2006-01-31 |
| HUP0301659A3 (en) | 2004-11-29 |
| AU2001253413A1 (en) | 2001-10-30 |
| WO2001079516A3 (en) | 2002-05-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7285702B2 (en) | Maize cellulose encoding nucleic acids and uses thereof | |
| US6930225B2 (en) | Maize cellulose synthases and uses thereof | |
| MXPA02010012A (es) | Celulosa sintetasas de maiz y usos de las mismas. | |
| US20040068767A1 (en) | Maize cellulose synthases and uses thereof | |
| US7524933B2 (en) | Maize cellulose synthases and uses thereof | |
| US20120047608A1 (en) | Floral Transition Genes in Maize and Uses Thereof | |
| US20110030090A1 (en) | Disease resistance genes | |
| US20020138882A1 (en) | Polynucleotides encoding proteins involved in plant metabolism | |
| US20030005482A1 (en) | Manipulation of sucrose synthase genes to improve stalk and grain quality | |
| US20020124284A1 (en) | Nitrate-responsive root transcriptional factor | |
| WO2000070059A2 (en) | Signal transduction genes and methods of use | |
| AU2002240443A1 (en) | Manipulation of Sucrose Synthase Genes to Improve Stalk and Grain Quality |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FG | Grant or registration |