[go: up one dir, main page]

MXPA02005178A - Oleil-proteina portadora de acilo tioesterasas en plantas. - Google Patents

Oleil-proteina portadora de acilo tioesterasas en plantas.

Info

Publication number
MXPA02005178A
MXPA02005178A MXPA02005178A MXPA02005178A MXPA02005178A MX PA02005178 A MXPA02005178 A MX PA02005178A MX PA02005178 A MXPA02005178 A MX PA02005178A MX PA02005178 A MXPA02005178 A MX PA02005178A MX PA02005178 A MXPA02005178 A MX PA02005178A
Authority
MX
Mexico
Prior art keywords
leu
arg
glu
thr
val
Prior art date
Application number
MXPA02005178A
Other languages
English (en)
Inventor
M Allen Stephen
Original Assignee
Du Pont
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Du Pont filed Critical Du Pont
Publication of MXPA02005178A publication Critical patent/MXPA02005178A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Nutrition Science (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Esta invencion se relaciona con un fragmento de acido nucleico aislado que codifica para una oleil-ACP tioesterasa. La invencion tambien se relaciona con la construccion de un gen quimerico que codifica para toda o una porcion de la oleil-ACP tioesterasa, en orientacion sentido o antisentido, donde la expresion del gen quimerico da como resultado la produccion de niveles alterados de oleil-ACP tioesterasa en una celula huesped transformada.

Description

OIiEHi- PROTEINA PORTADORA DE ACILO TIOESTERASAS EN PLANTAS CAMPO DE LA INVENCION Esta invención se encuentra en el campo de la biología molecular de plantas. De manera más específica, esta invención pertenece a fragmentos de ácido nucleico que codifican para la oleil-ACP tioesterasa en plantas y semillas .
ANTECEDENTES DE LA INVENCION La composición de lípidos de plantas, determina en gran medida la función de la membrana y la adaptación climática de las especies. Como resultado, existen muchos aceites de plantas naturales que presentan una amplia variedad de propiedades y composiciones. Esto ha conducido a la selección de diferentes aceites de plantas, para efectuar funciones industriales y nutricionales específicas. La composición lipídica es determinada por la síntesis de los ácidos grasos sobre una proteína portadora de acilo (ACP) , y su remoción de la ACP por tioesterasas . Las cadenas de ácido graso removidas de la ACP no son ya sustratos para el alargamiento o desnaturalización y están libres para acoplarse a los grupos cabeza para formar los compuestos de triacilo de orden superior, que son los componentes principales de los aceites. REF: 137857 Los lipidos de las plantas encuentran su uso principal como aceites comestibles en forma de ¦ triacilgliceroles . El desempeño especifico y atributos saludables de los aceites comestibles son determinados en gran medida por su composición de ácido graso. La mayoría de los aceites vegetales derivados de variedades de plantas comerciales están compuestos principalmente de ácidos palmitico (16:0), esteárico (18:0), oleico (18:1), linoleico (18:2) y linolénico (18:3). Los ácidos palmitico y esteárico son, respectivamente, ácidos grasos saturados de 16 y 18 carbonos de longitud. Los ácidos oleico, linoleico y linolénico son ácidos grasos insaturados de 18 carbonos de longitud, que contienen 1, 2 y 3 enlaces dobles, respectivamente. El ácido oleico es conocido como un ácido graso monoinsaturado, mientras que lo ácidos linoleico y linolénico son conocidos como ácidos grasos poliinsaturados. La biosintesis de aceite en plantas ha sido bien estudiada [véase Harwood (1989) en Critical Reviews in Plant Sciences, Vol. 8(1): 1-43]. La biosintesis de los ácidos palmitico, esteárico y oleico, ocurre en los plástidos debido a la interacción de tres enzimas claves del "ataque de la ACP": palmitoil-ACP elongasa, estearoil-ACP desnaturase y acil-ACP tioesterasas . De esos tres tipos de enzimas, las acil-ACP tioesterasas funcionan para remover la cadena de acilo de la cadena portadora (ACP) y de este modo formar la vía metabólica. La oleil-ACP tioesterasa cataliza la hidrólisis de oleil-ACP tioésteres a altas tasas y a tasas mucho menores la hidrólisis de palmitoil-ACP y estearoil-ACP. Han sido identificadas otras acil-ACP tioesterasas, las cuales no exhiben esta especificidad por el sustrato. La competencia entre todas las formas de acil-ACP tioesterasas, palmitoil-ACP elongasa y estearoil-ACP desnaturasa que trabajan sobre el mismo conjunto de sustratos unidos a ACP, finalmente determina las relaciones de ácidos palmitico, esteárico y poliinsaturados encontrados en los triacilglicéridos de los aceites vegetales. Esfuerzos de investigación recientes han examinado el papel que juega el ácido graso monoinsaturado en la reducción del riesgo de enfermedades cardiacas coronarias. En el pasado, se creía que los monoinsaturados, en contraste con los saturados y poliinsaturados, no tenían efecto sobre el colesterol sérico y el riesgo de enfermedades cardiacas coronarias. Varios estudios clínicos recientes en humanos sugieren que dietas altas en grasas monoinsaturadas pueden reducir el colesterol "malo" (lipoproteína de baja densidad) y mantener a la vez el colesterol "bueno" (lipoproteína de alta densidad). (Véase Mattson, et al., Journal of Lipid Research (1985) 26:194-202). El significado de la grasa monoinsaturado en la dieta fue confirmado por investigadores internacionales de siete países en el Segundo Coloquio sobre Grasas Monoinsaturadas patrocinado por Institutos Cardiacos, Pulmonares y Sanguíneos Nacionales en 1987. Por lo tanto, altos niveles de una actividad de oleil-ACP tioesterasa pueden ser ventajosos para incrementar la concentración de oleato monoinsaturado en aceites de plantas. Las tioesterasas de la clase I, encontradas en plantas y bacterias, son proteínas monofuncionales que catalizan la hidrólisis de acil-ACP tioésteres. Las actividades de tioesterasa de la Clase II son encontradas usualmente como componentes de polipéptidos multifuncionales y son ejemplificadas por las enzimas de las aves (Rogers y Kolattukudy (1984) Anal. Biochem 137:444-448) y ratas (Naggert et al., (1988) J. Biol.. Chem. 263:1146-1150). La Patente Estadounidense No. 5,147,792, expedida a Perchorowicz et al., describe un método para desviar la distribución de ácido graso en plástidos hacia especies de cadena más corto utilizando tioesterasa II y proteína portadora de acilo. Aunque Perchorowicz et al., enseñe un método para alterar la distribución de ácido graso en plástidos aislados, no enseñan un método para producir tales perfiles de ácido graso alterados en células de plantas completas. Ellos no enseñan además un método para producir plantas que se reproduzcan sexualmente que produzcan perfiles de ácido graso alterados. Los métodos, por lo tanto no proporcionan medios para la producción a gran escala de aceites vegetales útiles con composiciones de ácido graso nuevas . La Patente Estadounidense No. 5,298,421, expedida a Davies et al., describe acil-ACP-tioesterasas que prefieren cadenas medias de plantas y métodos relacionados. Los métodos enseñados por Davies et al., producen plantas con composiciones de aceite de semillas con cantidades sustanciales de ácidos grasos de menos de 16 átomos de carbono de longitud. Esos aceites son diferentes de los aceites de semillas producidos por semillas oleaginosas de zonas templadas normales en esta característica. Las composiciones de ácido graso de aceites de semillas enseñadas en la presente invención no son elevadas en comparación con los aceites normales en los ácidos grasos más cortos (menos de 16 átomos de carbono) . Los perfiles de ácido graso producidos en la presente invención son diferentes de los de semillas oleaginosas de zonas templadas comunes y de la invención de Davies et al., dado que contienen niveles elevados de ácidos grasos completamente saturados de 16 y 18 átomos de carbono de longitud. La Patente Estadounidense No. 5,530,186, expedida a Hitz et al., en Junio 25, 1996, describe el uso de fragmentos de ácido nucleico aislados que codifican para las acil-ACP y palmitoil-ACP tioesterasas (respectivamente), en plantas transgénicas que tienen composiciones de ácido graso alteradas. La acil-ACP tioesterasa codifica para una enzima que prefiere la cadena media similar a la descrita por Davies. La palmitoil-ACP tioesterasa exhibe especificidad por el palmitato insaturado de 16 carbonos. La evidencia de tres ADNc de longitud completa, y tres ADNc parciales, que codifican para oleil-ACP tioesterasas de seis diferentes especies de plantas es presentada aquí.
SUMARIO DE LA INVENCION La presente invención se relaciona con un polinucleótido aislado que comprende una secuencia nucleotidica seleccionada del grupo que consiste de (a) una primera secuencia nucleotidica que codifica para un polipéptido de al menos 166 aminoácidos que tiene al menos una identidad del 90% sobre la base del método de alineación de Clustal cuando se compara con un polipéptido seleccionado del grupo que consiste de SEQ ID NO: 2, 4, 6, 8, 10, 12 y 16, o una segunda secuencia nucleotidica que codifica para un polipéptido de al menos 363 aminoácidos que tiene al menos una identidad del 92% sobre la base del método de alineación de Clustal, comparado con un polipéptido de la SEQ ID NO: 14, y (b) una tercera secuencia nucleotidica que comprende el complemento de la primera o segunda secuencia nucleotidica. En una segunda modalidad, se prefiere que el polinucleótido aislado de la invención comprenda una primera secuencia nucleotidica que comprenda una secuencia de ácido nucleico seleccionada del grupo que consiste de SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15 que codifique para el polipéptido seleccionado de los grupos que consisten de SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 y 16. En una tercera modalidad, esta invención se relaciona con un polinucleótido aislado que comprende una secuencia nucleotidica de al menos uno de 60 (de manera preferible al menos uno de 40, de manera más preferible al menos uno de 30) nucleótidos contiguos derivados de una secuencia nucleotidica seleccionada del grupo que consiste de SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15 y el complemento de tales secuencias nucleotidicas . En una cuarta modalidad, esta invención se relaciona con un gen quimérico que comprende un polinucleótido aislado de la presente invención, ligado de manera operable a al menos una secuencia reguladora adecuada. En una quinta modalidad, la presente invención se relaciona con una célula huésped aislada que comprende un gen quimérico de la presente invención o un polinucleótido asilado de la presente invención. La célula huésped puede ser eucariótica, tal como una levadura o una célula de planta, o procariótica, tal como una célula de bacteria. La presente invención también se relaciona con un virus, de manera preferible un baculovirus, que comprende un polinucleótido aislado de la presente invención o un gen quimérico de la presente invención. En una sexta modalidad, la invención también se relaciona con un proceso para producir una célula huésped aislada que comprende un gen quimérico de la presente invención o un polinucleótido aislado de la presente invención, el proceso comprende la transformación o transfección de una célula huésped adecuada aislada con un gen quimérico o polinucleótido aislado de la presente invención . En una séptima modalidad, la invención se relaciona con un polipéptido oleil-ACP tioesterasa de al menos 166 aminoácidos que comprende una identidad de al menos el 90% sobre la base del método de alineación de Clustal comparado con un polipéptido seleccionado del grupo que consiste de SEQ ID NO: 2, 4, 6, 8, 10, 12 y 16, o polipéptido de al menos 365 aminoácidos que comprende una identidad de al menos el 92% sobre la base del método de alineación de Clustal, comprado con un polipéptido de la SEQ ID NO: 14. En una octava modalidad, la invención se relaciona con un método para seleccionar un polinucleótido aislado que afecta el nivel de expresión del polipéptido oleil-ACP tioesterasa o actividad enzimática en una célula huésped, de manera preferible una célula de planta, el método comprende los pasos de: (a) construir un polinucleótido aislado de la presente invención o un gen quimérico aislado de la presente invención; (b) introducir el polinucleótido aislado del gen quimérico aislado en una célula huésped; (c) medir el nivel del polipéptido oleil-ACP tioesterasa o actividad enzimática en la célula huésped que contiene el polinucleótido aislado; y (d) comparar el nivel de polipéptido oleil-ACP tioesterasa o actividad enzimática en la célula huésped que contiene el polinucleótido aislado con el nivel de polipéptido oleil-ACP tioesterasa o actividad enzimática en la célula huésped que con contiene el polinucleótido aislado. En una novena modalidad, la invención se relaciona con un método para obtener un fragmento de ácido nucleico que codifica para una porción sustancial de un polipéptido oleil-ACP tioesterasa, de manera preferible, un polipéptido oleil-ACP tioesterasa de planta, que comprende los pasos de: sintetizar un cebador oligonucleótido que comprende una secuencia nucleotidica de al menos uno de 30 (de manera preferible al menos uno de 40, de manera más preferible al menos uno de 60) nucleótidos contiguos derivados de una secuencia nucleotidica seleccionada del grupo que consiste de SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15, y el complemento de tales secuencias nucleotidicas ; y amplificar un fragmento de ácido nucleico (de manera preferible un ADNc insertado en un vector de clonación) , utilizando el cebador oligonucleotidico . El fragmento de ácido nucleico amplificado preferiblemente codificará para una porción sustancial de una secuencia de aminoácidos de oleil-ACP tioesterasa . En una décima modalidad, esta invención se relaciona con un método para obtener un fragmento de ácido nucleico que codifica para toda o una porción sustancial de la secuencia de aminoácidos que codifica para un polipéptido oleil-ACP tioesterasa que comprende los pasos de: sondear una ADNc o biblioteca genómica con un polinucleótido aislado de la presente invención; identificar una clona de ADN que se hibride con un polinucleótido aislado de la presente invención; aislar la clona de ADN identificada; y secuenciar al ADNc o fragmento genómico que comprende la clona de ADN aislada . En una onceava modalidad, esta invención se relaciona con una composición, tal como una mezcla de hibridación, que comprende un polinucleótido aislado de la presente invención. En una doceava modalidad, esta invención se relaciona con un método para la selección positiva de una célula transformada que comprende: (a) transformar una célula huésped con el gen quimérico de la presente invención o un cásete de expresión de la presente invención; y (b) hacer crecer la célula huésped transformada, de manera preferible una célula de planta, tal como una monocotiledonea o como dicotiledónea, bajo condiciones que permitan la expresión del polinucleotido oleolil-ACP tioesterasa en una cantidad suficiente para complementar un mutante nulo para proporcionar medios de selección positiva. En una treceava modalidad, esta invención se relaciona con un método para alterar el nivel de expresión de una oleoil-ACP tioesterasa en una célula huésped que comprende: (a) transformar una célula huésped con un gen quimérico de la presente invención; y (b) hacer crecer la célula huésped transformada bajo condiciones adecuadas para la expresión de un gen quimérico donde la expresión del gen quimérico da comparación o resultado la producción de niveles alterados de oleoil-ACP tioesterasa en la célula huésped transformada .
BREVE DESCRIPCION DE LOS DIBUJOS Y LISTADO DE SECUENCIA La invención puede ser comprendida de manera más completa a partir de la siguiente descripción detallada y los dibujos acompañantes y los listados de secuencia que forman parte de esta solicitud. La Figura 1 muestra una comparación de las secuencias de aminoácidos de la oleoil-ACP tioesterasa de margarita africana (Dimorphotheca sinuata, SEQ ID NO: 2 denotada como [SIN2]), maíz [Zea mays, SEQ ID NO: 6 denotada [SIN8]), cártamo (Carthamus tinctorius, SEQ ID NO : 17 , ~ Acceso NCBI número: gi 404028), manzana de tusa (Licania michauxii, SEQ ID NOC4 denotada como [SIN4]), mangostrana (Garcinia mangostana, SEQ ID NO: 18 Acceso NCDI número: gi 1930077), Vernonia (Vernonia mespilifolia, SEQ ID NO: 10 denotada como [SIN10]), cártamo (Carthamus tinctorius, SEQ ID NO: 19, Acceso NCBI número: gi 404026), trigo (Triticum aestivum, SEQ ID NO: 12 denotada como [SIN12]), aceite de palma africana (Elaeis guineensis, SEQ ID NO: 20, Acceso NCDI número: gi 4704640), maíz (Zea mays, SEQ ID NO: 14 denotada como [SIN14]), trigo (Triticum aestivum, SEQ ID NO: 16 denotada como [SIN16] ) , y dos proteínas de arabidopsis (Arabidopsis thaliana, SEQ ID NO: 21 y 22, Acceso NCBI número: gi 7487983 y gi 1076361, respectivamente) . La tabla 1 lista los polipetidos que son descritos aquí, la designación de las clonas de ADNc que comprenden los fragmentos de ácido nucleico que codifican para polipetidos que representan toda o una parte sustancial de esos polipetidos, y los identificadores correspondientes (SEQ ID NO:) como se utilizan en el listado de secuencia anexo. Las descripciones de las secuencias y los listados de secuencia anexos a la presente cumplen con las reglas que gobiernan las descripciones de secuencias de nucleotidos y/o aminoácidos en solicitudes de patentes como se expone en 37 C.F.R. ? 1.821- 1.825.
TABLA 1 Oleoil-ACP Tioesterasa Oleiol-ACP Designación SEQ ID NO: tioesterasa la clona (Nucleotido) (Aminoácido) Margarita dms2. cpkOOl . m 1 Africana 14 : fis [Dimorpha heca sinauta] Manzana de elslc.pkOOl. k6 tusa [Licania : fis michauxii] Maíz [Zea crln.pk0147. g3 mays] : fis Arroz [Oryza rlOn.pklOl.123 sativa] : fis rlr48.pkOOlO . f 5 Vernonia vsln.pkOOlO . f5 10 [ Vernonia mespilifolia] Trigo wrl.pk0026.b7 11 12 t Triticum aestivum] Maíz [Zea cp lc.pk002. g7 13 14 mays] : fis Trigo wrl.pk0026.b7: 15 16 [ Triticum fis aestivum] El listado de secuencia contiene el código de una •letra para los caracteres de la secuencia nucleotídica y el código de tres letras para aminoácidos de acuerdo a lo definido de conformidad con los estándares IUPAC-IUBMB descritos en Nucleic Acids Res. 13:3021-3030 (1985) y el Bioche ical J. 219 {No.2) : 345-373 (1984) los cuales se incorporan aquí como referencia. Los símbolos y el formato utilizado para la secuencia de nucleótidos y aminoácidos cumplen con los requerimientos de 37 C.F.R. ? 1.822.
DESCRIPCION DETALLADA DE LA INVENCION En el contexto de esta descripción, serán utilizados numerosos términos. Los términos "polinucleotido", "secuencia polinucleotídica", "secuencia de ácido nucleico", y "fragmento de ácido nucleico"/ "fragmento de ácido nucleico aislado" son utilizados de manera intercambiable. Esos términos abarcan secuencias nucleotídicas y similares. Un polinucleotido puede ser un ARN o ADN que sea de una sola o doble hebra, que opcionalmente contenga bases nucleotídicas sintéticas, no naturales o alteradas. Un polinucleotido en forma de un polímero de ADN puede estar comprendido de uno o más segmentos de ADNc, ADN genómico, ADN sintético, o mezclas de los mismos. Un polinucleotido aislado de la presente invención puede incluir al menos uno de 1200 nucleotidos contiguos, de manera preferible al menos uno de 800 nucleotidos contiguos, de manera más preferible uno de al menos 400 nucleotidos contiguos derivados de SEQ ID NOs: 1,3,5,7,9,11,13 y 15 o al complemento de tales secuencias. El término polinucleotido "aislado" se refiere a un polinucleotido que esta sustancialmente libre de otras secuencias de ácido nucleico, tal como y sin limitarse a otros ADN y ARN cromosomales y extracromosomales, ¦ que normalmente acompañan o interactuan con este como se encuentra en el ambiente natural. Los polinucleo'tidos aislados pueden ser purificados de una célula huésped en la cual se encuentran de manera natural. Los... métodos-' de purificación de ácido nucleico convencionales conocidos por aquellos expertos en la técnica pueden ser utilizados para obtener polinucleo'tidos aislados. El término también abarca polinucleótidos recombinantes y polinucleotidos sintetizados químicamente. El término "recombinante" significa, por ejemplo, que una secuencia de ácido nucleico es producida por una combinación artificial de dos segmentos en una secuencia en otras dos circunstancias separados, por ejemplo, por síntesis química o por la manipulación de ácidos nucleicos aislados por técnicas de ingeniería genética.
Como se utiliza aquí, el término "contig" se refiere a una secuencia nucleotidica que es montada a partir de dos o más secuencias nucleotidicas constituyentes que comparten una superposición común. Por ejemplo, las secuencias nucleotidicas de dos o más fragmentos de ácido nucleico pueden ser comparadas y alineadas para identificar secuencias comunes o superpuestas. Donde existen secuencias comunes o superpuestas entre dos o más fragmentos de ácido nucleico, las secuencias (y de este modo sus fragmentos de ácido nucleico correspondientes) pueden ser montadas en una sola secuencia nucleotidica contigua, para formar un "contig" . Como se utiliza aquí, "sustancialmente similares" en el caso de fragmentos de ácido nucleico se refiere a cambios en una o más bases nucleotidicas que dan como resultado la sustitución de uno o más aminoácidos, pero que no afectan las propiedades funcionales del polipéptido codificado por la secuencia nucleotidica. "Sustancialmente similares" también se refiere a fragmentos de ácido nucleico en donde los cambios en una o más bases nucleotidicas no afectan la capacidad del fragmento de ácido nucleico para alterar los patrones de expresión genética por el silenciamiento del gen a través por ejemplo de la tecnología antisentido o de cosupresión. "Sustancialmente similares" también se refiere a modificaciones de los fragmentos de ácido nucleico de la presente invención tales como la supresión o inserción de uno o más nucleótidos que no afectan sustancialmente las propiedades funcionales del transcripto resultante vis-a-vis la capacidad de mediar el silenciamiento genético o alteración de las propiedades funcionales de la molécula de proteina resultante. Por lo tanto debe comprenderse que la invención abarca más de las secuencias nucleotidicas o de aminoácidos ejemplares especificas e incluye equivalentes funcionales de las mismas. Los términos "sustancialmente similares" y "sustancialmente correspondientes" son utilizados de manera intercambiable aquí. En una modalidad, los fragmentos de ácido nucleico sustancialmente similares pueden ser obtenidos seleccionando o separando fragmentos de ácido nucleico que representan subfragmentos o modificaciones de los fragmentos de ácido nucleico de la presente invención, donde uno o más nucleótidos son sustituidos, suprimidos y/o insertados, por su capacidad para afectar el nivel del polipéptido codificado por el fragmento de ácido nucleico no modificado en una planta o célula de planta. Por ejemplo, un fragmento de ácido nucleico sustancialmente similar que representa al menos uno de 400 nucleótidos contiguos derivados del fragmento de ácido nucleico de la presente puede ser construido e introducido en una planta o planta de célula. El nivel del polipéptido codificado por el fragmento de ácido nucleico no modificado presente en una planta o célula de planta expuesta al fragmento de ácido nucleico sustancialmente similar puede entonces ser comparado con el nivel del polipéptido en una planta o célula de planta que no este expuesta al fragmento de ácido nucleico sustancialmente similar. Por ejemplo, es bien sabido en la técnica que la supresión y cosupresion antisentido de la expresión de un gen puede ser lograda utilizando fragmentos de ácido nucleico que representen menos de toda la región codificadora de un gen, y utilizando fragmentos de ácido nucleico que no compartan una identidad de secuencia del 100% con el gen a ser suprimido. Además, las alteraciones en un fragmento de ácido nucleico que dan como resultado la producción de un aminoácido químicamente equivalente en un sitio dado, pero que no afectan las propiedades funcionales del polipéptido codificado, son bien conocidos en la técnica. De este modo, un codón para el aminoácido alanina, un aminoácido hidrofóbico, puede ser sustituido por un codón que codifique para otro residuo menos hidrofóbico, tal como la glicina, o un residuo más hidrofóbico, tal como la valina, leucina o isoleucina. De manera similar, también puede esperarse que cambios que dan como resultado la sustitución de un residuo cargado negativamente por otros, tales como el ácido aspártico por ácido glutámico, o un residuo cargado positivamente por otro, tal como la lisina por arginina, puedan producir un producto funcionalmente equivalente. También no se esperaría que los cambios nucleotidicos que dan como resultado la alteración de porciones N-terminal y c- terminal de la molécula polipeptídica alteren la actividad del polipéptido. Cada una de las modificaciones propuestas esta dentro de la rutina de las destrezas en la técnica, como lo es la determinación de la retención de actividad biológica de los productos codificados. En consecuencia, un polinucleótido aislado que comprende una secuencia nucleotídica de al menos uno de 60 (de manera preferible al menos uno de 40, de manera más preferible al menos uno de 30) nucleótidos contiguos derivados de una secuencia nucleotídica seleccionada del grupo que consiste de las SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15, y el complemento de tales secuencias nucleotídicas puede ser utilizado en métodos para seleccionar un polinucleótido aislado que afecte la expresión de un polipéptido oleoli/ACP tioesterasa en una célula huésped. Un método para seleccionar un polinucleótido asilado que afecte el nivel de expresión de un polipéptido en un virus o en una célula huésped (eucariótica, tal como una célula de planta, o una célula de levadura, o procariótica tal como una célula de bacteria) puede comprender los pasos de: construir un polinucleótido aislado de la presente invención o un gen quimérico aislado de la presente invención; introducir el polinucleótido aislado o el gen quimérico aislado en una célula huésped, midiendo el nivel del polipéptido o actividad enzimática en la célula huésped que contiene el polinucleótido aislado; y comparando el nivel de un polipéptido o actividad enzimática en la célula huésped que contiene el polinucleótido aislado con el nivel de un polipéptido o actividad enzimática en una célula huésped que no contiene el polinucleótido aislado. Además, los fragmentos de ácido nucleico sustancialmente similar también pueden ser caracterizados por su capacidad para hibridarse. Los estimados de tal homología son proporcionados por la hibridación ADN-ADN o ADN-ARN bajo condiciones de estringencia como es bien comprendido por aquellos expertos en la técnica (Hames e Higgins, Eds. (1985) Nucleic Acid Hybridisation, IRL Press, Oxford, R.U). Las condiciones de estringencia pueden ser ajustadas para seleccionar fragmentos moderadamente similares, tales como secuencias homologas de organismos relacionados distantemente, con fragmentos altamente similares, tales como genes que duplican enzimas funcionales de organismos estrechamente relacionados. Los poslavados de la poshibridación determinan las condiciones de astringencia. Un conjunto de condiciones preferidas utiliza una serie de lavados comenzando con 6X SSC, SDS al 0.5% a temperatura ambiente durnate 15 minutos, repitiendo entonces con 2X SSC, SDS al 0.5% a 45°C durante 30 minutos, y repitiendo a continuación dos veces con 0.2X SSC, SDS al 0.5% a 50°G durante 30 minutos. Un conjunto más preferido de condiciones astringentes utiliza temperaturas mayores en los cuales los lavados son idénticos a aquellos anteriores excepto que la temperatura de los dos lavados finales de 30 minutos en 0.2X o SSC, SDS al 0.5% se incremento a 60 C. Otro conjunto preferido de condiciones altamente estringente utiliza dos lavados finales en 0.1X SSC, SDS al 0.1% a 65°C. Los fragmentos de ácido nucleico sustancialmente similares de la presente invención también pueden ser caracterizado por el por ciento de identidad de las secuencias de aminoácido que codifican para las secuencias de aminoácidos descritas aquí, de acuerdo a lo determinado por los algoritmos comúnmente empleados por aquellos expertos en la técnica. Los fragmentos de ácido nucleico adecuados (polinucleótidos aislados de la presente invención) codifican para polipéptidos que son al menos aproximadamente 70% idénticos, de manera preferible al menos aproximadamente 80%, de manera más preferible al menos aproximadamente 85%, de manera aún más preferible al menos aproximadamente 90%, y de manera más preferible al menos aproximadamente 95% idénticos a las secuencias de aminoácidos reportadas aquí. Los fragmentos de ácidos nucleicos preferidos codifican para secuencias de aminoácidos que son aproximadamente 92% idénticas a las secuencias de aminoácidos reportadas aquí. Los fragmentos de ácido nucleico más preferidos codifican para secuencias de aminoácidos que son al menos aproximadamente 93% idénticas a las secuencias de aminoácidos reportadas aqui. Más preferidos son fragmentos de ácido nucleico que codifican para secuencias de aminoácidos que son al menos aproximadamente 96% idénticas a las secuencias de aminoácidos reportadas aqui. Los fragmentos de ácido nucleico adecuados no únicamente tienen las identidades anteriores sino que típicamente codifican para un polipéptido que tiene al menos 10, de manera preferible 20, de manera más preferible 30, de manera aún más preferible 50, de manera más preferible al menos 100, de manera más preferible al menos 150 aminoácidos, de manera preferible al menos 166 aminoácidos, de manera más preferible al menos 200 aminoácidos, de manera más preferible al menos 250 aminoácidos, y de manera más preferible al menos 300 aminoácidos. Las alineaciones de secuencia y los cálculos del por ciento de identidad se efectuaron utilizando el programa de Megalign de la sucesión de computo bioinformática LASERGENE (DNSTAR Inc., Madison, WI). La alineación múltiple de las secuencias se efectuó utilizando el método de alineación de Clustal (Higgins y Sharp (1989) CABIOS 5:151-153) con los parámetros predeterminados (PENALIDAD DE ESPACIO =10, PENALIDAD DE LA LONGITUD DEL ESPACIO =10) . Los parámetros predeterminados para la alineación por pares utilizando el método de Clustal fueron KTUPLA 1, PENALIDAD DE ESPACIO = 3, VENTANA = 5 y DIAGONALES SALVADAS = 5. Una "porción sustancial" de una secuencia de aminoácidos o nucleótidos comprende una secuencia de aminoácidos o nucleótidos que es suficiente para proporcionar la identificación putativa de la proteina o gen que comprende la secuencia de aminoácidos o nucleótidos. La secuencia de aminoácidos o nucleótidos que pueden ser evaluadas ya sea manualmente por un experto en la técnica, o utilizando la comparación de secuencia basada en una computadora y herramientas de identificación que emplean algoritmos tales como el BLAS (Basic Local Alignment Search Tool; Altschul et al. (1993) J. Mol. Biol. 215; 403-410 ; véase también www.ncbi.nlm.nih.gov/BLAS/). En general, es necesario una secuencia de diez o más aminoácidos contiguos o treinta o más aminoácidos contiguos para identificar putativamente una secuencia polipeptidica o de ácido nucleico como homologa con una proteina o gen. Además, con respecto a las secuencias nucleotidicas, pueden ser utilizadas sondas oligonucleotidicas especificas de un gen que comprende 30 o más nucleótidos contiguos y métodos de identificación de genes dependientes de la secuencia (por ejemplo, hibridación de Southern) y aislamiento * (por ejemplo, hibridación in situ de colonias bacterianas o placas de bacteriófagos). Además, pueden ser utilizados oligonucleótidos cortos de 12 o más nucleótidos como cebadores de la amplificación en PCR para obtener un fragmento de ácido nucleico particular que comprenda los cebadores. En consecuencia, "porción sustancial" de una secuencia nucleotidica comprende una secuencia nucleotidica que proporcionara la identificación especifica y/o aislamiento de un fragmento de ácido nucleico que comprenda la secuencia. La especificación de la presente enseña secuencias de aminoácidos y nucleótidos que codifican ' para polipéptidos que comprenden una o más proteínas de planta particulares. El experto en la técnica, que tenga el beneficio de las secuencias reportadas aquí, puede ahora utilizar todas o una porción sustancial de las secuencias descritas aquí para propósitos conocidos para aquellos expertos en la técnica. En consecuencia, la presente invención comprende las secuencias completas reportadas en un listado de secuencia acompañante, así como porciones sustanciales de aquellas secuencias como se describió anteriormente. La "degeneración del codón" se refiere a la divergencia en el código genético que permite la variación de la secuencia nucleotidica sin afectar a la secuencia de aminoácidos de un polipéptido codificado. En consecuencia, la presente invención se relaciona con un fragmento de ácido nucleico que comprende una secuencia nucleotidica que codifica para todas o una porción sustancial de la secuencia de aminoácidos expuestas aquí. El experto en la técnica esta bien consciente de la "desviación de codón" exhibida por una célula huésped especifica en uso de los codones nucleotidicos para especificar un aminoácido dado. Por lo tanto, cuando se sintetice un fragmento de ácido nucleico para la expresión mejorada en una célula huésped, es deseable diseñar el fragmento de ácido nucleico de modo que su frecuencia de uso del codón se aproxime a la frecuencia del uso del codón preferido de la célula huésped. Los "fragmentos de ácido nucleico sintéticos" pueden ser montados a partir de los bloques de construcción oligonucleotidicos que son sintetizados químicamente utilizando procedimientos conocidos por aquellos expertos en la técnica. Esos bloques de construcción son ligados y recocidos para formar fragmentos de ácido nucleico más grande los cuales pueden entonces ser montados enzimáticamente para construir todo el fragmento de ácido nucleico deseado. "Químicamente sintetizado", se relaciona con un fragmento de ácido nucleico, que significa que los nucleótidos componentes fueron montados in vitro. La síntesis química manual de los fragmentos de ácido nucleico puede ser efectuada utilizando procedimientos bien establecidos, o puede efectuarse la síntesis química automatizada utilizando una de un número de máquinas comercialmente disponibles. En consecuencia, los fragmentos de ácido nucleico pueden ser diseñados para la expresión genética óptima basada en la optimización de la secuencia nucleotidica para reflejar la desviación del codón de la celular huésped. El experto en la técnica apreciara la probabilidad de una expresión genética exitosa si el uso del codón se desvia hacia aquellos codones favorecidos por el huésped. La determinación de codones preferidos puede basarse en estudios de genes derivados de la célula huésped donde este disponible la información de la secuencia. "Gen" se refiere a un fragmento de ácido nucleico que expresa una proteina especifica, incluyendo las secuencias reguladoras que preceden a (secuencias no codificadoras 5') y que siguen a (secuencias no codificadoras 3') la secuencia codificadora. "Gen nativo" se refiere a un gen como se encuentra en la naturaleza con sus propias secuencias reguladoras. "Gen quimérico" se refiere a cualquier gen que no sea un gen nativo, que comprenda secuencias reguladoras y codificadoras que se encuentran juntas en la naturaleza. En consecuencia, un gen quimérico puede comprender secuencias reguladoras y secuencias codificadoras que sean derivadas de diferentes fuentes» o secuencias reguladoras y secuencias codificadoras derivadas de la misma fuente, pero arregladas en una forma diferente a la encontrada en la naturaleza. "Gen endógeno" se refiere a un gen nativo en su lugar natural en el genoma de un organismo. Un "gen externo", se refiere a un gen normalmente no encontrado en el organismo huésped, pero que es introducido en el organismo huésped por transferencia genética. Los genes anteriores pueden comprender genes nativos insertados en un organismo no nativo, o genes quiméricos. Un "transgen" es un gen que ha sido introducido en el genoma por un procedimiento de transformación. Una "secuencia codificara" se refiere a una secuencia nucleotidica que codifica para una secuencia de aminoácidos especifica. Las "secuencias reguladoras" se refieren a secuencias nucleotidicas localizadas corriente arriba (secuencias no codificadoras 5'), dentro de, o corriente abajo (secuencias no codificadoras 3' ) de una secuencia codificadora, y que tienen influencia sobre la transcripción, procesamiento o estabilidad del ARN, o traducción de la secuencia codificadora asociada. Las secuencias reguladoras pueden incluir promotores, secuencias líderes de la traducción, intrones y secuencias de reconocimiento de poliadenilación . "Promotor" se refiere a una secuencia nucleotidica capaz de controlar la expresión de una secuencia codificadora de ARN funcional. En general, una secuencia codificadora se localiza _ 3' a una secuencia promotora. La secuencia promotora consiste de elementos corriente arriba proximales y más distales, siendo los últimos elementos con frecuencia referidos como mejoradores. En consecuencia, un "mej orador", es una secuencia nucleotidica que puede estimular la actividad promotora y puede ser un elemento innato del promotor o un elemento heterólogo insertado para aumentar el nivel de especificidad del tejido de un promotor. Los promotores pueden ser derivados en su totalidad de un gen nativo, o pueden estar compuestos de diferentes elementos derivados de diferentes promotores encontrados en la naturaleza, o pueden comprender aún segmentos nucleotídicos sintéticos. Es comprendido por aquellos expertos en la técnica que diferentes promotores pueden dirigir la expresión de un gen en diferentes tejidos o tipos de célula, o etapas diferentes del desarrollo, o en respuesta a diferentes condiciones ambientales. Los promotores que hacen que un fragmento de ácido nucleico sea expresado en la mayoría de los tipos celulares, en la mayoría de las veces son comúnmente referidos como "promotores constitutivos". Constantemente están siendo descubiertos nuevos promotores de varios tipos útiles en células de plantas; numerosos ejemplos pueden encontrarse en la recopilación de Okamuro y Goldberg (1989) Biochemistry of Plants 15:1-82. Además, se reconoce que puesto que en la mayoría de los casos, los límites exactos de las secuencias reguladoras no han sido completamente definidos, los fragmentos de ácido nucleico de diferentes longitudes pueden tener actividad promotora idéntica . "Secuencia líder de la traducción", se refiere a una secuencia nucleotídica localizada entre la secuencia promotora de un gen y la secuencia codificadora. La secuencia líder de la traducción está presente en el ARNm completamente procesado corriente arriba de la secuencia de inicio de la traducción. La secuencia líder de la traducción puede afectar el procesamiento del transcripto primario a ARNm, la estabilidad y eficiencia de la traducción del ARNm. Han sido descritos ejemplos de secuencias líderes de la traducción (Turner y Foster (1995) Mol. Biotechnol. 3:225-236) . Las "secuencias no codificadoras 3'", se refieren a secuencias nucleotídicas localizadas corriente debajo de una secuencia codificadora, e incluyen secuencias de reconocimiento de poliadenilación y otras secuencias que codifican para señales reguladoras capaces de afectar el procesamiento del ARNm o expresión del gen. La señal de poliadenilación se caracteriza usualmente por afectar la adición de tractos de ácido poliadenílico al extremo 3' al precursor del ARNm. El uso de secuencias no codificadoras 3' diferentes, es ejemplificado por Ingelbrecht et al. (1989) Plant Cell 1:671-680.
"'Transcripto de ARN", se refiere al producto resultante de la transcripción catalizada por polimerasa del ARN de una secuencia de ADN. Cuando el transcripto de ARN es una copia complementaria perfecta de la secuencia de ADN, se refiere como transcripto primario o puede ser una secuencia de ARN derivada del procesamiento postranscripcional del transcripto primario y se refiere como ARN maduro. "ARN mensajero (ARNm) ", se refiere al ARN que está sin intrones, y que puede ser traducido en polipéptidos por la célula. "ADNc", se refiere al ADN que es complementario a, y derivado de un patrón de ARNm. El ADNc puede ser de una sola hebra o convertido a la forma de doble hebra, utilizando, por ejemplo, el fragmento de Klenow del ADN polimerasa I. "ARN sentido", se refiere a un transcripto de ARN que incluye el ARNm y de este modo puede ser traducido en un polipéptido por la célula. "ARN antisentido" se refiere a un transcripto de ARN que es complementario a todo o parte de un transcripto o ARNm primario objetivo, y que bloquea la expresión de un gen objetivo (véase la Patente Estadounidense No. 5,107,065, incorporada aquí como referencia) . La complementaridad de un ARN antisentido puede ser con cualquier parte de la secuencia, nucleotidica especifica, es decir, en la secuencia no codificadora 5' , la secuencia no codificadora 3' , los intrones o la secuencia codificadora. "ARN funcional" se refiere al ARN sentido, ARN antisentido, o ARN ribosomal, u otro ARN que no pueda ser traducido, pero que tenga un efecto sobre los procesos celulares. El término "ligado operativamente" se refiere a la asociación de dos o más fragmentos de ácido nucleico o un 5 solo polinucleótido de modo que la función de uno sea afectada por el otro. Por ejemplo, un promotor está ligado operativamente con una secuencia codificadora cuando es capaz de afectar la expresión de esa secuencia codificadora (es decir, que la secuencia codificadora está bajo el control 10 transcripcional del promotor) . Las secuencias codificadoras pueden estar ligadas operativamente a secuencias reguladoras en orientación sentido o antisentido. El término "expresión", como se utiliza aquí, se refiere a la transcripción y acumulación estable de ARN 15 sentido (ARNm) o antisentido, derivado del fragmento de ácido nucleico de la invención. La expresión también puede referirse a la traducción del ARNm en un polipéptido. La "inhibición antisentido" se refiere a la producción de transcriptos de ARN antisentido, capaces de suprimir la 20 expresión de la proteina objetivo. La "sobreexpresión", se refiere a la producción de un producto genético en organismos transgénicos que excede el nivel de producción en organismos normales o no transformados. La "cosupresión", se refiere a la producción de transcriptos de ARN sentido capaces de 5 suprimir la expresión de genes externos o endógenos o idénticos o sustancialmente similares (Patente Estadounidense No. 5,231,020, incorporada aquí como referencia). Una "proteína" o "polipéptido" es una cadena de aminoácidos arreglados en un orden específico determinado por la secuencia codificadora en un polinucleótido que codifica para el polipéptido. Cada proteína o polipéptido tiene una función única. "Niveles alterados" o "expresión alterada" , se refiere a la producción del producto del gen en organismos transgénicos en cantidades o proporciones que difieren de los organismos normales o transformados. " utante nulo", se refiere aquí a una célula huésped, la cual carece de la expresión de un cierto polipéptido o expresa un polipéptido, el cual está inactivo, o no tiene ninguna función enzimática esperada detectable. "Proteína madura" o el término "madura", como se utiliza aquí para describir a una proteína, se refiere a un polipéptido procesado postraslacionalmente, es decir, uno de cualesquier pre o propéptidos presentes en el producto de la traducción primario, ha sido removido. El término "proteína precursora" o el término "precursora" como se utiliza aquí para describir una proteína, se refiere al producto primario de la traducción del ARNm; es decir, con los pre y propéptidos aún presentes. Los pre y propéptidos pueden no limitarse a señales de localización intracelulares .
Un "péptido de tránsito cloroplástico" es una secuencia de aminoácidos que es traducida en conjunto con ¾tma proteína y dirige la proteína al cloroplasto u otros tipos de plástidos presentes en la célula, en la cual la proteína es producida. La "secuencia de tránsito cloroplástico", se refiere a una secuencia nucleotídica que codifica para un péptido de tránsito cloroplástico. Un "péptido señal" os .una secuencia de aminoácidos que es traducida en conjunto con una proteína, y dirige la proteína al sistema secretor (Chrispeels (1991) Ann. Rev. Plant Phys . Plant Mol. Biol. 42:21-53) . Si la proteína va a ser dirigida a una vacuola, puede ser agregada además una señal de objetivo vacuolar {supra) , o si va al retículo endoplásmico, puede ser agregada una señal de retención del retículo endoplásmico (supra) . Si la proteína va a ser dirigida al núcleo, cualquier péptido señal presente, deberá ser removido y en su lugar incluirse una señal de localización nuclear (Raikhel (1992) Plant Phys, 100:1627-1632) . "Transformación" se refiere a la transferencia d un fragmento de ácido nucleico en el genoma de un organismo huésped, dando como resultado la herencia genéticamente estable. Los organismos huésped que contienen los fragmentos de ácido nucleico transformados, son referidos como organismos "transgénicos" . Los ejemplos de métodos de transformación de plantas, incluyen la transformación mediada por Agrobacterium (De Blaere et al. (1987) Meth. Enzymol. 143:211) y la tecnología de transformación acelerada por partículas o "cañón genético" (Klein et al. (1987) Nature {Londres) 327:70-73; Patente Estadounidense No. 4,945,050, incorporada aquí como referencia) . De este modo, los polinucleótidos aislados de la presente invención pueden ser incorporados en constructos recombinantes, típicamente constructos de ADN capaces de ser introducidos y reproducirse en una célula huésped. Tal constructo puede ser un vector que incluya un sistema de reproducción y secuencias que sean capaces de la transcripción y traducción de una secuencia codificadora de polipéptidos en una célula huésped dada. Un número de vectores adecuados para la transfección estable de células de planta o para el establecimiento de plantas transgénicas ha sido descrito en, por ejemplo, Pouwels et al., Vectores de Clonación: Un Manual de Laboratorio, 1985, supp. 1987; Weissbach y Weissbach, Métodos para la Biología Molecular de Plantas, Academic Press, 1989; y Flevin et al., Manual de Biología Molecular de Plantas, Kluwer Academic Publishers, 1990. Típicamente, los vectores de expresión de plantas incluyen, por ejemplo, uno o más genes de plantas clonados bajo el control transcripcional de secuencias reguladoras 5' y 3' , y un marcador seleccionable dominante. Tales vectores de expresión de plantas también pueden contener una región reguladora promotoras (por ejemplo, una región reguladora que controle la expresión especifica de células o tejidos constitutiva, regulada ambiental o desarrollisticamente) , un sitio de inhibición de inicio de la transcripción, un sitio de unión ribosomal, una señal de procesamiento de ARN, un sitio de terminación de la transcripción, y/o una señal de poliadenilación . Las técnicas de ADN recombinante y clonación molecular estándar utilizadas aquí, son bien conocidas en la técnica y son descritas, de manera más completa en Sambrook, et al., Clonación Molecular: Un Manual de Laboratorio; Cold Spring Harbor Laboratoty Press: Cold Spring Harbor, 1989 (aquí posteriormente " aniatis" ) . "PCR" o "reacción en cadena de la polimerasa" es bien conocida por aquellos expertos en la técnica como una técnica utilizada para la amplificación de segmentos de ADN específicos (Patentes Estadounidenses Nos. 4,683,195 y 4, 800, 159) . La presente invención se relaciona con un polinucleótido aislado que comprende una secuencia nucleotídica seleccionada del grupo que consiste de: (a) primera secuencia nucleotídica que codifica para un polipéptido de al menos 166 aminoácidos que tiene una identidad de al menos el 90% sobre la base del método de alineación de Clustal cuando se compara con un polipéptido seleccionado del grupo que consiste de las SEQ ID NO: 2, 4, 6, 8, 10, 12 y 16, o una segunda secuencia nucleotidica que codifica para un polipéptido de al menos 363 aminoácidos que tiene una identidad de al menos el 92% sobre la base del método de alineación de Clustal cuando se compara con un polipéptido de la SEQ ID NO: 14, o (b) una tercera secuencia nucleotidica que comprende el complemento de la primera o segunda secuencia nucleotidica. De manera preferible, la primera secuencia nucleotidica comprende una secuencia de ácido nucleico seleccionada el grupo que consiste de las SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15, que codifica para el polipéptido seleccionado del grupo que consiste de las SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 y 16. Han sido aislados e identificados los fragmentos de ácido nucleico que codifican para al menos una porción de varias oleil-ACP tioesterasas por comparación de secuencias de ADNc de plantas aleatorias con bases de datos públicas que contienen secuencias nucleotidicas y de proteínas utilizando los algoritmos BLAST bien conocidos por aquellos expertos en la técnica. Los fragmentos de ácido nucleico de la presente invención pueden ser utilizados para aislar ADNc y genes que codifican para proteínas homologas de las mismas u otras especies de plantas. El aislamiento de genes homólogos utilizando protocolos dependientes de la secuencia es bien conocida en la técnica. Los ejemplos de protocolos dependientes de la secuencia incluyen, pero no se limitan a, métodos de hibridación de ácido nucleico, y métodos de amplificación de ADN y ARN de acuerdo a lo ejemplificado por varios usos de tecnologías de amplificación de ácido nucleico (por ejemplo, reacción en cadena de la polimerasa, reacción en cadena de la ligasa) . Por ejemplo, los genes que codifican para otras oleil-ACP tioesterasas , ya sea como ADNc o ADN genómicos, podrían ser aislados directamente utilizando todos o una porción de los fragmentos de ácido nucleico de la presente como sondas de hibridación de ADN para seleccionar bibliotecas de cualquier planta deseada, empleando metodología bien conocida por aquellos expertos en la técnica. Las sondas oligonucleotídicas específicas basadas en la secuencia de ácido nucleico de la presente, pueden ser diseñadas y sintetizadas por métodos conocidos en la técnica (Maniatis) . Además, puede ser utilizada directamente una secuencia completa para sintetizar sondas de ADN por métodos conocidos por aquellos expertos en la técnica, tales como el mareaje con ADN cebador aleatorio, traducción de muescas, técnicas de mareaje final, o sondas de ARN utilizando sistemas de transcripción in vitro disponibles. Además, pueden ser diseñados y utilizados cebadores específicos para amplificar una parte o todas las secuencias de la presente. Los productos de la amplificación resultantes pueden ser marcados directamente durante las reacciones de amplificación o marcado después de las reacciones de amplificación, y ¦utilizados como sondas para aislar el ADN de longitud completa o fragmentos genéticos bajo condiciones de astringencia apropiados. Además, pueden ser utilizados dos segmentos cortos de los fragmentos de ácido nucleicos de la presente en los protocolos de la reacción en cadena de la polimerasa para amplificar fragmentos de ácido nucleico más grandes que codifiquen para genes homólogos de ADN o ARN. La reacción en cadena de la polimerasa, también puede ser efectuada en una biblioteca de fragmentos de ácido nucleico clonados, donde la secuencia de un cebador es derivada de los fragmentos de ácido nucleico de la presente, y la secuencia del otro cebador toma ventaja de la presencia de tractos de ácido poliadenilico al extremo 3' de los genes de plantas que codifican para el precursor del ARNm. De manera alternativa, la segunda secuencia cebadora puede basarse en las secuencias derivadas del vector de clonación. Por ejemplo, el experto en la técnica puede seguir el protocolo RACE (Forman et al., (1988) Proc. Nati. Acad. Sci. USA 85:8998-9002) para generar ADNc utilizando PCR para amplificar copias de la región entre un solo punto en el transcripto y el extremo 3' y 5' . Los cebadores orientados en las direcciones 3' y 5' pueden ser designados a partir de las secuencias de la presente.
Utilizando los sistemas RACE 3' o RACE 5' comercialmente disponibles (BRL) , pueden ser aislados fragmentos de ADNc 3' ó 5' (Ohara et al. (1989) Proc. Nati. Acad. Sci. USA 86: 5673- 5677; Loh et al. (1989) Science 243: 217 -220) . Los productos generados por los procedimientos RACE 3' y 5' pueden ser combinados para generar ADNc de longitud completa (Forman y Martin (1989) Techníques 1:165). En consecuencia, puede ser utilizado un polinucleótido que comprende una secuencia nucleotidica de al menos uno de 60 (de manera preferible uno de la menos 40, de manera más preferible uno de al menos 30) nucleótidos contiguos derivados de una secuencia nucleotidica seleccionada del grupo que consiste de las SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15 y el complemento de tales secuencias nucleotidicas en tales métodos para obtener un fragmento de ácido nucleico que codifique para una porción sustancial de una secuencia de aminoácidos de un polipéptido. La presente invención se relaciona con un método para obtener un fragmento de ácido nucleico que codifica para una porción sustancial de un polipéptido oleil-ACP tioesterasa, de manera preferible, una porción sustancial de un polipéptido de oleil-ACP tioesterasa de planta, que comprende los pasos de: sintetizar un cebador oligonucleotido que comprende una secuencia nucleotidica de al menos uno de 60 (de manera preferible al menos uno de 40, de manera más preferible al menos uno de 30) nucleótidos contiguos derivados de una secuencia nucleotidica seleccionada del grupo que consiste de las SEQ ID NO: 1, 3, 5, 7, 9, 11, 13 y 15, y el complemento de tales secuencias nucleotidicas; y amplificar un fragmento de ácido nucleico (de manera preferible un ADNc insertado en un vector de clonación) , utilizando el cebador oligonucleotidico . El fragmento de ácido nucleico amplificado preferiblemente codificará para una porción de un polipéptido oleil-ACP tioesterasa. La capacidad de la secuencias nucleotidicas y de aminoácidos deducidas de la presente, facilita la selección inmunológica de las bibliotecas de expresión de ADNc. Pueden ser sintetizados péptidos sintéticos que representan porciones de las secuencias de aminoácidos de la presente. Esos péptidos pueden ser utilizados para inmunizar animales para producir anticuerpos policlonales o monoclonales con especificidad por péptidos o proteínas que comprendan las secuencias de aminoácidos. Esos anticuerpos pueden entonces ser utilizados para seleccionar bibliotecas de expresión de ADNc para aislar clonas de ADNc de longitud completa de interés (Lerner (1984) Adv. Immunol. 36:1-34; aniatis) . En otra modalidad, esta invención se relaciona con virus y células huésped que comprenden genes quiméricos de la invención como se describe aquí, o un polinucleótido aislado de la invención como se describe aquí. Los ejemplos de células huésped que pueden ser utilizadas para practicar la invención incluyen, pero no se limitan a, una célula de levadura, una célula bacteriana y una célula de planta. Los fragmentos de ácido nucleico de la presente invención pueden ser utilizado para crear plantas transgénicas , en las cuales los polipéptidos descritos son sobreexpresados o su expresión suprimida, o en tipos de células o etapas del desarrollo en las cuales normalmente no se encuentran. Esto tendría el efecto de alterar el nivel de ácidos grasos en aquellas células. Las tioesterasas remueven sus sustratos de la vía de biosíntesis de aceite. Por lo tanto, la inhibición de la actividad de la oleil-ACP tioesterasa daría como resultado una disminución de 18:1 cadenas de acilo liberadas. Esto daría como resultado un incremento neto en ácidos grasos poliinsaturados de cadena mayor (18 y 20 carbonos) . La sobreexpresión de palmitoil- acil-ACP tioesterasa incrementaría la liberación de ácidos grasos 18:1, así como las cadenas insaturadas 16:0 y 18:0 en el aceite, a expensas de los ácidos grasos más grandes y poliinsaturados. Se cree que la alteración de la composición de aceites en plantas pueden conducir a cambios en el crecimiento y desarrollo, y los efectos de salud sobre los humanos del consumo de ese aceite también sufrirían impactos . La sobreexpresión de proteínas de la presente invención, puede lograrse construyendo primero un gen quimérico en el cual la región codificadora este ligada operativamente a un promotor capaz de dirigir la expresión de un gen en los tejidos deseados en la etapa deseada del desarrollo. El gen quimérico puede comprender secuencias promotoras y secuencias líderes de la traducción derivada de los mismos genes. También pueden proporcionarse secuencias no codificadoras 3' que codifiquen para señales de terminación de la transcripción. El gen quimérico de la presente también puede comprender uno o más intrones para facilitar la expresión del gen. Pueden ser construidos vectores plasmídicos que comprendan el polinucleótido aislado (o gen quimérico) de la presente. El experto en la técnica reconoce fácilmente que la elección del vector plasmídico depende de muchos factores, tales como si el vector es para la expresión de una proteína, la sobreexpresión o supresión de un gen, y que tipo de célula huésped de los vectores se propagaron. La elección del vector plasmídico también depende del método que será utilizado para transformar plantas huésped. El experto en la técnica está bien consciente de los elemento genéticos que deben estar presentes en el vector plasmídico para transformar, seleccionar y propagar exitosamente células huésped que contengan el gen quimérico. El experto en la técnica también reconocerá que los diferentes eventos de transformación independientes darán como resultado diferentes niveles y patrones de expresión (Jones et al. (1985) EMBO J. 4:2411-2418; De Almeida et al. (1989) Mol. Gen. Genetics 218:18-86) , y de este modo, esos evento múltiples deben ser seleccionados para obtener lineas que presenten el nivel y patrón de expresión deseado. Tal selección puede ser lograda por análisis Southern del ADN, análisis Northern de la expresión del ARNm, análisis Western de la expresión de la proteina o análisis fenotipico. Para algunas aplicaciones puede ser útil dirigir los polipéptidos de la presente a diferentes componentes celulares, o para facilitar su secreción de la célula. De este modo, . Se contempló que el gen quimérico descrito anteriormente puede ser suplementado adicionalmente dirigiendo la secuencia codificadora para codificar los polipéptidos de la presente con secuencias blanco intracelulares apropiadas, tales como secuencias de tránsito (Keegstra (1989) Cell 55:247-253) , secuencias de señal o secuencias que codifiquen para la localización del retículo endoplásmico (Chrispeels (1991) Ann. Rev. Plant Phys . Plant Mol. Biol. 42:21-53) , o señales de localización nuclear (Raikhel (1992) Plant Phys. 100:1627-1632) con o sin secuencias blanco de remoción que ya estén presentes. Aunque las referencias citadas anteriormente dan ejemplos de cada una de esas, la lista no es exhaustiva y pueden ser descubiertas más señales blanco u objetivo en el futuro.
También puede ser deseable reducir o eliminar la expresión de los genes que codifican para los polipéptidos de .la presente en plantas para algunas aplicaciones. Para lograr esto, puede ser construido un gen quimérico diseñado para la cosupresión del polipéptido de la presente, ligando un gen o fragmento de gen que codifique para ese polipéptido a secuencias promotoras de planta. De manera alternativa, puede ser construido un gen quimérico diseñado para expresar ARN antisentido para todo o parte del fragmento de ácido nucleico de la presente ligando el gen o fragmento de gen en orientación contraria a la secuencia promotora del planta. Cualquiera de los genes quiméricos de cosupresión o antisentido pueden ser introducidos en plantas vía transformación, donde la expresión de los genes endógenos correspondientes este reducida o eliminada. Las soluciones genéticas moleculares para la generación de plantas con expresión genética alterada tienen una ventaja decidida sobre los métodos de reproducción de plantas tradicionales. Los cambios en los fenotipos de la plantas pueden ser producidos inhibiendo específicamente la expresión de uno o más genes por inhibición o cosupresión antisentido (Patentes Estadounidenses Nos. 5,190,931, 5,107,065 y 5,283,323). Un constructo antisentido o de cosupresión, actuaría como un regulador negativo dominante de la actividad del gen. Aunque mutaciones convencionales pueden producir la regulación negativa de la actividad, esos efectos son muy probablemente recesivos. La regulación negativa dominante disponible con un método transgénico puede ser ventajosa desde una perspectiva de reproducción. Además, la capacidad para restringir la expresión de un fenotipo especifico para los tejidos reproductivos de la planta mediante el uso de promotores específicos del tejido, puede conferir ventajas agronómicas en relación a las mutaciones convencionales, las cuales pueden tener un efecto en todos los tejidos en los cuales un gen mutante es expresado de manera ordinaria. El experto en la técnica sabe que las consideraciones específicas están asociadas con el uso de tecnologías antisentido o cosupresión para reducir la expresión de genes particulares. Por ejemplo, el nivel apropiado de expresión de los genes sentido o antisentido puede requerir el uso de diferentes genes quiméricos que utilicen diferentes elementos reguladores conocidos por aquellos expertos en la técnica. Una vez que sean obtenidas las plantas transgénicas por uno de los métodos descritos anteriormente, será necesario seleccionar las transgénicas individuales de aquéllas que presenten más efectivamente el fenotipo deseado. En consecuencia, el experto en la técnica desarrollará métodos para seleccionar grandes números de transformantes. La naturaleza de esas selecciones, será elegida generalmente sobre antecedentes prácticos. Por ejemplo, puede seleccionarse buscando cambios en la expresión del gen utilizando anticuerpos específicos para la proteína codificada por el gen que este suprimido, o podrían establecerse ensayos que midan específicamente la actividad enzimática. Un método preferido será uno que permita que sean procesados grandes números de muestras rápidamente, puesto que se esperará que un número grandes de transformantes sean negativos para el fenotipo deseado. En otra modalidad, la presente invención se relaciona con un polipéptido de al menos 166 aminoácidos que tenga una identidad de al menos el 90% sobre la base del método de alineación de Clustal cuando se compare con un polipéptido seleccionado del grupo que consiste de las SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 y 16. Los polipéptidos de la presente (o porciones de los mismos) pueden ser producidos en células de huésped heterólogas, particularmente en células de huéspedes microbianos, y pueden ser utilizados para preparar anticuerpos para esas proteínas por métodos bien conocidos por aquellos expertos en la técnica. Los anticuerpos son útiles para detectar los polipéptidos de la presente invención in situ en células o in vitro extractos celulares. Las células huésped heterólogas preferidas para la producción de los huéspedes de la presente son huéspedes microbianos . Los vectores y sistemas de expresión microbianos que contienen secuencias reguladores que dirigen la expresión de alto nivel de proteínas externas son bien conocidos por aquellos expertos en la técnica. Cualquiera de éstos podría ser utilizado para construir un gen quimérico para la producción de polipéptidos instantáneos. Este gen quimérico podría entonces ser introducido en microorganismos apropiados vía la transformación de para proporcionar un alto nivel de expresión de la oleolil-ACP tioesterasa codificada. Se proporciona un ejemplo de un vector para la expresión de alto nivel de polipéptidos de la presente (Ejemplo 6) . Todos o una porción sustancial de los polinucleótidos de la presente invención también pueden ser utilizados como sondas para el trazo del mapa genético y físico de los genes que son parte de, y utilizados como marcadores para rasgos ligados a aquellos genes. Tal información puede ser útil en la reproducción de plantas para desarrollar líneas con fenotipos deseados. Por ejemplo, los fragmentos de ácido nucleico de la presente pueden ser utilizados como marcadores de polimorfismo de la longitud de fragmento y la restricción (RFLP) . Las manchas Southern (Maniatis) del ADN genómico de plantas digerido por restricción pueden ser sondeadas con los fragmentos de ácido nucleico de la presente invención. Los patrones de banda resultantes pueden entonces sometidos a análisis genéticos utilizando programas de computadora tales como el MapMaker (Lander et al. (1987) Genomics 1:174-1811) para construir un mapa genético. Además, los fragmentos de ácido nucleico de la presente invención pueden ser utilizados para sondear manchas Southern que contengan ADN genómicos tratados con endonucleasa de restricción de un conjunto y virus que representen el origen y progenia de una cruza genética definida. La segregación del polimorfismo del ADN es notada y utilizada para calcular la posición de la secuencia de ácido nucleico de la presente en el mapa genético previamente obtenido utilizando esta población (Botstein et al. (1980) ñm. J. Hum. Genet. 32:314-331). La producción y uso de sondas derivadas de genes de plantas para utilizarse en el trazo del mapa gené'tico se describe en Bernatzky y Tanksley (1986) Plant Mol. Biol. Repórter 4:37-41. Numerosas publicaciones describen el trazo de mapas genéticos de clonas de ADN específicas utilizando la metodología expuesta anteriormente o variaciones de la misma. Por ejemplo, poblaciones intercruzadas F2, poblaciones retrocruzadas , poblaciones apareadas aleatoriamente, en líneas isogénicas cercanas y otros conjuntos de individuos pueden ser utilizados para trazo de mapas. Tales metodologías son bien conocidas por aquellos expertos en la técnica. Las sondas de ácido nucleico derivadas de las secuencias de ácido nucleico de la presente también pueden ser utilizadas para trazar mapas físicos (la colocación de secuencias en mapas físicos; véase Hoheisel et al. En: Nonmammalian Genomic Analysis : a Practical Guide, Academic Press 1996. Pp. 319-346, y referencias citadas en ella) . En otra modalidad, pueden utilizadas sondas de ácido nucleico derivadas de las secuencia de ácido nucleico de la presente en trazo de mapas por hibridación in situ por fluorescencia directa (FISH) (Trask (1991) Trends Genet. 7:149-154). Aunque los métodos actuales para trazar mapas FISH favorecen el uso de clonas grandes (varios hasta varios cientos de KB; véase Laan et al. (1995) Genome Res. 5:13-20) las mejoras en la sensibilidad pueden permitir el desempeño del trazo de mapas FISH utilizando sondas más cortas. Puede llevarse a cabo una variedad de métodos basados en la amplificación del ácido nucleico del trazo de mapas genéticos y físicos utilizando las secuencias de ácido nucleico de la presente. Los ejemplos incluyen la amplificación específica del alelo (Kazazian (1989) J. Lab. Clin. Med. 11:95-96) , polimorfismos de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332) ligación específica de alelos (Landegren et al. (1988) Science 241:1077-1080), reacciones de extensión de nucleótidos (Sokolov (1990) Nucleic Acids Res. 18:3671), Radiación Hybrid Mapping (Walter et al. (1997) Nat. Genet 7:22-28) y Trazo de Mapas de Happy (Dear y Cook (1989) Nucleic Acid Res. 17:6795-6807). Para esos métodos, es utilizada la secuencia de un fragmento de ácido nucleico para diseñar y producir pares de cebadores para utilizarse en la ¦reacción de amplificación o reacciones de extensión del cebador. El diseño de tales cebadores es bien conocido por aquellos expertos en la técnica. En métodos que emplean el trazo de mapas genéticos basado en la PCR, puede ser necesario identificar las diferencias de las secuencias de ADN entre los orígenes del cruce del trazo del mapa en la región correspondiente a la secuencia de ácido nucleico de la presente. De este modo, sin embargo, generalmente no son necesarios los métodos de trazo de mapas. La pérdida de la función de fenotipos mutantes puede ser identificada por las clonas de ADNc de la presente por protocolos de disurpción del gen dirigidos o por la identificación de mutantes específicos para esos genes contenidos en una población de maíz que contienen mutaciones en todos los genes posibles (Balinger y Benzer (1989) Proc. Nati. Acad. Sci USA 86:9402-9406; Koes et al. (1995) Proc. Nati. Acad. Sci USA 92:8149-8153; Bensen et al. (1995) Plant Cell 7:75-84). El ultimo método puede ser efectuado de dos maneras. Primero, pueden ser utilizados segmentos cortos de los fragmentos de ácido nucleico de la presente en protocolos de la reacción en cadena de la polimerasa en conjunto con un cebador de la secuencia marcadora de la mutación sobre ADN preparados a partir de una población de plantas en las cuales han sido introducidos transpones mutantes o algún otro elemento de ADN que cause mutación (véase Bensen, supra) . La amplificación de un fragmento de ADN especifico con esos cebadores indica la inserción del elemento que marca la mutación menos cerca del gen de planta que codifica para los polipéptidos de la presente. De manera alternativa, el fragmento de ácido nucleico de la presente puede ser utilizado como una sonda de hibridación contra los productos de la amplificación por PCR regenerados a partir de las poblaciones mutantes utilizando el cebador de la secuencia que marca la mutación en conjunto con un cebador del sitio genómico arbitrario, tal como para un adaptador sintético anclado al sitio de la enzima de restricción. Con cualquier método, puede ser identificada y obtenida una planta que contenga una mutación en el gen endógeno que codifique para los polipéptidos de la presente. Esta planta mutante .puede entonces ser utilizada para determinar o confirmar la función natural de los polipéptidos de la presente descritos aquí.
EJEMPLOS La presente invención es definida mejor en los siguientes ejemplos, en las cuales las partes y porcentajes están en peso y los grados son Celsius, a menos que se establezca otra cosa. Deberá comprenderse que esos Ejemplos, aunque indican las modalidades preferidas de la invención, se dan a manera de ilustración únicamente. De la discusión anterior y esos ejemplos, un experto en la técnica puede determinar las características esenciales de esta invención, y sin apartarse del espíritu y alcance de la misma, puede hacer varios cambios y modificaciones de la invención para adaptar esta a varios usos y condiciones. De este modo, varias modificaciones de la invención además de aquellas mostradas y descritas aquí serán evidentes a aquellos expertos en la técnica a partir de la siguiente descripción. Se pretende que tales modificaciones también caigan dentro del alcance de las reivindicaciones anexas. La descripción de cada referencia expuesta aquí se incorpora aquí como referencia en su totalidad.
EJEMPLO 1 Composición de Bibliotecas de ADNc; Aislamiento y secuencxamiento de Clonas de ADNc Se prepararon bibliotecas de ADNc que representan ARNm de varios tejidos de margarita Africana {Dimorphotheca sinuata) , manzana de tuza {Licanía michauxií) , maíz {Zea mays) , arroz (Oryza sativa), Vernonia {Vernonia mespílífolia) y trigo {Triticum aestivum) . Las características de las bibliotecas se describen a continuación.
TABLA 2 Bibliotecas de ADNc de Margarita Africana, Manzana de Tuza, Maiz Arroz, Vernonia y Trigo Biblioteca Tejido Clona dms2c Margarita Africana dms2cc.pk001.mi 4 : fis (Dimorphotheca sínuata) que desarrolla semillas elslc Manzana de tuza {Licania elslc. pkO01. k6:fis micheuxii) que desarrolla semillas crin Semilleros de Raíz de Maíz crin . pk0147. g3 : fis de 7 Días de Edad* cpj le Maíz (Zea mays L . ) cpj le . pl002. g7 : fis recolectado de BMS tratado con productos químicos relacionados con la fuerza iónica de la membrana rlOn Hoja de arroz de 15 Días de rl0n.pkl01.123:£5 Edad* TABLA 2 (continuación) Bibliotecas de ADNc de Margarita Africana, Manzana de Tuza, Maíz Arroz, Vemonia y Trigo Biblioteca Te ido Clona rlr48 Hoja de Arroz de 15 Días rlr48.pkOOlO. f5 después de la Germinación, 48 Hrs después de la Infección de Magaporthe grísea 4360-R-62 (AVR2- YA O) ; Resistente vsln Semilla de Vernonía en vsln.pk0010.gl0:fis Etapa 1* wrl Raiz de Trigo de Semilla de wrl .pk0026.b7 7 Días de Edad * Esas bibliotecas fueron normalizadas esencialmente como se describe en la Patente Estadounidense No. 5,482,845, incorporada aqui como referencia. Las bibliotecas de ADNc pueden ser preparadas por cualquiera de muchos métodos disponibles. Por ejemplo, los ADNc pueden ser introducidos en vectores plasmídicos preparando primero las bibliotecas de ADNc en vectores üni-ZAPMR XR de acuerdo al protocolo del fabricante (Stratagene Cloning Systems, La Jolla, CA) . Las bibliotecas de üni-ZAPMR XR son convertidas en bibliotecas plasmídicas de acuerdo al protocolo proporcionado por Stratagene. Tras la conversión, los insertos de ADN estarán contenidos en el vector plasmídico pBluescript. Además, los ADNc pueden ser introducidos directamente en vectores Bluescriptor II SK (+) precortados (Stratagene) utilizando ADN ligasa T4 (New England Biolabs), seguido por transfección en células DH10B de acuerdo al protocolo del fabricante (GIBCO BRL Products) . Una vez que los insertos de ADNc están en vectores plasmídicos, los ADN plasmídicos son preparados a partir de colonias bacterianas recolectadas aleatoriamente que contienen plásmidos pBluescript recombinantes , o las secuencias de ADNc del inserto son amplificadas vía la reacción en cadena de la polimerasa utilizando cebadores específicos para secuencias de vectores que flanqueen las secuencias de ADNc insertadas. Los ADN insertados o ADN plasmídicos amplificados son secuenciados en reacciones de secuenciamiento del cebador con tinte para generar secuencias de ADNc parciales (marcas de secuencia expresadas o "EST", véase Adams et al., (1991) Science 252:1651-1656). Las EST resultantes son analizadas utilizando un secuenciador fluorescente Perkin Elmer Modelo 377. Los datos de la secuencia del inserto completo (FIS) son generados utilizando un protocolo de transposición modificado. Las clonas identificadas por FIS son recuperadas de patrones de glicerol archivados como colonias simples, y los ADN plasmidicos son aislados vía lisis alcalina. Los ¦patrones de ADN aislados se hacen reaccionar con vector cebado con oligonucleótidos de ida y regreso M13 y una reacción de secuenciamiento basada en PCR y cargados sobre secuenciadores automatizados. La confirmación de identificación de la clona es efectuada por la alineación de la secuencia con la secuencia EST original de la cual se produjo la FIS solicitada. Los patrones confirmados son traspuestos via un equipo de transposición de Isla Cebadora (PE Applied Biosystems, Foster City, CA) el cual se basa en el elemento trasponible Tyl de Saccharomyces cerevisiae (Devine y Boeke (1994) Nucleic Acids Res. 22:3765-3772). El sistema de transposición in vítro coloca sitios de unión únicos aleatoriamente a través de una población de moléculas de ADN grandes. El ADN traspuesto es entonces utilizado para transformar células electrocompetente DH10B (Gibco BRL/Life Technologies, Rockville, MD) via electroporació . El elemento trasponible contiene un marcador seleccionable adicional (nombrado DHFR; Fling y Richards (1983) Nucleic Acids Res. 11:5147-5158), que permite la doble selección sobre placas de agar de solo aquellas subclonas que contienen el trasposon integrado. Son seleccionadas aleatoriamente clonas múltiples de cada reacción de transposición, los ADN plasmidicos son ' separados vía lisís alcalina y los patrones son secuenciados (Mezcla lista para la reacción del terminador en tinte ABI Prism) fuera del evento de transposición, utilizando cebadores únicos específicos para los sitios de unión dentro del trasposón. Los datos de la secuencia se recolectaron (ABI Prism Collections) y montaron utilizando el Phred/Phrap (P. Green, Universidad de Washington, Seattle) . El Phrep/Phrap es un programa de computo de domino público el cual relee los datos de la secuencia ABI, recupera las bases, asigna valores de calidad y escribe valores de recuperación de calidad de las bases en archivos de salida editables. El programa de montaje de secuencias Phrap utiliza esos valores de calidad para incrementar la exactitud de contigs de secuencia montados. Los montajes son vistos por el editor de secuencias Consed (D. Gordon, Universidad de Washington, Seattle) .
EJEMPLO 2 Identificación de las clonas de ADNc Las clonas de ADNc que codifican para la oleil-ACP tioesterasa fueron identificadas conduciendo búsquedas por BLAST (Herramienta de Búsqueda de Alineación Local Básica; Altschul et al. (1993) J. Mol. Biol. 215:403-410; también véase www.ncbi.nlm.nih.gov/BLAST/) de similitudes de secuencias contenidas en la base de datos BLAST "nr" (que comprende todas las secuencias derivadas de traducciones de GenBank CDS no redundantes del banco de datos de proteínas de Brookhaven de estructura tridimensional, la última relación principal de la base de datos de secuencia de proteínas SWISS-PROT, EMBL y las bases de datos DDBJ) . Las secuencias de ADN obtenidas en el ejemplo 1 fuero analizadas para determinar su similitud con todas las secuencias de ADN públicamente disponibles contenidas en la base de datos "nr" utilizando el algoritmo BLASTN proporcionado por el Centro Nacional de Información Sobre Biotecnología (NCBI) . Las secuencias de ADN fueron traducidas en todos los marcos de lectura y comparadas por su similitud con todas las secuencias de proteínas disponibles públicamente contenidas en la base de datos "nr" utilizando el algoritmo BLASTX (Gish y States (1993) Nat. Genet. 3:266-272) proporcionado por el NCBI. Por conveniencia, el valor de P (probabilidad) de observar una similitud de una secuencia de ADNc con una secuencia contenida en las bases de datos buscadas simplemente por suerte de acuerdo a lo calculado por el BLAST son reportadas aquí como valores de "pLog", los cuales representan el negativo del algoritmo del valor de P reportado. En consecuencia, a mayor el valor de pLog, la mayor probabilidad de que la secuencia de ADNc y el "acierto" de BLAST represente proteínas homologas.
Las EST presentadas para el análisis son comparadas con la base de datos del genbank (banco de genes) de acuerdo a lo descrito anteriormente. Las EST que contiene més secuencias 5 o 3 prima pueden encontrarse utilizando el algoritmo BLASTn (Altschul et al (1997)) Nucleic Acids Recipiente. 25:3389-3402) contra la base de datos patentada de DuPont comparando las secuencias nucleotídicas que comparten regiones comunes o superpuestas de homoligía de secuencia. Donde existen secuencias comunes o superpuestas entre dos o más fragmentos de ácido nucleico, las secuencias pueden ser montadas en una sola secuencia nucleotídica contigua, extendiendo de este modo el fragmento original en la dirección 5 o 3 prima. Una vez que la mayoría de las EST 5 prima fueron identificadas, su secuencia completa puede ser determinada por el secuenciamineto del inserto completo como se describe en el ejemplo 1. Los genes homólogos pertenecientes a diferentes especies pueden encontrarse comparando la secuencia de aminoácido de un gen conocido (de cualquier fuente patentada o base de datos pública) contra una base de datos de EST utilizando el algoritmo de tBLASTn. El algoritmo tBLASTn busca aminoácidos consultados contra una base de datos de nucleótidos que es traducida en 6 marcos de lectura. Esta búsqueda permite la diferencia en el uso del codo nucleotídico entre diferentes especies y para la degeneración de codones.
EJEMPLO 3 Caracterización de las clonas de ADNc que codifican para oleoil-ACP tioesterasa La búsqueda con BLASTX utilizando las secuencias de EST de las clonas listadas en la tabla 3 revela la similitud de los polipéptidos codificados por los ADNc para la oleoil-ACP tioesterasa de cártamo [Carthamus tinctorius , SEQ ID NO: 13, Acceso NCBI número gi 404028), mangostana (Garcinia mangostana, SEQ ID NO: 14, Acceso NCBI número gi 1930077), cártamo {Carthamus tinctorius , SEQ ID NO: 15, Acceso NCBI número gi 404026) y aceite de palma africana (Elaeis guineensis , SEQ ID NO: 16, Acceso NCBI número gi 4704640). En la tabla 3 se muestran los resultados de BLAST para EST. individuales ("EST") , las secuencias de todos los insertos de ADNc que comprenden las clonas de ADNc indicadas ("FIS") , las secuencias de contigs montados de dos o más EST ("Contig"), secuencias de contigs montados de un FIS y una o más EST ("Contig*") , o secuencias que codifican para una proteina completa derivada de un FIS, un contig, o un FIS y PCR ("CGS") : Tabla 3 Resultados del BLAST para las secuencias que codifican polipéptidos homólogos para oleoil-ACP tioesterasa Clona SEQ ID NO: Estado valor pLog dé BLAST 404028 dms2c.pk001. 2 FIS 177.00 mi4 crln.pk0147.g3 4 FIS 133.00 rlOn.pklOl.123 8 Contig 155.00 rlr48.pk0010. f5 Clona Estado valor pLog de BLAST 1930077 elslc.pkOOl . k6 6 FIS 129.00 Clona Estado valor pLog de BLAST 404026 vsln.pk0010.gl 10 FIS 171.00 0 Clona Nivel valor pLog de BLAST 4704640 wrl.pk0026.b7 12 FIS 80.70 Se determinó la secuencia de todo el inserto de ADNc en las clonas listadas en la Tabla 3. El secuenciamiento y búsqueda adicionales de la base de datos patentada de DuPont permitió la identificación de otras clonas de maíz y trigo que codifican para la oleoil-ACP tíoesterasa. La búsqueda con BLASTX utilizando las secuencias EST de las clonas listadas en la Tabla 4 revelo la similitud de los polipéptidos codificados por los ADNc para la oleoil-ACP tíoesterasa de Arabidopsis thaliana ( identificador general NCBI número gi 1076361 y gi 7487983) . En la tabla 4 se muestran los resultados del BLAST para EST individuales ("EST") , las secuencias de todos los insertos de ADNc que comprenden las clonas de ADNc indicadas ("FIS"), secuencias de contigs montados de dos o más EST ("Contig"), secuencias de contig montados de un FIS y de una o más EST ("Contig*") , o secuencias que codifican para toda la proteína derivada de un FIS, un contig, o un FIS y PCR ("CGS") : Tabla 4 Resultados del BLAST para las secuencias que codifican para polipéptidos homólogos para oleoil-ACP tíoesterasa Clona SEQ ID NO: Estado Valor pLog de BALST 1076361 cpj lc.pk002. g7 14 FIS 18 0.00 : fis Clona Estado Valor pLog de BLAST 7487983 wrl .pk0026.b7 : 16 FIS fis La Figura 1 muestra una comparación de las secuencias de aminoácidos de oleoil-ACP tioesterása de margarita africana (Dimorphotheca sinauta, SEQ ID NO: 2, denotada como [SIN2]), maíz (Zea mays, SEQ ID NO: 6, denotada como [SIN6] ) , arroz (Oryza sativa, SEQ ID NO: 8, denotada como [SIN8]), cártamo {Carthamus tinctorius, SEQ ID NO: 17, Acceso NCBI número gi 404028), manzana de tuza (Licania michauxii, SEQ ID NO: 4, denotada como [SIN4]), mangostana (Garcinia mangostana , SEQ ID NO: 18, Acceso NCBI número gi 1930077), vernonia (Vernonia mespilifolia , SEQ ID NO: 10, denotada como [SIN10] ) , cártamo {Carthamus tinctorius, SEQ ID NO: 19, Acceso NCBI número gi 404026), trigo (Tritucum aestivu , SEQ ID NO: 12 denotada como [SIN12]), aceite de palma africana {Elaseis guineensis , SEQ ID NO: 20 Acceso NCBI número gi 474640), maíz {Zea mays, SEQ ID NO: 14 denotada como [SIN14]), trigo (Tritucum aestivum, SEQ ID NO: 16 denotada como [SIN16] ) , y dos proteínas de Arabidopsis (Arabidopsis thaliana, SEQ ID NO: 21 y 22, Acceso NCBI número: gi 7487983 y gi 1076361, respectivamente).
Tabla 5 Por ciento de identidad de secuencias de aminoácidos deducidas de secuencias nucleótidicas de clonas de ADNc que codifican para polipéptidos homólogos para oleoil-ACP tioesterasa. SEQ ID NO: Porciento de identidad para 404028 2 78.2% 6 63.1% 8 66.0% SEQ ID NO: Porciento de identidad para 1930077 4 84.2% SEQ ID NO: Porciento de identidad para 404026 10 89.3% SEQ ID NO: Porciento de identidad para 4704640 12 72.3% SEQ ID NO: Porciento de identidad para 1076361 14 65.5% SEQ ID NO: Porciento de identidad para 7487983 16 72.3% Los cálculos de alineaciones de secuencia y porciento de identidad se efectuaron utilizando el programa de Megalign de sucesión de computo de bioinformatica LASERGEN (DNASTAR Inc., Madison, WI) . Se efectuaron alineaciones múltiples de las secuencias utilizando el método de alineación de Clustal (Higgins y Sharp (1998) CABIOS 5:151-153) con los parámetros predeterminados (PENALIDAD EN EL ESPACIO=10, PENALIDAD DE LA LONGITUD DEL ESPACIO=10) . Los parámetros predeterminados por la alineación por pares utilizando el método de Clostal fueron KTUPLA 1, PENALIDAD EN EL ESPACIO=3, VENTANA=5, y DIAGONALES SALVADAS=5. Los valores y probabilidades de los valores de secuencia BLAST indican que los fragmentos de ácido nucleico que comprenden las clonas de ADNc de la presente codifican para una porción sustancial de una oleoil-ACP tioesterasa. Esas secuencias representan las primera secuencias de Dimorphoteca , Licania, y Vernonia que codifican para la oleoil-ACP tioesterasa conocida por la solicitante.
Ejemplo 4 Expresión de genes quiméricos en células monocotiledoneas Puede ser construido un gen quimérico que comprenda una secuencia de ADNc que codifique para los polipéptidos de la presente en orientación sentido con respecto al promotor zein de 27 kD del maíz que se localiza 5' al fragmento de ADNc, y el extremo 3' de zein de 10 kD que se localiza 3' al fragmento de ADNc. El fragmento de ADNc de este gen puede ser generado por la reacción en cadena de la polimerasa (PCR) de la clona de ADNc utilizando cebadores oligonucleotídicos apropiados. Pueden ser incorporados sitios de clonación (Ncol y Smal) en los oligonucleotidos para proporcionar la orientación apropiada del fragmento de ADN cuando sea insertado en el vector pML 103 digerido como se describe más adelante. Entonces se efectúa la amplificación en una PCR estándar. El ADN amplificado es entonces digerido con enzimas de restricción Ncol y Smal y fraccionados sobre un gel de agarosa. La banda apropiada puede ser aislada del gen y combinada con un fragmento de Ncol-Smal de 4.9 kb del plásmido pML 103. El plásmido pML 103 ha sido depositado bajo los términos del tratado de Budapest de la ATCC (American Type Culture Collection, 10801 University Blvd., Manassas, VA 20110-2209), y tiene el número de acceso ATCC 97366. El segmento de ADN del pML 103 contiene un fragmento del promotor de Sall-Ncol de 1.05 kb del gen zein de 27 kb y un fragmento de Smal y Salí de 0.96 kb del extremo 3' del gen zein de 10 kD del maíz en el vector pGem9Zf(+) (Promega). El vector y el inserto de ADN pueden ser ligados a 15°C durante la noche, esencialmente como se ., escribió (Maniatis) . El ADN ligado puede entonces ser utilizado para transformar E. coli XLI-Blue (Epicurian Coli XL-1 BlueMR; Stratagene) . Pueden ser seleccionados transformantes bacterianos por digestión con enzimas de restricción de ADN plasmídico y análisis de secuencia nucleotidica limitada utilizada el método de terminación de la cadena de didesoxi (Equipo de secuenciamiento de ADN SecuenaceMR. U.S. Biochemical) . El costructo del plasmido resultante comprendería un gen quimérico que codifica, la dirección 5' a 3' , el promotor zein de 27 kb del maíz, un fragmento de ADNc que codifica para los polipeptidos de la presente, y una región 3' de zein de 10 kb. El gen quimérico descrito anteriormente puede ser introducido entonces en células de maíz por el siguiente procedimiento. Pueden ser disectados embriones de maíz inmaduros de cariopsis en desarrollo derivada de cruces de líneas de maíz creadas H99 y LH 132. Los embriones aislados de 10 a 11 días después de la polinización cuando son de 1.0 a 1.5 mm de longitud. Los embriones son entonces colocados con el lado del eje orientado hacia a bajo y en contacto con medio N6 solidificado con agarosa (Chu et al (1975) Sel. Sin. Peking 18:659-668). Los embriones son mantenidos en la obscuridad a 27°C. El callo embriónico friable que consiste de masas de células no diferenciadas con proembrioides y embrioides somáticos contienen proliferados de estructuras supresoras del escutelo de esos embriones inmaduros. El callo embriónico aislado del explante primario puede ser cultivado sobre medio N6 y subcultivado sobre este medio cada 2 o 3 semanas . Puede ser utilizado el plásmido, p35S/Ac (obtenido de Dr. Peter Eckes, Hoechst Ag, Frankfurt, Alemania) en experimento de transformación para proporcionar un marcador seleccionable . Este plásmido contiene un gen Pat (véase solicitud de patente europea 0 242 236) la cual codifica para la fosfinotricina acetil transferasa (PAT) . La enzima PAT confiere resistencia a inhibidores de la glutamina sintasa herbicida tales como la fosfinotricina . El gen pat en el p35S/Ac esta bajo el control del promotor 35S del virus del mosaico de la coliflor (Odell et al (1985) Nature 313:810- 812) y la región 3' del gen de la nopalina sintasa de T-ADN del plásmido. Ti de Agrobacterium tumefaciens . El método de bombardeo de partículas (Klein et al. (1987) Nature 327:70-73) puede ser utilizado para transferir genes a las células de cultivo de callo. De acuerdo a este método, son recubiertas partículas de oro (1 µp? de diámetro) con ADN utilizando la siguiente técnica. Se agregan 10 µg de ADN de plásmido a 50 µ? de una suspensión de partículas de oro (60 mg por mL) . Se agrega cloruro de calcio (50 µ? de una solución 2.5 M) y base libre de espermidina (20 µL de una solución 1.0 M) a las partículas. La suspensión es agitada vorticialmente durante la adición de esas soluciones.
Después de 10 minutos, los tubos son centrifugados brevemente {5 seg. a 15, 000 rpm) y el sobrenadante es 'removido. Las partículas son resuspendidas en 200 µL de etanol absoluto, centrifugadas nuevamente y el sobrenadante removido. Se efectúa el enjuague con etanol nuevamente, y las partículas son resuspendidas en un volumen final de 30 µL de etanol.
Puede ser colocada una alícuota (5 µ?,) de partículas de oro recubiertas con ADN en el centro de un disco volador de KaptonMR (Bio-Rad Labs) . Las partículas son aceleradas entonces en el tejido del maíz con BíolisticMR (Bio-Rad Instruments, Hercules CA) , utilizando una presión de helio de 70.31 kgf/cm2 (1000 psi), una distancia de separación de 0.5 cm, y una distancia volante de 1.0 cm. Para el bombardeo, el tejido embriónico es colocado sobre papel filtro sobre medio N6 solidificado con agarosa. El tejido es arreglado con un lino y cubierta un área circular de aproximadamente 5 cm de diámetro. La caja de petri que contiene el tejido, puede ser colocada en la cámara de PDS-1000/He aproximadamente 8 cm desde el tamiz tope. El aire en la cámara es evacuado entonces a un vacío de 71.12 centímetros (28 pulgadas) de Hg. El macroportador es acelerado con una onda de choque de helio utilizando una membrana de ruptura que estalla cuando la presión de He en el tubo de choque alcanza 70.31 kgf/cm2 (1000 psi).
Siete días después del bombardeo, el tejido puede ser transferido a medio N6 que contiene glufosinato (2 mg por litro) y carece de caseína o prolina. El tejido continua creciendo lentamente sobre este medio. Después de 2 semanas adicionales, el tejido puede ser transferido a medio N6 fresco, que contiene glufosinato. 6 semanas después, pueden ser identificadas áreas de aproximadamente 1 cm de diámetro de callo que crece activamente sobre algunas de las placas que contienen medio suplementado con glufosinato. Esos callos pueden continuar creciendo cuando sean subcultivados sobre el medio selectivo. Las plantas pueden ser regeneradas a partir de callo transgénico transfiriendo primero fragmentos de tejido al medio N6 suplementado con 0.2 mg por litro de 2,4-D. Dos semanas después, el tejido puede ser transferido a medio de regeneración (Fromm et al. (1990) Bio/Technology 8:833-839).
EJEMPLO 5 Expresión de Genes Quiméricos en Células Dicotiledóneas Puede ser utilizado un cásete de expresión específico de la semilla compuesto de promotor y terminador de la transcripción del gen que codifica para la subunidad ß de la proteína de almacenamiento de la semilla faseolina del frijol Phaseolus vulgaris (Doyle et al. (1986) J. Biol ..
Chem. 252:9228-9238) para la expresión de los polipéptidos de la presente en soya transformada. El cásete de faseolina incluye aproximadamente 500 nucleótidos corriente arriba (5') de codón de inicio de la traducción y aproximadamente 1650 nucleótidos corriente abajo (3') del codón de alto de la traducción de faseolina. Entre las regiones 5' y 3' se encuentran sitios de endonucleasa de restricción únicos Neo I (los cuales incluyen el codón de inicio de la traducción ATG) , Sma I, Kpn I, y Xba I. Todo el cásete el flanqueado por sitios Hind III. El fragmento de ADNc de este gen puede ser generado por la reacción en cadena de la polimerasa (PCR) de la clona de ADNc utilizando cebadores oligonucleotidicos apropiados. Los sitios de clonación pueden ser incorporados en los oligonucleótidos para proporcionar la orientación apropiada del fragmento de ADN cuando sea insertado en el vector de expresión. A continuación se efectúa la amplificación como se describió anteriormente, y el fragmento aislado es insertado en un vector pUC18 que contiene el cásete de expresión de la semilla. Los embriones de soya pueden entonces ser transformados con el vector de expresión que comprende las secuencias que codifican para los polipéptidos de la presente. Para inducir embriones somáticos, pueden ser cultivados cotiledones de 3-5 mm de longitud disectados de semillas inmaduras, esterilizadas superficialmente, del cultivo de soya A2872, en la luz u oscuridad a 26°C sobre un medio de agar apropiado durante 6-10 semanas. Los embriones somáticos que producen embriones secundarios son entonces escindidos y colocados en un medio liquido adecuado. Después de la selección repetida de conjuntos de embriones somáticos, los cuales son embriones en etapa globular, multiplicados rápidamente, las suspensiones son mantenidas como se describe más adelante. Los cultivos de suspensión embriónica de soya pueden ser mantenidos en 35 mL de medio liquido en un agitador giratorio, 150 rpm, a 26°C con luces fluorescentes en un programa de 16:8 horas dia/noche. Los cultivos son subcultivados cada dos semanas inoculando aproximadamente 35 mg de tejido en 35 mL de medio liquido. Los cultivos de suspensión embriónica de soya pueden entonces ser transformados por el método del bombardeo con cañón de partículas (Klein et al. (1987) Nature (London) 327:70-73, Patente Estadounidense No. 4,945,050). Un instrumento BiolisticMR PDS1000/HE de DuPont (reconvertido a helio), puede ser utilizado para esas transformaciones. Un gen marcador seleccionable que puede ser utilizado para facilitar la transformación de soya es un gen quimérico compuesto del promotor 35S del Virus del Mosaico de la Coliflor (Odell et al. (1985) Nature 313:810-812); el gen de la higromicina fosfotransferasa del plásmido pJR225 (de E. coli; Gritz et al. (1983) Gene 25:179-188) y la región 3' del gen de la nopalina gintas.í del T-ADN del plásmido Ti de Agrobacterium tumefaciens . El cásete de expresión de la semilla que comprende la región 5' de la faseolina, el fragmento que codifica para los polipéptidos de la presente y la región 3' de la faseolina, puede ser aislado como un fragmento de restricción. Este fragmento puede entonces ser insertado en un sitio de restricción único del vector que contiene el gen marcador. A 50 µ?? de una suspensión de partículas de oro de 1 im 60 mg/ml se agregó (en orden): 5 µ?, de ADN (1 µg/µL) , 20 ? de espermidina (0.1 ) , y 50 µL de CaCl2 (2.5 M). La preparación de partículas se agitó entonces durante 3 minutos, se centrífugo en una microcentrífuga durante 10 segundos y se removió el sobrenadante. Las partículas recubiertas con ADN se lavaron entonces una vez en 400 µL de etanol al 70% y se resuspendieron en 40 iL de etanol anhidro. La suspensión de ADN/partículas puede ser sonicada tres veces durante un segundo cada vez. Se cargaron entonces 5 µL de partículas de oro recubiertas con ADN sobre cada disco macroportador . Se colocaron aproximadamente 300-400 mg de cultivo de suspensión de dos semanas en una caja de petri vacía de 60x15 mm y el liquido residual se removió del tejido con una pipeta. Para cada experimento de transformación, son bombardeadas normalmente aproximadamente 5-10 placas del tejido. La presión de ruptura de la membrana se ajustó a 77.34 kgf/cm2 (1100 psi) y la cámara se evacuó al un vacio de 71.12 centímetros (28 pulgadas) de mercurio. El tejido se colocó a aproximadamente 8.89 centímetros (3.5 pulgadas) lejos de la malla de retención y se bombardeó tres veces. Después del bombardeo, el tejido puede ser dividido a la mitad y colocado nuevamente en líquido y cultivado como se describió anteriormente. De cinco a siete días después del bombardeo, los medios líquido pueden ser intercambiados con medios frescos, y de once a doce días después del bombardeo con medios frescos que contengan 50 mg/mL de higromicina. Estos medios selectivos pueden ser renovados semanalmente . De siete a ocho semanas después del bombardeo, el tejido transformado, verde, puede ser observado creciendo de grupos embriogénicos necróticos, no transformados. El tejido verde aislado es removido e inoculado en frascos individuales para generar nuevos cultivos de suspensión embriogénicos transformados, propagados clonalmente. Cada nueva línea puede ser tratada como un evento de transformación independiente. Esas suspensiones pueden ser entonces subcultivadas y mantenidas como conjuntos de embriones inmaduros o regenerados en plantas completas por maduración y germinación de embriones Somáticos individuales.
EJEMPLO 6 Expresión de Genes Quiméricos en Células Microbianas Los ADNc que codifican para los polipéptidos de la presente, pueden ser insertados en el vector de expresión pBT430 de E. coli T7. Este vector es un derivado del pET-3a (1987) Gene 56:125-135), el cual emplea el sistema de ARN polimerasa T7 de bacteriófago/prmotor T7. El plásmido pBT430 fue construido destruyendo primero los sitios EcoR I y Hind III en pET-3a en sus posiciones originales. Fue insertado un adaptador oligonucleotidico que contiene los sitios EcoR I y Hind III en el sitio BamH I de pET-3a. Esto creó el pET-3aM con sitios de clonación únicos adicionales para la inserción de genes en el vector de expresión. A continuación, fue convertido el sitio Nde I en la posición de inicio en la traducción en el sitio Neo I utilizando mutagénesis dirigida al oligonucleótido . La secuencia de ADN de pET3aM en esta región, 5' -CATATGG, fue convertida a 5'-CCCATGG en pBT430. El ADN plasmídico que contiene una ADNc puede ser digerido apropiadamente para liberar un fragmento de ácido nucleico que codifique para la proteina. Este fragmento puede entonces ser purificado sobre un gel de agarosa de bajo punto de fusión al 1%. El amortiguador y la agarosa contienen 10 µg/ml de bromuro de etidio para la visualización del fragmento de ADN. El fragmento puede entonces ser purificado del gen de agarosa digiriendo con GELaseMR (Epicentre Technologies, Madison, WI) de acuerdo a las instrucciones del fabricante, precipitado con etanol, secado y resuspendido en '20 µ? de agua. Pueden ser ligados adaptadores oligonucleotidicos apropiados al fragmento utilizando ADN ligasa T4 (New England Biolabs (NEB) , Beverly, MA) . El fragmento que contiene los adaptadores ligados puede ser purificado de los adaptadores en exceso utilizando agarosa de bajo punto de fusión como se describió anteriormente. El vector pBT430 es digerido, desfosforilado con fosfatasa alcalina (NEB) y desprotonizado con fenol/cloroformo como se describió anteriormente. El vector preparado pBT430 y el fragmento pueden entonces ser ligados a 16°C durante 15 horas seguido por transformación en células electrocompetentes DH5 (GIBCO BRL) . Los transformantes pueden ser seleccionados sobre placas de agar que contengan medio LB y 100 µg/ml de ampicilina. Los transformantes que contienen " gen que codifica para los polipéptidos de la presente son entonces seleccionados por la orientación correcta con respecto al promotor T7 por análisis de enzima de restricción.
Para la expresión de alto nivel, una clona plasmidica con el inserto de ADNc en la orientación correcta en relación al promotor T7 puede ser transformada en E. coli cepa B121 (DE3) (Studier et al. (1986) J. Mol . Biol 255:113-130) . Los cultivos se hacen crecer en medio LB que contenga ampicilina (100 mg/L) a 25°C. a una densidad óptica de 600 nm de aproximadamente 1 puede ser agregado IPTG (isopropiltio-ß-galactósido, el vector) a una concentración final de 0.4 mM y puede continuarse la incubación durante 3 h a 25°C. Las células son entonces cosechadas por centrifugación y resuspendidas en 50 µ? de Tris-HCl 50 mM a pH 8.0 con un contenido de DTT 0.1 mM y fluoruro de fenil metilsulfonilo 0.2 mM. Puede ser agregada una pequeña cantidad de perlas de vidrio de 1 mm y la mezcla sonicada 3 veces durante aproximadamente 5 segundos cada vez con un sonicador de microsonda. La mezcla centrifugada y la concentración de proteina del sobrenadante determinada. Puede ser separado un µg de proteina de la fracción soluble del cultivo por electroforesis sobre gel de poliacrilamida con SDS. Los geles pueden ser observados para determinar bandas de proteina librando al peso molecular esperado.
LISTADO DE SECUENCIA <110> E.I. du Pont de Nemours <120> OLEIL-PROTEINA PORTADORA DE ACILO TIOESTEARASA EN PLANTAS <130> BB1348 PCT <140> <141> <150> 60/167,510 <151> 1999-1 1-24 <160> 22 <170> Microsoft Office 97 <210> 1 <21 1> 1507 <212> ADN: <213> Dimorphotheca sinuata <400> 1 gcacgaggct ccggccacca cgccgccaat tccgtcacca atcatgctct cacgtctcat 60 tccaaccgcc gccgccgcgg caacggcaac cgcaacaaca accacaaaca ccgcggcatt 120 caccggcaac aaccgcaccg taactaactt ccgatccggt gattccgtct caatccggcg 180 acaaaacagc ggttatttat gtaattcagc tcgccggagg ataactccgg taatggcggt 240 gaagaccggt gagcaaccga acagcgttgc tgctgcttct gacgtcagct tgaaggagaa 300 gagcttggcg gatcggctcc ggttaggtag cttgacggac ggtggattat cgtatacgga 360 gaggttcatt attaggtgtt atgaagtcgg aatcaataaa actgctactg ttgaaacaat 420 tgctaatctg ttgcaggagg ttggaggtaa tcatgctcaa agtgttggat tttcgacaga 480 tggatttgcc accactacaa ctatgagaaa attgcatctc atatgggtga cttcacgaat 540 gcatattgaa atttacagat atcctgcatg gagtgatgtg gttgagattg agacttggtg 600 tcaaagtgaa ggaagaattg gtactagacg tgattggatt attaaagact cttccaatgg 660 tgaggtcatt ggaagagcta caagcaagtg ggtgatgatg aactcggata ctagaagact 720 ccagaaagtc aatgatgata tccgagatga atatttgatt ttttgtccta aggaaccgag 780 attatcattt cccgaagaga acaataagag tctgaagaaa attaaaaagt tggaagatcc 840 agctgaattt tcaacattag gacttgtgcc aagaagagca gatttggata tgaacaaaca 900 tgttaacaat gttacctaca ttggatgggt tatagagagc atcccacaag aagtaatcga 960 cactcatgaa ctacaaacaa ttacgttaga ctacagacgt gaatgccagc atgatgatgt 1020 agtcgattct ctcacaagtt cagaatcact cgtctcaaaa cttgaaggaa ccaacggttc 1080 tgcttcttcc aaaaacgacg aacaagattt aagccaattt ttgcatttat taagatcatc 1 140 tggtgatggt cttgaactca acaggggtcg taccgaatgg : aagataaacg 1200 ataaacatat gttttcgttg gtttatttta ggccccccat cattctatta taatacccct 1260 tctgtattct tgttttttgt atgttttgtt gcggtttcgt attttacctt tttcgttatt 1320 ttgcgtattt gtgtatctcc gtagatggac tagattttcg gattcttaaa cccgaaaaac 1380 tgtttttttt tcttttttta aagttttctt gtggtttgca tgaagaactt tatgaatcat 1440 ttatctatga agtatttaag tattgaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1500 aaaaaaa 1570 <210> 2 <21 1> 386 <212> PRT <213> Dimorphotheca sinuata <400> 2 Met Leu Ser Arg Leu Tle Pro Thr Ala Ala Ala Ala Ala Thr Ala Thr i 5 10 15 Ala Thr Thr Thr Thr Asn Thr Ala Ala Phe Thr Gly Asn Asn Arg Thr 20 25 30 Val Thr Asn Phe Arg Ser Gly Asp Ser Val Ser lie Arg Arg Gln Asn 35 40 45 Ser Gly Tyr Leu Cys Asn Ser Ala Arg Arg Arg lie Thr Pro Val Met 50 55 60 Ala Val Lys Thr Gly Glu Gln Pro Asn Ser Val Ala Ala Ala Ser Asp 65 70 75 80 Val Ser Leu Lys Glu Lys Ser Leu Ala Asp Arg Leu Arg Leu Gly Ser 85 90 95 Leu Thr Asp Gly Gly Leu Ser Tyr Thr Glu Arg Phe lie lie Arg Cys 100 105 1 10 Tyr Glu Val Gly He Asn Lys Thr Ala Thr Val Glu Thr lie Ala Asn 1 15 120 125 Leu Leu Gln Glu Val Gly Gly Asn His Ala Gln Ser Val Gly Phe Ser 130 135 140 Thr Asp Gly Phe Ala Thr Thr Thr Thr Met Arg Lys Leu His Leta He 145 15 0 155 160 Trp Val Thr Ser Arg Met His lie Glu lie Tyr Arg Tyr Pro Ala Trp 165 170 175 Ser Asp Val Val Glu lie Glu Thr Trp Cys Gln Ser Glu Gly Arg He 180 185 190 Gly Thr Arg Arg Asp Trp lie lie Lys Asp Ser Ser Asn Gly Glu Val 195 200 205 lie Gly Arg Ala Thr Ser Lys Trn Val Met Met Asn Ser Asp Thr Arg 210 215 220 Arg Leu Gln Lys Val Asn Asp Asp He Arg Asp Glu Tyr Leu lie Phe 225 230 235 240 Cys Pro Lys Glu Pro Arg Leu Ser Phe Pro Glu Glu Asn Asn Lys Ser 245 250 255 Leu Lys Lys lie Lys Lys Leu Glu Asp Pro Ala Glu Phe Ser Thr Leu 260 265 270 Gly Leu Val Pro Arg Arg Ala Asp Leu Asp Met Asn Lys His Val Asn 275 280 285 Asn Val Thr Tyr lie Gly Trp Val Leu Glu Ser lie Pro Gln Glu Val 290 295 300 lie Asp Thr His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg Arg Glu 305 310 315 320 Cys Gln His Asp Asp Val Val Asp Ser Leu Thr Ser Ser Glu Ser Leu 325 330 335 Val Ser Lys Leu Glu Gly Thr Asn Gly Ser Ala Ser Ser Lys Asn Asp 340 345 350 Glu Gln Asp Leu Ser Gln Phe Leu His Leu Leu Arg Ser Ser Gly Asp 355 360 365 Gly Leu Glu Leu Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys Gln Asp 370 375 380 Lys Arg 385 <210> 3 <21 1> 1214 <212> ADN <213> Licania michauxii <400> 3 tttttctgca actggtcatt gcaaggagca attgcatgat ggggacagag aagacttcgt 60 cctcaaatgt tatgcaattg tttgaaaaaa aaaaaaaaca aaaagtgaca ttcacggagg 120 ttggttgtaa tcatgctcaa agtgttggat tctcaacaga tgggtttgca acaaccctga 180 caatgaggaa attgcatctc atttgggtaa ccgctcgtat gcacattgaa atttacaaat 240 acccggcttg gggtgatgta gtagaaatag agacttggtg ccaaggtgaa ggaagaattg 300 gaaccagacg cgattggatt ctgaaggact atgccactgg tgaagttatt gggagagcta 360 ctagtaagtg ggtgatgatg aaccaagata ctaggcgcct acaaaaagtg actgatgatg 420 tccgggatga atatttagtt ttctgtccac gtgaacttag attggcattc cctgaggaga 480 ataatcgcag cttgaggaag attgcaaagc tagaggatcc tgctgaacat tccaagctgg 540 gacttgtgcc cagaagagca gatctggaca tgaatcaaca tgttaataac gtcacctaca 600 ttggatgggt tttggagagc ctgccccaag aagtcattga aacccatgag ctgcaaacta 660 ttaccttaga ttacagaagg gaatgtcaac atgatgatgt agttgattcc ctcacaagtc 720 ctgaacccga tgagcaattt gaaggagttt cagagcttcg agggacaaat ggctctgcca 780 caccaactgc tgacaaccaa gactgcctga acttcttgca tctactgaga ctatcaggtg 840 aagggcttga gattaaccgc ggccgcactg agtggagaaa gaaacctgca agatgagggg 900 aatagtgtag agtcttgtac ttcttaatgc tttagccagt cttaagagtc catttctctg 960 tggcttcctt ctctttacct ctttgcttct ctattttggc ttttcttggc tcccagagga 1020 tcttgatctg attttgccgt cgttagctaa tatgttgtca ttggttgtac ggaatgagag 1080 gaaactgtac tgtactaaat gttgatactt gccaaaccca tcgtgcaaaa cttcgtgaat 1140 gaaatgttgt actgtgcttt tcttgaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa <210> 4 <21 1> 259 <212> PRT <213> Licania michauxii <400> 4 Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly 1 5 10 15 Phe Ala Thr Thr Leu Thr Met Arg Lys Leu His Leu lie Trp Val Thr 20 25 30 Ala Arg Met His lie Glu lie Tyr Lys Tyr Pro Ala Trp Gly Asp Val 35 40 45 Val Glu lie Glu Thr Trp Cys Gln Gly Glu Gly Arg lie Gly Thr Arg 50 55 60 Ar:g Asp Trp lie Leu Lys Asp Tyr Ala Thr Gly Gln Val lie Gly Arg 65 70 75 80 Ala Thr Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln 85 90 95 Lys Val Thr Asp Asp Val Arg Asp Glu Tyr Leu Val Phe Cys Prp Arg 100 105 110 Glu Leu Arg Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Leu Arg Lys 1 15 120 125 He Ala Lys Leu Glu Asp Pro Ala Glu His Ser Lys Leu Gly Leu Val 130 135 140 Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr 145 150 155 160 Tyr lie Gly Trp Val Leu Glu Ser Leu Pro Gln Glu Val lie Glu Thr 165 170 175 His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln His 180 185 190 Asp Asp Val Val Asp Ser Leu Thr Ser Pro Glu Pro Asp Glu Gln Phe 195 200 205 Glu Gly Val Ser Glu Leu Arg Gly Thr Asn Gly Ser Ala Thr Pro Thr 210 215 220 Ala Asp Asn Gln Asp Cys Leu Asn Phe Leu His Leu Leu Arg Leu Ser 225 230 235 240 Gly Glu Gly Leu Glu lie Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys 245 250 255 Pro Ala Arg <210> 5 <21 1> 1440 <212> ADN <213> Zea mays <400> 5 gcacgagccg ctccgcccgt gtaaaccaaa ccccgcttog gcggcggcgg cgactggccc 60 acgagccttc tcgaaccgac gcatccgcca cccatgotgc gctgccacac gccaccgcaa 120 tgcgcccgcg cgccgctccg ccaccacgga aggtgggagt cgcctccggc ggcggcgccc 180 gcggtggtag tgcggtgcgc gcggggtgcg ccgcaggtgt ccgggatcga ggcggcttcg 240 ccgggccacg cggctgtcac ggcggcgtta gctaaggcgg aagggggtga cgcgcggccc 300 agcctggccg agcggctgcg ttggggaac ctcctggagg acgggctatc gtacaaggag 360 agtttcatcg tgcgctgcta cgaggtgggg atcaacaaga cggccaccgt tgagaccatc 420 gccaatctcc tccaggaggt aggatgtaac catgcacaaa gtgttgggtt ctccactgat 480 ggcttcgcca cgaccactac aatgagaaaa cttggactta tttgggtgac gaacagaatg 540 cacattgaga tctacaagta cccagcttgg ggtgatgttg ttgagatcga aacatggtgc 600 caagaagatg gaagaattgg tacccgtcgt gattggatcc tcaaggacct agctaatggt 660 gaagttattg gcagagctac cagcaagtgg gtcatgatga accaaaatac acggagactt 720 cagcgggtca gtgatgacgt gagggatgag gtgtttatgc actgtccaaa ggctccaaga 780 ttagcattcc cagaggaaaa taatggcagt ttgaagaaga ttccgaatct ttcagaccct 840 gcagaatatt caagacttgg actagtgcca agaagagctg acctggacat gaaccaacat 900 gtcaataatg ttacttacat aggttgggtc ctcgaaagta tacctcaaga tataattgat 960 acacacgagt tacaaacaat cactctcgac tacagaaggg agtgtcaaca ggatgatata 1020 gttgattctc ttacttgcat agaggaagga gaggagaaaa gcatgaacgg ctctgcttct 1080 gcagcagcgc ctacaaaga agagcggcag cagttcctgc attgcttgag atttgcagcc 1 140 aacggacag agatcaaccg tggccgtacc gtgtggagga agctagctag ataaaagtgt 1200 tctttcgtca taaattgatct cctccatttc tctgctcacg gctggcggcc cttgtaccac 1260 aattttgtga tgtattgttg ccctttggaa tgtactcagc catgtatcgg tgccgatttg 1320 tgacatttct tggacgtgta gctgtctgtc cgttttgtac cagtggacaa tgtttgtgac 1380 atgcaataaa ctgcgtttct ccggcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440 <210> 6 <21 1> 366 <212> PRT <213> Zea mays <400> 6 Met Leu Arg Cys His Thr Pro Pro Gln Cys Ala Arg Ala Pro Leu Arg 1 5 10 15 His His Gly Arg Trp Glu Ser Pro Pro Ala Ala Ala Pro Ala Val Val 20 25 30 Val Arg Cys Ala Arg Gly Ala Pro Gln Val Ser Gly He Glu Ala Ala 35 40 45 Ser Pro Gly His Ala Ala Val Thr Ala Ala Leu Ala Lys Ala Glu Gly 50 55 60 Gly Asp Ala Arg Pro Ser Leu Ala Glu Arg Leu Arg Leu Gly Asn Leu 65 70 75 80 Leu Glu Asp Gly Leu Ser Tyr Lys Glu Ser Phe lie Val Arg Cys Tyr 85 90 95 Glu Val Gly lie Asn Lys Thr Ala Thr Val Glu Thr lie Ala Asn Leu 100 105 110 Leu Gln Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr 115 120 125 Asp Gly Phe Ala Thr Thr Thr Thr Met Arg Lys Leu Gly Leu He Trp 130 135 140 Val Thr Asn Arg Met His lie Glu lie Tyr Lys Tyr Pro Ala Trp Gly 145 150 155 160 Asp Val Val Glu lie Glu Thr Trp Cys Gln Glu Asp Gly Arg lie Gly 165 170 175 Thr Arg Arg Asp Trp lie Leu Lys Asp Leu Ala Asn Gly Glu Val lie 180 185 190 Gly Arg Ala Thr Ser Lys Trp Val Met Met Asn Gln Asn Thr Arg Arg 195 200 205 Leu Gln Arg Val Ser Asp Asp Val Arg Asp Glu Val Phe Met His Cys 210 215 220 Glu Glu Asn Asn Gly Ser Leu 225 230 235 240 Lys Lys He Pro Asn Leu Ser Asp Pro Ala Glu Tyr Ser Arg Leu Gly 245 250 255 5 Leu Val Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn 260 265 270 Val Thr Tyr lie Gly Trp Val Leu Glu Ser lie Pro Gln Asp lie lie 275 280 285 Asp Thr His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg Arg Glu Cys 10 290 295 300 Gln Gln Asp Asp lie Val Asp Ser Leu Thr Cys lie Glu Glu Gly Glu 305 310 315 320 Glu Lys Ser Met Asn Gly Ser Ala Ser Ala Ala Ala Pro His Lys Glu 325 330 335 15 Glu Arg Gln Gln Phe Leu His Cys Leu Arg Phe Ala Ala Asn Gly His 340 345 350 Glu He Asn Arg Gly Arg Thr Val Trp Arg Lys Leu Ala Arg 355 360 365 20 <210> 7 <211> 1510 <212> ADN <213> Oryza sativa <400> 7 gcaogagtgg tacctcctcc ctataaaccc ccccgcgccc ccagctgctc gggcggcggc 60 ggcggcggcg ; cgaactcgaa tctcttctgt ccccttccac caccgtcccc ccacaggaga 120 tgctgcgctg ccacacgccg ccgcaatgcc gcctcggcgc gggcggcgcg ggcgcggggg 180 tgctgctgag gcagcggagc gaggtggcgg tgcggtgccg cgcgcagcag gtgtccgggg 240 tcgaggcggc ggcggggaca ccggcggcgc gggcggcggt ggagggtggg gagaggacga 300 gcctggcgga gcggctgcgg ctggggagcc tgctggagga cgggctgtcg tacaaggaga 360 gcttcatcgt gcggtgctac gaggtgggca tcaacaagac ggccaccgtc gagaccatcg 420 ccaacctcct ccaggaggta gggtgtaacc atgcacaaag tgttgggttc tccactgatg 480 gttttgccac aactaccaca atgagaaaac ttggtctaat ttgggtgacc aaccgaatgc 540 acattgagat ctacaagtac ccagcatggg gtgatgttgt ggagattgaa acttggtgcc 600 aagaagatgg aaagatcggt actcgtcgtg attggatcct taaggatctg gctaatggtg 660 aagttatcgg cagagctacc agcaagtggg tcatgatgaa ccaaaataca cgcagacttc 720 aaagagtgag tgatgacgtg agggatgagg tttttgtaca ctgtccaaag actccaagat 780 tagcattccc cgaggaaaat aatggcagtt tgaaaaagat tccagttctt actgatcctg 840 cacagcactc aagactaggc ctagtgccaa gaagagctga tctggacatg aaccaacatg 900 tcaataatgt cacttacatt ggttgggtac ttgaaagtat acctcaagat attattgata 960 cacatgagtt acaaacaatc actcttgact acagaagaga gtgccaacat gatgacatag 1020 tagattcact tacttatatc gaggaaggag aggagaagag ttccaatgga tccgcatttg 1080 ctgcaccgca cccagaagag cagcgacagt tcttgcactg cttaagattt gctgggaacg 1140 ggaacgagat caaccgtggg cgcaccgtgt ggaggaagct agctagatga attecctagt 1200 tttgatcata cagtcatatg tattctgatc cttccatttg ttccatcatt ttgctcttgg 1260 tgtctggoat agccctttca gagaatcggt tgtaccccaa attttgtgtt aatttgttac 1320 ctttgtaatg taccgtggta acaattacag tttgtgacat cgtcttacc tgaagttgtg 1380 cgttgctgta tactttgtac tagtagaatc agtgtttatg aatcttcaaa taattctatc 1440 ggcaacagat agcaatggca tgccaagttt ggttaaaaaa aaaaaaaaaa aaaaaaaaaa 1500 aaaaaaaaaa 1510 <210> 8 <21 1> 356 <212> PRT <213> Oryza sativa <400> 8 Met Leu Arg Cys His Thr Pro Pro Gln Cys Arg Leu Gly Ala Gly Gly 1 5 10 15 Ala Gly Ala Gly Val Leu Leu Arg Gln Arg Ser Clu Val Ala Val Arg 20 25 30 Cys Arg Ala Gln Gln Val Ser Gly Val Glu Ala Ala Ala Gly Thr Pro 35 40 45 Ala Ala Arg Ala Ala Val Glu Gly Gly Glu Arg Thr Ser Leu Ala Glu 50 55 60 Arg Leu Arg Leu Gly Ser Leu Leu Glu Asp Gly Leu Ser Tyr Lys Glu 65 70 75 80 Ser Phe He Val Arg Cys Tyr Glu Val Gly lie Asn Lys Thr Ala Thr 85 90 95 Val Glu Thr lie Ala Asn Leu Leu Gln Glu Val Gly Cys Asn His Ala 100 105 110 Gln Ser Val Gly Phe Ser Thr Asp Gly Phe Ala Thr Thr Thr Thr Met 1 15 120 125 Arg Lys Leu Gly Leu lie Trp Val Thr Asn Arg Met His lie Glu lie 130 135 140 Tyr Lys Tyr Pro Ala Trp Gly Asp Val Val Glu lie Glu Thr Trp Cys 145 150 155 160 Gln Glu Asp Gly Lys lie Gly Thr Arg Arg Asp Trp lie Leu Lys Asp 165 170 175 Leu Ala Asn Gly Glu Val lie Gly Arg Ala Thr Ser Lys Trp Val Met 180 185 190 Met Asn Gln Asn Thr Arg Arg Leu Gln Arg Val Ser Asp Asp Val Arg 195 200 205 Asp Glu Val Phe Val His Cys Pro Lys Thr Pro Arg Leu Ala Phe Pro 210 215 220 Glu Glu Asn Asn Gly Ser Leu Lys Lys lie Pro Val Leu Thr Asp Pro 225 230 235 240 Ala Gln His Ser Arg Leu Gly Leu Val Pro Arg Arg Ala Asp Leu Asp 245 250 255 Met Asn Gln His Val Asn Asn Val Thr Tyr lie Gly Trp Val Leu Glu 260 265 270 Ser lie Pro Gln Asp lie He Asp Thr His Glu Leu Gln Thr lie Thr 275 280 285 Leu Asp Tyr Arg Arg Glu Cys Gln His Asp Asp lie Val Asp Ser Leu 290 295 300 Thr Tyr lie Glu Glu Gly Glu Glu Lys Ser Ser Asn Gly Ser Ala Phe 305 310 315 320 Ala Ala Pro His Pro Glu Glu Gln Arg Gln Phe Leu His Cys Leu Arg 325 330 335 Phe Ala Gly Asn Gly Asn Glu lie Asn Arg Gly Arg Thr Val Trp Arg 340 345 350 Lys Leu Ala Arg 355 <210> 9 <21 1> 1 101 <212> ADN <213> Vernonia mespilifolia <400> 9 gcacgaggag agtttctccg ttactggcgg tgacgaccgg agagcagtcg agtagcgttg 60 gtagcttaca tgaggcggaa aaggaaaaaa gcctggggaa caggctccga ctggggagct 120 tgacggagga tggattatcg tataaggaga aatttgttat aaggtgttat gaggttggca 180 tcaacaaaac tgccactatt gaaacgattg ccaatctttt gcaggaggtt ggaggtaatc 240 atgctcagag tgttggattt tctactgatg ggtttgccac tacgaccact atgaggaaat 300 tgcatctcat atgggttact gcacgaatgc atatcgaagt atacagatac cctgcttgga 360 gtgatgtgat tgaaatcgag acttgggttc aaggtgaagg aagggttggg accagacgtg 420 attggattct caaagactat gccaatgacg aggtcattgg aagggctacg agcaaatggg 480 tgatgatgaa tgaggatact agaagattgc agaaagtcgg tgatgatgtc agagaagaat 540 atttagtgtt ttgccccagg acattgagat tggcatttcc tgaagagaac aataacagcc 600 tgaagaaaat agcaaaactc gaagacccgg ctgaatattc caggctaaga ctcgtgccga 660 ggagatcgga tctggatatg aacaaacatg taaataatgt tacctacatt ggatgggctc 720 tggagagcat cccaccagat atcatcgaca cccatgaact gcaagcaatt accctagact 780 atagacgtga atgccagcag gatgacatag ttgattcact caccagtcgg gaaccactcg 840 ttgatgctgc caatttagaa cttacagaaa gcaatgacag agaagatttg agccgatttt 900 tgcatctact aagatcggct gctaatggtc ttgagataaa tcggtgtcgc actgaatgga 960 gaaagaaacc agcaaaaata tagtacaccc acacacaatc tgttgatcct tctccttctc 1020 ctgtacctgt ttaccgtatt tacccttotc gtttgtgttc aaagtgtagt ttttcttttt 1080 ataaaaaaaa aaaaaaaaaa a 1 101 <210> 10 <211> 326 <212> PRT <213 > Vernonia mespilifol ia <400> 10 Thr Arg Arg Val Ser Pro Leu Leu Ala Val Thr Thr Gly Glu Gln Ser 1 5 10 15 Ser Ser Val Gly Ser Leu His Glu Ala Glu Lys Glu Lys Ser Leu Gly 20 25 30 Asn Arg Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly Leu Ser Tyr Lys 35 40 45 Glu Lys Phe Val lie Arg Cys Tyr Glu Val Gly lie Asn Lys Thr Ala 50 55 60 Thr lie GLu Thr lie Ala Asn Leu Leu Gln Glu Val Gly Gly Asn His 65 70 75 80 Ala Gln Ser Val Gly Phe Ser Thr Asp Gly Phe Ala Thr Thr Thr Thr 85 90 95 Met Arg Lys Leu His Leu lie Trp Val Thr Ala Arg Met His lie Glu 100 105 110 Val Tyr Arg Tyr Pro Ala Trp Ser Asp Val lie Glu lie Glu Thr Trp 1 15 120 125 Val Gln Gly Glu Gly Arg Val Gly Thr Arg Arg Asp Trp He Leu Lys 130 135 140 Asp Tyr Ala Asn Asp Glu Val lie Gly Arg Ala Thr Ser Lys Trp Val 145 150 155 160 Met Met Asn Glu Asp Thr Arg Arg Leu Gln Lys Val Gly Asp Asp Val 165 170 175 Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg Thr Leu Arg Leu Ala Phe 180 185 190 Pro Glu Glu Asn Asn Asn Ser Leu Lys Lys lie Ala Lys Leu Glu Asp 195 200 205 Pro Ala Glu Tyr Ser Arg Leu Arg Leu Val Pro Arg Arg Ser Asp Leu 210 215 220 Asp Met Asn Lys His Val Asn Asn Val Thr Tyr lie Gly Trp Ala Leu 225 230 235 240 Glu Ser lie Pro Pro Asp lie lie Asp Thr His Glu Leu Gln Ala lie 245 250 255 Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp lie Val Asp Ser 260 265 270 Leu Thr Ser Arg Glu Pro Leu Val Asp Ala Ala Asn Leu Glu Leu Thr 275 280 285 Glu Ser Asn Asp Arg Glu Asp Leu Ser Arg Phe Leu His Leu Leu Arg 290 295 300 Ser Ala Ala Asn Gly Leu Glu lie Asn Arg Cys Arg Thr Glu Trp Arg 305 310 315 320 Lys Lys Pro Ala Lys lie 325 <210> 1 1 <21 1> 522 <212> ADN <213> Triticnrn aestivum <221> incierta <222> (134) <400> 1 1 gaaagatcgg tactcggcgt gattggatcc ttaaggattt agctaatggt gaagttattg 60 gaagagctac cagcaagtgg gtcatgaíga accaaaatac acgcagactt caaagagtca 120 gtgacgaagc aggngatgag gtgtttatcc actgtccgaa gagtccaaga ttageattcc 180 ctgaggaaaa taatggcagt ctgaagaaga ttcctgttct aacagatcct gcacagcact 240 cgaggctcgg tctagtgcct agaagagctg atctggacat gaaccaacat gtcaataatg 300 tcacttacat tggttgggtc ctcgaaagca tacctcaaga tattattgat acccatgagt 360 tgcaaacaat cactcttgac tacagaagag agtgccagca tgatgacata gtcgattctc 420 tcacctatat agaggaaggg gaggagataa attctaatgg atctctgttt tcagcgccgc 480 acccagaaga gcagcgtcag ttcttgcact gcttgagatt tg 522 <210> 12 <21 1> 166 <212> PRT <213> Triticun aestivum <400> 12 Lys lie Gly Thr Arg Arg Asp Trp lie Leu Lys Asp Leu Ala Asn Gly 1 5 10 15 Glu Val lie Gly Arg Ala Thr Ser Lys Trp Val Met Met Asn Gln Asn 20 25 30 Thr Arg Arg Leu Gln Arg Val Ser Asp Glu Ala Gly Asp Glu Val Phe 35 40 45 lie His Cys Pro Lys Ser Pro Arg Leu Ala Phe Pro Glu Glu Asn Asn 50 55 60 Gly Ser Leu Lys Lys lie Pro Val Leu Thr Asp Pro Ala Gln His Ser 65 70 75 80 Arg Leu Gly Leu Val Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His 85 90 95 Val Asn Asn Val Thr Tyr He Gly Trp Val Leu Glu Ser lie Pro Gln 100 105 1 10 Asp lie lie Asp Thr His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg 1 15 120 125 Arg Glu Cys Gln His Asp Asp lie Val Asp Ser Leu Thr Tyr lie Glu 130 135 140 Glu Gly Glu Glu lie Asn Ser Asn Gly Ser Leu Phe Ser Ala Pro His 145 150 155 160 Pro Glu Glu Gln Arg Gln 165 <210> 13 <21 1> 1454 <212> ADN <213> Zea mays <400> 13 gcacgagaac cccagtccgc tccgcccgtg taaaactcca accgcgcatc gtcgtcgtcg 60 tcggctgegg cggcggccgg gcaacgagcc tcctcgaaac gacgcgcccg ctctcccaca 120 tgctgcgctg tcacgcgcca ccgcaatgcg gccgcgcgcc gctccgccac cacggaaggt 180 gggagtcgtc tcccgcaccc ggggtggtgg tgcggtgcac gcggggtgcg ccgcaggtat 240 ccgggatcga ggcggcgtcg ccggaccacg cagctgccac ggcggtggcg gctaaggcgg 300 aagggggtga cgcgcggccc agcctggccg agcggctgcg actggggagc ctcctggagg 360 acgggctctc ttacaaggag agtttcatcg tgcgctgcta cgaggtgggt atcaacaaga 420 cggccaccgt cgagaccatc gccaatctcc tccaggaggt aggatgtaac catgcacaaa 480 gtgttgggtt ctctactgat ggcttcgcca caactactac aatgagaaaa cttggactta 540 tttgggtgac gaaccgaatg cacattgaga tctacaagta cccagcttgg ggtgatgttg 600 ttgagatcga aacatggtgc caagaagatg gaaaaattgg tactcgtcgt gattggatcc 660 tcaaggacct gtgtactggt gaagttactg gcagagctac cagcaagtgg gtcatgatga 720 accaaaatac acggagactt caacgagtca gtgatgacgt gagggatgag gtgtttatac 780 attgtccaaa gactccaaga ttagcatttc cagaggaaaa taatggcagt ttgaagaaga 840 ttccgaatct ttcagatcct gcacaatatt caagactagg actagtgcca agaagagctg 900 atctggacat gaaccaacat gtcaataatg ttacttacat tggttgggtc cttgaaagta 960 tacctcaaga tataattgat acacacgagt tacaaacaat cactctcgac tatagaagag 1020 aatgtcaaca cgatgacata gttgattctc ttacttacgt agaggaagga gaggagagaa 1080 gcatgaacgg ctctgcttcc tcagtgccgc acacagaaca gcggcggcag ttcttgcatt 1 140 gcttgagatt tgcagccaat ggggatgaga tcaaccgtgg ccgtaccgcg tggaggaagc 1200 tagctagata aaaagtagtt tttggtcatc aatattctgc tccattttgc ttctcgcggt 1260 tggcggccct tgtaccacaa ttctgccatg cgtcgatggc gatttctgtc atttcttgca 1320 gttgtaaccg tctgtccgtt ttgtaccagt ggacagtgtc tgtgcgacat gcaataacct 1380 gcgtttaaac cctacgccaa cacaggcaag tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440 aaaaaaaaaa aaaa 1454 <210> 14 <211> 400 <212> PRT <213> Zea mays <400> 14 Thr Pro Val Arg Ser Ala Arg Val Lys Leu Gln Pro Arg lie Val Val 1 5 10 15 Val Val Gly Cys Gly Gly Gly Arg Ala Thr Ser Leu Leu Glu Thr Thr 20 25 30 Arg Pro Leu Ser His Met Leu Arg Cys His Ala Pro Pro Gln Cys Gly 35 40 45 Arg Ala Pro Leu Arg His His Gly Arg Trp Glu Ser Ser Pro Ala Pro 50 55 60 Gly Val Val Val Arg Cys Thr Arg Gly Ala Pro Gln Val Ser Gly lie 65 70 75 80 Glu Ala Ala Ser Pro Asp His Ala Ala Ala Thr Ala Val Ala Ala Lys 85 90 95 Ala Glu Gly Gly Asp Ala Arg Pro Ser Leu Ala Glu Arg Leu Arg Leu 100 105 1 10 Gly Ser Leu Leu Glu Asp Gly Leu Ser Tyr Lys Glu Ser Phe lie Val 1 15 120 125 Arg Cys Tyr Glu Val Gly lie Asn Lys Thr Ala Thr Val Glu Thr He 130 135 140 Ala Asn Leu Leu Gln Glu Val Gly Cys Asn His Ala Gln Ser Val Gly 145 150 155 160 Phe Ser Thr Asp Gly Phe Ala Thr Thr Thr Thr Met Arg Lys Leu Gly 165 170 175 Leu lie Trp Val Thr Asn Arg Met His lie Glu lie Tyr Lys Tyr Pro 180 185 190 Ala Trp Gly Asp Val Val Glu lie Glu Thr Trp Cys Gln Clu Asp Gly 195 200 205 Lys lie Gly Thr Arg Arg Asp Trp lie Leu Lys Asp Leu Cys Thr Gly 210 215 220 Glu Val Thr Gly Arg Ala Thr Ser Lys Trp Val Met Met Asn Gln Asn 225 230 235 240 Thr Arg Arg Leu Gln Arg Val Ser Asp Asp Val Arg Asp Glu Val Phe 245 250 255 He His Cys Pro Lys Thr Pro Arg Leu Ala Phe Pro Glu Glu Asn Asn 260 265 270 Gly Ser Leu Lys Lys lie Pro Asn Leu Ser Asp Pro Ala Gln Tyr Ser 275 280 285 Arg Leu Gly Leu Val Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His 290 295 300 Val Asn Asn Val Thr Tyr lie Gly Trp Val Leu Glu Ser He Pro Gln 305 310 315 320 Asp lie lie Asp Thr His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg 325 330 335 Arg Glu Cys Gln His Asp Asp lie Val Asp Ser Leu Thr Tyr Val Glu 340 345 350 Glu Gly Glu Glu Arg Ser Met Asn Gly Ser Ala Ser Ser Val Pro His 355 360 365 Thr Glu Gln Arg Arg Gln Phe Leu His Cys Leu Arg Phe Ala Ala Asn 370 375 380 Gly Asp Glu lie Asn Arg Gly Arg Thr Ala Trp Arg Lys Leu Ala Arg 385 390 395 400 <210> 15 <21 1> 772 <212> ADN <213> Triíicun aestivum <400> 15 gcacgaggaa agatcggtac tcggcgtgat tggatcctta aggatttagc taatggtgaa 60 gttattggaa gagctaccag caagtgggtc atgatgaacc aaaatacacg cagacttcaa 120 agag cag g acgaag cag gga gagg g a ccact gtccgaagag tccaagatta 180 gcattccctg aggaaaataa tggcagtctg aagaagattc ctgttctaac agatcctgca 240 cagcactcga ggctcggtct agtgcctaga agagctgatc tggacatgaa ccaacatgtc 300 aataatgtca cttacattgg ttgggtcctc gaaagcatac ctcaagatat tattgatacc 360 catgagttgc aaacaatcac tcttgactac agaagagagt gccagcatga tgacatagtc 420 gattctctca cctatataga ggaaggggag gagataaatt ctaatggatc tctgttttca 480 gcgccgcacc cagaagagca gcgtcagtta ttgcactgct tgagatttgc tggggctggg 540 gacgagatca accgtggtcg caccgtgtgg aggaaactag ctagataaaa agtgatatgt 600 atttgctcat atgtattgtg ctgttccttt tgttttactg ttttgctctt tgcgaccggc 660 gccgcatcac gagagaatca actgtacccg gaattttgtg attacctttg tgacctgtgt 720 aacaatcaat gccaatctgt ggcaaatgtt ggaccaaaaa aaaaaaaaaa aa 772 <210> 16 <2\ \> 195 <212> PRT <213> Triticum aestivum <400> 16 Ala Arg Gly Lys lie Gly Thr Arg Arg Asp Trp lie Leu Lys Asp Leu 1 5 10 15 Ala Asn Gly Glu Val He Gly Arg Ala Thr Ser Lys Trp Val Met Met 20 25 30 Asn Gln Asn Thr Arg Arg Leu Gln Arg Val Ser Asp Glu Val Arg Asp 35 40 45 Glu Val Phe lie His Cys Pro Lys Ser Pro Arg Leu Ala Phe Pro Glu 50 55 60 Glu Asn Asn Gly Ser Leu Lys Lys lie Pro Val Leu Thr Asp Pro Ala 65 70 75 80 Gln His Ser Arg Leu Gly Leu Val Pro Arg Arg Ala Asp Leu Asp Met 85 90 95 Asn Gln His Val Asn Asn Val Thr Tyr lie Gly Trp Val Leu Glu Ser 100 105 1 10 lie Pro Gln Asp lie lie Asp Thr His Glu Leu Gln Thr He Thr Leu 1 15 120 125 Asp Tyr Arg Arg Glu Cys Gln His Asp Asp lie Val Asp Ser Leu Thr 130 135 140 Tyr lie Glu Glu Gly Glu Glu lie Asn Ser Asn Gly Ser Leu Phe Ser 145 150 155 160 Ala Pro His Pro Glu Glu Glu Arg Gln Phe Leu His Cys Leu Arg Phe 165 170 175 Ala Gly Ala Gly Asp Glu lie Asn Arg Gly Arg Thr Val Trp Arg Lys 180 185 190 Leu Ala Arg 195 <210> 17 <211> 352 <212> PRT <213> Garcinia mangostana <400> 17 Met Leu Lys Leu Ser Ser Ser Arg Ser Pro Leu Ala Arg lie Pro Thr 1 5 10 15 Arg Pro Arg Pro Asn Ser lie Pro Pro Arg lie lie Val Val Ser Ser 20 25 30 Ser Ser Ser Lys Val Asn Pro Leu Lys Thr Glu Ala Val Val Ser Ser 35 40 45 Gly Leu Ala Asp Arg Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly Leu 50 55 60 Ser Tyr Lys Glu Lys Phe lie Val Arg Cys Tyr Glu Val Gly lie Asn 65 70 75 80 Lys Thr Ala Thr Val Glu Thr lie Ala Asn Leu Leu Gln Glu Val Gly 85 90 95 Cys Asn His Ala Gln Ser Val Gly Tyr Ser Thr Gly Gly Phe Ser Thr 100 105 1 10 Thr Pro Thr Met Arg Lys Leu Arg Leu lie Trp Val Thr Ala Arg Met 115 120 125 His lie Glu lie Tyr Lys Tyr Pro Ala Trp Ser Asp Val Val Glu lie 130 135 140 Glu Ser Trp Gly Gln Gly Glu Gly Lys lie Gly Thr Arg Arg Asp Trp 145 150 155 160 He Leu Arg Asp Tyr Ala Thr Gly Gln Val lie Gly Arg Ala Thr Ser 165 170 175 Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Lys Val Asp 180 185 190 Val Asp Val Arg Asp Glu Tyr Leu Val His Cys Pro Arg Glu Leu Arg 195 200 205 Leu Ala Phe Pro Glu Glu Asn Asn Ser Ser Leu Lys Lys lie Ser Lys 210 215 220 Leu Glu Asp Pro Ser Gln Tyr Ser Lys Leu Gly Leu Val Pro Arg Arg 225 230 235 240 Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr lie Gly 245 250 255 Trp Val Leu Glu Ser Met Pro Gln Glu lie lie Asp Thr His Glu Leu 260 265 270 Gln Thr lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln His Asp Asp Val 275 280 285 Val Asp Ser Leu Thr Ser Pro Glu Pro Ser Glu Asp Ala Glu Ala Val 290 295 300 Phe Asn His Asn Gly Thr Asn Gly Ser Ala Asn Val Ser Ala Asn Asp 305 310 315 320 His Gly Cys Arg Asn Phe Leu His Leu Leu Arg Leu Ser Gly Asn Gly 325 330 335 Leu Glu lie Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys Pro Thr Arg 340 345 350 <210> 18 <21 1> 389 <212> PRT <213> Carthamus tinctorius <400> 18 Met Leu Ser Arg Pro Leu Pro Thr Thr Ala Ala Ala Ala Thr Thr Thr 1 5 10 15 Thr Asn Asn Cys Asn Gly Val Asp Ser Arg Gly Ala Leu Pro His Ser 20 25 30 Arg Ser Val Gly Phe Ala Ser lie Arg Lys Arg Ser Thr Gly Ser Leu 35 40 45 Cys Asn Ser Pro Pro Arg Thr Val Ala Pro Val Met Ala Val Arg Thr 50 55 60 Gly Glu Gln Pro Thr Gly Val Ala Val Gly Leu Lys Glu Ala Glu Ala 65 70 75 80 Glu Val Glu Lys Ser Leu Ala Asp Arg Leu Arg Met Gly Ser Leu Thr 85 90 95 Glu Asp Gly Leu Ser Tyr Lys Glu Arg Phe lie lie Arg Cys Tyr Glu 100 105 110 Val Gly lie Asn Lys Thr Ala Thr Val Glu Thr lie Ala Asn Leu Leu 1 15 120 125 Gln Glu Val Gly Gly Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp 130 135 140 Gly Phe Ala Thr Thr Thr Thr Met Arg Lys Leu His Leu He Trp Val 145 150 155 160 Thr Ser Arg Met His lie Glu lie Tyr Arg Tyr Pro Ala Trp Ser Asp 165 170 175 Val Val Glu He Glu Thr Trp Cys Gln Ser Glu Gly Arg lie Gly Thr 180 185 190 Arg Arg Asp Trp lie Met Lys Asp His Ala Ser Gly Glu Val lie Gly 195 200 205 Arg Ala Thr Ser Lys Trp Val Met Met Asn Glu Asp Thr Arg Arg Leu 210 215 220 Gln Lys Val Asp Asp Asp Val Arg Asp Glu Tyr Leu Val Phe Cys Pro 225 230 235 240 Lys Thr Pro Arg Leu Ala Phe Pro Glu Lys Asn Thr Ser Ser Leu Lys 245 250 255 Lys lie Ala Lys Leu Glu Asp Pro Ala Glu Tyr Ser Thr Leu Gly Leu 260 265 270 Val Pro Arg Arg Ala Asp Leu Asp Met Asn Lys His Val Asn Asn Val 275 280 285 Thr Tyr lie Gly Trp Val Leu Glu Ser lie Pro Gln Glu Val lie Asp 290 295 300 Thr His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln 305 310 315 320 His Asp Asp lie Val Asp Ser Leu Thr Ser Ser Glu Ser Leu Leu Asp 325 330 335 Asp Ala Ala lie Ser Lys Leu Glu Gly Thr Asn Gli Ser Ser Val Pro 340 345 350 Lys Lys Asp Glu Thr Asp Leu Ser Arg Phe Leu His Leu Leu Arg Ser 355 360 365 Ser Gly Asp Gly Leu Glu Leu Asn Arg Gly Arg Thr Glu Trp Arg Lys 370 375 380 Lys Pro Ala Lys Lys 385 <210> 19 <21 1> 385 <212> PRT <213> Carthamus tinctorius <400> 19 Met Leu Ser Lys Gly Ala Pro Ala Ala Pro Ala Val Ala Ala Met Tyr 1 5 10 15 Asn Ala Ser Ala Lys Asp Thr Thr Phe Ala Leu Thr His Ser Arg Ser 20 25 30 He Gly Ser Val Ser lie Arg Arg Arg Tyr Asn Val Phe Leu Cys Asn 35 40 45 Ser Ser Ser Ser Ser Arg Lys Val Ser Pro Leu Leu Ala Val Ala Thr 50 55 60 Gly Glu Gln Pro Ser Gly Val Ala Ser Leu Arg Glu Ala Asp Lys Glu 65 70 75 80 Lys Ser Leu Gly Asn Arg Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly 85 90 95 Leu Ser Tyr Lys Glu Lys Phe Val lie Arg Cys Tyr Glu Val Gly lie 100 105 110 Asn Lys Thr Ala Thr lie Glu Thr lie Ala Asn Leu Leu Gln Glu Val 115 120 125 Gly Gly Asn His Ala Gln Gly Val Gly Phe Ser Thr Asp Gly Phe Ala 130 135 140 Thr Thr Thr Thr Met Arg Lys Leu His Leu lie Trp Val Thr Ala Arg 145 150 155 160 Met His lie Glu lie Tyr Arg Tyr Pro Ala Trp Ser Asp Val lie Glu 165 170 175 He Glu Thr Trp Val Gln Gly Glu Gly Lys Val Gly Thr Arg Arg Asp 180 185 190 Trp lie Leu Lys Asp Tyr Ala Asn Gly Glu Val He Gly Arg Ala Thr 195 200 205 Ser Lys Trp Val Met Met Asn Glu Asp Thr Arg Arg Leu Gln Lys Val 210 215 220 Ser Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg Thr Leu 225 230 235 240 Arg Leu Ala Phe Pro Glu Glu Asn Asn Asn Ser Met Lys Lys He Pro 245 250 255 Lys Leu Glu Asp Pro Ala Glu Tyr Ser Arg Leu Gly Leu Val Pro Arg 260 265 270 Arg Ser Asp Leu Asp Met Asn Lys His Val Asn Asn Val Thr Tyr He 275 280 285 Gly Trp Ala Leu Glu Ser He Pro Pro Glu lie lie Asp Thr His Glu 290 295 300 Leu Gln Ala lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln Arg Asp Asp 305 310 315 320 De Val Asp Ser Leu Thr Ser Arg Glu Pro Leu Gly Asn Ala Ala Gly 325 330 335 Val Lys Phe Lys Glu lie Asp Gly Ser Val Ser Pro Lys Lys Asp Glu 340 345 350 Gln Asp Leu Ser Arg Phe Met His Leu Leu Arg Ser Ala Gly Ser Gly 355 360 365 Leu Glu lie Asn Arg Cys Arg Thr Glu Trp Arg Lys Lys Pro Ala Lys 370 375 380 Arg 385 <210> 20 <21 1> 222 <212> PRT <213> Elaeis guineensis <400> 20 Gly Phe Ala Thr Thr Pro Thr Met Arg Lys Leu Arg Leu lie Trp Val 1 5 10 15 Thr Ser Arg Met His lie Glu lie Tyr Lys Tyr Pro Ala Trp Gly Asp 20 25 30 Val Val Glu lie Glu Thr Trp Cys Gln Gly Glu Gly Arg lie Gly Thr 35 40 45 Arg Arg Asp Trp lie He Lys Mp Leu Ala Thr Gly Glu Val lie Gly 50 55 60 Arg Ala Thr Ser Lys Trp Val Met Met Asp Gln Asp Thr Arg Lys Leu 65 70 75 80 Gln Arg Val Ser Asp Glu Val Arg Glu Glu Tyr Leu Val Phe Cys Pro 85 90 95 Arg Thr Pro Arg Leu Ala Phe Pro Glu Glu Asp Asn Gly Ser Val Lys 100 105 1 10 Lys He Pro Lys Leu Glu Glu Pro Ala Asp Tyr Ser Arg Ser Glu Leu 115 120 125 Val Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val 130 135 140 Thr Tyr lie Gly Trp Val Leu Glu Ser Met Pro Gln Glu lie lie Asp 145 150 155 160 Thr His Glu Leu Gln Thr lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln 165 170 175 His Asn Asp Met Val Asp Ser Leu Thr Ser Leu Glu Leu Ala Asp Asp 180 185 190 Tyr Ser Thr Asn Cly Ser Ala lie Gly Lys Cm His Lys Lys Glu His 195 200 205 Pro Ser Leu Phe Ala Phe Leu Glu lie Val Gln His Trp Thr 210 215 220 <210> 21 <21 1> 367 <212> PRT <213> Arabidopsis thaliana <400> 21 Met Leu Lys Leu Ser Cys Asn Val Thr Asp His lie His Asn Leu Phe 1 5 10 15 Ser Asn Ser Arg Arg lie Phe Val Pro Val His Arg Gln Thr Arg Pro 20 25 30 lie Ser Cys Phe Gln Leu Lys Lys Glu Pro Leu Arg Ala lie Leu Ser 35 40 45 Ala Asp His Gly Asn Ser Ser Val Arg Val Ala Asp Thr Val Ser Gly 50 55 60 Thr Ser Pro Ala Asp Arg Leu Arg Phe Gly Arg Leu Met Glu Asp Gly 65 70 75 80 Phe Ser Tyr Lys Glu Lys Phe lie Val Arg Ser Tyr Glu Val Gly He 85 90 95 Asn Lys Thr Ala Thr lie Glu Thr lie Ala Asn Leu Leu Gln Glu Val 100 105 1 10 Ala Cys Asn His Val Gln Asn Val Giy Phe Ser Thr Asp Gly Phe Ala 1 15 120 125 Thr Thr Leu Thr Het Arg Lys Leu His Leu lie Trp Val Thr Ala Arg 130 135 140 Met His lie Glu lie Tyr Lys Tyr Pro Ala Trp Ser Pap Val Val Glu 145 150 155 160 lie Glu Thr Trp Cys Gln Ser Glu Gly Arg lie Cly Thr Arg Arg Asp 165 170 175 Trp lie Leu Lys Asp Cys Ala Thr Gly Glu Val lie Gly Arg Ala Thr 180 185 190 Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Arg Val 195 200 205 Thr Asp Glu Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Pro Glu Pro 210 215 220 Arg Leu Ala Phe Pro Glu Glu Asp Asn Ser Ser Leu Lys Lys He Pro 225 230 235 240 Lys Leu Glu Asp Pro Ala Glu Tyr Ser Met Leu Gly Leu Lys Pro Arg 245 250 255 Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr lie 260 265 270 Gly Trp Val Leu Glu Ser lie Pro Gln Glu lie He Asp Thr His Glu 275 280 285 Leu Lys Val lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp 290 295 300 He Val Asp Ser Leu Thr Thr Ser Glu Thr Pro Asn Glu Val Val Ser 305 310 315 320 Lys Leu Thr Gly Thr Asn Gly Ser Thr Thr Ser Ser Lys Arg Glu His 325 330 335 Asn Glu Ser His Phe Leu His lie Leu Arg Leu Ser Glu Asn Gly Gln 340 345 350 Glu lie Asn Arg Gly Arg Thr Gln Trp Arg Lys Lys Ser Ser Arg 355 360 365 <210> 22 <211> 362 <212> PRT <213> Arabidopsis thaliana <400> 22 Met Leu Lys Leu Ser Cys Asn Val Thr Asp Ser Lys Leu Gln Arg Ser 1 5 10 15 Leu Leu Phe Phe Ser His Ser Tyr Arg Ser Asp Pro Val Asn Phe lie 20 25 30 Arg Arg Arg lie Val Ser Cys Ser Gln Thr Lys Lys Thr Gly Leu Val 35 40 45 Pro Leu Arg Ala Val Val Ser Ala Asp Gln Gly Ser Val Val Gln Gly 50 55 60 Leu Ala Thr Leu Ala Asp Gln Leu Arg Leu Gly Ser Leu Thr Gln Asp 65 70 75 80 Gly Leu Ser Tyr Lys Gln Lys Phe Val Val Arg Ser Tyr Glu Val Gly 85 90 95 Ser Asp Lys Thr Ala Thr Val Glu Thr lie Ala Asp Leu Leu Gln Glu 100 105 110 Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly Phe 1 15 120 125 Ala Thr Thr Thr Thr Met Arg Lys Leu His Leu He Trp Val Thr Ala 130 135 140 Arg Met His lie Gln lie Tyr Lys Tyr Pro Ala Trp Gly Asp Val Val 145 150 155 160 Glu lie Glu Thr Trp Cys Gln Ser Gln Gly Arg lie Gly Thr Arg Arg 165 170 175 Asp Trp He Leu Lys Asp Ser Val Thr Gly Glu Val Thr Gly Arg Ala 180 185 190 Thr Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Lys 195 200 205 Val Ser Asp Asp Val Arg Asp Clu Tyr Leu Val Phe Cys Pro Gln Glu 210 215 220 Pro Arg Leu Ala Phe Pro Glu Glu Asp Asp Arg Ser Leu Lys Lys lie 225 230 235 240 Pro Lys Leu Glu Asp Pro Ala Gln Tyr Ser Met lie Gly Leu Lys Pro 245 250 255 Arg Arg Ala Asp Leu Asp Met Asp Gln His Val Asp Asp Val Thr Tyr 260 265 270 lie Gly Trp Val Leu Gln Ser lie Pro Gln Glu lie Val Asp Thr His 275 280 285 Glu Leu Gln Val lie Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp 290 295 300 Asp Val Val Asp Ser Leu Thr Thr Thr Thr Ser Glu lie Gly Gly Thr 305 310 315 320 Asn Gly Ser Ala Thr Ser Gly Thr Gln Gly His Asn Asp Ser Gln Phe 325 330 335 Leu His Leu Leu Arg Leu Ser Gly Asp Gly Gln Glu lie Asn Arg Gly 340 345 350 Thr Thr Leu Trp Arg Lys Lys Pro Ser Ser 355 360 Se hace constar que con relación a esta fecha, un mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (24)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones .
1. Un polinucleótido aislado, caracterizado porque codifica para un primer polipéptido de al menos 166 aminoácidos, teniendo el polipéptido una identidad de secuencia de al menos 90% sobre la base del método de alineación de Clustal cuando se compara con un segundo polipéptido seleccionado del grupo que consiste de las SEQ ID NOS: 2, 4, 6, 8, 10, 12 y 16, o de manera -referible un tercer polipéptido de al menos 363 aminoácidos, el polipéptido tiene una identidad de secuencia de al menos 92% de identidad sobre la base del método de alineación de Clustal cuando se compara con un cuarto polipéptido seleccionado de la SEQ ID NO: 14.
2. La secuencia polinucleotidica de conformidad con la reivindicación 1, caracterizada porque la identidad de secuencia es de al menos el 93%.
3. La secuencia polinucleotidica de conformidad con la reivindicación 1, caracterizada porque la identidad de secuencia es de al menos el 96%.
4. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque el primer polipéptido es seleccionado del grupo que consiste de la SEQ ID NOS: 2, 4, 6, 8, 10, 12 y 16.
5. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque el polinucleótido comprende una secuencia nucleotidica seleccionada del grupo que consiste de las SEQ ID NOS: 1, 3, 5, 7, 9, 11, 13 y 15.
6. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque el primer polipéptido es una oleoil-ACP tioesterasa.
7. Un complemento aislado del polinucleótido de conformidad con la reivindicación 1, caracterizado porque (a) el complemento y el polinucleótido consisten del mismo número de nucleótidos, y (b) las secuencias nucleotidicas del complemento y el polinucleótido tienen una complementarídad del 100%.
8. Un complemento aislado del polinucleótido de conformidad con la reivindicación 5, caracterizado porque (a) el complemento y el polinucleótido consisten del mismo número de nucleótidos, y (b) las secuencias nucleotidicas del complemento y el polinucleótido tienen una complementarídad del 100%.
9. Una molécula de ácido nucleico aislada, caracterizada porque comprende (1) al menos 400 nucleótidos y (2) permanece hibridada con el polinucleotido aislado de conformidad con la reivindicación 1 bajo una condición de lavado de 0.1X SSC, SDS al 0.1% y 65°C.
10. Una molécula de ácido nucleico aislada/ caracterizada porque comprende (1) al menos 400 nucleótidos y (2) permanece hibridada con el polinucleotido aislado de conformidad con la reivindicación 5 bajo una condición de lavado de 0.1X SSC, SDS al 0.1% y 65°C.
11. Una célula, caracterizada porque comprende el polinucleotido de conformidad con la reivindicación 1.
12. La célula de conformidad con la reivindicación 11, caracterizada porque la célula se selecciona del grupo que consiste de una célula de levadura, una célula bacteriana y una célula de planta.
13. Una planta transgénica, caracterizada porque comprende el polinucleotido de conformidad con la reivindicación 1.
14. Un método para transformar una célula, caracterizado porque comprende introducir en una célula el polinucleotido de conformidad con la reivindicación 1.
15. Un método para producir una planta transgénica, caracterizado porque comprende (a) transformar una célula de planta con el polinucleotido de conformidad con la reivindicación 1 y (b) generar una planta a partir de la célula de planta transformada.
16. Un iftétodo para producir un fragmento polinucleotidico, caracterizado porque comprende (a) seleccionar una secuencia polinucleotidica comprendida por: el polinucleótido de conformidad con la reivindicación 1, y (b) sintetizar un fragmento polinucleotidico que contiene la secuencia nucleotidica .
17. El método de conformidad con la reivindicación 16, caracterizado porque el fragmento es producir in vivo.
18. Un polipéptido aislado, caracterizado porque comprende (a) al menos 166 aminoácidos, y (b) tiene una identidad de secuencia de al menos el 90% sobre la base del método de Clustal en comparación con una secuencia de aminoácidos seleccionado del grupo que consiste de las SEQ ID NOS: 2, 4, 6, 8, 10, 12 y 16 o de manera preferible (c) al menos 363 aminoácidos, y (d) tiene una identidad de secuencia de al menos el 92% sobre la base del método de Clustal comparado con una secuencia de aminoácido seleccionada del grupo que consiste de la SEQ ID NO: 14.
19. El polipéptido de conformidad con la reivindicación 18, caracterizado porque la identidad de secuencia es de al menos el 93%.
20. El polipéptido de conformidad con la reivindicación 18, caracterizado porque la identidad de secuencia es de al menos el 96%.
21. El polipéptido de conformidad con la reivindicación 18, caracterizado porque el polipéptido tiene una secuencia seleccionada del grupo que consiste de las SEQ ID NOS: 2, 4, 6, 8, 10, 12, 14 y 16.
22. El polipéptido de conformidad con la reivindicación 18, caracterizado porque el polipéptido es una oleoil-ACP tioesterasa.
23. Un gen quimérico, caracterizado porque comprende el polinucleótido de conformidad con la reivindicación 1, ligado de manera operativa a al menos una secuencia reguladora adecuada.
24. Un método para alterar el nivel de expresión de oleoil-ACP tioesterasa en una célula huésped, el método se caracteriza porque comprende: (a) Transformar una célula huésped con el gen quimérico de conformidad con la reivindicación 23; y (b) Hacer crecer la célula transformada en el paso (a) bajo condiciones adecuadas para la expresión del gen quimérico .
MXPA02005178A 1999-11-24 2000-11-22 Oleil-proteina portadora de acilo tioesterasas en plantas. MXPA02005178A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16751099P 1999-11-24 1999-11-24
PCT/US2000/032012 WO2001038502A2 (en) 1999-11-24 2000-11-22 Oleoyl-acyl-carrier-protein thioesterases in plants

Publications (1)

Publication Number Publication Date
MXPA02005178A true MXPA02005178A (es) 2003-01-28

Family

ID=22607664

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02005178A MXPA02005178A (es) 1999-11-24 2000-11-22 Oleil-proteina portadora de acilo tioesterasas en plantas.

Country Status (8)

Country Link
EP (1) EP1232250A2 (es)
JP (1) JP2004508802A (es)
AU (1) AU1787101A (es)
BR (1) BR0015641A (es)
CA (1) CA2387044A1 (es)
HU (1) HUP0203314A3 (es)
MX (1) MXPA02005178A (es)
WO (1) WO2001038502A2 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3053432A1 (en) 2009-12-18 2016-08-10 Cargill, Incorporated Brassica plants yielding oils with a low total saturated fatty acid content
CA2837011C (en) 2010-05-25 2023-01-17 Cargill Incorporated Brassica plants yielding oils with a low alpha linolenic acid content
US9695434B2 (en) 2010-05-25 2017-07-04 Cargill, Incorporated Brassica plants yielding oils with a low alpha linolenic acid content
FR2966162B1 (fr) * 2010-10-15 2014-08-29 Genoplante Valor Obtention de plantes ayant une tolerance amelioree a un deficit hydrique

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5512482A (en) * 1990-04-26 1996-04-30 Calgene, Inc. Plant thioesterases
AU7147498A (en) * 1997-05-05 1998-11-27 Dow Agrosciences Llc Nucleotide sequences of maize oleoyl-acp thioesterase and palmitoyl-acp thioesterase genes and their use in the modification of fatty acid content of oil

Also Published As

Publication number Publication date
HUP0203314A2 (hu) 2003-01-28
WO2001038502A2 (en) 2001-05-31
BR0015641A (pt) 2002-07-09
EP1232250A2 (en) 2002-08-21
JP2004508802A (ja) 2004-03-25
HUP0203314A3 (en) 2005-11-28
CA2387044A1 (en) 2001-05-31
WO2001038502A3 (en) 2001-12-13
AU1787101A (en) 2001-06-04

Similar Documents

Publication Publication Date Title
US8466344B2 (en) Plant transcription factors
US7199284B2 (en) Chlorophyllases
US7534935B2 (en) Phospholipid:diacylglycerol acyltransferases
CA2436778A1 (en) Floral development genes
CA2370017A1 (en) Plant defensins
US20040148653A1 (en) Triacylglycerol lipases
US6864077B1 (en) Membrane-bound desaturases
AU779003B2 (en) Plant reproduction proteins
MXPA02005178A (es) Oleil-proteina portadora de acilo tioesterasas en plantas.
US6673988B1 (en) Plant lipases
US7235714B2 (en) Lysophosphatidic acid acetyltranferases
US7112722B2 (en) Plant genes encoding pantothenate synthetase
US7087813B2 (en) Plant lipoxygenases
US7002060B1 (en) Enzymes involved in petroselinic acid biosynthesis
US6730823B1 (en) Plant choline phosphate cytidylyltransferase
US20040073974A1 (en) Cyclopropane-fatty-acyl-phospholipid synthase
WO2000049156A2 (en) Lysophosphatidic acid acetyltransferases
WO2000032790A2 (en) Membrane-bound desaturases
WO2001019995A1 (en) Plant flowering control genes
US20020088026A1 (en) Plant RNaseD-like genes
WO2001019994A2 (en) PLANT APOPTOSIS INDUCING FACTORS (AIFs)
AU2002245193A1 (en) Plant transcription factors