MX2013008086A

MX2013008086A - Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.

Info

Publication number: MX2013008086A
Application number: MX2013008086A
Authority: MX
Inventors: Valerie Frankard; Christophe Reuzeau; Cecile Vriet
Original assignee: Basf Plant Science Co Gmbh
Priority date: 2011-01-20
Filing date: 2012-01-19
Publication date: 2013-10-03
Also published as: WO2012098517A1; CA2823287A1; EP2665819A1; DE112012000525T5; EP2665819A4; US20130298289A1; AR085309A1; BR112013018545A2; AU2012208257A1; CN103429745A

Abstract

Un método para mejorar, en plantas, varios rasgos relacionados con el rendimiento de importancia económica. Más específicamente, un método para mejorar rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704 (familia 704 de citocromo P450), un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28. También plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido tipo CYP704 (familia 704 de citocromo P450), un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, en donde las plantas tienen mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control. También ácidos nucleicos que codifican polipéptidos DUF1218 y constructos que los comprenden desconocidos hasta el momento, útiles en la realización de los métodos de la invención.

Description

PLANTAS QUE TIENEN MEJORES RASGOS RELACIONADOS CON EL RENDIMIENTO Y UN MÉTODO PARA PRODUCIRLAS ANTECEDENTES La presente invención se refiere, en general, al campo de la biología molecular y se relaciona con un método para mejorar rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704 (familia 704 de citocromo P450). La presente invención también se refiere a plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido tipo CYP704, en donde dichas plantas tienen mejores rasgos relacionados con el rendimiento, con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee constructos útiles en los métodos de la invención.

La presente invención también se refiere, en general, al campo de la biología molecular y se relaciona con un método para mejorar, en plantas, varios rasgos relacionados con el rendimiento de importancia económica. Más específicamente, la presente invención se refiere a un método para mejorar rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido DUF1218. La presente invención también se refiere a plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido DUF1218, en donde dichas plantas tienen mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control. La invención también provee ácidos nucleicos que codifican DUF1218 y constructos que los comprenden desconocidos hasta el momento, útiles en la realización de los métodos de la invención.

La presente invención también se refiere, en general, al campo de la biología molecular y se relaciona con un método para mejorar rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo translina. La presente invención también se refiere a plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido tipo translina, en donde dichas plantas tienen mejores rasgos relacionados con el rendimiento, con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee constructos útiles en los métodos de la invención.

La presente invención también se refiere, en general, al campo de la biología molecular y se relaciona con un método para mejorar rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28. La presente invención también se refiere a plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido tipo ERG28, en donde dichas plantas tienen mejores rasgos relacionados con el rendimiento, con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee constructos útiles en los métodos de la invención.

La población mundial en constante crecimiento y la disminución del suministro de tierras arables disponibles para la agricultura estimulan la investigación tendiente a incrementar la eficacia de la agricultura. Los medios convencionales para mejorar los cultivos y la horticultura utilizan técnicas de reproducción selectivas a fin de identificar plantas que tengan características deseables. Sin embargo, dichas técnicas de reproducción selectivas tienen varios inconvenientes, a saber, que estas técnicas generalmente son laboriosas y dan como resultado plantas que, a menudo, contienen componentes genéticos heterogéneos que no siempre resultarán en que el rasgo deseable sea heredado de las plantas progenitoras. Los avances en biología molecular han permitido que el hombre modifique el germoplasma de animales y plantas. La manipulación genética de plantas implica el aislamiento y la manipulación del material genético (típicamente en la forma de ADN o ARN) y la posterior introducción de ese material genético en una planta. Dicha tecnología tiene la capacidad de producir cultivos o plantas que tengan varios rasgos mejorados desde el punto de vista económico, agronómico u hortícola.

Un rasgo de particular interés económico es el aumento del rendimiento. Normalmente, el rendimiento se define como el producto medible de valor económico de un cultivo. Esto se puede definir en términos de cantidad y/o calidad. El rendimiento depende directamente de diversos factores, por ejemplo, la cantidad y el tamaño de los órganos, la arquitectura de la planta (por ejemplo, la cantidad de ramas), la producción de semillas, la senectud de las hojas y otros. El desarrollo de la raíz, la absorción de nutrientes, la tolerancia al estrés y el vigor temprano también pueden ser factores importantes para determinar el rendimiento. En consecuencia, la optimización de los factores antes mencionados puede contribuir a aumentar el rendimiento del cultivo.

El rendimiento de las semillas es un rasgo particularmente importante debido a que las semillas de muchas plantas son importantes para la nutrición de humanos y animales. Los cultivos tales como maíz, arroz, trigo, cañóla y soja representan más de la mitad de la ingesta calórica total de los humanos, ya sea por consumo directo de las semillas mismas o por consumo de productos cárnicos obtenidos de semillas procesadas. También son fuente de azúcares, aceites y muchos tipos de metabolitos que se utilizan en procesos industriales. Las semillas contienen un embrión (fuente de nuevos brotes y raíces) y un endosperma (fuente de nutrientes para el crecimiento del embrión durante la germinación y durante el crecimiento temprano de las plántulas). El desarrollo de una semilla incluye muchos genes y requiere la transferencia de metabolitos desde raíces, hojas y tallos hasta la semilla en crecimiento. El endosperma, en particular, asimila los precursores metabólicos de hidratos de carbono, aceites y proteínas y los sintetiza en macromoléculas de almacenamiento para llenar el grano.

Otro rasgo importante para muchos cultivos es el vigor temprano. Mejorar el vigor temprano es un objetivo importante de los programas modernos de reproducción de arroz en cultivares de arroz templados y tropicales. Las raíces largas son importantes para un adecuado anclaje al suelo en el caso del arroz sembrado en agua. Cuando el arroz se siembra directamente en campos inundados y cuando las plantas deben emerger rápidamente del agua, los brotes más largos se asocian con el vigor. Cuando se practica la siembra mecánica, los mesocotilos y coleoptilos más largos son importantes para el buen surgimiento de las plántulas. La capacidad de manipular por ingeniería genética el vigor temprano en las plantas sería de gran importancia en agricultura. Por ejemplo, el escaso vigor temprano ha sido una limitación a la introducción de híbridos de maíz (Zea mays L.) basados en el germoplasma del cinturón maizero en el Atlántico Europeo.

Otro rasgo importante es una mejor tolerancia al estrés abiótico. El estrés abiótico es una causa principal de la pérdida de cultivos a nivel mundial, lo cual reduce en más del 50 % el rendimiento promedio de la mayoría de las plantas de cultivo importantes (Wang et al., Planta 218, 1-14, 2003). El estrés abiótico puede ser causado por estrés por sequía, salinidad, temperaturas extremas, toxicidad química y estrés oxidativo. La capacidad de mejorar la tolerancia de las plantas al estrés abiótico sería de gran ventaja económica para los agricultores en todo el mundo y permitiría la plantación de cultivos en condiciones adversas y en territorios en los cuales la plantación de cultivos no puede ser posible de otra manera.

En consecuencia, se puede aumentar el rendimiento de los cultivos mediante la optimización de uno de los factores antes mencionados.

Con respecto a los polipéptidos tipo CYP704, la expresión 'citocromo P450' (P450) en referencia a una sustancia pigmentada cuando se reduce y se une con monóxido de carbono, produjo un pico de absorción inusual en una longitud de onda de 450 nm. Los citocromos P450 son proteínas hemotioladas que participan en muchas vías metabólicas básicas que varían desde la síntesis y degradación de hormonas esteroides endógenas, vitaminas y derivados de ácidos grasos ("endobióticos") hasta el metabolismo de compuestos extraños, como fármacos, productos químicos ambientales y carcinógenos ("xenobióticos"). En las plantas, participan en la síntesis de hormonas vegetales, síntesis de fitoalexina, biosíntesis de pigmentos de pétalos florales y degradación de herbicidas. Por lo general, los P450 funcionan como monooxigenasas activando el oxígeno molecular cuando insertan uno de sus átomos en el sustrato y reducen el otro para formar agua: R-H + 02 + NADPH + H+ = R-OH + H20 + NADP+ Por lo general, los P450 vegetales se clasifican en dos ciados principales: Tipo A y tipo no A El ciado tipo A es específico de plantas; algunos P450 que participan en la biosíntesis de productos naturales o metabolitos secundarios se encuentran en este grupo. Por el contrario, el ciado tipo no A es un grupo de secuencias mucho más divergente que consiste en varios ciados individuales, los cuales con frecuencia muestran más similitud con los P450 no vegetales que con los otros P450 vegetales. En la actualidad, se acepta generalmente que los P450 tipo A se originan de un único gen ancestral común.

Las proteínas CYP704A forman una pequeña familia génica (2 miembros en Arabidopsis, 3 en arroz), y se presupone que participan en la hodroxilación de ácidos grasos, la formación de cutina y la tolerancia al estrés por sequía. CYP704B1 es una ?-hidroxilasa de ácidos grasos de cadena larga esencial para la síntesis de esporopolenina en polen de Arabidopsis thaliana. CYP704B2 cataliza la v-hidroxilación de ácidos grasos (C16 y C18) y es necesaria para la biosíntesis de cutina en las anteras y la formación de exina del polen en el arroz.

Con respecto a los polipéptidos tipo translina, la translina es un miembro de la superfamilia Translina. La translina interactúa con el ADN y forma un anillo alrededor del ADN; véase, por ejemplo, Aoki et al., FEBS Lett. 1997 Jan 20; 401(2-3):109-112. Otro miembro de la superfamilia Translina es el factor X asociado a la translina (TRAX) que, según se descubrió, interactúa con la translina en el ensayo de dos híbridos de levadura.

Jaendling et al.(Biochem. J. (2010) 429, 225-234) informaron que tanto la translina como el TRAX participan en un amplio espectro de actividades biológicas, aunque no se ha clarificado la función precisa para todos estos procesos.

Con respecto a los polipéptidos tipo ERG28, los fitoesteroles se sintetizan mediante la vía del mevalonato de la formación de terpenoides. Los esferoides vegetales se derivan de esteróles y comprenden las hormonas de esferoides vegetales brasinoesteroides. Se ha demostrado que los esferoides y esteróles vegetales cumplen una función esencial en la regulación de muchos procesos de crecimiento y desarrollo de las plantas. Se sabe que las alteraciones en los niveles de esteróles afectan la embriogénesis, la elongación celular y la diferenciación vascular (Clouse, Plant Cell 14: 1995-2000, 2002 y las referencias allí citadas). Cabe destacar que, en términos de aplicaciones agronómicas, los esteróles también participan en la resistencia de las plantas a los patógenos. Por ejemplo, la aplicación exógena de ergosterol, el principal esteral de la mayoría de los hongos, promueve la expresión de varios genes de defensa y conduce a una mayor tolerancia a los patógenos fúngicos en las plantas (Laquitaine et al, Molecular Plant-Microbe Interactions 19: 1103-1112, 2006; Loc man et al, Plant Molecular Biology 62: 43-51 , 2006). Sin embargo, aún no se ha clarificado si los cambios en la composición y/o los niveles de esteróles en las plantas también confieren mayor tolerancia a diversos tipos de estrés abiótico en las plantas. Finalmente, datos experimentales sugieren que las alteraciones en la composición de esteróles en las plantas pueden generar modificaciones en las características nutricionales de las plantas. Por ejemplo, la sobreexpresión del gen GmSMTI en las plantas de papas genera una reducción de los niveles de colesterol y glicoalcaloides (TGA) (Arnqvist et al, Plant Physiology 131 : 1792-1799, 2003). Además, también se cree que los esteróles vegetales tienen efectos benéficos en la salud de los seres humanos (un consumo relativamente alto de fitoesteroles tiende a mejorar la función inmunitaria y a reducir el nivel de colesterol en los seres humanos; Püronen et al, Journal of the Science of Food and Agriculture 80: 939-966, 2000).

Las vías de síntesis y señalización de brasinoesteroides y esteróles vegetales están caracterizadas correctamente. Sin embargo, a la fecha no se sabe prácticamente nada en relación con la topología de las enzimas responsables de la síntesis de brasinoesteroides y esteróles vegetales. Poco se sabe también acerca de los mecanismos de regulación que participan en la síntesis de esteróles y esteroides vegetales, y su transporte dentro de la célula.

ERG28 es una proteína clave en el complejo de enzimas biosintéticas de esteróles de levadura. Se descubrió que ERG28 está altamente corregulada con otras enzimas de la biosíntesis del ergosterol (Mo et al, Proceedings of the National Academy of Sciences of the United States of America 99: 9739-9744 2002). También se demostró que esta proteína ubicada en la transmembrana del retículo endoplasmático interactúa con muchas de las enzimas biosintéticas del ergosterol en la levadura (Saccharomyces cerevisiae). Al parecer, ScERG28 funciona como una estructura para atar estas enzimas y formar así un complejo grande (Mo et al, 2002; Mo et al., Biochimica Et Biophysica Acta-Molecular and Cell Biology of Lipids 1686: 30-36, 2004; and Mo et al., Journal of Lipid Research 46: 1991 -1998, 2005). La pérdida de ScERG28 da como resultado una reducción del nivel de ergosterol, acumulación de intermediarios de esterol y crecimiento lento en la levadura (Smith et al, Science 274:2069-2074, 1996; Gachotte et al., Journal of Lipid Research 42: 150-154, 2001 ). Se identificaron homólogos de ScERG28 en otros eucariotas, que incluyen especies humanas y varias especies vegetales. Aún no se ha caracterizado la función de las proteínas tipo ERG28 en las plantas.

Según el uso final, se puede favorecer la modificación de ciertos rasgos del rendimiento con respecto a otros. Por ejemplo, para aplicaciones tales como producción de forraje o madera, o recursos de biocombustibles, puede ser deseable un aumento de las partes vegetativas de una planta y, para aplicaciones tales como producción de harina, almidón o aceite, puede ser particularmente deseable un aumento en los parámetros de la semilla. Aun entre los parámetros de semilla, se pueden favorecer algunos con respecto a otros, según la aplicación. Diversos mecanismos pueden contribuir a aumentar el rendimiento de las semillas, ya sea aumentando el tamaño de las semillas o aumentado la cantidad de semillas.

Ahora se ha descubierto que se pueden mejorar varios rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218 o un polipéptido tipo translina en una planta.

Con respecto a los polipéptidos tipo ERG28, ahora se ha descubierto que se pueden mejorar varios rasgos relacionados con el rendimiento en plantas o levadura mediante la modulación de la expresión, en una planta, de un ácido nucleico que codifica un polipéptido tipo ERG28. En la levadura, la expresión modulada de proteínas tipo ERG28 da como resultado un mejor crecimiento y/o reproducción de la levadura, en comparación con la levadura de tipo silvestre.

Descripción detallada de la invención La presente invención demuestra que modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218 o un polipéptido tipo translina produce plantas que tienen mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control.

Con respecto a los polipéptidos tipo ERG28, la presente invención demuestra que modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28 produce plantas que tienen una composición alterada de esteroides y/o mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control. Se descubrió que la expresión modulada de un ácido nucleico que codifica un polipéptido tipo ERG28 en la levadura da como resultado un mejor crecimiento y/o reproducción de la levadura.

De acuerdo con una primera forma de realización, la presente invención provee un método para mejorar rasgos relacionados con el rendimiento en plantas, con respecto a plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218 o un polipéptido tipo translina y, opcionalmente, seleccionar plantas que tienen mejores rasgos relacionados con el rendimiento. De acuerdo con otra forma de realización, la presente invención provee un método para producir plantas que tienen mejores rasgos relacionados con el rendimiento, con respecto a plantas de control, en donde dicho método comprende las etapas de modular la expresión en dicha planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218 o un polipéptido tipo translina, como se describen en la presente, y opcionalmente, seleccionar plantas que tienen mejores rasgos relacionados con el rendimiento.

Con respecto a los polipéptidos tipo ERG28, de acuerdo con una primera forma de realización, la presente invención provee un método para regular la síntesis de esteroides en plantas, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28 y, opcionalmente, seleccionar plantas que tienen una composición alterada de esteroides. De acuerdo con una segunda forma de realización, la presente invención provee un método para mejorar rasgos relacionados con el rendimiento en plantas, con respecto a plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28 y, opcionalmente, seleccionar plantas que tienen mejores rasgos relacionados con el rendimiento. De acuerdo con otra forma de realización, la presente invención provee un método para producir plantas que tienen una composición alterada de esteroides y/o mejores rasgos relacionados con el rendimiento, con respecto a plantas de control, en donde dicho método comprende las etapas de modular la expresión en dicha planta un ácido nucleico que codifica un polipéptido tipo ERG28, como se describe en la presente, y opcionalmente, seleccionar plantas que tienen una composición alterada de esteroides y/o mejores rasgos relacionados con el rendimiento. De acuerdo con aun otra forma de realización, la presente invención provee un método para mejorar el crecimiento y/o la reproducción de la levadura, por ejemplo, aumentar el volumen de las células de la levadura, aumentar la tasa de crecimiento o mejorar la capacidad de apareamiento.

Un método preferido para modular (aumentar o disminuir) la expresión de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28 es mediante la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28.

Cualquier referencia de aquí en adelante a una "proteína útil en los métodos de la invención" significa un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido ERG28, como se definen en la presente. Cualquier referencia de aquí en adelante a un "ácido nucleico útil en los métodos de la invención" significa un ácido nucleico capaz de codificar dicho polipéptido tipo CYP704, polipéptido DUF1218, polipéptido tipo translina o polipéptido ERG28. El ácido nucleico que se introducirá en una planta (y, por lo tanto, útil para realizar los métodos de la invención) es cualquier ácido nucleico que codifica el tipo de proteína que se describirá a continuación, en adelante también denominado "ácido nucleico tipo CYP704", "ácido nucleico DUF1218', "ácido nucleico tipo translina" o "ácido nucleico tipo ERG28', o "gen tipo CYP704", "gen DUF1218', "gen tipo translina" o "gen tipo ERG28'.

Un "polipéptido tipo CYP704", como se define en la presente, se refiere a cualquier polipéptido que comprende un dominio P450 (Pfam PF00067) y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72), en donde x puede ser cualquier aminoácido.

De manera adicional y/o alternativa, el polipéptido tipo CYP704 comprende uno o más de los siguientes motivos: Motivo 1 (SEQ ID NO: 73): [GD]L[LF]GDGIF[ATN][TV]DG[EHD][MK]W[RK][HQ]QRK[VL^[SA]S[FY]EF[SA][TS][RK][V A]LRDFS[STC][DSV][TIV]F[RK][RKE] Motivo 2 (SEQ ID NO: 74): D[VTI]LP[DN]G[HYFT][KNRS]V[KVS][KA]G[DG][MG][VI][TNAY]Y[QMV]tPIA]Y[AS]MGRM[ ETK][YF][ILN]WG[DE]DA[EQA][ES][YF][RK]PERW Motivo 3 (SEQ ID NO: 75): [? [???][?? ]???0[? ][??]??[??][???]???[??]0??[??][??? [?3 ?[??8^?[???]?[? M]LCK[HN]P[LHAIE][VI][QA][DEN]K[VIL][AV][LQ]E[VIL][RM][ED][AFV][TVE] Motivo 4 (SEQ ID NO: 76): [LD][VEDK][DN]G[VI][YF][QK][PQ]ESPFKF[TV][SA]F[QNH]AGPRICLGK[DE][FS]A[HY][RL ]QMK[IM][VMF][AS][AM][ATV]L Motivo 5 (SEQ ID NO: 77): R[YF][VI]D[PIV][FML]WK[LI]K[RK][YF][LF]N[IV]GSEAxLK[RK][NS][VI][QK][VI][IV][DN][DES ]FV[MY][KS][LV]I[HNR][KQT][RK][KIR][EA] en donde x puede ser cualquier aminoácido.

Motivo 6 (SEQ ID NO: 78): [SE]F[ASTV][KA][RS][IL][DTN][DEY][DEG]A[IL][SENG]K[ML][HNQ]YL[QH]A[TA][LI][TS]ET LRLYP[AS]VP[VLQ]D[PGNA]K[MIG][CAI][FLD][SE]D De manera adicional y/o alternativa, el polipéptido tipo CYP704 comprende uno o más de los siguientes motivos: Motivo 7 (SEQ ID NO: 79): G[DEHK]GIF; Motivo 8 (SEQ ID NO: 80): [TS][ML][DE][SG][IVFT][FC]x[VIG][GAVI][FL]G; en donde x puede ser cualquier aminoácido, preferentemente, uno de K, T, N, R, H, Q; Motivo 9 (SEQ ID NO: 81 ): [YFST]L[RK]D[IV][VIT]L[NS][FIV].

Como se usan en la presente, las expresiones "tipo CYP704" o "polipéptido tipo CYP704" también pretenden incluir homólogos, como se definen en la presente, del "polipéptido tipo CYP704".

Los motivos 1 a 6 se derivan con el algoritmo MEME (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994.), En cada posición dentro de un motivo MEME, se muestran los residuos que están presentes en el conjunto de incógnitas de secuencias con una frecuencia superior a 0,2. Los residuos entre corchetes representan alternativas.

Con mayor preferencia, el polipéptido tipo CYP704 comprende, en orden creciente de preferencia, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o los 6 motivos. De manera adicional o alternativa, el polipéptido tipo CYP704 comprende 1 , 2 o los 3 motivos 7, 8 y 9.

De manera adicional o alternativa, e homólogo de una proteína tipo CYP704 tiene, en orden creciente de preferencia, al menos 20 %, 21 %, 22 %, 23 %, 24 %, 25 %, 26 %, 27 %, 28 %, 29 %, 30 %, 31 %, 32 %, 33 %, 34 %, 35 %, 36 %, 37 %, 38 %, 39 %, 40 %, 41 %, 42 %, 43 %, 44 %, 45 %, 46 %, 47 %, 48 %, 49 %, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia total con la secuencia de aminoácidos representada por SEQ ID NO: 2, siempre que la proteína homologa comprenda uno o más de los motivos conservados, como se indicó anteriormente. La identidad de secuencia total se determina con un algoritmo de alineamiento global, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Accelrys), preferentemente, con parámetros predeterminados y, preferentemente, con secuencias de proteínas maduras (es decir, sin considerar las señales de secreción o los péptidos de tránsito). En una forma de realización, el nivel de identidad de secuencia se determina mediante la comparación de las secuencias de polipéptidos en la longitud total de la secuencia de SEQ ID NO: 2 o SEQ ID NO: 4. En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando solo se consideren motivos o dominios conservados. Preferentemente, los motivos en un polipéptido tipo CYP704 tienen, en orden creciente de preferencia, al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con uno o más de los motivos representados por SEQ ID NO: 73 a SEQ ID NO: 78 (Motivos 1 a 6), SEQ ID NO: 79 a SEQ ID NO: 81 (Motivos 7 a 9).

En otras palabras, en otra forma de realización, se provee un método en donde dicho polipéptido tipo CYP704 comprende un dominio (o motivo) conservado con al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con el dominio conservado que comienza con el aminoácido Q51 hasta el aminoácido F501 en SEQ ID NO: 2 o con el aminoácido V94 hasta el aminoácido L517 en SEQ ID NO: 4.

Las proteínas DUF 218 son proteínas vegetales. Los miembros de la familia contienen varios residuos de cisteína conservados. En particular, como se define en la presente, un "polipéptido DUF1218" se refiere a cualquier polipéptido que comprende un dominio DUF1218.

En una forma de realización, el dominio DUF1218 comprende o consiste en una secuencia de aminoácidos que tiene, al menos, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia total con el aminoácido representado por SEQ ID NO: 179 y, por ejemplo, consiste en la secuencia de aminoácidos representada por SEQ ID NO: 179.

En un ejemplo, el dominio DUF1218 consiste de una secuencia de aminqácidos que tiene al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia total con un dominio conservado de los aminoácidos 60 a 152 en SEQ ID NO: 88.

En otra forma de realización, el polipéptido DUF1218 comprende al menos un péptido de señal. De manera alternativa o combinada, el polipéptido DUF1218 comprende al menos un dominio transmembranal y, por ejemplo, al menos dos o al menos tres dominios transmembranales.

En aun otra forma de realización preferida, el polipéptido DUF1218 comprende uno o más de los siguientes motivos: (i) Motivo 10: NW[TS][LV]AL[VI][CS]F[VI]VSW[FA]TF[VI]IAFLLLLTGAALNDQ[HR]G [EQ]E (SEQ ID NO: 180), (ii) Motivo 11 : SP[STG][EQ]C[VI]YPRSPAL[AG]LGL[IT][AS]A[DV][AS]LM[IV]A[QH] [ISV]IINrTV][AV][TA]GCICC[KR][RK] (SEQ ID NO: 181), (¡ii) Motivo 12: [YS][YF]CYWKPGVF[AS]G[GA]AVLSLASV[AI]L[GA]IVYY (SEQ ID NO: 182) En otra forma de realización preferida, el polipéptido DUF1218 también comprende uno o más de los siguientes motivos: (i) Motivo 13: CCKRHPVPSDTNWSVALISFIVSW[VAC]TFIIAFLLLLTGAALNDQRG[E Q] ENMY (SEQ ID NO: 183), (ii) Motivo 14: MERK[AV]VWCA[LV]VGFLGVLSAALGFAAE[GA]TRVKVSDVQT[DS] (SEQ ID NO: 184), (iii) Motivo 15: IP[QP]QSSEPVFVHEDTYNR[QR]Q[FQ] (SEQ ID NO: 185) Como se usan en la presente, las expresiones "DUF1218" o "polipéptido DUF1218" también pretenden incluir homólogos, como se definen en la presente, del "polipéptido DUF1218".

Los motivos 10 a 15 se derivan con el algoritmo MEME (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994.), En cada posición dentro de un motivo MEME, se muestran los residuos que están presentes en el conjunto de incógnitas de secuencias con una frecuencia superior a 0,2. Los residuos entre corchetes representan alternativas.

Con mayor preferencia, el polipéptido DUF1218 comprende, en orden creciente de preferencia, al menos 2, al menos 3, al menos 4, al menos 5 o los 6 motivos.

De manera adicional o alternativa, el homólogo de una proteína DUF1218 tiene, en orden creciente de preferencia, al menos 25 %, 26 %, 27 %, 28 %, 29 %, 30 %, 31 %, 32 %, 33 %, 34 %, 35 %, 36 %, 37 %, 38 %, 39 %, 40 %, 41 %, 42 %, 43 %, 44 %, 45 %, 46 %, 47 %, 48 %, 49 %, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia total con la secuencia de aminoácidos representada por SEQ ID NO: 88, siempre que la proteína homologa comprenda uno o más de los motivos conservados, como se indicó anteriormente. La identidad de secuencia total se determina con un algoritmo de alineamiento global, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Accelrys), preferentemente, con parámetros predeterminados y, preferentemente, con secuencias de proteínas maduras (es decir, sin considerar las señales de secreción o los péptidos de tránsito). En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando solo se consideren motivos o dominios conservados. Preferentemente, los motivos en un polipéptido DUF1218 tienen, en orden creciente de preferencia, al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con uno o más de los motivos representados por SEQ ID NO: 180 a SEQ ID NO: 185 (Motivos 10 a 15).

Un "polipéptido tipo translina", como se define en la presente, se refiere a cualquier polipéptido que comprende la secuencia característica GTDFWKLRR (SEQ ID NO: 245). Preferentemente, el polipéptido tipo translina comprende un acceso a InterPro IPR002848 correspondiente al número de acceso a PFAM PF01997 del dominio de translina. En SEQ ID NO: 191 , el dominio de translina está presente desde el aminoácido 72 hasta el aminoácido 272.

Como se usan en la presente, las expresiones "tipo translina" o "polipéptido tipo translina" también pretenden incluir homólogos, como se definen en la presente, del "polipéptido tipo translina".

Preferentemente, el polipéptido tipo translina comprende uno o más de los siguientes motivos: (i) Motivo 16: DLAAV[TV][NED]QY[IM][LAGS][KR]LVKELQGTDFWKLRRAY[ST][PF] G VQ E YVE AAT[ F L][C Y] [KR] FC [R K] [TS] GT (SEQ ID NO: 238), (ii) Motivo 17: [3?][3?][??]?[??][??]?[T3?][??][??]?[??]???[?????[??]??? [VL]VKASRD[IV]TMNSKKVIFQVHR[IM]SK[DN]N[RK] (SEQ ID NO: 239), (iii) Motivo 18: IC[QA]FVRDIYRELTL[LVI]VP[YL]MDD[SN][SN][DE]MK[TK]KM[DE][TV] MLQSV[VM]KIENAC[YF][GS]VHVRG (SEQ ID NO: 240).

Los motivos 16 a 18 se derivan con el algoritmo MEME (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994.), En cada posición dentro de un motivo MEME, se muestran los residuos que están presentes en el conjunto de incógnitas de secuencias con una frecuencia superior a 0,2. Los residuos entre corchetes representan alternativas.

Con mayor preferencia, el polipéptido tipo translina comprende, en orden creciente de preferencia, al menos 2 o los 3 motivos.

De manera adicional o alternativa, el homólogo de una proteína tipo translina tiene, en orden creciente de preferencia, al menos 25 %, 26 %, 27 %, 28 %, 29 %, 30 %, 31 %, 32 %, 33 %, 34 %, 35 %, 36 %, 37 %, 38 %, 39 %, 40 %, 41 %, 42 %, 43 %, 44 %, 45 %, 46 %, 47 %, 48 %, 49 %, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia total con la secuencia de aminoácidos representada por SEQ ID NO: 91 , siempre que la proteína homologa comprenda uno o más de los motivos conservados, como se indicó anteriormente. La identidad de secuencia total se determina con un algoritmo de alineamiento global, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Accelrys), preferentemente, con parámetros predeterminados y, preferentemente, con secuencias de proteínas maduras (es decir, sin considerar las señales de secreción o los péptidos de tránsito).

En una forma de realización, el nivel de identidad de secuencia se determina mediante la comparación de las secuencias de polipéptidos de la longitud total de la secuencia de SEQ ID NO: 191.

En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando solo se consideren motivos o dominios conservados. Preferentemente, los motivos en un polipéptido tipo translina tienen, en orden creciente de preferencia, al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con uno o más de los motivos representados por SEQ ID NO: 180 a SEQ ID NO: 240 (Motivos 16 a 18).

En otras palabras, en otra forma de realización, se provee un método en donde el polipéptido tipo translina comprende un motivo o dominio conservado con al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con uno o más de los dominios conservados desde el aminoácido 114 hasta el aminoácido 163, desde el aminoácido 55 hasta el aminoácido 104 y/o desde el aminoácido 222 hasta el aminoácido 271 en SEQ ID NO: 191.

Como se define en la presente, un "polipéptido tipo ERG28" se refiere a cualquier polipéptido que comprende un dominio Pfam PF03694 (proteína tipo ERG28, InterPro IPR005352). En general, las proteínas del polipéptido tipo ERG28 comprenden 4 dominios transmembranales. Preferentemente, el polipéptido tipo ERG28 también comprende la secuencia característica WTLL[TS]CTL (SEQ ID NO: 296).

En una forma de realización preferida, el polipéptido tipo ERG28 comprende uno o más de los siguientes motivos: Motivo 19 (SEQ ID NO: 297): CTLC[FY]LCA[FL]NL[HE][DN][KR]PLYLAT[IF]LSF[IV]YA[FL]GHFLTE[FY]L[FI]Y[HQ]TM Motivo 20 (SEQ ID NO: 298): VG[ST]LRLASVWFGF[VF][DN]IWALR[LV]AVFS[QK]T[TE]M[TS][ED][VI]HGRTFG[VT]WT Motivo 21 (SEQ ID NO: 299): [IA][KA]NL[S ]TVG[FI]FAGTSI[VI]WMLL[EQ]WN[SA][LH][EQG][QK][PV][RKH] Motivo 22 (SEQ ID NO: 300): [PEK][LA]LG[YW]WL[MI] Como se usan en la presente, las expresiones "tipo ERG28" o "polipéptido tipo ERG28" también pretenden incluir homólogos, como se definen en la presente, del "polipéptido tipo ERG28".

Los motivos 19 a 22 se derivan con el algoritmo MEME (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994.), En cada posición dentro de un motivo MEME, se muestran los residuos que están presentes en el conjunto de incógnitas de secuencias con una frecuencia superior a 0,2. Los residuos entre corchetes representan alternativas.

Con mayor preferencia, el polipéptido tipo ERG28 comprende la secuencia característica y, en orden creciente de preferencia, al menos 1 , al menos 2, al menos 3 o los 4 motivos que se definen en la presente.

De manera adicional o alternativa, el homólogo de una proteína tipo ERG28 tiene, en orden creciente de preferencia, al menos 25 %, 26 %, 27 %, 28 %, 29 %, 30 %, 31 %, 32 %, 33 %, 34 %, 35 %, 36 %, 37 %, 38 %, 39 %, 40 %, 41 %, 42 %, 43 %, 44 %, 45 %, 46 %, 47 %, 48 %, 49 %, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %. 65 %, 66 %. 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia total con la secuencia de aminoácidos representada por SEQ ID NO: 247 o SEQ ID NO: 249, siempre que la proteína homologa comprenda uno o más de los motivos conservados, como se indicó anteriormente. La identidad de secuencia total se determina con un algoritmo de alineamiento global, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Acceírys), preferentemente, con parámetros predeterminados y, preferentemente, con secuencias de proteínas maduras (es decir, sin considerar las señales de secreción o los péptidos de tránsito). En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando solo se consideren motivos o dominios conservados. Preferentemente, los motivos en un polipéptido tipo ERG28 tienen, en orden creciente de preferencia, al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con uno o más de los motivos representados por SEQ ID NO: 180 a SEQ ID NO: 300 (Motivos 19 a 22).

En otras palabras, en otra forma de realización, se provee un método en donde dicho polipéptido tipo ERG28 comprende un dominio (o motivo) conservado con al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con el dominio conservado que comienza con el aminoácido 1 hasta el aminoácido 106 en SEQ ID NO: 247.

Los términos "dominio", "característica" y "motivo" se definen en la sección "definiciones" de la presente.

Con respecto a los polipéptidos tipo CYP704, la secuencia de polipéptidos, cuando se usa en la construcción de un árbol filogenético, tal como el que se publicó en Li et al., Plant Cell, 22:173-190, 2010, preferentemente se agrupa con el grupo de polipéptidos tipo CYP704 que comprende la secuencia de aminoácidos representada por AT2G45510 (SEQ ID NO: 8), en lugar de con cualquier otro grupo.

Además, los polipéptidos tipo CYP704 (al menos en su forma nativa) generalmente tienen actividad de monooxigenasa. Las herramientas y las técnicas para medir la actividad de monooxigenasa son conocidas en el arte, por ejemplo, la v-hidroxilación de ácidos grasos (C16 y C18) es catalizada por CYP704B2 (Dobritsa et al., Plant Physiology 151 , 574-589, 2009).

En una forma de realización de la presente invención, la función de las secuencias de ácidos nucleicos de la invención es conferir información para una proteína que aumenta el rendimiento o los rasgos relacionados con el rendimiento, cuando una secuencia de ácidos nucleicos de la invención se transcribe y traduce en una célula vegetal viva.

Además, los polipéptidos tipo CYP704, cuando se expresan en el arroz de acuerdo con los métodos de la presente invención como se indica en los Ejemplos 8 y 9, producen plantas que tienen rasgos aumentados relacionados con el rendimiento, en particular, mayor rendimiento de semillas.

Con respecto a los polipéptidos DUF1218, la secuencia de polipéptidos, cuando se usa en la construcción de un árbol filogenético, preferentemente se agrupa con el grupo de polipéptidos DUF1218 que comprende las secuencias de aminoácidos representadas por SEQ ID NO: 88, en lugar de con cualquier otro grupo. Como se sabe en el arte, se puede construir un árbol filogenético de polipéptidos DUF1218 mediante el alineamiento de secuencias DUF1218 por medio de MAFFT (Katoh and Toh (2008) - Briefings in Bioinformatics 9:286-298). Se puede calcular un árbol de unión a vecino con Quick-Tree (Howe et al. (2002), Bioinformatics 18(11 ): 1546-7), 100 repeticiones bootstrap. Se puede dibujar un dendrograma con Dendroscope (Huson et al. (2007), BMC Bioinformatics 8(1 ):460). Por lo general, se indican los niveles de confianza luego de 100 repeticiones bootstrap para las principales ramificaciones. La Figura 10 ilustra un árbol filogenético de varios polipéptidos DUF1218 Además, los polipéptidos DUF1218, cuando se expresan en el arroz de acuerdo con los métodos de la presente invención como se indica en los Ejemplos 8 y 9, producen plantas que tienen rasgos aumentados relacionados con el rendimiento, en particular, mayor rendimiento de semillas y, más en particular, uno o más parámetros seleccionados del grupo que comprende mayor peso total de semillas, mayor tasa de llenado y mayor peso de mil granos.

Con respecto a los polipéptidos tipo transllna, la secuencia de polipéptidos, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 13, preferentemente se agrupa con el grupo de polipéptidos tipo translina que comprende la secuencia de aminoácidos representada por SEQ ID NO: 191 , en lugar de con cualquier otro grupo.

Además, los polipéptidos tipo translina, al menos en su forma natural, generalmente tienen actividad de unión a ADN Las herramientas y técnicas para medir la actividad de unión a ADN son conocidas en el arte.

Además, los polipéptidos tipo translina, cuando se expresan en el arroz de acuerdo con los métodos de la presente invención como se indica en los Ejemplos 8 y 9, producen plantas que tienen rasgos aumentados relacionados con el rendimiento, en particular, mayor rendimiento de semillas, más en particular, rendimiento total de semillas (peso total de semillas), tasa de llenado de semillas (tasa de llenado), índice de cosecha y cantidad de semillas (cant. de semillas llenas).

Con respecto a los polipéptidos tipo ERG28, la secuencia de polipéptidos, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 19, preferentemente se agrupa con el grupo de polipéptidos tipo ERG28 que comprende la secuencia de aminoácidos representada por SEQ ID NO: 247, en lugar de con cualquier otro grupo de secuencias que no comprenden el dominio PF03694.

Además, los polipéptidos tipo ERG28 (al menos en su forma nativa) generalmente pueden participar en la unión de esteróles y/o enzimas de esteroides a las membranas del sistema secretor (por ejemplo, el retículo endoplasmático, el aparato de Golgi, las vesículas transportadoras, las vesículas secretoras) y/o en la mediación de interacciones entre estas enzimas. Las herramientas y técnicas para medir la actividad de desmetilación son conocidas en el arte; véase, por ejemplo, Gachotte et al. (Journal of Lipid Research 42: 150-154, 2001 ).

Además, los polipéptidos tipo ERG28, cuando se expresan en el arroz de acuerdo con los métodos de la presente invención como se indica en los Ejemplos 8 y 9, producen plantas que tienen rasgos aumentados relacionados con el rendimiento.

Con respecto a los polipéptidos tipo CYP704, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 1 , que codifica la secuencia de polipéptidos de SEQ ID NO: 2. Sin embargo, la realización de la invención no se encuentra restringida a estas secuencias; los métodos de la invención pueden llevarse a cabo ventajosamente mediante el uso de cualquier ácido nucleico que codifica un tipo CYP704 o polipéptido tipo CYP704, como se definen en la presente, como se muestra para SEQ ID NO: 4, codificado por SEQ ID NO: 3.

En la Tabla A1 de la sección Ejemplos de la presente, se brindan ejemplos de ácidos nucleicos que codifican polipéptidos tipo CYP704. Dichos ácidos nucleicos son útiles en la realización de los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A1 de la sección Ejemplos son secuencias ilustrativas de ortólogos y parálogos del polipéptido tipo CYP704 representado por SEQ ID NO: 2, los términos "ortólogos" y "parálogos" son como se definen en la presente. Otros ortólogos y parálogos se pueden identificar fácilmente mediante la realización de la denominada búsqueda blast recíproca, como se describe en la sección de definiciones; cuando la secuencia incógnita es SEQ ID NO: 1 o SEQ ID NO: 2, el segundo BLAST (retro-BLAST) sería contra secuencias de Populus trichocarpa; en donde la secuencia incógnita es SEQ ID NO: 3 o SEQ ID NO: 4, el segundo BLAST (retro-BLAST) sería contra secuencias de arroz.

La invención también provee ácido nucleicos que codifican tipo CYP704 y polipéptidos tipo CYP704 desconocidos hasta el momento, útiles para conferir mejores rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control.

Con respecto a los polipéptidos DUF1218, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 87, que codifica la secuencia de polipéptidos de SEQ ID NO: 88. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención pueden llevarse a cabo ventajosamente mediante el uso de cualquier ácido 'nucleico que codifica DUF1218 o polipéptido DUF1218, como se definen en la presente.

En la Tabla A2 de la sección Ejemplos de la presente, se brindan ejemplos de ácidos nucleicos que codifican polipéptidos DUF1218. Dichos ácidos nucleicos son útiles en la realización de los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A2 de la sección de Ejemplos son secuencias ilustrativas de ortólogos y parálogos del polipéptido DUF1218 representado por SEQ ID NO: 88, los términos "ortólogos" y "parálogos" son como se definen en la presente. Otros ortólogos y parálogos se pueden identificar fácilmente mediante la realización de la denominada búsqueda blast recíproca, como se describe en la sección de definiciones; cuando la secuencia incógnita es SEQ ID NO: 87 o SEQ ID NO: 88, el segundo BLAST (retro-BLAST) sería contra secuencias de arroz.

La invención también provee ácido nucleicos que codifican DUF1218 y polipéptidos DUF1218 desconocidos hasta el momento, útiles para conferir mejores rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control.

De acuerdo con otra forma de realización de la presente invención, se provee una molécula de ácido nucleico aislada seleccionada de: (i) un ácido nucleico representado por cualquiera de SEQ ID NO: 87 o 97; (ii) el complemento de un ácido nucleico representado por cualquiera de SEQ ID NO: 87 o 97; (iii) un ácido nucleico que codifica un polipéptido DUF1218 que tiene, en orden creciente de preferencia, al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 88 o 98, y de manera adicional o alternativa, que comprende uno o más motivos que tienen, en orden creciente de preferencia, al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con uno o más de los motivos indicados en SEQ ID NO: 179 a SEQ ID NÓ: 185 y, con mayor preferencia, que confieren mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control; (¡v) una molécula de ácido nucleico que se híbrida con una molécula de ácido nucleico de (i) a (iii) en condiciones de hibridación muy rigurosas y, preferentemente, confiere mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control.

De acuerdo con otra forma de realización de la presente invención, también se provee un polipéptido aislado seleccionado de: (i) una secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 88 o 98; (ii) una secuencia de aminoácidos que tiene, en orden creciente de preferencia, al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %. 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos representada por SEQ ID NO: 88 o 98, y de manera adicional o alternativa, que comprende uno o más motivos que tienen, en orden creciente de preferencia, al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con uno o más de los motivos indicados en SEQ ID NO: 179 a SEQ ID NO: 185 y, con mayor preferencia, que confieren mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control; (iii) derivados de cualquiera de las secuencias de aminoácidos indicadas en (i) o (ii) anteriores.

Con respecto a los polipéptidos tipo translina, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 190, que codifica la secuencia de polipéptidos de SEQ ID NO: 191. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención pueden llevarse a cabo ventajosamente mediante el uso de cualquier ácido nucleico que codifica tipo translina o polipéptido tipo translina, como se definen en la presente.

En la Tabla A3 de la sección de Ejemplos de la presente, se brindan ejemplos de ácidos nucleicos que codifican polipéptidos tipo translina. Dichos ácidos nucleicos son útiles en la realización de los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A3 de la sección de Ejemplos son secuencias ilustrativas de ortólogos y parálogos del polipéptido tipo translina representado por SEQ ID NO: 191 ; los términos "ortólogos" y "parálogos" son como se definen en la presente. Otros ortólogos y parálogos se pueden identificar fácilmente mediante la realización de la denominada búsqueda blast recíproca, como se describe en la sección de definiciones; cuando la secuencia incógnita es SEQ ID NO: 190 o SEQ ID NO: 191 , el segundo BLAST (retro-BLAST) sería contra secuencias de álamo.

La invención también provee ácido nucleicos que codifican polipéptídos tipo translina y polipéptídos tipo translina desconocidos hasta el momento, útiles para conferir mejores rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control.

De acuerdo con otra forma de realización de la presente invención, se provee una molécula de ácido nucleico aislada seleccionada de: (i) un ácido nucleico representado por cualquiera de SEQ ID NO: 224 o 232; (¡i) el complemento de un ácido nucleico representado por cualquiera de SEQ ID NO: 224 o 232; (iii) un ácido nucleico que codifica un polipéptido tipo translina que tiene, en orden creciente de preferencia, al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 225 o 233, y de manera adicional o alternativa, que comprende uno o más motivos que tienen, en orden creciente de preferencia, al menos 50 %, 55 %t 60 %¡ 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con uno o más de los motivos indicados en SEQ ID NO: 238 a SEQ ID NO: 240 y, con mayor preferencia, que confieren mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control; (iv) una molécula de ácido nucleico que se híbrida con una molécula de ácido nucleico de (i) a (iii) en condiciones de hibridación muy rigurosas y, preferentemente, confiere mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control.

De acuerdo con otra forma de realización de la presente invención, también se provee un polipéptido aislado seleccionado de: (i) una secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 225 o (ü) una secuencia de aminoácidos que tiene, en orden creciente de preferencia, al menos 37 %, 38 %, 39 %, 40 %, 41 %, 42 %, 43 %, 44 %, 45 %, 46 %, 47 %, 48 %, 49 %, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 225 o 233, y de manera adicional o alternativa, que comprende uno o más motivos que tienen, en orden creciente de preferencia, al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con uno o más de los motivos indicados en SEQ ID NO: 238 a SEQ ID NO: 240 y, con mayor preferencia, que confieren mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control; (iii) derivados de cualquiera de las secuencias de aminoácidos indicadas en (i) o (ii) anteriores.

Con respecto a los polipéptidos tipo ERG28, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 246, que codifica la secuencia de polipéptidos de SEQ ID NO: 247. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención pueden llevarse a cabo ventajosamente mediante el uso de cualquier ácido nucleico que codifica un tipo ERG28 o polipéptido tipo ERG28, como se definen en la presente. En otra forma de realización, la presente invención se practica con la secuencia de ácidos nucleicos representada por SEQ ID NO: 248, que codifica la secuencia de polipéptidos de SEQ ID NO: 249.

En la Tabla A4 de la sección de Ejemplos de la presente, se brindan ejemplos de ácidos nucleicos que codifican polipéptidos tipo ERG28. Dichos ácidos nucleicos son útiles en la realización de los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A4 de la sección de Ejemplos son secuencias ilustrativas de ortólogos y parálogos del polipéptido tipo ERG28 representado por SEQ ID NO: 247, los términos "ortólogos" y "parálogos" son como se definen en la presente. Otros ortólogos y parálogos se pueden identificar fácilmente mediante la realización de la denominada búsqueda blast recíproca, como se describe en la sección de definiciones; cuando la secuencia incógnita es SEQ ID NO: 246 o SEQ ID NO: 247, el segundo BLAST (retro- BLAST) sería contra secuencias de Arabidopsis thaliana. Cuando la secuencia incógnita es SEQ ID NO: 248 o SEQ ID NO: 249, el segundo BLAST (retro-BLAST) sería contra secuencias de Solanum lycopersicum.

Las variantes de ácidos nucleicos también pueden ser útiles para poner en práctica los métodos de la invención. Los ejemplos de dichas variantes incluyen ácidos nucleicos que codifican homólogos y derivados de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a 44 de la sección de Ejemplos; los términos "homólogo" y "derivado" son como se definen en la presente. También son útiles en los métodos de la invención los ácidos nucleicos que codifican homólogos y derivados de ortólogos o parálogos de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos. Los homólogos y derivados útiles en los métodos de la presente invención tienen considerablemente la misma actividad biológica y funcional que la proteína no modificada de la cual derivan. Otras variantes útiles para poner en práctica los métodos de la invención son las variantes en las cuales se optimiza el uso del codón o en las cuales se retiran los sitios blanco de miARN.

¦ Otras variantes de ácidos nucleicos útiles para poner en práctica los métodos de la invención incluyen porciones de ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28, ácidos nucleicos que se hibridan con ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28, variantes de empalme de ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28, variantes alélicás de ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF 218, polipéptidos tipo translina o polipéptidos tipo ERG28 y variantes de ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28 obtenidos por transposición génica. Los términos secuencia de hibridación, variante de empalme, variante alélica y transposición génica son como se describen en la presente.

Los ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28 no necesitan ser ácidos nucleicos de longitud completa, debido a que la realización de los métodos de la invención no depende del uso de secuencias de ácidos nucleicos de longitud completa. De acuerdo con la presente invención, se provee un método para mejorar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una porción de cualquiera de las secuencias de ácidos nucleicos indicadas en las Tablas A1 a A4 de la sección de Ejemplos, o una porción de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos.

Se puede preparar una porción de un ácido nucleico, por ejemplo, realizando una o más eliminaciones en el ácido nucleico. Las porciones se pueden utilizar en forma aislada o se pueden fusionar con otras secuencias codificantes (o no codificantes) a fin de producir, por ejemplo, una proteína que combine varias actividades. Cuando se fusiona con otras secuencias codificantes, el polipéptido resultante producido luego de la traducción puede ser más grande que el previsto para la porción de proteína.

Con respecto a los polipéptidos tipo CYP704, las porciones útiles en los métodos de la invención codifican un polipéptido tipo CYP704, como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A1 de la sección Ejemplos. Preferentemente, la porción es una porción de cualquiera de los ácidos nucleicos indicados en la Tabla A de la sección de Ejemplos, o es una porción de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 de la sección de Ejemplos. Preferentemente, la porción tiene al menos 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900 nucleótidos consecutivos de longitud, en donde los nucleótidos consecutivos son cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 de la sección de Ejemplos, o de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 de la sección de Ejemplos. Con máxima preferencia, la porción es una porción del ácido nucleico de SEQ ID NO: 1 o SEQ ID NO: 3. Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se usa en la construcción de un árbol filogenético, tal como el que se publicó en Li et al., Plant Cell, 22:173-190, 2010, se agrupa con el grupo de polipéptidos tipo CYP704 que comprende la secuencia de aminoácidos representada por AT2G45510 (SEQ ID NO: 8), en lugar de con cualquier otro grupo y/o comprende un dominio P450 (Pfam PF00067) y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72) y/o tiene actividad de monooxigenasa, y/o tiene al menos 20 % de identidad de secuencia con SEQ ID NO: 2 o SEQ ID NO: 4.

Con respecto a los polipéptidos DUF1218, las porciones útiles en los métodos de la invención codifican un polipeptido DUF1218, como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Preferentemente, la porción es una porción de cualquiera de los ácidos nucleicos indicados en la Tabla A2 de la sección Ejemplos, o es una porción de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Preferentemente, la porción tiene al menos 500, 550, 600, 650, 700, 750, 800 nucleótidos consecutivos de longitud, en donde los nucleótidos consecutivos son cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A2 de la sección de Ejemplos, o de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A2 de la sección de Ejemplos. Con máxima preferencia, la porción es una porción del ácido nucleico de SEQ ID NO: 87.

Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que tiene una o más de las siguientes características: - Cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo; - comprende un dominio DUF1218, como se define en la presente, - comprende un o más de los motivos 10 a 15, como se indica en la presente, y - tiene al menos 30 % de identidad de secuencia con SEQ ID NO: 88.

Con respecto a los polipéptidos tipo translina, las porciones útiles en los métodos de la invención codifican un polipéptido tipo translina, como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A3 de la sección de Ejemplos. Preferentemente, la porción es una porción de cualquiera de los ácidos nucleicos indicados en la Tabla A3 de la sección de Ejemplos, o es una porción de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A3 de la sección de Ejemplos. Preferentemente, la porción tiene al menos 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950 nucleótidos consecutivos de longitud, en donde los nucleótidos consecutivos son de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A3 de la sección de Ejemplos, o de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A3 de la sección de Ejemplos. Con máxima preferencia, la porción es una porción del ácido nucleico de SEQ ID NO: 190. Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 13, se agrupa con el grupo de polipéptidos tipo translina que comprende la secuencia de aminoácidos representada por SEQ ID NO: 191 , en lugar de con cualquier otro grupo y/o comprende al menos uno de los motivos 16 a 18 (SEQ ID NO: 238 a 240) y/o tiene actividad biológica de unión a ADN y/o tiene al menos 30,1 % de identidad de secuencia con SEQ ID NO: 191.

Con respecto a los polipéptidos tipo translina, las porciones útiles en los métodos de la invención codifican un polipéptido tipo ERG28, como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A4 de la sección de Ejemplos. Preferentemente, la porción es una porción de cualquiera de los ácidos nucleicos indicados en la Tabla A4 de la sección de Ejemplos, o es una porción de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A4 de la sección de Ejemplos. Preferentemente, la porción tiene al menos 100, 150, 200, 250, 300, 350, 400 nucleótidos consecutivos de longitud, en donde los nucleótidos consecutivos son cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A4 de la sección de Ejemplos, o de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A4 de la sección de Ejemplos. Con máxima preferencia, la porción es una porción del ácido nucleico de SEQ ID NO: 246. Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 19, se agrupa con el grupo de polipéptidos tipo ERG28 que comprende la secuencia de aminoácidos representada por SEQ ID NO: 247, en lugar de con cualquier otro grupo de secuencias que no comprenden el dominio PF03694 y/o que comprende uno o más de los Motivos 19 a 22 y/o que tiene al menos 40 % de identidad de secuencia con SEQ ID NO: 247 o SEQ ID NO: 249.

Otra vanante de ácido nucleico útil en los métodos de la invención es un ácido nucleico capaz de hibridarse, en condiciones de rigurosidad reducida, preferentemente en condiciones de rigurosidad, con un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definen en la presente, o con una porción como se define en la presente.

De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta un ácido nucleico capaz de hibridarse con cualquiera de los ácidos nucleicos indicados en las Tablas A1 a A4 de la sección de Ejemplos, o que comprende, introducir y expresar en una planta un ácido nucleico capaz de hibridarse con un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de ácidos nucleicos indicadas en las Tablas A1 a A4 de la sección de Ejemplos.

Las secuencias de hibridación útiles en los métodos de la invención codifican un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definen en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos. Preferentemente, la secuencia de hibridación es capaz de hibridarse con el complemento de cualquiera de los ácidos nucleicos indicados en las Tablas A1 a A4 de la sección de Ejemplos, o con una porción de cualquiera de estas secuencias, en donde una porción es como se define en la presente, o la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico que codifica un ortólogo o parálogo de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos.

Con respecto a los polipéptidos tipo CYP704, con máxima preferencia, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 1 o con una porción de este. En una forma de realización, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 1 o con una porción de este en condiciones de rigurosidad media o alta, preferentemente, rigurosidad alta, como se define en la presente. En otra forma de realización, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 1 en condiciones rigurosas.

Preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando tiene longitud completa y se usa en la construcción de un árbol filogenético, tal como el que se publicó en Li et al., Plant Cell, 22:173-190, 2010, se agrupa con el grupo de polipéptidos tipo CYP704 que comprende la secuencia de aminoácidos representada por AT2G45510 (SEQ ID NO: 8), en lugar de con cualquier otro grupo y/o comprende un dominio P450 (Pfam PF00067) y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72) y/o tiene actividad de monooxigenasa, y/o tiene al menos 20 % de identidad de secuencia con SEQ ID NO: 2 o SEQ ID NO: 4.

Con respecto a los polipéptidos DUF1218, con máxima preferencia, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 87 o con una porción de este.

Preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que tiene una o más de las siguientes características, - cuando es de longitud completa y se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo; - comprende un dominio DUF1218, como se define en la presente, - comprende un o más de los motivos 10 a 15, como se indica en la presente, y - tiene al menos 30 % de identidad de secuencia con SEQ ID NO: 88.

Con respecto a los polipéptidos tipo translina, con máxima preferencia, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 190 o con una porción de este. En una forma de realización, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 190 o con una porción de este en condiciones de rigurosidad media o alta, preferentemente, rigurosidad alta, como se define en la presente. En otra forma de realización, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 190 en condiciones rigurosas.

Preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando tiene longitud completa y se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 13, se agrupa con el grupo de polipéptidos tipo translina que comprende la secuencia de aminoácidos representada por SEQ ID NO: 191 , en lugar de con cualquier otro grupo y/o comprende al menos uno de los motivos 16 a 18 (SEQ ID NO: 238 a 240) y/o tiene actividad biológica de unión a ADN y/o tiene al menos 30,1 % de identidad de secuencia con SEQ ID NO: 191.

Con respecto a los polipéptidos tipo ERG28, con máxima preferencia, la secuencia de hibridación es capaz de hibridarse con el complemento de un ácido nucleico representado por SEQ ID NO: 246 o con una porción de este.

Preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando tiene longitud completa y se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 19, se agrupa con el grupo de polipéptidos tipo ERG28 que comprende la secuencia de aminoácidos representada por SEQ ID NO: 247, en lugar de con cualquier otro grupo de secuencias que no comprenden el dominio PF03694 y/o que comprende uno o más de los Motivos 19 a 22 y/o que tiene al menos 40 % de identidad de secuencia con SEQ ID NO: 247 o SEQ ID NO: 249.

Otra variante de ácido nucleico útil en los métodos de la invención es una variante de empalme que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definen en la presente; una variante de empalme es como se define en la presente.

De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento y/o alterar el nivel/la composición de esteroides en las plantas, que comprende introducir y expresar en una planta una variante de empalme de cualquiera de las secuencias de ácidos nucleicos indicadas en las Tablas A1 a A4 de la sección de Ejemplos, o una variante de empalme de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos.

Con respecto a los polipéptidos tipo CYP704, las variantes de empalme preferidas son variantes de empalme de un ácido nucleico representado por SEQ ID NO: 1 , o una variante de empalme de un ácido nucleico que codifica un ortólogo o parálogo de SEQ ID NO: 2. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme, cuando se usa en la construcción de un árbol filogenético, tal como el que se publicó en Li et al., Plant Cell, 22:173-190, 2010, se agrupa con el grupo de polipéptidos tipo CYP704 que comprende la secuencia de aminoácidos representada por AT2G45510 (SEQ ID NO: 8), en lugar de con cualquier otro grupo y/o comprende un dominio P450 (Pfam PF00067) y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72) y/o tiene actividad de monooxigenasa, y/o tiene al menos 20 % de identidad de secuencia con SEQ ID NO: 2 o SEQ ID NO: 4.

Con respecto a los polipéptidos DUF1218, las variantes de empalme preferidas son variantes de empalme de un ácido nucleico representado por SEQ ID NO: 87, o una variante de empalme de un ácido nucleico que codifica un ortólogo o paráiogo de SEQ ID NO: 88. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme tiene una o más de las siguientes características: cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo; comprende un dominio DUF1218, como se define en la presente, comprende un o más de los motivos 10 a 15, como se indica en la presente, y tiene al menos 30 % de identidad de secuencia con SEQ ID NO: 88.

Con respecto a los polipéptidos tipo translina, las variantes de empalme preferidas son variantes de empalme de un ácido nucleico representado por SEQ ID NO: 190, o una variante de empalme de un ácido nucleico que codifica un ortólogo o paráiogo de SEQ ID NO: 191. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 13, se agrupa con el grupo de polipéptidos tipo translina que comprende la secuencia de aminoácidos representada por SEQ ID NO: 191 , en lugar de con cualquier otro grupo y/o comprende al menos uno de los motivos 16 a 18 (SEQ ID NO: 238 a 240) y/o tiene actividad biológica de unión a ADN y/o tiene al menos 30,1 % de identidad de secuencia con SEQ ID NO: 191.

Con respecto a los polipéptidos tipo ERG28, las variantes de empalme preferidas son variantes de empalme de un ácido nucleico representado por SEQ ID NO: 246, o una variante de empalme de un ácido nucleico que codifica un ortólogo o paráiogo de SEQ ID NO: 247. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 19, se agrupa con el grupo de polipéptidos tipo ERG28 que comprende la secuencia de aminoácidos representada por SEQ ID NO: 247, en lugar de con cualquier otro grupo de secuencias que no comprenden el dominio PF03694 y/o que comprende uno o más de los Motivos 19 a 22 y/o que tiene al menos 40 % de identidad de secuencia con SEQ ID NO: 247 o SEQ ID NO: 249.

Otra variante de ácido nucleico útil para realizar los métodos de la invención es una variante alélica de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definieron anteriormente; una variante de empalme es como se define en la presente.

De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento y/o alterar el nivel/la composición de esteroides en las plantas, que comprende introducir y expresar en una planta una variante alélica de cualquiera de los ácidos nucleicos indicados en las Tablas A1 a A4 de la sección de Ejemplos, o que comprende introducir y expresar en una planta una variante alélica de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos.

Con respecto a los polipéptidos tipo CYP704, los polipéptidos codificados por las variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido tipo CYP704 de SEQ ID NO: 2 y cualquiera de las secuencias de aminoácidos representadas en la Tabla A1 de la sección de Ejemplos. Las variantes alélicas existen en la naturaleza, y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 1 , o una variante alélica de un ácido nucleico que codifica un ortólogo o parálogo de SEQ ID NO: 2. Preferentemente, la secuencia de aminoácidos codificada por la variante alélica, cuando se usa en la construcción de un árbol filogenético, tal como el que se publicó en Li et al., Plant Cell, 22:173-190, 2010, se agrupa con el grupo de polipéptidos tipo CYP704 que comprende la secuencia de aminoácidos representada por AT2G45510 (SEQ ID NO: 8), en lugar de con cualquier otro grupo y/o comprende un dominio P450 (Pfam PF00067) y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72) y/o tiene actividad de monooxigenasa, y/o tiene al menos 20 % de identidad de secuencia con SEQ ID NO: 2 o SEQ ID NO: 4.

Con respecto a los polipéptidos DUF1218, los polipéptidos codificados por las variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido DUF1218 de SEQ ID NO: 88 y cualquiera de las secuencias de aminoácidos representadas en la Tabla A1 de la sección de Ejemplos. Las variantes alélicas existen en la naturaleza, y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 87, o una variante alélica de un ácido nucleico que codifica un ortólogo o parálogo de SEQ ID NO: 88. Preferentemente, la secuencia de aminoácidos codificada por la variante alélica tiene una o más de las siguientes características: cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo; - comprende un dominio DUF1218, como se define en la presente, comprende un o más de los motivos 10 a 15, como se indica en la presente, y tiene al menos 30 % de identidad de secuencia con SEQ ID NO: 88.

Con respecto a los polipéptidos tipo translina, los polipéptidos codificados por las variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido tipo translina de SEQ ID NO: 191 y cualquiera de las secuencias de aminoácidos representadas en la Tabla A3 de la sección de Ejemplos. Las variantes alélicas existen en la naturaleza, y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 190, o una variante alélica de un ácido nucleico que codifica un ortólogo o parálogo de SEQ ID NO: 191. Preferentemente, la secuencia de aminoácidos codificada por la variante alélica, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 7, se agrupa con los polipéptidos tipo translina que comprenden la secuencia de aminoácidos representada por SEQ ID NO: 191 , en lugar de con cualquier otro grupo y/o comprende al menos uno de los motivos 16 a 18 (SEQ ID NO: 238 a 240) y/o tiene actividad biológica de unión a ADN y/o tiene al menos 30,1 % de identidad de secuencia con SEQ ID NO: 191.

Con respecto a los polipéptidos tipo ERG28, los polipéptidos codificados por las variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido tipo ERG28 de SEQ ID NO: 247 y cualquiera de las secuencias de aminoácidos representadas en la Tabla A4 de la sección de Ejemplos. Las variantes alélicas existen en la naturaleza, y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 246, o una variante alélica de un ácido nucleico que codifica un ortólogo o parálogo de SEQ ID NO: 247. Preferentemente, la secuencia de aminoácidos codificada por la variante alélica, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 19, se agrupa con el grupo de polipéptidos tipo ERG28 que comprende la secuencia de aminoácidos representada por SEQ ID NO: 247, en lugar de con cualquier otro grupo de secuencias que no comprenden el dominio PF03694 y/o que comprende uno o más de los Motivos 19 a 22 y/o que tiene al menos 40 % de identidad de secuencia con SEQ ID NO: 247 o SEQ ID NO: 249.

También se puede usar transposición génica o evolución dirigida para generar variantes de ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF12 8, polipéptidos tipo translina o polipéptidos tipo ERG28, como se definieron anteriormente; la expresión "transposición génica" es como se define en la presente.

De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante de cualquiera de las secuencias de ácidos nucleicos indicadas en las Tablas A1 a A4 de la sección de Ejemplos, o que comprende introducir y expresar en una planta una variante de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en las Tablas A1 a A4 de la sección de Ejemplos, en donde la variante de ácido nucleico se obtiene mediante transposición génica.

Con respecto a los polipéptidos tipo CYP704, la secuencia de aminoácidos codificada por la variante de ácido nucleico que se obtiene por transposición génica, cuando se usa en la construcción de un árbol filogenético, tal como el que se publicó én Li et al., Plant Cell, 22:173-190, 2010, preferentemente se agrupa con el grupo de polipéptidos tipo CYP704 que comprende la secuencia de aminoácidos representada por AT2G45510 (SEQ ID NO: 8), en lugar de con cualquier otro grupo y/o comprendé un dominio P450 (Pfam PF00067) y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72) y/o tiene actividad de monooxigenasa, y/o tiene al menos 20 % de identidad de secuencia con SEQ ID NO: 2 o SEQ ID NO: 4.

Con respecto a los polipéptidos DUF1218, la secuencia de aminoácidos codificada por la variante de ácido nucleico que se obtiene por transposición génica, preferentemente tiene una o más de las siguientes características: - cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo; - comprende un dominio DUF1218, como se define en la presente, - comprende un o más de los motivos 10 a 15, como se indica en la presente, y - tiene al menos 30 % de identidad de secuencia con SEQ ID NO: 88.

Con respecto a los polipéptidos tipo translina, la secuencia de aminoácidos codificada por la variante de ácido nucleico que se obtiene por transposición génica, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 13, preferentemente se agrupa con el grupo de polipéptidos tipo translina que comprende la secuencia de aminoácidos representada por SEQ ID NO: 191 , en lugar de con cualquier otro grupo y/o comprende al menos uno de los motivos 16 a 18 (SEQ ID NO: 238 a 240) y/o tiene actividad biológica de unión a ADN y/o tiene al menos 30,1 % de identidad de secuencia con SEQ ID NO: 191.

Con respecto a los polipéptidos tipo EGR28, la secuencia de aminoácidos codificada por la variante de ácido nucleico que se obtiene por transposición génica, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 19, preferentemente se agrupa con el grupo de polipéptidos tipo ERG28 que comprende la secuencia de aminoácidos representada por SEQ ID NO: 247, en lugar de con cualquier otro grupo de secuencias que no comprenden el dominio PF03694 y/o que comprende uno o más de los Motivos 19 a 22 y/o que tiene al menos 40 % de identidad de secuencia con SEQ ID NO: 247 o SEQ ID NO: 249.

Además, las variantes de ácidos nucleicos también se pueden obtener mediante mutagénesis dirigida a sitio. Hay varios métodos disponibles para lograr la mutagénesis dirigida a sitio, en donde los más comunes son los métodos basados en PCR (Current Protocols in Molecular Biology. Wiley Eds.).

Se pueden usar polipéptidos tipo CYP704 que difieren de la secuencia de SEQ ID NO: 2 o SEQ ID NO: 4 por uno o varios aminoácidos para aumentar el rendimiento de las plantas en los métodos, constructos y plantas de la invención. La sustitución de uno o más aminoácidos en una proteína se puede realizar mediante técnicas estándares conocidas por el experto en el arte.

Los ácidos nucleicos que codifican polipéptidos tipo CYP704 pueden derivar de cualquier fuente natural o artificial. El ácido nucleico se puede modificar de su forma nativa en composición y/o ambiente genómico mediante manipulación humana deliberada. Preferentemente, el ácido nucleico que codifica el polipéptido tipo CYP704 es de una planta, preferentemente, de una planta monocotiledónea, con mayor preferencia, de la familia Poaceae, con máxima preferencia, de Oryza sativa. En otra forma de realización, el ácido nucleico que codifica el polipéptido tipo CYP704 es de una planta dicotiledónea, preferentemente, de la familia Salicaceae, con mayor preferencia, de la Populus trichocarpa.

Los ácidos nucleicos que codifican polipéptidos DUF1218 pueden derivar de cualquier fuente natural o artificial. El ácido nucleico se puede modificar de su forma nativa en composición y/o ambiente genómico mediante manipulación humana deliberada. Preferentemente, el ácido nucleico que codifica el polipéptido DUF1218 es de una planta, preferentemente, de una planta monocotiledónea, con mayor preferencia, de la familia Poaceae, con mayor preferencia, del género Oryza, con máxima preferencia, de Oryza sativa.

Los ácidos nucleicos que codifican polipéptidos tipo translina pueden derivar de cualquier fuente natural o artificial. El ácido nucleico se puede modificar de su forma nativa en composición y/o ambiente genómico mediante manipulación humana deliberada. Preferentemente, el ácido nucleico que codifica el polipéptido tipo translina es de una planta, preferentemente, de una planta dicotiledónea, con mayor preferencia, de la familia Salicaceae, con máxima preferencia, de Populus trichocarpa.

Los ácidos nucleicos que codifican polipéptidos tipo ERG28 pueden derivar de cualquier fuente natural o artificial. El ácido nucleico se puede modificar de su forma nativa en composición y/o entorno genómico mediante manipulación humana deliberada, que incluye, entre otros, proteínas tipo ERG28 híbridas que comprenden partes de dos o más de otras proteínas tipo ERG28 o proteínas de fusión sintéticas de una proteína tipo ERG28 con dominios de otras proteínas. Preferentemente, el ácido nucleico que codifica el polipéptido tipo ERG28 es (o deriva de) levadura o de una planta, preferentemente, de una planta dicotiledónea, con mayor preferencia, de la familia Brassicaceae, con máxima preferencia, de Arabidopsis thaliana. En otra forma de realización, el ácido nucleico que codifica el polipéptido tipo ERG28 es de la familia Solanaceae, con máxima preferencia, de Solanum lycopersicum.

Con respecto a los polipéptidos tipo ERG28, el término "esferoide", como se usa en la presente, abarca "esteróles" y se usa de manera indistinta en la presente. Los esteroides forman un grupo de compuestos sobre la base del hidrocarburo tetracíclico saturado: 1 ,2-ciclopentanoperhidrofenantreno, que puede tener sustituciones en C10 y C13 mediante grupos de metilo y puede tener cetona, hidroxilo, alquilo u otras cadenas laterales en C17. Las moléculas de esteroides se pueden dividir en varios grupos, por ejemplo, esteróles, brasinoesteroides, bufadienolidos, cardenolidos, cucurbitacinas, ecdiesteroides, sapogeninas, alcaloides esteroides, withaesteroides, ácido biliar, esteroides hormonales.

Los fitoesteroles se sintetizan mediante la vía del mevalonato de la formación de terpenoides. Los esteroides vegetales se derivan de esteróles y comprenden las hormonas de esteroides vegetales brasinoesteroides. Se ha demostrado que los esteroides y esteróles vegetales cumplen una función esencial en la regulación de muchos procesos de crecimiento y desarrollo vegetal. Se sabe que las alteraciones en los niveles de esteróles afectan la embriogénesis, la elongación celular y la diferenciación vascular (Clouse, Plant Cell 14: 1995-2000, 2002 y las referencias allí citadas), Cabe destacar que, en términos de aplicaciones agronómicas, los esteróles también participan en la resistencia de las plantas a los patógenos. Por ejemplo, la aplicación exógena de ergosterol, el principal esterol de la mayoría de los hongos, promueve la expresión de varios genes de defensa y conduce a una mayor tolerancia de los patógenos fúngicos en las plantas (Laquitaine et al, Molecular Plant-Microbe Interactions 19: 1103-1 1 12, 2006; Lochman et al, Plant Molecular Biology 62: 43-51 , 2006). Sin embargo, aún no se ha clarificado si los cambios en la composición y/o los niveles de esteróles también confieren mayor tolerancia a diversos tipos de estrés abiótico en las plantas. Finalmente, los datos sugieren que las alteraciones en la composición de los esteróles en las plantas pueden generar modificaciones en la calidad nutricional de las plantas. Por ejemplo, la sobreexpresion del gen GmSMTI en las plantas de papas conduce a la reducción de los niveles de colesterol y glicoalcaloides (TGA) (Arnqvist et al, Plant Physiology 131 : 1792- 1799, 2003). Además, también se cree que los esteróles vegetales tienen efectos benéficos en la salud de los seres humanos (un consumo relativamente alo de fitoesteroles tiende a mejorar la función inmunitaria y a reducir el nivel de colesterol en los seres humanos; Piironen et al, Journal of the Science of Food and Agriculture 80: 939-966, 2000). Por lo tanto, sería beneficioso poder manipular la composición de esteroides de una planta y/o aumentar o disminuir los niveles de esteroides en una planta. De manera sorprendente, ahora se ha descubierto que, en una forma de realización, modular la expresión de proteínas tipo ERG28 en una planta da como resultado una alteración de la composición de esteróles y/o esteroides, y/o una modificación de los niveles de esteróles y/o esteroides en una planta. De manera sorprendente, en una segunda forma de realización, ahora se ha descubierto que modular la expresión proteínas tipo ERG28 en levadura da como resultado un mayor crecimiento y/o reproducción de la levadura, en comparación con la levadura tipo silvestre. La invención también provee el uso de proteínas tipo ERG28 para mejorar el crecimiento y/o la reproducción de la levadura en condiciones de crecimiento normal y/o de estrés.

En una tercera forma de realización, modular la expresión (aumentar o disminuir la expresión) de las proteínas tipo ERG28 en una planta da como resultado mejores rasgos relacionados con el rendimiento. En particular, disminuir la expresión de proteínas tipo ERG28 da como resultado un mayor rendimiento de las semillas y raíces hinchadas y más cortas con mayor densidad de las vellosidades radiculares, en comparación con las plantas de tipo silvestre que se describen y ejemplifican en el Ejemplo 14 de la presente.

En una forma de realización, la presente invención se extiende a ADN cromosómico recombinante que comprende una secuencia de ácidos nucleicos útil en los métodos de la invención, en donde dicho ácido nucleico está presente en el ADN cromosómico como resultado de métodos recombinantes, es decir, dicho ácido nucleico no se encuentra en el ADN cromosómico en su entorno natural. Dicho ADN cromosómico recombinante puede ser un cromosoma de origen natural, en donde dicho ácido nucleico se inserta por medios recombinantes, o puede ser un minicromosoma o una estructura cromosómica no natural, por ejemplo, un cromosoma artificial. La naturaleza del ADN cromosómico puede variar, siempre que el pasaje estable en las sucesivas generaciones del ácido nucleico recombinante útil en los métodos de la invención, y permita la expresión de dicho ácido nucleico en una célula vegetal viva, que genera mayor rendimiento o rasgos aumentados relacionados con el rendimiento de la célula vegetal o planta que comprende la célula vegetal. En otra forma de realización, el ADN cromosómico recombinante de la invención está comprendido en una célula vegetal.

La realización de los métodos de la invención genera plantas que tienen mejores rasgos relacionados con el rendimiento. En particular, la realización de los métodos de la invención genera plantas que tienen mayor rendimiento, en especial mayor rendimiento de semillas en relación con las plantas de control. Las expresiones "rendimiento" y "rendimiento de semilla" se describen en mayor detalle en la sección "definiciones" de la presente.

La referencia en la presente a mejores rasgos relacionados con el rendimiento significa un aumento del vigor temprano y/o de biomasa (peso) de una o más partes de una planta, que pueden incluir i) partes aéreas y, preferentemente, partes aéreas cosechables y/o (¡i) partes subterráneas y, preferentemente, subterráneas cosechables. En particular, dichas partes cosechables son semillas y la realización de los métodos de la invención da como resultado plantas que tienen mayor rendimiento de semillas con respecto al rendimiento de semillas de las plantas de control.

La presente invención provee un método para aumentar el rendimiento de las plantas, en especial, el rendimiento de semillas de las plantas, con respecto a las plantas de control, en donde el método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, como se define en la presente.

La presente invención también provee un método para aumentar los rasgos relacionados con el rendimiento, en particular el rendimiento, en especial el rendimiento de semillas de las plantas, con respecto a las plantas de control, en donde el método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido DUF1218, como se define en la presente.

La presente invención también provee un método para aumentar el rendimiento, en especial, el índice de cosecha y/o el rendimiento de semillas de las plantas, con respecto a las plantas de control, en donde el método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo translina, como se define en la presente.

La presente invención también provee un método para aumentar los rasgos relacionados con el rendimiento y/o alterar (aumentar o disminuir) el nivel/composición de esteroides, en especial, el rendimiento de las plantas, con respecto a las plantas de control, en donde el método comprende modular la expresión (aumentar o disminuir la expresión) en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28, como se define en la presente.

De acuerdo con una característica preferida de la presente invención, la realización de los métodos de la invención genera plantas que tienen una mayor tasa de crecimiento con respecto a las plantas de control. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar la tasa de crecimiento de las plantas, cuyo método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definen en la presente.

La realización de los métodos de la invención brinda a las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve aumento del rendimiento y/o alteración (aumento o disminución) del nivel/composición de esferoides, con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento y/o alterar (aumentar o disminuir) el nivel/composición de esteroides en las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve, cuyo método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28.

La realización de los métodos de la invención brinda a las plantas cultivadas en condiciones de sequía aumento del rendimiento y/o alteración (aumento o disminución) del nivel/composición de esteroides, con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento y/o alterar (aumentar o disminuir) el nivel/composición de esteroides en las plantas cultivadas en condiciones de sequía, cuyo método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28.

La realización de los métodos de la invención brinda a las plantas cultivadas en condiciones de deficiencia de nutrientes, en particular, en condiciones de deficiencia de nitrógeno, aumento del rendimiento y/o alteración (aumento o disminución) del nivel/composición de esteroides, con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento y/o alterar (aumentar o disminuir) el nivel/composición de esteroides en las plantas cultivadas en condiciones de deficiencia de nutrientes, cuyo método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28.

La realización de los métodos de la invención brinda a las plantas cultivadas en condiciones de estrés salino aumento del rendimiento y/o alteración (aumento o disminución) del nivel/composición de esteroides, con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento y/o alterar (aumentar o disminuir) el nivel/composición de esteroides en las plantas cultivadas en condiciones de estrés salino, cuyo método comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28.

La invención también provee constructos genéticos y vectores para facilitar la introducción y/o expresión en plantas de ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28. Los constructos génicos se pueden insertar en vectores, que pueden estar disponibles en el comercio, adecuados para la transformación en plantas y para la expresión del gen de interés en las células trasformadas. La invención también provee el uso de un constructo génico, como se define en la presente en los métodos de la invención.

Más específicamente, la presente invención provee un constructo. que comprende: (a) un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definieron anteriormente; (b) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (c) una secuencia de terminación de la transcripción.

Preferentemente, el ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28 es como se definió anteriormente. Las expresiones "secuencia de control" y "secuencia de terminación" son como se definen en la presente.

El constructo genético de la invención puede estar comprendido en una célula huésped, célula vegetal, semilla, producto agrícola o planta. Las plantas o las células huésped se transforman con un constructo genético, tal como un vector o un cásete de expresión, que comprende cualquiera de los ácidos nucleicos descritos anteriormente. Por ello, la invención también provee plantas o células vegetales transformadas con un constructo como se describió anteriormente. En particular, la invención provee plantas transformadas con un constructo como se definió anteriormente, cuyas plantas tienen rasgos aumentados relacionados con el rendimiento y/o alteración (aumento o disminución) del nivel/composición de esteroides, como se describe en la presente.

Las plantas se transforman con un vector que comprende cualquiera de los ácidos nucleicos descritos anteriormente. El experto en el arte conoce los elementos genéticos que deben estar presentes en el vector a fin de transformar, seleccionar y propagar exitosamente las células huésped que contienen la secuencia de interés. La secuencia de interés se liga operativamente a una o más secuencias de control, al menos a un promotor, en los vectores de la invención.

El promotor en dicho cásete de expresión puede ser un promotor no natural para el ácido nucleico antes descrito, es decir, un promotor que no regula la expresión de dicho ácido nucleico en su entorno natural. En otra forma de realización, los casetes de expresión de la invención confieren mayor rendimiento o rasgos relacionados con el rendimiento a una célula vegetal viva, cuando se introdujeron en dicha célula vegetal y dan como resultado la expresión del ácido nucleico antes definido, comprendido en los casetes de expresión.

De forma ventajosa, se puede utilizar cualquier tipo de promotor, ya sea natural o sintético, para dirigir la expresión de la secuencia de ácidos nucleicos, pero preferentemente, el promotor es de origen vegetal. Un promotor constitutivo es particularmente útil en los métodos. Preferentemente, el promotor constitutivo es un promotor constitutivo ubicuo de intensidad media. Véase la sección "Definiciones'' de la presente para obtener las definiciones de los diversos tipos de promotores.

Preferentemente, el promotor constitutivo es un promotor de intensidad media. Con mayor preferencia, es un promotor derivado de plantas, por ejemplo, un promotor de origen crornosómico vegetal, tal como un promotor GOS2 o un promotor que tiene sustancialmente la misma intensidad y el mismo patrón de expresión (un promotor funcionalmente equivalente), con mayor preferencia, el promotor es el promotor GOS2 del arroz. Con mayor preferencia, el promotor constitutivo es representado por una secuencia de ácidos nucleicos sustancialmente similar a SEQ ID NO: 83 o SEQ ID NO: 186 o SEQ ID NO: 242 o SEQ ID NO: 301 , con máxima preferencia, el promotor constitutivo es representado por SEQ ID NO: 83 o SEQ ID NO: 186 o SEQ ID NO: 242 o SEQ ID NO: 301. Véase la sección "Definiciones" de la presente para obtener más ejemplos de promotores constitutivos.

Con respecto a los polipéptidos tipo ERG28, en una forma de realización particular con Arabidopsis thaliana como planta huésped, se puede usar el promotor CaMV35S como promotor constitutivo.

Con respecto a los polipéptidos tipo CYP704, debe quedar claro que la aplicabilidad de la presente invención no se restringe al ácido nucleico que codifica el polipéptido tipo CYP704 representado por SEQ ID NO: 1 , ni a la expresión de un ácido nucleico que codifica un polipéptido tipo CYP704 cuando es dirigido por un promotor constitutivo o cuando es dirigido por un promotor específico de raíz.

Con respecto a los polipéptidos DUF1218, debe quedar claro que la aplicabilidad de la presente invención no se restringe al ácido nucleico que codifica el polipéptido DUF1218 representado por SEQ ID NO: 87, ni a la expresión de un ácido nucleico que codifica un polipéptido DUF1218 cuando es dirigido por un promotor constitutivo.

Con respecto a los polipéptidos tipo translina, debe quedar claro que la aplicabilidad de la presente invención no se restringe al ácido nucleico que codifica el polipéptido tipo translina representado por SEQ ID NO: 190, ni a la expresión de un ácido nucleico que codifica un polipéptido tipo translina cuando es dirigido por un promotor constitutivo.

Con respecto a los polipéptidos tipo ERG28, debe quedar claro que la aplicabilidad de la presente invención no se restringe al ácido nucleico que codifica el polipéptido tipo ERG28 representado por SEQ ID NO: 246 o SEQ ID NO: 247, ni a la expresión de un ácido nucleico que codifica un polipéptido tipo ERG28 cuando es dirigido por un promotor constitutivo.

Con respecto a los polipéptidos tipo CYP704, opcionalmente, se pueden utilizar una o más secuencias terminadoras en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende un promotor GOS2, sustancialmente similar a SEQ ID NO: 83, que se liga operativamente al ácido nucleico que codifica el polipéptido tipo CYP704. Con mayor preferencia, el constructo comprende un terminador de zeína (t-zeína) ligado al extremo 3' de la secuencia codificante de tipo CYP704. Además, puede haber una o más secuencias que codifican marcadores seleccionabas en el constructo introducido en una planta.

Con respecto a los polipéptidos DUF1218, opcionalmente, se pueden utilizar una o más secuencias terminadoras en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende un promotor GOS2, sustancialmente similar a SEQ ID NO: 186, que se liga operativamente al ácido nucleico que codifica el polipéptido DUF1218. Con mayor preferencia, el constructo comprende un terminador de zeína (t-zeína) ligado al extremo 3' de la secuencia codificante de DUF1218. Con máxima preferencia, el cásete de expresión comprende una secuencia que tiene, en orden creciente de preferencia, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99 % de identidad con la secuencia representada por SEQ ID NO: 187 (pGOS2::DUF1218::secuencia de t-zeína). Además, puede haber una o más secuencias que codifican marcadores seleccionares en el constructo introducido en una planta.

Con respecto a los polipéptidos tipo translina, opcionalmente, se pueden utilizar una o más secuencias terminadoras en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende un promotor GOS2, sustancialmente similar a SEQ ID NO: 242, que se liga operativamente al ácido nucleico que codifica el polipéptido tipo translina. Con mayor preferencia, el constructo comprende un terminador de zeína (t-zeína) ligado al extremo 3' de la secuencia codificante de tipo translina. Con máxima preferencia, el cásete de expresión comprende una secuencia que tiene, en orden creciente de preferencia, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99 % de identidad con la secuencia representada por SEQ ID NO: 241 (pPRO::gen tipo translina::secuenciá de t-zeína). Además, puede haber una o más secuencias que codifican marcadores seleccionares en el constructo introducido en una planta.

Con respecto a los polipéptidos tipo ERG28, opcionalmente, se pueden utilizar una o más secuencias terminadoras en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende un promotor GOS2, sustancialmente similar a SEQ ID NO: 301 , que se liga operativamente al ácido nucleico que codifica el polipéptido tipo ERG28. Con mayor preferencia, el constructo comprende un terminador de zeína (t-zeína) ligado al extremo 3' de la secuencia codificante de tipo ERG28. Además, puede haber una o más secuencias que codifican marcadores seleccionares en el constructo introducido en una planta.

De acuerdo con una característica preferida de la invención, la expresión modulada es mayor expresión. Los métodos para aumentar la expresión (o sobreexpresión) de ácidos nucleicos o genes, o productos génicos, están documentados en el arte, y se proporcionan ejemplos en la sección de definiciones.

De acuerdo con otra característica preferida de la invención, la expresión modulada es menor expresión. Los métodos para disminuir la expresión de ácidos nucleicos o genes, o productos génicos, son conocidos por los expertos y están documentados en el arte. En una forma de realización particular, la inserción de T-ADN se usa para disminuir la expresión de un gen/ácido nucleico tipo ERG28. Los métodos alternativos para disminuir la expresión se describen en la sección de Definiciones de la presente.

Como se mencionó anteriormente, un método preferido para modular la expresión de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28 es mediante la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28; sin embargo, los efectos de realizar el método, es decir, mejorar los rasgos relacionados con el rendimiento, también se pueden lograr mediante otras técnicas conocidas, que incluyen, entre otras, rotulado por activación de T-ADN, TILLING, recombinación homologa. En la sección de definiciones se provee una descripción de estas técnicas.

La invención también provee un método para la producción de plantas transgénicas que tienen mejores rasgos relacionados con el rendimiento y/o alteración del nivel/composición de esteroides, con respecto a las plantas de control, que comprende la introducción y expresión en una planta de cualquier ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definieron con anterioridad.

Más específicamente, la presente invención provee un método para la producción de plantas transgénicas que tienen mejores rasgos relacionados con el rendimiento, en particular, mayor rendimiento (de semillas), cuyo método comprende: (i) introducir y expresar en una planta o célula vegetal un ácido nucleico que codifica un polipéptido tipo CYP704 o un constructo genético que comprende un ácido nucleico que codifica un polipéptido tipo CYP704; y (ii) cultivar la célula vegetal en condiciones que promuevan el desarrollo y el crecimiento de la planta.

Cultivar la célula de planta en condiciones que promuevan el desarrollo y crecimiento de la planta, puede o no incluir la regeneración y o crecimiento hasta la madurez.

Más específicamente, la presente invención provee un método para la producción de plantas transgénicas que tienen mejores rasgos relacionados con el rendimiento, en particular, mayor rendimiento y, en particular, mayor rendimiento de semillas, en donde el método comprende: (i) introducir y expresar en una planta o célula vegetal un ácido nucleico que codifica un polipéptido DUF1218 o un constructo genético que comprende un ácido nucleico que codifica un polipéptido DUF1218; y (ii) cultivar la célula vegetal en condiciones que promuevan el desarrollo y el crecimiento de la planta.

Más específicamente, la presente invención provee un método para la producción de plantas transgénicas que tienen mejores rasgos relacionados con el rendimiento, en particular, mayor rendimiento de semillas y/o mayor índice de cosecha, en donde el método comprende: (i) introducir y expresar en una planta o célula vegetal un ácido nucleico que codifica un polipéptido tipo translina o un constructo genético que comprende un ácido nucleico que codifica un polipéptido tipo translina; y (ii) cultivar la célula vegetal en condiciones que promuevan el desarrollo y el crecimiento de la planta.

Más específicamente, la presente invención provee un método para la producción de plantas transgénicas que tienen mejores rasgos relacionados con el rendimiento y/o alteración del nivel/composición de esteroides, en particular, mayor rendimiento (de semillas), cuyo método comprende: (i) introducir y expresar en una planta o célula vegetal un ácido nucleico que codifica un polipéptido tipo ERG28 o un constructo genético que comprende un ácido nucleico que codifica un polipéptido tipo ERG28; y (ii) cultivar la célula vegetal en condiciones que promuevan el desarrollo y el crecimiento de la planta.

Cultivar la célula vegetal en condiciones que promuevan el desarrollo y crecimiento de la planta, puede o no incluir la regeneración y/o el crecimiento hasta la madurez. En consecuencia, en una forma de realización particular de la invención, la célula vegetal transformada con el método de acuerdo con la invención se puede regenerar en una planta transformada. En otra forma de realización particular, la célula vegetal transformada con el método de acuerdo con la invención no se puede regenerar en una planta transformada, es decir, células que no son capaces de regenerarse en una planta mediante el uso de técnicas de cultivo celular conocidas en el arte. Si bien las células vegetales generalmente tienen la característica de totipotencia, algunas células vegetales no se pueden usar para regenerar o propagar plantas intactas de dichas células. En una forma de realización de la invención, las células vegetales de la invención son dichas células. En otra forma de realización, las células vegetales de la invención son células vegetales que no se alimentan a sí mismas en una vía autótrofa.

El ácido nucleico se puede introducir directamente en una célula vegetal o en la planta misma (incluso introducirlo en un tejido, órgano o cualquier otra parte de una planta). De acuerdo con una característica preferida de la presente invención, el ácido nucleico se introduce, preferentemente, en una planta o célula vegetal mediante transformación. La expresión "transformación" se describe en mayor detalle en la sección "definiciones" de la presente.

En una forma de realización, la presente invención se extiende claramente a cualquier célula vegetal o planta producida mediante cualquiera de los métodos descritos en la presente y a todas las partes de la planta y sus propágulos.

La presente invención abarca plantas o sus partes (incluso semillas) que se pueden obtener medíante los métodos de acuerdo con la presente invención. Las plantas o sus partes comprenden un transgén de ácido nucleico que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definieron anteriormente. La presente invención también abarca la progenie de una célula, tejido, órgano o planta entera primaria transformada o transfectada que fue producida mediante cualquiera de los métodos antes mencionados, en donde el único requisito es que la progenie exhiba las mismas características genotípicas y/o fenotípicas que las producidas por el progenitor en los métodos de acuerdo con la invención.

Con respecto a los polipéptidos tipo ERG28, la presente invención también se extiende a células de levadura producidas con cualquiera de los métodos descritos en la presente. Como se usan en la presente, las expresiones "levadura" o "célula de levadura" se refieren a microorganismos unicelulares que pertenecen a una de tres clases: Ascomycetes, Basidiomycetes y Fungi Imperfecti. Preferentemente, la levadura es una cepa no patogénica seleccionada de Saccharomyces, Candida, Cryptococcus, Hansenula, Kluyveromyces, Pichia, Rhodotorula, Schizosaccharomyces y Yarrowia; con mayor preferencia, la levadura se selecciona de Saccharomyces, Candida, Hansenula, Pichia y Schizosaccharomyces, con máxima preferencia, la levadura es Saccharomyces. Las especies preferidas de cepas de levadura incluyen Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Candida kejyr, Candida tropicalis, Cryptococcus laurentii, Cryptococcus neoformans, Hansenula anómala, Hansenula polymorpha, Kluyveromyces fragilis, Kluyveromyces lactis, Kluyveromyces marxianus var. lactis, Pichia pastoris, Rhodotorula rubra, Schizosaccharomyces pombe y Yarrowia lipolytica. Cabe destacar que varias de estas especies incluyen múltiples subespecies, tipos, subtipos, etc. que pretenden estar incluidos en las especies antes mencionadas. Con máxima preferencia, las especies de levadura que se usan en los métodos de la presente invención son una especie de levadura que es "Generalmente reconocida como segura" o "GRAS" para usar como aditivo alimenticio (GRAS, FDA proposed Rule 62FR18938, April 17, 1997).

En otra forma de realización, la presente invención también se extiende a células de plantas transgénicas y semillas, que comprenden la molécula de ácido nucleico de la invención en un cásete de expresión vegetal o en un constructo de expresión vegetal.

En otra forma de realización, la semilla de la invención comprende, de manera recombinante, los casetes de expresión de la invención, los constructos (de expresión) de la invención, los ácidos nucleicos antes descritos y/o las proteínas codificadas por los ácidos nucleicos antes descritos. Otra forma de realización de la presente invención se extiende a células vegetales que comprenden el ácido nucleico antes descrito, en un cásete de expresión vegetal recombinante.

Aun en otra forma de realización, las células vegetales de la invención son células que no se propagan, por ejemplo, las células no se pueden usar para regenerar una planta entera de esta célula en su conjunto mediante el uso de técnicas de cultivo celular estándar, es decir, métodos de cultivo celular, pero excluyendo métodos de transferencia de núcleos, organelas o cromosomas ¡n vitro. Si bien las células vegetales generalmente tienen la característica de totipotencia, algunas células vegetales no se pueden usar para regenerar ni propagar plantas intactas de dichas células. En una forma de realización de la invención, las células vegetales de la invención son dichas células.

En otra forma de realización, las células vegetales de la invención son células vegetales que no se sostienen a sí mismas por fotosíntesis mediante la síntesis , de hidratos de carbono y proteínas de sustancias inorgánicas, tales como agua, dióxido de carbono y sales minerales, es decir, se las puede considerar una variedad no vegetal. En otra forma de realización, células vegetales de la invención son una variedad no vegetal y no se pueden propagar.

La invención también incluye células huésped que contienen un ácido nucleico aislado que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definieron anteriormente en la presente. Las células huésped de la invención pueden ser cualquier célula seleccionada del grupo que consiste en células bacterianas, tales como células de especies de E. coli o Agrobacterium, células de levadura, células de hongos, algas o cianobacterias, o células vegetales. En una forma de realización, las células huésped de acuerdo con la invención son células vegetales, levadura, bacterias u hongos. Las plantas huésped para los ácidos nucleicos o el vector usado en el método de acuerdo con la invención, el cásete de expresión o constructo o vector son, en principio, ventajosamente, todas las plantas que son capaces de sintetizar los polipéptidos usados en el método de la invención.

Los métodos de la invención se aplican de manera ventajosa a cualquier planta, en particular, a cualquier planta como se define en la presente. Las plantas que son particularmente útiles en los métodos de la invención incluyen todas las plantas que pertenecen a la superfamilia Viridiplantae, en particular plantas monocotiledóneas y dicotiledóneas que incluyen forraje o legumbres forrajeras, plantas ornamentales, cultivos alimenticios, árboles o arbustos De acuerdo con una forma de realización de la presente invención, la planta es una planta de cultivo. Los ejemplos de plantas de cultivo incluyen, pero no se limitan a, achicoria, zanahoria, mandioca, trébol, soja, remolacha, remolacha azucarera, girasol, cañóla, alfalfa, colza, linaza, algodón, tomate, papa y tabaco. De acuerdo con otra forma de realización de la presente invención, la planta es una planta monocotiledónea. Los ejemplos de plantas monocotiledóneas incluyen caña de azúcar. De acuerdo con otra forma de realización de la presente invención, la planta es un cereal. Los ejemplos de cereales incluyen arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, emmer, espelta, trigo einkom, teff, sorgo milo y avena. En una forma de realización particular, las plantas que se usan en los métodos de la invención se seleccionan del grupo que consiste en maíz, trigo, arroz, soja, algodón, colza oleaginosa, que incluye cañóla, caña de azúcar, remolacha azucarera y alfalfa. Ventajosamente, los métodos de la invención son más eficaces que los métodos conocidos porque las plantas de la invención tienen mayor rendimiento y/o tolerancia a un estrés ambiental, en comparación con las plantas de control que se usan en métodos comparables.

De acuerdo con otra forma de realización, la planta es una planta que no es de semillas, tales como algas y musgos. El término "algas", como se usa en la presente solicitud, se refiere a organismos eucarióticos unicelulares o multicelulares, antes clasificados como plantas, que son fotosintéticos pero que carecen de verdaderos tallos, raíces y hojas. Las algas que son particularmente útiles en los métodos de la invención incluyen todas las especies y subespecies del género Selaginella, en particular, la especie Selaginella moellendorffii. El término "musgo" se refiere a plantas no vasculares de la clase Musci de la división Bryophyta. Los musgos que son particularmente útiles en los métodos de la invención incluyen todas las especies y subespecies del género Physcomitrella, en particular, la especie Physcomitrella patens.

La invención también incluye células huésped que contienen un ácido nucleico aislado que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, como se definen en la presente. En una forma de realización, las células huésped de acuerdo con la invención son células vegetales, levadura, bacterias u hongos. Las plantas huésped para los ácidos nucleicos, constructos, casetes de expresión o vectores usados en el método de acuerdo con la invención son, en principio, ventajosamente todas las plantas capaces de sintetizar los polipéptidos usados en el método de la invención. En una forma de realización particular, las células vegetales de la invención sobreexpresan la molécula de ácido nucleico de la invención.

La invención también se extiende a las partes cosechables de una planta, tales como semillas, hojas, frutos, flores, tallos, raíces, rizomas, tubérculos y bulbos; las partes cosechables comprenden un ácido nucleico recombinante que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28. La invención además se refiere a productos derivados o producidos, preferentemente, derivados o producidos directamente, de una parte cosechable de dicha planta, tales como pelets secos, harina o polvos, aceite, grasa y ácidos grasos, almidón o proteínas.

La invención también incluye métodos para la fabricación de un producto que comprende a) cultivar las plantas de la invención y b) obtener dicho producto de las plantas de la invención o partes de estas, que incluyen semillas. En otra forma de realización, los métodos comprenden las siguientes etapas: a) cultivar las plantas de la invención, b) retirar las partes cosechables, como se describen en la presente, de las plantas, y c) obtener dicho producto de las partes cosechables de las plantas de acuerdo con la invención. Los ejemplos de dichos métodos serian cultivar plantas de maíz de la invención, cosechar las mazorcas del maíz y retirar los granos. Estos se pueden usar como forraje o se pueden procesar para obtener almidón y aceite como productos agrícolas.

El producto se puede generar en el lugar donde se cultivó la planta, o se pueden retirar las plantas o partes de estas del lugar en donde se cultivaron las plantas para producir el producto. En general, se cultiva la planta, se retiran las partes cosechables deseables de la planta, de ser posible en ciclos repetidos, y se obtiene el producto de las partes cosechables de la planta. La etapa de cultivar la planta se puede realizar solo una vez cada vez que se llevan a cabo los métodos de la invención, mientras que las etapas de producción del producto se pueden realizar varias veces, por ejemplo, mediante el retiro reiterado de las partes cosechables de las plantas de la invención y, de ser necesario, mediante el procesamiento adicional de estas partes para producir el producto. También es posible reiterar la etapa de cultivo de las plantas de la invención y almacenar las partes de plantas o partes cosechables hasta que se lleva a cabo una vez la generación del producto para las plantas o partes de las plantas acumuladas. Además, las etapas de cultivar las plantas y producir el producto se pueden superponer en el tiempo, incluso se pueden realizar, en gran medida, de manera simultánea o secuencial. En general, las plantas se cultivan durante cierto tiempo antes de producir el producto.

En una forma de realización, los productos producidos mediante los métodos de la invención son productos vegetales, tales como productos alimenticios, forraje, suplementos alimenticios, suplementos para forraje, fibras, cosméticos o productos farmacéuticos. Los productos alimenticios para humanos se consideran composiciones para la nutrición o para complementar la nutrición. Los productos alimenticios para animales y los suplementos alimenticios para animales, en particular, se consideran productos alimenticios. En otra forma de realización, los métodos para la producción se usan para obtener productos agrícolas, tales como extractos vegetales, proteínas, aminoácidos, hidratos de carbono, grasas, aceites, polímeros, vitaminas y similares. Es posible que un producto vegetal consista, en gran medida, en uno o más productos agrícolas.

Aún en otra forma de realización, los polinucleótidos o polipéptidos de la invención están comprendidos en un producto agrícola. En una forma de realización particular, las secuencias de ácidos nucleicos y las secuencias proteicas de la invención se pueden usar como marcadores de productos, por ejemplo, cuando un producto agrícola fue producido por los métodos de la invención. El marcador se puede usar para identificar un producto que se obtuvo mediante un proceso ventajoso que genera no solo mayor eficacia del proceso, sino también mejor calidad del producto, debido a una mayor calidad del material vegetal y de las partes cosechables usados en el proceso. Los marcadores se pueden detectar mediante varios métodos conocidos en el arte, por ejemplo, entre otros, métodos basados en PCR para la detección de ácidos nucleicos o métodos basados en anticuerpos para la detección de proteínas.

La presente invención también abarca el uso de ácidos nucleicos que codifican polipéptidos POI como se describe en la presente y el uso de estos polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28 para mejorar cualquiera de los rasgos relacionados con el rendimiento antes mencionados en plantas. Por ejemplo, los ácidos nucleicos que codifican polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28, descritos en la presente, o los mismos polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28 pueden ser útiles en programas de reproducción, en los que se identifica un marcador de ADN que se puede ligar genéticamente a un gen que codifica un polipéptido tipo CYP704, un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28. Para definir un marcador molecular se pueden usar ácidos nucleicos/genes o los mismos polipéptidos tipo CYP704, polipéptidos DUF1218, polipéptidos tipo translina o polipéptidos tipo ERG28. Este marcador de ADN o proteína luego se puede usar en programas de reproducción para seleccionar plantas que tienen mejores rasgos relacionados con el rendimiento, como se define en la presente en los métodos de la invención Además, las variantes alélicas de un ácido nucleico/gen que codifica un polipéptido tipo CYP704, un polipéptido DUF12 8, un polipéptido tipo translina o un polipéptido tipo ERG28 pueden ser útiles en los programas de reproducción asistidos por marcador. Los ácidos nucleicos que codifican un polipéptido tipo CYP704, un polipéptido DUF 218, un polipéptido tipo translina o un polipéptido tipo ERG28 también se pueden usar como sondas para mapear de forma genética y física los genes de los cuales son parte, y como marcadores para los rasgos ligados a esos genes. Dicha información puede ser útil para la reproducción de plantas a fin de desarrollar líneas con los fenotipos deseados.

Con respecto a los polipéptidos translina, en una forma de realización, se realiza cualquier comparación para determinar los porcentajes de identidad de secuencia - en el caso de una comparación de ácidos nucleicos sobre la región codificante completa de SEQ ID NO: 190, o en el caso de una comparación de secuencias de polipéptidos sobre la longitud completa de SEQ ID NO: 191.

Por ejemplo, en esta forma de realización, una identidad de secuencia del 50 % significa que sobre la región codificante completa de SEQ ID NO: 190, el 50 por ciento de todas las bases son idénticas entre la secuencia de SEQ ID NO: 190 y la secuencia relacionada. De modo similar, en esta forma de realización, una secuencia de polipéptidos es 50 % idéntica a la secuencia de polipéptidos de SEQ ID NO: 191 , cuando el 50 por ciento de los residuos de aminoácidos de la secuencia representada en SEQ ID NO: 191 se encuentran en el polipéptido evaluado, al comparar desde la metionina de inicio hasta el final de la secuencia de SEQ ID NO: 2.

Además, con respecto a los polipéptidos tipo CYP704, la presente invención se refiere a los siguientes ítems específicos: 1. Un método para mejorar rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, que comprende modular la expresión en una planta un ácido nucleico que codifica un polipéptido tipo CYP704, en donde dicho polipéptido tipo CYP704 comprende un dominio PF450 y la secuencia característica MGRMXXXWGXXXXXXXPERW (SEQ ID NO: 72). 2. Método de acuerdo con el ítem 1 , en donde dicha expresión modulada se realiza mediante la introducción y expresión en una planta de dicho ácido nucleico que codifica el polipéptido tipo CYP704. 3. Método de acuerdo con los ítems 1 o 2, en donde dichos mejores rasgos relacionados con el rendimiento comprenden mayor rendimiento y/o vigor temprano, con respecto a las plantas de control y, preferentemente, comprenden mayor rendimiento de semillas, con respecto a las plantas de control. 4. Método de acuerdo con cualquiera de los ítems 1 a 3, en donde dichos mejores rasgos relacionados con el rendimiento se obtienen en condiciones sin estrés. 5. Método de acuerdo con cualquiera de los ítems 1 a 4, en donde dicho polipéptido tipo CYP704 comprende uno o más de los siguientes motivos: . (i) Motivo 1 : GD]L[LF]GDGIF[ATN][1A ]DG[EHD][MK]W[RK][HQ]QRK[\/LIT][SA]S[FY] EF[SA]rTS][RK][VA]LRDFS[STC][DSV][TIV]F[RK][RKE] (SEQ ID NO: 73), (ii) Motivo 2: D[VTI]LP[DN]G[HYFT][KNRS]V[KVS][KA]G[DG][MG][VI][TNAY]Y[QMV] [PIA]Y[AS]MGRM[ETK][YF][ILN]WG[DE]DA[EQA][ES][YF][RK]PERW (SEQ ID NO: 74), (iii) Motivo 3: [D [PYD][RTK]YLRD[IV][IV]L [FI][VLM]IAG[KR]DTT[GA][GNA [AS? L[TAS]WF[LFI]Y[LM]LCK[HN]P[LHAIE][VI][QA][DEN]K[VIL][AV][LQ]E[VIL][RM][ED][AFV][T VE] (SEQ ID NO: 75) (iv) Motivo 4: [LD][VEDK][DN]G[VI][YF][QK][PQ]ESPFKF[TV][SA]F[QNH]AGPRICLGK [DE][FS]A[HY][RL]QMK[IM][VMF][AS][AM][ATV]L (SEQ ID NO: 76) (v) Motivo 5: R[YF][VI]D[PIV][FML]WK[LI]K[RK][YF][LF]N[IV]GSEAxLK[RK][NS][VI] [??][??][? ][0 ][0?8]? [??][?8][? ]?[? ?][?a [??][???][^] (SEQ ID NO: 77) (vi) Motivo 6: [SE]F[ASTV][KA][RS][IL][DTN][DEY][DEG]A[IL][SENG]K[ML][HNQ]YL [QH]A[TA][LI][TS]ETLRLYP[AS]VP[VLQ]D[PGNA]K[MIG][CAI][FLD][SE]D (SEQ ID NO: 78) 6. Método de acuerdo con cualquiera de los ítems 1 a 5, en donde dicho ácido nucleico que codifica un polipéptido tipo CYP704 es de origen vegetal, preferentemente, de una planta dicotiledónea o monocotiledónea. 7. Método de acuerdo con cualquiera de los ítems 1 a 6, en donde el ácido nucleico que codifica un tipo CYP704 codifica cualquiera de los polipéptidos enumerados en la Tabla A1 o es una porción de dicho ácido nucleico, o un ácido nucleico capaz de hibridarse con dicho ácido nucleico. 8. Método de acuerdo con cualquiera de los ítems 1 a 7, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de los polipéptidos indicados en la Tabla A1. 9. Método de acuerdo con cualquiera de los ítems 1 a 8, en donde dicho ácido nucleico codifica el polipéptido representado por SEQ ID NO: 2 o SEQ ID NO: 4. 10. Método de acuerdo con cualquiera de los ítems 1 a 9, en donde dicho ácido nucleico se liga operativamente a un promotor constitutivo, preferentemente, a un promotor constitutivo de intensidad media, preferentemente, a un promotor vegetal, con mayor preferencia, a un promotor GOS2, con máxima preferencia, a un promotor GOS2 del arroz. 11. Planta, parte de planta, incluso semillas, o célula vegetal que se puede obtener mediante un método de acuerdo con cualquiera de los ítems 1 a 10, en donde dicha planta, parte de planta o célula vegetal comprende un ácido nucleico recombinante que codifica un polipéptido tipo CYP704, como se define en cualquiera de los ítems 1 y 5 a 9. 12. Constructo que comprende: (i) ácido nucleico que codifica un polipéptido tipo CYP704 como se define en cualquiera de los ítems 1 y 5 a 9; (¡i) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (i); y opcionalmente (iii) una secuencia de terminación de la transcripción. 13. Constructo de acuerdo con el ítem 12, en donde una de dichas secuencias de control es un promotor constitutivo, preferentemente, un promotor constitutivo de intensidad media, preferentemente, un promotor vegetal, con mayor preferencia, un promotor GOS2, con máxima preferencia, un promotor GOS2 del arroz. 14. Uso de un constructo de acuerdo con los ítems 12 o 13 en un método para producir plantas que tienen mejores rasgos relacionados con el rendimiento, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas, con respecto a las plantas de control. 15. Planta, parte de planta o célula vegetal transformada con un constructo de acuerdo con los ítems 12 o 13. 16. Método para la producción de una planta transgénica que tiene mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas, con respecto a las plantas de control, que comprende: (i) introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido tipo CYP704 como se define en cualquiera de los ítems 1 y 5 a 9; y (ii) cultivar la célula vegetal o planta en condiciones que promuevan el desarrollo y el crecimiento de la planta. 17. Planta transgénica que tiene mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas, que es el resultado de la expresión modulada de un ácido nucleico que codifica un polipéptido tipo CYP704, como se define en cualquiera de los ítems 1 y 5 a 9, o una célula vegetal transgénica derivada de dicha planta transgénica. 18. Planta transgénica de acuerdo con los ítems 11 , 15 o 17, o una célula vegetal transgénica derivada de esta, en donde dicha planta es una planta de cultivo, tal como remolacha, remolacha azucarera o alfalfa, o una monocotiledónea, tal como caña de azúcar, o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, emmer, espelta, trigo einkorn, teff, sorgo milo o avena. 19. Uso de un ácido nucleico que codifica un polipéptido tipo CYP704 como se define en cualquiera de los ítems 1 y 5 a 9 para mejorar los rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, preferentemente, para aumentar el rendimiento y, con mayor preferencia, para aumentar el rendimiento de semillas en plantas, con respecto a las plantas de control.

Además, con respecto a los polipéptidos tipo CYP704, la presente invención se refiere a las siguientes formas de realización específicas: 1. Un método para la producción de una planta transgénica que tiene mejor rendimiento de semillas con respecto a una planta de control, que comprende las siguientes etapas: introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido tipo CYP704, en donde el ácido nucleico se liga operativamente a un promotor vegetal constitutivo, y en donde el polipéptido tipo CYP704 comprende el polipéptido representado por uno de: SEQ ID NO: 2, SEQ ID NO: 4 o un homólogo de este que tiene, al menos, 90 % de identidad de secuencia total con SEQ ID NO : 2 o SEQ ID NO: 4, y cultivar la célula vegetal o planta en condiciones que promuevan el desarrollo y el crecimiento de la planta. 2. Método de acuerdo con la forma de realización 1 , en donde el mayor rendimiento de semillas comprende al menos un parámetro seleccionado del grupo que comprende mayor peso total de semillas, mayor índice de cosecha y mayor tasa de llenado. 3. Método de acuerdo con las formas de realización 1 o 2, en donde el aumento del rendimiento de semillas comprende un aumento de al menos el 5 % en la planta, en comparación con las plantas de control para cada uno de los parámetros. 4. Método de acuerdo con cualquiera de las formas de realización 1 a 3, en donde el mayor rendimiento se obtiene en condiciones sin estrés. 5. Método de acuerdo con cualquiera de las formas de realización 1 a 4, en donde dicho ácido nucleico se liga operativamente a un promotor GOS2. 6. Método de acuerdo con la forma de realización 5, en donde el promotor GOS2 es el promotor GOS2 del arroz. 7. Método de acuerdo con cualquiera de las formas de realización 1 a 6, en donde la planta es una planta monocotiledónea. 8. Método de acuerdo con la forma de realización 7, en donde la planta es un cereal. 9. Constructo que comprende: (i) ácido nucleico que codifica un polipéptido tipo CYP704, como se define en la forma de realización 1 ; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (i); y opcionalmente (iii) una secuencia de terminación de la transcripción. 10. Constructo de acuerdo con la forma de realización 9, en donde una o más de dichas secuencias de control es un promotor GOS2. 11. Planta transgénica que tiene mayor rendimiento de semillas como se define en las formas de realización 2 o 3, con respecto a las plantas de control, que es el resultado de la introducción y expresión de un ácido nucleico que codifica un polipéptido tipo CYP704 como se define en la forma de realización 1 , en dicha planta, o una célula vegetal transgénica derivada de dicha planta transgénica. 12. Uso de un ácido nucleico que codifica un polipéptido tipo CYP704 como se define en la forma de realización 1 para mejorar el rendimiento de semillas como se define en las formas de realización 2 o 3 en una planta transgénica, con respecto a una planta de control.

Además, con respecto a los polipéptidos DUF12 8, la presente invención se refiere a las siguientes formas de realización específicas: 1. Un método para mejorar los rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido DUF1218, en donde dicho polipéptido DUF1218 comprende un dominio DUF1218. 2. Método de acuerdo con la forma de realización 1 , en donde dicha expresión modulada se realiza mediante la introducción y expresión en una planta de dicho ácido nucleico que codifica el polipéptido DUF1218. 3. Método de acuerdo con las formas de realización 1 o 2, en donde dichos mejores rasgos relacionados con el rendimiento comprenden mayor rendimiento, con respecto a las plantas de control y, preferentemente, comprenden mayor rendimiento de semillas y/o mayor biomasa, con respecto a las plantas de control. 4. Método de acuerdo con cualquiera de las formas de realización 1 a 3, en donde el mayor rendimiento de semillas comprende mayor peso total de semillas. 5. Método de acuerdo con cualquiera de las formas de realización 1 a 4, en donde dichos mejores rasgos relacionados con el rendimiento se obtienen en condiciones sin estrés. 6. Método de acuerdo con cualquiera de las formas de realización 1 a 4, en donde dichos mejores rasgos relacionados con el rendimiento se obtienen en condiciones de estrés por sequía, estrés salino o deficiencia de nitrógeno. 7. Método de acuerdo con cualquiera de las formas de realización 1 a 6, en donde el dominio DUF1218 comprende una secuencia de aminoácidos que tiene al menos 50 % de identidad de secuencia total con el aminoácido representado por SEQ ID NO: 179 8. Método de acuerdo con cualquiera de las formas de realización 1 a 7, en donde el polipéptidos DUF1218 tiene, al menos, un péptido de señal y, al menos, un dominio transmembranal. 9. Método de acuerdo con cualquiera de las formas de realización 1 a 8, en donde dicho polipéptido DUF1218 comprende uno o más de los siguientes motivos: (i) Motivo l O: NW[TS][LV]ALrVI][CS]Fr i]VS [FA]TF[VI]IAFLLLLTGAALNDQ[HR]G [EQ]E (SEQ ID NO: 180), (ii) Motivo 11 : SP[STG][EQ]C[VI]YPRSPAL[AG]LGL[^[AS]A[DV][AS]LM[IV]A[QH] [ISVjlIN [TV][AV][TA]GCICC[ R][RK] (SEQ ID NO: 181 ), (iii) Motivo 12: [YS][YF]CYWKPGVF[AS]G[GA]AVLSLASV[AI]L[GA]IVYY (SEQ ID NO: 182) 10. Método de acuerdo con cualquiera de las formas de realización 1 a 9, en donde dicho polipéptido DUF1218 también comprende uno o más de los siguientes motivos: (i) Motivo 13: CCKRHPVPSDTNWSVALISFIVSW[VC]TFIIAFLLLLTGAALNDQRG[E QJENMY (SEQ ID NO: 183), (ii) Motivo 14: MERK[AV]WVCA[LV]VGFLGVLSAALGFAAE[GA]TRVKVSDVQT[DS] (SEQ ID NO: 184), (iii) Motivo 15: IP[QP]QSSEPVFVHEDTYNR[QR]Q[FQ] (SEQ ID NO: 185) 11. Método de acuerdo con cualquiera de las formas de realización 1 a 10, en donde dicho ácido nucleico que codifica un polipéptido DUF1218 es de una planta, preferentemente, de una planta monocotiledónea, con mayor preferencia, de la familia Poaceae, con mayor preferencia, del género Oryza, con máxima preferencia, de Oryza sativa. 12. Método de acuerdo con cualquiera de las formas de realización 1 a 1 1 , en donde el ácido nucleico que codifica un polipéptido DUF1218 codifica cualquiera de los polipéptidos enumerados en la Tabla A2 o es una porción del ácido nucleico, o un ácido nucleico capaz de hibridarse con dicho ácido nucleico. 13. Método de acuerdo con cualquiera de las formas de realización 1 a 12, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de los polipéptidos indicados en la Tabla A2. 14. Método de acuerdo con cualquiera de las formas de realización 1 a 13, en donde dicho ácido nucleico codifica el polipéptido representado por SEQ ID NO: 2 o un homólogo de este. 15. Método de acuerdo con cualquiera de las formas de realización 1 a 14, en donde dicho ácido nucleico se liga operativamente a un promotor constitutivo, preferentemente, a un promotor constitutivo de intensidad media, preferentemente, a un promotor vegetal, con mayor preferencia, a un promotor GOS2, con máxima preferencia, a un promotor GOS2 del arroz. 16. Planta, parte de planta, incluso semillas, o célula vegetal que se puede obtener mediante un método de acuerdo con cualquiera de las formas de realización 1 a 15, en donde dicha planta, parte de planta o célula vegetal comprende un ácido nucleico recombinante que codifica un polipéptido DUF1218, como se define en cualquiera de las formas de realización 1 y 7 a 14. 17. Constructo que comprende: (i) ácido nucleico que codifica un polipéptido DUF 2 8 como se define en cualquiera de las formas de realización 1 y 7 a 14; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (i); y opcionalmente (iii) una secuencia de terminación de la transcripción. 18. Constructo de acuerdo con la forma de realización 17, en donde una de dichas secuencias de control es un promotor constitutivo, preferentemente, un promotor constitutivo de intensidad media, preferentemente, un promotor vegetal, con mayor preferencia, un promotor GOS2, con máxima preferencia, un promotor GOS2 del arroz. 19. Uso de un constructo de acuerdo con las formas de realización 16 o 17 en un método para producir plantas que tienen mejores rasgos relacionados con el rendimiento, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas, con respecto a las plantas de control. 20. Planta, parte de planta o célula vegetal transformada con un constructo de acuerdo con la forma de realización 16 o 17. 21. Método para la producción de una planta transgénica que tiene mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas y/o mayor biomasa, con respecto a las plantas de control, que comprende: (i) introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido DUF1218 como se define en cualquiera de las formas de realización 1 y 7 a 14; y (ii) cultivar la célula vegetal o planta en condiciones que promuevan el desarrollo y el crecimiento de la planta. 22. Planta transgénica que tiene mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas, que es el resultado de la expresión modulada de un ácido nucleico que codifica un polipéptido DUF1218, como se define en cualquiera de las formas de realización 1 y 7 a 14, o una célula vegetal transgénica derivada de dicha planta transgénica. 23. Planta transgénica de acuerdo con la forma de realización 16, 20 o 22, p una célula vegetal transgénica derivada de esta, en donde dicha planta es una planta de cultivo, tal como remolacha, remolacha azucarera o alfalfa, o una monocotiledónea, tal como caña de azúcar, o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, emmer, espelta, sécale, trigo einkorn, teff, sorgo milo o avena. 24. Partes cosechables de una planta de acuerdo con cualquiera de las formas de realización 16, 20, 22-23, en donde las partes cosechables son, preferentemente, biomasa de brote y/o semillas. 25. Productos derivados de una planta de acuerdo cualquiera de las formas de realización* 16, 20, 22-23 y/o de partes cosechables de una planta de acuerdo con la forma de realización 24. 26. Molécula de ácido nucleico aislada seleccionada de: (i) un ácido nucleico representado por cualquiera de SEQ ID NO: 87 o 97; (ii) el complemento de un ácido nucleico representado por cualquiera de SEQ ID NO: 87 o 97; (iii) un ácido nucleico que codifica un polipéptido DUF1218 que tiene, en orden creciente de preferencia, al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 2 o 12, y de manera adicional o alternativa, que comprende uno o más motivos que tienen, en orden creciente de preferencia, al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con uno o más de los motivos indicados en SEQ ID NO: 93 a SEQ ID NO: 99 y, con mayor preferencia, confiere mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control; (iv)- una molécula de ácido nucleico que se híbrida con una molécula de ácido nucleico de (i) a (iii) en condiciones de hibridación muy rigurosas y, preferentemente, confiere mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control. 27. Polipéptido aislado seleccionado de: (i) una secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 2 o 12; (ii) una secuencia de aminoácidos que tiene, en orden creciente de preferencia, al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos representada por SEQ ID NO: 2 o 12, y de manera adicional o alternativa, que comprende uno o más motivos que tienen, en orden creciente de preferencia, al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con uno o más de los motivos indicados en SEQ ID NO: 93 a SEQ ID NO: 99 y, con mayor preferencia, que confieren mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control; (iii) derivados de cualquiera de las secuencias de aminoácidos indicadas en (i) o (ii) anteriores. 28. Uso de un ácido nucleico que codifica un polipéptido DUF1218 como se define en cualquiera de las formas de realización 1 y 7 a 14 para mejorar los rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, preferentemente, para aumentar el rendimiento y, con mayor preferencia, para aumentar el rendimiento de semillas en plantas, con respecto a las plantas de control. 29. Uso de un ácido nucleico como se define en la forma de realización 26 y que codifica un polipéptido DUF1218 para mejorar los rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, preferentemente, para aumentar el rendimiento y, con mayor preferencia, para aumentar el rendimiento de semillas en plantas, con respecto a las plantas de control. 30. Uso de un ácido nucleico que codifica un polipéptido DUF1218 como se define en cualquiera de las formas de realización 1 y 7 a 14 y 27, como marcador molecular. 31. Uso de un ácido nucleico como se definió en la forma de realización 26 y que codifica un polipéptido DUF1218 como se define en cualquiera de las formas de realización 1 y 7 a 14 y 27, como marcador molecular.

Además, con respecto a los polipéptidos tipo translina, la presente invención se refiere a las siguientes formas de realización específicas: 1. Un método para mejorar rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, que comprende modular la expresión en una planta un ácido nucleico que codifica un polipéptido tipo translina, en donde dicho polipéptido tipo translina comprende la secuencia característica GTDFWKLRR (SEQ ID NO: 56) y, preferentemente, comprende un acceso a InterPro IPR002848 correspondiente al número de acceso a PFAM PF01997 del dominio de translina. 2. Método de acuerdo con la forma de realización 1 , en donde dicha expresión modulada se realiza mediante la introducción y expresión en una planta de dicho ácido nucleico que codifica el polipéptido tipo translina. 3. Método de acuerdo con las formas de realización 1 o 2, en donde dichos mejores rasgos relacionados con el rendimiento comprenden mayor rendimiento, con respecto a las plantas de control y, preferentemente, comprenden mayor índice de cosecha y/o mayor rendimiento de semillas, con respecto a las plantas de control. 4. Método de acuerdo con cualquiera de las formas de realización 1 a 3, en donde dichos mejores rasgos relacionados con el rendimiento se obtienen en condiciones sin estrés. 5. Método de acuerdo con cualquiera de las formas de realización 1 a 4, en donde dicho polipéptido tipo translina comprende uno o más de los siguientes motivos: (i) Motivo 16: DLAAV[TV][NED]QY[IM][LAGS][KR]LVKELQGTDFWKLRRAY[ST][PF] GVQEYVEAAT[FL][CY][KR]FC[RK][TS]GT (SEQ ID NO: 238), (ii) Motivo 17: [SP][SA][FM]K[DA][AE]F[GSA][ K][YH]A[NE]YLN[KN?L [ED]KRER [VL]VKASRD[IV]TMNSKKVIFQVHR[IM]SK[DN]N[RK] (SEQ ID NO: 239), (iii) Motivo 18: IC[QA]FVRDIYREÍLTL[LVI]VP[YL]MDD[SN][SN][DE]IV1K[TK]KM[DE][T V]MLQSV[VM]KIENAC[YF][GS]VHVRG (SEQ ID NO: 240). 6. Método de acuerdo con cualquiera de las formas de realización 1 a 5, en donde dicho ácido nucleico que codifica un polipéptido tipo translina es de una planta, preferentemente, de una planta dicotiledónea, con mayor preferencia, de la familia Salicaceae, con mayor preferencia, del género Populus, con máxima preferencia, de Populus trichocarpa. 7. Método de acuerdo con cualquiera de las formas de realización 1 a 6, en donde el ácido nucleico que codifica un polipéptido tipo translina codifica cualquiera de los polipéptidos enumerados en la Tabla A3 o es una porción del ácido nucleico, o un ácido nucleico capaz de hibridarse con dicho ácido nucleico. 8. Método de acuerdo con cualquiera de las formas de realización 1 a 7, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de los polipéptidos indicados en la Tabla A3. 9. Método de acuerdo con cualquiera de las formas de realización 1 a 8, en donde dicho ácido nucleico codifica el polipéptido representado por SEQ ID NO: 191. 10. Método de acuerdo con cualquiera de las formas de realización 1 a 9, en donde dicho ácido nucleico se liga operativamente a un promotor constitutivo, preferentemente, a un promotor constitutivo de intensidad media, preferentemente, a un promotor vegetal, con mayor preferencia, a un promotor GOS2, con máxima preferencia, a un promotor GOS2 del arroz. 11. Planta, parte de planta, incluso semillas, o célula vegetal que se puede obtener mediante un método de acuerdo con cualquiera de las formas de realización 1 a 10, en donde dicha planta, parte de planta o célula vegetal comprende un ácido nucleico recombinante que codifica un polipéptido tipo translina, como se define en cualquiera de las formas de realización 1 y 5 a 9. 12. Constructo que comprende: (i) ácido nucleico que codifica un polipéptido tipo translina como se define en cualquiera de las formas de realización 1 y 5 a 9; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (i); y opcionalmente (i) una secuencia de terminación de la transcripción. 13. Constructo de acuerdo con la forma de realización 12, en donde una de dichas secuencias de control es un promotor constitutivo, preferentemente, un promotor constitutivo de intensidad media, preferentemente, un promotor vegetal, con mayor preferencia, un promotor GOS2, con máxima preferencia, un promotor GOS2 del arroz. 14. Uso de un constructo de acuerdo con la forma de realización 12 o 13 en un método para producir plantas que tienen mejores rasgos relacionados con el rendimiento, preferentemente, mayor rendimiento, con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas y/o mayor biomasa, con respecto a las plantas de control. 15. Planta, parte de planta o célula vegetal transformada con un constructo de acuerdo con la forma de realización 12 o 13. 16. Método para la producción de una planta transgénica que tiene mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, preferentemente, mayor rendimiento con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas y/o mayor índice de cosecha, con respecto a las plantas de control, que comprende: (i) introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido tipo translina como se define en cualquiera de las formas de realización 1 y 5 a 9; y (ü) cultivar la célula vegetal o planta en condiciones que promuevan el desarrollo y el crecimiento de la planta. 17. Planta transgénica que tiene mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, preferentemente, mayor rendimiento, con respecto a las plantas de control y, con mayor preferencia, mayor rendimiento de semillas y/o mayor biomasa, que es el resultado de la expresión modulada de un ácido nucleico que codifica un polipéptido tipo translina, como se define en cualquiera de las formas de realización 1 y 5 a 9, o una célula vegetal transgénica derivada de dicha planta transgénica. 18. Planta transgénica de acuerdo con la forma de realización 11 , 15 o 17, o una célula vegetal transgénica derivada de esta, en donde dicha planta es una planta de cultivo, tal como remolacha, remolacha azucarera o alfalfa, o una monocotiledónea, tal como caña de azúcar, o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, emmer, espelta, sécale, trigo einkorn, teff, sorgo milo o avena. 19. Partes cosechables de una planta de acuerdo con la forma de realización 18, en donde dichas partes cosechables son preferentemente semillas. 20. Productos derivados de una planta de acuerdo con la forma de realización 18 y/o de partes cosechables de una planta de acuerdo con la forma de realización 19. 21. Uso de un ácido nucleico que codifica un polipéptido tipo translina como se define en cualquiera de las formas de realización 1 y 5 a 9 para mejorar rasgos relacionados con el rendimiento en plantas, con respecto a las plantas de control, preferentemente, para aumentar el rendimiento y, con mayor preferencia, para aumentar el rendimiento de semillas y/o para aumentar la biomasa en plantas, con respecto a las plantas de control. 22. Planta que tiene mayor rendimiento, en particular, mayor biomasa y/o mayor rendimiento de semilla, con respecto a las plantas de control, que es el resultado de la expresión modulada de un ácido nucleico que codifica un polipéptido tipo translina o una célula vegetal transgénica que se origina o es parte de dicha planta transgénica. 23. Un método para la obtención de un producto, que comprende las etapas de cultivar las plantas de la invención y obtener dicho producto de o mediante (a) las plantas de la invención; o (b) partes, que incluyen semillas, de estas plantas. 24. Planta de acuerdo con la forma de realización 11 , 15 o 21 , o una célula vegetal transgénica que se origina de aquella, o un método de acuerdo con la forma de realización 22, en donde dicha planta es una planta de cultivo, preferentemente, una planta dicotiledónea, tal como remolacha azucarera, alfalfa, trébol, achicoria, zanahoria, mandioca, algodón, soja, cañóla; o una planta monocotiledónea, tal como caña de azúcar; o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, emmer, espelta, sécale, trigo einkorn, teff, sorgo milo y avena. 25. Constructo de acuerdo con las formas de realización 12 o 13 comprendido en una célula vegetal. 26. ADN cromosómico recombinante que comprende el constructo de acuerdo con las formas de realización 12 o 13.

Además, con respecto a los polipéptidos tipo ERG28, la presente invención se refiere a las siguientes formas de realización específicas: 1. Un método para mejorar rasgos relacionados con el rendimiento y/o modificar una composición de esteróles y/o esteroides, y/o aumentar o disminuir los niveles de esteróles y/o esteroides en plantas, con respecto a las plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28, en donde el polipéptido tipo ERG28 comprende un dominio Pfam PF03694 y, preferentemente, también la secuencia característica WTLL[TS]CTL. 2. Método de acuerdo con la forma de realización 1 , en donde dicha expresión modulada se realiza mediante la introducción y expresión en una planta de dicho ácido nucleico que codifica el polipéptido tipo ERG28. 3. Método de acuerdo con las formas de realización 1 o 2, en donde la expresión modulada es expresión aumentada o disminuida. 4. Método de acuerdo con las formas de realización 1 o 3, en donde dichos mejores rasgos relacionados con el rendimiento comprenden mayor rendimiento y/o vigor temprano, con respecto a las plantas de control y, preferentemente, comprenden mayor biomasa y/o mayor rendimiento de semillas, con respecto a las plantas de control. 5. Método de acuerdo con cualquiera de las formas de realización 1 a 4, en donde dichos mejores rasgos relacionados con el rendimiento y/o composición de esteroides modificada y/o niveles de esteroides aumentados se obtienen en condiciones sin estrés. 6. Método de acuerdo con cualquiera de las formas de realización 1 a 4, en donde dichos mejores rasgos relacionados con el rendimiento y/o composición de esteroides modificada y/o niveles de esteroides aumentados se obtienen en condiciones de estrés por sequía, estrés salino o deficiencia de nitrógeno. 7. Método de acuerdo con cualquiera de las formas de realización 1 a 5, en donde dicho polipéptido tipo ERG28 comprende uno o más de los siguientes motivos: (i) Motivo 19: CTLC[FY]LCA[FL]NL[HE][DN][KR]PLYLAT[IF]LSF[IV]YA[FL]GHFLTE [FY]L[FI]Y[HQ]TM (SEQ ID NO: 297), (ii) Motivo 20: VG[ST]LRLAS\AA FGF[VF][DN)IWALR[LV]AVFS[QK]T[TE]M[TS][ED] [VI]HGRTFG[VT]WT (SEQ ID NO: 298), (¡ii) Motivo 21 : ' [IA][KA]NL[SVT]TVG[FI]FAGTSI[VI]WMLL[EQ]WN[SA][LH][EQG][QK] [PV][RKH] (SEQ ID NO: 299), (iv) Motivo 22: [PEK][LA]LG[YW]WL[MI ] (SEQ ID NO: 300). 8. Método de acuerdo con cualquiera de las formas de realización 1 a 6, en donde dicho ácido nucleico que codifica un polipéptido tipo ERG28 es de levadura o de una planta, preferentemente, de una planta dicotiledónea, con mayor preferencia, de la familia Brassicaceae o Solanaceae, con mayor preferencia, del género Arabidopsis o Solanum, con máxima preferencia, de Arabidopsis thaliana o Solanum lycopersicum. 9. Método de acuerdo con cualquiera de las formas de realización 1 a 7, en donde el ácido nucleico que codifica un tipo ERG28 codifica cualquiera de los polipéptidos enumerados en la Tabla A4 o es una porción del ácido nucleico, o un ácido nucleico capaz de hibridarse con dicho ácido nucleico. 10. Método de acuerdo con cualquiera de las formas de realización 1 a 8, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de los polipéptidos indicados en la Tabla A4. 1 1. Método de acuerdo con cualquiera de las formas de realización 68 a 9, en donde dicho ácido nucleico codifica el polipéptido representado por SEQ ID NO: 247. 12. Método de acuerdo con cualquiera de las formas de realización 1 a 10, en donde dicho ácido nucleico se liga operativamente a un promotor constitutivo, tal como el promotor CaMV35S, preferentemente, a un promotor constitutivo de intensidad media, preferentemente, a un promotor vegetal, con mayor preferencia, a un promotor GOS2, con máxima preferencia, a un promotor GOS2 del arroz. 13. Planta, parte de planta, incluso semillas, o célula vegetal que se puede obtener mediante un método de acuerdo con cualquiera de las formas de realización 1 a 11 , en donde dicha planta, parte de planta o célula vegetal comprende un ácido nucleico recombinante que codifica un polipéptido tipo ERG28, como se define en cualquiera de las formas de realización 1 y 6 a 10. 14. Constructo que comprende: (i) ácido nucleico que codifica un tipo ERG28 como se define en cualquiera de las formas de realización 1 y 6 a 10; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (i); y opcionalmente (iü) una secuencia de terminación de la transcripción. 15. Constructo de acuerdo con la forma de realización 13, en donde una de dichas secuencias de control es un promotor constitutivo, preferentemente, un promotor constitutivo de intensidad media, preferentemente, un promotor vegetal, con mayor preferencia, un promotor GOS2, con máxima preferencia, un promotor GOS2 del arroz. 16. Uso de un constructo de acuerdo con las formas de realización 13 o 14 en un método para producir plantas que tienen mejores rasgos relacionados con el rendimiento y/o una composición de esteroides modificada y/o niveles de esteroides aumentados, con respecto a las plantas de control. 17. Planta, parte de planta o célula vegetal transformada con un constructo de acuerdo con la forma de realización 13 o 14. 18. Método para la producción de una planta transgénica que tiene mejores rasgos relacionados con el rendimiento y/o una composición de esteroides modificada y/o niveles de esteroides aumentados o disminuidos, con respecto a las plantas de control, que comprende: (i) introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido tipo ERG28 como se define en cualquiera de las formas de realización 1 y 6 a 10; y (ii) cultivar la célula vegetal o planta en condiciones que promuevan el desarrollo y el crecimiento de la planta. 18. Planta transgénica que tiene mejores rasgos relacionados con el rendimiento y/o una composición de esteroides modificada y/o niveles de esteroides aumentados o disminuidos, con respecto a las plantas de control, que es el resultado de la expresión modulada de un ácido nucleico que codifica un polipéptido tipo ERG28, como se define en cualquiera de las formas de realización 1 y 6 a 10, o una célula vegetal transgénica derivada de dicha planta transgénica. 19. Planta transgénica de acuerdo con la forma de realización 12, 16 o 18, o una célula vegetal transgénica derivada de esta, en donde dicha planta es una planta de cultivo, tal como soja, cañóla, remolacha, remolacha azucarera o alfalfa; o una planta monocotiledónea, tal como caña de azúcar; o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, emmer, espelta, trigo einkorn, teff, sorgo milo o avena. 20. Partes cosechables de una planta de acuerdo con la forma de realización 19, en donde las partes cosechables son, preferentemente, biomasa de brote y/o semillas. 21. Productos derivados de una planta de acuerdo con la forma de realización 19 y/o de partes cosechables de una planta de acuerdo con la forma de realización 20. 22. Uso de un ácido nucleico que codifica un polipéptido tipo ERG28 como se define en cualquiera de las formas de realización 1 y 6 a 10 para mejorar rasgos relacionados con el rendimiento y/o modificar una composición de esteroides y/o aumentar los niveles de esteroides en las plantas, con respecto a las plantas de control.

Definiciones Las siguientes definiciones se usarán a lo largo de la presente solicitud. Los títulos y encabezamientos de las secciones de esta solicitud se brindan a fines prácticos y de referencia, y no deben afectar de modo alguno el significado o la interpretación de la presente solicitud. Por lo general, las expresiones y los términos técnicos que se usan dentro del alcance de la presente solicitud deben interpretarse con el significado que se les aplica habitualmente en el arte pertinente de la biología de las plantas, biología molecular, bioinformática y reproducción de plantas. Todas las siguientes definiciones de términos se aplican al contenido completo de esta solicitud. El término "esencialmente", "alrededor de", "aproximadamente" y similares, en relación con un atributo o un valor, también definen, en particular, exactamente el atributo o el valor, respectivamente. El término "alrededor de", en el contexto de un determinado valor o rango numérico, se refiere, en particular, a un valor o rango que está dentro del 20 %, dentro del 10 % o dentro del 5 % del valor o rango determinados. Como se usa en la presente, el término "comprende" también abarca el término "consiste en".

Péptidos(sVProteína(s) Los términos "péptidos", "oligopéptidos", "polipéptido" y "proteína" se usan en forma indistinta en la presente y se refieren a aminoácidos en forma polimérica de cualquier longitud, ligados por enlaces peptídicos, a menos que se indique de otra manera.

Polinucleótido(sVÁcido(s) nucleico(s)/Secuencia(s) de ácidos nucleicos/Secuencia(s) de nucleótidos Las expresiones "polinucleótido(s)", "secuencia(s) de ácidos nucleicos", "secuencia(s) de nucleótidos", "ácido(s) nucleico(s)", "molécula de ácido nucleico" se usan en forma indistinta en la presente y se refieren a nucleótidos, sean ribonucleótidos o desoxirribonucleótidos o una combinación de ambos, en una forma polimérica no ramificada de cualquier longitud.

Homóloqo(s) Los "homólogos" de una proteína abarcan péptidos, oligopéptidos, polipéptidos, proteínas y enzimas que tienen sustituciones, eliminaciones y/o inserciones de aminoácidos con respecto a la proteína en cuestión sin modificar y que tienen actividad funcional similar a la proteína sin modificar de la que derivan.

Los ortólogos y parálogos son dos formas diferentes de homólogos y abarcan conceptos evolutivos que se utilizan para describir las relaciones ancestrales de los genes. Los parálogos son genes dentro de la misma especie que han sido originados por duplicación de un gen ancestral; los ortólogos son genes que provienen de diferentes organismos que han sido originados por especiación y también derivan de un gen ancestral común.

Una "eliminación" se refiere a la supresión de uno o más aminoácidos de una proteína.

Una "inserción" se refiere a la introducción de uno o más residuos de aminoácidos en un sitio predeterminado de una proteína. Las inserciones pueden comprender fusiones N-terminal y/o C-terminal y también inserciones intrasecuencia de aminoácidos únicos o múltiples. Generalmente, las inserciones en la secuencia de aminoácidos serán más pequeñas que las fusiones N- o C-terminal, en el orden de alrededor de 1 a 10 residuos. Los ejemplos de péptidos o proteínas de fusión N- o C-terminal incluyen el dominio de unión o dominio de activación de un activador de la transcripción como se usa en el sistema de dos híbridos de levadura, proteínas de recubrimiento de fagos, etiqueta de (histidina)— 6, etiqueta de glutatión S-transferasa, proteína A, proteína de unión a maltosa, dihidrofolato reductasa, epítope Tag*100, epítope c-myc, epítope FLAG® , lacZ, CMP (péptido de unión a calmodulina), epítope HA, epítope de proteína C y epítope VSV.

Una "sustitución" se refiere al reemplazo de aminoácidos de la proteína con otros aminoácidos que tienen propiedades similares (tales como hidrofobicidad, hidrofilicidad, antigenicidad, propensión similar a formar o romper estructuras helicoidales a o estructuras de hoja ß). En general, las sustituciones de aminoácidos son de residuos únicos, pero se pueden agrupar según las restricciones funcionales del polipéptido y pueden variar de 1 a 10 aminoácidos. Preferentemente, las sustituciones de aminoácidos son sustituciones conservadoras de aminoácidos. Las tablas de sustituciones conservadoras son conocidas en el arte (véase, por ejemplo, Creighton (1984) Proteins. W.H. Freeman and Company (Eds) y la siguiente Tabla 1 ).

Tabla 1 : Ejemplos de sustituciones conservadoras de aminoácidos Las sustituciones, eliminaciones y/o inserciones de aminoácidos se pueden realizar fácilmente mediante las técnicas de síntesis de péptidos conocidas en el arte, tales como síntesis de péptidos en fase sólida y similares, o mediante la manipulación de ADN recombinante. Los métodos para la manipulación de secuencias de ADN para producir sustitución, inserción o eliminación de variantes de una proteína son muy conocidos en el arte. Por ejemplo, las técnicas para realizar mutaciones por sustitución en sitios predeterminados del ADN son muy conocidas por los expertos en el arte e incluyen mutagénesis M13, mutagénesis de T7-Gen in vitro (USB, Cleveland, OH), mutagénesis dirigida al sitio QuickChange (Stratagene, San Diego, CA), mutagénesis dirigida al sitio mediada por PCR u otros protocolos de mutagénesis dirigida al sitio (véase Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 y las actualizaciones anuales)).

Derivados Los "derivados" incluyen péptidos, oligopéptidos, polipéptidos que pueden comprender, en comparación con la secuencia de aminoácidos de la forma natural de la proteína tal como la proteína de interés, sustituciones de aminoácidos por residuos de aminoácidos no naturales o adiciones de residuos de aminoácidos no naturales. Los "derivados" de una proteína también abarcan péptidos, oligopéptidos, polipéptidos que comprenden residuos de aminoácidos alterados de forma natural (glucosilados, adiados, prenilados, fosforilados, miristoilados, sulfatados, etc.) o alterados de forma no natural, en comparación con la secuencia de aminoácidos de una forma natural del polipéptido. Un derivado también puede comprender uno o más sustituyentes o adiciones de no aminoácidos, en comparación con la secuencia de aminoácidos de la cual deriva, por ejemplo una molécula informadora u otro ligando, unido de forma covalente o no covalente a la secuencia de aminoácidos, tal como una molécula indicadora que se liga para facilitar su detección y residuos de aminoácidos no naturales, con respecto a la secuencia de aminoácidos de una proteína natural. Además, los "derivados" también incluyen fusiones de la forma natural de la proteína con péptidos rotuladores tales como FLAG, HIS6 o tiorredoxina (para una reseña sobre péptidos rotuladores, véase Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003).

Dominio, Motivo/Secuencia de consenso/Característica El término "dominio" se refiere a un conjunto de aminoácidos conservados en posiciones específicas a lo largo de un alineamiento de secuencias de proteínas relacionadas en la evolución. Mientras que los aminoácidos en otras posiciones pueden variar entre homólogos, los aminoácidos altamente conservados en posiciones específicas indican aminoácidos que probablemente son esenciales para la estructura, estabilidad o función de una proteína. Sí se los identifica por su alto grado de conservación en secuencias alineadas de una familia de homólogos de proteínas, se los puede utilizar como identificadores para determinar si cualquier polipéptido en cuestión pertenece a una familia de polipéptidos previamente identificada.

El término "motivo" o "secuencia de consenso" o "característica" se refiere a una región corta conservada en la secuencia de proteínas relacionadas en la evolución. Con frecuencia, los motivos son partes altamente conservadas de dominios, pero también pueden incluir solo parte del dominio, o pueden estar ubicados fuera del dominio conservado (si todos los aminoácidos del motivo están fuera de un dominio definido).

Existen bases de datos especializadas para la identificación de dominios, por ejemplo, S ART (Schuitz et al. (1998) Proc. Nati. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucí. Acids. Res. 31 , 315-318), Prosite (Bucher and Baíroch (1994), A generalized profile syntax for biomolecular sequences motifs and its function ¡n automatíc sequence interpretation. (En) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61 , AAAI Press, Menlo Park; Hulo et al., Nucí. Acids. Res. 32:D134-D137, (2004)), o Pfam (Bateman et al., Nucleic Acids Research 30(1 ): 276-280 (2002)). Un conjunto de herramientas para el análisis in silico de secuencias proteicas se encuentra disponible en el servidor proteómico ExPASy (Swiss Institute of Bioinformatícs (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31 :3784-3788(2003)). También se pueden identificar dominios o motivos mediante técnicas de rutina, tales como alineamiento de secuencias.

Los métodos para el alineamiento de secuencias para la comparación son muy conocidos en el arte, dichos métodos incluyen GAP, BESTFIT, BLAST, FASTA y TFASTA. GAP usa el algoritmo de Needleman y Wunsch ((1970) J Mol Biol 48: 443-453) para hallar el alineamiento global (es decir, que abarca las secuencias completas) de dos secuencias que maximiza la cantidad de coincidencias y minimiza la cantidad de brechas. El algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula el porcentaje de identidad de secuencia y realiza un análisis estadístico de la similitud entre las dos secuencias. El software para realizar el análisis BLAST está disponible al público mediante National Centre for Biotechnology Information (NCBI). Se pueden identificar fácilmente homólogos mediante, por ejemplo, el algoritmo ClustalW de alineamiento de secuencia múltiple (versión 1.83), con los parámetros predeterminados de alineamiento de a pares y un método de calificación en porcentaje. Los porcentajes globales de similitud e identidad también se pueden determinar mediante uno de los métodos disponibles en el paquete de software MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Se puede realizar edición manual menor para optimizar el alineamiento entre motivos conservados, como sería evidente para un experto en el arte. Además, en lugar de utilizar secuencias de longitud total para la identificación de homólogos, también se pueden utilizar dominios específicos. Los valores de identidad de secuencia se pueden determinar con respecto a la secuencia completa de ácidos nucleicos o aminoácidos, o con respecto a motivo(s) conservado(s) o dominios seleccionados, utilizando los programas antes mencionados con los parámetros predeterminados. Para los alineamientos locales, el algoritmo de Smith-Waterman es particularmente útil (Smith TF, Waterman MS (1981 ) J. Mol. Biol 147(1 );195-7).

BLAST recíproco En general, esto incluye un primer BLAST que implica someter a BLAST una secuencia incógnita (por ejemplo, usando cualquiera de las secuencias enumeradas en la Tabla A de la sección de Ejemplos) con respecto a cualquier base de datos de secuencias, tal como la base de datos disponible al público NCBI. Generalmente, se utiliza BLASTN o TBLASTX (con valores predeterminados estándar) cuando se comienza desde una secuencia de nucleótidos y BLASTP o TBLASTN (con valores predeterminados estándar) cuando se comienza desde una secuencia de proteínas. Los resultados de BLAST se pueden filtrar opcionalmente. Las secuencias de longitud total de los resultados filtrados o de los resultados no filtrados luego se someten de nuevo a BLAST (segundo BLAST) con respecto a secuencias provenientes del organismo del cual deriva la secuencia incógnita Luego se comparan los resultados del primer y segundo BLAST. Se identifica un parálogo si una coincidencia de alto rango del primer blast proviene de la misma especie de la cual deriva la secuencia incógnita, entonces un nuevo blast idealmente daría como resultado que la secuencia incógnita se encuentre entre las mayores coincidencias; se identifica un ortólogo si una coincidencia de alto rango en el primer BLAST no proviene de la misma especie de la cual deriva la secuencia incógnita y preferentemente, daría como resultado que el nuevo BLAST en la secuencia incógnita se encuentre entre las mayores coincidencias.

Las coincidencias de alto rango son aquellas que tienen bajo valor E. Cuanto más bajo es el valor E, más importante es la calificación (o, en otras palabras, menor es la probabilidad de hallar la coincidencia por azar). El cálculo del valor E es bien conocido en el arte. Además de los valores E, las comparaciones también se califican por porcentaje de identidad. El porcentaje de identidad se refiere a la cantidad de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o polipéptidos) comparadas a lo largo de una longitud particular. En el caso de grandes familias, se puede utilizar ClustalW, seguido por un árbol de unión cercana, para contribuir a visualizar la agrupación de genes relacionados e identificar ortólogos y parálogos.

Hibridación El término "hibridación", como se define en la presente, es un proceso en el cual las secuencias de nucleótidos complementarias considerablemente homologas se aparean entre sí. El proceso de hibridación se puede producir por completo en solución, es decir, ambos ácidos nucleicos complementarios están en solución. El proceso de hibridación también se puede producir con uno de lós ácidos nucleicos complementarios inmovilizados en una matriz tal como esferas magnéticas, esferas de sefarosa o cualquier otra resina. El proceso de hibridación también se puede producir con uno de los ácidos nucleicos complementarios inmovilizados en un soporte sólido tal como una membrana de nitrocelulosa o nylon o inmovilizado, por ejemplo, por fotolitografía, por ejemplo, en un soporte de vidrio silíceo (este último se conoce como micromatriz multigénica o como chips de ácido nucleico). Con el fin de permitir que se produzca la hibridación, las moléculas de ácido nucleico generalmente se desnaturalizan en forma térmica o química para fundir una doble cadena en dos cadenas simples y/o eliminar las horquillas u otras estructuras secundarias de los ácidos nucleicos monocatenarios.

El término "rigurosidad" se refiere a las condiciones en las cuales tiene lugar la hibridación. La rigurosidad de hibridación está influenciada por condiciones tales como temperatura, concentración salina, fuerza iónica y composición del buffer de hibridación. Generalmente, las condiciones de baja rigurosidad se seleccionan para que sean de alrededor de 30 °C por debajo del punto de fusión térmico (Tm) de la secuencia específica con una fuerza iónica y pH definidos. Las condiciones de rigurosidad media son aquellas en que la temperatura es 20 °C por debajo de Tm y las condiciones de rigurosidad alta son aquellas en que la temperatura es 10 °C por debajo de Tm. Las condiciones de rigurosidad alta se utilizan típicamente para aislar secuencias de hibridación que tienen mucha similitud de secuencia con la secuencia de ácidos nucleicos blanco. Sin embargo, los ácidos nucleicos se pueden desviar en secuencia y aún así codificar un polipéptido considerablemente idéntico, debido a la degeneración del código genético. En consecuencia, algunas veces las condiciones de hibridación de rigurosidad media pueden ser necesarias para identificar dichas moléculas de ácido nucleico.

La Tm es la temperatura con una fuerza iónica y pH definidos, a la cual el 50 % de la secuencia blanco se híbrida a una sonda perfectamente apareada. La Tm depende de las condiciones de la solución y la composición base y la longitud de la sonda. Por ejemplo, las secuencias más largas se hibridan específicamente a temperaturas más elevadas. La tasa máxima de hibridación se obtiene de alrededor de 16 X a 32 °C por debajo de Tm. La presencia de cationes monovalentes en la solución de hibridación reduce la repulsión electroestática entre las dos cadenas de ácido nucleico, promoviendo de este modo la formación de híbridos; este efecto es visible para las concentraciones de sodio de hasta 0,4 M (para mayores concentraciones, este efecto se puede ignorar). La formamida reduce la temperatura de fusión de los dúplex de ADN-ADN y ADN-ARN con 0,6 a 0,7°C para cada porcentaje de formamida, y la adición de 50 % de formamida permite que la hibridación se realice de 30 a 45 °C, si bien se reducirá la tasa de hibridación. Los errores de apareamiento de los pares de bases reducen la tasa de hibridación y la estabilidad térmica de los dúplex. En promedio y para sondas grandes, la Tm disminuye alrededor de 1 °C por % de errores de apareamiento de las bases. La Tm se puede calcular con las siguientes ecuaciones, según los tipos de híbridos: 1 ) Híbridos de ADN-ADN (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984): Tm= 81 ,5°C + 16,6xlog10[Na+]a + 0,41 x%[G/Cb] - 500x[Lc]"1 - 0,61 x% de formamída 2) Híbridos de ADN-ARN o ARN -ARN: Tm= 79,8°C+ 18.5 (log10[Na+]a) + 0,58 (%G/Cb) + 1 1 ,8 (%G/Cb)2 - 820/Lc 3) Híbridos de oligo-ADN u ol¡go-ARNd: Para <20 nucleótidos: Tm= 2 (ln) Para 20-35 nucleótidos: Tm= 22 + 1 ,46 (ln) a o para otro catión monovalente, pero solo exacto en el rango 0,01-0,4 M. b solo exacto para el % de GC en el rango de 30 % a 75 %. 0 L = longitud del dúplex en pares de bases. d oligo, oligonucleótidos; ln, = longitud efectiva del cebador = 2?(??. de G/C)+(No. de A/T).

La unión no específica se puede controlar mediante cualquiera de las numerosas técnicas conocidas tales como, por ejemplo, bloqueo de la membrana con soluciones que contienen proteínas, adiciones de ARN, ADN y SDS heterólogos al buffer de hibridación y tratamiento con Rnasa. En las sondas no homologas, se puede realizar una serie de hibridaciones mediante la variación de uno de las siguientes (i) reducir progresivamente la temperatura de apareamiento (por ejemplo, de 68°C a 42°C) o (i¡) reducir progresivamente la concentración de formamída (por ejemplo, de 50 % a 0 %). El experto en el arte conoce varios parámetros que se pueden alterar durante la hibridación y que mantendrán o cambiarán las condiciones de rigurosidad.

Además de las condiciones de hibridación, la especificidad de la hibridación generalmente también depende de la función de los lavados posteriores a la hibridación. Para retirar el fondo que resulta de la hibridación no específica, las muestras se lavan con soluciones salinas diluidas. Los factores críticos de dichos lavados incluyen la fuerza iónica y la temperatura de la solución de lavado final: a menor concentración salina y mayor temperatura del lavado, mayor rigurosidad del lavado. Las condiciones de lavado se realizan típicamente con la rigurosidad de la hibridación o con una rigurosidad inferior a esta. Una hibridación positiva produce una señal que es por lo menos el doble de la del fondo. Generalmente, las condiciones de rigurosidad adecuadas para los ensayos de hibridación de ácido nucleico o procedimientos de detección de amplificación génica son como se indicaron anteriormente. También se pueden seleccionar condiciones más o menos rigurosas. El experto en el arte conoce varios parámetros que se pueden alterar durante el lavado y que mantendrán o cambiarán las condiciones de rigurosidad.

Por ejemplo, las condiciones de hibridación de alta rigurosidad típicas para los híbridos de ADN mayores de 50 nucleótidos comprenden hibridación a 65°C en 1 SSC o a 42°C en 1x SSC y 50 % de formamida, seguida de lavados a 65°C en 0,3x SSC. Los ejemplos de condiciones de hibridación de rigurosidad media para híbridos de ADN mayores de 50 nucleótidos comprenden hibridación a 50°C en 4x SSC o a 40°C en 6x SSC y 50 % de formamida, seguida de lavados a 50°C en 2x SSC. La longitud del híbrido es la longitud prevista para el ácido nucleico de hibridación. Cuando los ácidos nucleicos de secuencia conocida se hibridan, se puede determinar la longitud del híbrido mediante el alineamiento de las secuencias y la identificación de las regiones conservadas descritas en la presente. 1 *SSC es NaCI 0,15 M y citrato de sodio 15 mM; la solución de hibridación y las soluciones de lavado también pueden incluir reactivo de Denhardt 5x, 0,5—1 ,0 % de SDS, 100 pg/ml de ADN de esperma de salmón fragmentado, desnaturalizado, 0,5 % de pirofosfato de sodio.

A fin de definir el nivel de rigurosidad, se puede hacer referencia a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York o a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 y las actualizaciones anuales).

Variante de empalme Como se usa en la presente, la expresión "variante de empalme" abarca variantes de una secuencia de ácidos nucleicos en la cual se escindieron, reemplazaron, desplazaron o agregaron intrones y/o exones seleccionados, o en la cual se acortaron o alargaron intrones. Dichas variantes serán aquellas en las que la actividad biológica de la proteína es considerablemente retenida; esto se puede obtener mediante la retención selectiva de segmentos funcionales de la proteína. Dichas variantes de empalme se pueden hallar en la naturaleza o pueden ser fabricadas por el hombre. Los métodos para predecir y aislar dichas variantes de empalme son muy conocidos en el arte (véase, por ejemplo, Foissac and Schiex (2005) BMC Bioinformatics 6: 25).

Variante alélica Los "alelos" o las "variantes alélicas" son formas alternativas de un gen determinado, ubicado en la misma posición del cromosoma. Las variantes alélicas abarcan polimorfismos de nucleótido único (SNP) y también polimorfismos de inserción/eliminación pequeña (INDEL). Usualmente, el tamaño de los INDEL es menor de 100 pb. Los SNP e INDEL forman el mayor conjunto de variantes de secuencia en las cepas polimórficas naturales de la mayoría de los organismos.

Gen endógeno La referencia en la presente a un gen "endógeno" no solo se refiere al gen en cuestión como se encuentra en una planta en su forma natural (es decir, sin que medie intervención humana), sino que también se refiere a ese mismo gen (o a un gen/ácido nucleico considerablemente homólogo) en forma aislada que es (re)introducido posteriormente en una planta (un transgén). Por ejemplo, una planta transgénica que contiene dicho transgén puede presentar una reducción considerable de la expresión del transgén y/o una reducción considerable de la expresión del gen endógeno. El gen aislado se puede aislar de un organismo o puede ser preparado por el hombre, por ejemplo, mediante síntesis química.

Transposición qénica/Evolución dirigida La "transposición génica" o "evolución dirigida" consiste en iteraciones de transposición de ADN seguido del barrido y/o selección adecuada para generar variantes de ácidos nucleicos o porciones de estos que codifican proteínas que tienen actividad biológica modificada (Castle - et al., (2004) Science 304(5674): 1 151-4; patentes estadounidenses 5.81 1.238 y 6.395.547).

Constructo El ADN artificial (por ejemplo, plásmidos o ADN viral) puede replicarse en una célula huésped y se usa para la introducción de una secuencia de ADN de interés en una célula u organismo huésped. Las células huésped de la invención pueden ser cualquier célula seleccionada de células bacterianas, tales como células de especies de Escherichia coli o Agrobacterium, células de levadura, células de hongos, algas o cianobacterias o células vegetales. El experto en el arte conoce los elementos genéticos que deben estar presentes en el constructo genético, a fin de transformar, seleccionar y propagar exitosamente las células huésped que contienen la secuencia de interés. La secuencia de interés está ligada operativamente a una o más secuencias de control (al menos a un promotor), como se describe en la presente. Otros elementos reguladores pueden incluir mejoradores de la transcripción y de la traducción. Los expertos en el arte conocen las secuencias terminadoras y mejoradoras que pueden ser adecuadas para utilizar en la realización de la invención. También se puede agregar una secuencia intrónica a la región 5' no traducida (UTR) o en la secuencia codificante para aumentar la cantidad de mensaje maduro que se acumula en el citosol, como se describe en la sección de definiciones. Otras secuencias de control (además de las secuencias promotoras, mejoradoras, silenciadoras, intronicas, regiones 3'UTR y/o 5'UTR) pueden ser elementos estabilizadores de ARN y/o proteína. El experto en el arte conoce dichas secuencias o las puede obtener fácilmente.

Los constructos genéticos de la invención también pueden incluir una secuencia de origen de replicación que es necesaria para el mantenimiento y/o la replicación en un tipo de célula específica. Un ejemplo es cuando es necesario mantener un constructo genético en una célula bacteriana como elemento genético episomal (por ejemplo, una molécula de cósmido o plásmido) Los orígenes de replicación preferidos incluyen, pero no se limitan a, f 1 -ori y colE1.

Para detectar la transferencia exitosa de las secuencias de ácidos nucleicos como se usan en los métodos de la invención y/o la selección de plantas transgénicas que comprenden estos ácidos nucleicos, es ventajoso usar genes marcadores (o genes indicadores). Por lo tanto, el constructo genético puede comprender, opcionalmente, un gen marcador seleccionable. Los marcadores seleccionables se describen en mayor detalle en la sección "definiciones" de la presente. Los genes marcadores se pueden retirar o eliminar de la célula transgénica cuando dejan de ser necesarios. Las técnicas para retirar marcadores son conocidas en el arte, se describieron técnicas útiles en la sección de definiciones.

Elemento regulador/Secuencia de control/Promotor Las expresiones "elemento regulador", "secuencia de control" y "promotor" se utilizan en forma indistinta en la presente y se deben interpretar en un contexto amplio para referirse a secuencias de ácidos nucleicos reguladoras capaces de efectuar la expresión de las secuencias a las cuales están ligadas. En general, el término "promotor" se refiere a una secuencia de control de ácidos nucleicos ubicada corriente arriba del inicio de la transcripción de un gen y que participa en el reconocimiento y la unión de ARN polimerasa y otras proteínas, dirigiendo de este modo la transcripción de un ácido nucleico ligado operativamente. Las expresiones antes mencionadas abarcan las secuencias reguladoras transcripcionales derivadas de un gen genómico eucariótico clásico (incluso la caja TATA que es necesaria para la iniciación precisa de la transcripción, con o sin una secuencia de la caja CCAAT) y elementos reguladores adicionales (es decir, secuencias de activación corriente arriba, potenciadores y silenciadores) que alteran la expresión génica en respuesta a los estímulos del desarrollo y/o externos, o de manera específica de tejido. La expresión también incluye una secuencia reguladora transcripcional de un gen procariótico clásico, en cuyo caso puede incluir una secuencia de la caja -35 y/o secuencias reguladoras transcripcionales de la caja -10. La expresión "elemento regulador" también abarca una molécula de fusión sintética o derivado que confiere, activa o mejora la expresión de una molécula de ácido nucleico en una célula, un tejido u un órgano.

Un "promotor de planta" comprende elementos reguladores que median la expresión de un segmento de una secuencia codificante en las células de las plantas. En consecuencia, un promotor de planta no necesita ser de origen vegetal, pero se puede originar a partir de virus o microorganismos, por ejemplo de virus que atacan las células de las plantas. El "promotor de planta" también se puede originar a partir de una célula de planta, por ejemplo, de la planta que se transforma con la secuencia de ácidos nucleicos expresada en el proceso de la invención y que se describe en la presente. Esto también se aplica a otras señales reguladoras de "planta", tales como terminadores de "planta". Los promotores corriente arriba de las secuencias de nucleótidos útiles en los métodos de la presente invención se pueden modificar mediante una o más sustituciones, inserciones y/o supresiones de nucleótidos sin interferir con la funcionalidad o actividad de cualquiera de los promotores, el marco de lectura abierto (ORF) o la región reguladora 3' tal como terminadores u otras regiones reguladoras 3' que se localizan fuera del ORF. Además, es posible que la actividad de los promotores aumente mediante la modificación de su secuencia o que sean reemplazados por completo por promotores más activos, incluso promotores de organismos heterólogos. Para la expresión en plantas, la molécula de ácido nucleico, como se describió anteriormente, debe estar ligada operativamente o comprender un promotor adecuado que exprese el gen en el punto temporal correcto y con el patrón de expresión espacial requerido.

Para la identificación de promotores funcionalmente equivalentes, la potencia del promotor y/o el patrón de expresión de un promotor candidato se pueden analizar, por ejemplo, mediante la unión operativa del promotor a un gen indicador y el análisis del nivel de expresión y patrón del gen indicador en varios tejidos de la planta. Los genes indicadores conocidos y adecuados incluyen, por ejemplo, beta-glucuronidasa o beta-galactosidasa. La actividad del promotor se analiza al medir la actividad enzimática de la beta-glucuronidasa o beta-galactosidasa. La potencia del promotor y/o el patrón de expresión luego se pueden comparar con los de un promotor de referencia (tal como el que se utiliza en los métodos de la presente invención). Alternativamente, la potencia del promotor se puede analizar mediante la cuantificación de los niveles de mARN o mediante la comparación de los niveles de mARN del ácido nucleico utilizado en los métodos de la presente invención, con niveles de mARN de genes housekeeping tales como rARN 18S, con los métodos conocidos en el arte, tales como Northern blotting con análisis densitométrico de autorradiogramas, PCR cuantitativo en tiempo real o RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Generalmente, por "promotor débil" se entiende un promotor que dirige la expresión de una secuencia codificante a un nivel bajo. Por "nivel bajo" se entienden niveles de alrededor de 1/10.000 transcriptos a alrededor de 1/100.000 transcriptos, a alrededor de 1/500.0000 transcriptos por célula. Por el contrario, un "promotor fuerte" dirige la expresión de una secuencia codificante a un nivel alto o de alrededor de 1/10 transcriptos a alrededor de 1/100 transcriptos a alrededor de 1/1000 transcriptos por célula. En general, por "promotor de potencia media" se entiende un promotor que dirige la expresión de una secuencia codificante a un nivel más bajo que un promotor fuerte, en particular a un nivel que es, en todos los casos, inferior al obtenido bajo el control de un promotor 35S CaMV.

Ligado operativamente Como se usa en la presente, la expresión "ligado operativamente" se refiere a un enlace funcional entre la secuencia del promotor y el gen de interés, de modo que la secuencia del promotor puede iniciar la transcripción del gen de interés.

Promotor constitutivo Un "promotor constitutivo" se refiere a un promotor que es activo en la transcripción durante la mayoría, pero no necesariamente todas, las fases de crecimiento y desarrollo y en la mayoría de las condiciones ambientales, en al menos una célula, tejido o un órgano. La siguiente Tabla 2a provee ejemplos de promotores constitutivos.

Tabla 2a: Ejemplos de promotores constitutivos Promotor ubicuo Un "promotor ubicuo" es activo en casi todos los tejidos o células de un organismo.

Promotor regulado por el desarrollo Un "promotor regulado por el desarrollo" es activo durante ciertas etapas del desarrollo o en partes de la planta que experimentan cambios del desarrollo.

Promotor inducible Un "promotor inducible" ha inducido o aumentado la iniciación de la transcripción en respuesta a un estímulo químico (para una reseña, véase Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental o físico, o puede ser "inducible por estrés", es decir, que se activa cuando una planta se expone a diversas condiciones de estrés, o "inducible por patógeno" es decir, que se activa cuando una planta se expone a diversos patógenos.

Promotor específico de órgano/específico de tejido Un promotor específico de órgano o específico de tejido es un promotor capaz de iniciar preferentemente, la transcripción en ciertos órganos o tejidos, tales como hojas, raíces, tejido de semilla, etc. Por ejemplo, un "promotor específico de raíz" es un promotor activo durante la transcripción predominantemente en las raíces de las plantas, excluyendo en gran medida cualquier otra parte de una planta, aun mientras permite cualquier expresión con pérdida en estas otras partes de la planta. Los promotores capaces de iniciar la transcripción solo en ciertas células se denominan en la presente "específicos de célula".

Los ejemplos de promotores específicos de raíz se enumeran en la siguiente Tabla 2b: Tabla 2b: Ejemplos de promotores específicos de raíz Un "promotor específico de semilla" es activo durante la transcripción predominantemente en el tejido de semillas, pero no necesariamente en forma exclusiva en el tejido de las semillas (en casos de expresión con pérdida). El promotor específico de semilla puede ser activo durante el desarrollo de la semilla y/o durante la germinación. El promotor específico de semilla puede ser específico de endosperma/aleurona/embrión. Los ejemplos de promotores específicos de semilla (específicos de endosperma/aleurona/embrión) se indican en las siguientes Tabla 2c a Tabla 2f. Otros ejemplos de promotores específicos de semilla se proveen en Qing Qu and Takaiwa (Plant Biotechnol. J. 2, 1 13-125, 2004), cuya descripción se incorpora a la presente por referencia como si se indicara en su totalidad.

Tabla 2c: Ejemplos de promotores específicos de semilla Tabla 2d: Ejemplos de promotores específicos de endoesperma Tabla 2e: Ejemplos de promotores específicos de embrión: Tabla 2f: Ejemplos de promotores específicos de aleurona: Un "promotor específico de tejido verde", como se define en la presente, es un promotor que es activo durante la transcripción predominantemente en el tejido verde, excluyendo en gran medida cualquier otra parte de una planta, aun mientras permite cualquier expresión con pérdida en estas otras partes de la planta.

Los ejemplos de promotores específicos de tejido verde que se pueden utilizar para llevar a cabo los métodos de la invención se indican en la siguiente Tabla 2g.

Tabla 2g: Ejemplos de promotores específicos de tejido verde Otro ejemplo de un promotor específico de tejido es un promotor específico de meristema, que es activo durante la transcripción predominantemente en tejido meristemático, excluyendo en gran medida cualquier otra parte de una planta, aun mientras permite cualquier expresión con pérdida en estas otras partes de la planta. Los ejemplos de promotores específicos de meristema verde que se pueden utilizar para llevar a cabo los métodos de la invención se indican en la siguiente Tabla 2h.

Tabla 2h: Ejemplos de promotores específicos de meristema Terminador El término "terminador" abarca una secuencia de control que es una secuencia de ADN en el extremo de una unidad de transcripción que señala el procesamiento 3' y la poliadenilación de un transcripto primario y la terminación de la transcripción. El terminador puede derivar del gen natural, de una variedad de otros genes de planta o de T-ADN. El terminador a agregar puede derivar, por ejemplo, de los genes de nopalina sintasa u octopina sintasa o, alternativamente, de otro gen de planta o, con menor preferencia, de cualquier otro gen eucariótico.

(Gen) marcador seleccionable/ Gen indicador "Marcador seleccionable", "gen marcador seleccionable" o "gen indicador" incluyen cualquier gen que confiere un fenotipo a una célula en la cual se expresa para facilitar la identificación y/o selección de las células que son transfectadas o transformadas con un constructo de ácido nucleico de la invención. Estos genes marcadores permiten la identificación de una transferencia exitosa de las moléculas de ácido nucleico mediante una serie de diferentes principios. Los marcadores adecuados se pueden seleccionar a partir de marcadores que confieren resistencia a antibióticos o herbicidas, que introducen un nuevo rasgo metabólico o que permiten la selección visual. Los ejemplos de genes marcadores seleccionares incluyen los genes que confieren resistencia a antibióticos (tales como nptll que fosforila neomicina y canamicina, o hpt que fosfohla higromicina, o genes que confieren resistencia, por ejemplo, a bleomicina, estreptomicina, tetraciclina, cloramfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina o blasticidina), a herbicidas (por ejemplo, bar que confiere resistencia a Basta®; aroA o gox que confiere resistencia a glifosato, o los genes que confieren resistencia, por ejemplo, a imidazolinona, fosfinotricina o sulfonilurea), o genes que proveen un rasgo metabólico (tales como manA que permite a las plantas usar mañosa como única fuente de carbono o xilosa isomerasa para la utilización de xilosa, o marcadores antinutritivos, tales como resistencia a 2-desoxiglucosa). La expresión de genes marcadores visuales da como resultado la formación de color (por ejemplo, ß-glucuronidasa, GUS o ß-galactosidasa con sus sustratos con color, por ejemplo X-Gal), luminiscencia (tales como el sistema de luciferina/luciferasa) o fluorescencia (proteína fluorescente verde, GFP, y sus derivados). Esta lista representa solo una pequeña cantidad de posibles marcadores. El trabajador experto está familiarizado con dichos marcadores. Se prefieren diferentes marcadores según el organismo y el método de selección.

Se sabe que luego de la integración estable o transitoria de los ácidos nucleicos en las células vegetales, solo una minoría de las células absorbe el ADN exógeno y, si se desea, lo integra en su genoma, dependiendo del vector de expresión y la técnica de transfección utilizados. Para identificar y seleccionar estos integrantes, usualmente se introduce un gen que codifica un marcador seleccionable (tales como aquellos descritos anteriormente) en las células huésped junto con el gen de interés. Estos marcadores pueden usarse, por ejemplo, en mutantes en los cuales estos genes no sean funcionales mediante, por ejemplo, eliminación por métodos convencionales. Asimismo, las moléculas de secuencia de ácidos nucleicos que codifican un marcador seleccionable se pueden introducir en una célula huésped en el mismo vector que comprende la secuencia que codifica los polipéptidos de la invención o usados en los métodos de la invención, o de otro modo en un vector separado. Se pueden identificar las células que fueron transfectadas de forma estable con el ácido nucleico introducido, por ejemplo, mediante selección (por ejemplo, las células que integraron el marcador seleccionable sobreviven, mientras que las otras células mueren).

Debido a que los genes marcadores, en particular los genes de resistencia a antibióticos y herbicidas, ya no son necesarios o son indeseados en la célula huésped transgénica, una vez que los ácidos nucleicos han sido introducidos con éxito, el proceso de acuerdo con la invención para introducir los ácidos nucleicos utiliza en forma ventajosa técnicas que permiten la eliminación o escisión de estos genes marcadores. Uno de dichos métodos es conocido como cotransformación. El método de cotransformación usa dos vectores simultáneamente para la transformación, en donde un vector tiene el ácido nucleico de acuerdo con la invención y un segundo vector tiene el/los gen(es) marcador(es). Una gran proporción de transformantes recibe o, en el caso de las plantas, comprende (hasta 40 % o más de los transformantes), ambos vectores. En el caso de la transformación con Agrobacterias, los transformantes usualmente reciben solo una parte del vector, es decir, la secuencia flanqueada por el T-ADN, que usualmente representa el cásete de expresión. Los genes marcadores luego se pueden eliminar de la planta transformada mediante la realización de cruzas. En otro método, los genes marcadores integrados en un transposón se utilizan para la transformación junto con el ácido nucleico deseado (conocido como tecnología Ac/Ds). Los transformantes se pueden cruzar con una fuente de transposasa o los transformantes se transforman con un constructo de ácido nucleico que confiere expresión de una transposasa, en forma transitoria o estable.

En algunos casos (aprox. 10 %), el transposón sale del genoma de la célula huésped una vez que se produce con éxito la transformación, y se pierde. En otros casos, el transposón salta a una ubicación diferente. En estos casos, el gen marcador se debe eliminar mediante la realización de cruzas. En microbiología, se desarrollaron técnicas que posibilitan o facilitan la detección de dichos eventos. Otro método ventajoso es lo que se conoce como sistemas de recombinación, cuya ventaja es que se puede prescindir de la eliminación por cruza. El sistema más conocido de este tipo es el denominado sistema Cre/lox. Creí es una recombinasa que elimina las secuencias ubicadas entre las secuencias loxP. Si el gen marcador se integra entre las secuencias loxP, se lo elimina una vez que se ha producido con éxito la transformación mediante la expresión de la recombinasa. Otros sistemas de recombinación son los sistemas HIN/HIX, FLP/FRT y REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Es posible una integración específica de sitio en el genoma de la planta de las secuencias de ácidos nucleicos de acuerdo con la invención. Obviamente, estos métodos también se pueden aplicar a microorganismos tales como levadura, hongos o bacterias.

Transqénico/T ransqén /Recombinante A los fines de la invención, "transgénico", "transgén" o "recombinante" significan, por ejemplo, con respecto a una secuencia de ácidos nucleicos, un cásete de expresión, un constructo génico o un vector que comprende la secuencia de ácidos nucleicos o un organismo transformado con las secuencias de ácidos nucleicos, casetes de expresión o vectores de acuerdo con la invención, todas aquellas construcciones obtenidas por métodos recombinantes en los cuales (a) las secuencias de ácidos nucleicos que codifican proteínas útiles en los métodos de la invención, o (b) secuencia(s) de control genético que está ligada operativamente a la secuencia de ácidos nucleicos de acuerdo con la invención, por ejemplo un promotor, o (c) a) y b) no se encuentran en su ambiente genético natural o fueron modificadas por métodos recombinantes, en donde es posible que la modificación sea, por ejemplo, una sustitución, adición, eliminación, inversión o inserción de uno o más residuos de nucleótidos. "Entorno genético natural" significa el locus cromosómico o genómico natural en la planta original o la presencia en una genoteca genómica. Preferentemente, en el caso de una genoteca genómica, se retiene, al menos en parte, el entorno genético natural de la secuencia de ácidos nucleicos. El ambiente flanquea la secuencia de ácidos nucleicos al menos en un lado y tiene una longitud de secuencia de al menos 50 bp, preferentemente, al menos 500 bp, preferentemente, en especial al menos 1000 bp, con máxima preferencia, al menos 5000 bp. Un cásete de expresión natural - por ejemplo, la combinación natural del promotor natural de las secuencias de ácidos nucleicos con la correspondiente secuencia de ácidos nucleicos que codifica un polipéptido útil en los métodos de la presente invención, como se define en la presente - se convierte en un cásete de expresión transgénico cuando este cásete de expresión es modificado por métodos de síntesis no naturales ("artificiales") tales como, por ejemplo, tratamiento mutagénico. Los métodos adecuados se describen, por ejemplo, en US 5565350 o WO 00/15815.

Por lo tanto, a los fines de la invención, una planta transgénica significa, como se indicó anteriormente, que los ácidos nucleicos usados en el método de la invención no están presentes o se originan del genoma de dicha planta o están presentes en el genoma de dicha planta, pero no en su locus natural en el genoma de dicha planta, y es posible que los ácidos nucleicos se expresen de manera homologa o heteróloga. Sin embargo, como se mencionó, transgénico también significa que, mientras que ios ácidos nucleicos de acuerdo con la invención o utilizados en el método de la invención se encuentran en su posición natural en el genoma de una planta, la secuencia fue modificada con respecto a la secuencia natural y/o que las secuencias reguladoras de las secuencias naturales fueron modificadas. Preferentemente, transgénico significa la expresión de los ácidos nucleicos de acuerdo con la invención en un locus no natural en el genoma, es decir que tiene lugar la expresión homologa o, preferentemente, heteróloga de los ácidos nucleicos. Las plantas transgénicas preferidas se mencionan en la presente.

También se debe tener en cuenta que, en el contexto de la presente invención, la expresión "ácido nucleico aislado" o "polipéptido aislado" se puede considerar, en algunos casos, sinónimo de un "ácido nucleico recombinante" o de un "polipéptido recombinante", respectivamente, y se refiere a un ácido nucleico o polipéptido que no se encuentra en su entorno genético natural y/o que se modificó por métodos recombinantes.

Modulación El término "modulación" significa, con respecto a la expresión o expresión génica, un proceso en el que el nivel de expresión es cambiado por dicha expresión génica en comparación con la planta de control, el nivel de expresión se puede aumentar o disminuir. La expresión original no modulada puede ser de cualquier tipo de expresión de un ARN (rARN, tARN) o mARN estructural con la posterior traducción. A los fines de la presente invención, la expresión original no modulada también puede ser ausencia de cualquier expresión. La expresión "modulación de la actividad" significa todo cambio de expresión de las secuencias de ácidos nucleicos de la invención o proteínas codificadas, que genera un mayor rendimiento y/o un mayor crecimiento de las plantas. La expresión puede aumentar desde cero (ausencia de expresión o expresión no medible) hasta una cierta cantidad, o puede disminuir desde una cierta cantidad hasta cantidades pequeñas no medibles o hasta cero.

Expresión Las expresiones "expresión" o "expresión génica" significan la transcripción de un gen específico o genes específicos o constructo genético específico. En particular, las expresiones "expresión" o "expresión génica" significan la transcripción de uno o más genes o constructo genético en ARN (rARN, tARN) o mARN estructural con o sin la posterior traducción del último en una proteína. El proceso incluye la transcripción de ADN y el procesamiento del producto de mARN resultante.

Mayor expresión/sobreexpresión Como se usan en la presente, las expresiones "mayor expresión" o "sobreexpresión" significan cualquier forma de expresión adicional al nivel de expresión original del tipo silvestre. A los fines de la presente invención, el nivel de expresión original del tipo silvestre también puede ser cero, es decir, ausencia de expresión o expresión no medible.

Los métodos para aumentar la expresión de genes o productos génicos están documentados en el arte e incluyen, por ejemplo, la sobreexpresión dirigida por promotores adecuados, el uso de potenciadores de la transcripción o de la traducción. Los ácidos nucleicos aislados que actúan como elementos promotores o potenciadores se pueden introducir en una posición adecuada (en general, corriente arriba) de una forma no heteróloga de un polinucleótido, a fin de regular en forma ascendente la expresión de un ácido nucleico que codifica el polipéptido de interés. Por ejemplo, los promotores endógenos se pueden alterar in vivo mediante mutación, eliminación y/o sustitución (véase, Kmiec, US 5.565.350; Zarling et al., W09322443) o se pueden introducir promotores aislados en una célula vegetal en la orientación y distancia adecuadas de un gen de la presente invención a fin de controlar la expresión del gen.

Si se desea la expresión de un polipéptido, generalmente es deseable incluir una región de poliadenilación en el extremo 3' de una región codificante de polinucleótidos. La región de poliadenilación puede derivar del gen natural, de una variedad de otros genes de planta o de T-ADN. La secuencia del terminal 3' que se desea agregar puede derivar, por ejemplo, de los genes de nopalina sintasa u octopina sintasa o, alternativamente, de otro gen vegetal o, con menor preferencia, de cualquier otro gen eucariótico.

También se puede agregar una secuencia ¡ntrónica a la región 5' no traducida (UTR) o la secuencia codificante de la secuencia codificante parcial para aumentar la cantidad de mensaje maduro que se acumula en el citosol. Se ha demostrado que la inclusión de un intrón empalmable en la unidad de transcripción tanto en los constructos de expresión vegetales y animales aumenta la expresión génica a nivel del ARNm y de las proteínas hasta 1000 veces (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1 :1183-1200). En general, la mejora intrónica de la expresión génica es mayor cuando se coloca cerca del terminal 5' de la unidad de transcripción. El uso de los intrones del maíz intrón Adh1-S 1 , 2 y 6, el intrón Bronze-1 es conocido en el arte. Para información general véase: The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

Menor expresión La referencia en la presente a "menor expresión" o "reducción o eliminación considerable" de la expresión significa una disminución en la expresión de un gen endógeno y/o en los niveles de polipéptidos y/o en la actividad de polipéptidos con respecto a las plantas de control. La reducción o eliminación considerable es, en orden creciente de preferencia, al menos 10 %, 20 %, 30 %, 40 % o 50 %, 60 %, 70 %, 80 %, 85 %, 90 % o 95 %, 96 %, 97 %, 98 %, 99 % o más de reducción en comparación con las plantas de control.

Para la reducción o eliminación considerable de la expresión de un gen endógeno en una planta, es necesario que los nucleótidos considerablemente contiguos de una secuencia de ácidos nucleicos tengan una longitud suficiente. A fin de realizar el silenciamiento génico, esta puede tener tan pocos como 20, 19, 18, 17, 16, 15, 14, 13, 12, 11 , 10 o menos nucleótidos, alternativamente esta puede ser igual al gen entero (incluso UTR 5' y/o 3', ya sea total o parcialmente). La porción de nucleótidos considerablemente contiguos puede derivar del ácido nucleico que codifica la proteína de interés (gen blanco) o de cualquier ácido nucleico capaz de codificar un ortólogo, parálogo u homólogo de la proteína de interés. Preferentemente, la porción de nucleótidos considerablemente contiguos es capaz de formar uniones de hidrógeno con el gen blanco (ya sea cadena sentido o antisentido), con mayor preferencia, la porción de nucleótidos considerablemente contiguos tiene, en orden creciente de preferencia, 50 %, 60 %, 70 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %. 99 %, 100 % de identidad de secuencia con el gen blanco (ya sea cadena sentido o antisentido). Una secuencia de ácidos nucleicos que codifica un polipéptido (funcional) no es un requisito de los diversos métodos analizados en la presente para la reducción o eliminación considerable de la expresión de un gen endógeno.

Esta reducción o eliminación considerable de la expresión se puede lograr mediante herramientas y técnicas de rutina. Un método preferido para la reducción o eliminación considerable de la expresión del gen endógeno es mediante la introducción y expresión en una planta de un constructo genético en el cual el ácido nucleico (en este caso una porción de nucleótidos considerablemente contiguo derivados del gen de interés o de cualquier ácido nucleico capaz de codificar un ortólogo, parálogo u homólogo de cualquiera de las proteínas de interés) se clona como una repetición invertida (total o parcialmente), separada por un espaciador (ADN no codificante).

En dicho método preferido, la expresión del gen endógeno se reduce o elimina considerablemente mediante el silenciamiento mediado por ARN con el uso de una repetición invertida de un ácido nucleico o una parte de este (en este caso, una porción de nucleótidos considerablemente contiguos derivada del gen de interés o de cualquier ácido nucleico capaz de codificar un ortólogo, parálogo u homólogo de la proteína de interés), preferentemente, capaz de formar una estructura de horquilla. La repetición invertida se clona en un vector de expresión que comprende secuencias de control. Una secuencia de ácidos nucleicos de ADN no codificante (un separador, por ejemplo un fragmento de la región de unión a la matriz (MAR), un intrón, un poliligador, etc.) se ubica entre los dos ácidos nucleicos invertidos que forman la repetición invertida. Luego de la transcripción de la repetición invertida, se forma un ARN quimérico con una estructura autocomplementaria (total o parcialmente). Esta estructura de ARN bicatenario se denomina ARN horquilla (hpARN). El hpARN es procesado por la planta en siARN que se incorpora en un complejo de silenciamiento inducido por ARN (RISC). El RISC además escinde los transcriptos de mARN, para así reducir considerablemente la cantidad de transcriptos de mARN que se traducirán en polipéptidos. Para más detalles generales, véase, por ejemplo, Grierson et al. (1998) WO 98/53083; Waterhouse et al. (1999) WO 99/53050).

La realización de los métodos de la invención no depende de la introducción y expresión en una planta de un constructo genético en el cual el ácido nucleico se clona como una repetición invertida, sino que se pueden utilizar uno o más de los diversos métodos de "silenciamiento génico" conocidos para lograr los mismos efectos.

Uno de dichos métodos para reducir la expresión del gen endógeno es el silenciamiento de la expresión génica mediado por ARN (regulación descendente). En este caso, el silenciamiento es activado en una planta por una secuencia de ARN bicatenario (dsARN) que es considerablemente similar al gen endógeno blanco. Este dsARN es procesado adicionalmente por la planta en alrededor de 20 a alrededor de 26 nucleótidos denominados ARN cortos de interferencia (siARN). Los siARN se incorporan en un complejo silenciador inducido por ARN (RISC) que escinde los transcriptos de mARN del gen blanco endógeno, reduciendo considerablemente de esta manera la cantidad de transcriptos de mARN que se deben traducir en un polipéptido. Preferentemente, la secuencia de ARN bicatenario corresponde al gen blanco.

Otro ejemplo de un método de silenciamiento de ARN incluye la introducción de secuencias de ácidos nucleicos o partes de estas (en este caso, una porción de nucleótidos sustancialmente contiguos derivados del gen de interés o de cualquier ácido nucleico capaz de codificar un ortólogo, parálogo u homólogo de la proteína de Interés) en orientación sentido en una planta. "Orientación sentido" se refiere a una secuencia de ADN que es homologa de uno de sus transcripto de mARN. Por lo tanto, en una planta se habrá introducido al menos una copia de la secuencia de ácidos nucleicos. La secuencia adicional de ácidos nucleicos reducirá la expresión del gen endógeno, originando un fenómeno conocido como cosupresión. La reducción de la expresión génica será más pronunciada si se introducen varias copias adicionales de una secuencia de ácidos nucleicos en la planta, ya que existe una correlación positiva entre los niveles altos de transcriptos y la activación de la cosupresión.

Otro ejemplo de un método de silenciamiento de ARN involucra el uso de secuencias de ácidos nucleicos antisentido. Una secuencia de ácidos nucleicos "antisentido" comprende una secuencia de nucleótidos que es complementaria de una secuencia de ácidos nucleicos "sentido" que codifica una proteína, es decir, complementaria de la cadena codificante de una molécula de cADN bicatenario o complementaria de una secuencia de transcriptos de mARN. Preferentemente, la secuencia de ácidos nucleicos antisentido es complementaria del gen endógeno a silenciar. La complementariedad puede estar ubicada en la "región codificante" y/o en la "región no codificante" de un gen. El término "región codificante" se refiere a la región de la secuencia de nucleótidos que comprende codones que se traducen en residuos de aminoácidos. El término "región no codificante" se refiere a secuencias de 5' y 3' que flanquean la región codificante que se transcriben pero no se traducen en aminoácidos (también denominadas regiones 5' y 3' no traducidas).

Las secuencias de ácidos nucleicos antisentido se pueden diseñar de acuerdo con las reglas de formación de pares de bases de Watson y Crick. La secuencia de ácidos nucleicos antisentido puede ser complementaria de la secuencia entera de ácidos nucleicos (en este caso, una porción de nucleótidos considerablemente contiguos derivados del gen de interés o de cualquier ácido nucleico capaz de codificar un ortólogo, parálogo u homólogo de la proteína de interés), pero también puede ser un oligonucleótido que es antisentido con respecto a solo una parte de la secuencia de ácidos nucleicos (incluso UTR 5' y 3' de mARN). Por ejemplo, la secuencia de oligonucleótidos antisentido puede ser complementaria de la región que rodea al sitio de inicio de la traducción de un transcripto de mARN que codifica un polipéptido. La longitud de una secuencia de oligonucleótidos antisentido adecuada es conocida en el arte y puede comenzar desde alrededor de 50, 45, 40, 35, 30, 25, 20, 15 o 10 nucleótidos de longitud o menos. Una secuencia de ácidos nucleicos antisentido de acuerdo con la invención se puede construir mediante síntesis química y reacciones de ligadura enzimática utilizando los métodos conocidos en el arte. Por ejemplo, una secuencia de ácidos nucleicos antisentido (por ejemplo, una secuencia de oligonucleótidos antisentido) se puede sintetizar químicamente con nucleótidos naturales o nucleótidos modificados de distintas maneras diseñados para aumentar la estabilidad biológica de las moléculas o para aumentar la estabilidad física del dúplex formado entre las secuencias de ácidos nucleicos sentido y antisentido, por ejemplo, se pueden utilizar derivados de fosforotioato y nucleótidos sustituidos por acridina. Los ejemplos de nucleótidos modificados que se pueden utilizar para generar las secuencias de ácidos nucleicos antisentido son muy conocidos en el arte. Las modificaciones conocidas de nucleótidos incluyen metilación, ciclación y "caps" y sustitución de uno o más de los nucleótidos naturales por un análogo, tal como inosina. Otras modificaciones de nucleótido son conocidas en el arte.

La secuencia de ácidos nucleicos antisentido se puede producir de forma biológica usando un vector de expresión en el cual se ha subclonado una secuencia de ácidos nucleicos en orientación antisentido (es decir, el ARN transcripto desde el ácido nucleico insertado tendrá orientación antisentido con respecto al ácido nucleico blanco de interés). Preferentemente, la producción de secuencias de ácidos nucleicos antísentido en plantas ocurre por medio de un constructo de ácidos nucleicos integrado de forma estable que comprende un promotor, un oligonucleótido antisentido ligado operativamente y un terminador.

Las moléculas de ácido nucleico utilizadas para el silenciamiento en los métodos de la invención (ya sea introducidas en una planta o generadas in situ) se hibridan o se unen a transcriptos de mARN y/o ADN genómico que codifica un polipéptido para inhibir de este modo la expresión de la proteína, por ejemplo, mediante la inhibición de la transcripción y/o traducción. La hibridación puede ocurrir mediante complementariedad de nucleótidos convencional para formar un dúplex estable o, por ejemplo, en el caso de una secuencia de ácidos nucleicos antisentido que se une a dúplex de ADN, mediante interacciones específicas en la cavidad principal de la hélice doble. Se pueden introducir secuencias de ácidos nucleicos antisentido en una planta mediante transformación o inyección directa en un sitio específico de tejido. Alternativamente, las secuencias de ácidos nucleicos antisentido se pueden modificar para que se dirijan a células seleccionadas y luego administrarlas de forma sistémica. Por ejemplo, para la administración sistémica, las secuencias de ácidos nucleicos antisentido pueden modificarse de manera tal que se unen específicamente a receptores o antígenos que se expresan en la superficie celular seleccionada, por ejemplo, mediante la unión de la secuencia de ácidos nucleicos antisentido a los péptidos o anticuerpos que se unen a los antígenos o receptores de la superficie celular. Las secuencias de ácidos nucleicos antisentido también se pueden dirigir a células utilizando los vectores descritos en la presente.

De acuerdo con otro aspecto, la secuencia de ácidos nucleicos antisentido es una secuencia de ácidos nucleicos a-anomérica. Una secuencia de ácidos nucleicos a-anomérica forma híbridos bicatenarios específicos con ARN complementario donde, a diferencia de las unidades b habituales, las cadenas son paralelas entre sí (Gaultier et al. (1987) Nucí Ac Res 15: 6625-6641 ). La secuencia de ácidos nucleicos antisentido también puede comprender 2'-o-metilrribonucleótido (Inoue et al. (1987) Nucí Ac Res 15, 6131-6148) o un análogo de ARN-ADN quimérico (Inoue et al. (1987) FEBS Lett. 215, 327-330).

La reducción o eliminación considerable de la expresión del gen endógeno también se puede realizar mediante el uso de ribozimas. Las ribozimas son moléculas de ARN catalítico con actividad de ribonucleasa que son capaces de escindir una secuencia de ácidos nucleicos monocatenarios, tal como un mARN, con la cual tienen una región complementaria. De este modo, las ribozimas (por ejemplo, las ribozimas hammerhead (descritas en Haselhoff and Gerlach (1988) Nature 334, 585-591 ) se pueden usar para escindir de modo catalítico transcriptos de mARN que codifican un polipéptido, reduciendo considerablemente, de este modo, la cantidad de transcriptos de mARN a traducir en un polipéptido. Se puede diseñar una ribozima que tiene especificidad para una secuencia de ácidos nucleicos (véase por ejemplo: Cech et al. patente estadounidense N.° 4.987.071 ; y Cech et al. patente estadounidense N.° 5.1 16.742). Alternativamente, se pueden usar transcriptos de mARN que corresponden a una secuencia de ácidos nucleicos para seleccionar un ARN catalítico que tenga actividad de ribonucleasa específica a partir de un pool de moléculas de ARN (Bartel and Szostak (1993) Science 261 , 14 1-1418). El uso de ribozimas para el silenciamiento génico en plantas es conocido en el arte (por ejemplo, Atkins et al. (1994) WO 94/00012; Lenne et al. (1995) WO 95/03404; Lutziger et al. (2000) WO 00/00619; Prinsen et al. (1997) WO 97/13865 y Scott et al. (1997) WO 97/381 16).

El silenciamiento génico también se puede lograr mediante mutagénesis de inserción (por ejemplo, inserción de T-ADN o inserción de transposón) o mediante estrategias como las descritas, entre otros, en Angelí and Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083) o Baulcombe (WO 99/15682).

El silenciamiento génico también puede ocurrir si hay una mutación en un gen endógeno y/o una mutación en un ácido nucleico/gen aislado que se introduce posteriormente en una planta. La reducción o eliminación considerable puede ser causada por un polipéptido no funcional. Por ejemplo, el polipéptido se puede unir a varias proteínas que interactúan; por lo tanto, una o más mutaciones y/o truncamientos pueden generar un polipéptido que aún es capaz de unirse a proteínas que interactúan (tales como proteínas receptoras) pero que no puede exhibir su función normal (tal como un ligando de señalización).

Otro enfoque al silenciamiento génico es mediante el direccionamiento de secuencias de ácidos nucleicos complementarias de la región reguladora del gen (por ejemplo, el promotor y/o mejoradores) para formar estructuras helicoidales triples que evitan la transcripción del gen en las células blanco. Véase Helene, C, Anticancer Drug Res. 6, 569-84, 1991 ; Helene et al., Ann. N.Y. Acad. Sci. 660, 27-36 1992; y Maher, L.J. Bioassays 14, 807-15, 1992.

Otros métodos, tales como el uso de anticuerpos dirigidos a un polipéptido endógeno para inhibir su función en la planta, o interferencia en la vía de señalización en la cual se encuentra involucrado el polipéptido, serán bien conocidos por el experto en el arte. En particular, se puede prever que las moléculas fabricadas por el hombre pueden ser útiles para inhibir la función biológica de un polipéptido blanco o para interferir con la vía de señalización en la cual está involucrado el polipéptido blanco.

De modo alternativo, se puede preparar un programa de barrido para identificar, en una población de plantas, las variantes naturales de un gen, en donde dichas variantes codifican polipéptidos con actividad reducida. Dichas variantes naturales también se pueden usar para realizar, por ejemplo, recombinación homologa.

Se puede usar microARN (miARN) artificial y/o natural para knock out la expresión génica y/o la traducción de mARN. Los miARN endógenos son ARN pequeños monocatenarios que generalmente tienen 19-24 nucleótidos de longitud. Funcionan principalmente para regular la expresión génica y/o la traducción de mARN. La mayoría de los microARN (miARN) de plantas tienen complementariedad perfecta o casi perfecta con sus secuencias blanco. Sin embargo, existen blancos naturales con hasta cinco faltas de coincidencia. Se los procesa a partir de ARN no codificantes más largos con estructuras características de replegamiento mediante RNasas bicatenarias específicas de la familia Dicer. Luego del procesamiento, se incorporan en el complejo de silenciamiento inducido por ARN (RISC) mediante la unión a su componente principal, una proteína Argonauta. Los miARN sirven como componentes de especificidad dé RISC, ya que forman pares de base para dirigirse a ácidos nucleicos, principalmente mARN, en el citoplasma. Los posteriores eventos reguladores incluyen la escisión de mARN blanco y la destrucción y/o inhibición de la traducción. De este modo, a menudo se reflejan los efectos de la sobreexpresión de miARN en menores niveles de genes blanco.

Los microARN (amiARN) artificiales, que típicamente tienen 21 nucleótidos de longitud, se pueden modificar mediante ingeniería genética específicamente para regular de forma negativa la expresión génica de un solo gen o de múltiples genes de interés. Los determinantes de la selección de microARN vegetal blanco son muy conocidos en el arte. Se han definido los parámetros empíricos para el reconocimiento del blanco y se pueden usar para ayudar en el diseño de amiARN específicos (Schwab et al., Dev. Cell 8, 517-527, 2005). Las herramientas convenientes para el diseño y la generación de amiARN y sus precursores también están disponibles al público (Schwab et al., Plant Cell 18, 1 121 -1 133, 2006).

Para un rendimiento óptimo, las técnicas de silenciamiento génico usadas para reducir la expresión en una planta de un gen endógeno requieren el uso de secuencias de ácidos nucleicos de plantas monocotiledóneas para la transformación de plantas monocotiledóneas, y de plantas dicotiledóneas para la transformación de plantas dicotiledóneas. Preferentemente, se introduce una secuencia de ácidos nucleicos de cualquier especie de planta determinada en esa misma especie. Por ejemplo, se transforma una secuencia de ácidos nucleicos del arroz en una planta de arroz. Sin embargo, no es un requisito indispensable que la secuencia de ácidos nucleicos que se desee introducir se origine de la misma especie vegetal que la planta en la cual será introducida. Es suficiente que haya una homología considerable entre el gen endógeno blanco y el ácido nucleico por introducir.

Se describieron anteriormente ejemplos de varios métodos para la reducción o eliminación considerable de la expresión en una planta de un gen endógeno. Un experto en el arte podrá fácilmente adaptar los métodos de silenciamiento antes mencionados a fin de lograr la reducción de expresión de un gen endógeno en una planta entera o en sus partes, por ejemplo, mediante el uso de un promotor adecuado.

Transformación Los términos "introducción" o "transformación", como se indica en la presente, abarcan la transferencia de un polinucleótido exógeno a una célula huésped, independientemente del método utilizado para la transferencia. El tejido vegetal capaz de propagación clonal posterior, ya sea por organogénesis o embriogénesis, se puede transformar con un constructo genético de la presente invención y regenerar una planta completa a partir de él. El tejido particular elegido variará según los sistemas de propagación clonal disponibles y más adecuados para la especie particular a transformar. Los ejemplos de tejidos blanco incluyen discos de hoja, polen, embriones, cotiledones, hipocotilos, megagametofitos, tejido de callo, tejido meristemático existente (por ejemplo, meristema apical, brotes axilares y meristemas de raíz) y tejido del meristema inducido (por ejemplo, meristema de cotiledón y meristema de hipocotilo). El polinucleótido se puede introducir en forma transitoria o estable en una célula huésped y se puede mantener no integrado, por ejemplo, como un plásmido. Alternativamente, se lo puede integrar en el genoma del huésped. La célula vegetal transformada resultante luego se puede utilizar para regenerar una planta transformada en una forma conocida por los expertos en el arte. De manera alternativa, una célula vegetal que no se puede regenerar en una planta se puede elegir de una célula huésped, es decir, la célula vegetal transformada resultante no tiene la capacidad de regenerarse en una planta (completa).

La transferencia de genes exógenos al genoma de una planta se denomina transformación. En la actualidad, la transformación de especies vegetales es una técnica bastante rutinaria. Ventajosamente, se puede utilizar cualquiera de los diversos métodos de transformación para introducir el gen de interés en una célula ancestral adecuada. Los métodos descritos para la transformación y regeneración de las plantas a partir de tejidos o células vegetales se pueden usar para la transformación transitoria o estable. Los métodos de transformación incluyen el uso de liposomas, electroporación, productos químicos que aumentan la absorción de ADN libre, inyección del ADN directamente en la planta, bombardeo con pistola de partículas, transformación con virus o polen y microproyección. Los métodos se pueden seleccionar del método de calcio/polietilenglicol para protoplastos (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); electroporación de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); microinyección en material vegetal (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeo de partículas recubiertas con ADN o ARN (Klein TM et al., (1987) Nature 327: 70) infección con virus (no integrativos) y similares. Las plantas transgénicas, incluso plantas de cultivo transgénicas, se producen preferentemente mediante transformación mediada por Agrobacterium. Un método de transformación ventajoso es la transformación en la planta. Con este fin, es posible, por ejemplo, permitir que las agrobacterias actúen en las semillas de la planta o inocular el meristema de la planta con agrobacterias. Se ha demostrado que es particularmente oportuno de acuerdo con la invención permitir que una suspensión de agrobacterias transformadas actúe en la planta intacta o al menos en los primordios de la flor. La planta se cultiva posteriormente hasta que se obtienen las semillas de la planta tratada (Clough and Bent, Plant J. (1998) 16, 735-743). Los métodos para la transformación de arroz mediada por Agrobacterium incluyen métodos muy conocidos para la transformación del arroz, tales como los descritos en cualquiera de los siguientes: solicitud de patente europea EP 1 198985 A1 , Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), cuyas descripciones se incorporan a la presente por referencia como si se indicaran en su totalidad. En el caso de la transformación del maíz, el método preferido es como se describe en Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) o Frame et al. (Plant Physiol 129(1 ): 13-22, 2002), cuyas descripciones se incorporan a la presente por referencia como si se indicaran en su totalidad. Dichos métodos se describen también a modo de ejemplo en B. Jenes et al., Techniques for Gene Transfer, en: Transgenic Plants, Vol. 1 , Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143 y en Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991 ) 205-225). Los ácidos nucleicos o el constructo que se desean expresar se clonan, preferentemente, en un vector adecuado para la transformación de Agrobacterium tumefaciens, por ejemplo, pBin19 (Bevan et al., Nucí. Acids Res. 12 (1984) 8711 ). Las agrobacterias transformadas por dicho vector luego se pueden utilizar de la manera conocida para la transformación de plantas, tales como plantas utilizadas como modelo, como Arabidopsis (dentro del alcance de la presente invención, Arabidopsis thaliana no se considera una planta de cultivo) o plantas de cultivo tales como, por ejemplo, las plantas de tabaco, por ejemplo mediante la inmersión de hojas machacadas u hojas picadas en una solución de agrobacterias y luego el cultivo en un medio adecuado. La transformación de plantas por medio de Agrobacterium tumefaciens se describe, por ejemplo, en Hófgen y Willmitzer en Nucí. Acid Res. (1988) 16, 9877 o se conoce, entre otros, de F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1 , Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38.

Además de la transformación de células somáticas, que luego se deben regenerar en plantas intactas, también es posible transformar las células de meristemas de plantas y, en particular, las células que se desarrollan en gametos. En este caso, los gametos transformados siguen el desarrollo natural de la planta, produciendo las plantas transgénicas. De este modo, por ejemplo, las semillas de Arabidopsis se tratan con agrobacterias y las semillas se obtienen a partir de las plantas en desarrollo, de las cuales cierta proporción es transformada y, por lo tanto, transgénica [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:1-9; Feldmann K (1992). En: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. Los métodos alternativos se basan en la eliminación reiterada de las inflorescencias y la incubación del sitio de escisión en el centro de la roseta con las agrobacterias transformadas, por la cual las semillas transformadas también se pueden obtener en un momento posterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Sin embargo, un método especialmente eficaz es el método de infiltración con vacío con sus modificaciones, tal como el método de "inmersión floral". En el caso de infiltración con vacío de Arabidopsis, las plantas intactas bajo presión reducida se tratan con una suspensión de agrobacterias [Bechthold, N (1993). C R Acad Sci París Life Sci, 316: 1 194-1199], mientras que en el caso del método de "inmersión floral" el tejido floral en desarrollo se incuba por poco tiempo con una suspensión de agrobacterias tratada con tensoactivos [Clough, SJ and Bent AF (1998) The Plant J. 16, 735-743]. En ambos casos se cosecha una cierta proporción de semillas transgénicas y estas semillas "se pueden distinguir de las semillas no transgénicas por el cultivo en las condiciones selectivas antes descritas. Además, la transformación estable de los plástidos es ventajosa porque los plástidos se heredan por vía materna en la mayoría de los cultivos, lo cual reduce o elimina el riesgo de flujo de transgenes mediante polen. Por lo general, la transformación del genoma del cloroplasto se obtiene mediante un proceso que se representa en forma esquemática en Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. En síntesis, las secuencias a transformar se clonan junto con un gen marcador seleccionable entre las secuencias flanqueadoras homologas del genoma del cloroplasto. Estas secuencias flanqueadoras homologas dirigen la integración específica de sitio en el plastoma. La transformación de los plástidos ha sido descrita para diferentes especies de plantas y se provee una reseña en Bock (2001 ) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21 ; 312 (3):425-38 o Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21 , 20-28. Recientemente se ha informado otro progreso biotecnológico en forma de transformantes de plástidos libres de marcadores, que se pueden producir mediante un gen marcador cointegrado transitorio (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).

Las células vegetales modificadas genéticamente se pueden regenerar mediante todos los métodos conocidos por el experto en el arte. Se pueden encontrar métodos adecuados en las publicaciones antes mencionadas de S.D. Kung and R. Wu, Potrykus o Hófgen and Willmitzer. De manera alternativa, las células vegetales modificadas genéticamente no se pueden regenerar en una planta entera.

Generalmente, después de la transformación, las células vegetales o los agrupamientos celulares se seleccionan para determinar la presencia de uno o más marcadores codificados por genes expresables en plantas cotransferidos con el gen de interés, luego de lo cual el material transformado se regenera en una planta entera. Para seleccionar las plantas transformadas, el material vegetal obtenido en la transformación se somete, en general, a condiciones selectivas a fin de poder distinguir las plantas transformadas de las plantas no transformadas. Por ejemplo, las semillas obtenidas del modo antes descrito se pueden plantar y, luego de un período de crecimiento inicial, se pueden someter a una selección adecuada mediante pulverización. Otra posibilidad consiste en cultivar las semillas, en caso de ser adecuado, luego de la esterilización, en placas de agar mediante el uso de un agente de selección adecuado a fin de que solo las semillas transformadas puedan crecer hasta convertirse en plantas. De modo alternativo, las plantas transformadas se controlan para detectar la presencia de un marcador seleccionable, tales como los descritos anteriormente.

Luego de la regeneración y transferencia de ADN, las plantas posiblemente transformadas también se pueden evaluar, por ejemplo, mediante análisis Southern, para determinar la presencia del gen de interés, la cantidad de copias y/o la organización genómica. De modo alternativo o adicional, se pueden controlar los niveles de expresión del ADN recién introducido mediante análisis Northern y/o Western; ambas técnicas son conocidas por los expertos en el arte.

Las plantas transformadas generadas se pueden propagar por diversos medios, tales como propagación clonal o técnicas de reproducción clásicas. Por ejemplo, se puede autocruzar una planta transformada de primera generación (o T1 ) y seleccionar transformantes homocigotas de segunda generación (o T2), y las plantas T2 luego se pueden propagar también mediante técnicas de reproducción clásicas. Los organismos transformados generados pueden adoptar diversas formas. Por ejemplo, pueden ser quimeras de células transformadas y no transformadas; transformantes clónales (por ejemplo, todas las células se transforman para que contengan el cásete de expresión); injertos de tejidos transformados y no transformados (por ejemplo, en plantas, un rizoma transformado injertado en un acodo no transformado).

Marcación por activación de T-ADN La marcación por "activación de T-ADN" (Hayashi et al. Science (1992) 1350- 1353) incluye la inserción de T-ADN, que usualmente contiene un promotor (también puede ser un mejorador de la traducción o un intrón), en la región genómica del gen de interés o 10 kb corriente arriba o corriente abajo de la región codificante de un gen en una configuración tal que el promotor dirige la expresión del gen blanco. En general, la regulación de la expresión del gen blanco por su promotor natural se altera y el gen cae bajo el control del promotor recién introducido. El promotor está típicamente incluido en un T-ADN. Este T-ADN se inserta en forma aleatoria en el genoma de la planta, por ejemplo, mediante infección con Agrobacterium, y conduce a la expresión modificada de los genes cerca del T-ADN insertado. Las plantas transgénicas resultantes muestran fenotipos dominantes debido a la expresión modificada de los genes cercanos al promotor introducido.

TILLING El término "TILLING" es la abreviatura de "Targeted Induced Local Lesions In Genomes" (Lesiones locales inducidas dirigidas en genomas) y se refiere a una tecnología de mutagénesis útil para generar y/o identificar ácidos nucleicos que codifican proteínas con expresión y/o actividad modificada. TILLING también permite la selección de plantas que portan dichos variantes mutantes. Estas variantes mutantes pueden exhibir expresión modificada, ya sea en potencia o ubicación o duración (por ejemplo, si las mutaciones afectan al promotor). Estas variantes mutantes pueden exhibir mayor actividad que la exhibida por el gen en su forma natural. TILLING combina mutagénesis de alta densidad con métodos de barrido de alto rendimiento. Las etapas que habitualmente se siguen en TILLING son: (a) mutagénesis EMS (Redei GP and Kóñcz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparación de -ADN y agrupamiento de individuos; (c) amplificación por PCR de una región de interés; (d) desnaturalización y apareamiento para permitir la formación de heterodúplex; (e) DHPLC, cuando se detecta la presencia de un heterodúplex en un pool como un pico extra en el cromatograma; (f) identificación del individuo muíante; y (g) secuenciación del producto de PCR muíante. Los métodos para TILLING son muy conocidos en el arte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; reseñado por Stemple (2004) Nat Rev Genet 5(2): 145-50).

Recombinación homologa La "recombinación homologa" permite la introducción en un genoma de un ácido nucleico seleccionado en una posición seleccionada definida. La recombinación homologa es una tecnología estándar que se usa en forma rutinaria en las ciencias biológicas para organismos inferiores, tales como levadura o el musgo Physcomitrella. Los métodos para realizar la recombinación homologa en las plantas han sido descritos no solo para las plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84) sino también para las plantas de cultivo, por ejemplo, arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; lida and Terada (2004) Curr Opin Biotech 15(2): 132-8) y hay enfoques que son aplicables en general, independientemente del organismo blanco (Miller et al, Nature Biotechnol. 25, 778-785, 2007).

Rasgos relacionados con el rendimiento Un "rasgo relacionado con el rendimiento" es un rasgo o una característica que se relaciona con el rendimiento de la planta. Los rasgos relacionados con el rendimiento pueden comprender uno o más de la siguiente lista no limitativa de características: tiempo de floración temprano, rendimiento, biomasa, rendimiento de semilla, vigor temprano, índice de verdor, tasa de crecimiento, rasgos agronómicos, por ejemplo, tolerancia a la inmersión (que genera rendimiento del arroz), eficacia en el uso del agua (WUE), eficacia en el uso de nitrógeno (NUE), etc.

La referencia en la presente a mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control, significa uno o más de los siguientes: aumento del vigor temprano y/o biomasa (peso) de una o más partes de una planta, que pueden incluir i) partes aéreas y, preferentemente, partes aéreas cosechables y/o (ii) partes subterráneas y, preferentemente, subterráneas cosechables. En particular, las partes cosechables son semillas.

Rendimiento En general, término "rendimiento" significa un producto mensurable de valor económico, típicamente relacionado con un cultivo, área y período de tiempo específicos. Las partes individuales de las plantas contribuyen directamente al rendimiento sobre la base de su cantidad, tamaño y/o peso, o el rendimiento real es el rendimiento por metro cuadrado para un cultivo y año, el cual se determina dividiendo la producción total (incluye tanto la producción cosechada como la producción calculada) por metro cuadrado plantado.

En la presente, las expresiones "rendimiento" de una planta y "rendimiento vegetal" se usan de manera indistinta y se refieren a la biomasa vegetal, tal como biomasa de raíz y/o brote, a los órganos reproductivos y/o a los propágulos, tales como semillas, de esa planta.

Las flores en el maíz son unisexuales; las inflorescencias masculinas (panojas) se originan en el tallo apical y las inflorescencias femeninas (mazorcas) surgen de los ápices de yemas axilares. La inflorescencia femenina produce pares de espículas en la superficie de un eje central (mazorca). Cada una de estas espículas femeninas encierra dos florcillas fértiles, una de ellas generalmente madura en un grano de maíz luego de ser fertilizada. Por lo tanto, el aumento del rendimiento en el maíz se puede manifestar como uno o más de los siguientes: aumento de la cantidad de plantas establecidas por metro cuadrado, aumento de la cantidad de mazorcas por planta, aumento de la cantidad de hileras, cantidad de granos por hilera, peso del grano, peso de mil granos, longitud/diámetro de la mazorca, aumento de la tasa de llenado de semillas, que es la cantidad, de florcillas llenas (es decir, florcillas que contienen semillas) dividido por la cantidad total de florcillas y multiplicado por 100), entre otros.

Las inflorescencias en las plantas de arroz se denominan panículas. Las panículas tienen espículas, que son la unidad básica de las panículas y consiste en un pedículo y en una florcilla. La florcilla se origina en el pedículo e incluye una flor cubierta por dos glumas protectoras: una gluma más grande (lema) y una gluma más corta (palea). Por lo tanto, si se toma el arroz como ejemplo, el aumento del rendimiento se puede manifestar como el aumento de uno o más de los siguientes: cantidad de plantas por metro cuadrado, cantidad de panículas por planta, longitud de la panícula, cantidad de espículas por panícula, cantidad de flores (o florcillas) por panícula; un aumento de la tasa de llenado de semillas, que es la cantidad de florcillas llenas (es decir, florcillas que contienen semillas dividido por la cantidad total de florcillas y multiplicado por 100); aumento del peso de mil granos, entre otros.

Tiempo de floración temprano Como se usa en la presente, las plantas que tienen un "tiempo de floración temprano" son plantas que comienzan a florecer antes que las plantas de control. Por lo tanto, este término se refiere a plantas que muestran un inicio de floración más temprano. El tiempo de floración de las plantas se puede evaluar al contar la cantidad de días ("tiempo que tardan en florecer") entre la siembra y el surgimiento de la primera inflorescencia. Por ejemplo, el "tiempo de floración" de una planta se puede determinar con el método descrito en WO 2007/093444.

Vigor temprano "Vigor temprano" se refiere al crecimiento activo, sano y equilibrado, especialmente durante las etapas tempranas del crecimiento de la planta, y puede ser el resultado de un mejor estado físico de la planta debido, por ejemplo, a que las plantas se adaptan mejor a su medio ambiente (es decir, optimizan el uso de recursos de energía y los reparten entre los brotes y las raíces). Las plantas que tienen vigor temprano también muestran mayor supervivencia de las plántulas y mejor establecimiento del cultivo, lo que habitualmente da como resultado campos muy uniformes (en donde el cultivo crece de manera uniforme, es decir, la mayoría de las plantas alcanza los diversos estadios del desarrollo considerablemente al mismo tiempo), y a menudo mejor y mayor rendimiento. Por lo tanto, el vigor temprano se puede determinar al medir varios factores, tales como peso de mil granos, porcentaje de germinación, porcentaje de plantas que emergen, crecimiento de las plántulas, altura de las plántulas, longitud de las raíces, biomasa de las raíces y de los brotes y muchos otros.

Aumento de la tasa de crecimiento El aumento de la tasa de crecimiento puede ser específico de una o más partes de una planta (incluso semillas) o puede ser de casi la totalidad de la planta. Las plantas con mayor tasa de crecimiento pueden tener un ciclo de vida más corto. El ciclo de vida de una planta puede significar el tiempo necesario para que se desarrolle desde la semilla madura hasta la etapa en la cual la planta produjo semillas maduras, similares al material de inicio. Este ciclo de vida puede estar influenciado por factores tales como velocidad de germinación, vigor temprano, tasa de crecimiento, índice de verdor, tiempo de floración y velocidad de maduración de la semilla. El aumento de tasa de crecimiento puede ocurrir en una o más etapas del ciclo de vida de una planta o durante considerablemente todo el ciclo de vida de la planta. El aumento de la tasa de crecimiento durante las etapas tempranas del ciclo de vida de una planta puede reflejar mejor vigor. El aumento de la tasa de crecimiento puede alterar el ciclo de cosecha de una planta, lo cual permite sembrar las plantas más tarde y/o cosecharlas antes de lo que sería posible de otro modo (se puede obtener un efecto similar con tiempo de floración más temprano). Si se aumenta lo suficiente la tasa de crecimiento, esto puede permitir la siembra adicional de semillas de la misma especie de planta (por ejemplo, sembrar y cosechar plantas de arroz seguido de la siembra y cosecha de otras plantas de arroz, todo dentro de un periodo de crecimiento convencional). De modo similar, si se aumenta lo suficiente la tasa de crecimiento, esto puede permitir la siembra adicional de semillas de distintas especies de plantas (por ejemplo, sembrar y cosechar plantas de maíz seguido, por ejemplo, de la siembra y cosecha opcional de soja, papa o cualquier otra planta adecuada). También pueden ser posibles cosechas adicionales de los mismos rizomas, en el caso de algunas plantas de cultivo. La alteración del ciclo de cosecha de una planta puede conducir a un aumento de la producción de biomasa anual por metro cuadrado (debido a un aumento de la cantidad de veces (por ejemplo, por año) que se puede cultivar y cosechar cualquier planta particular). Un aumento de la tasa de crecimiento también puede permitir el cultivo de plantas transgénicas en un área geográfica más amplia que la de sus contrapartes de tipo silvestre, debido a que las limitaciones territoriales para el desarrollo de un cultivo con frecuencia están determinadas por condiciones ambientales adversas al momento de la plantación (estación temprana) o al momento de la cosecha (estación tardía). Dichas condiciones adversas se pueden evitar si se acorta el ciclo de cosecha. La tasa de crecimiento se puede determinar al derivar varios parámetros de las curvas de crecimiento, dichos parámetros pueden ser: T-Mid (el tiempo que tardan las plantas en alcanzar el 50 % de su tamaño máximo) y T-90 (el tiempo que tardan las plantas en alcanzar el 90 % de su tamaño máximo), entre otros.

Resistencia al estrés El aumento de la tasa de rendimiento y/o de crecimiento ocurre si la planta se encuentre en condiciones sin estrés o si la planta está expuesta a varios tipos de estrés, en comparación con las plantas de control. Las plantas típicamente responden a la exposición al estrés mediante un crecimiento más lento. En condiciones de estrés severo, la planta puede incluso detener su crecimiento por completo. Por otra parte, el estrés leve se define en la presente como cualquier estrés al que está expuesta una planta que no causa el cese por completo del crecimiento de una planta sin la capacidad de reiniciar el crecimiento. El estrés leve, en el sentido de la invención, conduce a una reducción del crecimiento de las plantas estresadas de menos de 40 %, 35 % o 25 %, con mayor preferencia, menos de 20 % o 15 % en comparación con la planta de control en condiciones sin estrés. Debido a los adelantos en las prácticas agrícolas (irrigación, fertilización, tratamientos con plaguicidas), no es frecuente encontrar distintos tipos de estrés severo en plantas de cultivo cultivadas. En consecuencia, el crecimiento comprometido inducido por estrés leve es a menudo una característica indeseable en la agricultura. El estrés abiótico se puede deber a sequía o exceso de agua, estrés anaeróbico, estrés salino, toxicidad química, estrés oxidativo y temperaturas cálidasv frías o de congelación.

El "estrés biótico" típicamente es el estrés causado por patógenos, tales como bacterias, virus, hongos, nemátodos e insectos.

El "estrés abiótico" puede ser estrés osmótico causado por estrés hídrico, por ejemplo, debido a sequía, estrés salino o estrés por congelación. El estrés abiótico también puede ser estrés oxidativo o estrés por frío. "Estrés por congelación" se refiere a estrés debido a las temperaturas de congelación, es decir, temperaturas en las cuales las moléculas de agua disponibles se congelan y se convierten en hielo. "Estrés por frío", también denominado "estrés por heladas", se refiere a temperaturas frías, por ejemplo, temperaturas menores de 10° o, preferentemente, menores de 5°C, pero a las cuales las moléculas de agua no se congelan. Como se informó en Wang et al. (Planta (2003) 218: 1-14), el estrés abiótico conduce a una serie de cambios morfológicos, fisiológicos, bioquímicos y moleculares que afectan de manera adversa el crecimiento y la productividad de la planta. Se sabe que el estrés por sequía, salinidad, temperaturas extremas y el estrés oxidativo están interconectados y pueden inducir el crecimiento y daño celular mediante mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) describe un grado particularmente alto de "comunicación cruzada'' entre estrés por sequía y estrés por alta salinidad. Por ejemplo, la sequía y/o la salinización se manifiestan principalmente como estrés osmótico, lo cual da como resultado la interrupción de la homeóstasis y la distribución iónica en la célula. El estrés oxidativo, que frecuentemente acompaña al estrés por alta o baja temperatura, por salinidad o por sequía, puede causar la desnaturalización de proteínas funcionales y estructurales. Como consecuencia, estos diversos tipos de estrés ambientales a menudo activan vías de señalización celular y respuestas celulares similares, tales como la producción de proteínas por estrés, la regulación en forma ascendente de antioxidantes, la acumulación de solutos compatibles y la detención del crecimiento. Como se usa en la presente, las condiciones "sin estrés" son las condiciones ambientales que permiten el crecimiento óptimo de las plantas. Los expertos en el arte conocen las condiciones normales del suelo y climáticas para una ubicación determinada. Las plantas en condiciones óptimas de crecimiento (que crecen en condiciones sin estrés) usualmente rinden, en orden creciente de preferencia, al menos 97 %, 95 %, 92 %, 90 %, 87 %, 85 %, 83 %, 80 %, 77 % o 75 % de la producción promedio de dicha planta en un ambiente determinado. La producción promedio se puede calcular sobre la base de una cosecha y/o estación. Los expertos en el arte conocen el rendimiento promedio de la producción de un cultivo.

En particular, los métodos de la presente invención se pueden realizar en condiciones sin estrés. Por ejemplo, los métodos de la presente invención se pueden realizar en condiciones sin estrés, tales como sequía leve, para obtener plantas con mayor rendimiento, con respecto a plantas de control.

En otra forma de realización, los métodos de la presente invención se pueden realizar en condiciones con estrés.

Por ejemplo, los métodos de la presente invención se pueden realizar en condiciones con estrés, tales como sequía, para obtener plantas con mayor rendimiento, con respecto a plantas de control.

En otro ejemplo, los métodos de la presente invención se pueden realizar en condiciones con estrés, tales como deficiencia de nutrientes, para obtener plantas con mayor rendimiento, con respecto a plantas de control.

La deficiencia de nutrientes puede ser el resultado de la falta de nutrientes tales como nitrógeno, fosfatos y otros compuestos que contienen fósforo, potasio, calcio, magnesio, manganeso, hierro y boro, entre otros.

Aun en otro ejemplo, los métodos de la presente invención se pueden realizar en condiciones con estrés, tales como estrés salino, para obtener plantas con mayor rendimiento, con respecto a plantas de control. La expresión "estrés salino" no se restringe a la sal común (NaCI), sino que puede ser uno o más de los siguientes: NaCI, KCI, LiCI, MgCI2, CaCI2, entre otros.

Aun en otro ejemplo, los métodos de la presente invención se pueden realizar en condiciones con estrés, tales como estrés por frío o estrés por congelación, para obtener plantas con mayor rendimiento, con respecto a plantas de control.

Incremento/Mejora/Aumento Los términos "incremento", "mejora" o "aumento" son indistintos y significan, en el sentido de la solicitud, al menos 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 % o 10 %, preferentemente, al menos 15 % o 20 %, con mayor preferencia, 25 %, 30 %, 35 % o 40 % más de rendimiento y/o crecimiento en comparación con las plantas de control como se definen en la presente.

Rendimiento de las semillas Un aumento del rendimiento de las semillas se puede manifestar como uno o más de los siguientes: (a) mayor biomasa de las semillas (peso total de las semillas) que puede ser por semilla y/o por planta y/o por metro cuadrado; (b) mayor cantidad de flores por planta; (c) mayor cantidad de semillas; (d) mayor tasa de llenado de semillas (que se expresa como la proporción entre la cantidad de florcillas llenas dividido por la cantidad total de florcillas); (e) mayor índice de cosecha, que se expresa como la proporción entre el rendimiento de las partes cosechables, tales como semillas, dividido por la biomasa de las partes aéreas de la planta; y (f) mayor peso de mil granos (TKW), que se extrapola de la cantidad de semillas contadas y su peso total. Un mayor TKW puede ser el resultado de un mayor tamaño de las semillas y/o peso de las semillas, y también puede ser el resultado de un mayor tamaño del embrión y/o endosperma.

Las expresiones "florcillas llenas" y "semillas llenas" se pueden considerar sinónimos.

Un mayor rendimiento de las semillas también se puede manifestar como un mayor tamaño de las semillas y/o volumen de las semillas. Asimismo, un mayor rendimiento de las semillas también se puede manifestar como una mayor área de la semilla y/o longitud de la semilla y/o ancho de la semilla y/o perímetro de la semilla.

Indice de verdor Como se usa en la presente, el "índice de verdor" se calcula de imágenes digitales de plantas. Para cada píxel que pertenece a la planta objeto de la imagen, se calcula la proporción del valor de verde con respecto al valor de rojo (en el modelo RGB para la codificación de color). El índice de verdor se expresa como el porcentaje de píxeles para los cuales la proporción verde-rojo excede un umbral determinado. En condiciones normales de crecimiento, en condiciones de crecimiento con estrés salino y en condiciones de crecimiento con disponibilidad reducida de nutrientes, el índice de verdor de las plantas se mide en la última formación de imágenes antes de la floración. Por el contrario, en condiciones de crecimiento con estrés por sequía, el índice de verdor de las plantas se mide en la primera formación de imágenes después de la sequía.

Biomasa Como se usa en la presente, el término "biomasa" se refiere al peso total de una planta. Dentro de la definición de biomasa, se puede hacer una distinción entre la biomasa de una o más partes de una planta, que pueden incluir uno o más de los siguientes: partes aéreas, tales como, por ejemplo, biomasa de brotes, biomasa de semillas, biomasa de hojas, etc.: - partes aéreas cosechables, tales como, por ejemplo, biomasa de brotes, biomasa de semillas, biomasa de hojas, etc.; - partes subterráneas, tales como, pero sin limitarse a, biomasa de raíces, tubérculos, bulbos, etc.; - partes subterráneas cosechables, tales como, pero sin limitarse a, biomasa de raíces, tubérculos, bulbos, etc.; - partes cosechables parcialmente subterráneas, tales como remolacha y otras áreas del hipocotilo de la planta, rizomas, estolones o rizomas reptantes; - biomasa vegetativa, tal como biomasa de raíces, biomasa de brotes, etc.; - órganos reproductivos; y - propágulos, tales como semillas.

Reproducción asistida por marcador Dichos programas de reproducción algunas veces requieren la introducción de variaciones alélicas mediante el tratamiento mutagénico de las plantas, utilizando, por ejemplo, mutagénesis EMS; alternativamente, el programa puede comenzar con una colección de variantes alélicas del denominado origen "natural" causado de manera no intencional. Luego se realiza la identificación de variantes alélicas, por ejemplo, mediante PCR. Luego sigue una etapa de selección de variantes alélicas superiores de la secuencia en cuestión y que produce mayor rendimiento. Generalmente, la selección se realiza mediante el control del crecimiento de las plantas que contienen diferentes variantes alélicas de la secuencia en cuestión. El crecimiento se puede controlar en un invernadero o en el campo. Otras etapas opcionales incluyen la cruza de plantas en las cuales la variante alélica superior se identificó con otra planta. Esto se puede usar, por ejemplo, para realizar una combinación de características fenotíplcas de interés.

Uso como sondas en (mapeo genético) El uso de ácidos nucleicos que codifican la proteína de interés para el mapeo genético y físico de genes requiere solamente una secuencia de ácidos nucleicos de al menos 15 nucleótidos de longitud. Estos ácidos nucleicos se pueden utilizar como marcadores de polimorfismos de longitud del fragmento de restricción (RFLP). Los Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de ADN genómico vegetal digerido por restricción se pueden sondear con los ácidos nucleicos que codifican la proteína de interés. Los patrones de banda resultantes luego se pueden someter a análisis genéticos mediante el uso de programas de computación tales como MapMaker (Lander et al. (1987) Genomics 1 : 174-181 ) a fin de construir un mapa genético. Además, los ácidos nucleicos se pueden usar para sondear Southern blots que contienen ADN genómico tratado con endonucleasa de restricción de un conjunto de individuos que representan los progenitores y la progenie de una cruza genética definida Se observa la segregación de los polimorfismos de ADN y se usa para calcular la posición del ácido nucleico que codifica la proteína de interés en el mapa genético que se obtuvo previamente con esta población (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331 ).

La producción y el uso de sondas derivadas de genes vegetales para usar en el mapeo genético se describen en Bernatzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicaciones describen el mapeo genético de clones de cADN específicos mediante la metodología descrita anteriormente o sus variaciones Por ejemplo, para el mapeo se pueden usar poblaciones de intercruza F2, poblaciones de retrocruza, poblaciones apareadas al azar, líneas isogénicas cercanas y otros conjuntos de individuos. Tales metodologías son muy conocidas por los expertos en el arte.

Las sondas de ácidos nucleicos también se pueden usar para el mapeo físico (es decir, la ubicación de secuencias en mapas físicos; véase Hoheisel et al. En: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, y las referencias allí citadas).

En otra forma de realización, las sondas de ácidos nucleicos se pueden usar en el mapeo de hibridación in situ por fluorescencia directa (FISH) (Trask (1991 ) Trends Genet. 7:149-154). Si bien los métodos actuales de mapeo FISH favorecen el uso de clones grandes (varios kb a varios cientos de kb; véase Laan et al. (1995) Genome Res. 5:13-20), las mejoras en la sensibilidad pueden permitir la realización del mapeo FISH con sondas más cortas.

Se pueden realizar diversos métodos basados en la amplificación de ácidos nucleicos para el mapeo genético y físico mediante el uso de ácidos nucleicos. Los ejemplos incluyen la amplificación específica de alelos (Kazazian (1998) J. Lab. Clin. Med 1 1 :95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligadura específica de alelos (Landegren et al. (1988) Science 241 :1077-1080), reacciones de extensión de nucleótidos (Sokolov (1990) Nucleic Acid Res. 18:3671 ), mapeo de híbrido por radiación (Walter et al. (1997) Nat. Genet. 7:22-28) y mapeo Happy (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estos métodos, se utiliza la secuencia de un ácido nucleico para diseñar y producir pares de cebadores para utilizar en la reacción de amplificación o en las reacciones de extensión de cebadores. El diseño de dichos cebadores es muy conocido por los expertos en el arte. En los métodos que utilizan mapeo genético basado en PCR, puede ser necesario identificar diferencias de secuencias de ADN entre los progenitores de la cruza por mapeo en la región correspondiente con la secuencia de ácidos nucleicos de la presente. Sin embargo, esto generalmente no es necesario para los métodos de mapeo.

Planta Como se usa en la presente, el término "planta" abarca plantas enteras, antecesores y progenie de las plantas y partes de plantas, incluso semillas, brotes, tallos, hojas, raíces (incluso tubérculos), flores y tejidos y órganos, en donde cada uno de los antes mencionados comprende el gen/ácido nucleico de interés. El término "planta" también abarca células de plantas, cultivos en suspensión, tejidos de callos, embriones, regiones meristemáticas, gametofitos, esporofitos, polen y microesporas, en donde cada uno de los antes mencionados comprende el gen/ácido nucleico de interés.

Las plantas que son particularmente útiles en los métodos de la invención incluyen todas las plantas que pertenecen a la superfamilia Viridiplantae, en particular, plantas monocotiledóneas y dicotiledóneas, incluso forraje o legumbres forrajeras, plantas ornamentales, cultivos para alimentación, árboles o arbustos seleccionados de la lista que comprende Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, Annona spp., Apium graveolens, Arachis spp, Artocarpus spp., Asparagus officinalis, Avena spp. (por ejemplo, Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hy brida), Averrhoa carambola, Bambú sa spp., Benincasa hispida, Bertholletia excelsea, Beta vulgaris, Brassica spp. (por ejemplo, Brassica napus, Brassica rapa spp. [cañóla, colza oleaginosa, nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceiba pentandra, Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus spp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucúrbita spp., Cucumis spp., Cynara spp., Daucus carota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., £/ae('s (por ejemplo, E/ae/'s guineensis, Elaeis oleifera), Eleusine coracana, Eragrostis tef, Erianthus spp., Eriobotrya japónica, Eucalyptus spp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. fpor ejemplo, Glycine max, Soja hispida o Soja max), Gossypium hirsutum, Helianthus spp. fpor ejemplo, Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. fpor ejemplo, Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens culinaris, Linum usitatissimum, Litchi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula sylvatica, Lycopersicon spp. fpor ejemplo, Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon pyriforme), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, MelHotus spp., Mentha spp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. fpor ejemplo, Oryza saí/Va, Oryza latifolia), Panicum miliaceum, Panicum virgatum, Passiflora edulis, Pastinaca sativa, Pennisetum spp., Persea spp., Petroselinum crispum, Phalaris arundinacea, Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Púnica granatum, Pyrus communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saccharum spp., Sa//x spp., Sambucus spp., Sécale cereale, Sesamum spp., Sinapis spp., Solanum spp. fpor ejemplo, Solanum tuberosum, Solanum integrifolium o Solanum lycopersicum), Sorghum bicolor, Spinacia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Trípsacum dactyloides, Triticosecale rimpaui, Triticum spp. fpor ejemplo, Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum, Triticum monococcum o Triticum vulgare), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Wc/a spp., Vigna spp., V o/a odorata, Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., entre otros.

Planta(s) de control La elección de plantas de control adecuadas es una parte rutinaria en la preparación experimental y puede incluir las correspondientes plantas de tipo silvestre o las correspondientes plantas sin el gen de interés. Generalmente, la planta de control es de la misma especie de planta o incluso de la misma variedad que la planta a evaluar. La planta de control también puede ser un nulicigota de la planta a evaluar. Los nulicigotas (o plantas de control nulas) son individuos que carecen del trasngén por segregación. Además, las plantas de control se cultivan en las mismas condiciones de crecimiento que las plantas de la invención, es decir, cerca de las plantas de la invención y simultáneamente con ellas. Como se usa en la presente, una "planta de control" se refiere no solo a las plantas completas, sino también a las partes de las plantas, incluso semillas y partes de semillas.

Descripción de las figuras La presente invención se describirá a continuación con referencia a las siguientes figuras en las cuales: La Figura 1 representa la estructura de dominio de SEQ ID NO: 2 y SEQ ID NO: 4 con la secuencia característica en negrita, el dominio P450 en cursiva y los dominios 1 a 6 subrayados; La Figura 2 representa un alineamiento múltiple de varios polipéptidos tipo CYP704. Estos alineamientos se pueden usar para definir otros motivos o secuencias características, cuando se usan aminoácidos conservados.

La Figura 3 muestra la tabla de MATGAT del Ejemplo 3.

La Figura 4 representa el vector binario usado para una mayor expresión en Oryza sativa de un ácido nucleico que codifica un tipo CYP704 bajo el control de un promotor GOS2 (pGOS2) del arroz La estructura del plásmido es la misma para las secuencias de arroz y de álamo; solo los ORF son diferentes.

La Figura 5 representa la estructura de dominio de SEQ ID NO: 2, en la que se indican el dominio DUF1218 conservado (en negrita y subrayado) y los motivos 1 a 6.

La Figura 6 representa un alineamiento múltiple de varios polipéptidos DUF1218. Estos alineamientos se pueden usar para definir otros motivos o secuencias características, cuando se usan aminoácidos conservados. OsJJNK DUF1218 (SEQ ID NO: 87) se indica con un recuadro. El péptido de señal se indica con un recuadro. El dominio DUF1218 se ubica entre los aminoácidos en las posiciones 60 y 152 en SEQ ID NO: 88 y también se indica con un recuadro. Estos alineamientos se pueden usar para definir otros motivos, cuando se usan aminoácidos conservados. Los polipéptidos ilustrados tienen los siguientes SEQ ID NO: La Figura 7 representa un alineamiento múltiple de polipéptidos DUF1218 cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 6, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo. OsJJNK DUF1218 (SEQ ID NO:87), el péptido de señal y el dominio DUF1218 se indican con un recuadro, como sucede de modo similar en la Figura 6.

La Figura 8 muestra la tabla de MATGAT del Ejemplo 3 para varios polipéptidos DUF1218. Los polipéptidos DUF1218 representados se indican con la siguiente numeración: 1. Os_UNKDUF1218; 2. T.aestivum_c54830581 @5965; 3. H.paradoxus_EL492156; 4. H.tuberosus_TA3647_4233; 5. H.exilis_EE650298; 6. H.ciliaris_EL431974¡ 7. C.intybus_ TA2743J 3427; 8. G.max_Glyma12g02170.1 ; 9.

L.japonicus_TC36104; 10. E.esula_ DV124989; 11. P.trichocarpa_826108; 12.

H.vulgare_TC164154; 13. T.aestivum_ TC293972; 14. T.aestivum_TC281335; 15.

Zea_mays_GRMZM2G041994_T01 ; 16. Z.mays_TC513290; 17. F.vesca_EX683932; 18.

G.hirsutum_TC133069; 19. S.lycopersicum_TC198292; 20. S.tuberosum_TC172344; 21. S.tuberosum_TC168299; 22. A.majus_TA5960_4151 ; 23. Triphysaria_sp_TC12092; 24.

C.clementina_CX293339; 25. G.max_Glyma11g09860.1 ; 26. M.domestica_TC35146; 27.

P.persica_TC10133; 28. N.tabacum_EB451790; 29. S.bicolor_Sb10g001220.1 ; 30.

J.hindsii_x_regia_EL901497; 31. O.sativa_LOC_Os06g02440.1 ; 32.

R.communis_TA5054_3988; 33. A.thal¡ana_ AT5G17210.1; 34. A.lyrata_488583; 35. V.vinifera_GSVIVT00014076001 ; 36. A.officinalis_TA2043_4686; 37.

C.solstitialis_TA2955_347529; 38. C.maculosa_ EH745515; 39. C.maculosa_EH748870; 40. C.maculosa_TA751_215693; 41. Cmaculosa _TA752_215693; 42.

C.tinctorius_EL401112; 43. C.tinctorius_EL412247; 44. L.perennis_ TA3000_43195; 45.

T.aestivum_TC286470; 46. T.kok-saghyz_DR398994 La Figura 9 representa el vector binario usado para una mayor expresión en Oryza sativa de un ácido nucleico que codifica DUF1218 bajo el control de un promotor GOS2 (pGOS2) del arroz.

La Figura 10 muestra un árbol filogenético de varios polipéptidos DUF1218 (véanse también los Ejemplos 2 y 3 para una tabla de MATGAT sobre los polipéptidos DUF1218 ilustrados).

La Figura 11 representa la estructura de dominio de SEQ ID NO: 191 con la secuencia característica y los motivos conservados.

La Figura 12 representa un alineamiento múltiple de varios polipéptidos '. tipo translina. Los asteriscos indican aminoácidos idénticos entre las diversas secuencias proteicas, los dos puntos indican sustituciones de aminoácidos altamente conservados y los puntos representan sustituciones de aminoácidos menos conservados; en otras posiciones no hay conservación de secuencia. Estos alineamientos se pueden usar para definir otros motivos o secuencias características, cuando se usan aminoácidos conservados. Los SEQ ID NO correspondientes para las secuencias de polipéptidos alineadas que se muestran en la Figura 12 son los siguientes: SEQ ID NO: 199 para B.napus_TC64968 SEQ ID NO: 195 para A.thaliana_AT2G03780.1 SEQ ID NO: 197 para B.napus_TC100628 SEQ ID NO: 207 para S. lycopersicum_PUT-155a SEQ ID NO: 203 para G.max_TC289758 SEQ ID NO: 201 para G.max_Glyma1 1g01340.1 SEQ ID NO: 209 para M.truncatula_AC144726_60.5 SEQ ID NO: 221 para P.trichocarpa_TC97700 SEQ ID NO: 219 para P.trichocarpa_TC1 16999 SEQ ID NO: 217 para P.trichocarpa_scaff_X.1315 SEQ ID NO: 215 para P.trichocarpa_659024 SEQ ID NO: 191 para P.tr¡chocarpa_translin SEQ ID NO: 193 para A.cepa_CF442302 SEQ ID NO: 225 para T.aestivum_c54625664@13479 SEQ ID NO: 229 para T.aest¡vum_TC284985 SEQ ID NO: 205 para H.vulgare_TC189986 SEQ ID NO: 227 para T.aest¡vum_TC278465 SEQ ID NO: 211 para O.sat¡va_LOC_Os01g 16100.1 SEQ ID NO: 213 para 0.sativa_TC_314197 SEQ ID NO: 237 para Z. mays_GRMZM2G128080_T03 SEQ ID NO: 235 para Z. mays_GRMZM2G128080_T02 SEQ ID NO: 233 para Z. mays_ZM07MC31062_BFb0264H 7 SEQ ID NO: 223 para S. lycopers¡cum_PUT-171a SEQ ID NO: 231 para Z.mays_TC476725 La Figura 13 muestra un árbol filogenetico de polipéptidos tipo translina, como se describe en el Ejemplo 2.

La Figura 14 muestra la tabla de MATGAT del Ejemplo 3.

La Figura 5 muestra otra tabla de MATGAT del Ejemplo 3.

La Figura 16 representa el vector binario usado para una mayor expresión en Oryza sativa de un ácido nucleico que codifica un tipo translina bajo el control de un promotor GOS2 (pGOS2) del arroz La Figura 17 representa la estructura de dominio de SEQ ID NO: 247 con el dominio ERG28 (Pfam PF03694) en negrita y los motivos 19 a 22 subrayados.

La Figura 18 representa un alineamiento múltiple de varios polipéptidos tipo ERG28. Este alineamiento se puede usar para definir otros motivos o secuencias características, cuando se usan aminoácidos conservados con técnicas estándares conocidas en el arte.

La Figura 19 muestra un árbol filogenético de polipéptidos tipo ERG28.

La Figura 20 muestra la tabla de MATGAT del Ejemplo 3.

La Figura 21 representa el vector binario útil para una mayor expresión en Oryza sativa de un ácido nucleico que codifica un tipo ERG28 bajo el control de un promotor GOS2 del arroz (pGOS2).

La Figura 22 muestra el análisis del nivel de transcripto de AtERG28 (qRT-PCR) de GABI-Kat_205F01 (GK205F01 ). No se observó prácticamente expresión génica de AtERG28 en los mutantes homocigotas GABI-Kat_205F01 (GK205F01 ) (mutantes con pérdida de función AtERG28). Peso: 1 , 2, 8, 1 1 ; mutante homocigota: 3, 5, 6, 9; heterocigota: 4, 7, 10, 12.

La Figura 23 muestra el rendimiento de semillas de mutantes de T-ADN ERG28 con respecto al tipo silvestre (ts) en condiciones de estrés y sin estrés. DS: estrés por sequía (estrés por sequía leve progresivo sin riego durante 2 semanas) seguido de una fase de recuperación (se permitió que las plantas se recuperaran y hecharan semillas en condiciones de abundante riego). C: control; no se aplicó tratamiento de estrés por sequía; las plantas se mantuvieron regadas.

Ejemplos La presente invención se describirá a continuación con referencia a los siguientes ejemplos, que se brindan solo a modo ilustrativo. Los siguientes ejemplos no pretenden limitar el alcance de la invención. A menos que se indique de otro modo, la presente invención usa técnicas y métodos convencionales de biología vegetal, biología molecular, bioinformática y reproducción de plantas.

Manipulación de ADN: a menos que se indique de otro modo, las técnicas de ADN recombinante se realizan de acuerdo con los protocolos estándares descritos en (Sambrook (2001 ) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) o en los Volúmenes 1 y 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Los materiales y métodos estándar para el trabajo molecular en plantas se describen en Plant Molecular Biology Labfax (1993) de R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) y Blackwell Scientific Publications (UK).

Ejemplo 1: Identificación de secuencias relacionadas con la secuencia de ácidos nucleicos usada en los métodos de la invención 1. Polipéptidos tipo CYP704 Se identifican secuencias (de cADN de longitud completa, EST o genómicas) relacionadas con SEQ ID NO: 1 y SEQ ID NO: 2 entre aquellas que se mantienen en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) mediante el uso de herramientas de búsqueda de secuencias en base de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para encontrar regiones de similitud local entre secuencias mediante la comparación de secuencias de ácidos nucleicos o polipéptidos con bases de datos de secuencias y mediante el cálculo de la importancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico de SEQ ID NO: 1 se usa para el algoritmo TBLASTN, con parámetros predeterminados, y se activa el filtro para ignorar las secuencias de baja complejidad. El resultado del análisis se examina mediante comparación de a pares y se lo califica de acuerdo con el puntaje de probabilidad (valor E), donde el puntaje refleja la probabilidad de que un alineamiento en particular se produzca al azar (cuanto menor es el valor E, más importante es la coincidencia). Además de los valores E, las comparaciones también se califican por porcentaje de identidad. El porcentaje de identidad se refiere a la cantidad de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o polipéptidos) comparadas a lo largo de una longitud particular. En algunos casos, los parámetros predeterminados se pueden ajustar para modificar la rigurosidad de la búsqueda. Por ejemplo, se puede aumentar el valor E para mostrar coincidencias menos rigurosas. De este modo, se pueden identificar coincidencias cortas casi exactas.

La Tabla A1 provee una lista de secuencias de ácidos nucleicos y proteínas relacionadas con SEQ ID NO: 1/2 y SEQ ID NO: 3/4 copendiente de propiedad conjunta.

Tabla A1 : Ejemplos de polipéptidos y ácidos nucleicos tipo CYP704: 2. Polipéptidos DUF1218 Se identifican secuencias (de cADN de longitud completa, EST o genómicas) relacionadas con SEQ ID NO: 87 y SEQ ID NO: 88 entre aquellas que se mantienen en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) mediante el uso de herramientas de búsqueda de secuencias en base de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para encontrar regiones de similitud local entre secuencias mediante la comparación de secuencias de ácidos nucleicos o polipéptidos con bases de datos de secuencias y mediante el cálculo de la importancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico de SEQ ID NO: 87 se usa para el algoritmo TBLASTN, con parámetros predeterminados, y se activa el filtro para ignorar las secuencias de baja complejidad. El resultado del análisis se examina mediante comparación de a pares y se lo califica de acuerdo con el puntaje de probabilidad (valor E), donde el puntaje refleja la probabilidad de que un alineamiento en particular se produzca al azar (cuanto menor es el valor E, más importante es la coincidencia). Además de los valores E, las comparaciones también se califican por porcentaje de identidad. El porcentaje de identidad se refiere a la cantidad de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o polipéptidos) comparadas a lo largo de una longitud particular. En algunos casos, los parámetros predeterminados se pueden ajustar para modificar la rigurosidad de la búsqueda. Por ejemplo, se puede aumentar el valor E para mostrar coincidencias menos rigurosas. De este modo, se pueden identificar coincidencias cortas casi exactas.

La Tabla A2 provee SEQ ID NO: 87 y SEQ ID NO: 88, y una lista de secuencias de ácidos nucleicos relacionadas con SEQ ID NO: 87 y SEQ ID NO: 88.

Tabla A2: Ejemplos de polipéptidos y ácidos nucleicos DUF1218: 3. Polipéptidos tipo translina Se identifican secuencias (de cADN de longitud completa, EST o genómicas) relacionadas con SEQ ID NO: 190 y SEQ ID NO: 191 entre aquellas que se mantienen en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) mediante el uso de herramientas de búsqueda de secuencias en base de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para encontrar regiones de similitud local entre secuencias mediante la comparación de secuencias de ácidos nucleicos o polipéptidos con bases de datos de secuencias y mediante el cálculo de la importancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico de SEQ ID NO: 190 se usa para el algoritmo TBLASTN, con parámetros predeterminados, y se activa el filtro para ignorar las secuencias de baja complejidad. El resultado del análisis se examina mediante comparación de a pares y se lo califica de acuerdo con el puntaje de probabilidad (valor E), donde el puntaje refleja la probabilidad de que un alineamiento en particular se produzca al azar (cuanto menor es el valor E, más importante es la coincidencia). Además de los valores E, las comparaciones también se califican por porcentaje de identidad. El porcentaje de identidad se refiere a la cantidad de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o polipéptidos) comparadas a lo largo de una longitud particular. En algunos casos, los parámetros predeterminados se pueden ajustar para modificar la rigurosidad de la búsqueda. Por ejemplo, se puede aumentar el valor E para mostrar coincidencias menos rigurosas. De este modo, se pueden identificar coincidencias cortas casi exactas.

La Tabla A3 provee una lista de secuencias de ácidos nucleicos relacionadas con SEQ ID NO: 190 y SEQ ID NO: 191.

Tabla A3: Ejemplos de polipéptidos y ácidos nucleicos tipo translina: 4. Polipéptidos tipo ERG28 Se identifican secuencias (de cADN de longitud completa, EST o genómicas) relacionadas con SEQ ID NO: 246 y SEQ ID NO: 247 entre aquellas que se mantienen en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) mediante el uso de herramientas de búsqueda de secuencias en base de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para encontrar regiones de similitud local entre secuencias mediante la comparación de secuencias de ácidos nucleicos o polipéptidos con bases de datos de secuencias y mediante el cálculo de la importancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico de SEQ ID NO: 246 se usa para el algoritmo TBLASTN, con parámetros predeterminados, y se activa el filtro para ignorar las secuencias de baja complejidad. El resultado del análisis se examina mediante comparación de a pares y se lo califica de acuerdo con el puntaje de probabilidad (valor E), donde el puntaje refleja la probabilidad de que un alineamiento en particular se produzca al azar (cuanto menor es el valor E, más importante es la coincidencia). Además de los valores E, las comparaciones también se califican por porcentaje de identidad. El porcentaje de identidad se refiere a la cantidad de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o polipéptidos) comparadas a lo largo de una longitud particular. En algunos casos, los parámetros predeterminados se pueden ajustar para modificar la rigurosidad de la búsqueda. Por ejemplo, se puede aumentar el valor E para mostrar coincidencias menos rigurosas. De este modo, se pueden identificar coincidencias cortas casi exactas.

La Tabla A4 provee una lista de secuencias de ácidos nucleicos relacionadas con SEQ ID NO: 246 y SEQ ID NO: 247.

Tabla A4: Ejemplos de polipéptidos y ácidos nucleicos tipo ERG28: Las secuencias se unieron tentativamente y se revelaron al público mediante institutos de investigación, tales como The Institute for Genomic Research (TIGR; comenzando con TA). Por ejemplo, la base de datos Eukaryotic Gene Orthologs (EGO) se puede usar para identificar dichas secuencias relacionadas, ya sea por búsqueda de palabra clave o usando el algoritmo BLAST con la secuencia de ácidos nucleicos o secuencia de polipéptidos de interés. Se crearon bases de datos especiales de secuencias de ácidos nucleicos para organismos particulares, por ejemplo, para ciertos organismos procarióticos, tal como mediante el Joint Genome Institute. Asimismo, el acceso a bases de datos registradas permite la identificación de nuevas secuencias de polipéptidos y ácidos nucleicos.

Ejemplo 2: Alineamiento de secuencias relacionadas con las secuencias de polipéptidos usadas en los métodos de la invención 1. Polipéptidos tipo CYP704 El alineamiento de secuencias de polipéptidos se realizó con el algoritmo de alineamiento progresivo ClustalW 1.81 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31 :3497-3500) con parámetros estándar (alineamiento lento, matriz de similitud: Gonnet, penalidad por apertura de brecha 10, penalidad por extensión de brecha: 0,2). Se realiza edición manual menor para optimizar adicionalmente el alineamiento. Los polipéptidos tipo CYP704 se alinean en la Figura 2. 2. Polipéptidos DUF1218 Se realizó el alineamiento de secuencias de polipéptidos con MAFFT (versión 6.624, L-INS-I method - Katoh y Toh (2008) - Briefings in Bioinformatics 9:286-298)1 Se realiza edición manual menor para optimizar adicionalmente el alineamiento. Una cantidad representativa de los polipéptidos DUF1218 se alinean en la Figura 6. La Figura 7 representa un alineamiento múltiple de polipéptidos DUF1218 cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupa con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo.

Se puede construir un árbol filogenético de varios polipéptidos DUF1218 (Figura 10) mediante el alineamiento de secuencias DUF1218 por medio de MAFFT (Katoh and Toh (2008) Briefings in Bioinformatics 9:286-298). Se calculó un árbol de unión a vecino con Quick-Tree (Howe et al. (2002), Bioinformatics 18(11 ): 1546-7), 100 repeticiones bootstrap. Se dibujó el dendograma con Dendroscope (Huson et al. (2007), BMC Bioinformatics 8(1 ):460). Se indican los niveles de confianza luego de 100 repeticiones bootstrap para las principales ramificaciones. 3. Polipéptidos tipo translina El alineamiento de secuencias de polipéptidos se realiza con el algoritmo de alineamiento progresivo ClustalW 2.0.11 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31 :3497-3500) con parámetros estándar (alineamiento lento, matriz de similitud: Gonnet, penalidad por apertura de brecha 10, penalidad por extensión de brecha: 0,2). Se realiza edición manual menor para optimizar adicionalmente el alineamiento. Los polipéptidos tipo translina se alinean en la Figura 12.

Se construye un árbol filogenético de polipéptidos tipo translina (Figura 13) mediante el alineamiento de secuencias tipo translina por medio de MAFFT (Katoh and Toh (2008) Briefings in Bioinformatics 9:286-298). Se calculó un árbol de unión a vecino con Quick-Tree (Howe et al. (2002), Bioinformatics 18(11): 1546-7), 100 repeticiones bootstrap. Se dibujó el dendograma con Dendroscope (Huson et al. (2007), BMC Bioinformatics 8(1):460). Se indican los niveles de confianza luego de 100 repeticiones bootstrap para las principales ramificaciones. 4. Polipéptidos tipo ERG28 Se realizó el alineamiento de secuencias de polipéptidos con MAFFT (Katoh and Toh (2008) Briefings in Bioinformatics 9:286-298) con parámetros estándar; véase la Figura 18.

Se construyó un árbol filogenético de polipéptidos tipo ERG28 (Figura 19) mediante el alineamiento de secuencias tipo ERG28 por medio de MAFFT (Katoh and Toh, 2008. Se calculó un árbol de unión a vecino con Quick-Tree (Howe et al. (2002), Bioinformatics 18(11): 1546-7), 100 repeticiones bootstrap. Se dibujó el cladograma con Dendroscope (Huson et al. (2007), BMC Bioinformatics 8(1 ):460). Se indican los niveles de confianza luego de 100 repeticiones bootstrap para las principales ramificaciones. Ejemplo 3: Cálculo del porcentaje de identidad global entre las secuencias de polipéptidos Los porcentajes globales de similitud e identidad entre secuencias de polipéptidos de longitud completa útiles para realizar los métodos de la invención se determinaron con el software MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein o DNA sequences. Campanella JJ, Bitincka L, Smalley J; software albergado por Ledion Bitincka). MatGAT genera matrices de similitud/identidad para las secuencias de ADN o proteínas sin que se necesario el prealineamiento de datos. El programa realiza una serie de alineamientos de a pares con el algoritmo de alineamiento global Myers y Miller, calcula la similitud e identidad y, luego, coloca los resultados en una matriz de distancia. 1 . Polipéptidos tipo CYP704 Los resultados del análisis se indican en la Figura 3 para la similitud e identidad globales de las secuencias de polipéptidos de longitud completa. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea diagonal divisoria. Los parámetros que se usaron en la comparación fueron: Matriz de calificación: Blosum62, Primera brecha: 12, Brecha de extensión: 2. La identidad de secuencia (en %) entre las secuencias de polipéptidos tipo CYP704 útiles para realizar los métodos de la invención puede ser menor de 30 %, pero generalmente, es mayor de 30 %, en comparación con SEQ ID NO: 2 o SEQ ID NO: 4. 2. Polipéptidos DUF1218 Los resultados del análisis se indican en la Figura 8 para la similitud e identidad globales de las secuencias de polipéptidos de longitud completa. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea diagonal divisoria. Los parámetros que se usaron en la comparación fueron: Matriz de calificación: Blosum62, Primera brecha: 12, Brecha de extensión: 2. La identidad de secuencia (en %) entre las secuencias de polipéptidos DUF1218 útiles para realizar los métodos de la invención es, por lo general, mayor de 30 % y, preferentemente, mayor de 50 %, en comparación con SEQ ID NO: 88.

Los resultados del análisis de la similitud e identidad global sobre la longitud completa de varias secuencias de polipéptidos que, cuando se usan en la construcción de un árbol filogenético, tal como el que se representa en la Figura 10, se agrupan con el grupo de polipéptidos que comprende la secuencia de aminoácidos representada por SEQ ID NO: 88, en lugar de con cualquier otro grupo, se muestran en la Tabla B1. En esta tabla se usan las siguientes leyendas: 1. Os_UNKDUF1218; 2. A.officinalis_TA2043_4686; 3. H.vulgare_TC164154; 4. 0.sativa_ LOC_Os06g02440.1 ; 5. S.bicolor_Sb10g001220.1 ; 6.

T.aestivum_c54830581 @5965; 7. T.aestivum_TC281335; 8. T.aestivum_TC286470; 9. T.aestivum_TC293972; 10. Z.mays_ TC513290; 11. Zea_mays_GRMZM2G041994_T01.

Tabla B1 3. Polipéptidos tipo translina Los resultados del análisis se indican en la Figura 14 para la similitud e identidad globales de las secuencias de polipéptidos de longitud completa. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea diagonal divisoria. Los parámetros que se usaron en la comparación fueron: Matriz de calificación: Blosum62, Primera brecha: 12, Brecha de extensión: 2. La identidad de secuencia (en %) entre las secuencias de polipéptidos tipo translina útiles para realizar los métodos de la invención puede ser tan baja como 26,4 % (generalmente, es mayor de 26,4 %), en comparación con SEQ ID NO: 191.

Tabla B2: Descripción de las proteínas de la Figura 14. 1. B.napus_TC100628 2. B.napus_TC64968 3. T.aestivum_c54625664@13479 4. Z.mays_ZM07MC31062_BFb0264l17@30969 5. Z. mays_GR ZM2G128080_T02 6. Z. mays_TC476725 7. Z. mays_GRMZM2G128080_T03 8. P.trichocarpa_TC116999 9. M.truncatula_AC144726_60.5 10. A.thaliana_AT2G03780.1 1 1. O.sativa_LOC_Os01g16100.1 12. S. lycopersicum_PUT-171a-Solanum_lycopersicum-42451 13. P.trichocarpa_TC97700 14. P.trichocarpa_scaff_X.1315 15. P. Trichocarpa translin-like 16. P.trichocarpa_659024 17. G.max_TC289758 18. G.max_Glyma1 1g01340.1 19. T.aestivum_TC284985 20. 0.sativa_TC314197 21. A.cepa_CF442302 22. S. lycopersicum_PUT-155a-Lycopersicon_esculentum-70144897 23. T.aestivum_TC278465 24. H.vulgare_TC189986 Los resultados de otro análisis se indican en la Figura 15 para la similitud e identidad de las secuencias de polipéptidos sobre el dominio tipo translina de acuerdo con PFAM01997. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea diagonal divisoria. Los parámetros que se usaron en la comparación fueron: Matriz de calificación: Blosum62, Primera brecha: 12, Brecha de extensión: 2. La identidad de secuencia (en %) del dominio tipo translina entre las secuencias de polipéptidos tipo translina útiles para realizar los métodos de la invención puede ser tan baja como 30,1 % (generalmente, es mayor de 30,1 %), en comparación con SEQ ID NO: 191.

Tabla B3: Descripción de las proteínas de la Figura 15. 1. B.napus_TC100628 2. B.napus_TC64968 3. A.thaliana_AT2G03780.1 4. P.trichocarpa_TC97700 5. P.trichocarpa_scaff_X.1315 6. P.trichocarpa_659024 7. P.trichocarpa_translin-like 8. P.trichocarpa_TC116999 9. G.max_TC289758 10. G.max_Glyma1 1g01340.1 1 1. M.truncatula_AC144726_60.5 12. S. lycopersicum_PUT-171a--Solanum_lycopers¡cum-42451 13. S. lycopersicum_PUT-155a-Lycopersicon_esculentum-70144897 14. A.cepa_CF442302 15. T.aestivum_c54625664@13479 16. T.aestivum_TC278465 17. H.vulgare_TC189986 18. T.aestivum_TC284985 19. O.sativa_LOC_Os01g16100.1 20. 0.sativa_TC314197 21. Z.mays_TC476725 22. Z. mays_GRMZM2G128080_T03 23. Z. mays_GRMZM2G128080_T02 24. Z. mays_ZM07MC31062_BFb0264M 7@30969 4. Polipéptidos tipo ERG28 Los resultados del análisis se indican en la Figura 20 para la similitud e identidad globales de las secuencias de polipéptidos de longitud completa. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea diagonal divisoria. Los parámetros que se usaron en la comparación fueron: Matriz de calificación: Blosum62, Primera brecha: 12, Brecha de extensión: 2. La identidad de secuencia (en %) entre las secuencias de polipéptidos tipo ERG28 útiles para realizar los métodos de la invención puede ser tan baja como 24 %, cuando se compara SEQ ID NO: 247 con el ortólogo tipo ERG28 de levadura, pero generalmente, es mayor de 45 %, en comparación con SEQ ID NO: 247.

Ejemplo 4: Identificación de dominios comprendidos en secuencias de polipéptidos útiles para la realización de los métodos de la invención La base de datos Integrated Resource of Protein Families, Domains and Sites (InterPro) es una ¡nterfaz integrada para las bases de datos de firmas que se utilizan habitualmente para búsquedas basadas en texto y en secuencias. La base de datos InterPro combina estas bases de datos, que utilizan diferentes metodologías y diversos grados de información biológica sobre proteínas bien caracterizadas, para derivar firmas de proteínas Las bases de datos que colaboran incluyen SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom y Pfam, Smart y TIGRFAM. Pfam es una gran colección de alineamientos de secuencias múltiples y modelos Markov ocultos que abarcan muchos dominios y familias de proteínas comunes. Pfam se encuentra en el servidor de Sanger Institute en el Reino Unido. InterPro se encuentra en el European Bíoinformatics Instítute en el Reino Unido. 1. Polipéptidos tipo CYP704 Los resultados de la búsqueda por InterPro (base de datos de InterPro, versión 28,0) de la secuencia de polipéptidos representada por SEQ ID NO: 2 se indican en la Tabla C1 , y los de SEQ ID NO: 4 en la Tabla C2.

Tabla C1: Resultados de la búsqueda por InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 2.

InterPro IPR001128 Citocromo P450 Función molecular: actividad de monooxigenasa (GO:0004497), Función molecular: unión de ion de hierro (GO:0005506), Proceso biológico: transporte de electrones (GO:0006118), Función molecular: unión a hemo (GO:0020037) Método Número de acc. Nombre corto Ubicación FprintScan PR00385 P450 T[303-320] 4.2e-13 T[365-376] 4.2e-13 T[4 43- 452] 4.2e -13 T[45 2- 463] 4.2e -13 Gene3D G3DSA:1.10.630.10 sin descripción T[20-505] 1.4e-92 HMMPanther PTHR19383 CITOCROMO P450 T[11-473] 3.3e-166 HMMPfam PF00067 p450 T[51-501] 6.5e-54 Superfamily SSF48264 Citocromo P450 T[36-505] 1 2e-99 InterPro IPR002401 Citocromo P450, clase E, grupo I Función molecular: actividad de monooxigenasa (GO:0004497), Función molecular: unión de ion de hierro (GO:0005506), Proceso biológico: transporte de electrones (GO:0006118), Función molecular: unión a hemo (GO:0020037) Método Número de acc. Nombre corto Ubicación FPrintScan PR00463 EP450I T[292-309] 6.3e-16 T[312-338] 6.3e-16 T[364- 382] 6.3e-16 T[442-452] 6.3T-16 T[452-475] 6.3e-16 Tabla C2: Resultados de la búsqueda por InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 4.

InterPro IPR001 128 Citocromo P450 Función molecular: actividad de monooxigenasa (GO:0004497), Función molecular: unión de ion de hierro (GO:0005506), Proceso biológico: transporte de electrones (GO:00061 18), Función molecular: unión a hemo (GO:0020037) Método Número de acc. Nombre corto Ubicación FprintScan PR00385 P450 T[318- 335] 3.5e-13 T[381-392] 3.5e-13 T[459- 468] 3.5e-13 T[468-479] 3.5e-13 Gene3D G3DSA:1.10.630.10 sin descripción T[55-521] 5.1e-93 HMMPanther PTHR19383 CITOCROMO P450 T[22-489] 1.7e-152 HMMPfam PF00067 p450 T[94-517] 1.8e-59 Superfamily SSF48264 Citocromo P450 T[54-522] 6.3e-102 InterPro IPR002401 Citocromo P450, clase E, grupo I Función molecular: actividad de monooxigenasa (GO:0004497), Función molecular: unión de ion de hierro (GO:0005506), Proceso biológico: transporte de electrones (GO:00061 18), Función molecular: unión a hemo (GO:0020037) Método Número de acc. Nombre corto Ubicación FPrintScan PR00463 EP450I T[307- 324] 2e-16 T[327-353] 2e-16 T[380-398] 2e-16 T[458- 468] 2e-16 T[468-491] 2e-16 En una forma de realización; un polipéptido tipo CYP704 comprende un dominio conservado (o motivo) con al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con un dominio conservado desde el aminoácido Q51 hasta el aminoácido F501 en SEQ ID NO: 2 o con el aminoácido V94 hasta el aminoácido L517 en SEQ ID NO: 4. 2. Polipéptidos DUF1218 Los resultados de la búsqueda por InterPro (base de datos de InterPro, versión 29,0) de la secuencia de polipéptidos representada por SEQ ID NO: 88 se indican en la Tabla C3.

Tabla C3: Resultados de la búsqueda por InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 88. 3. Polipéptidos tipo translina Los resultados de la búsqueda por InterPro (base de datos de InterPro, versión 30,0) de la secuencia de polipéptidos representada por SEQ ID NO: 191 se indican en la Tabla C4.

Tabla C4: Resultados de la búsqueda por InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 191.

En una forma de realización, un polipéptido tipo translina comprende un dominio conservado (o motivo) con al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con un dominio conservado de los aminoácidos 72 a 272 en SEQ ID NO: 191. 4. Polipéptidos tipo ERG28 Los resultados de la búsqueda por InterPro (base de datos de InterPro, versión 30,0) de la secuencia de polipéptidos representada por SEQ ID NO: 247 se indican en la Tabla C5.

Tabla C5: Resultados de la búsqueda por InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 247.

En una forma de realización, un polipéptido tipo ERG28 comprende un dominio conservado (o motivo) con al menos 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con un dominio conservado de los aminoácidos 1 a 106 en SEQ ID NO: 247).

Ejemplo 5: Predicción de la topología de las secuencias de polipéptidos útiles para la realización de los métodos de la invención TargetP 1.1 predice la ubicación subcelular de proteínas eucarióticas. La asignación de la ubicación se basa en la presencia prevista de cualquiera de las presecuencias N-terminal: péptido de transito a cloroplasto (cTP), péptido de direccionamiento a mitocondria (mTP) o péptido de señal de la vía secretora (SP). Los puntajes sobre los cuales se basa la predicción final no son realmente probabilidades y no necesariamente suman uno. Sin embargo, la ubicación con el puntaje más alto es la más probable de acuerdo con TargetP, y la relación entre los puntajes (la clase de confiabilidad) puede indicar el nivel de certeza de la predicción. La clase de confianza (RC) está en el rango de 1 a 5, donde 1 indica la predicción más factible. TargetP se conserva en el servidor de la Universidad Técnica de Dinamarca.

Para las secuencias que se prevé que contienen una presecuencia N-terminal, también se puede predecir un posible sitio de escisión.

Se seleccionan varios parámetros, tales como grupo de organismo (no planta o planta), conjuntos de límites (ninguno, conjunto de límites predefinidos o conjunto de límites especificados por el usuario) y el cálculo de predicción de sitios de escisión (sí o no).

Se pueden usar muchos otros algoritmos para realizar dichos análisis, incluso: • ChloroP 1 ,1 alojado en el servidor de la Universidad Técnica de Dinamarca; • Protein Prowler Subcellular Localisation Predictor versión 1.2 alojado en el servidor del Institute for Molecular Bioscience, Universidad de Queensland, Brisbane, Australia; · PENCE Proteome Analyst PA-GOSUB 2,5 alojado en el servidor de la Universidad de Alberta, Edmonton, Alberta, Canadá; PSORT (URL: psort.org) • PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).

• TMHMM, alojado en el servidor de la Universidad Técnica de Dinamarca. · 1. Polipéptidos tipo CYP704 Los resultados del análisis TargetP 1.1 de la secuencia de polipéptidos representada por SEQ ID NO: 2 y 4 se indican, respectivamente, en la Tabla D1 y Tabla D2. Se seleccionó el grupo de organismos "planta", no se definieron límites y se solicitó la longitud prevista del péptido de tránsito. Se prevé que las secuencias de polipéptidos representadas por SEQ ID NO: 2 o SEQ ID NO: 4 son secretadas o están unidas a una membrana de la vía secretora.

Tabla D1 : Análisis TargetP 1.1 de la secuencia de polipéptidos representada por SEQ ID NO: 2. Abreviaturas: Len, Longitud; cTP, Péptido de tránsito a cloroplasto; mTP, Péptido de tránsito a mitocondria, SP, Péptido de señal de la vía secretora, otro, otros direccionamientos subcelulares, Loe, Ubicación prevista; RC, Clase de Confiabilidad; TPIen, Longitud prevista del péptido de tránsito.

Nombre Len cTP mTP SP otro Loe RC TPIen P.tr¡chocarpa_scaff_ 508 0,018 0,013 0,949 0,156 S 2 27 Límite 0,000 0,000 0,000 0,000 Tabla D2: Análisis TargetP 1.1 de la secuencia de polipéptidos representada por SEQ ID NO: 4. Abreviaturas: Len, Longitud; cTP, Péptido de tránsito a cloroplasto; mTP, Péptido de tránsito a mitocondria, SP, Péptido de señal de la vía secretora, otro, otros direccionamientos subcelulares, Loe, Ubicación prevista; RC, Clase de Confiabilidad; TPIen, Longitud prevista del péptido de tránsito.

Nombre Len cTP mTP SP otro Loe RC TPIen O.sativa_Os06g012990 525 0,005 0,093 0,987 0,035 S Límite 0,000 0,000 0,000 0,000 Los resultados del análisis TMHMM en SEQ ID NO: 4 se indican a continuación: # O.SATIVA_OS06G0129900 Longitud: 525 # O.SATIVA_OS06G0129900 Cantidad de T H previstos: 1 # O.SATIVA_OS06G0129900 Cantidad prevista de AA en TMH: 26,40637 # O.SATIVA_OS06G0129900 Cantidad prevista, primeros 60 AA: 25,87569 # O.SATIVA_OS06G0129900 Prob total de N en: 0,96764 # O.SATIVA_OS06G0129900 POSIBLE secuencia de señal del terminal N O.SATIVAJDS06G0129900 TMHMM2.0 interior 1 11 O.SATIVA_OS06G0129900 TMHMM2.0 TMhelix 12 34 O.SATIVA OS06G0129900 TMHMM2.0 exterior 35 525 2. Polipéptidos tipo ERG28 Los resultados del análisis TargetP 1.1 de la secuencia de polipéptidos representada por SEQ ID NO: 2 se indican en la Tabla D3. Se seleccionó el grupo de organismos "planta", no se definieron límites y se solicitó la longitud prevista del péptido de tránsito. Probablemente, la localización subcelular de la secuencia de polipéptidos representada por SEQ ID NO: 247 puede ser la vía secretora; se prevé que un péptido de tránsito tiene un sitio de escisión entre S40 y E41.

Tabla D3: Análisis TargetP 1.1 de la secuencia de polipéptidos representada por SEQ ID NO: 191. Abreviaturas: Len, Longitud; cTP, Péptido de tránsito a cloroplasto; mTP, Péptido de tránsito a mitocondria, SP, Péptido de señal de la vía secretora, otro, otros direccionamientos subcelulares, Loe, Ubicación prevista; RC, Clase de Confiabilidad; TPIen, Longitud prevista del péptido de tránsito.

Nombre Len cTP mTP SP otro Loe RC SEQ ID NO: 247 129 0,000 0,630 0,685 0,015 S 5 Límite 0,000 0,000 0,000 0,000 Cuando se analiza con Predotar (Small et al, Proteomics 4(6):1581-90, 2004), se prevé que SEQ ID NO: 247 se encuentra en el retículo endoplasmático (ER): El análisis con el algoritmo TMHMM (Technical University of Denmark, Sonnhammer et al, Proc Int Conf Intell Syst Mol Biol. 6: 175-82, 1998) reveló la presencia de cuatro dominios transmembranales putativos: # A. thaliana_AT1 G 10030.1 Longitud: 129 # A.thaliana_AT1 G10030.1 Cantidad de TMH previstos: 4 # A.thaliana_AT1 G10030.1 Cantidad prevista de AA en TMH: 83,89595 # A.thaliana_AT1G10030.1 Cantidad prevista, primeros 60 AA: 36,83596 # A.thaliana_AT1G10030.1 Prob total de N en: 0,25743 # A.thaliana_AT1G10030.1 POSIBLE secuencia de señal del terminal N A.thaliana. _AT1G10030.1 TMHMM2.0 exterior 1 4 A.thaliana_ _AT1G10030.1 TMH M2.0 TMhelix 5 27 A.thaliana_ _AT1G10030.1 TMH M2.0 interior 28 46 A.thaliana. _AT1 G 10030.1 TMH M2.0 TMhelix 47 66 A.thaliana. _AT1 G 10030.1 TMHMM2.0 exterior 67 69 A.thaliana. _AT1 G10030.1 TMHMM2.0 TMhelix 70 92 A.thaliana. _AT1 G 10030.1 TMHMM2.0 interior 93 96 A.thaliana. _AT1 G10030.1 TMHMM2.0 TMhelix 97 1 16 A.thaliana. _AT1G10030.1 TMHMM2.0 exterior 1 17 129 Ejemplo 6: Ensayo funcional relacionado con las secuencias de polipéptidos útiles para realizar los métodos de la invención 1. Polipéptidos tipo CYP704 La orientación para realizar la caracterización funcional de polipéptidos tipo CYP704 se brinda en Dobritsa et al. (2009) y Li et al. (2010).

Ejemplo 7: Medición de la composición y los niveles de esteróles y esteroides en plantas La extracción, la purificación, el análisis de la composición y la cuantificación de los niveles endógenos de esteróles y brasinoesteroides en plantas se llevan a cabo mediante GS-MS, por ejemplo, como se describe en He et al, Plant Physiology 131 : 1258-1269, 2003. La composición y los niveles de esteróles de la levadura también se miden mediante cromatografía gaseosa-espectrometría de masa (GS-MS), por ejemplo, como se describe en Gachotte et al., Journal of Lipid Research 42: 150-154, 2001.

Ejemplo 8: Clonación de la secuencia de ácidos nucleicos usada en los métodos de la invención 1. Polipéptidos tipo CYP704 La secuencia de ácidos nucleicos se amplifica mediante PCR usando como molde una colección de cADN de Populus trichocarpa personalizada para SEQ ID NO:. 2 o una colección de cADN de plántulas de Oriza sativa personalizada para SEQ ID NO: 4. Se realiza PCR con ADN polimerasa Taq disponible en el mercado en condiciones estándar, con 200 ng de molde en 50 µ? de mezcla PCR. Los cebadores utilizados en SEQ ID NO: 1 fueron prm15749 (SEQ ID NO: 85; sentido, codón de inicio en negrita): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcctc cattgatgttct-3' y prm 15750 (SEQ ID NO: 86; inverso, complementario): 5'-ggggaccact ttgtacaagaaagctgggtga ggcatccatcaatatgaaga-3'.

Los cebadores uados para la clonación de la secuencia de arroz fueron prm 15747 (SEQ ID NO: 83; sentido, codón de inicio en negrita): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggttacccagctcacctac-3' y prm15748 (SEQ ID NO: 84; inverso, complementario): 5'-ggggaccactttgtacaagaaagctggg tagtagcttgtttggggttcat-3'.

Estos cebadores incluyen los sitios AttB para la recombinación Gateway. El fragmento de PCR amplificado se purifica también mediante métodos estándar. Luego se realiza la primera etapa del procedimiento Gateway, la reacción BP, durante la cual el fragmento PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología de Gateway, un "clon de entrada", tipo pCYP704 (con SEQ ID NO: 1 o SEQ ID NO: 3). El plásmido pDONR201 se compró a Invitrogen, como parte de la tecnología Gateway®.

El clon de entrada que comprende SEQ ID NO: 1 o SEQ ID NO: 3 luego se usó en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contiene como elementos funcionales dentro de los límites de T-ADN: un marcador seleccionable vegetal; un cásete de expresión del marcador controlable; y un cásete Gateway para la recombinación LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada Un promotor GOS2 del arroz (SEQ ID NO: 82) para la expresión constitutiva se ubica corriente arriba de este cásete de Gateway Después de la etapa de recombinación LR, el vector de expresión resultante pGOS2::t¡po CYP704 (Figura 4) se transformó en la cepa LBA4044 de Agrobacteríum de acuerdo con los métodos conocidos en el arte. 2. PolÍDéDtidos DUF1218 La secuencia de ácidos nucleicos se amplifica mediante PCR usando como molde una colección de cADN de Oryza sativa personalizada. Se realiza PCR con ADN polimerasa Taq disponible en el mercado en condiciones estándar, con 200 ng de molde en 50 µ? de mezcla PCR. Los cebadores utilizados fueron prm13120 (SEQ ID NO: 188; sentido, codón de inicio en negrita): 5'-gggga caagtttgtacaaaaaagcaggcttaaacaatggagaggaaggtggtgg-3' y prm13121 (SEQ ID NO: 189; inverso, complementario): 5'-ggggaccactttgtacaagaaagctgggtcatgatttatgggaattgctg-3', que incluye los sitios AttB para la recombinación Gateway. El fragmento de PCR amplificado se purifica también mediante métodos estándar. Luego se realiza la primera etapa del procedimiento Gateway, la reacción BP, durante la cual el fragmento PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología de Gateway, un "clon de entrada", pDUF1218. El plásmido pDONR201 se compró a Invitrogen, como parte de la tecnología Gateway®.

El clon de entrada que comprende SEQ ID NO: 87 luego se usA en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contiene como elementos funcionales dentro de los límites de T-ADN: un marcador seleccionable vegetal; un cásete de expresión del marcador controlable; y un cásete Gateway para la recombinación LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada Un promotor GOS2 del arroz (SEQ ID NO: 186) para la expresión constitutiva se ubica corriente arriba de este cásete de Gateway Luego de la etapa de recombinación LR, el vector de expresión resultante pGOS2:: DUF1218 (Figura 9) se transforma en la cepa LBA4044 de Agrobacteríum de acuerdo con los métodos conocidos en el arte. 3. Polipéptidos tipo translina La secuencia de ácidos nucleicos se amplifica mediante PCR usando como molde una colección de cADN de plántulas de Populus trichocarpa personalizada. Se realiza PCR con ADN polimerasa Taq disponible en el mercado en condiciones estándar, con 200 ng de molde en 50 µ? de mezcla PCR. Los cebadores utilizados fueron prm 14862 (SEQ ID NO: 243; sentido): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgttattgacaagactcgcc-3' y prm15985 (SEQ ID NO: 244; inverso, complementario): 5'-ggggaccactttgtacaagaaagctgggtttataattcgacatcagatacc c-3', que incluyen los sitios AttB para la recombinación Gateway. El fragmento de PCR amplificado se purifica también mediante métodos estándar. Luego se realiza la primera etapa del procedimiento Gateway, la reacción BP, durante la cual el fragmento PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología de Gateway, un "clon de entrada", tipo p-translina. El plásmido pDONR201 se compró a Invitrogen, como parte de la tecnología Gateway®.

El clon de entrada que comprende SEQ ID NO: 190 luego se usó en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contiene como elementos funcionales dentro de los límites de T-ADN: un marcador seleccionable vegetal; un cásete de expresión del marcador controlable; y un cásete Gateway para la recombinación LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada Un promotor GOS2 del arroz (SEQ ID NO: 242) para la expresión constitutiva se ubica corriente arriba de este cásete de Gateway Después de la etapa de recombinación LR, el vector de expresión resultante pGOS2::tipo translina (Figura 16) se transforma en la cepa LBA4044 de Agrobacterium de acuerdo con los métodos conocidos en el arte. 4. Polipéptídos tipo ERG28 La secuencia de ácidos nucleicos que codifica la proteína tipo ERG28 de Arabidopsis thaliana y la proteína tipo ERG28 del tomate se clonan mediante técnicas estándares, por ejemplo, mediante PCR de una colección de cADN de plántulas personalizadas usando cebadores adecuados que incluyen los sitios AttB para la recombinación Gateway. El fragmento de PCR amplificado se purifica también mediante métodos estándar. Entonces se realiza la primera etapa del procedimiento Gateway, la reacción BP, durante la cual el fragmento de PCR se recombina in vivo con el plásmido pDONR201 (parte de la tecnología Gateway®) para producir, de acuerdo con la terminología de Gateway, un "clon de entrada", tipo pERG28.

El clon de entrada que comprende SEQ ID NO: 246 o SEQ ID NO: 248 luego se usa en una reacción LR con un vector de destino usado para la transformación úeOryza sativa. Este vector contiene como elementos funcionales dentro de los límites de T-ADN: un marcador seleccionare vegetal; un cásete de expresión del marcador controlable; y un cásete Gateway para la recombinación LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada Un promotor GOS2 del arroz (SEQ ID NO: 301 ) para la expresión constitutiva se ubica corriente arriba de este cásete de Gateway , .

Después de la etapa de recombinación LR, el vector de expresión resultante pGOS2::tipo ERG28 (Figura 21) se transforma en la cepa LBA4044 de Agrobacterium de acuerdo con los métodos conocidos en el arte.

Ejemplo 9: Transformación de plantas Transformación de arroz El Agrobacterium que contiene el vector de expresión se utilizó para transformar plantas de Oryza sativa. Se quitaron las cáscaras de las semillas secas maduras del cultivar de arroz japonés Nipponbare. La esterilización se realizó mediante la incubación durante 1 minuto en 70 % de etanol, seguido de 30 a 60 minutos, preferentemente 30 minutos, en solución de hipoclorito de sodio (según el grado de contaminación); luego, se lavó de 3 a 6 veces, preferentemente 4 veces, con agua estéril destilada. Las semillas estériles luego se germinaron en un medio que contenía 2,4-D (medio de inducción de callos). Después de la incubación a la luz durante 6 días, los callos derivados de escutelo se transformaron con Agrobacterium, como se describe a continuación en la presente.

La cepa LBA4404 de Agrobacterium que contiene el vector de expresión se utilizó para el cocultivo. Se inoculó Agrobacterium en un medio AB con los antibióticos apropiados y se cultivó durante 3 días a 28 °C. Luego, se recogieron las bacterias y se suspendieron en un medio de cocultivo líquido a una densidad (OD600) de alrededor de 1. Los callos se sumergieron en la suspensión durante 1 a 15 minutos. Los tejidos de los callos se secaron en un papel de filtro y se transfirieron a un medio de cocultivo solidificado y se incubaron durante 3 días en la oscuridad a 25 °C. Después de retirar Agrobacterium mediante lavado, los callos se cultivaron en un medio que contenía 2,4-D durante 10 a 14 días (tiempo de crecimiento para índica: 3 semanas) a la luz a 28 °C - 32 °C en presencia de un agente de selección. Durante este período, se desarrollaron islas de callos resistentes que crecieron rápidamente. Después de transferir este material a un medio de regeneración, se liberó el potencial embriogénico, y se desarrollaron brotes en las siguientes 4 a 6 semanas. Se retiraron los brotes de los callos y se incubaron durante 2 a 3 semanas en un medio que contenía auxina, desde el cual se transfirieron al suelo. Los brotes endurecidos se cultivaron en condiciones de alta humedad y días cortos en un invernadero.

La transformación de índica del cultivar de arroz también se puede realizar de modo similar al descrito anteriormente, de acuerdo con las técnicas conocidas por los expertos.

Se generaron de 35 a 90 transformantes de arroz T0 independientes para un constructo. Los transformantes primarios se transfirieron de una cámara de cultivo de tejidos a un invernadero. Después de un análisis de PCR cuantitativo para verificar la cantidad de copias del inserto de T-ADN, solo se conservaron las plantas transgénicas de única copia que presentan tolerancia al agente de selección para cosechar la semilla T1. Las semillas luego se cosecharon de tres a cinco meses después del trasplante. El método produjo transformantes de único locus en una proporción de más de 50 % (Aldemita and Hodges1996, Chan et al. 1993, Hiei et al. 1994). ¦. : Ejemplo 10: Transformación de otros cultivos Transformación de maíz La transformación del maíz (Zea mays) se realiza con una modificación del método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. La transformación depende del genotipo en el maíz y solo genotipos específicos pueden ser transformados y regenerados. La línea endogámica A188 (Universidad de Minnesota) o los híbridos con A188 como progenitor son una buena fuente de material donante para la transformación, pero también se pueden utilizar exitosamente otros genotipos. Las espigas se cosechan de la planta de maíz aproximadamente 11 días después de la polinización (DAP) cuando el embrión inmaduro tiene una longitud de alrededor de 1 a 1 ,2 mm. Los embriones inmaduros se cocultivan con Agrobacterium tumefaciens que contiene el vector de expresión, y las plantas transgénicas se recuperan por medio de organogénesis. Los embriones extraídos se cultivan en medio de inducción de callos, luego en medio de regeneración de maíz, que contiene el agente de selección (por ejemplo, imidazolinona, pero se pueden utilizar varios marcadores de selección). Las placas de Petri se incuban a la luz a 25 °C durante 2-3 semanas o hasta que se desarrollan los brotes. Los brotes verdes se transfieren de cada embrión al medio de enraizamiento de maíz y se incuban a 25 °C durante 2-3 semanas, hasta que se desarrollan las raíces. Los brotes con raíces se trasplantan al suelo en el invernadero. Las semillas T1 se producen a partir de plantas que exhiben tolerancia al agente de selección y que contienen una única copia del inserto de T-ADN.

Transformación de trigo La transformación del trigo se realiza con el método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. Habitualmente, se usa el cultivar Bobwhite (disponible de CIM YT, Méjico) para la transformación. Los embriones inmaduros se cocultivan con Agrobacterium tumefaciens que contiene el vector de expresión y las plantas transgénicas se recuperan por medio de organogénesis. Después de la incubación con Agrobacterium, los embriones se cultivan in vitro en medio de inducción de callos, luego en medio de regeneración, que contiene el agente de selección (por ejemplo, imidazolinona, pero se pueden utilizar varios marcadores de selección). Las placas de Petri se incuban a la luz a 25 °C durante 2-3 semanas o hasta que se desarrollan los brotes. Los brotes verdes se transfieren de cada embrión al medio de enraizamiento y se incuban a 25 °C durante 2-3 semanas, hasta que se desarrollan las raíces. Los brotes con raíces se trasplantan al suelo en el invernadero. Las semillas T1 se producen a partir de plantas que exhiben tolerancia al agente de selección y que contienen una única copia del inserto de T-ADN.

Transformación de soja La soja se transforma de acuerdo con una modificación del método descrito en la patente US 5.164.310 de Texas A&M. Diversas variedades de soja comercial son susceptibles de transformación con este método. Habitualmente, se usa el cultivar Jack (disponible de Illinois Seed foundation) para la transformación. Las semillas de soja se esterilizan para la siembra in vitro. Se extraen el hipocotilo, la radícula y un cotiledón de plántulas jóvenes de siete días. El epicotilo y el cotiledón restante se cultivan adicionalmente para que desarrollen nodulos axilares. Estos nodulos axilares se extraen y se incuban con Agrobacterium tumefaciens que contiene el vector de expresión. Después del tratamiento de cocultivo, los explantes se lavan y se transfieren al medio de selección. Los brotes regenerados se extraen y se colocan en un medio de alargamiento de brotes. Los brotes cuya longitud no excede 1 cm se colocan en medio de enraizamiento hasta que se desarrollan las raíces. Los brotes con raíces se trasplantan al suelo en el invernadero. Las semillas T1 se producen a partir de plantas que exhiben tolerancia al agente de selección y que contienen una única copia del inserto de T-ADN.

Transformación de colza/canola Los pecíolos cotiledonarios y los hipocotilos de plántulas jóvenes de 5-6 días se utilizan como explantes para el cultivo de tejido y se transforman de acuerdo con Babic et al. (1998, Plant Cell Rep 17: 183-188). El cultivar comercial Westar (Agriculture Canadá) es la variedad estándar que se utiliza para la transformación, pero también se pueden utilizar otras variedades. Las semillas de cañóla se esterilizan en superficie para la siembra in vitro. Los explantes de pecíolos cotiledonarios con el cotiledón unido se extraen de las plántulas in vitro y se inoculan con Agrobacterium (que contiene el vector de expresión) sumergiendo el extremo cortado del explante del pecíolo en la suspensión bacteriana. Los explantes luego se cultivan durante 2 días en medio MSBAP-3 que contiene 3 mg/l de BAP, 3 % de sacarosa, 0,7 % de Phytagar a 23 °C, 16 horas de luz. Después de dos días de cocultivo con Agrobacterium, los explantes de pecíolos se transfieren a medio MSBAP-3 que contiene 3 mg/l de BAP, cefotaxima, carbenicilina o timentina (300 mg/l) durante 7 días, y luego se cultivan en medio MSBAP-3 con cefotaxima, carbenicilina o timentina y agente de selección hasta la regeneración de los brotes. Cuando los brotes tienen 5 - 10 mm de longitud, se los corta y transfiere a medio de alargamiento de brotes (MSBAP-0,5, que contiene 0,5 mg/l de BAP). Los brotes de alrededor de 2 cm de longitud se transfieren al medio de enraizamiento (MSO) para la inducción de raíces. Los brotes con raíces se trasplantan al suelo en el invernadero. Las semillas T1 se producen a partir de plantas que exhiben tolerancia al agente de selección y que contienen una única copia del inserto de T-ADN.

Transformación de alfalfa Se transforma un clon regenerador de alfalfa (Medicago sativa) con el método de (McKersie et al., 1999 Plant Physiol 1 19: 839-847). La regeneración y transformación de alfalfa dependen del genotipo y, por lo tanto, se requiere una planta regeneradora. Se han descrito métodos para obtener plantas regeneradoras. Por ejemplo, estas se pueden seleccionar del cultivar Rangelander (Agriculture Canadá) o de cualquier otra variedad de alfalfa comercial como se describe en Brown DCW y A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 1 11-1 12). Alternativamente, se seleccionó la variedad RA3 (Universidad de Wisconsin) para usar en el cultivo de tejidos (Walker et al., 1978 Am J Bot 65:654-659). Los explantes de pecíolos se cocultivan, durante la noche, con un cultivo de C58C1 pMP90 de Agrobacterium tumefaciens (McKersie et al., 1999 Plant Physiol 1 19: 839-847) o LBA4404 que contiene el vector de expresión. Los explantes se cocultivan durante 3 días en la oscuridad en medio de inducción SH que contiene 288 mg/L de Pro, 53 mg/L de tioprolina, 4,35 g/L de K2S04 y 100 m de acetosiringinona. Los explantes se lavan en medio Murashige-Skoog de concentración media (Murashige and Skoog, 1962) y se colocan en placas en el mismo medio de inducción SH sin acetosiringinona pero con un agente de selección adecuado y antibiótico adecuado para inhibir el crecimiento de Agrobacterium. Después de varias semanas, los embriones somáticos se transfieren a medio de desarrollo BOÍ2Y que no contiene reguladores del crecimiento, ni antibióticos y 50 g/L de sacarosa. Posteriormente, los embriones somáticos se germinan en medio Murashige-Skoog de concentración media. Las plántulas con raíces se trasplantan a macetas y se cultivan en un invernadero. Las semillas T1 se producen a partir de plantas que exhiben tolerancia al agente de selección y que contienen una única copia del Inserto de T-ADN.

Transformación de algodón El algodón se transforma con Agrobacterium tumefaciens de acuerdo con el método descrito en US 5.159.135. Las semillas de algodón se esterilizan en superficie en 3 % de solución de hipoclorito de sodio durante 20 minutos y se lavan en agua destilada con 500 g/ml de cefotaxima. Luego se transfieren las semillas al medio SH con 50 g/ml de benomilo para la germinación. Se extraen los hipocotilos de las plántulas que tienen de 4 a 6 días, se los corta en trozos de 0,5 cm y se los coloca en 0,8 % de agar. Se usa una suspensión de Agrobacterium (aprox. 108 células por mi, diluidas de un cultivo de toda la noche transformado con el gen de interés y marcadores de selección adecuados) para la inoculación de los explantes de hipocotilos. Luego de 3 días a temperatura ambiente y luz, los tejidos se transfieren a un medio sólido (1 ,6 g/l de Gelrite) con sales Murashige y Skoog con vitaminas B5 (Gamborg et al., Exp. Cell Res. 50:151-158 (1968)), 0,1 mg/l de 2,4-D, 0,1 mg/l de 6-furfurilaminopurina y 750 pg/ml de MgCL2, y con 50 a 100 pg/ml de cefotaxima y 400-500 pg/ml de carbeniciüna para eliminar las bacterias residuales. Se aislan las líneas celulares individuales luego de dos a tres meses (con subcultivos cada cuatro a seis semanas) y se cultivan adicionalmente en un medio selectivo para la amplificación del tejido (30°C, fotoperíodo de 16 horas). Posteriormente, los tejidos transformados se cultivan adicionalmente en medio no selectivo durante 2 a 3 meses para que se generen embriones somáticos. Los embriones de aspecto saludable de al menos 4 mm de longitud se transfieren a tubos con medio SH en vermiculita fina, enriquecido con 0,1 mg/l de ácido indol acético, 6 furfurilaminopurina y ácido giberélico. Los embriones se cultivan a 30°C con un fotoperíodo de 16 horas, y los plantines en la etapa de 2 a 3 hojas se transfieren a macetas con vermiculita y nutrientes. Las plantas se vuelven más resistentes y posteriormente se las transfiere al invernadero para continuar el cultivo.

Transformación de la remolacha azucarera Las semillas de la remolacha azucarera (Beta vulgaris L.) se esterilizan en 70 % de etanol durante un minuto, seguido de 20 min con agitación en 20 % de lejía de hipoclorito, por ejemplo, lejía regular Clorox® (disponible en el comercio de Clorox, 1221 Broadway, Oakland, CA 94612, EEUU). Las semillas se enjuagan con agua estéril y se secan con aire, seguido de la colocación en placas en un medio de germinación (medio basado en Murashige and Skoog (MS)) (Murashige, T., and Skoog, ., 1962. Physiol. Plant, vol. 15, 473-497) que incluye vitaminas B5 (Gamborg et al.; Exp. Cell Res., vol. 50, 151-8.) enriquecido con 10 g/l de sacarosa y 0,8 % de agar). Básicamente, el tejido de los hipocotilos se usa para la iniciación de cultivos de brotes de acuerdo con Hussey and Hepher (Hussey, G., and Hepher, A., 1978. Annals of Botany, 42, 477-9) y se mantienen en un medio a base de MS enriquecido con 30g/l de sacarosa, más 0,25 mg/l de bencilamino purina y 0,75 % de agar, pH 5,8 a 23-25 °C, con un fotoperíodo de 16 horas. La cepa de Agrobacterium tumefaciens que tiene un plásmido binario que alberga un gen del marcador seleccionare, por ejemplo, nptll, se usa en los experimentos de transformación. Un día antes de la transformación, se desarrolla un cultivo líquido de LB, que incluye antibióticos, en un agitador (28°C, 150 rpm) hasta alcanzar una densidad óptica (O.D.) a 600 nm de ~1. Los cultivos bacterianos desarrollados durante la noche se centrifugan y resuspenden en un medio de inoculación (O.D. ~1 ) que incluye acetosiringona, pH 5,5. El tejido a base de brotes se corta en rodajas (1 ,0 cm x 1 ,0 cm x 2,0 mm aproximadamente). El tejido se sumerge durante 30 segundos en un medio líquido de inoculación bacteriana. El exceso de líquido se retira mediante secado con papel de filtro. El cocultivo ocurre durante 24-72 horas en un medio basado en MS, que incluye 30g/l de sacarosa, seguido de un período no selectivo, que incluye el medio basado en MS, 30g/l de sacarosa con 1 mg/l de BAP para inducir el desarrollo de brotes y cefotaxim para eliminar Agrobacterium. Luego de 3-10 días, los explantes se transfieren a un medio selectivo similar que alberga, por ejemplo, canamicina o G418 (50-100 mg/l dependiente de genotipo). Los tejidos se transfieren a un nuevo medio cada 2-3 semanas para mantener la presión de selección. La muy rápida iniciación de los brotes (luego.de 3-4 días) indica la regeneración de meristemas existentes, en lugar de la organogénesis de meristemas transgénicos recién desarrollados. Los brotes pequeños se transfieren luego de varias rondas de subcultivo al medio de inducción de raíces que contiene 5 mg/l de NAA y canamicina o G418. Se realizan etapas adicionales para reducir el potencial de generar plantas transformadas que sean quiméricas (parcialmente transgénicas). Las muestras de tejido de los brotes regenerados se usan para el análisis de ADN. Otros métodos de transformación de la remolacha azucarera se conocen en el arte, por ejemplo, los de Linsey & Gallois(Linsey, K., and'Gallois, P., 1990. Journal of Experimental Botany; vol. 41 , N.° 226; 529-36) o los métodos publicados en la solicitud internacional publicada como W09623891A.

Transformación de la caña de azúcar Los husos se aislan de plantas de caña de azúcar de 6 meses cultivadas en el campo (Arencibia et al., 1998. Transgenic Research, vol. 7, 213-22; Enriquez-Obregon et al., 1998. Planta, vol. 206, 20-27). El material se esteriliza por inmersión en 20 % de lejía de hipoclorito, por ejemplo, lejía regular Clorox® (disponible en el comercio de Clorox, 1221 Broadway, Oakland, CA 94612, EEUU) durante 20 minutos. Las secciones transversales de alrededor de 0,5 cm se colocan en el medio en la dirección de relleno. El material vegetal se cultiva durante 4 semanas en un medio basado en MS (Murashige, T., and Skoog, ., 1962. Physiol. Plant, vol. 15, 473-497), que incluye vitaminas B5 (Gamborg, O., et al., 1968. Exp. Cell Res., vol. 50, 151-8) enriquecido con 20g/l de sacarosa, 500 mg/l de caseína hidrolizada, 0,8 % de agar y 5 mg/l de 2,4-D a 23 °C en la oscuridad. Los cultivos se transfieren luego de 4 semanas a un nuevo medio idéntico. La cepa de Agrobacterium tumefaciens que tiene un plásmido binario que alberga un gen del marcador seleccionable, por ejemplo, hpt, se usa en los experimentos de transformación. Un día antes de la transformación, se desarrolla un cultivo líquido de LB, que incluye antibióticos, en un agitador (28°C, 150 rpm) hasta alcanzar una densidad óptica (O.D.) a 600 nm de -0,6. Los cultivos bacterianos desarrollados durante la noche se centrifugan y resuspenden en un medio de inoculación basado en MS (O.D. -0,4) que incluye acetosiringona, pH 5,5. Los trozos de callos embriogénicos de caña de azúcar (2-4 mm) se aislan sobre la base de las características morfológicas como estructura compacta y color amarillo, y se secan durante 20 minutos en la campana de flujo, seguido de inmersión en un medio líquido de inoculación bacteriana durante 10-20 minutos. El exceso de líquido se retira mediante secado con papel de filtro. El cocultivo ocurre durante 3-5 días en la oscuridad sobre papel de filtro, que se coloca en la parte superior del medio basado en MS, que incluye vitaminas B5, que contiene 1 mg/l de 2,4-D. Luego del cocultivo, los callos se lavan con agua estéril, seguido de un período de cultivo no selectivo en un medio similar que contiene 500 mg/l de cefotaxime para eliminar las células de Agrobacterium restantes. Luego de 3-10 días, los explantes se transfieren al medio selectivo basado en MS, que incluye vitaminas B5, que contiene 1 mg/l de 2,4-D, durante otras 3 semanas y que alberga 25 mg/l de higromicina (dependiente de genotipo). Todos los tratamientos se realizan a 23°C en condiciones de oscuridad. Los callos resistentes también se cultivan en un medio que carece de 2,4-D, que incluye 1 mg/l de BA y 25 mg/l de higromicina, en un fotoperíodo de 16 h de luz; esto genera el desarrollo de estructuras de brotes. Los brotes se aislan y cultivan en un medio selectivo de enraizamiento (basado en MS, que incluye 20g/l de sacarosa, 20 mg/l de higromicina y 500 mg/l de cefotaxime). Las muestras de tejido de los brotes regenerados se usan para el análisis de ADN. Otros métodos de transformación de la caña de azúcar se conocen en el arte, por ejemplo, de la solicitud internacional publicada como WO2010/151634A y la patente europea concedida EP1831378.

Ejemplo 11 : Procedimiento de evaluación fenotípica 1 1.1 Preparación de la evaluación Se generaron de 35 a 90 transformantes de arroz T0 independientes. Los transformantes primarios se transfirieron de una cámara de cultivo de tejidos a un invernadero para el cultivo y la cosecha de la semilla T1. Se retuvieron seis eventos, de los cuales la progenie de T1 segregó 3:1 para la presencia/ausencia del transgén. Para cada uno de estos eventos, se seleccionaron aproximadamente 10 plántulas T1 que contenían el transgén (heterocigotas y homocigotas) y aproximadamente 10 plántulas T1 que no tenían el transgén (nulicigotas) mediante el control de la expresión del marcador visual. Las plantas transgénicas y los correspondientes nulicigotas se cultivaron lado a lado en posiciones al azar. Las condiciones del invernadero fueron de días cortos (12 horas de luz), 28°C a la luz y 22°C en la oscuridad y humedad relativa de 70 %. Las plantas cultivadas en condiciones sin estrés se regaron en intervalos regulares para asegurar que el agua y los nutrientes no fueran limitantes y para satisfacer las necesidades de las plantas a fin de que completaran su crecimiento y desarrollo, a menos que se hayan usado en un ensayo de estrés.

Desde la etapa de siembra hasta la etapa de madurez, las plantas se pasaron varias veces a través de un gabinete de formación de imágenes digitales. En cada punto de tiempo, se tomaron imágenes digitales (2048x1536 píxeles, 16 millones de colores) de cada planta desde al menos 6 ángulos diferentes.

También se evaluaron eventos T1 en la generación 12 de acuerdo con el mismo procedimiento de evaluación que para la generación T1 , por ejemplo, con menos eventos y/o con más individuos por evento. En este ejemplo, también se evaluaron cuatro eventos en la generación T2.

Control de sequía Se cultivan plantas T1 o T2 en tierra para maceta en condiciones normales hasta que alcanzan la etapa de espigazón. Luego se las transfiere a una sección "seca" donde dejan de recibir irrigación. Se insertan sondas de humedad del suelo en macetas elegidas al azar para controlar el contenido de agua en el suelo (SWC). Cuando el SWC es inferior a ciertos umbrales, las plantas se riegan nuevamente de forma automática y continua hasta alcanzar de nuevo un nivel normal. A continuación, las plantas se transfieren nuevamente a condiciones normales. El resto del proceso de cultivo (maduración de la planta, cosecha de semillas) es igual que para las plantas no cultivadas en condiciones de estrés abiótico. Los parámetros de crecimiento y rendimiento se registran como se detalla para el crecimiento en condiciones normales.

Control de la eficacia en el uso de nitrógeno Se cultivan plantas T1 o T2 en tierra para maceta en condiciones normales excepto por la solución de nutrientes. Las macetas se riegan, desde que son trasplantadas hasta su maduración, con una solución de nutrientes específica con contenido reducido de nitrógeno N (N), usualmente de 7 a 8 veces menos. El resto del proceso de cultivo (maduración de la planta, cosecha de semillas) es igual que para las plantas no cultivadas en condiciones de estrés abiótico. Los parámetros de crecimiento y rendimiento se registran como se detalla para el crecimiento en condiciones normales.

Control de estrés salino Las plantas T1 o 12 se cultivan en un substrato hecho de fibras de coco y partículas de arcilla cocida (Argex) (proporción 3 a 1 ). Se usa una solución normal de nutrientes durante las primeras dos semanas luego de trasplantar los plantines al invernadero. Luego de las dos primeras semanas, se agregan 25 mM de sal (NaCI) a la solución de nutrientes hasta que se cosechan las plantas. Los parámetros de crecimiento y rendimiento se registran como se detalla para el crecimiento en condiciones normales. 11.2 Análisis estadístico: Prueba F Se utilizó ANOVA (análisis de variantes) de dos factores como modelo estadístico para la evaluación total de las características fenotípicas de la planta. Se realizó una prueba F en todos los parámetros medidos de todas las plantas de todos los eventos transformados con el gen de la presente invención. La prueba F se realizó para controlar el efecto del gen en todos los eventos de transformación y para verificar el efecto total del gen, también conocido como efecto global del gen. El umbral de significancia para un efecto global y verdadero del gen se fijó en un nivel de probabilidad de 5 % para la prueba F. Un valor significativo de la prueba F indica un efecto del gen, es decir que no es solo la mera presencia o posición del gen lo que causa las diferencias en el fenotipo.

Se realizó un análisis combinado cuando se llevaron a cabo dos experimentos con eventos superpuestos. Esto es útil para verificar la consistencia de los efectos en los dos experimentos y, de ser este el caso, acumular pruebas de ambos experimentos a fin de aumentar la confianza en la conclusión. El método que se utilizó fue un enfoque de modelo mixto que considera la estructura de múltiples niveles de los datos (es decir, experimento - evento - segregantes). Los valores P se obtuvieron al comparar la prueba de proporción de probabilidad con las distribuciones ji cuadrado. 9.3 Parámetros medidos Desde la etapa de siembra hasta la etapa de madurez, las plantas se pasaron varias veces a través de un gabinete de formación de imágenes digitales. En cada punto de tiempo, se tomaron imágenes digitales (2048x1536 píxeles, 16 millones de colores) de cada planta desde al menos 6 ángulos diferentes, como se describe en WO2010/031780. Se usan estas mediciones para determinar parámetros diferentes.

Medición de parámetros relacionados con la biomasa Se determinó el área aérea de la planta (o biomasa del follaje) al contar la cantidad total de píxeles en las imágenes digitales de las partes aéreas de las plantas diferenciadas del fondo. Este valor se promedió para las fotos tomadas en el mismo punto de tiempo desde los diferentes ángulos y se convirtió a un valor de superficie física expresado en mm cuadrados por calibración. Los experimentos muestran que el área aérea de la planta medida de este modo se correlaciona con la biomasa de las partes aéreas de la planta. El área aérea es el área medida en el punto de tiempo en el cual la planta ha alcanzado su máxima biomasa de follaje.

El aumento en la biomasa de la raíz se expresa como un aumento en la biomasa total de la raíz (medida como la biomasa máxima de las raíces observada durante el ciclo de vida de una planta); o como un aumento en el índice de raíz/brote, medido como la relación entre la masa de la raíz y la masa del brote durante el período de crecimiento activo de la raíz y del brote. En otras palabras, se define el índice de raíz/brote como la relación de la rapidez del crecimiento de la raíz con la rapidez del crecimiento del brote en el periodo del crecimiento activo de la raíz y el brote. La biomasa de raíces se puede determinar con el método descrito en WO 2006/029987.

Parámetros relacionados con el tiempo de desarrollo El vigor temprano es el área aérea de la planta tres semanas posteriores a la germinación. El vigor temprano se determinó al contar la cantidad total de píxeles de las partes aéreas de las plantas diferenciadas del fondo. Este valor se promedió para las fotos tomadas en el mismo punto de tiempo desde los diferentes ángulos y se convirtió a un valor de superficie física expresado en mm cuadrados por calibración. Área de surgimiento indica el rápido desarrollo temprano cuando este valor disminuye en comparación con las plantas de control. Es la relación (expresada en %) entre el tiempo que necesita una planta para alcanzar el 30 % de la biomasa final y el tiempo que necesita para alcanzar el 90 % de su biomasa final.

El "tiempo en florecer" o el "tiempo de floración" de la planta se puede determinar con el método descrito en WO 2007/093444.

Medición de parámetros relacionados con las semillas Las panículas primarias maduras se cosecharon, se contaron, se embolsaron, se rotularon con códigos de barras y luego se secaron durante tres días en un horno a 37°C. Luego se trillaron las panículas, y se recogieron y contaron todas las semillas. En general, las semillas se cubren con una cubierta externa seca, la cascara. Las cáscaras llenas (también denominado en la presente florcillas llenas) se separaron de las vacías con un dispositivo de soplado de aire. Las cáscaras vacías se descartaron y la fracción restante se contó nuevamente. Las cáscaras llenas se pesaron en una balanza analítica.

La cantidad total de semillas se determinó al contar la cantidad de cáscaras llenas que permanecieron después de la etapa de separación. El peso total de las semillas se midió pesando todas las cáscaras llenas cosechadas de una planta.

Se determinó la cantidad total de semillas (o florcillas) por planta al contar la cantidad de cáscaras (llenas o no) cosechadas de una planta.

El peso de mil granos (TKW) se extrapola a partir de la cantidad de semillas contadas y su peso total.

El índice de cosecha (Hl) en la presente invención se define como la relación entre el peso total de la semilla y el área aérea (mm2), multiplicado por un factor 106.

La cantidad de flores por panícula, como se define en la presente invención, es la relación entre la cantidad total de semillas y la cantidad de panículas primarias maduras.

La "tasa de llenado de semillas", como se define en la presente invención, es la relación (expresada como %) entre la cantidad de semillas llenas (es decir, florcillas que contienen semillas) y la cantidad total de semillas (es decir, cantidad total de florcillas). En otras palabras, la tasa de llenado de semillas es el porcentaje de florcillas que se llenan con semillas.

Ejemplo 10: Resultados de la evaluación fenotípica de las plantas transqénicas 1. Polipéptidos tipo CYP704 Los resultados de la evaluación de las plantas transgénicas de arroz T1 que expresan un ácido nucleico que codifica el polipéptido tipo CYP704 de SEQ ID NO: 4 en condiciones sin estrés se indican a continuación en la Tabla E1. Cuando se cosecharon en condiciones sin estrés, se observó un aumento de al menos 5 % del rendimiento de semillas (incluso peso total de semillas, tasa de llenado e índice de cosecha). Además, las plantas que expresan el ácido nucleico tipo CYP704 de SEQ ID NO: 1 mostraron, para una o más de las líneas evaluadas, un aumento del peso de mil granos, altura y área de surgimiento.

Tabla E1 : Síntesis de datos de las plantas transgénicas de arroz; para cada parámetro, se muestra el porcentaje de aumento total para la generación T1 , para cada parámetro el valor p es <0,05.

Las plantas transgénicas de arroz T1 que expresan el ácido nucleico que codifica el polipéptido tipo SYP704 de SEQ ID NO: 4 en condiciones sin estrés mostraron aumento de la tasa de llenado (aumento total de 16,0 %, valor p <0,05). Además, dos de las líneas evaluadas arrojaron un resultado positivo para Emervigour (vigor temprano), y para la altura, una de las líneas evaluadas tuvo un aumento del peso de mil granos. 2. Polipéptidos DUF1218 Los resultados de la evaluación de las plantas transgénicas de arroz de la generación T1 que expresan el ácido nucleico que codifica el polipéptido DUF1218 de SEQ ID NO: 88 en condiciones sin estrés indicaron un aumento del peso total de las semillas de al menos 5 % (valor p <0,05) y, en particular, de 10,4 %, en comparación con las plantas de control.

Este efecto se confirmó en la generación T2. Los resultados de la evaluación de plantas transgénicas de arroz de la generación T2 que expresan el ácido nucleico que codifica el polipéptido DUF1218 de SEQ ID NO: 88 en condiciones sin estrés indicaron un aumento del peso total de las semillas de al menos 5 % (valor p <0,05) y, en particular, de 8,1 %, en comparación con las plantas de control.

Los resultados del análisis combinado se muestran en la Tabla E2. Como se muestra en la siguiente Tabla E2, el valor p de la prueba F para la evaluación combinada de T1 y T2 fue significativo (valor p de 0,0001 ), lo cual indicó que la presencia del constructo en las plantas tiene un efecto significativo en el peso total de las semllas en las plantas transgénicas.

Tabla E2: Peso total de semillas; aumento total en comparación con las plantas de control Asimismo, se observó que las plantas de al menos dos eventos mostraron un aumento del vigor de surgimiento, tasa de llenado, índice de cosecha, cantidad de semillas y peso de mil granos, en comparación con las plantas de control. Un evento también mostró un aumento de la biomasa (aumento del área y altura máx.), en comparación con las plantas de control. 3. Polipéptidos tipo translina Los resultados de la evaluación de las plantas transgénicas de arroz en condiciones sin estrés se indican a continuación. Se observó un aumento de al menos 5 % del rendimiento total de las semillas (peso total de semillas), tasa de llenado de semillas (tasa de llenado), índice de cosecha y cantidad de semillas (cant. de semillas llenas) (Tabla E3).

Los resultados de la evaluación de las plantas transgénicas de arroz en la generación T1 que expresan un ácido nucleico que codifica el polipéptido tipo translina de SEQ ID NO: 191 en condiciones sin estrés se indican a continuación en la Tabla E3. Cuando se cultivaron en condiciones sin estrés, se observó un aumento de al menos 5 % del rendimiento total de las semillas (peso total de semillas), tasa de llenado de semillas (tasa de llenado), índice de cosecha y cantidad de semillas (cant. de semillas llenas).

Tabla E3: Síntesis de datos de las plantas transgénicas de arroz; para cada parámetro, se muestra el porcentaje de aumento total para la generación T1 , para cada parámetro el valor p es <0,05. 4. Polipéptidos tipo ERG28 Las plantas transgénicas de arroz que expresan la proteína tipo ERG28 mediante SEQ ID NO: 247 o SEQ ID NO: 249 o una versión modificada de esta muestran al menos un rasgo aumentado relacionado con el rendimiento, como se define en la presente, en particular, mayor rendimiento, tal como mayor biomasa y/o mayor rendimiento de semillas, y/o tienen un contenido elevado de esteroides y/o una composición modificada de esteroides.

Ejemplo 13: La expresión de la proteína tipo ERG-28 en la levadura da como resultado un mejor crecimiento y apareamiento de la levadura El tipo ERG28 se clona y se expresa en Saccharomyces cerevisiae mediante técnicas estándares. Los clones de levadura que tienen expresión modulada (preferentemente, aumento de la expresión) del tipo ERG28 tienen mayor crecimiento, en comparación con la levadura de tipo silvestre.

La tasa de crecimiento y la capacidad de apareamiento de la levadura se determinan como se describe en Smith et al, Science 274:2069-2074, 1996.

Ejemplo 14: Una menor expresión de la proteína tipo ERG-28 en los mutantes de T-ADN ERG28 da como resultado rasgos aumentados relacionados con el rendimiento en condiciones sin estrés y de estrés por sequía Se han caracterizado varias líneas de mutantes de T-ADN del gen tipo ERG-28 mediante la identificación de mutantes ERG28 con pérdida de función de Arabidopsis (AtERG28) que mostraron un fenotipo radicular con deficiencia de esteróles (es decir, raíces hinchadas con mayor densidad y longitud de las vellosidades radiculares), así como mayor rendimiento de las semillas en condiciones sin estrés y una vez recuperadas después del estrés por sequía. 1. Materiales y métodos Material vegetal y condiciones de crecimiento Las semillas (generación T2) de las líneas de inserción de T-ADN SALK, SAIL y GABI-Kat se obtuvieron de European Arabidopsis Stock Centre (NASC). Las líneas de inserción de T-ADN FLAG y las líneas de mutantes etiquetados con transposón de Arabidopsis RIKEN (RATM) se obtuvieron de INRA Versailles y RIKEN, respectivamente. Los controles de tipo silvestre de Arabidopsis que se usaron fueron el ecotipo Columbia (Col-0) en el caso de las líneas SALK, SAIL y Gabi-Kat, y el ecotipo Wassiíewskija (Ws) en el caso de las líneas FLAG.

Las semillas se esterilizaron en la superficie, se enfriaron a 4 °C durante 3 d, germinaron y se cultivaron en un medio Murashige y Skoog (MS) (Murashige and Skoog, 1962) enriquecido con 1 % de sacarosa a 21 °C en un fotoperíodo de 16 h de luz/8 h de oscuridad. De una a dos semanas después de la germinación, las plántulas se transfirieron al suelo y se cultivaron hasta alcanzar la madurez a la misma temperatura y condiciones de luz. Para el análisis fenotípico de las plántulas mutantes de la línea de T-ADN GABI-Kat_205F01 , los ensayos de la placa de antibióticos se realizaron enriqueciendo el medio MS con 5,25 mg.L-1 de Sulfadiazine. Los ensayos de estrés abiótico se realizaron enriqueciendo el medio MS con 50 mM de mannitol, 100 mM de mannitol o 150 mM dé NaCI.

La extracción de ADN genómico para la medición de genotipos se realizó con el método CTAB. Para identificar mutantes homocigotas inactivados (knockout) con una inserción de T-ADN, se usaron cebadores límite de T-ADN y cebadores específicos de genes derivados del ADN genómico que flanquea la inserción de T-ADN. Los individuos homocigotas para la inserción de T-ADN se hicieron notar por la ausencia de productos específicos de genes y la presencia de un producto específico de T-ADN. A continuación se indican los cebadores que se usaron para la medición de genotipos y la secuenciación: GABI-Kat 923G08 LP 323 ATTTCAAGTAGCCCCCTAAATTGT La extracción de ARN total para el análisis del nivel de transcriptos EG28 mediante transcripción inversa cuantitativa en tiempo real y PCR (qRT-PCR) se realizó de acuerdo con el método de TRI-reactivo (TRIZOL)-cloroformo-isopropanol después de la purificación del ARN aislado usando columnas RNAeasy™. La síntesis de cADN se realizó con el kit de síntesis de cADN iScript™. Se evaluaron CDKA, UBQ10, EEF1 a y 18sRNA como cebadores génicos de referencia. Se seleccionaron CDKA y EEF1 a como gen de referencia para analizar aún más los niveles de transcriptos ERG28. Para la detección de transcriptos génicos de referencia y ERG28, se usaron los cebadores que se enumeran a continuación: 2. Caracterización de líneas de T-ADN AtERG28 A continuación se enumeran las líneas de T-ADN disponibles y para las cuales se recibieron semillas (generación T2) para la caracterización de mutantes de T-ADN AtERG28. Las líneas que se analizaron se muestran en negrita. A continuación también se indican las posiciones previstas de las inserciones de estas líneas de T-ADN con respecto a la secuencia codificante de genes ERG28.

Se realizaron mediciones de genotipo, fenotipo y análisis del nivel de transcripto ERG28 para las diferentes líneas de T-ADN descritas en Materiales y métodos. Entre las líneas de T-ADN para las cuales se pudieron identificar algunos mutantes homocigotas y se pudo confirmar la inserción de T-ADN mediante secuenciación, los mutantes homocigotas de dos de ellas mostraron alteración de los niveles de transcriptos AtERG28. En una de ellas (SAIL_CS839574), los niveles de transcriptos se regularon en forma ascendente en comparación con los segregantes WT y heterocigotas, mientras que en la otra (GABI-Kat_205F01 ), los niveles de transcriptos de AtERG28 se redujeron considerablemente. No se observaron cambios considerables en los niveles de transcriptos AtERG28 en los mutantes homocigotas de ninguna de las otras líneas de mutantes de T-ADN. Ninguno de los mutantes homocigotas de cualquiera de las líneas de T-ADN antes mencionadas mostraron una diferencia fenotípica visible con sus segregantes de tipo silvestre (WT) cuando se cultivaron en el suelo en condiciones sin estrés/de crecimiento óptimo. Los resultados de la caracterización de la línea de T-ADN ERG28 se resumen a continuación para cada una de las líneas, y los resultados del nivel de expresión de transcriptos AtERG28 se muestran en la Figura 22.

• FLAG_520D04: segregación de población de mutantes heterocigotas, homocigotas y WT; no hubo cambios en el nivel de expresión de transcriptos AtERG28 (qRT-PCR) en los mutantes, en comparación con el WT; no hubo fenotipos visibles.

• SALK_139449: todos mutantes homocigotas; no hubo diferencia considerable en el nivel de expresión de transcriptos AtERG28, en comparación con WTcolO, no hubo fenotipos visibles.

· SAIL_CS839574: segregación de población de mutantes heterocigotas, homocigotas y WT; aumento considerable del nivel de expresión de transcriptos AtERG28 en los mutantes (y, en menor grado, también en los heterocigotas), en comparación con el WT; no se observaron diferencias fenotípicas visibles entre el muíante homocigota SAIL_CS839574 y las plantas WT cultivadas en el suelo en condiciones de crecimiento óptimo.

• SALK 000240: segregación de población de mutantes heterocigotas, homocigotas y WT; no hubo fenotipos visibles.

• GABI-Kat_205F01 : segregación de población de mutantes heterocigotas, homocigotas y WT; disminución considerable del nivel de expresión de transcriptos AtERG28 en los mutantes, en comparación con los heterocigotas y WT; no se observaron diferencias fenotípicas visibles entre el mutante homocigota GABI-Kat_205F01 y las plantas WT cultivadas en el suelo en condiciones de crecimiento óptimo.

FLAG_328E06, SALK_027826, SALK_025834, SALK_000240 y SALK_023293: no se identificaron mutantes homocigotas; no se confirmó la inserción de T-ADN. · 3. Análisis fenotípico de mutantes de T-ADN GK205F01 (T3) en condiciones de estrés y sin estrés Se recolectaron semillas T3 producidas por plantas T2 de las lineas mutantes de T-ADN para las cuales se pudo confirmar la inserción (FLAG_520D04, SALK_139449, SAIL_CS839574, SALK_000240, GABI-Kat_205F01 ) (para cada línea de T-ADN, se cosecharon varios individuos/réplicas biológicas de cada uno de los genotipos: mutantes homocigotas, heterocigotas y segregantes WT).

Los análisis de fenotipos en condiciones de estrés y sin estrés se realizaron en la progenie (F1 ) de mutantes homocigotas, heterocigotas y WT de la línea de T-ADN GABI-Kat_205F01. Se germinaron las semillas, y se cultivaron las plántulas en un medio S con y sin selección de antibióticos (5,25 mg.L-1 Sulfadiazine) o tratamiento osmótico/de estrés salino (50 mM de mannitol, 100 mM de mannitol o 150 mM de NaCI). Solo las semillas y plántulas mutantes homocigotas GABI-Kat_205F01 , y no las de WT, pudieron crecer en un medio MS enriquecido con antibióticos; por ello, se confirmó la presencia del inserto de T-ADN en los mutantes homocigotas (no se muestran los datos).

Las plántulas WT y mutantes homocigotas GABI-Kat_205F01 de 11 días (de 8 a 9 réplicas biológicas de cada genotipo) cultivadas en un medio MS se transfirieron al suelo. Cuando tuvieron 18 días, se detuvo el riego de las plantas durante alrededor de 2 semanas. En ese momento, las plantas que habían comenzado a morir se volvieron a regar, y se registró su capacidad de recuperación. Se dejó que las plantas maduraran en condiciones de abundante riego, y las semillas se cosecharon y pesaron. Las semillas también se cosecharon y se pesaron de plantas de control WT y mutantes homocigotas que siempre se mantuvieron bien regadas (4 réplicas biológicas de cada genotipo). Las plantas mutantes homocigotas exhibieron un leve aumento del rendimiento de las semillas (12-19 %; no hubo una diferencia importante en términos estadísticos) en comparación con WT, ambas en condiciones de estrés y sin estrés. Los resultados de estas mediciones del rendimiento de semillas se indican en la Figura 23.

Se observó un leve aumento del rendimiento de las semillas en el mutanté con pérdida de función AtERG28, en comparación con WT, tanto en condiciones sin estrés y como una vez recuperadas después del estrés por sequía. La regulación descendente de ERG28 en estas especies genera una mayor densidad de las vellosidades radiculares, y por lo tanto, una mayor nodulación y capacidad de fijación de nitrógeno simbiótica.

Claims

REIVINDICACIONES

1. Un método para la producción de una planta transgénica que tiene rendimiento de semilla mejorado en relación con una planta control, que comprende las etapas de: - introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido tipo CYP704, en donde el ácido nucleico se une operativamente a un promotor de planta constitutivo, y en donde el polipéptido tipo CYP704 comprende el polipéptido representado por una de: SEQ ID NO: 2, SEQ ID NO: 4 o un homólogo de las mismas que tiene al menos 90% de identidad de secuencia global para SEQ ID NO: 2 o SEQ ID NO: 4, y - cultivar la célula vegetal o planta bajo condiciones que promueven el crecimiento y desarrollo de la planta.

2. El método de acuerdo con la reivindicación 1, en donde el rendimiento de semilla incrementado comprende por lo menos un parámetro seleccionado del grupo que comprende incrementar el peso de semillas total, índice de cosecha incrementada, y la tasa de carga incrementada, en particular, en donde el incremento en el rendimiento de semilla comprende un incremento de al menos 5% en la planta cuando se compara con las plantas control para cada uno de los parámetros.

3. El método de acuerdo con cualquiera de las reivindicaciones 1 ó 2, en donde el rendimiento incrementado se obtiene bajo condiciones sin estrés.

4. El método de acuerdo con cualquiera de las reivindicaciones 1 a 3, en donde el ácido nucleico se une operablemente al promotor GOS2, en particular en donde el promotor GOS2 es el promotor GOS2 de arroz.

5. El método de acuerdo con cualquiera de las reivindicaciones 1 a 4, en donde la planta es una planta monocotiledónea, en particular, en donde la planta es un cereal.

6. Un método para mejorar los rasgos relacionados con el rendimiento de plantas en relación con plantas control, que comprende (i) modular la expresión en una planta de un ácido nucleico que codifica un polipéptido de DUF1218, en donde el polipéptido de DUF1218 comprende un dominio DUF1218, en particular en donde la expresión modulada se efectúa al introducir y expresar en una planta el ácido nucleico que codifica el polipéptido de DUF1218, o (¡i) introducir y expresar en una planta un ácido nucleico que codifica un polipéptido tipo translin, en donde el polipéptido tipo translin comprende la secuencia de firma GTDFWKLRR (SEO. ID NO: 245) y comprende de preferencia un acceso InterPro IPR002848 que corresponde al dominio translin número de acceso PFAM PF01997, o, un método para mejorar el rasgo relacionado con el rendimiento y/o para modificar la composición esferoide en planta con relación a plantas control que comprende (iii) modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo ERG28, en donde el polipéptido ERG28 comprende un dominio Pfam PF03694 y de preferencia también la secuencia de firma WTLL[TS]CTL, en particular en donde la expresión modulada se efectúa al introducir y expresar en una planta el ácido nucleico que codifica el polipéptido tipo ERG28.

7. El método de acuerdo con la reivindicación 6, en donde (i) el ácido nucleico codifica un polipéptido de DUF1218, y en donde el rasgo relacionado con el rendimiento mejorado comprende incrementar el rendimiento en relación con las plantas control, y de preferencia comprende el rendimiento de semillas incrementado y/o biomasa incrementada en relación a las plantas control, en particular en donde el rendimiento de semillas incrementado comprende el peso de la semillas total incrementado, (ii) el ácido nucleico codifica un polipéptido tipo translin, y en donde el rasgo relacionado con el rendimiento mejorado comprende incrementar el rendimiento en relación con las plantas control, y de preferencia comprende incrementar el índice de cosecha y/o el rendimiento de semilla incrementada en relación con las plantas control, o (iii) el ácido nucleico que codifica un polipéptido tipo ERG28, y en donde los rasgos relacionados con el rendimiento mejorado comprende incrementar el rendimiento incrementado y/o vigor temprano en relación con las plantas control, y de preferencia comprende incrementar la biomasa incrementada y/o el rendimiento de semillas incrementado en relación con las plantas control.

8. El método de acuerdo con cualquiera de las reivindicaciones 6 ó 7, en donde el ácido nucleico codifica un polipéptido tipo DUF1218 o translin, y en donde los rasgos relacionados con el rendimiento mejorado se obtienen bajo condiciones sin estrés, o en donde el ácido nucleico codifica un polipéptido tipo ERG28, y en donde los rasgos relacionados con el rendimiento mejorado y/o la composición de esteroide modificada, y/o los niveles de esteroide incrementados o unidos se obtienen bajo condiciones sin estrés.

9. El método de acuerdo con cualquiera de las reivindicaciones 6 ó 7, en donde el ácido nucleico codifica un polipéptido de DUF1218, y en donde el rasgo relacionado con el rendimiento mejorado se obtienen bajo condiciones de estrés por sequía, estrés por salinidad o deficiencia de nitrógeno, o en donde el ácido nucleico codifica un polipéptido tipo ERG28, y en donde los rasgos relacionados con el rendimiento mejorado, y/o la composición estéril modificada, y/o los niveles de esteroide incrementados o disminuidos se obtienen bajo condiciones de estrés por sequía, estrés por salinidad o deficiencia de nitrógeno.

10. El método de acuerdo con cualquiera de las reivindicaciones 6 a 9, en donde (a) el dominio DUF1218 comprende una secuencia de aminoácidos que tiene al menos 50% de la identidad de secuencia global en el aminoácido representado por la SEQ ID NO: 179; (b) el aminoácido que codifica un polipéptido tipo translin codifica el polipéptido representado por la SEQ ID NO: 191 , o (c) el polipéptido tipo ERG28 comprende uno o más de los siguientes motivos: (i) Motivo 19: CTLC[FY]LCA[FL]NL[HE][DN][KR]PLYLAT [IF]LSF[IV]YA[FL]GHFLTE[FY]L[FI]Y[HQ]TM. (¡i) Motivo 20: VG[ST]LRLASVWFGF[VF][DN]IWALR[LV] AVFS[QK]T[TE]M[TS][ED][VI]HGRTFG(VT)WT. (i) Motivo 21 : [IA][KA]NL[SVT]TVG[FI]FAGTSI[VI] WMLL[EQ]WN[SA][LH][EQG][QK][PV][RKH] (iv) Motivo 22: [PEK][LA]LG[YW]WL[MI].

11. El método de acuerdo con cualquiera de las reivindicaciones 6 a 10, en donde el polipéptido DUF1218 tiene al menos un péptido de señal y al menos un dominio de transmembrana.

12. El método de acuerdo con cualquiera de las reivindicaciones 6 a 1,1 , en donde el polipéptido DUF1218 comprende uno o más de los siguientes motivos. (i) Motivo 10: NW[TS][LV]AL[VI][CS]F[VI]VSW[FA] TF[VI]IAFLLLLTGAALNDQ[HR]G[EQ]E(SEQ ID NO: 180) (i¡) Motivo 1 1 : SP[STG][EQ]C[VI]YPRSPAL[AG]LGL[^ [AS]A[DV][AS]LM[IV]A[QH][ISV]IIN[TV][AV]rTA]GCICC(KR][RK] (SEQ ID NO: 181 ) (iii) Motivo 12: [YS][YF]CYWKPGVF[AS]G[GA]AVLSLASV [AI]L[GA]IVYY (SEQ ID NO: 182, o el método de acuerdo con cualquiera de las reivindicaciones 6 a 10, en donde el polipéptido tipo translin comprende uno o más de los siguientes motivos. (i) Motivo 16: DLAAV[TV][NED]QY[IM][LAGS][KR] LVKELQGTDFWKLRRAY[ST][PF]GVQEYVEAAT[FL][CY][KR]FC[RK][TS]GT (SEQ ID NO: 238. (ii) Motivo 17: [SP][SA][FM]K[DA][AE]F[GSA][NK][YH] ?[??]???[? ??[?0]????[??]???5??[??]???5?????a???[??)3?[0?]?[??](5?0 ID NO: 239), (i) Motivo 18: IC[QA]FVRDIYRELTL[LVI]VP[YL]MDD[SN] fSN][DE]MK[TK]KM[DE][TV]MLQSV[VM]KIENAC[YF][GS]VHVRG (SEQ ID NO: 240).

13. El método de acuerdo con cualquiera de las reivindicaciones 6 a 12, en donde el polipéptido DUF1218 además comprende uno o más de los siguientes motivos: (i) Motivo 13: CCKRHPVPSDTNWSVALISFIVSW[VAC] TFIIAFLLLLTGAALNDQRG[EQ]ENMY (SEQ ID NO: 183). (ii) Motivo 14: M ERK[AV] VWC A[LV] VG FLG VLSAALG FAAE [GA]TRVKVSDVQT[DS] (SEQ ID NO: 184). (iii) Motivo 15: IP[QP]QSSEPVFVHEDTYNR[QR]Q[FQ] (SEQ ID NO: 185

14. El método de acuerdo con cualquiera de las reivindicaciones 6 a 13, en donde (i) el ácido nucleico codifica un polipéptido DUF1218 es de un origen vegetal, de preferencia de una planta monocotiledónea, de preferencia adicionalmente de la familia Poaceae, de mayor preferencia del género Oryza, de mayor preferencia el ácido nucleico es de Oryza sativa, (ii) en donde el ácido nucleico que codifica un polipéptido tipo translin es de origen vegetal, de preferencia de una planta dicotiledónea, de preferencia adicionalmente de la familia Salicaceae, de mayor preferencia del género Populus, de mayor preferencia de Populus trichocarpa, o (¡ii) en donde el ácido nucleico codifica un tipo ERG28 es de origen vegetal, de preferencia de una planta dicotiledónea, de preferencia adicionalmente de la familia Brassicaceae, de mayor preferencia del género Arabidopsis, de mayor preferencia de Arabidopsis thaliana.

15. El método de acuerdo con cualquiera de las reivindicaciones 6 a 14, en donde (i) el ácido nucleico codifica un polipéptido DUF1218 que codifica cualquiera de los polipéptidos listados en la Tabla A2 o es una porción del ácido nucleico o un ácido nucleico capaz de hibridizar con el ácido nucleico. (ii) en donde el ácido nucleico que codifica un polipéptido tipo ERG28 codifica cualquiera de los polipéptidos listados en la Tabla A4 o es una porción de un ácido nucleico, o un ácido nucleico capaz de hibridizar con el ácido nucleico.

16. El método de acuerdo con cualquiera de las reivindicaciones 6 a 15, en donde (i) la secuencia de ácido nucleico que codifica un polipéptido DUF1218 codifica un ortólogo o parálogo de cualquiera de los polipéptidos determinados en la Tabla A2, o (ii) el ácido nucleico que codifica un polipéptido tipo ERG28 codifica un ortólogo o parálogo de cualquiera de los polipéptidos determinados en la Tabla A4.

17. El método de acuerdo con cualquiera de las reivindicaciones 6 a 16, en donde (i) la secuencia de ácido nucleico que codifica un polipéptido DUF1218 codifica el polipéptido representado por la SEQ ID NO: 88 o un homólogo de la misma, o (¡i) en donde el ácido nucleico codifica un polipéptido tipo ERG28 que codifica el polipéptido representado por SEQ ID NO: 247.

18. El método de acuerdo con cualquiera de las reivindicaciones 6 a 17, en donde el ácido nucleico se une operablemente a un promotor constitutivo, de preferencia a un promotor constitutivo de resistencia media, de preferencia a un promotor de planta, de mayor preferencia a un promotor de GOS2, de mayor preferencia a un promotor de GOS2 de arroz.

19. La planta, parte de la planta de la misma, incluyendo semillas, o células vegetales, obtenibles por un método de acuerdo con cualquiera de las reivindicaciones 1 a 18, en donde la planta, parte de la planta o las células vegetales comprenden un ácido nucleico recombinante que codifica un polipéptido tipo CYP704 como se define en la reivindicación 1 , o un polipéptido DUF1218, un polipéptido tipo translin, o un polipéptido tipo ERG28 como se define en cualquiera de las reivindicaciones 6 y 10 a 17.

20. El constructo comprende: (i) el ácido nucleico que codifica un polipéptido tipo CYP704 se define en la reivindicación 1 , o un polipéptido DUF1218, un polipéptido tipo translin, o un polipéptido tipo ERG28 como se define en cualquiera de las reivindicaciones 6 y 10 a 17; (ii) una o más secuencias de control capaces de manejar la expresión de la secuencia de ácido nucleico de (i); y opcionalmente (iii) una secuencia de terminación de transcripción.

21. El constructo de acuerdo con la reivindicación 20, en donde una de las secuencias de control es un promotor constitutivo, de preferencia un promotor constitutivo de resistencia media, de preferencia un promotor de planta, de mayor preferencia un promotor de GOS2, de mayor preferencia un promotor de GOS2 de arroz.

22. El uso de un constructo de acuerdo con la reivindicación 20 ó 21 en un método para fabricar plantas que tengan rasgos relacionados con el rendimiento mejorado, y/o la composición de esteroide modificado, y/o los niveles de esteroide incrementados o disminuidos, en relación con las plantas control de preferencia el rendimiento incrementado en relación con las plantas control, y de mayor preferencia el rendimiento de semillas incrementado y/o la biomasa incrementada en relación con la planta control.

23. La planta, parte de la planta o células vegetales transformadas con un constructo de acuerdo con la reivindicación 20 ó 21.

24. Un método para la producción de una planta transgénica que tiene rasgos relacionados con el rendimiento mejorado y/o con posición de esteroide modificado, y/o niveles de esteroide incrementado o disminuido, en relación con plantas control, de preferencia el rendimiento incrementado en relación con las plantas control, de mayor preferencia el rendimiento de semillas incrementado y/o la biomasa incrementada y/o el índice de cosecha incrementado en relación con las plantas control, que comprende: (i) introducir y expresar en una célula vegetal o planta un ácido nucleico que codifica un polipéptido DUF1218, un polipéptido tipo translin, o un polipéptido tipo ERG28 como se define en cualquiera de las reivindicaciones 6 y 10 a 17; y (¡i) cultivar la célula vegetal o planta bajo condiciones que promueven el crecimiento y desarrollo de la planta.

25. La planta transgénica que tiene rasgos relacionados con el rendimiento mejorado en relación con plantas control, que resulta de la expresión modulada de un ácido nucleico que codifica un polipéptido tipo CYP704 como se define en la reivindicación 1 , o un polipéptido DUF1218, un polipéptido tipo translin, o un polipéptido tipo ERG28 como se define en cualquiera de las reivindicaciones 6 y 10 a 17, o célula vegetal transgénica derivada de la planta transgénica.

26. La planta transgénica de acuerdo con la reivindicación 19, 23 ó 25, o una célula vegetal transgénica derivada de la misma, en donde la planta es una planta de cultivo, tal como remolacha, remolacha azucarera o alfalfa; o una planta monocotiledónea tal como caña de azúcar; o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, tritical, zahina, espelta, escanda, sécale, escanda menor, tef, sorgo o avena.

27. Las partes cosechables de una planta de acuerdo con cualquiera de las reivindicaciones 19, 23, 25-26, en donde las partes cosechables son de preferencia acumulación de la biomasa y/o semillas.

28. Los productos derivados de una planta de acuerdo con cualquiera de las reivindicaciones 19, 23, 25-26 y/o de las partes cosechables de una planta de acuerdo con la reivindicación 27.

29. Una molécula de ácido nucleico aislada seleccionada de: orden creciente de preferencia al menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad de secuencia en la secuencia de aminoácido representada por cualquiera de las SEQ ID NO: 88 ó 98, y que comprende adicional o alternativamente uno o más motivos que tienen en orden creciente de preferencia al menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más identidad de secuencia en cualquiera o más de los motivos determinados en la SEQ ID NO: 179 a la SEQ ID NO: 185, y de preferencia adicional que confiere rasgos relacionados con el rendimiento mejorado en relación con las plantas control. (iv) una molécula de ácido nucleico que hibridiza con una molécula de ácido nucleico de (i) a (iii) bajo condiciones de hibridación a alta rigurosidad y de preferencia confiere rasgos relacionados con el rendimiento mejorado en relación con las plantas control.

30. El polipéptido aislado seleccionado de: (i) una secuencia de aminoácido representada por cualquiera de las SEQ ID NO: 88 ó 98; (ii) una secuencia de aminoácido que tiene, en orden creciente de preferencia, al menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71 %, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad de secuencia en la secuencia de aminoácido representada por las SEQ ID NO: 88 ó 98, y que comprende adicional o alternativamente uno o más motivos que tienen en orden creciente de preferencia al menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más identidad de secuencia en cualquiera o más de los motivos determinados en la SEQ ID NO: 179 a la SEQ ID NO: 185, y de preferencia adicional que confiere rasgos relacionados con el rendimiento mejorado en relación con las plantas control. (iii) derivados de cualquiera de las secuencias de aminoácidos determinadas en (i) o (ii) anteriores.

31. El uso de ácido nucleico que codifica un polipéptido tipo CYP704 como se define en la reivindicación 1 , o un polipéptido DUF1218, o un polipéptido tipo translin, como se define en cualquiera de las reivindicaciones 6 y 10 a 17 para mejorar los rasgos relacionados con el rendimiento y/o modificar la composición esteroide, y/o incrementar o disminuir los niveles de esteroides en plantas con relación con las plantas control, en donde (i) el ácido nucleico codifica un polipéptido tipo CYP704, y en donde el rasgo relacionado con el rendimiento es el rendimiento de semilla, en particular el rendimiento de semillas como se define en la reivindicación 2, (¡i) el ácido nucleico que codifica un polipeptido DUF1218, y en donde el rasgo relacionado con el rendimiento es, de preferencia el rendimiento y, de mayor preferencia el rendimiento de semillas, o (iii) el ácido nucleico codifica un polipéptido tipo translin, y en donde el rasgo relacionado con el rendimiento es, de preferencia el rendimiento y, de mayor preferencia el rendimiento de semillas y/o biomasa incrementada.

32. El uso de un ácido nucleico que codifica un polipéptido tipo ERG28 como se define en cualquiera de las reivindicaciones 6, 10 y 14 a 17 para mejorar los rasgos relacionados con el rendimiento, y/o modificar la composición esferoide, y/o incrementar o disminuir los niveles de esteroide en plantas en relación con las plantas control.

33. El uso de un ácido nucleico como se define en la reivindicación 29 y que codifica un polipéptido DUF1218, o de un ácido nucleico que codifica un polipéptido DUF1218 como se define en cualquiera de las reivindicaciones 6, y 10 a 17 para mejorar los rasgos relacionados con el rendimiento en planta en relación con las plantas control, de preferencia para incrementar el rendimiento, y de mayor preferencia para incrementar el rendimiento de semillas en plantas en relación con las plantas control.

34. El uso de un ácido nucleico que codifica un polipéptido DUF1218 como se define en cualquiera de las reivindicaciones 6 y 10 a 17 y 30 como marcador molecular.

35. El uso de un ácido nucleico como se define en la reivindicación 29 y que codifica un polipéptido DUF1218 como se define en cualquiera de las reivindicaciones 6 y 10 a 17 y 30 como el marcador molecular.

36. El uso de un ácido nucleico que codifica un polipéptido tipo translin para incrementar los rasgos relacionados con el rendimiento en relación con las plantas control.

37. El uso de un ácido nucleico que codifica un polipéptido tipo CYP704, en particular de un polipéptido CYP704 como se define en la reivindicación 1 para mejorar el rendimiento de semilla como se define en la reivindicación 2 en una planta transgénica en relación con una planta control. RESUMEN Un método para mejorar, en plantas, varios rasgos relacionados con el rendimiento de importancia económica. Más específicamente, un método para mejorar rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo CYP704 (familia 704 de citocromo P450), un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28. También plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido tipo CYP704 (familia 704 de citocromo P450), un polipéptido DUF1218, un polipéptido tipo translina o un polipéptido tipo ERG28, en donde las plantas tienen mejores rasgos relacionados con el rendimiento, con respecto a las plantas de control. También ácidos nucleicos que codifican polipéptidos DUF1218 y constructos que los comprenden desconocidos hasta el momento, útiles en la realización de los métodos de la invención.