wo 03/001902 A2
Publis ed: For rwo-ktier cedes and other abbreviations. refer to thc "Guid- — without iniernational search repon and to be republished ance Notes on Codes and Abbreviations" appearmg al the begin- upon receipt of ihat repon - ning ofeach regular issue of the PCT Gazetie.
1
ALTERACIÓN DE CARACTER STICAS DE ACEITE EN PLANTAS
Campo de la invención La presente invención está en el campo de la reproducción y genética vegetales, y, en particular, se refiere a la alteración de fenotipos de aceite en plantas a través de la expresión controlada de genes selectivos. Antecedentes de la invención Los lípidos vegetales tienen una variedad de usos industriales y nutricionales y son centrales para la función de la membrana vegetal y la adaptación climática. Estos lípidos representan una vasta disposición de estructuras químicas, y estas estructuras determinan las propiedades fisiológicas e industriales del llpido. Muchas de estas estructuras resultan ya sea directa o indirectamente de los procesos metabólicos que alteran el grado de insaturacion del lípido. Diferentes regímenes metabólicos en diferentes plantas producen estos lípidos alterados, y se requiere normalmente ya sea la domesticación de especies vegetales exóticas o la modificación de especies agronómicamente adaptadas para producir cantidades económicamente grandes del lípido deseado. Existen serias limitaciones al uso de mutagénesis para alterar la composición de los ácidos grasos. Los tamices raramente descubrirán mutaciones que a) den como REF . : 151550 2
resultado un fenotipo ("ganancia de función") dominante, b) estén en genes que sean esenciales para el crecimiento de la planta y c) estén en una enzima que nos sea limitadora de velocidad y que sea codificada por más de un gen. En casos en los que los fenotipos deseados están disponibles en lineas de maíz mutantes, su introgresión en líneas de primera categoría mediante técnicas de reproducción tradicionales es lenta y costosa, ya que las composiciones de aceite deseadas son probablemente el resultado de varios genes recesivos . Técnicas recientes de biología molecular y celular ofrecen el potencial de superar algunas de las limitaciones del enfoque de mutagénesis, incluyendo la necesidad de una extenso reproducción. Algunas de las tecnologías particularmente útiles son la expresión específica de semilla de genes extraños en plantas transgénicas [véase Goldberg et al (1989) Cell 55:149-160] , y el uso de ARN antisentido para inhibir los genes objetivo vegetales de una manera dominante y específica de tejido [véase van der Krol et al )1988) Gene 72:45-50]. Otros avances incluyen la transferencia de genes extraños en variedades comerciales de primera categoría de cultivos de oleaginosas comerciales, tales como soya [Chee et al (1989) Plant Physiol. 91:1212-12818; Christou et al )1989) Proc. Nati. Acad. Sel. U.S.A. 86:7500-7504; Hinchee et al (1988) Bio/Technology 6:915-922; publicación europea 0 301 749 A2] , colza [De Block et al (1989) Plant Physiol. 91:694- 3
701] y girasol [Everett et al (1987) Bio/Technology 5:1201-1204] , y el uso de genes como marcadores de polimorfismo de longitud de fragmento de restricción (RFLP) en un programa de reproducción, lo cual hace a la introgresión de características recesivas en líneas de primera categoría rápida y menos costosa [Tanksley et al (1989) Bio/Technology 7:257-264] . Sin embargo, la aplicación de cada una estas tecnologías requiere de la identificación y aislamiento de genes comercialmente importantes . La regulación de la transcripción de la mayorxa de los genes eucarióticos es coordinada a través de la unión específica de secuencia de proteínas a la región promotora localizada hacia el extremo cinco prima del gen. Muchas de estas secuencias de unión a proteínas han sido conservadas durante la evolución y se encuentran en una amplia variedad de organismos. Una de estas características es el elemento de secuencia "CCAAT" (Edwards et al, 1998, Plant Physuol . 117:1015-1022). Las cajas CC7AAT son una característica de promotores génicos en muchos eucariontes que incluyen varios promotores de genes vegetales . Las proteínas HAP constituyen una gran familia de factores de transcripción identificados primero en levadura. Se combinan para formar un complejo de proteínas heteromérico que activa la transcripción al unirse a cajas CCAAT en promotores eucarióticos . Las proteínas Hap ortólogas 4
despliegan un alto grado de conservación evolutiva en sus dominios funcionales en todas las especies estudiadas hasta la fecha (Li et al., 1991). WO 00/28058, publicado el 18 de mayo de 2000 describe polinucleótidos y polipéptidos activadores de transcripción de unión a caja CCAAT tipo Hap3 , especialmente, los polinucleótidos y polipéptidos activadores de transcripción de cotiledón 1 frondoso (LEC1) . WO 99/67405 describe genes de cotiledón 1 frondoso y sus usos. Los homólogos humanos, de murino y vegetales de proteínas de unión a CCAAT han sido aislados y caracterizados con base en su similitud de secuencia con sus contrapartes de levadura (Li et al., 1991) . Este alto grado de homología de secuencia se traduce notablemente en una capacidad de intercambio funcional entre proteínas ortólogas de diferentes especies (Sinha et al., 1995). A diferencia de la levadura, varias formas de cada homólogo HPA han sido identificadas en plantas (Edwards, et al., 1998). Los análisis moleculares y genéticos revelaron miembros de HAP que están implicados en el control de varios procesos biológicos críticos que van del desarrollo y regulación del ciclo celular al control metabólico y homeostasis (Lotan et al., 1998; López et al., 1996). En levadura, las proteínas HAP están implicadas en el control 5
transcripcional de procesos metabolicos relevantes tales como la regulación de la derrepresión catabólica de cycl y otros genes implicados en la respiración (Becker et al., 1991) . En sistemas de mamífero, varios reportes describen proteínas ??? como reguladores directos o indirectos de varios genes importantes implicados en la bioslntesis de lípidos tales como ácido graso sintasa (Roder et al., 1997), farnesil difosfato (FPP) sintasa, (Jackson et al., 1995; Ericsson et al., 1996), glicerol-3 -fosfato aciltransferasa (GPA, Jackson et al., 1997), acetil-CoA carboxilasa (ACC, López et al., 1996) y 3-hidroxi-3-metilglutaril-coenzima A (HMG-CoA) sintasa (Jackson et al., 1995), entre otros. Además, otros factores de transcripción de unión a CCAAT también ha sido reportados como implicados en diferentes aspectos del control de la biosíntesis de lípidos y el crecimiento y diferenciación de adipositos en sistemas de mamífero (véase McKnight et al., 1989). Parece que la evidencia actualmente disponible hasta la fecha apunta hacia una familia de proteínas de los factores de transcripción de unión a CCAAT como importantes moduladores del metabolismo y biosíntesis de lípidos en sistemas de mamífero. Esta determinación no se ha hecho para sistemas vegetales. Sumario de la invención Esta invención se refiere a un fragmento de 6
nucleótido aislado que comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en: a) una secuencia de ácido nucleico que codifica para un quinto polipeptido que tiene una actividad de factor de transcripción tipo Hap2, el quinto ' olipeptido tiene por lo menos 70% de identidad con base en el método de alineación Clustal cuando se le compara con un sexto polipéptido seleccionado del grupo que consiste en SEQ ID NOs : 2, 4, 5, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 ó 208, 210, 212, 214 ó 216; b) una secuencia de ácido nucleico que codifica para un séptimo polipéptido que tiene una actividad de factor de transcripción tipo Hap5, el séptimo polipéptido tiene al menos 80% de identidad con base ¦ en el método de alineación Clustal cuando se le compara con un octavo polipéptido seleccionado del grupo que consiste en SEQ ID NOs : 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128 ó 221,; c) una secuencia de ácido nucleico que codifica para un diecisieteavo polipéptido que tiene actividad tipo Hap3/Lecl, el diecisieteavo polipéptido tiene por lo menos 70% de identidad con base en el método de alineación Clustal cuando se le compara con un dieciochoavo polipéptido seleccionado del grupo que consiste en SEQ ID NOs: 130, 132, 7
134 ó 136. Son también de interés los complementos de este fragmento de nucleótido así como el uso de estos fragmentos o una parte de los mismos en inhibición o co-supresión antisentido en una planta transformada. En una segunda modalidad, esta invención se refiere a construcciones de ADN recombinantes que comprenden estos fragmentos, plantas que comprenden estas construcciones de ADN recombinantes en su genoma, semillas obtenidas de estas plantas y aceite obtenido de estas semillas. En una tercera modalidad, esta invención se refiere a un método para alterar fenotipo de aceite en una planta, que comprende: a) transformar una planta con una construcción de ADN recombinante de la invención, b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante y c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. En una cuarta modalidad, esta invención se refiere a un método para alterar fenotipo de aceite en una planta que comprende : a) transformar una planta con una construcción de ADN recombinante que comprende un fragmento de nucleótido aislado que contiene una secuencia de ácido nucleico 8
seleccionada del grupo que consiste en: i) una secuencia de ácido nucleico que codifica para un factor de transcripción Hap3/Lecl vegetal que tiene al menos 60% de identidad con base en el método de alineación Clustal cuando se le compara con un segundo polipéptido seleccionado del grupo que consiste en: SEQ ID NOs. pares: de 130 a 148 y SEQ ID NOs : 196 y 196; ii) el complemento de la secuencia de ácido nucleico de i) ; iii) la secuencia de i) o ii) o una parte de la misma que es útil en la inhibición o co-supresión antisentido en una planta transformada; iv) una secuencia de ácido nucleico que codifica para un factor de transcripción de unión a CCAAT relacionado con Lecl vegetal que tiene por lo menos 60% de identidad con base en el método de alineación Clustal cuando se le compara con un segundo polipéptido seleccionado del grupo que consiste en SEQ ID NOs pares: de 150 a 178 y SEQ ID NOs:'197 a 202; v) el complemento de la secuencia de ácido nucleico de iv) ; vi) la secuencia de iv) o v) o una parte de la misma que es útil en la inhibición o co-supresión antisentido en una planta transformada; en donde la secuencia de ácido nucleico está ligada 9
operablemente a por lo menos una secuencia reguladora; b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante y c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. En una quinta modalidad, esta invención se refiere a un método para alterar fenotipo de aceite en una planta que comprende : a) transformar una planta con una construcción de ADN recombinante que comprende un fragmento de ácido nucleico aislado ligado operablemente a por lo menos una secuencia reguladora, en donde el fragmento tiene una secuencia de ácido nucleico que codifica para un polipeptido que tiene una identidad de secuencia de por lo menos 60% con base en el método de alineación Clustal cuando se le compara con un polipeptido seleccionado del grupo que consiste en SEQ ID NOs pares: de 2 a 178, y 206 a 214, y SEQ ID NOs : 179 a 202, 216 a 219, 221 y 222; b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante; y c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el 10
fenotipo de aceite de una planta no transformada. En una sexta modalidad, esta invención se refiere a un método para mapear variaciones genéticas emparentadas con fenotipos de aceite alterados en una planta que comprende: a) cruzar dos variedades vegetales; y b) evaluar las variaciones genéticas con respecto a las secuencias de ácido nucleico descritas en cualquiera de los SEQ ID NOs impares: de 1 a 177, ó 207 a 215, o SEQ ID NO: 220 en plantas de progenie que resulten de la cruza de la etapa a) , en donde la evaluación se hace usando un método seleccionado del grupo que consiste en: análisis RFLP, análisis SNP y análisis a base de PCR. En una séptima modalidad, esta invención se refiere a un método de reproducción molecular para obtener fenotipos de aceite alterados en una planta que comprende: a) cruzar dos variedades vegetales y b) evaluar variaciones genéticas con respecto a secuencias de ácido nucleico descritas en cualquiera de las SEQ ID NOs impares: de 1 a 177, ó 207 a 215, o SEQ ID NO: 220 en plantas de progenie que resulten de la cruza de la etapa a) , en donde la evaluación se hace usando un método seleccionado del grupo que consiste en: análisis RFLP, análisis SNP y análisis a base de PCR. En una octava modalidad, esta invención se refiere a un método para alterar fenotipos de aceite en una planta, 1 1
el cual comprende : a) transformar una planta con una construcción de ADN recombinante que comprende un fragmento de nucleótido aislado que contiene una secuencia de ácido nucleico seleccionada del grupo que consiste en: i) una secuencia de ácido nucleico que codifica para un factor de transcripción Hap3/Lecl vegetal que tiene al menos 70% de identidad con base en el método de alineación Clustal cuando se le compara con un segundo polipéptido seleccionado del grupo que consiste en SEQ ID NOs : 130 a 148 y SEQ ID NOs: 195, 196 y 206; ii) el complemento de la secuencia de ácido nucleico de iv) ; iii) la secuencia de iv) o v) o una parte de la misma que es útil en la inhibición o co-supresión antisentido en una planta transformada; b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante y c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. En una novena modalidad, esta invención se refiere a un método para aislar fragmentos de ácido nucleico asociados con alterar fenotipos de aceite en una planta que 12
comprende : a) comparar los SEQ ID NOs pares: de 2 a 178 y 206 a 214, y SEQ ID NOs : 179 a 202, 216 a 219, 221, y 222 con otras secuencias de polipéptidos con el propósito de identificar los polipéptidos asociados con alterar fenotipos de aceite en una planta; b) identificar las secuencias conservadas o cuatro o más aminoácidos obtenidos en la etapa a) ; c) hacer sondas u oligómeros de nucleótidos específicos de región con base en las secuencias conservadas identificadas en la etapa b) y d) usar las sondas u oligómeros de nucleótidos de la etapa c) para aislar secuencias asociadas con alterar fenotipos de aceite mediante protocolos dependientes de secuencia. Breve descripción de las figuras y listados de secuencias La invención se puede entender más a partir de la siguiente descripción detallada, las figuras anexos y el listado de secuencias, los cuales forman una parte de esta solicitud. La figura 1 muestra la composición de ácido graso de embriones somáticos de maíz que sobreexpresan Hap3/Lecl (barras oscuras, "Hap3/Lecl") en comparación con embriones de control (barras claras, "con") . Se usó un promotor de ubiquitina para conducir la expresión de Hap3/Lecl en callos 13
embriogénicos de maíz. Más de diez eventos diferentes fueron analizados mediante GC para la composición/contenido de ácido graso y se compararon con controles transformados con el plásmido marcador seleccionable (gen BAR) solo. Los embriones somáticos que sobreexpresan Lecl contienen elevados contenidos de ácido graso promediando 119% sobre los niveles de aceite de control . La figura 2 muestra la composición de ácido graso de embriones de maíz transformados con copias adicionales de Hap3/Lecl (barras oscuras, "+ transgen" ) en comparación con embriones de control (barras cuadriculadas, "-transgen"). Se usó un promotor de oleosina para dirigir la expresión de una copia transgénica de Hap3/Lecl. Más de veinte eventos que producían semilla TI segregadora fueron analizados mediante RMN para el contenido de aceite embrionario. Seis a doce embriones fueron analizados para cada uno de cinco eventos diferentes . Algunos embriones en cada evento contenían un elevado contenido de aceite. Los mismos embriones de estos cinco eventos fueron analizados mediante PCR para determinar la presencia o ausencia de la construcción Lecl . Los embriones con alto contenido de aceite siempre se encontró que contenían la construcción Lecl (barras color oscuro) , mientras que los embriones con niveles normales de aceite se encontraba que típicamente no contenían la construcción Lecl (barras cuadriculadas) . Estos datos demuestran que la 14
presencia del gen Lecl no lleva a un contenido de aceite incrementado en el embrión. Se cree que los embriones que contienen niveles pronunciadamente más altos de aceite eran homocigóticos para la construcción Lecl, toda vez que estos eventos eran segregadores 1:2:1: La concentración de aceite en los embriones que contienen la construcción Lecl sobrepasó ampliamente cualquier incremento previamente logrado a través de la modificación enzimática de la via biosintética de ácido graso, con algunos embriones conteniendo un incremento promedio de 56% en el contenido de aceite del embrión. La tabla 1 lista los polipéptidos que se describen en la presente, la designación de los clones de ADNc que comprenden los fragmentos de ácido nucleico que codifican para polipéptidos que representan toda o una porción sustancial de estos polipéptidos (para el identificador SEQ ID NO: correspondiente como el usado en el listado de secuencias anexo, véase tabla 3) . Las descripciones de secuencia y el listado de secuencia anexo a la presente cumplen con las reglas que rigen las descripciones de secuencisa de nucleótidos y/o aminoácidos en solicitudes de patente como las establecidas en 37 C.F.R. § 1.821-1.825.
15
Tabla 1 Genes implicados en alteración de características de aceite en plantas Nombre del Gen Clon Planta factor de transcripción Hap2a ncs.pk0013.c4 Catalpa [Catalpa speciosa] factor de transcripción tipo etr1c.pk006.f9 Espadaña [Typha latifolia] Hap2c factor de transcripción Hap2a vmb1 na.pkOI 5.d 18:fis uva [Vitis sp.] factor de transcripción Hap2a vpI1c.pk008.o5:fis uva [Vitis sp.] factor de transcripción tipo vdb1 c.pk001.m5:fis uva [Vitis sp.j Hap2c factor de transcripción Hap2 cho1 c.pk004.b19:fis maíz [Zea mays] factor de transcripción Hap2 p0015.cdpgu90r:fis maíz [Zea mays] factor de transcripción Hap2a cta1 n.pk0070.f3:fis maíz [Zea mays] factor de transcripción tipo cco1 n.pk0014.d4:fis maíz [Zea mays] Hap2a factor de transcripción tipo cco1 n.pk086.d20:fis maíz [Zea mays] Hap2a factor de transcripción Hap2b p0126.cnlau71 r:fis maíz [Zea mays] factor de transcripción tipo p0104.cabav52r maíz [Zea mays] Hap2-b Factor de transcripción Hap2c cho1 c.pk007.I21 :fis maíz [Zea mays] factor de transcripción tipo cho1c.pk007.I21 :fis contig de: maíz [Zea mays] Hap2c cca.pk0026.d6 cen3n.pk0061.e10:fis cen3n.pk0135.c2 Cho1c.pk001.n24 p0092.chwae40r factor de transcripción tipo cpf1c.pk006.e3:fis maíz [Zea mays] Hap2c factor de transcripción tipo contig de: maíz [Zea mays] Hap2c cr1 n.pk0080.g6 p0003.cgpge51 r Factor de transcripción tipo p0015.cpdfm55r:fis maíz [Zea mays] Hap2c factor de transcripción tipo p0083.cldct11 r:fis maíz [Zea mays] Hap2c factor de transcripción tipo p0083.cldeu68r:fis maíz [Zea mays] Hap2c factor de transcripción Hap2a pps1 c.pk001.h3:fis chicalote [Argenome mexicana] factor de transcripción tipo pps1 c.pk007.j21 :fis chicalote [Argemone Hap2c mexicana] factor de transcripción Hap2 rr1.pk0030.f7:fis arroz [Oryza sativa] factor de transcripción Hap2a rls72.pk0023.c8:fis arroz [Oryza sativa] factor de transcripción tipo rca1 n.pk002.c15 arroz [Oryza sativa] Hap2a factor de transcripción tipo rds3c.pk001.g9 arroz [Oryza sativa] Hap2a factor de transcripción Hap2b rca1 n.pk002.j'3:fis arroz [Oryza sativa] 16
Tabla 1 (continuación)
Nombre del Gen Clon Planta factor de transcripción tipo rca1 n.pk029.n22:fis arroz [Oryza sativa] Hap2c factor de transcripción tipo rlOn.pk131.j17 arroz [Oryza sativa] Hap2c Factor de transcripción Hap2a sdp3c.pk018.b9:fis soya [Glycine max] Factor de transcripción Hap2a Sfl1.pk0102.h8 soya [Glycine max] Factor de transcripción Hap2a srr3c.pk001.H 0:fis soya [Glycine max] Factor de transcripción Hap2a sdp2c.pk003.o5:fis soya [Glycine max] Factor de transcripción Hap2b Sif1c.pk001.m16:fis soya [Glycine max] Factor de transcripción tipo src1 c.pk003.o16:fis soya [Glycine max] Hap2c Factor de transcripción tipo src3c.pk012.m6:fis soya [Glycine max] Hap2c Factor de transcripción tipo hsslpk011.h10:fis girasol [Helianthus sp.] Hap2c Hap2 transcription factor wr1.pk0094.f2:fis trigo común [Triticum aestivum] Factor de transcripción tipo wre1n.pk0 43.h2.fis trigo común [Triticum Hap2a aestivum] Factor de transcripción Hap2b wds1f.pk002.p21 :fis trigo común [Triticum aestivum] Factor de transcripción Hap2c contig de: [Triticum aestivum] wdi1c.pk002.b10 wr1.pk0153.c7:fis Factor de transcripción tipo wre1n.pk0066.e4:fis trigo común [Triticum Hap2c aestivum] Factor de transcripción tipo ncs.pk0013.c4:fis catalpa [Catalpa speciosa] Hap2c Factor de transcripción tipo p0117.chcln94r:fis maíz [Zea mays] Hap2c Factor de transcripción tipo rdi2c.pk011.f19:fis arroz [Oryza sativa] Hap2c Factor de transcripción tipo sfh .pkO101.g7:fis soya [Glycine max] Hap2c Factor de transcripción tipo wdi1c.pk002.b10:fis trigo común [Triticum Hap2c aestivum] Factor de transcripción tipo ectlc.pk001.k17:fis canácea [Canna edulis] Hap5c Factor de transcripción tipo vrr1c.pk004.o20:fis uva [Vitis sp.] Hap5a Factor de transcripción tipo Clm1f.pk001.k17:fis maíz [Zea mays] Hap5a Factor de transcripción tipo cde1n.pk003.a5:fis maíz [Zea mays] Hap5b Factor de transcripción tipo cen3n.pk0164.a10:fis maíz [Zea mays] Hap5b Factor de transcripción tipo p0118.chsbc77r maíz [Zea mays] Hap5b Factor de transcripción tipo cco1 n.pk055.o18:fis maíz [Zea mays] Hap5c 17
Tabla 1 (continuación)
Nombre del Gen Clon Planta Factor de transcripción tipo cho1c.pk001.l23:fis maíz [Zea mays] Hap5c Factor de transcripción tipo cse1 c.pk001.h6:fis maíz [Zea mays] Hap5c Factor de transcripción tipo rlm3n.pk005.d20:f¡s arroz [Oryza sativa]
Hap5a Factor de transcripción tipo rrlpk0003.a3:fis arroz [Oryza sativa]
Hap5b Factor de transcripción tipo rr1.pk0039.d4:fis arroz [Oryza sativa]
Hap5b Factor de transcripción tipo rca1n.pk021.b20:fis arroz [Oryza sativa]
Hap5c Factor de transcripción tipo sdp2c.pk029.k17:fis soya [Glycine max]
Hap5a Factor de transcripción tipo sdp2c.pk044.e5:fis soya [Glycine max]
Hap5a Factor de transcripción tipo sgs4c.pk004.j2 soya [Glycine max]
Hap5b Factor de transcripción tipo src3c.pk002.h4:fis soya [Glycine max]
Hap5b Hap5b-liketranscription src3c.pk009.b15:fis soya [Glycine max] factor Factor de transcripción tipo src3c.pk019.d4:fis soya [Glycine max]
Hap5b Factor de transcripción tipo sls1 c.pk032.j4:fis soya [Glycine max]
Hap5c Hap5 transcription factor wdk2c.pk009.e4:fis Trigo común [Triticum aestivum] Factor de transcripción tipo contig de: trigo común [Triticum
Hap5a wlm96.pk036.j11 aestivum] Wlm96.pk060.d5:fis Factor de transcripción tipo wle1 n.pk0076.h7:fis trigo común [Triticum
Hap5c aestivum] Factor de transcripción tipo sgs4c.pk004.j2:fis soya [Glycine max]
Hap5c Lec1 tipo embrionario eas1c.pk003.e16 amaranto [Amarantous retroflexus] Lec1 tipo embrionario fds 1n.pk008.m14 pera balsámica [Momordica charantia] Lec1 tipo embrionario p0015.cdpgp75rb:fis maize [Zea mays]
Lec1 tipo embrionario p0083.cider12r:fis maize [Zea mays]
Lec1 tipo embrionario pps1c.pk002J19 chicalote [Argemone mexicana] Lec1 tipo embrionario Contig de: soya [Glycine max] scb1c.pk004.j10 se1.pk0042.d8:fis Lec1 tipo embrionario se2.11 d12:fis soya [Glycine max]
Lec1 tipo embrionario ses2w.pk0015.a4:fis soya [Glycine max]
Lec1 tipo embrionario vs1 n.pk013.m13:fis vernonia [Vernonia mespilifolia] 18
Tabla 1 (continuación)
Nombre del Gen Clon Planta Lec1 tipo embrionario wdk3c.pk023.h15:fis Trigo común ¡Triticum aestivum] Proteína de unión a CCAAT ect1 c.pk007.p18:fis Canácea [Canna edulis] relacionada con Lec1 Proteína de unión a CCAAT fds.pk0003.h5:fis Pera balsámica [Momordica relacionada con Leda charantia] Proteína de unión a CCAAT eef1c.pk004.c8:fis eucalipto [Eucalyptus relacionada con Lec1 grandis] Proteína de unión a CCAAT cbn10.pk0005.e6:fis maíz [Zea mays] relacionada con Lec1 Proteína de unión a CCAAT p0006.cbysa51 r:fis maíz [Zea mays] relacionada con Lec1 Proteína de unión a CCAAT rl0n.pk0061.c8:fis arroz [Oryza sativa] relacionada con Lec1 Proteína de unión a CCAAT rsl1n.pk002.g10:fis arroz [Oryza sativa] relacionada con Lec1 Proteína de unión a CCAAT ses4d.pk0037.e3:fis soya [Glycine max] relacionada con Lec1 Proteína de unión a CCAAT src2c.pk003.i13:fis soya [Glycine max] relacionada con Lec1 Proteína de unión a CCAAT src2c.pk011.m12:fis soya [Glycine max] relacionada con Lec1 Proteína de unión a CCAAT src2c.pk025.b3:fis soya [Glycine max] relacionada con Lec1 Proteína de unión a CCAAT src3c.pk028.j21 :fis soya [Glycine max] relacionada con Lec1 Proteína de unión a CCAAT wkm1c.pk0002.d7:fis trigo común [Triticum relacionada con Lec1 aestivum] Proteína de unión a CCAAT Wlk8.pk0001.e10:f¡s trigo común [Triticum relacionada con Lec1 aestivum] Proteína de unión a CCAAT wlm96.pk037.k9:fis trigo común [Triticum relacionada con Lec1 aestivum]
El Listado de Secuencias contiene el código de una letra para caracteres de secuencias de nucleótidos y los códigos de tres letras para aminoácidos como los definidos de conformidad con las normas de IUPAC-IUBMB descritas en Nucleic Acids Res. 13:3021-3030 (1985) y en Biochemical J. 219 (No. 2) :345-373 (1984) los cuales se incorporan en la presente a manera de referencia. Los símbolos y formato 19
usados para los datos de secuencias de nucleótidos y aminoácidos cumplen con las reglas establecidas en 37 C.F.R. § 1.822. Descripción detallada de la invención Todas las patentes, solicitudes de patente y publicaciones que son mencionadas en la presente están incorporadas a manera de referencia en su totalidad. Según se usa en la presente, un "fragmento de ácido nucleico aislado" es un polímero de ARN o ADN que tiene una sola o dos hebras, que contiene opcionalmente bases de nucleótidos sintéticas, no naturales o alteradas. Un fragmento de ácido nucleico aislado en forma de un polímero de ADN puede comprender uno o más segmentos de ADNc, ADN genómico o ADN sintético. Los nucleótidos (normalmente encontrados en su forma de 5 ' -monofosfato) son referidos por su designación de una sola letra como sigue: "A" para adenilato o desoxiadenilato (para ARN o ADN, respectivamente) , "C" para citidilato o desoxicitidilato, "G" para guanilato o desoxiguanilato, "U" para uridilato, WT" para desoxitimidilato, "R" para purinas (A o G) , "Y" para pirimidinas (C o T) , "K" para G o T, "H" para A o C o T, "I" para inosina y "N" para cualquier nucleotido. Los términos "subfragmento que se es funcionalmente equivalente" y "subfragmento funcionalmente equivalente" se usan en forma intercambiable en la presente. Estos términos 20
se refieren a una porción o subsecuencia de un fragmento de ácido nucleico aislado en la cual la capacidad para alterar la expresión del gen o producir un cierto fenotipo es conservada ya sea que el fragmento o subfragmento codifique o no para una enzima activa. Por ejemplo, el fragmento o subfragmento puede usarse en el diseño de construcciones quiméricas para producir el fenotipo deseado en una planta transformada. Las construcciones quiméricas pueden ser diseñadas para usarse en co-supresión o antisentido al enlazar un fragmento de ácido nucleico o subfragmento del mismo, ya sea que éste codifique o no para una enzima activa, en la orientación adecuada en relación con la secuencia promotora vegetal . Los términos "homología" , "homólogo" , "sustancialmente similar" y "que corresponde sustancialmente" se usan de manera intercambiable en la presente . Se refieren a fragmentos de ácido nucleico en los que los cambios en una o más bases de nucleótidos no afectan la capacidad del fragmento de ácido nucleico para mediar la expresión génica o producir un fenotipo dado . Estos términos se refieren también a modificaciones de los fragmentos de ácido nucleico de la presente invención tales como supresión o inserción de uno o más nucleótidos que no alteren sustancialmente las propiedades funcionales del fragmento de ácido nucleico resultante en relación con el fragmento no modificado e 21
inicial. Se entiende por lo tanto, como los expertos en la técnica lo apreciarán, que la invención abarca más que las secuencias ejemplares especificas. Además, el experto en la técnica reconoce que las secuencias de ácido nucleico sustancialmente similares abarcadas por esta invención son también definidas por su capacidad para hibridar, bajo condiciones moderadamente severas (por ejemplo, 1 X SSC, 0.1% SDS, 60°) con las secuencias ejemplificadas en la presente, o a cualquier porción de las secuencias de nucleótidos reportadas en la presente y las cuales son funcionalmente equivalentes al gen o al promotor de la invención. Las condiciones de severidad se pueden ajustar para tamizar de fragmentos moderadamente similares, tales como secuencias homologas a partir de organismos distintamente relacionados, a fragmentos altamente similares, tales como genes que duplican enzimas funcionales de organismos estrechamente emparentados. Los lavados posthibridación determinan las condiciones de severidad. Un conjunto de condiciones que se prefieren incluye una serie de lavados iniciando con SX SSC, 0.5% SDS a temperatura ambiente durante 15 min. , luego repetido con X SSC, 0.5% SDS a 45°C durante 30 min. y después repetido dos veces con 0.2X SSC, 0.5% SDS a 50°C durante 30 min. Un conjunto de condiciones severas que más se prefiere incluye el uso de temperaturas más altas en las cuales los lavados son idénticos a aquellos 22
anteriores excepto que la temperatura de los dos lavados de 30 min. finales en SSC, 0.5% SDS fue incrementada a 60 °C. Otro conjunto preferido de condiciones altamente severas incluye el' uso de dos lavados finales en 0. IX SSC, 0.1% SDS a 65°C. Con respecto al grado de similitud sustancial entre el ARNm objetivo (endógeno) y la región de ARN en la construcción que tiene homología al ARNm objetivo, estas secuencias deben tener por lo menos 25 nucleótidos de longitud, de preferencia por lo menos 50 nucleótidos de longitud, muy preferiblemente por lo menos 100 nucleótidos de longitud, de nuevo muy preferiblemente al menos 200 nucleótidos de longitud y más preferiblemente por lo menos 300 nucleótidos de longitud; y deben ser por lo menos 80% idénticas, de preferencia por lo menos 85% idénticas, muy preferiblemente por lo menos 90% idénticas y más preferiblemente por lo menos 95% idénticas. Las alineaciones de secuencia y los cálculos de similitud porcentual pueden determinarse usando una variedad de métodos de comparación diseñados para detectar secuencias homologas incluyendo, ' pero no limitados a, el programa Megalign de la oficina de computación de bioinformática LASARGENE (DNASTAR Inc., Madison, WI) . La alineación múltiple de las secuencias se lleva a cabo usando el método de alineación Clustal (Higgins y Sharp (1989) CABIOS. 5:151- 23
153) con los parámetros por omisión (GAP PENALTY=10, GAP LENGTH PENALTY=10) . Los parámetros por omisión para las alineaciones por pares y el cálculo de la identidad porcentual de las secuencias de proteínas usando el método Clustal son KTUPLE=1, GAP PENALTY=3 , WI D0W=5 y DIAGONALS SAVED=5. Para ácidos nucleicos estos parámetros son TUPLE=2, GAP PENALTY=5 , WIND0W=4 y DIAGONALS SAVED=4. Una "porción sustancial" de una secuencia de nucleótido o aminoácidos comprende una secuencia de aminoácidos o nucleótidos que es suficiente para producir la identificación putativa de la proteína o gen que la secuencia de aminoácidos o nucleótidos comprende. Las secuencias de aminoácidos y nucleótidos pueden ser evaluadas ya sea manualmente por un experto en la técnica, o mediante el uso de herramientas de comparación e identificación de secuencias a base de computadora que empleen algoritmos tales como BLAST (Basic Local Alignment Search Tool; Altschul et al (1993) J". Mol. Biol. 215:403-410; véase también www.ncbi.nlm.nih.gov/BLAST/) . En general, una secuencia de diez o más aminoácidos contiguos o treina o más nucleótidos contiguos es necesaria para poder identificar putativamente una secuencia de polipéptidos o ácido nucleico como homologa a una proteína o gen conocido. Además, con respecto a secuencias de nucleótidos, se pueden usar sondas de oligonucleótidos específicas de genes que comprendan 30 o más 24
nucleotidos contiguos en métodos de identificación de genes dependientes de secuencia (por ejemplo, hibridación Southern) y aislamiento (por ejemplo, hibridación in situ de colonias bacterianas o placas de bacteriófagos) . Además, oligonucleótidos cortos de 12 o más nucleotidos pueden usarse como cebadores de amplificación en PCR para obtener así un fragmento de ácido nucleico particular que comprenda los cebadores. En consecuencia, una "porción sustancial" de una secuencia de nucleotidos comprende una secuencia de nucleotidos que producirá la identificación y/o aislamiento específicos de un fragmento de ácido nucleico que comprenda la secuencia. La presente descripción enseña secuencias de aminoácidos y nucleotidos que codifican para polipeptidos que comprenden una o más proteínas vegetales. El experto en la técnica, que tiene el beneficio de las secuencias como las reportadas en la presente, puede usar ahora toda o una porción sustancial de las secuencias descritas para propósitos conocidos por los expertos en la técnica. En consecuencia, la presente invención comprende las secuencias completas reportadas en el listado de secuencias adjunto, así como porciones sustanciales de esas secuencias como las definidas arriba. "Degeneración de codones" se refiere a divergencia en el código genético que permite la variación de la secuencia de nucleotidos sin afectar la secuencia de 25
aminoácidos de un polipéptido codificado. En consecuencia, la presente invención se refiere a cualquier fragmento de ácido nucleico que comprenda una secuencia de nucleótidos que codifique para toda o una porción sustancial de las secuencias de aminoácidos descritas en la presente. El experto en la técnica conoce bien la "derivación de codones" exhibida por una célula huésped especifica en el uso de codones de nucleótidos para especificar un aminoácido dado. Por lo tanto, cuando se sintetiza un fragmento de ácido nucleico para expresión mejorada en una célula huésped, es deseable diseñar el fragmento de ácido nucleico de tal forma que se frecuencia de uso de codones se acerque a la frecuencia de uso de codones preferido de la célula huésped. "Fragmentos de ácido nucleico sintéticos" pueden ser ensamblados a partir de bloques de construcción de oligonucleótidos que sean químicamente sintetizados usando procedimientos conocidos por los expertos en la técnica. Estos bloques de construcción son ligados y fijados para formar fragmentos de ácido nucleico más grandes que después puedan ser ensamblados enzimáticamente para construir el fragmento de ácido nucleico deseado. "Químicamente sintetizado", en referencia a un fragmento de ácido nucleico, significa que los nucleótidos componentes fueron ensamblados in vitro. La síntesis química manual de fragmentos de ácido nucleico puede lograrse usando procedimientos bien 26
establecidos, o puede llevarse a cabo síntesis química automatizada usando uno de un número de máquinas disponibles comercialmente . En consecuencia, los fragmentos de ácido nucleico pueden ser diseñados para expresión génica óptima con base en la optimización de la secuencia de nucleótidos para reflejar la derivación de codones de la célula huésped. El experto en la técnica aprecia la probabilidad de una expresión génica exitosa si el uso de codones es derivado hacia aquellos codones favorecidos por el huésped. La determinación de los codones preferidos puede basarse en una encuesta de genes derivados de la célula huésped cuando esté disponible información de secuencias. "Gen" se refiere a un fragmento de ácido nucleico que expresa una proteína específica, incluyendo secuencias reguladoras que anteceden (secuencias no codificadoras 5') y siguen (secuencias no codificadoras 3') la secuencia de codificación. "Gen nativo" se refiere a un gen como se encuentra en la naturaleza con sus propias secuencias reguladoras. El término "construcción de ADN recombinante" y "constructo de ADN recombinante" se usan en forma intercambiable en la presente. Una "construcción de ADN recombinante" comprende una combinación artificial de fragmentos de ácido nucleico, por ejemplo, secuencias reguladoras y codificadoras que no se encuentran juntas en la naturaleza. Por ejemplo, una construcción de ADN 27
recorreinante puede comprender secuencias reguladoras y secuencias de codificación que se deriven de diferentes fuentes, o secuencias reguladoras y secuencias de codificación derivadas de la misma fuente, pero dispuestas de una manera diferente a la que se encuentra normalmente en la naturaleza. Un gen "extraño" se refiere a un gen que no se encuentra normalmente en el organismo huésped, sino que es introducido en el organismo huésped mediante transferencia génica. Los genes extraños pueden comprender genes nativos insertados en un organismo no nativo, o construcciones de ADN recombinantes . Un "transgen" es un gen que ha sido introducido en el genoma mediante un procedimiento de transformación. Una "secuencia de. codificación" se refiere a una secuencia de ADN que codifica para una secuencia de aminoácidos especifica. Las "secuencias reguladoras" se refieren a secuencias de nucleótidos localizadas hacia el extremo cinco prima (secuencias no codificadoras 5')/ dentro, o hacia el extremo tres prima (secuencias no codificadoras 3') de una secuencia de codificación, y las cuales tienen influencia en la transcripción, procesamiento o estabilidad de AR , o en la traducción de la secuencia de codificación asociada. Las secuencias reguladoras pueden incluir, pero no están limitadas a, promotores, secuencias líderes de traducción, intrones y secuencias de reconocimiento de 28
poliadenilación. Un "promotor" se refiere a una secuencia de ADN capaz de controlar la expresión de una secuencia de codificación o AR funcional . La secuencia promotora consiste en elementos hacia el extremo cinco prima próximos y más distantes, éstos últimos elementos comúnmente referidos como potenciadores . En consecuencia, un "potenciador" es una secuencia de ADN que puede estimular la actividad -· del promotor y puede ser un elemento innato del promotor o un elemento heterólogo insertado para potenciar el nivel o especificidad en tejido de un promotor. Los promotores se pueden derivar en su totalidad a partir de un gen nativo, o pueden estar compuestos de diferentes elementos derivados de diferentes promotores encontrados en la naturaleza, o incluso comprender segmentos de ADN sintéticos. Se entiende por los expertos en la técnica que diferentes promotores pueden dirigir la expresión de un gen en diferentes tejidos o tipos de células, o en etapas diferentes de desarrollo, o en respuesta a diferentes condiciones ambientales. Los promotores que causan que un gen sea expresado en la mayoría de los tipos de células la mayoría de las veces son comúnmente referidos como "promotores constitutivos" . Nuevos promotores de varios tipos útiles en células vegetales se están descubriendo constantemente; numerosos ejemplos pueden encontrarse en la compilación por Okamuro y Goldberg, (1989) 29
Biochemístry of Plants 15:1-82. Se reconoce además que ya que en la mayoría de los casos los límites exactos de las secuencias reguladoras no han sido completamente definidos, los fragmentos de ADN de cierta variación pueden tener actividad promotora idéntica. Un "intrón" es una secuencia de intervención en un gen que no codifica para una porción de la secuencia de proteínas. Así, estas secuencias son transcritas en ARN pero después son extirpadas y no son traducidas. El término se usa también para las secuencias de AR extirpadas. Un "exón" es una porción de la secuencia de un gen que es transcrita y no se encuentra en el ARN mensajero maduro derivado del gen, pero no necesariamente es una parte de la secuencia que codifica para el producto génico final . La "secuencia líder de traducción" se refiere a una secuencia de ADN localizada entre la secuencia promotora de un gen y la secuencia de codificación. La secuencia líder de traducción está presente en el ARNm completamente procesado hacia el extremo cinco prima de la secuencia de inicio de traducción. La secuencia líder de traducción puede afectar el procesamiento del transcripto primario a ARNm, la estabilidad del ARNm o la eficiencia de traducción. Ejemplos de secuencias líderes de traducción han sido descritos (Turner, R. y Foster, G. D. (1995) Molecular Biotechnology 3 :225) .
30
Las "secuencias no codificadoras 3'" se refieren a secuencias de ADN localizadas hacia el extremo tres prima de una secuencia de codificación e incluyen secuencias de reconocimiento de poliadenilación y otras secuencias que codifican para señales reguladoras capaces de afectar el procesamiento de ARNm o la expresión génica. La señal de poliadenilación se caracteriza normalmente por afectar la adición de tractos de ácido poliadenílico hacia el extremo 3' del precursor de ARNm. El uso de diferentes secuencias no codificadoras 3' se ejemplifica por Ingelbrecht et al., (1989) Plant Cell 1:671-680. Un "transcripto de ARN" se refiere al producto que resulta de la transcripción catalizada por ARN polimerasa de una secuencia de ADN. Cuando el transcripto de ARN es una perfecta copia complementaria de la secuencia de ADN, éste es referido como el transcripto primario o puede ser una secuencia de ARN derivada de un procesamiento post-transcripcional del transcripto primario y es referida como el ARN maduro. "ARN mensajero (ARNm) " se refiere al ARN que está sin intrones y que puede ser traducido en proteínas por las células . "ADNc" se refiere a un ADN que es complementario a, y sintetizado de una plantilla de ARNm usando la enzima transcriptasa inversa. El ADNc puede ser de una sola hebra o convertirse en la forma de doble hebra usando el fragmento Klenow de ADN polimerasa I . ARN de 31
"sentido" se refiere a un transcripto de ARN que incluye el ARNm y puede ser traducido en proteínas dentro de una célula o in vitro. "ARN antisentido" se refiere a un transcripto de ARN que es complementario a todo o parte de un transcripto primario objetivo o ARNm y que bloquea la expresión de un fragmento de ácido nucleico aislado objetivo (patente de E.U.A. No. 5,107,065). La complementariedad de un ARN antisentido puede estar con cualquier parte del transcripto del gen específico, es decir, en la secuencia no codificadora 5', secuencia no codificadora 3', intrones o la secuencia de codificación. "ARN funcional" se refiere a ARN antisentido, ARN de ribozima u otro ARN que pudiera no ser traducido pero que aún tuviera un efecto en procesos celulares . Los ' términos "complemento" y "complemento inverso" se usan de manera intercambiable en la presente con respecto a transcriptos de ARNm, e intentan definir el ARN antisentido del mensaj e . El término "ARN endógeno" se refiere a cualquier ARN que es codificado por cualquier secuencia de ácido nucleico presente en el genoma del huésped antes de su transformación con la construcción recombinante de la presente invención, ya sea que ocurra naturalmente o que no ocurra naturalmente, es decir, introducida por medios recombinantes , mutagénesis, etc. El término "que no ocurre naturalmente" significa 32
artificial, no consistente con lo que se encuentra normalmente en la naturaleza. El término "ligado operablemente" se refiere a la asociación de secuencias de ácido nucleico en un solo fragmento de ácido nucleico de tal manera que la función de uno sea regulada por el otro. Por ejemplo, un promotor está ligado operablemente con una secuencia de codificación cuando es capaz de regular la expresión de esa secuencia de codificación (es decir, que la secuencia de codificación esté bajo el control transcripcional del promotor) . Las secuencias de codificación se pueden ligar operablemente a secuencias reguladoras de una orientación de sentido o antisentido. En otro ejemplo, las regiones de AR complementarias de la invención se pueden ligar operablemente, ya sea directa o indirectamente, 5' hacia el ARN objetivo, o 3' hacia el ARNm objetivo, o dentro del ARNm objetivo, o una primera región complementaria está 5' y su complemento está 3' hacia el ARNm objetivo. El término "expresión" , según se usa en la presente, se refiere a la producción de un producto final funcional. La expresión de un gen incluye la transcripción del gen y la traducción del ARNm en un precursor o proteína madura. "Inhibición antisentido" se refiere a la producción de transcriptos de ARN antisentido capaces de suprimir la expresión de la proteína objetivo. "Co-supresión" se refiere 33
a la producción de transcriptos de ARN de sentido capaces de suprimir la expresión de genes extraños o endógenos idénticos o sustancialmente similares (patente de E.U.A. No. 5,231, 020) . Proteína "madura" se refiere a un polipéptido procesado después de la traducción, es decir, uno del cual cualquier pre- o propéptido presente en el producto de traducción primario ha sido removido. Proteína "precursora" se refiere al producto primario de la traducción de ARNm, es decir, con pre- y propéptidos aún presentes. Los pre- y propéptidos pueden ser, pero no están limitados a, señales de localización intracelulares . La "transformación estable" se refiere a la transferencia de un fragmento de ácido nucleico a un genoma de un organismo huésped, incluyendo genomas tanto nucleares como organelares, dando como resultado una herencia genéticamente estable. En contraste, la "transformación transitoria" se refiere a la transferencia de un fragmento de ácido nucleico al interior del núcleo, u organelo que contiene ADN, de un organismo huésped que resulte en la expresión génica sin integración o herencia estable. Los organismos huésped que contienen los fragmentos de ácido nucleico transformados son referidos como organismos "transgénicos" . El método preferido de transformación de células de arroz, maíz y otras monocotiledóneas es el uso de 34
tecnología de transformación de partículas aceleradas o "pistola génica" (Klein et al., (1987) Nature (Londres) 327:70-73; patente de E.U.A. No. 4,945,050), o un método mediado por Agrobacterium usando un plásmido Ti adecuado que contenga el transgen (Ishida Y. et al., 1996, Nature Biotech. 14:745-750). El término "transformación" según se usa en la presente, se refiere tanto a una transformación estable como a una transformación transitoria. Las técnicas de ADN recombinante y clonación molecular estándares usadas en la presente se conocen bien en la técnica y se describen más detalladamente en Sambrook, J. , Fritsh, E. F. y Maniatis, T. Molecular Clonlng: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989 (en adelante "Sambrook") . El término "recombinante" significa, por ejemplo, que una secuencia de ácido nucleico se hace mediante una combinación artificial de dos segmentos de secuencia separados de otra manera, por ejemplo, mediante síntesis química o mediante la manipulación de ácidos nucleicos aislados mediante técnicas de manipulación genética. Una "construcción de ADN recombinante" comprende un polinucleótido aislado ligado operablemente a por lo menos una secuencia reguladora. El término abarca un polinucleótido aislado que comprende una región que codifica para todo o parte de un ARN funcional y al menos una de las 35
secuencias reguladoras que ocurre naturalmente que dirija la expresión en la fuente (por ejemplo, organismo) de la cual el polinucleótido fue aislado, tal como, pero no limitada a, un polinucleótido aislado que comprenda una secuencia de nucleótidos que codifique para un gen objetivo resistente a herbicidas y las secuencias promotoras y de extremo 3' correspondientes que dirijan la expresión en la fuente de la cual las secuencias fueron aisladas. Un "transgen" es una construcción. de ADN recombinante que ha sido introducida en el genoma mediante un procedimiento de transformación. Según se usa en la presente "contig" se refiere a una secuencia de nucleótidos que es ensamblada a partir de dos o más secuencias de nucleótidos constituyentes que comparten regiones comunes o superpuestas de homología de secuencia. Por ejemplo, las secuencias de nucleótidos de dos o más fragmentos de ácido nucleico pueden ser comparadas y alineadas para identificar secuencias comunes o superpuestas. Cuando existen secuencias comunes o superpuestas entre dos o más fragmentos de ácido nucleico, las secuencias (y de esta manera sus fragmentos de ácido nucleico correspondientes) pueden ser ensambladas en una sola secuencia de nucleótidos contigua . "PCR" o "Reacción en Cadena de Polimerasa" es una técnica para la síntesis de grandes cantidades de segmentos 36
de ADN específicos, consiste en una serie de ciclos repetitivos (Perkin Elmer Cetus Instruments, Norwalk, CT) . Típicamente, el ADN de doble hebra es desnaturalizado con calor, los dos cebadores complementarios a los límites 3' del segmento objetivo se fijan a baja temperatura y luego se extienden a una temperatura intermedia. Un conjunto de estas tres etapas consecutivas se refiere como un ciclo. Los términos "construcción recombinante" ,
"construcción de expresión" , "construcción de expresión recombinante", "construcción de ADN recombinante" y "constructo de ADN recombinante" se usan de manera intercambiable en la presente. Esta construcción puede ser ella misma o puede usarse en conjunto con un vector. Si se usa un vector, entonces la elección del vector depende del método que se usará para transformar plantas huésped como se conoce bien por los expertos en la técnica. Por ejemplo, se puede usar un vector plasmídico. El experto en la técnica está consiente de los elementos genéticos que deben estar presentes en el vector para de esta manera transformar, seleccionar y propagar de manera exitosa células huésped que comprendan cualquiera de los fragmentos de ácido nucleico aislados de la invención. La persona capacitada reconocerá también que diferentes eventos " de transformación independientes darán como resultado diferentes niveles y patrones de expresión (Jones et al., (1985) EMBO J. 4:2411- 37
2418; De Almeida et al., (1989) Mol. Gen. Genetics 218:18-86) , y de esta manera que múltiples eventos deben ser tamizados para poder obtener lineas que desplieguen el nivel y patrón de expresión deseado. Este tamizado puede lograrse mediante el análisis Southern de ADN, análisis Northern de expresión de ARNm, análisis Western de expresión de proteínas, o análisis fenotipico. Las construcciones de co-supresión en plantas han sido diseñadas previamente al enfocarse en la sobreexpresión de una secuencia de ácido nucleico que tenga homología a un ARNm endógeno, en la orientación de sentido, lo cual dé como resultado la reducción de todo el ARN que tenga homología a la secuencia sobreexpresada (véase Vaucheret et al., (1998) Plant J 16:651-659 ; y Gura (2000) Nature 404:804-808) . La eficiencia general de este fenómeno es baja, y el grado de la reducción de ARN es ampliamente variable. Trabajo reciente ha descrito el uso de estructuras de "pasador" que incorporan toda, o parte, de una secuencia de codificación de ARNm en una orientación complementaria que da como resultado una estructura de "vástago-asa" potencial para el ARN expresado (publicación de PCT WO 99/53050 publicada el 21 de octubre de 1999) . Esto incrementa la frecuencia de co-supresión en las plantas transgénicas recuperadas. Otra variación describe el uso de secuencias virales vegetales para dirigir la supresión, o "silenciamiento" de secuencias de codificación 38
de AR m proximales (publicación de PCT WO 98/36083, publicada el 20 de agosto de 1998) . Ambos de estos fenómenos de co-supresión no han sido elucidados en forma mecánica, aunque evidencia genética reciente ha comenzado a desvelar esta compleja situación (Elmayan et al. (1998) Plant Cell 20:1747-1757) . Como alternativa, una construcción de ADN recombinante diseñada para expresar AR antisentido para todo o parte de un fragmento de ácido nucleico de la presente se puede construir al ligar el gen o fragmento génico en orientación invertida a secuencias promotoras vegetales. Construcciones de ADN recombinantes ya sea de co-supresión o antisentido se pueden introducir en plantas mediante transformación en donde la expresión de los genes endógenos correspondiente sea reducida o eliminada. Las soluciones genéticas moleculares a la generación de plantas con expresión génica alterada tienen una ventaja decidida sobre enfoques de cultivo de plantas más tradicionales. Los cambios en los fenotipos de las plantas pueden producirse al inhibir específicamente la expresión de uno o más genes mediante inhibición o co-supresión antisentido (patentes de E.U.A. Nos. 5,190,931, 5,107,065 y 5,283,323). Una construcción antisentido o de co-supresión actuará como un regulador negativo dominante de la actividad del gen. Aunque mutaciones convencionales pueden producir 39
regulación negativa de la actividad génica, estos efectos son muy probablemente recesivos . La regulación negativa dominante disponible con un enfoque transgénico puede ser ventajosa desde una perspectiva de reproducción, además, la capacidad para restringir la expresión de un fenotipo específico a los tejidos reproductivos de la planta mediante el uso de promotores específicos de tejido puede conferir ventajas agronómicas en relación con mutaciones convencionales que puedan tener un efecto en todos los tejidos en los cuales un gen mutante sea expresado ordinariamente . La persona capacitada en la técnica conocerá que consideraciones especiales están asociadas con el uso de tecnologías antisentido o de co-supresión para reducir de esta manera la expresión de genes particulares. Por ejemplo, el nivel adecuado de expresión de genes de sentido o antisentido puede requerir del uso de diferentes construcciones de ADN recombinantes que utilicen diferentes elementos reguladores conocidos por el experto en la técnica. Una vez que plantas transgénicas son obtenidas mediante uno de los métodos descritos arriba, será necesario tamizar transgénicos individuales para aquellos que desplieguen de manera más efectiva el fenotipo deseado. En consecuencia, el experto en la técnica desarrollará métodos para tamizar grandes números de transformantes. La naturaleza de estos 40
tamices generalmente se seleccionará sobre bases prácticas. Por ejemplo, se puede tamizar al ver cambios en la expresión génica mediante el uso de anticuerpos específicos para la proteina codificada por el gen que se esté suprimiendo, o se pueden establecer ensayos que midan específicamente la actividad enzimática. Un método preferido será uno que permita que grandes números de muestras sean procesadas rápidamente, toda vez que se esperará que un gran número de transformantes sean negativos para el fenotipo deseado. La pérdida de fenotipos mutantes de función puede identificarse para los presentes clones de ADN ya sea mediante protocolos de alteración de genes dirigidos o al identificar mutantes específicos para estos genes contenidos en una población de maíz que porte mutaciones en todos los genes posibles (Ballinger y Benzer (1989) Proc. Nati. Acad. Sci USA 86 : 9 02-9406 ; Koes et al (1995) Proc. Nati. Acad. Sci USA 92:8149-8153; Bensen et al (1995) Plant Cell 7:75-84;. Este último enfoque se puede lograr en dos formas. Primero, segmentos cortos de los presentes fragmentos de ácido nucleico pueden usarse en protocolos de reacción en cadena de polimerasa en conjunto con un cebador de secuencia marcadora de mutación sobre ADNs preparados a partir de una población de plantas en las cuales transposones mutadores o algún otro elemento de ADN que cause mutación hayan sido introducidos (véase Bensen, citado anteriormente) . La amplificación de un 41
fragmento de ADN específico con estos cebadores indica la inserción del elemento marcador de mutación en o cerca del gen vegetal que codifique para los presentes polipéptidos . Como alternativa, el presente fragmento de ácido nucleico se puede usar como una sonda de hibridación contra productos de amplificación por PCR generados a partir de la población de mutación usando el cebador de secuencia marcadora de mutación en conjunto con un cebador de sitio genomico arbitrario, tal como aquel para un adaptador sintético anclado a sitio de enzima de restricción. Con cualquier método, una planta que contenga una mutación en el gen endógeno que codifique para los presentes polipéptidos puede identificarse y obtenerse. Esta planta mutante se puede usar después para determinar o confirmar la función natural de los presentes polipéptidos descritos aqui . Los términos Hap3 , Lecl y Hap3/Lecl se usan de manera intercambiable en la presente y se refieren a una clase de factores de transcripción. La clase Hap3/Lecl es parte de una familia más amplia que incluye otros factores de transcripción tales como Hapt5, Hap2 y Lecl-CCAAT. Los términos tipo Hap3 , tipo Lecl, tipo Hap3/Lecl, tipo Hap5, tipo Hap2, tipo Lecl-CCAAT, etc., se refieren a cualquier factor de transcripción que comparte identidad de secuencia como se describe en la presente y/o funcionalidad con las secuencias de nucleótidos y las secuencias de aminoácidos 42
correspondientes- codificadas por las secuencias de nucleótidos descritas en la presente invención. De manera sorprendente e inesperada, se ha encontrado que hay una variedad de fragmentos de ácido nucleico reguladores/estructurales, los cuales hasta la fecha no han sido asociados con alterar fenotipo de aceite en plantas, que parecen ser útiles para alterar fenotipos de aceite en plantas . Además de los factores de transcripción de unión a CCAAT, otras proteínas que hasta la fecha no han estado asociadas con alterar fenotipo de aceite en plantas han sido identificadas. Los ácidos nucleicos identificados codifican para una clase diversa de polipéptidos reguladores y estructurales cuya expresión se correlaciona con fenotipos de aceite alterados en plantas. La alteración de la expresión de estos polipéptidos se esperarla que tuviera un efecto en alterar la acumulación de aceite en plantas. Otras clases de proteínas identificadas en la presente incluyen: un factor de transcripción Hap2 ; un factor de transcripción Hap5 ; un factor de transcripción de unión a Hap3/Lecl o Lecl-CCAAT. Pueden ser caracterizados como un fragmento de nucleótido aislado que comprenda una secuencia de ácido nucleico seleccionada del grupo que consiste en: 43
a) una secuencia de ácido nucleico que codifica para un quinto polipeptido que tiene una actividad de factor de transcripción tipo Hap2, el quinto polipeptido tiene por lo menos 70% de identidad con base en el método de alineación Clustal cuando se le compara con un sexto polipeptido seleccionado del grupo que consiste en SEQ ID NOs : 2, 4, 5, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38,40, 42, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 ó 208, 210, 212, 214 ó 216 o b) una secuencia de ácido nucleico que codifica para un séptimo polipéptido que tiene actividad de factor de transcripción tipo Hap5, el séptimo polipéptido tiene por lo menos 80% de identidad con base en el método de alineación Clustal cuando se le compara con un octavo polipéptido seleccionado del grupo que consiste en SEQ ID NOs : 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128 ó 221; o c) una secuencia de ácido nucleico que codifica para un diecisieteavo polipéptido que tiene actividad tipo Hap3/Lecl, el diecisieteavo polipéptido tiene por lo menos 70% de identidad de secuencia con base en el método de alineación Clustal cuando se le compara con un dieciochoavo polipéptido seleccionado del grupo que consiste en SEQ ID NOs: 130, 132, 134 ó 136. Se entiende por un experto en la técnica que otras 44
escalas de identidad porcentual pueden ser útiles en la caracterización mencionada arriba. Las identidades porcentuales útiles incluirían, pero no están limitadas a, 45%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% y todos los porcentajes enteros de 45 a 100%. El complemento de los fragmentos de nucleótidos de esta invención es abarcado dentro del alcance de esta invención . Los expertos en la técnica también apreciarán que el fragmento de nucleótido de esta invención y/o el complemento del mismo se pueden usar completos o en parte para la inhibición o co-supresión antisentido de una planta transformada. En una modalidad más preferida, el primer polipéptido mencionado arriba es como sigue con respecto a cada parte, el primer polipéptido en la parte a) es un factor de transcripción Hap2 ; la parte b) es un factor de transcripción Hap5 ; la parte c) es un factor de transcripción de unión a Hap3/Lecl o Lecl-CCAAT. Los homólogos de Lecl pueden identificarse más mediante el uso de motivos de secuencia conservados . La siguiente secuencia de aminoácidos (dada en su código de una sola letra, con "x" representando cualquier aminoácido) . Los aminoácidos subrayados son aquellos que se conservan en Lecl 45
pero que no se encuentran en proteínas relacionadas con Lecl. REQDxxMPxANVxRIMRxxLPxxAKISDDAKExIQECVSExISFxTxEANxRCxxxxRKTx xxE En una modalidad más, esta invención abarca una construcción de ADN recombinante que comprende cualquiera de los fragmentos de ácido nucleico aislados de la invención o complemento de los mismos ligado operablemente a por lo menos una secuencia reguladora. Se entiende también que las construcciones de ADN recombinante que comprenden estos fragmentos o complementos de los mismos o partes de cada uno de ellos se pueden usar en la inhibición o supresión antisentido de una planta transformada. También dentro del alcance de esta invención está una planta que comprende en su genoma una construcción de ADN recombinante como la descrita en la presente. Las construcciones de ADN recombinantes diseñadas para la expresión en plantas tales como aquellas descritas en la presente se pueden introducir en una célula vegetal en un número de formas reconocidas en la técnica. Los expertos en la técnica apreciarán que la elección de un método podría depender del tipo de planta (es decir, monocotiledónea o dicotiledónea) y/u organelo (es decir, núcleo, cloroplasto, mitocondria) seleccionado para la transformación. Los métodos adecuados para transformar células vegetales incluyen microinyección, electroporación, transformación mediada por 46
Agrobacterium, transferencia génica directa y tecnología de transformación de partículas aceleradas o "pistola génica" como la que se describió arriba. Ejemplos de plantas que pueden ser transformadas incluyen, pero no están limitadas a, maíz, soya, trigo, arroz, cañóla, Brassica, sorgo, girasol y coco. La regeneración, desarrollo y cultivo de plantas a partir de transformantes de protoplastos de una sola planta o de varios explantes transformados se conocen bien en la técnica (Weissbach y Weissbach, en Methods for Plant Molecular Biology, (eds.), Academic Press, Inc., San Diego, CA (1988)). Este proceso de regeneración y crecimiento incluye típicamente las etapas de selección de células transformadas, el cultivo de las células individualizadas a través de las etapas normales de desarrollo embrionario a lo largo de la etapa de plántulas enraizadas. Los embriones y semillas transgénicos se regeneran similarmente . Los brotes enraizados transgénicos resultantes se colocan posteriormente en medio de crecimiento de plantas adecuado tal como tierra. El desarrollo o regeneración de plantas que contienen el gen extraño y exógeno que codifica para una proteína de interés se conoce bien en la técnica. De preferencia, las plantas regeneradas son autopolinizadas para proporcionar plantas transgénicas homocigóticas . De otra manera, el polen obtenido de las plantas regeneradas se cruza 47
con plantas que crezcan de semillas de lineas agronómicamente importantes. De manera inversa, el polen de plantas de estas líneas importantes se usa para polinizar plantas regeneradas. Una planta transgénica de la presente invención que contiene un polipéptido deseado se cultiva usando métodos bien conocidos por el experto en la técnica. Existe una variedad de métodos para la regeneración de plantas a partir de tejido vegetal. El método de regeneración particular dependerá del tejido vegetal de partida y de la especie vegetal particular que será regenerada. Los métodos para transformar dicotiledóneas, principalmente mediante el uso de Agrobacterium tumefaciens, y obtener plantas transgénicas han sido publicados para algodón (patente de E.U.A. No. 5,004,863, patente de E.U.A. No. 5,159,135, patente de E.U.A. No. 5,518,908); soya (patente de E.U.A. No. 5,569,834, patente de E.U.A. No. 5,416,011, McCabe et al., Bio/Technology 6:923 (1988), Christou et al., Plant Physiol . 87:671-674 (1988)); Brassica (patente de E.U.A. No. 5,463,174); cacahuate (Cheng et al., Plant Cell Rep. 15:653-657 (1996), McKently et al., Plant Cell Rep. 14:699-703 (1995)); papaya y guisante (Grant et al., Plant Cell Rep. 15:254-258, (1995)). También se ha reportado la transformación de monocotiledóneas usando electroporación, bombardeo de partículas y Agrobacterium. La transformación y regeneración 48
vegetal han sido logradas en espárrago (Bytebier et al . , Proc. Nati. Acad. Sci. (USA) 84:5354, (1987)); cebada (Wan y Lemaux, Plant Physiol 104:37 (1994)); Zea mays (Rhodes et al., Science 240:204 (1988), Gordon-Kamm et al., Plant Cell 2:603-618 (1990), Fromm et al., BiolTechnology 8:833 (1990), Koziel et al., Blol Technology 11:194, (1993), Armstrong et al., Crop Science 35:550-557 (1995)); avena (Somers et al., Biol Techcnology 10:15 89 (1992)); césped de huerto (Horn et al., Plant Cell Rep. 7:469 (1988)); arroz (Toriyama et al., TheorAppl. Genet. 205:34, (1986); Part et al., Plant Mol. Biol. 32:1135-1148, (1996); Abedinia et al., Aust. J". Plant Physyiol. 24:133-141 (1997); Zhang y Wu, Theor. Appl . Genet. 76:835 (1988); Zhang et al., Plant Cell Rep. 7:379, (1988); Battraw y Hall, Plant Sci. 86:191-202 (1992); Christowu et al., Bio/Technology 9:957 (1991)); centeno (De la Pena et al., Nature 325:274 (1987)); caña de azúcar (Bower y Birch, Plant J. 2:409 (1992)); cañuela ( ang et al., BiolTechnology 10:691 (1992)) y trigo (Vasil et al., Bio/Technology 10:667 (1992); patente de E.U.A. No. 5,631,152). Los ensayos para la expresión génica a base de la expresión transitoria de construcciones de ácido nucleico clonadas han sido desarrollados al introducir las moléculas de ácido nucleico en células vegetales mediante tratamiento con polietilenglicol , electroporación o bombardeo de partículas (Marcotte et al., Nature 335:454-457 (1988);
49
Marcotte et al., Plant Cell 1:523-532 (1989).; McCarty et al . , Cell 66:895-905 (1991); Hattori et al . , Genes Dev. 6:609-618 (1992); Goff et al . , EMBO J. 9:2517-2522 (1990)). Los sistemas de expresión transitoria pueden ser usados para diseccionar funcionalmente construcciones génicas (véase generalmente, Maliga et al., Methods in Plant Molecular Biology, Cold Spring Harbor Press (1995)). Se entiende que cualquiera de las moléculas de ácido nucleico de la presente invención se puede introducir en una célula vegetal de una manera permanente o transitoria en combinación con otros elementos genéticos tales como vectores, promotores, potenciadores, etc. Además de los procedimientos descritos arriba, los practicantes están familiarizados con los materiales de origen estándares que describen condiciones y procedimientos específicos para la construcción, manipulación y aislamiento de macromoléculas (por ejemplo, moléculas de ADN, plásmidos, etc.), generación de organismos recombinantes y el tamizado y aislamiento de clones (véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press (1989); Maliga et al., Methods in Plant Molecular Biology, Cold Spring Harbor Press (1995); Birren ett al., Genome Analysis: Eetecting Genes, 1, Cold Spring Harbor, Nueva York (1998); Birren et al., Genome Analysis: Analyzing DNA, 2, Cold Spring Harbor, Nueva York (1998) ; Plant 50
Molecular Biology: A Laboratory Manual, eds . , Clark, Sprlnger, Nueva York (1997) ) . Las semillas obtenidas de estas plantas y el aceite obtenido de estas semillas constituyen otro aspecto de la presente invención. En un aspecto adicional, la invención se refiere a un método para alterar fenotipos de aceite en una planta que comprende : a) transformar una planta con una construcción de ADN recombinante de la invención; b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante y c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. En una modalidad más específica, la invención se refiere a un método para alterar fenotipos de aceite en una planta que comprende : a) transformar una planta con una construcción de
ADN recombinante que comprende un fragmento de nucleótidos aislado que contiene una secuencia de ácido nucleico seleccionada del grupo que consiste en: i) una secuencia de ácido nucleico que codifica para un factor de transcripción Hap3/Lecl vegetal que tiene 51
al menos 60% de identidad con base en el método de alineación Clustal cuando se le compara con un segundo polipeptido seleccionado del grupo que consiste en SEQ ID NOs pares: de 130 a 148, y SEQ ID NOs : 195 y 196; ii) el complemento de la secuencia de ácido nucleico de i) ; iii) la secuencia de i) o ii) o una parte de la misma que sea útil en la inhibición o co-supresión antisentido en una planta transformada; iv) una secuencia de ácido nucleico que codifica para un factor de transcripción de unión a CCAAT relacionado con Lecl vegetal que tiene al menos 60% de identidad con base en el método de alineación Clustal cuando se le compara con un segundo polipéptido seleccionado del grupo que consiste en SEQ ID NOs pares: de 150 a 178, y SEQ ID NOs : 197 a 202; v) el complemento de la secuencia de ácido nucleico de vii) ; vi) la secuencia de iv) o v) o una parte de la misma que sea útil en la inhibición o co-supresión antisentido en una planta transformada; en donde la secuencia de ácido nucleico está ligada operablemente a por lo menos una secuencia reguladora; b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de 7ADN recombinante y 52
c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. Se entiende por un experto en la técnica que otras escalas de identidad porcentual pueden ser útiles en el método mencionado arriba. Las identidades porcentuales útiles incluirían, pero no están limitadas a, 45%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% y todos los porcentajes enteros de 45 a 100%. En un aspecto más, esta invención se refiere a un método para aislar fragmentos de ácido nucleico asociados con alterar fenotipo de aceite en una planta que comprende : a) comparar SEQ ID NOs pares: de 2 a 178, y 206 a 214, y SEQ ID NOs : 179 a 202, 216 a 219, 221 y 222 con otras secuencias de polipéptidos con el propósito de identificar polipéptidos asociados con alterar fenotipos de aceite en una planta b) identificar las secuencias conservadas o cuatro o más aminoácidos obtenidos en la etapa a) ; c) hacer sondas u oligómeros de nucleótidos específicos de región con base en las secuencias conservadas identificadas en la etapa b) y d) usar las sondas u oligómeros de nucleótidos de la etapa c) para aislar secuencias asociadas con alterar fenotipo de aceite mediante protocolos dependientes de secuencia.
53
En un aspecto más preferido, esta invención se refiere a un método para alterar fenotipos de aceite en una planta que comprende : a) transformar una planta con una construcción de ADN recombinante que comprenda un fragmento de acido nucleico aislado ligado operablemente a por lo menos una secuencia reguladora, en donde el fragmento tiene una secuencia de ácido nucleico que codifica para un polipéptido que tiene una identidad de secuencia de por lo menos 60% con base en el método de alineación Clustal cuando se le compara con un polipéptido seleccionado del grupo que consiste en par (sic) b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante y c) seleccionar las plantas transformadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. Se entiende por un experto en la técnica que otras escalas de identidad porcentual pueden ser útiles en el método mencionado arriba . Las identidades porcentuales útiles incluirían, pero no están limitadas a, 45%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% y todos los porcentajes enteros de 45 a 100%. En otro aspecto, esta invención se refiere también a un método para mapear variaciones genéticas relacionadas con 54
fenotipos de aceite alterados en una planta que comprende : a) cruzar dos variedades vegetales y b) evaluar las variaciones genéticas con respecto a secuencias de ácido nucleico mostradas en cualquiera de las SEQ ID NOs impares: de 1 a 177 ó 207 a 215, o SEQ ID NO: 220 en plantas de progenie que resulten de la cruza de la etapa a) , en donde la evaluación se hace usando un método seleccionado del grupo que consiste en: análisis RFLP, análisis SNP y análisis a base de PCR. En otra modalidad, esta invención se refiere a un método de reproducción molecular para obtener fenotipos de aceite alterados en una planta que comprende : a) cruzar dos variedades vegetales y b) evaluar las variaciones genéticas con respecto a secuencias de ácido nucleico mostradas en cualquiera de los SEQ
ID NOs impares: de 1 a 177, ó 207 a 215, o SEQ ID NO: 220 en plantas de progenie que resulten de la cruza de la etapa a) , en donde la evaluación se hace usando un método seleccionado del grupo que consiste en: análisis RFLP, análisis SNP y análisis a base de PCR. La variabilidad genética en un locus (gen) particular debido a cambios de base incluso menores puede alterar el patrón de fragmentos de digestión de enzima de restricción que pueden ser generados. Las alteraciones patogénicas al genotipo pueden deberse a supresiones o inserciones dentro del gen que 55
esté siendo analizado o incluso a sustituciones de nucleótidos individuales que puedan crear o suprimir un sitio de reconocimiento de enzima de restricción. El análisis RFLP saca ventaja de esto y utiliza borrones de Southern con una sonda que corresponde al fragmento de ácido nucleico aislado de interés . De esta manera, si un polimorfismo (es decir, una variación que ocurre comúnmente en un gen o segmento de ADN; también, la existencia de varias formas de un gen (alelos) en la misma especie) crea o destruye un sitio de corte con endonucleasa de restricción, o si éste da como resultado la pérdida o la inserción de ADN (por ejemplo, un polimorfismo de repetición en tándem de nucleótidos variables (VNTR) ) , éste alterará el tamaño o perfil de los fragmentos de ADN que sean generados mediante digestión con esa endonucleasa de restricción. De esta manera, los individuos que posean una secuencia variante pueden distinguirse de aquellos que tengan la secuencia original mediante el análisis del fragmento de restricción. Los polimorfismos que pueden ser identificados de esta manera son llamados "polimorfismos de longitud de fragmento de restricción" ("RFLPs") . Los RFLPs han sido usados ampliamente en análisis genéticos humanos y vegetales (Glassberg, solicitud de patente británica 2135774; Skolnick et al., Cytogen. Cell Genet. 32:58-67 (1982); Botstein et al. Ann. J. Hum. Genet. 32:314-331 (1980); Fisher et al (solicitud de 56
PCT WO 90/13668; Uhlen, solicitud de PCT WO 90/11369) . Un atributo central de los "polimorfismos de un solo nucleótido" o wSNPs" es que el sitio del polimorfismo es en un solo nucleótido. Los SNPs tienen ciertas ventajas reportadas sobre RFLPs o VNTRs. Primero, los SNPs son más estables que otras clases de polimorfismos. Su velocidad de mutación espontánea es de aproximadamente 10"9 (Kornerg, DNA Replication, W. H. Freeman & Co., San Francisco, 1980), aproximadamente 1, 000 veces menos frecuente que la de los VNTRs (patente de E.U.A. 5,679,524). Segundo, los SNPs ocurren a una mayor frecuencia, y con mayor uniformidad que los RFLPs y VNTRs. Ya que SNPs resultan de la variación de secuencia, polimorfismos nuevos pueden identificarse mediante la secuenciación de moléculas genómicas o de ADNc aleatorias . Los SNPs también pueden ser el resultado de supresiones, mutaciones por puntos e inserciones. Cualquier alteración de una sola base, cualquiera que sea la causa, puede ser un SNP. La mayor frecuencia de SNPs significa que pueden ser más fácilmente identificados que las demás clases de polimorfismos. Los SNPs se pueden caracterizar usando cualquiera de una variedad de métodos . Estos métodos incluyen la secuenciación directa o indirecta del sitio, el uso de enzimas de restricción en donde los alelos respectivos del sitio crean o destruyen un sitio de restricción, el uso de sondas de hibridación específicas de alelos, el uso de antcuerpos que 57
sean específicos para las proteínas codificadas por los diferentes alelos del polimorfismo o mediante otra interpretación bioquímica. Los SNPs pueden ser secuenciados mediante un número de métodos . Dos métodos básicos pueden usarse para la secuenciación de ADN, el método de terminación de cadena de Sanger et al., Proc. Nati. Acad. Sci. (U.S.A.) 74:5463-5467 (1977) y el método de degradación química de Maxam y Gilbert, Proc. Nati. Acad. Sci. (U.S.A.) 74:560-564 (1977). La reacción en cadena de polimerasa ("PCR") es una técnica poderosa usada para amplificar ADN millones de veces, mediante la replicación repetida de una plantilla, en un corto periodo de tiempo. (Mullís et al., Cold Spring Harbor Symp. Quant. Biol. 51:263-273 (1986); Erlich et al., solicitud de patente europea 50,424; solicitud de patente europea 84,796; solicitud de patente europea 258,017, solicitud de patente europea 237,362; Mullís, solicitud de patente europea 201,184, Mullís et al., patente de E.U.A. No. 4,683,202; Erlich, patente de E.U.A. No. 4,582,788 y Saiki et al., patente de E.U.A. No. 4,683,194). El procedimiento utiliza conjuntos de oligonucleótidos sintetizados in vitro específicos para cebar la síntesis de ADN. El diseño de los cebadores depende de las secuencias de ADN que se desee analizar. La técnica se lleva a cabo a través de muchos ciclos (normalmente 20-50) de fundir la plantilla a alta temperatura, permitiendo que los cebadores se fijen a secuencias complemen arias dentro de la plantilla y 58
luego replicando la plantilla con ADN polimerasa. Los productos de las reacciones de PCR se analizan mediante separación en geles de agarosa seguida por tinción con bromuro de etidio y la visualización mediante transiluminación UV. Como alternativa, dNTPs radioactivos se pueden añadir a la PCR para incorporar marcadores en los productos. En este caso, los productos de PCR son visualizados mediante la exposición del gel a película de rayos X. La ventaja agregada de marcar radioactivamente productos de PCR es que los niveles de productos de amplificación individuales pueden ser cuantificados . Más aún, las mutaciones de un solo punto pueden ser detectadas mediante técnicas de PCR modificadas tales como el análisis de reacción en cadena de ligasa ("LCR") y polimorfismos conformacionales de una sola hebra por PCR ("PCR-SSCP") . La técnica de PCR se puede usar también para identificar el nivel de expresión de genes en muestras de material extremadamente pequeñas, por ejemplo, tejidos o células de un cuerpo. La técnica es llamada transcripción inversa-PCR ("RT-PCR") . En otra modalidad, esta invención se refiere a un método para alterar fenotipos de aceite en una planta que comprende . a) transformar una planta con una construcción de ADN recombinante que comprende un fragmento de nucleótido aislado 59
que contiene una secuencia de ácido nucleico seleccionada del grupo que consiste en: i) una secuencia de ácido nucleico que codifica para un factor de transcripción Hap3/Lecl vegetal que tiene al menos 70% de identidad con base en el método de alineación Clustal cuando se le compara con un segundo polipéptido seleccionado del grupo que consiste en SEQ ID NOs: 130 a 148 y SEQ ID NOs: 195 y 196; ii) el complemento de la secuencia de ácido nucleico de iv) ; iii) la secuencia de iv) o v) o una parte de la misma que es útil en la inhibición o co-supresión antisentido en una planta transformada; b) cultivar la planta transformada bajo condiciones adecuadas para la expresión de la construcción de ADN recombinante y c) seleccionar las plantas trans ormadas cuyo fenotipo de aceite haya sido alterado en comparación con el fenotipo de aceite de una planta no transformada. Se entiende por un experto en la técnica que otras escalas de identidad porcentual pueden ser útiles en el método mencionado arriba. Las identidades porcentuales útiles incluirían, pero no están limitadas a, 45%, 50%, 55%, 60%, 65%, 75%, 80%, 85%, 90%, 95% y todos los porcentajes enteros de 45 a 100%.
60
En otro aspecto esta invención se refiere a un método para aislar fragmentos de ácido nucleico asociados con alterar fenotipos de aceite en una planta que comprende: a) comparar SEQ ID NOs : 130 a 148 y SEQ ID NOs : 195, 196 y 206 con otras secuencias de polipéptidos con el propósito de identificar polipéptidos asociados con alterar fenotipos de aceite en una planta; b) identificar las secuencias conservadas o cuatro o más aminoácidos obtenidos en la etapa a) ; c) hacer sondas u oligómeros de nucleótidos específicos de región con base en las secuencias conservadas identificadas en la etapa b) y d) usar las sondas u oligómeros de nucleótidos de la etapa c) para aislar las secuencias asociadas con alterar fenotipos de aceite mediante protocolos dependientes de secuencia . Ejemplos La presente invención se define más en los siguientes ejemplos, en los cuales las partes y porcentajes son en peso y los grados son centígrados, a menos que se indique lo contrario. La descripción de cada referencia descrita en la presente se incorpora aquí a manera de referencia en su totalidad.
61
Ej emplo 1 Composición de bibliotecas de ADNc; aislamiento y secuenciacion de clones de ADNc Bibliotecas de ADNc que representan, moléculas de ARNm de varios tej idos vegetales fueron preparadas . Las características de las bibliotecas se describen a continuación. Tabla 2 Bibliotecas de ADNc de varias plantas
Biblioteca Tejido Clon cbn10 Grano de Maíz en Desarrollo (Embrión y Cbn10.pk0005.e6:fis Endospermo); 10 Días después de Polinización cbn10.pk0064.e6 cc71se-a Tejido de Callo de Maíz Tipo II, Embrión 871se-a.pk0002.e11:fis Somático Formado cc71se-b Tejido de Callo de Maíz Tipo II, Embrión ce71se-b.pk0018.e4:fis Somático Formado cea Tejido de Callo de Maíz Tipo II, No cca.pk0026.d6 diferenciado, Altamente Transformable ccase-b Tejido de Callo de Maíz Tipo II, Embrión ccase-b.pk0003.b9:fis Somático Formado, Altamente Transformable cco1n.pk062.j7 cco1n.pk086.d20:fis ccoln Mazorca de Maíz de 67 Días de Edad Plantas cco1n.pk0014.d4:fis Cultivadas en invernadero* cco1n.pk055.o18 cco1n.pk089.g17 cco1n.pk068:f18:fis edele Embrión de maíz en desarrollo (Zea Mays, cde1c.pk003.o22:fis B73) 20 DAP cdeln Embrión de maíz en desarrollo (Zea mays, cde1n.pk003.a5 B73) 20 DAP normalizado cde1n.pk001.n24:fis edole Ovario de maíz (Zea mays L), 5 días después cdo1c.pk001.c1 :fis de maduración (incluye pedicelo y glumas) ceb3 Embrión de Maíz 20 Días después de ceb3.pk0012.a7 Polinización ceb5 Embrión de Maíz 30 Días después de ceb5.pk0081.b4 Polinización cen3n.pk0 64.a10 cen3n Endospermo ds Maíz 20 Días después de cen3n.pk0044.b8:fis Polinización* cen3n.pk0112.e10:fis cho1c.pk003.p17:fis cho1c.pk003.n23 cholc Embrión de maíz (Zea mays L, Alexho Cho1c.pk004.b19:fis Synthetic High Oil) 20 DAP Cho1c.pk007.l21:fis cho1c.pk001.l23:fis cho1c.pk009.g10 clnrlf Hoja de maíz (Zea mays, B73) en V6-VT Clm1f.pk001.k17 (longitud completa) clm1f.pk002.o13:fis cpdlc BMS de maíz (Zea mays L.) agrupados cpd1c.pk01 .i5:fis tratados con químicos relacionados con cpd1c.pk008.e21 proteína cinasas cp lc BMS de maíz (Zea mays L.) agrupados cpf1c.pk006.e3:fis tratados con químicos relacionados con síntesis de proteína cpjlc BMS de maíz (Zea mays L.) agrupados cpj1c.pkO05.m2O:fis tratados con químicos relacionados con fuerza iónica de membrana 62
Tabla 2 (continuación)
Biblioteca Tejido Clon cri n Raíz de maíz de plántulas de 7 días de cr1 n.pk0080.g6 edad* csel c Plántula de maíz (Zea mays L.) en etapa cse1 c.pk001.h6 V2 tratada con etileno colectada a 6 hr, 23 hr, 72 hr ctaln Espiguilla de Maíz* cta1n.pk0070.f3:fis cta1 n.pk0074.h11 ctnlc Espiguilla de maíz (Zea mays L, B73) ctn1c.pk002.o4 cosechada en la noche (etapa V12). ectlc Tubérculos de Canna edulis ect1c.pk001.k17:fis ect1c.pk007.p18:fis eeflc Bulbos florales de Eucalyptus tereticornis eef1c.pk004.c8:fis de árbol adulto etrlc Raíz de Espadaña (Typha latifolia) etr1c.pk006.f9 fds Semilla en Desarrollo de Momordica fds.pk0003.h5:fis charantia hssl c Plantas de girasol infectadas con hss1c.pk011.h10:fis
Sclerotinia ncs Semilla en Desarrollo de Catalpa speciosa ncs.pk0013.c4 p0006 Brote Joven p0006.cbysa51 r:fis p0015 Embrión de 13 DAP p0015.cdpgu90r:fis p0015.cdpfm55r:fis p0016 Brotes de espiguilla, agrupados, 0.1-1.4 p0016.ctsbf56rb p0026 Callo en regeneración 5 días después de p0026.ccrab39r remoción de auxina callo H¡-ll 223a, 1129e p0027 Cultivos de brote GS3 que fueron p0027.cgsag51 r transformados con PHP5869 y se mantuvieron en medio de multiplicación de brotes 273T desde 3/17/94 (muestra recibida el 5/29/96 para prep. de ARN). La transformación original se hizo el 1/6/93 p0031 Cultivo de brotes C 45. Fue iniciado el p0031.ccmau15r:fis
2/28/96 de meristemos derivados de p0031.ccmbc81r plantas. El cultivo se mantuvo en medio 273N p0032 Callo en regeneración, 10 y 14 días p0032.crcav77r:fis después de remoción de auxina. Callo Hi- II 223a, 1129e 10 días. Callo Hi-ll 223a, 1129e 14 días p0037 Raíces V5 infestadas con Gusano de Raíz p0037.crwbs90r:fis del Maíz p0083.cldct11r:fis p0083 Granos de maíz 7DAP p0083.cldeu68r:fis p0083.clder12r p0086 P0067 Tamizado 1 ; pericarpo 11 DAP p0086.cbsaa24r p0118 Tejido de tallo agrupado y cosechado en p0118.chsbc77r la noche de los 4-5 ¡nternódulos que p0118.chsbh89r subtienden la espiguilla; Etapas V8-V12, Tamizados 1 63
Tabla 2 (continuación)
Biblioteca Tejido Clon p0125 Antera: Profase I tamizada 1 p0125.czaab60rb:fis p0126 Tejido foliar cosechado en la noche; V8-V10 p0126.cnlau71 r:fis p0134 Callo Hi-ll 223a, 1129e, 10 días callo hi-ll p0134.carah47r 233a, 1129e, 14 días ppslc Semillas en desarrollo de chicalote pps1c.pk001.h3:fis pps1c.pk007.j21:fis rbm5c Salvado de Arroz (Oryza sativa, Cypress) 10 rbm5c.pk001.a19 días después de molienda rcalc Callo de Arroz Nipponbare rca1c.pk007.b22:fis rcal n Callo de Arroz (Oryza sativa L, Nipponbare) rca1n.pk029.n22 normalizado. rca1n.pk002.j3 rca1n.pk021.b20:fis rca1n.pk004.j14:fis rca1n.pk026.m9 rcaln. k008.o5:fis r10n.pk096.h23 rIOn Hoja de Arroz de 15 Días de Edad* rl0n.pk0061.c8:fis rl0n.pk131.j17 r10n.pk0015.a4:fis rlm3n Mezcla de hojas de arroz (Oryza Sativa, YM) rlm3n.pk005.d20:fis (rsr9) normalizadas a 45 C durante 24 hrs usando exceso de 20 veces de conductor rlr2 Hoja de arroz (Oryza sativa L.) (15 DAG) 2 rlr2.pk0012.d2 hrs después de infección de cepa 4360-R-62 (AVR2-YA O); resistente rlr24 Hoja de arroz 15 días después de rlr24.pk0032.e10 germinación, 24 horas después de infección con cepa Magnaporthe grísea 4360-R-62 (AVR2-YAMO); Resistente rls6 Hoja de arroz 15 días después de rls6.pk0033.a9:fis germinación, 6 horas después de infección con cepa Magnaporthe grísea 4360-R-67 (AVR2-YAMO); Susceptible rls72 Hoja de arroz 15 días después de rls72.pk0023.c8:fls germinación, 72 horas después de infección con cepa Magnaporthe grísea 4360-R-67 (AVR2-YA O); Susceptible rr1 Plántula en desarrollo de raíz de arroz de dos rr1.pk0039.d4:fis semanas de edad rr1.pk0003.a3:fis rr1.pk097.f22:f¡s rr1.pk0047.g12:fis rsl1 n.pk002.g10:f¡s rsl1n.pk002.j2:fis rslln Plántula de arroz (Oryza sativa, YM) de 15 rsl1 n.pk006.n24:fis días de edad normalizada rsl1 n.pk013.g2 scbl c Cultivo de suspensión embrionaria de soya scb1c.pk004.n19:fis (Glycine max L, 2872) sometido a 4 bombardeos y colectado 2 hrs más tarde.
64
Tabla 2 (continuación)
Biblioteca Tejido Clon sde4c Embrión de soya en desarrollo (9-1 sde4c.pk0001.a2:fis mm) sdp2c.pk003.o5:fis sdp2c Vainas de soya (Glycine max L.) en sdp2c.pk023.n6:fis desarrollo, 6-7 mm sdp2c.pk029,k17:fis sdp2c.pk044.e5:fis sdp3c Vainas de soya en desarrollo (8-9 sdp3c.pk018.b9:fis mm) sdp3c.pk019.n1 :fis sdp4c Vainas de soya (Glycine max L.) en sdp4c.pk009.e3 s desarrollo, 10-12 mm dp4c.pk016.e10 sdrlf Raíz de soya (Glycine max, Wye) de sdr1f.pk001.p7 10 días de edad sdslf Biblioteca de longitud completa de sds1f.pk001.f7:fis plántulas de soya (Glycine max, Wye) de 11 días de edad usando trehalosa sel Embrión de soya, 6 a 10 días sel .pk0042.d8:fis después de florescencia se2 Embrión de soya, 13 días después de se2.1 1 d12:fis florescencia ses2w Suspensión embrionaria de soya 2 ses2w.pk0015.a4:fis semanas después de subcultivo ses2w.pk0035.a9:fis ses2w.pk0012.d10:fis ses4d.pk0037.e3:fls ses4d Suspensión embrionaria de soya 4 ses4d.pk0044.c12 semanas después de subcultivo ses4d.pk0006.a12 ses4d.pk0006.a12:fis ses4d.pk0043.d10:fis Sfl1.pk0102.fi8 sfH Flor de soya inmadura sfl1.pk131.j19 Sfl1.pk135.g3 sfl1.pk0029.h10:fis sgc5c Cotiledón germinante de soya sgc5c.pk001.h 6 (Glycine max L, Wye) (3/4 amarillo; 15-24 DAG) sgslc Semillas de soya 4 horas después de sgs1c.pk004.f19:fis germinación sgs4c Semillas de soya (Glycine max L.) 2 sgs4c.pk004.j2 días después de germinación sgs4c.pk006.g6 sgs4c.pk006.n21 sid c Tejido de soya (Glycine max) sic1c.pk003.o13:fis agrupado de raíz, tallo y hoja con sic1 c.pk003.o18:fis condiciones de clorosis por hierro siflc Tejido de soya (Glycine max) sif1c.pk001.m16:fis agrupado de tallo y raíz básales infectado con fusarium slsl c Soya (Glycine max L, S1990) sls1c.pk01O.I1 :fis infectada con micelio de Sclerotinia sls1c.pk032.j4 sclerotiorum.
65
Tabla 2 (continuación)
Biblioteca Tejido Clon slslc Soya (Glycine max L, S1990) sls1c.pk01O.I1 :fis infectada con micelio de Sclerotinia sls1c.pk020.h24 sclerotiorum. sls2c Soya (Glycine max L, Manta) Sls2c.pk007.c23:fis infectada con micelio de Sclerotinia sclerotiorum. sr1 Raíz de soya srlpk0041.a11 :fis sr1.pk0049.c2 srb Judía escarlata (R. Goldberg) srb.08g04 srdc Raíz de soya de 8 días de edad src1 c.pk003.o16:fis infectada con nematodo de quiste src2c Raíz de soya (Glycine max L, src2c.pk025.b3:fis 437654) de 8 días de edad inoculada src2c.pk011.m12:fis con huevecillos de nematodo de src2c.pk009.g9:fis quiste (Carrera 1 ) durante 4 días src2c.pk003.i13:fis . src3c.pk018.d10:fis sr3c.pk011.g22 src3c Raíz de soya de 8 días de edad src3c.pk012.m6:fis infectada con nematodo de quiste src3c.pk019.d4:fis src3c.pk009.b15 src3c.pk028.j21 :fis srrl c Raíz de soya de 8 días de edad srr1 c.pk001.i24:fis srr3c Raíz de soya de 8 días de edad srr3c.pk001.H O:fis tlwl c Hojas de tabaco (Nicotiana tlw1c.pk006.o16 benthamiana) lesionadas por abrasión y cosechadas después de 1.5 horas. vdbl c Yema de uva (Vitis sp.) en desarrollo Vdb1 c.pk001.m5:fis vmblna Bayas de uva (Vitis sp.) en etapa vmb1na.pk015.d18:fis media normalizadas vpH c Plántulas in vitro de uva (Vitis sp.) vpl1c.pk008.o5:fis vrrlc Raíces de uva (Vitis sp.) resistentes vrr1c.pk004.o20:fis vs1n Semilla de Vernonla* vs1 n.pk013.m13:fis wdelf Endospermo de trigo (Triticum wde1f.pk003.h2:fis aestivum, Línea Hi) en desarrollo 2-7 DPA wdk2c Grano de trigo en desarrollo, 7 Días wdk2c.pk009.e4 Después de antesis. wdk2c Grano de trigo en desarrollo, 7 Días wdk2c.pk018.c16:fis
Después de antesis. wdk3c Grano de trigo en desarrollo, 14 Días wdk3c.pk023.h15:fis
Después de antesis wdk5c Grano de trigo en desarrollo, 30 Días wdk5c.pk006.m13 Después de antesis wdk9n Granos de trigo (Triticum aestivu, Wdk9n.pk001.k5 trigo primaveral) 3, 7, 14 y 21 días después de antesis wdrlf Raíz de trigo (Triticum aestivum) en wdr1f.pk003.b21 :fis desarrollo (longitud completa) 66
Tabla 2 (continuación)
Biblioteca Tejido Clon wdslf Plántula de trigo en desarrollo, wds1f.pk002.p21 :fis longitud completa wialc Anteras de trigo (Triticum aestivum, wia1 c.pk001.d20:fis Línea Hi) inmaduras wkmlc Grano de trigo fermentado 55 horas a wkm1c.pk0002.d7:fis 22 Grados Celsius wl1 n Hoja de trigo de plántula de 7 días de Wl1 n.pk0114.f9 edad* wlel n Hoja de trigo de plántula de 7 días de wle1 n.pk0076.h7:fis edad etiolada* wlk8 Plántulas de trigo 8 horas después de Wlk8.pk0001.e10:fis tratamiento con funguicida** wlm96 Plántulas de trigo 96 horas después wim96.pk060.d5 de inoculación con Erysiphe graminis wlm96.pk037.k9:fis f. sp trítlci Wlm96.pk035.j11 :fis wlm96.pk0007.e4:fis wr1 Rafe de trigo de plántula de 7 días de wr1.pk0094.f2:fis edad wr1.pk0153.c7:fis wr1.pk148.f7:fis wrel n Raíz de trigo de plántula de 7 días de wre1 n.pk0066.e4:fis edad etiolada* wre1 n.pk0143.h2:fis *Estas bibliotecas fueron normalizadas esencialmente como se describe en la patente de E.TJ.A. No. 5 , 482 , 845 , incorporada en la presente a manera de referencia. **La aplicación de 6-yodo- 3-propil-2-propiloxi-4 - (3H) -quinazolinona; síntesis y métodos de uso de este compuesto se describen en la patente de E.U.A. No. 5 , 747 , 497 . Las bibliotecas de ADNc pueden prepararse mediante cualquiera de muchos métodos disponibles. Por ejemplo, las moléculas de ADNc se pueden introducir en vectores plasmidicos al preparar primero las bibliotecas de ADNc en vectores Uni-ZAP™ XR de acuerdo con el protocolo del fabricante (Stratagene Cloning Systems, La Jolla, CA) . Las bibliotecas Uni-ZAP™ XR se convierten en bibliotecas 67
plasmídicas de acuerdo con el protocolo provisto por Stratagene. Después de la conversión, los insertos de ADNc estarán contenidos en el vector plasmídico pBluescript . Además, las moléculas de ADNc pueden ser introducidas directamente en vectores Bluescript II SK(+) precortados (Stratagene) usando T4 ADN ligasa (New England Biolabs) , seguido por la transfección en células DH10B de acuerdo con el protocolo del fabricante (GIBCO BRL Products) . Una vez que los insertos de ADNc están en vectores plasmídicos, las moléculas de ADN plasmídicas se preparan a partir de colonias bacterianas recogidas aleatoriamente que contienen plásmidos pBluescript recombinantes ; o las secuencias de ADNc de inserto se amplifican mediante reacción en cadena de polimerasa usando cebadores específicos para secuencias de vectores que flanquean las secuencias de ADNc insertadas. Las moléculas de ADN insertadas y amplificadas o ADNs plasmídicos se secuencian en reacciones de secuenciación de colorante-cebador para generar secuencias de ADNc parciales (marcadores de secuencia expresados o "ESTs" ; véase Adams et al., (1991) Science 252 -.1651-1656) . Los ESTs resultantes se analizan usando un secuenciador fluorescente Perkin Elmer Modelo 377. Los datos de secuencia de inserto completo (FIS) se generan utilizando un protocolo de transposición modificado. Los clones identificados para FIS se recuperan de soluciones 68
de glicerol archivadas como colonias individuales, y las moléculas de ADN plasmídicas se aislan mediante lisis alcalina. Plantillas de ADN aisladas se hacen reaccionar con oligonucleótidos M13 delanteros e inversos cebados con vectores en una reacción de secuenciación a base de PCR y se cargan sobre secuenciadores automatizados. La conformación de la identificación del clon se lleva a cabo mediante alineación de secuencia con la secuencia EST original de la cual se hace la petición de FIS. Las plantillas confirmadas se transponen por medio del equipo de transposición Primer Island (PE Applied Biosystems, Foster City, CA) el cual se basa en el elemento transponible Tyl de Saccharomyces cerevisiae (Devine y Boeke (1994) Nucleic Acids Res. 22:3765-3772) . El sistema de transposición in vitro coloca sitios de unión únicos aleatoriamente a lo largo de una población de grandes moléculas de ADN. El ADN transpuesto se usa después para transformar células electrocompetentes DH10B (Gibco BRL/Life Technologies, Rockville, MD) mediante electroporación. El elemento transponible contiene un marcador seleccionable adicional (llamado DHFR; Fling y Richards (1982) Nucleic Acids Res. 11:5147-5158), que permite la doble selección sobre placas de agar únicamente de aquellos subclones que contenían el transposón integrado. Se seleccionan aleatoriamente varios subclones de cada reacción de 69
transposición, las moléculas de ADN plasmídico se preparan mediante lisis alcalina y se secuencian las plantillas (mezcla de reacción de colorante-terminador ABI Pris) hacia fuera del sitio de evento de transposición, utilizando cebadores únicos específicos para los sitios de unión dentro del transposón. Los datos de secuencia se recaban (ABI Prism Collections) y se ensamblan usando Phred/Phrap (P. Green, Universidad de Washington, Seattle) . Phred/Phrap es un programa de software de dominio público el cual vuelve a leer los datos de secuencia ABI, reasigna las bases, asigna valores de calidad y escribe las llamadas de base y los valores de calidad en archivos de emisión editables. El programa de ensamble de secuencias Phrap utiliza estos valores de calidad para incrementar la precisión de los contigs de secuencia ensamblados . Los ensambles se ven por medio del editor de secuencias Consed (D. Gordon, Universidad de Washington, Seattle) . En algunos de los clones el fragmento de ADNc corresponde a una porción del término 3' del gen y no cubre el marco de lectura abierto completo . Para obtener la información hacia el extremo cinco prima se usa uno de los dos protocolos diferentes . El primero de estos métodos da como resultado la producción de un fragmento de ADN que contiene una porción de la secuencia génica deseada mientras 70
que el segundo método da como resultado la producción de un fragmento que contiene el marco de lectura abierto completo. Ambos de estos métodos utilizan dos rondas de amplificación por PCR para obtener fragmentos de una o más bibliotecas. Las bibliotecas se seleccionan algunas veces con base en el conocimiento previo de que el gen específico debe encontrarse en cierto tejido y algunas veces se seleccionan aleatoriamente. Las reacciones para obtener el mismo gen pueden llevarse a cabo en varias bibliotecas en parelelo o en un fondo de bibliotecas. Los fondos de biblioteca se preparan normalmente usando tres a cinco bibliotecas diferentes y se normalizan hasta una dilución uniforme. En la primera ronda de amplificación ambos métodos utilizan un cebador específico de vector (hacia el extremo cinco prima) que corresponde a una porción del vector localizada en el término 5' del clon copulado con un cebador específico del gen (hacia el extremo tres prima) . El primer método utiliza una secuencia que es complementaria a una porción de la secuencia génica ya conocida mientras que el segundo método utiliza un cebador específico de gen complementario con una porción de la regió no traducida 3' (también referida como UTR) . En la segunda ronda de amplificación un conjunto anidado de cebadores se usa para ambos métodos . El fragmento de ADN resultante se liga en un vector pBluescript utilizando un equipo comercial y siguiendo el protocolo del fabricante.
71
Este equipo se selecciona de muchos disponibles a partir de varios vendedores que incluyen Invitrogen (Carlsbad, CA) , Promerga Biotech (Madison, WI) y Gibco-BRL (Gaithersburg, MD) . El ADN plasmídico se aisla mediante un método de lisis alcalina y se somete a secuenciación y ensamble usando Phred/Phrap, como se explicó arriba. Ejemplo 2 Identificación de clones de ADNc Clones de ADNc que codifican para proteínas implicadas en la alteración de características de aceite en plantas fueron identificados mediante perfilado de genes (véase ejemplo 7) y a llevar a cabo búsquedas BLAST (Basic Local Alignment Search Tool; Altschul et al (1993) J. Mol. Biol . 225:403-410 ; véase también www.ncbi.nlm.nih.gov/BLAST/) para similitud con secuencias contenidas en la base de datos BLAST "nr" (que comprende todas las traducciones GenBank CDS no redundantes y secuencias derivadas de la estructura tridimensional Brookhaven Protein Data Bank, la última liberación principal de la base de datos de secuencias de proteínas SWISS-PROT, bases de datos EMBL y DDBJ) . Las secuencias de ADNc obtenidas en el ejemplo 1 se analizaron para similitud con todas las secuencias de ADN públicamente disponibles en la base de datos "nr" usando el algoritmo BLASTN provisto por el Centro Nacional de Información de Biotecnología (NCBI) . Las secuencias de ADN fueron traducidas en todos los marcos de lectura y se les comparó para similitud 72
con todas las secuencias de proteínas disponibles públicamente contenidas en la base de datos "nr" usando el algoritmo BLASTX (Gish y States (1993) Nat. Genet. 3:266-272) provisto por la NCBI . Por motivos de conveniencia, el valor P (probabilidad) de observar una coincidencia de una secuencia de ADNc con una secuencia contenida en las bases de datos investigadas simplemente por oportunidad calculado mediante BLAST se reporta en la presente como valores "pLog" , los cuales representan el negativo del logaritmo del valor P reportado. En consecuencia, entre mayor sea el valor pLog, mayor será la probabilidad de que la secuencia de ADNc y el "acierto" de BLAST representen proteínas homologas . Los ESTs presentados para análisis se comparan con la base de datos del banco de genes como se describió arriba. Los ESTs que contienen secuencias de más de 5 ó 3 prima se pueden encontrar mediante el uso del algoritmo BLASTn (Altschul et al (1997) Nucleic Acids Res. 25:3389-3402) contra la base de datos privada de Du Pont que compara secuencias de nucleótidos que comparten regiones comunes o sobrepuestas de homología de secuencia. Cuando secuencias comunes o sobrepuestas existen entre dos o más fragmentos de ácido nucleico, las secuencias pueden ser ensambladas en una sola secuencia de nucleótidos contigua, extendiendo de esta manera el fragmento original ya sea en la dirección 5 prima o 3 prima. Una vez que el EST más 5 prima es identificado, su secuencia completa puede ser 73
determinada mediante Secuenciación de Inserto Completo como se describió en el ejemplo 1. Los genes homólogos que pertenecen a diferentes especies pueden encontrarse al comparar la secuencia de aminoácidos de un gen conocido (ya sea de una fuente privada o una base de datos pública) contra una base de datos de EST usando el algoritmo tBLASTn. El algoritmo tBLASTn busca una consulta de aminoácido contra una base de datos de nucleótidos que es traducida en todos los seis marcos de lectura. Esta búsqueda permite diferencias en el uso de codones de nucleótidos entre especies diferentes, y la degeneración de los codones. Ej emplo 3 Caracterización de clones de ADNc que codifican para proteínas implicadas en alterar fenotipos de aceite La búsqueda BLASTX usando las secuencias EST de clones listados en la tabla 3 reveló similitud de los polipéptidos codificados por las moléculas de ADNc con los homólogos de Hap2, homólogos de Hap5 y factores de transcripción Lecl de varias especies incluyendo Arabidopsis thaliana, arroz (Oryza sativa) , maíz (Zea mays) , soya [Glycine max) , pepino (Cucumis sativas) , Sordaria (Sordariamacrospora) , ajonjolí (Sesamum indicum) , uva (Vitis sp.), Brassica {Brassica napus) y tabaco (Nicotiana tabacum) . En la tabla 3 se muestran los resultados BLAST para ESTs individuales ("EST"), las secuencias de los insertos de ADNc completos que comprenden los clones de ADNc indicados ("FIS"), las secuencias de contigs 74
ensambladas de dos o más ESTs ("Contig") , secuencias de contigs ensambladas, de ion FIS y uno o más ESTs ("Contig*"), o secuencias que codifican para una proteína completa derivada de un FIS, un contig, o un FIS y PCR ("CGS") : Tabla 3 Resultados BLAST para secuencias que codifican para polipeptidos homólogos a proteínas implicadas en alterar fenotipos de aceite
SEQ ID Nombre del Clon Homólogo Genbank # pLOG
NO. gen 2 Hap2a ncs.pk0013.c4 Sin aciertos - 4 Hap2c etr1c.pk006.f9 Sin aciertos - 6 Hap2a vmb1na.pk015.d18 Arabidopsis 1282597 8.1
8 Hap2a vpl c.pk008.o5:fis Uva 7141243 91.2 10 Hap2c vdbl c.pk001.m5:fis Arroz 7489555 38.0
12 Hap2c Cho1c.pk004.b19:fis Arroz 7489565 94.3
14 Hap2c p0015.cdpgu90r:fis Arroz 7489565 96.2
16 Hap2a Cta1n.pk0070.f3:fis Arroz 7489565 38.1
18 Hap2a c81n.pkO014.d4:fis Arabidopsis 6634774 37.2
20 Hap2a cco1n.pk086.d20:fis Arabidopsis 6634774 36.3
22 Hap2b p0126.cnlau71r:fis Arroz 7489565 23.7
24 Hap2b p0104.cabav52r Arroz 7489565 16.7
26 Hap2b Cho1c.pk007.l21 :fis Arroz 7489565 35.0 contig de: cca.pk0026.d6 28 Hap2c cen3n.pk0061.e10:f¡s Arroz 7489565 43.5 cen3n.pk0135.c2 cho1c.pk001.n24 p0092.chwae40r 30 Hap2c cpf1c.pk006.e3:fis Arroz 7489565 44.0 contig de: Arroz 7489565 cr1n.pk0080.g6 35.0 p0003.cgpge5 r 34 Hap2c p0015.cdpftn55r:fis Arabidopsis 4587559 26.4
36 Hap2 p0083.cldct11r:fis Arroz 7489565 91.4
38 Hapt2 p0083.cldeu68r:fis Arroz 7489565 14.2
40 Hap2a pps1c.pk001.h3:fis Arabidopsis 9293997 45.5
42 Hap2c pps1 c.pk007.j21 :fis Arabidopsis 5903072 53.7
44 Hap2 rr1.pk0030.f7:fis Arroz 7489565 ¡dentical
46 Hap2a rls72.pk0023.c8:fis Arabidopsis 9293997 36.5
48 Hap2a rca1n.pk002.c 5 Uva 7141243 7.7
50 Hap2a rds3c.pk001.g9 Arroz 7489565 18.2
52 Hap2b rca1n.pk002.j3:fis Arroz 7489565 26.0
54 Hap2c rca1n.pk029.n22:fis Arabidopsis 8778470 29.2
56 Hap2b r10n.pk131.j17 Arroz 7489565 10.5
58 Hap2a sdp3c.pk018.b9:fis Arabidopsis 2398521 74.5
60 Hap2a sfllpk0102.h8 Grape 7141243 36.7
62 Hap2a srr3c.pk001.HO:fis Brassica 1586551 48.7
64 Hap2a Sdp2c.pk003.o5:fis Arabidopsis 6634774 53.0
66 Hap2b Sif1c.pk001.m16:f¡s Arabidopsis 67144411 180.0
68 Hap2c src1c.pk003.o16:fis Arroz 7489565 33.5 75
Tabla 3 (continuación)
SEQ ID Nombre del Clon Homólogo Genbank # pLOG
NO. gen 70 Hap2c src3c.pk012.m6:fis Arroz 7489565 31.5
72 Hap2a hss1c.pk011.h10:fis Arabidopsis 9293997 48.7
74 Hap2c wr1.pk0094.f2:fis Arroz 7489565 92.7
76 Hap2a wre1n.pk0143.h2:fis Arabidopsis 6634774 35.0
78 Hap2b wds1f.pk002.p21 :fis Arabidopsis 6714441 26.5 contig de: Arroz 7489565 80 Hap2b wd¡1c.pk002.b10 38.5 wr1.pk0153.c7:fis 82 Hap2c wre1n.pk0066.e4:fis Arroz 7489565 42.7
84 Hap5c ect1c.pk001.k17:fis Arroz 5257260 57.0
86 Hap5a vrr1c.pk004.o20:fis Arabidopsis 6523090 93.0
88 Hap5a clm1f.pk001.k17:f¡s Arabidopsis 6523090 66.7
90 Hap5b cde1n.pk003.a5:fis Arabidopsis 3776575 57.0
92 Hap5b cen3n.pk0164.a10:fis Arabidopsis 3776575 57.0
94 Hap5b p0118.chsbc77r Arabidopsis 3776575 58.5
96 Hap5c cco1n.pk055.o18 Arroz 5257260 41.0
98 Hap5c cho1c.pk001.l23.fis Arroz 5257260 82.0
100 Hap5c cse1c.pk001.h6:fis Arroz 5257260 86.4
102 HapSa rlm3n.pk005.d20:fis Arabidopsis 6523090 66.7
104 Hap5b rr1.pk003.a3:fis Arabidopsis 6289057 58.5
106 Hap5b rr1.pk0039.d4:fis Arabidopsis 3776575 57.2
108 Hap5c rca1 n.pk021.b20:fis Arroz 5257260 74.0
110 Hap5a sdp2c.pk029.k17:fis Arabidopsis 6523090 90.5
112 Hap5a sdp2c.pk044.e5:fis Arabidopsis 6523090 92.4
114 Hap5b sgs4c.pk004.j2 Arabidopsis 3776575 18.5
116 Hap5b src3c.pk002.h4:fis Arabidopsis 6289057 61.1
118 Hap5b src3c.pk009.b15:fis Arabidopsis 6289057 61.5
120 Hap5b src3c.pk019.d4:fis Arabidopsis 6056368 51.5
122 Hap5c Sls1 c.pk032.j4:fis Arabidopsis 6289057 74.5
124 Hap5 wdk2c.pk009.e4:fis Arroz 5257260 20.0
126 Hap5a Contig de: Arabidopsis 9758288 19.7 wlm96.pk036.j11 wlm96.pk060.d5:fis 128 Hap5c wle1n.pk0076.h7:fis Arroz 5257260 82.0
130 Led eas1c.pk003.e16 Arabidopsis 9758795 49.2
132 Led fds1 n.pk008.m14 Arabidopsis 9758795 46.1
134 Led p0015.cdpg75rb:fis Arabidopsis 9758795 45.4
136 Led p0083.clder12r:fis Arabidopsis 6552738 35.2
138 Led pps1c.pk002.H 9 Arabidopsis 9758795 45.2
140 Led Contig de: Arabidopsis 9758795 47.4
142 Led scb1c.pk004.j10 Arabidopsis 9758795 52.2
144 Led sel .pk0042.d8:fis Arabidopsis 9758795 43.7
146 Led se2.1 1d12:fis Arabidopsis 9758795 53.1
148 Led ses2w.pk0015.a4:fis Arabidopsis 9758795 36.7
150 Led- vs1 n.pk013.m13:fis Zea mays 22380 44.7
152 CCAAT Wdk3c.pk023.h15:fis Arabidopsis 6729485 57.7
Led- ect1c.pk007.p18:fis CCAAT fds.pk0003.h5:fis 76
TABLA 3 (continuación)
SEQ ID Nombre del Clon Homólogo Genbank # pLOG
NO. gen 154 Led-CCAAT eef1c.pk004.c8:fis Zea mays 22380 61.7
156 Led-CCAAT cbn10.pk0005.e6:fis Zea mays 22380 72.2
158 Led-CCAAT p0006.cbysa51r:fis Arabidopsis 2244810 55.5
160 Led-CCAAT rl0n.pk0061.c8:fis Zea mays 22380 46.5
162 Led-CCAAT rs!1n.pk002.g10:fis Zea mays 22380 68.7
164 Led-CCAAT ses4d.pk0037.e3:fis Arabidopsis 2398529 49.0
166 Led-CCAAT src2c.pk003.¡13:f¡s Arabidopsis 3738293 41.1
168 Led-CCAAT src2c.pk011.m12:fis Arabidopsis 6729485 62.0
170 Led-CCAAT src2c.pk025.b3:fis Zea mays 22380 45.5
172 Led-CCAAT src3c.pk028.j21:fls Zea mays 22380 54.3
174 Led-CCAAT wkm1c.pk0002.d7:fis Zea mays 22380 79.5
176 Led-CCAAT wlk8.pk0001.e10:fis Arabidopsis 2398529 52.7
178 Led-CCAAT wlm96.pk037.k9:fis Zea mays 22380 73.5
206 Led rice genome seq Oryza sativa 7378310 180
208 Hap2 ncs.pk0013.c4:fis Arabidopsis 9293997 46.7
210 Hap2 p0117.chcln94r:fis Oryza sativa 1489565 26.0
212 Hap2 rdi2c.pk011.f19:fis Oryza sativa 1489565 45.0
214 Hap2 sfl1.pk0101.g7:fis Vitis sp. 7141243 38.4
216 Hap2 wdi1c.pk002.b10:fis Oryza sativa 1489565 40.3
221 Hap5 sgs4c.pk004.j2:fis Arabidopsis 15223482 69.0
Se determinó la secuencia del inserto de ADNc completo en los clones listados en la tabla 3. La secuenciación y búsquedas adicionales de la base de datos propiedad de DuPont permitieron una identif cación de otros clones de maíz, arroz, soya y/o trigo que codifican para polipéptidos implicados en alterar fenotipos de aceite . La búsqueda BLASTX usando las secuencias de clones listados en la tabla 4 reveló similitud de los polipéptidos codificados por las diferentes moléculas de ADNc de especies vegetales y fúngicas (indicadas por su No. Identificador General de NCBI en las tablas 3 y 4) . En la tabla 4 se muestran los resultados BLAST para ESTs individuales ( "EST" ) , las secuencias de los insertos de ADNc completos que comprenden los clones de ADNc indicados ("FIS") , las secuencias de contigs ensamblados de dos o más ESTs ("Contig"), secuencias 77
de contigs ensamblados de un FIS y uno o más ESTs ("Contig*") , o secuencias que codifican para una proteína completa derivada de un FIS, un contig, o un FIS y PCR ("CGS") : Tabla 4 Identidad porcentual de secuencias de aminoácidos deducidas de las secuencias de nucleótidos de clones ADNc que codifican para polipéptidos homólogos a polipeptidos implicados en alterar fenotipos de aceite en plantas
SEQ ID NO. No. de Acceso (SEQ ID NO) Identidad porcentual 2 1586551 (187) 23.4% 4| 7489565 (181) 27.4% 6 11282597 (179) 22.1% 10 7489565 (181) 36.1% 12 7489565 (181) 67.2% 14 7489565 (181) 70.6% 16 7489565 (181) 33.2% 18 6634774 (182) 40.1% 20 6634774 (182) 389.1% 22 7489565 (181) 28.2% 24 7489565 (181) 53.2% 26 7489565 (181) 34.0% 28 7489565 (181) 39.5% 30 7489565 (181) 39.5% 32 7489565 (181) 35.5% 34 4587559 (202) 54.1% 36 7489565 (181) 67.2% 38 7489565 (181) 29.0% 40 9293997 (217) 31.5% 42 5903072 (184) 35.3% 46 5903072 (184) 33.7% 48 7141243 (180) 34.5% 50 7489565 (181) 35.7% 52 7489565 (181) 27.2% 54 8778470 (185) 40.5% 56 7889565 (181) 22.1% 58 2398521 (186) 49.1% 60 7141243 (180) 40.9% 62 1586551 (187) 37.8% 64 6634774 (182) 49.2% 66 6714441 (188) 32.5% 68 7489565 (181) 32.4% 70 7489565 (181) 31.1% 78
Tabla 4 (continuación)
SEQ ID NO. No. de Acceso (SEQ ID NO) Identidad porcentual 72 9293997 (217) 40.6% 74 7489565 (181 ) 68.5% 76 6634774 (182) 36.5% 78 6714441 (188) 23.7% 80 7489565 (181 ) 34.5% 82 7489565 (181 ) 37.4% 84 5257260 (189) 62.9% 94 3776575 (191 ) 60.0% 96 5257260 (189) 62.7% 98 5257260 (189) 75.0% 100 5257260 (189) 77.5% 102 6523090 (190) 53.8% 04 6289057 (192) 50.6% 106 3776575 (191 ) 52.1 % 108 5257260 (189) 77.9% 110 6523090 (190) 70.3% 1 12 6523090 (190) 70.7% 1 14 3776575 (191 ) 35.7% 116 6289057 (192) 53.2% 1 18 6289057 (192) 52.8% 120 6056368 (193) 73.0% 122 6289057 (192) 57.1 % 124 5257260 (189) 27.3% 126 9758288 (194) 46.3% 128 5257260 (189) 74.9% 130 9758795 (196) 49.0% 132 9758795 (196) 49.7% 134 9758795 (196) 49.8% 136 6552738 (195) 38.9% 208 9293997 (217) 34.9% 210 7489565 (218) 28.6% 212 7489565 (218) 35.7% 214 7141243 (219) 42.3% 216 7489565 (218) 34.9% 221 15223482 (222) 64.8% Las alineaciones de secuencia y los cálculos de identidad porcentual se llevaron a cabo usando el programa Megalign de la oficina de cómputo de bioinformática LASERGENE 79
(DNASTAR Inc., Madison, WI) . La alineación múltiple de las secuencias se llevó a cabo usando el método de alineación Clustal (Higgins y Sharp (1989) CABIOS. 5:151-153) con los parámetros por omisión (GAP PENALTY=10, GAP LENGTH PENALTY=10) . Los parámetros por omisión para las alineaciones por pares usando el método Clustal fueron KTUPLE 1, GAP PENALTY=3 , WIND0W=5 y DIAGONALS SAVED=5. Las alineaciones de secuencia y puntuaciones y probabilidades BLAST indican que los fragmentos de ácido nucleico que comprenden los presentes clones de ADNc codifican para una porción sustancial de moléculas de ADNc a proteína cinasas receptoras, homólogos MEK3 , homólogos Hap2, homólogos LIP15, proteínas de calcio EF-mano, ATP citrato liasa, proteínas de metabolismo de glucosa tales como homólogos SNF1, factores de transcripción de Lecl y factores de transcripción regulados en desarrollo de semilla tales como homólogos CKC (tipo Aintegumenta) . Ejemplo 4 Expresión de construcciones de ADN recombinante en células de monocotiledóneas Puede construirse una construcción quimérica que comprenda un ADNc que codifique para los presentes polipéptidos en orientación de sentido con respecto al promotor del gen de zeina de maíz de 27kD que se localiza 5' hacia el fragmento de ADNc y la zeina de lOkD del extremo 3' que se localiza 3' hacia el fragmento de ADNc. El fragmento 80
de ADNc de este gen puede generarse mediante reacción en cadena de polimerasa (PCR) del clon de ADNc usando cebadores de oligonucleótidos adecuados. Los sitios de clonación (Ncol o Smal) pueden incorporarse en los oligonucleótidos para proporcionar la orientación adecuada del fragmento de ADN cuando sea insertado en el vector digerido pML103 como el descrito abajo. La amplificación se lleva a cabo después en una PCR estándar. EL ADN amplificado se digiere después con enzimas de restricción Ncol y Smal y fraccionado en un gel de agarosa. La banda adecuada puede ser aislada del gel y combinada con un fragmento Ncol-Smal de 4.9 kb del plásmido pML103. El plásmido pML103 ha sido depositado bajo los términos del Tratado de Budapest en la ATCC (Colección Americana de Tipos de Cultivos 10801 University Blvd. , Manassas, VA 20110-2209) , y porta el número de acceso ATCC 97366. El segmento de ADN de p L 103 contiene un fragmento promotor de Sall-Ncol de 1.05 kb del gen de zeina de maíz de 27 kD y un fragmento Smal-Sall de 0.96 kb del extremo 3' del gen de zeina de maíz de 10 kD en el vector pGem9Zf(+) (Promega) . El vector y el ADN de inserto se pueden ligar a 15°C durante la noche, esencialmente como se describió (Maniatas) . El ADN ligado se puede usar después para transformar azul XL1 de E. coli (Epicurian Coli XL-1 Blue™; Stratagene) . Los transformantes bacterianos se pueden tamizar mediante digestión con enzimas de restricción de ADN 81
plasmídico y análisis de secuencias de nucleótidos limitado usando el método de terminación de cadena didesoxi (Equipo de Secuenciación de ADN Sequenase™; U.S. Biochemical) . La construcción plasmídica resultante comprendería una construcción quimérica que codificara, en la dirección 5' a 3', para el promotor de zeina de maíz de 27 kD, un fragmento de ADNc que codificara para los presentes polipéptidos y la región 3' de zeina de 10 kD. La construcción de ADN recombinante descrita arriba se puede introducir después en células de maíz mediante el siguiente procedimiento. Embriones de maíz inmaduros pueden ser diseccionados de cariopsis en desarrollo derivadas de cruzas de líneas de maíz reproducidas H99 y LH132. Los embriones se aislan 10 a 11 días después de la polinización cuando miden 1.0 a 1.5 mm de largo. Los embriones se ponen después con el lado del eje mirando hacia abajo y en contacto con medio N6 solidificado con agarosa (C u et al. (1975) Sel. Sin. Peking 18 : 659-668) . Los embriones se mantienen en la oscuridad a 27°C. El callo embrionario friable que consiste en masas no diferenciadas de células con proembrioides somáticos y embrioides que crecieron sobre estructuras suspensoras prolifera del escutelo de estos embriones inmaduros. El callo embriogénico aislado del explante primario puede ser cultivado sobre medio N6 y subcultivado sobre este medio cada 2 a 3 semanas .
82
El plásmido, p35S/Ac (obtenido del Dr. Peter Eckes, Hoechst Ag, Frankfurt, Alemania) se puede usar en experimentos de transformación para proporcionar un marcador seleccionable . Este plásmido contiene el gen Pat (véase publicación de patente europea 0 242 236) que codifica para fosfinotricina acetil transferasa (PAT) . La enzima PAT confiere resistencia a inhibidores de glutamina sintetasa herbicida tales como fosfinotricina . El gen pat en p35S/Ac está bajo el control del promotor 35S del Virus del Mosaico de la Coliflor (Odell et al., (1985) Nature 313:810-812) y la región 3' del gen de nopalina sintasa del ADN-T del plásmido Ti de Agrobacterium tumefaciens. El método de bombardeo de partículas (Klein et al. (1987) Nature 327:70-73) se puede usar para transferir genes a las células de cultivo de callo. De acuerdo con este método/ partículas de oro (con un diámetro de 1 µt?) son recubiertas con ADN usando la siguiente técnica. Diez µe$ de moléculas de ADN plasmídico se añaden a 50 L de una suspensión de partículas de oro (SO mg por mL) . Se añade a las partículas cloruro de calcio (50 ^L de una solución 2.5 M) y base libre de spermidina (20 iL de una solución 1.0 M) . La suspensión se vortexea durante la adición de estas soluciones. Luego de 10 minutos, los tubos se centrifugan brevemente (5 seg. a 15,000 rpm) y el sobrenadante se remueve. Las partículas se resuspenden en 200 /L de etanol 83
absoluto, se centrifugan de nuevo y el sobrenadante se remueve. El enjuague con etanol se lleva a cabo de nuevo y las partículas son resuspendidas en un volumen final de 30 µ de etanol. Una alícuota (5 /¿L) de las partículas de oro recubiertas con ADN puede colocarse en el centro de un disco volador Kapton™ (Bio-Rad Labs) . Las partículas se aceleran después en el tejido de maíz con un BiolisticTM PDS-1000/He (Bio-Rad Instruments, Hercules CA) , usando una presión de helio de 70 kg/cm2 (1000 psi) , una distancia de espacio de 0.5 cm y una distancia de vuelo de 1.0 cm. Para el bombardeo, el tejido embriogénico se coloca sobre papel filtro en medio N6 solidificado con agarosa. El tejido se coloca como una capa delgada y se cubre un área circular de aproximadamente 5 cm de diámetro. La caja de petri que contiene el tejido se puede colocar en la cámara del PDS-1000/He aproximadamente 8 cm de la malla de detención. El aire en la cámara se evacúa después a un vacío de 711 milímetros de Hg. El macroportador se acelera con una onda de choque de helio usando una membrana de ruptura que estalla cuando la presión de helio en el tubo de choque alcanza 70 kg/cm2 (1000 psi) . Siete días después del bombardeo el tejido puede ser transferido a medio N6 que contenga bialofos (5 mg por litro) y que carezca de caseína o prolina. El tejido continúa creciendo lentamente sobre este medio. Después de 84
dos semanas adicionales el tejido puede ser transferido a medio N6 fresco que contenga bialofos. Luego de 6 semanas, las áreas de aproximadamente 1 cm de diámetro de callo activamente creciente pueden identificarse sobre algunas de las placas que contienen el medio complementado con bialofos. Estos callos pueden continuar creciendo cuando sean subcultivados sobre el medio selectivo. Las plantas pueden ser regeneradas del callo transgénico al transferir primero racimos de tejido a medio N6 complementado con 0.2 mg por litro de 2,4-D. Después de dos semanas el tejido puede ser transferido a medio de regeneración (Fromm et al. (1990) Bio/Technology 8:833-839). Ejemplo 5 Expresión de construcciones de ADN recombinantes en células dicotiledóneas Un cásete de expresión especifico de semilla compuesto del promotor y terminador de traducción del gen que codifica para la subunidad ß de la proteína de almacenamiento de semilla faseolina del haba Phaseolus vulgaris (Doyle et al. (196) J. Biol. Che . 251:9228-9239) se puede usar para la expresión de los presentes polipéptidos en soya transformada. El cásete de faseolina incluye aproximadamente 500 nucleótidos hacia el extremo cinco prima (5') desde el codón de inicio de traducción y aproximadamente 1650 nucleótidos hacia el extremo tres prima (3') desde el codón de detención 85
de traducción de faseolina. Entre las regiones 5' y 3' están los sitios de endonucleasa de restricción únicos Neo I (que incluye el codón de inicio de traducción ATG) , Sma I, Kpn I y Xba I. El cásete completo se flanquea por sitios Hind III. El fragmento de ADNc de este gen se puede generar mediante reacción en cadena de polimerasa (PCR) del clon de ADNc usando cebadores de oligonucleótidos adecuados . Los sitios de clonación pueden incorporarse en los oligonucleótidos para proporcionar la orientación adecuada del fragmento de ADN cuando sea insertado en el vector de expresión. La amplificación se lleva a cabo después como se describió arriba, y el fragmento aislado se inserta en un vector pUC18 que porta el cásete de expresión de semilla. Embriones de soya se pueden transformar después con el vector de expresión que comprende secuencias que codifican para los presentes polipéptidos . Para inducir embriones somáticos, cotiledones, con una longitud de 3-5 mm diseccionados de semillas inmaduras de superficie esterilizada del cultivo de soya A2872, se pueden cultivar en la luz u oscuridad a 26°C sobre un medio de agar adecuado durante 6-10 semanas. Los embriones somáticos que producen embriones secundarios se extirpan después y se colocan en un medio liquido adecuado . Después de la selección repetida de racimos de embriones somáticos que se multiplicaron prematuramente, embriones en etapa globular, las suspensiones 86
se mantienen como se describe abajo. Los cultivos de suspensión embriogénica de soya se pueden mantener en 35 mL de medio líquido sobre un agitador giratorio, 150 rpm, a 26°C con luces fluorescentes en un programa día/noche de 16:8 horas. Los cultivos se subcultivan cada dos semanas al inocular aproximadamente 35 mg de tejido en 35 mL de medio liquido. Los cultivos de suspensión embrionaria de soya se pueden transformar después mediante el método de bombardeo con pistola de partículas (Klein et al. (1987) Na.tu.re (Londres) 237:70-73, patente de E.U.A. No. 4.945,050). Un instrumento DuPont Biolistic™ PDS1000/HE (modificación con helio) se puede usar para estas transformaciones. Un gen marcador seleccionable que se puede usar para facilitar la transformación de soya es una construcción de ADN recombinante compuesta del promotor 35S del Virus del Mosaico de la Coliflor (Odell et al. (1985) Nature 313:810-812) , el gen de higromicina fosfotransferasa del plásmido pJR225 (de E. coli; Gritz et al. (1983) Gene 25:179-188) y la región 3' del gen de nopalina sintasa del ADN-T del plásmido Ti de Agrrojbacterium tumefaciens. El cásete de expresión de semilla que comprende la región 5' de faseolina, el fragmento que codifica para los presentes polipéptidos y la región 3' de faseolina, se puede aislar como un fragmento de restricción. Este fragmento puede insertarse después en un 87
sitio de restricción único del vector que porte el gen marcador . A 50 µ?? de una suspensión de 60 mg/mL de partículas de oro de 1 µp? se le añade (en orden) : 5 f¡L de ADN (1 /g/ L) , 20 /¿L de espermidina (0.1 ) , y 50 //L de CaCl2 (2.5 M) . La preparación de partículas se agita después durante tres minutos, se centrifuga en una microcentrífuga durante 10 segundos y el sobrenadante se remueve. Las partículas recubiertas con ADN se lavan después una vez en 400 /¿L de etanol al 70% y se resuspenden en 40 µL de etanol anhidro. La suspensión de ADN/partículas puede ser sonificada tres veces durante un segundo cada una. Cinco µL de las partículas de oro recubiertas con ADN se cargan después sobre cada disco macroportador. Aproximadamente 300-400 mg de un cultivo de suspensión de dos semanas de edad se colocan en una caja de petri de 60x15 mm vacía y el líquido residual se remueve del te ido con una pipeta. Para cada experimento de transformación, aproximadamente 5-10 placas de tejido se bombardean normalmente. La presión de ruptura de la membrana se ajusta a 77.33 kg/cm2 (1100 psi) y la cámara se evacúa a un vacío de 711 milímetros de mercurio. El tejido se coloca aproximadamente 8.89 centímetros lejos de la pantalla de retención y se bombardea tres veces. Después del bombardeo, el tejido puede ser dividido a la mitad y puesto de nuevo en 88
liquido y cultivarse como se describió arriba. Cinco a siete días después del bombardeo, el medio liquido se puede intercambiar por medio fresco, y once a doce dias después del bombardeo con medio fresco que contenga 50 mg/mL de higromicina. Este medio selectivo se puede refrescar semanalmente . Siete a ocho semanas después del bombardeo, tejido verde y transformado puede ser observado creciendo a partir de racimos embriogénicos necróticos no transformados. El tejido verde aislado se remueve y se inocula en matraces individuales para generar nuevos cultivos de suspensión embrionarios transformados y clonalmente propagados. Cada línea nueva se puede tratar como un evento de transformación independiente. Estas suspensiones pueden después subcultivarse y mantenerse como racimos de embriones inmaduros o regenerase en plantas enteras mediante la maduración y germinación de embriones somáticos individuales . Ejemplo 6 Vector de expresión para la transformación de plantas mediante bombardeo con pistola de partículas Se usó un cásete de expresión de gen específico de semilla para hacer construcciones de ADN reco binantes para la expresión de genes candidatos en maíz. El cásete de expresión está compuesto del promotor de oleosina de 0.9 kb, el intrón 1 del gen de 1 contraído del maíz y el exón adyacente (Vasil et. al., 1989, Plant Physiol 91:1575-1579;
89
axarenhas et al., 1990, Plant Mol Biol 15:913-920) y la región de terminación de transcripción 3' del gen de nopalina sintasa (Nos) . Entre el exón adyacente al gen 1 contraído y el gen de nopalina sintasa (Nos) están los sitios de endonucleasa de restricción únicos Mfel y Xmal . A este vector se le ha designado pBN256 (patente de referencia de Jennie Shen) . pMUT256 se refiere a un plásmido pBN256 en el cual un sitio EcoRI ha sido removido mediante mutagénesis dirigida a sitio. Una versión modificada de pMUT256, designada pMUT256e, fue modificada mediante la adición de un sitio de clonación múltiple sintético. El polienlazador sintético se generó al fijar los oligonucleótidos (5'-acagtacagtacagtacagtacagt-3 ' ) y (5'-actgtactgtactgtacgtgactgt-3' ) [SEQ ID Nos: 430 y 431, respectivamente] y subclonar posteriormente en el pMut256 abierto con Mfel y Xmal . Casetes de expresión/vectores adicionales se describirán con referencia a los ejemplos específicos en donde han sido usados (véase abajo) . Ejemplo 7 Aislamiento y clonación de genes candidatos en vectores de expresión de planta específicos de embrión HAP3/LEC1 (Proteína 3 activada por Heme/cotiledón frondoso 1 Un clon de longitud completa (p0015. cdpgp75rb, SEQ ID NOs : 263) para el homólogo de maíz del gen HAP3/Lecl se obtuvo de la base de datos Dupont/Pioneer EST. El ORF de 90
HAP3/Lecl de maíz (un fragmento Sall/Hapal de Ikb, solicitud de PCT No. WO 00/28058, publicada el 18 de mayo de 2000) fue movido en un cásete de expresión que contenía un promotor de oleosina de maíz (un fragmento BamHl/Xhol de 0.9 kb, solicitud de PCT No. WO 99/64579 publicada el 16 de diciembre de 1999) y una secuencia de poliadenilación del gen de nopalina sintasa de Agrobacterium. Este cásete de expresión se subclonó después adyacente a un cásete de expresión 35S::Bar (Sidorenko et al (2000) Plant J 22 :471-482) . Los casetes de expresión resultantes flanqueados por secuencias de límite de ADN-T fueron movilizados después en el vector "super-binario" de Agrobacterium (Komari, 1990) usando electroporación. Se hicieron construcciones adicionales para conférir patrones de expresión diferentes de aquellos obtenidos con el promotor de oleosina. Un promotor de ubiquitina (UBI, Christensen et al (1992) Plant Mol Biol 18:65-680), un promotor de proteína de transferencia de lípidos (LTP) (patente de E.U.A. No. 5,525,716), y un promotor de zeina gama (GZP) (Boronat et al (1986) Plant Science 47:95-102) fueron fusionados cada uno a Lecl como se describió arriba para el promotor de oleosina. Las dos unidades de transcripción, LTP-Lecl y GZP-Lecl, fueron combinadas en una construcción de expresión cerca de la construcción de expresión 35S:Bar y flanqueada por las secuencias de límite de ADN-T (como las descritas arriba) .
91
HAP2 (Proteina 2 activada por heme) Un clon de longitud completa (cholc.pk006.bl4, un ADNc 30 nucleótidos más corto que cholc .pk004.bl9 :fis, mostrado en SEQ ID NO: 27) para el homólogo de maíz del gen ???2 se obtuvo de la base de datos Dupont/Pioneer EST. El fragmento Apol/Apal de 1.1 kb de cholc.pk006.bl4 fue aislado y subclonado en pMUT256e abierto mediante digestión con EcoRl/Apal. Un clon fue seleccionado para la transformación de maíz mediante análisis de enzima de restricción para un tamaño de inserto correcto. Los artefactos de subclonación se excluyeron mediante una secuencia 5' y 3' de los límites de inserto de vector. ???5 (Proteína 5 activada por heme) : Un clon de longitud completa (cholc .pkOOl .123 , mostrado en SEQ ID NO: 113) para el homólogo de maíz del gen ???5 se obtuvo de la base de datos Dupont/Pioneer EST. El fragmento EcoRl/Apal de 1.1 kb de cholc .pkOOl .123 fue aislado y subclonado en pMÜT256e abierto mediante digestión con EcoRl/Apal. Se seleccionó un clon para la transformación de maíz después del análisis de digestión de restricción para el tamaño de inserto correcto. Artefactos de subclonación fueron excluidos mediante una secuencia 5' y 3' de los límites de inserto de vector. Ejemplo 8 Transformación de embriones inmaduros mediante bombardeo de partículas y regeneración de plantas de maíz Embriones de maíz inmaduros de plantas donadoras 92
invernadero se bombardean con un plásmido que contiene el gen de la invención ligado operablemente a un promotor débil, tal como el promotor nos, o un promotor inducible, tal como In2 , más un plásmido que contiene el gen marcador seleccionable PAT (Wohlleben et al (1988) Gene 70:25-37) que confiere resistencia al herbicida Bialafos. La transformación se lleva a cabo como sigue. Las mazorcas se esterilizan en superficie en 30% de blanqueador Cloral más 0.5% de detergente Micro durante 20 minutos, y se enjuagan dos veces con agua estéril. Los embriones inmaduros se extirpan y se colocan con el eje del embrión boca abajo (el lado del escutelo hacia arriba) , 25 embriones por placa. Éstos son cultivados sobre medio 560 L cuatro días antes del bombardeo en la oscuridad. El medio 560 L es un medio a base de N6 que contiene vitaminas de Eriksson, tiamina, sacarosa, 2,4-D y nitrato de plata. El día del bombardeo, los embriones son transferidos a medio 560 Y durante cuatro horas y se disponen dentro de una zona objetivo de 2.5 cm. El medio 560? es un medio osmótico alto (560 L con alta concentración de sacarosa) . Se construye un vector plasmídico que comprende el gen de la invención ligado operablemente al promotor seleccionado. Este ADN plasmídico más ADN plasmídico que contiene un marcador seleccionable PAT se precipitan sobre gránulos de tungsteno de 1.1 µt (diámetro promedio) usando un procedimiento de precipitación por CaCl2 como sigue: 100 µ? de 93
partículas de tungsteno preparadas en agua, 10 µ? (1 ^g) de ADN en regulador de pH TrisEDTA (1 µg total) , 100 µ? de CaCl2 2.5 M, 10 µ? de espermidina 0.1 M. Cada reactivo se añade secuencialraente a la suspensión de partículas de tungsteno, mientras se mantiene en el vortexor de tubos múltiples. La mezcla final se sonifica brevemente y se deja incubar bajo vortexeo constante durante 10 minutos. Después del periodo de precipitación, los tubos se centrifugan brevemente, se remueve el liquido, se lavan con 500 mi de etanol al 100% y se centrifugan durante 30 segundos. Nuevamente se remueve liquido y 105 µ? de etanol al 100% se añaden al gránulo de partícula de tungsteno final . Para el bombardeo con pistola de partículas, las partículas de tungsteno/ADN se sonifican brevemente y 10 µ? se colocan sobre el centro de cada microportador y se les deja secar durante aproximadamente dos minutos antes del bombardeo . Las placas de muestra se bombardean a nivel #4 en la pistola de partículas #HE34-1 o #HE24-2. Todas las muestras reciben un solo disparo a 45.7 kg/cm2 (650 PSI) , con un total de diez alícuotas tomadas de cada tubo de partículas/ADN preparados. Después del bombardeo, los embriones se mantienen sobre medio 560Y, un medio a base de N6 , durante dos días, luego se transfiere a medio de selección 560R, un medio a base de N6 que contiene 3 mg/litro de Bialafos, y se subcultivan cada dos semanas. Después de aproximadamente 10 semanas de selección, los 94
clones de callo resistentes a la selección se muestrean para PCR y la actividad del gen de interés. Las líneas positivas se transfieren a medio 288J, un medio a base de N6 con niveles más bajos de sacarosa y hormonas, para iniciar la regeneración de la planta. Después de la maduración del embrión somático (2-4 semanas) , los embriones somáticos bien desarrollados se transfieren a medio para su germinación y se transfieren al cuarto de cultivo iluminado . Aproximadamente 7-10 días más tarde, las plántulas en desarrollo se transfieren a medio en tubos durante 7-10 días hasta que las plántulas estén bien establecidas. Las plantas se transfieren después a insertos en recipientes planos (equivalentes a macetas de 63.5 mm) que contienen tierra de siembra y se cultivan durante una semana en una cámara de crecimiento, posteriormente se cultivan 1-2 semanas adicionales en el invernadero, luego se transfieren a macetas 600 clásicas (4.45 litros) y se cultivan hasta la madurez. Las plantas se monitorean para verificar la expresión del gen de interés . Ej emplo 9 Transformación de callo y regeneración de plantas de maíz - pistola de partículas Aislamiento y mantenimiento de callo tipo II Después de 10-21 días, callo tipo II es iniciado desde el escutelio y aparece como un brote embrionario friable de células que se dividen rápidamente . El callo se 95
subcultiva cada 5-10 días y se mantiene sobre medio N6 complementado con 1 mg/L de 2,4-D (CM) . Estos cultivos se usan en experimentos de transformación de 5 a 12 semanas después del inicio. Preparación de callo para transformación Callo tipo II proembriogénico se transfiere a un papel filtro Whatman #4 sobre medio CM. Las placas CM con callo se envuelven con película de parafina y se incuban en la cámara de crecimiento Conviron oscura (45% de humedad, 27-28°C) durante dos días antes del bombardeo. Antes del bombardeo, las placas osmóticas se dejan parcialmente entreabiertas durante 30 minutos en la cámara de flujo laminar para permitir que la humedad sobre el tejido se disipe . Preparación de partículas de oro Sesenta mg de oro de 0.6 mieras se ponderan en un tubo Eppendorf siliconizado (Microtubos Axgen - tubo transparente de 1.7 mi). El tubo se deja estacionario durante 15 minutos y se centrifuga. La pella se enjuaga con agua estéril tres veces más. Posteriormente, un mi de agua estéril se añaden a la pella de oro y se vortexea durante 10 minutos. Las partículas de oro se dividen en alícuotas de 50 ul. Preparación de ADN/oro Cincuenta µ? de oro de 0.6 mieras en H20 dd 96
estéril. Una relación molar 2:1 de gen de característica :gen de barra (normalmente ~5-10 ug en ADN total) se añade y se vortexea. Posteriormente, cincuenta /¿L de CaCl2 2.5 M se añaden rápidamente a la suspensión y se vortexean seguidos por la adición de 20 /¿L de espermidina 0.1 M y se votexea y centrifuga. La pella se juega 3x en 100% de etanol . La pella se resuspende suavemente al inclinar el lado del tubo Eppendorf varias veces . La preparación de ADN se almacena en el congelador a 20°C. Carga del macropotador La preparación de ADN/oro se descongela y se sonifica (2 golpes) en el limpiador Granson 200 Ultrasonic antes de la adición a los microportadores . La suspensión se mezcla bien mediante pipeteo hacia adentro y hacia afuera. Inmediatamente, 6 µ? de suspensión de ADN/oro se dispensan rápidamente al centro de cada macroportador. Una vez que la preparación de ADN se seca sobre el macroportador, la pistola PDS-100/He se usa para bombardear las células de callo de maíz con las partículas de oro recubiertas con ADN. Parámetros de pistola de partículas Las placas que contienen callo se bombardean después con la pistola PDS-1000/He usando los siguientes parámetros: 1) ADN precipitado sobre partículas de oro de 0.6 µ?; 2) distancia de 8 cm desde la pantalla de detención; 3) vacío de 685-736 milímetros de mercurio; 4) 73.8-77.3 kg/cm2 97
(1050-1100 PSI) de presión de He. Selección de lineas de callo transgénicas Después de 3-4 días de incubación en la cámara oscura el callo se transfiere (fragmentos de 3-4 mm) a medio que contiene 3-5 ppm de bialafos (SM3 o SM5) . Las placas SM se incuban en la oscuridad a 27°C durante alrededor de 7-14 días. Posteriormente, todo el callo se transfiere sobre SM (5 ppm de bialafos) manteniendo el rastro de líneas únicas como arriba. Cada fragmento puede ser dividido en varias piezas en esta transferencia. Regeneración de plantas de maíz transgénicas Los eventos de callo se aislan sobre medio SM fresco, se muestrean para PCR (reacción en cadena de polimerasa) y se ponen sobre un medio de regeneración de primera etapa (RM31) . Después de 10-14 días, el callo proembriogénico se transfiere sobre placas RM3 frescas y se coloca en la cámara de luz a 26°C. Plántulas de aproximadamente 2-3 cm se remueven y se transfieren a tinas de medio RM4. Después de 1-2 semanas las plantas de RM4 se colocan hasta un máximo de dos plántulas por maceta. Las macetas se ponen después en la cámara de crecimiento Conviron (fotoluz = 20 horas, humedad = 65%, temperatura = 24°C) y se riegan con solución Roots2. Las plantas (~20 cm de alto) se prueban para verificar la expresión del gen jar al llevar a cabo una prueba de limpieza basta al 2%.
98
Ejemplo 10 Análisis del contenido de ácido graso y composición mediante cromatografía de gas (GC) La determinación de ácido graso (FA) se hizo a partir de un total de 300-400 mg de tejido liofilizado durante 24 horas. El tejido fue después molido usando un molino FastPrep (BiolOl) a 4.5 de velocidad y 20 segundos en presencia de 0.5 mi de ácido sulfúrico al 2.5% + metanol al 97.5% y ácido heptadecanoico (17:0, solución de 10 mg/ml en tolueno) como una norma externa. Más adelante, otros 0.5 mi de ácido sulfúrico al 2.5% + metanol al 97.5% se usaron para lavar cada tubo e incubar en 95°C durante una hora para la transesterificación. Los tubos se remueven después del baño de agua y se les deja enfriar a la temperatura ambiente. Los FAs fueron extraídos en un volumen de heptano:H20 (1:1) y fueron clarificados mediante centrif gación. El sobrenadante (50 ul) que contenía los ésteres metílicos de ácido graso se cargó en un cromatófrafo de gas Hewlett Packard 6890 equipado con una columna Omegawax de 30 m x 0.32 mm y los picos separados se analizaron y caracterizaron. Ejemplo 11 La sobreexpresión de Lecl lleva a la acumulación de ácido graso alterada en embriones somáticos de maíz El promotor de ubiquitina (Christensen et al (1992) Plant Mol Biol 18: 675-89) se usó para conducir la expresión 99
de Hap3/Lecl (descrita en el ejemplo 7) en callo embrionario de maiz para probar qué fenotipo se originaría a partir de la sobreexpresión de Lecl en embriones somáticos. La transformación de la construcción en callo embrionario de maíz y la generación de embriones somáticos se describe en el ejemplo 9. Más de diez eventos diferentes fueron analizados mediante GC para el contenido/composición de ácido graso y se les comparó con controles transformados con el plásmido marcador seleccionable (gen BAR) solo. Un fondo de tres embriones cada uno de XX eventos diferentes mostró que los embriones somáticos que sobreexpresaban Lecl contienen un contenido elevado de ácido graso (un incremento promedio de 119% sobre el control) sin alteración significativa en la composición de ácido graso cuando se le compara con los embriones- somáticos de control (figura 1) . Ejemplo 12 Análisis de resonancia magnética nuclear (R ) Las semillas son embebidas en agua destilada durante 12-24 horas a 4°C. El embrión se disecciona y se almacena en una placa de 48 pocilios. Las muestras se liofilizan durante en un liofilizador Virtis 24x48. La RMN (Process Control Technologies - PCT (Ft. Collins, CO) se establece según las instrucciones del fabricante. La RMN se calibra usando una serie de tubos de RMN de 5 mm que 100
contienen cantidades medidas precisamente de aceite de maiz (Mazóla) . Los parámetros de calibración son 3, 6, 9, 12, 15, 18, 21, 27, 33 y 40 mg o aceite. Ejemplo 13 La sobreexpresion de Lee 1 lleva a una acumulación de aceite alterada en granos de maíz La construcción de expresión Hap3/Lecl con el promotor de oleosina (descrito en el ejemplo 7) fue introducida en maíz para probar qué fenotipo se originaría de la sobreexpresion específica de semilla. La transformación de la construcción en maíz se logró usando Agrobacteríum tumefaciens como sigue. Embriones de maíz inmaduros recién aislados, alrededor de 10 días después de - la polinización (DAP) , se incuban con el AgrroJbacterium. El genotipo preferido para la transformación es el fenotipo Hi-11 altamente transformable (Armstrong, C.L. , 1991, Development and Availability of Germplasm with High Type II Culture Formation Response, Maize Genetics Cooperation Newsletter, 75:92-93). Un híbrido Fi creado al cruzar un Hi-II con un cultivo de primera categoría también puede usarse. Después del tratamiento con Agrobacteríum de embriones inmaduros, los embriones se cultivan sobre medio que contiene niveles tóxicos de herbicida. Sólo las células que reciben el gen de resistencia a herbicida y los genes ligados, crecen sobre medio 101
selectivo. Los eventos transgénicos seleccionados de esta manera se propagan y regeneran a plantas enteras, producen semilla y transmiten transgenes a la progenie . El Agrobacterium turnefaciens LBA4 04 manipulado se construye según la patente de E.U.A. No. 5,591,616 para contener los genes ligados y el gen marcador seleccionable . Típicamente, ya sea BAR (D'Halluin et al (1992) Methods Enzy ol. 216:415-426) o ??? (Wohlleben et al (1988) Gene 70:25-37) pueden usarse. Para usar el vector manipulado en transformación de plantas, una placa maestra de colonias bacterianas individuales se prepara primero al inocular las bacterias sobre medio AB mínimo y luego incubando la placa de bacterias invertida a 28°C en la oscuridad durante tres días. Una placa de trabajo se prepara después al seleccionar una sola colonia de la placa de medio A mínimo y rayándola a través de una placa de medio YP. La placa bacteriana de medio YP se incuba después invertida a 28°C en la oscuridad durante 1-2 días. Agrobacterium para la transfección y co-cultivo de plantas se prepara un día antes de la transformación. En 30 mi de medio A mínimo en un matraz se colocan 50 /zg/ml de espectinomicina (o antibiótico bacteriano adecuado dependiendo del marcador en co-integrado) , 100 µ? de acetosiringona y una cantidad de aproximadamente 1/8 de Agrobacterium de una placa de trabajo de uno a dos días de 102
edad. El Agrobacterium se cultiva después a 28°C a 200 rpm en la oscuridad durante la noche (alrededor de 14 horas) . En la fase logarítimica media, el Agrobacterium se cosecha y se resuspende a 3 a 5 X 108 CFU/ml en medio 561Q + 100 µ? de acetosiringona usando técnicas microbianas estándares y curvas estándares . Preparación de embriones inmaduros Nueve a diez días después de la polinización controlada de una planta de maíz, los embriones .inmaduros en desarrollo están opacos, miden 1-1.5 muí de largo y tienen el tamaño adecuado para la Agro-xnfección . Las mazorcas desgranadas se esterilizan en 50% de blanqueador comercial y una gota de Tween durante 30 minutos, y luego se enjuagan dos veces con agua estéril . Los embriones inmaduros se remueven asépticamente de la cariopsis y se colocan en 2 mi de solución de retención estéril que comprende 561Q + 100 µ? de acetosiringona . Infección por Agrobacterium y co-cultivo de embriones Solución de retención se decanta de los embriones inmaduros extirpados y se reemplaza con Agrobacterium preparado. Después del suave mezclado e incubación durante aproximadamente cinco minutos, el Agrobacterium se decanta de los embriones inmaduros. Los embriones inmaduros se mueven después a una placa de medio 562P, la superficie del escutelo mirando hacia arriba, y se incuban a 20°C durante tres horas 103
en la oscuridad seguidos por incubación a 28°C durante tres dias en la oscuridad sobre medio 562P + 100 mg/ml de carbenecilina (véase patente de E.U.A. 5,981,840). Selección de eventos transgenicos Después de la incubación, los embriones inmaduros se transfieren a medio 5630 para la selección de eventos. El ADN de transformación posee un gen de resistencia a herbicida, en este ejemplo el gen PAT, el cual confiere resistencia a bialafos . A intervalos de 10 a 14 días, los embriones se transfieren a medio 5630. El tejido embrionario transgénico putativo en crecimiento activo es visible a las 6-8 semanas. Regeneración de plantas T0 Tejido embrionario transgénico se transfiere a medio 288W y se incuba a 28 °C en la oscuridad hasta que los embriones somáticos maduren, o aproximadamente 10 a 18 días.
Embriones somáticos madurados individuales con escutelo y coleóptilo bien definidos se transfieren a un medio de germinación de 272 embriones y se incuban a 28°C en la luz. Después de que emergen los brotes y raíces, las plantas individuales se colocan en tierra y se endurecen usando métodos hortícolas típicos. Confirmación de la transformación Los eventos transgénicos putativos se someten a análisis para confirmar su naturaleza transgénica. Los 104
eventos se prueban para verificar la presencia de Lecl mediante amplificación por PCR. Además, las plantas T0 se pintan con herbicida bialafos. La falta posterior de lesión por herbicida indica la presencia y acción del gen de resistencia a herbicida. Las plantas se monitorean y califican para la expresión de Lecl y/o fenotipo alterados tales como compuestos de azufre orgánico incrementados. Recetas de medios El medio 5S1 Q contiene los siguientes ingredientes: 950,000 mi de agua D-I, filtrado; 4, 000 g de Sales Básicas Chu (N6) (Sigma C1416) ; 1,000 mi de mezcla de vitaminas Eriksson (lOOOx Sigma-1511) ; 1,250 mi de Tiamina.HCL.4 mg/ml; 3, 000 mi de 2,4-D 0.5 mg/ml (No. 2A) ; 0.690 g de L-prolina; 68,500 g de sacarosa y 36, 000 g de glucosa. Las instrucciones son: disolver los ingredientes en agua desionizada pulida en secuencia; ajustar el pH a 5.2 c/ OH; C.S. a volumen con agua desionizada pulida después de ajustar el pH y esterilizar por filtro (no en autoclave) . El medio 562P contiene los siguientes ingredientes: 950,000 mi de agua D-I, filtrada; 4,000 g de Sales Básicas Chu (N6) (Sigma C-1416) ; 1, 000 mi de mezcla de vitaminas Eriksson (lOOOx Sigma-1511); 1,250 mi de tiamina.HCL .4 mg/ml; 4,000 mi de 2, 4-D 0.5 mg/ml; 0.690 g de L-prolina; 30, 000 g de sacarosa; 3,000 g de Gelrite, el cual se añade después C.S. hasta volumen; 0.425 mi de nitrato de plata 2 mg/ml #; y 105
1, 000 mi de Aceto Syringone 100 mM#. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; ajustar pH a 5.8 c/KOH; C.S. hasta volumen con agua desionizada pulida después de ajustar el pH, y esterilizar y enfriar a 60 °C. Los ingredientes designados con un # se añaden para después de esterilizar y enfriar hasta la temperatura. El medio 563 O contiene los siguientes ingredientes: 950,000 mi de agua D-I, filtrada: 4,000 g de sales básicas Chu (N6) (Sigma C-1416) ; 1,000 mi de mezcla de vitaminas Eriksson (lOOOx Sigma-1511) ; 1,250 mi de tiamina.HCL.4 mg/ml; 30,000 g de sacarosa; 3,000 mi de 2, 4-D 0.5 mg/ml (No. 2A) ; 0.690 g de L-prolina; 0.500 g de regulador de pH Mes; 8,000 g de Agar (Sigma A-7049, purificado) , el cual se añade después en cantidad suficiente hasta volumen; 0.425 mi de nitrato de plata 2 mg/ml #, 3,000 mi de Bialafos 1 mg/ml #, y 2,000 mi de Agribio Carbenicilina 50 mg/ml #. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; ajustar a pH 5.8 c/koh; C.S. hasta volumen con agua desionizada pulida después de ajustar pH; esterilizar y enfriar a 60°C. Los ingredientes designados con un # se agregan después de esterilizar y enfriar a la temperatura. El medio 288 W contiene los siguientes ingredientes: 950, 000 mi de D-I ¾0; 4,300 g de sales MS;
106
0.100 g de Myo-Inositol ; 5, 000 mi de solución de abastecimiento de vitaminas MS (No. 36J) ; 1,000 mi de Zeatina, 5 mg/ml; 60,000 g de sacarosa; 8,000 g de Agar (Sigma A-7049, purificado), el cual se añade después C.S. hasta volumen; 2,000 mi de IAA 0.5 mg/ml #; 1,000 mi de ABA 1 Mm #; 3,000 mi de Bialafos 1 mg/ml # y 2, 000 mi de Agribio Carbenicillina, 50 mg/ml #. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; ajustar a pH 5.6; C.S. hasta volumen con agua desionizada pulida después de ajustar el pH; esterilizar y enfriar a 60°C. Añadir 3.5 g/L de Gelrite para biología celular. Los ingredientes designados con un # se agregan después de esterilizar y enfriar a la temperatura. El medio 272 contiene los siguientes ingredientes: 950,000 mi de agua desionizada; 4,300 g de sales MS; 0.100 g de Myo-Inositol ; 5,000 de una solución de abastecimiento de vitaminas MS; 40,000 g de sacarosa y 1,500 g de Gelrite, el cual se añade después C.S. hasta volumen. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; ajustar a pH 5.6; C.S. hasta volumen con agua desionizada pulida después de ajustar el pH, y esterilizar y enfriar a 60°C. El medio mínimo A contiene los siguientes ingredientes: 950,000 mi de agua desionizada; 10,500 g de fosfato de potasio dibásico K2HP04 ; 4,500 g de fosfato de 107
potasio monobásico, H2P04; 1,000 g de sulfato de amonio; 0,500 g de citrato de sodio dihidratado; 10,000 mi de solución de sacarosa al 20%# y 1,000 mi de sulfato de magnesio 1M#. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; C.S. a volumen con agua desionizada; esterilizar y enfriar a 60 °C. Los ingredientes designados con un # se agregan después de esterilizar y enfriar a la temperatura. El medio mínimo AB contiene los siguientes ingredientes: 850,000 mi de agua desionizada; 50,000 mi de una solución de abastecimiento 800A; 9 g de Phytagar que se agrega después C.S. a volumen; 50,000 mi de solución de abastecimiento 800B; 5,000 g de glucosa # y 2,000 mi de solución de abastecimiento de espectinomicina, 50/mg/ml #. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; C.S. a volumen con agua desionizada pulida a menos de 100 mi por litro; esterilizar y enfriar a 60°C. Los ingredientes designados con un # se añaden después de esterilizar y enfriar a la temperatura. La solución de abastecimiento 800A contiene los siguientes ingredientes: 950,000 mi de agua desionizada, 60,000 g de fosfato de potasio dibásico K2HP04 y 20,000 g de fosfato monobásico de sodio hidratado. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; ajustar pH a 7.0 con hidroxido de potasio; C.S. a 108
volumen con agua desionizada pulida después de ajustar el pH, y esterilizar y enfriar a 60°C. La solución de abastecimiento 800B contiene los siguientes ingredientes: 950,000 mi de agua desionizada; 20,000 g de cloruro de amonio, 6,000 g de sulfato de magnesio 7-H20, MgS0 í 7 H20; 3,000 g de cloruro de potasio; 0.200 g de cloruro de calcio (anhidro); y 0.050 g de sulfato ferroso 7-hidratado. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; C.S. a volumen con suficiente agua desionizada pulida y esterilizar y enfriar a 60 °C. El medio mínimo YP contiene los siguientes ingredientes: 950,000 mi de agua desionizada; 5,000 g de extracto de levadura (Difco) ; 10,000 g de peptona (Difco) ; 5,000 g de cloruro de sodio; 15,000 g de bacto-agar, el cual se agrega después C.S. hasta volumen y 1,000 mi de solución de abastecimiento de espectinomicina, 50 mg/ml #. Las instrucciones son: disolver ingredientes en agua desionizada pulida en secuencia; ajustar pH a 6.8 con hidróxido de potasio; C.S. a volumen con suficiente agua desionizada pulida después de ajustar el pH; esterilizar y enfriar a 60°C. Los ingredientes designados con # se agregan después de esterilizar y enfriar a la temperatura. Más de veinte eventos que producen semilla TI segregadora fueron analizados mediante RMN para el contenido de aceite del embrión (véase ejemplo 12) . Seis a doce 109
embriones analizados para cada uno de diferentes eventos mostraron que algunos embriones dentro de cada evento tenían un elevado contenido de aceite . Estos resultados se muestran en la figura 2. Los mismos embriones de estos cinco eventos fueron analizados mediante PGR para determinar la presencia o ausencia de la construcción Lecl . Los embriones con alto contenido de aceite siempre se encuentra que contienen la construcción Lecl (barras sombreadas oscuras) , mientras que los embriones con niveles normales de aceite se encuentra típicamente que no contienen la construcción Lee (barras cuadriculadas) . Estos datos demuestran que la presencia de que el gen Lecl no lleva a un contenido de aceite incrementado en el embrión. Se cree que los embriones que contienen niveles pronunciadamente más altos de aceite eran homocigóticos para la construcción Lecl, toda vez que estos eventos eran segregadores 1:2:1. Para estos eventos, la concentración de aceite en los embriones que contenían la construcción Lecl sobrepasó ampliamente cualquier incremento previamente logrado a través de la modificación enzimática de la vía biosintética de ácido graso, con algunos embriones conteniendo un incremento promedio de 56% en el contenido de aceite del embrión (figura 2, evento 277267) . Las plantas derivadas de semillas que contenían un alto contenido de aceite exhiben alguno cambios fenotípicos en crecimiento y desarrollo. Existe una acumulación de hojas adicionales 110
durante la fase inicial de crecimiento y desarrollo, y un fuerte rizado de las hojas a lo largo del crecimiento y desarrollo de la planta. Ejemplo 14 Promotores adicionales acoplados a Lecl también dan como resultado una acumulación alterada de aceite en granos de maíz Otros tipos de promotores específicos de semilla, el promotor de proteína de transferencia de lípidos y el promotor de zeina gama, también fueron probados para verificar su capacidad para alterar la acumulación de aceite en granos de maíz cuando expresaban Lecl . La transformación y análisis de estas construcciones fue esencialmente la misma que los protocolos descritos en el ejemplo 13. Más de veinte eventos que producían semilla TI segregadora fueron analizados mediante RMN para el contenido de aceite del embrión (véase ejemplo 12). Seis a doce embriones fueron analizados para cada evento. Los eventos que contenían embriones con alto contenido de aceite fueron analizados más. Los mismos embriones de estos eventos fueron analizados mediante PCR para determinar la presencia o ausencia de la construcción Lecl . Al igual que con la construcción que contenía el promotor de oleosina, todos los embriones con altos contenidos de aceite se encuentra que contienen la construcción Lecl, mientras que los embriones con contenidos 111
de aceite más bajos o normales se encuentra típicamente que no contienen la construcción Lecl . Al igual que los eventos que contienen Lecl y el promotor de oleosina, la concentración de aceite en el embrión para estos eventos también sobrepasa ampliamente cualquier incremento previamente logrado a través de la modificación enzimática, con algunos embriones conteniendo un incremento promedio de más del 50% en el contenido de aceite del embrión. De manera sorprendente, las plantas derivadas de semillas que contienen altas cantidades de aceite usando esta construcción no muestran el fenotipo anormal encontrado para plantas que expresan Lecl bajo el control del promotor de oleosina. Se cree que estos datos demuestran que un alto contenido de aceite puede lograrse en el embrión sin efectos agronómicos negativos cuando se emplea la expresión adecuada. Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.
LISTADO DE SECUENCIAS <110> E. I. du Pont de Nemours and Company y Pioneer
<120> Alteración De Características De Aceite En Plantas
<130> BB1458 PCT1 <140> <141> <160> 222 <170> Microsoft Office 97 <210> 1 <211> 638 <212> ADN <213> Catalpa speciosa <220> <221> inseguro <222> (402) <223> n = A, C, G, o T <220> <221> inseguro <222> (520) <223> n = A, C, G, o T <220> <221> inseguro <222> (526) <223> n = A, C, G, o T <220> <221> inseguro <222> (539) <223> n = A, C, G, o T <220> <221> inseguro <222> (542) <223> n = A, C, G, o T <220> <221> inseguro <222> (558) <223> n = A, C, G, o T <220> <221> inseguro <222> (563) <223> n = A, C, G, o T <220> <221> inseguro <222> (581) <223> n = Ar C, G, o T
1 <220> <221> inseguro <222> (609) <223> n = A, C, G, o T <220> <221> inseguro <222> (619) <223> n = A, C, G, o T <220> <221> inseguro <222> (622) <223> n = A, C, G, o T <220> <221> inseguro <222> (629) .. (630) <223> n = A, C, G, o T <220> <221> inseguro <222> (632) <223> n = A, C, G, o T <400> 1 gtgctcttta aaattcacaa gtacatctga cctctacatc aacacacatt gactctaaat 60 tctctctcta aattctgtca acccccaaat tctagggttt tgttttaatt gtcatcagat 120 ttcgccttaa caggacacat tggttgattt ctttgggaga aattagggga gcatgcaatc 180 caagtcccag agcggcaacc aaggagaatc caacctttat aatgttccta actccaaagt 240 aaatccggat tcttggtgga ataatactgg gatataatcc ttttcctcaa caatgatggg 300 gtgggaaatg catcaagatt catcatccct agaacaatct gtgggatgga caagtcgcag 360 tctaaaggtg gtataaatga ggaagatgat gatactacca anacgatcac aaagttagta 420 cacctccggc tgccaagata gaaactatag gcaggagggc cgagctccag caagctccac 480 ctaccaatac atccaaagaa acaatgggat cgttaatcan ggccanagtt gagctgggng 540 gnatcagtag ctgggggnca aancctaaga tcatatacgg nggaagatgg aactaaggca 600 gcatggtcnc ccaattaang anagcacann anggtgga 638
<210> 2 <211> 77 <212> PRT <213> Catalpa speciosa <220> <221> INSEGURO <222> (35) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (76) <223> Xaa = cualquier aminoácido <400> 2 Met Gln Ser Lys Ser Gln Ser Gly Asn Gln Gly Glu Ser Asn Leu Tyr 1 5 10 15
2 Asn Val Pro Asn Ser Lys Val Asn Pro Asp Ser Trp Trp Asn Asn Thr 20 25 30 Gly lie Xaa Ser Phe Ser Ser Thr Met Met Gly Gly Asn Ala Ser Arg 35 40 45 Phe lie lie Pro Arg Thr lie Cys Gly Met Asp Lys Ser Gln Ser Lys 50 55 60 Gly Gly lie Asn Glu Glu Asp Asp Asp Thr Thr Xaa Thr 65 70 75 <210> 3 <211> 441 <212> ADN <213> Typha latifolia <220> <221> inseguro <222> (378) <223> n = A, C, G, o T <220> <221> inseguro <222> (415) <223> n «= A, C, G, o T <400> 3 atttaggaga gagcttgagg tcgagaggag cagcagagga ggaaggaggc aggagaagca 60 aagggtttcg agaaagggga catgctcccc ttataaggac atggaaacca gaaagcaact 120 aggtcatcca ttgctgaagc aagactcatt ttcaaatgtc aactaatctg ttccaccaag 180 aagcatcggt aatgggtgaa gaccacctta gtgagaagca tacttcaaca caatctggga 240 atgctggtag ttatggaaat ataagggatg gttatccaaa atcagtatta tccttggcaa 300 atccagaagc tgcctttgta cctccgaaac ttgattgtag ccagtctttt acttgcatgc 360 catacccttt tgctgatnca tgctttggtg gtgtcatggc tgcatatggt tcgcnatgcc 420 tttattcaac aacaaatggt g 441
<210> 4 <211> 95 <212> PRT <213> Typha latifolia <220> <221> INSEGURO <222> (75) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (87) <223> Xaa = cualquier aminoácido <400> 4 Met Ser Thr Asn Leu Phe His Gln Glu Ala Ser Val Met Gly Glu Asp 1 5 10 15 His Leu Ser Glu Lys His Thr Ser Thr Gln Ser Gly Asn Ala Gly Ser 20 25 30
3 Tyr Gly Asn Ile Arg Asp Gly Tyr Pro Lys Ser Val Leu Ser Leu Ala 35 40 45 Asn Pro Glu Ala Ala Phe Val Pro Pro Lys Leu Asp Cys Ser Gln Ser 50 55 60 Phe Thr Cys Met Pro Tyr Pro Phe Ala Asp Xaa Cys Phe Gly Gly Val 65 70 75 80
Met Ala Ala Tyr Gly Ser Xaa Cys Leu Tyr Ser Thr Thr Asn Gly 85 90 95 <210> 5 <211> 849 <212> ADN <213> Vitis sp. <400> 5 ctgaggttgc agagacacca tggattccca ccaacggcca tgatttcctt ccaaactcct G0 accttttagg gtttattcct ctgctctcat cccacattag atttggggct aggggatttt 120 tgtttttctt ggtggaaaag aataatgccg actaaaccca aaattgagga tcggcggata 180 gaacctggtg gtaagagcaa tccgtcatca acagtctact cccaaccttg gtggcatggt 240 gttgggaaca atgccatctc cccagctgcc ttgggtggaa gcccatcaaa atcaacttca 300 gttgaacacc ttaacagtca tatcacgagc aatggtttcc aattacaagc taatggcagg 360 ctggatgatg gaactacctt taataaagga acacaaccta cggtagccct gcaatctgat 420 ggaaggaatg gacaggaaca ccagcacctc aatcctactg cttcctcaac actgccaatt 480 atgagtgaac atcttgaacc aaattcccaa atggaacttg ttggtcactc aattgtgttg 540 acatcatatc cgtatcaaga tccacataat gtggggatta tgacttctta tgggccacag 600 gctatggtat gcaaagaagt tggttgcatt tctgtgtgtt gtggtaacat tactgttggt 660 ggcactacca cttctgaaag tgatgcctca accttgaaaa ctagattctc ctgtactagg 720 gcctgcccct cttatagggg aggtcagcca ctgtagtgaa taatctgttt cataagaaaa 780 tcatcagttt ttatgtgaag gttccttctt ctagatttgg tctcgcccaa gaaaaaaaaa 840 aaaaaaaaa 849
<210> 6 <211> 154 <212> PRT <213> Vitis sp. <400> 6 Met Pro Thr Lys Pro Lys .lie Glu Asp Arg Arg lie Glu Pro Gly Gly 1 5 10 15 Lys Ser Asn Pro Ser Ser Thr Val Tyr Ser Gln Pro Trp Trp His Gly 20 25 30 Val Gly Asn Asn Ala lie Ser Pro Ala Ala Leu Gly Gly Ser Pro Ser 35 40 45 Lys Ser Thr Ser Val Glu His Leu Asn Ser His lie Thr Ser Asn Gly 50 55 60 Phe Gln Leu Gln Ala Asn Gly Arg Leu Asp Asp Gly Thr Thr Phe Asn 65 70 75 80
Lys Gly Thr Gln Pro Thr Val Ala Leu Gln Ser Asp Gly Arg Asn Gly 85 90 95
4 Gln Glu His Gln His Leu Asn Pro Thr Ala Ser Ser Thr Leu Pro lie 100 105 110 Met Ser Glu His Leu Glu Pro Asn Ser Gln Met Glu Leu Val Gly His 115 120 125 Ser lie Val Leu Thr Ser Tyr Pro Tyr Gln Asp Pro His Asn Val Gly 130 135 140 lie Met Thr Ser Tyr Gly Pro Gln Ala Met 145 150 <210> 7 <211> 1334 <212> ADN <213> Vitis sp. <400> 7 ctcatttgaa aatccgtaga ccgaaccatg gacttcgtat ccatcattct tctctctcca 60 tagctcctca attctagggt ttctctcact cttcttcctc tctgaatgga agctgtggac 120 aagaacaaaa gcatcctcag caagctgtat caatgatgcc tatgactatg gctgaatacc 180 aaccttgcacc accttcccag ctggacttg ttggccactc aattgcgtgt gcatcatatc 240 catattctga accttattac acgggagtca ttcctgctta tggacctcag ggtttggtac 300 aatctcaatt tcttggtgtg aatgtggcta gaatggcttt gcctattgaa atggcagagg 360 ggcaccagca tgctatgaga agggcaagag gatgtggagg ccgttttctc aacacaaaaa 420 cgaaggccga gctggaaaaa aaactgataa aagttaggaa gccatatctt catgaatcaa 480 ggcaccagca tgctatgaga agggcaagag gatgtggagg ccgttttctc aacacaaaga 540 agcttgattc taatgcatcg tatgacatgc ctgacaaggg ctctgatcca gatgtaaacc 600 tttcaacacg acccatcagc tcatcagtct ctgaatctct gccctccaat tcttcccgaa 660 atgaggattc ccccaccagt catctagatg caagaggtcc ctctgtgcag gaattgcaca 720 ataggcaaac agcctcccat ggaaatggca acagctgtta tccacacaac cagggatttc 780 agttgtcgac ataccattcc cttaaagatg atcgcgtgga agaaggagac cacgcagggc 840 ggcagcatga gagaattctg gtgaataggg ccccccacag ggccctaacc atcaaatgaa 900 accttcgttg ctaagggatg aagggtcttt ccagcattgc tctgatctat tgcagatggc 960 atcagcttcc atgtgggctt gagggtgtca cagaagtggg ctagttcaaa tacaaaaata 1020 agtgaggagc atccttctgt gacttctact caagtatctg gtaacggatc cggatggcag 1080 cattgcaggg caaagctgga agcattaccc caaccaatca gagggggggg ggacccctgg 1140 cctatgtgtt gtattttcag gcaaatcatt cttggcttgt atttttcata ttcctgtgtt 1200 tgttggaccg ggggggaaag acagagagat tgggaatcgt ctaatttcac tcattacctt 1260 tttggaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaa 1334
<210> 8 <211> 261 <212> PRT <213> Vitis sp. <400> 8 Cys Gly Gln Glu Gln Lys His Pro Gln Gln Ala Val Ser Met Met Pro 1 5 10 15 Met Thr Met Ala Glu Tyr His Leu Ala Pro Pro Ser Gln Leu Glu Leu 20 25 30 Val Gly His Ser lie Ala Cys Ala Ser Tyr Pro Tyr Ser Glu Pro Tyr 35 40 45
5 Tyr Thr Gly Val lie Pro Ala Tyr Gly Pro Gln Gly Leu Val Gln Ser 50 55 60 Gln Phe Leu Gly Val Asn Val Ala Arg Met Ala Leu Pro lie Glu Met 65 70 75 80
Ala Glu Glu Pro Val Tyr Val Asn Ala Lys Gln Tyr His Gly lie Leu 85 90 95 Arg Arg Arg Gln Ser Arg Ala Lys Ala Glu Leu Glu Lys Xys Leu lie 100 105 110 Lys Val Arg Lys Pro Tyr Leu His Glu Ser Arg His Gln His Ala Met 115 120 125 Arg Arg Ala Arg Gly Cys Gly Gly Arg Phe Leu Asn Thr Lys Lys Leu 130 135 140 Asp Ser Asn Ala Ser Tyr Asp Met Pro Asp Lys Gly Ser Asp Pro Asp 145 150 155- 160
Val Asn Leu Ser Thr Arg Pro lie Ser Ser Ser Val Ser Glu Ser Leu 165 170 175 Pro Ser Asn Ser Ser Arg Asn Glu Asp Ser Pro Thr Ser His Leu Asp 180 185 190 Ala Arg Gly Pro Ser Val Gln Glu Leu His Asn Arg Gln Thr Ala Ser 195 200 205 His Gly Asn Gly Asn Ser Cys Tyr Pro His Asn Gln Gly Phe Gln Leu 210 215 220 Ser Thr Tyr His Ser Leu Lys Asp Asp Arg Val Glu Glu Gly Asp His 225 230 235 240
Ala Gly Arg Gln His Glu Arg lie Leu Val Asn Arg Ala Pro His Arg 245 250 255 Ala Leu Thr lie Lys 260 <210> 9 <211> 987 <212> ADN <213> Vitis sp. <400> 9 gcacgaggga aggtcaaagt caaatgaagc cagttttctt tatggctaat ccagatgttg 60 tcttcaatcc ttcacaagtt gactatggcc attctgtgac tcatgttgca tatccttatg 120 ctgatcctta ccatgggggg ttagtggctg catatggtcc acatgctgtt attcagcccc 180 agctggtggg gatagcacct accagagtcc cactgccctt tgatattgca gaggatggac 240 ctatttttgt caatgcaaaa cagtatcatg gaattctcag gaggaggcag tcacgagcaa 300 agatggaggc ccagaacaaa cttgtcaaag cccgaaagcc atatctgcac gagtctcggc 360 atcttcatgc cctaaatagg gttagaggat ctggtggacg cttcctcagc acgaaaaagc 420 tccaagaacc ggactcaact tccaatgctg gctgtcatag tgtatctggc tctggtcatt 480 ttcaccagaa gggagacaca actgagcagc cggagcacag gttctcaggc atgtctcccc 540 acatgggtgg agccatgcaa ggtggtggcg gtgggactta tgggcaatgg agtcctgctc 600 ctggttgtcc ggtgagaagt cgataggaac aagatcgatg gagtcactgg tctgggcaat 660
6 tcatccttgg ctttgttact ttcgtttcat gcgtgttaag aagataaaca catcaaactt 720 catggtgtag tagaaatact ctgcctttcc catttccaaa tgcatacatt ttggctctgt 780 aaacatggtt gagaagaggc tatgcttgaa actctctgtt tgtgaaccat tgttttgttt 840 tttcaagaca atgtgagata ttggttcacc ggtattttgt ttgttgctta cagaaagcaa 900 accctgcctt ttgtgcttaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 960 aaaaaaaaaa aaaaaaaaaa aaaaaaa 937
<210> 10 <211> 205 <212> PRT <213> Vitis sp. <400> 10 Glu Gly Gln Ser Gln Met Lys Pro Val Phe Phe Met Ala Asn Pro Asp 1 5 10 15 Val Val Phe Asn Pro Ser Gln Val Asp Tyr Gly His Ser Val Thr His 20 25 30 Val Ala Tyr Pro Tyr Ala Asp Pro Tyr His Gly Gly Leu Val Ala Ala 35 40 45 Tyr Gly Pro His Ala Val lie Gln Pro Gln Leu Val Gly lie Ala Pro 50 55 60 Thr Arg Val Pro Leu Pro Phe Asp lie Ala Glu Asp Gly Pro lie Phe 65 70 75 80
Val Asn Ala Lys Gln Tyr His Gly lie Leu Arg Arg Arg Gln Ser Arg 85 90 95 Ala Lys Met Glu Ala Gln Asn Lys Leu Val Lys Ala Arg Lys Pro Tyr 100 105 110 Leu His Glu Ser Arg His Leu His Ala Leu Asn Arg Val Arg Gly Ser 115 120 125 Gly Gly Arg Phe Leu Ser Thr Lys Lys Leu Gln Glu Pro Asp Ser Thr 130 135 140 Ser Asn Ala Gly Cys His Ser Val Ser Gly Ser Gly His Phe His Gln 145 150 155 160
Lys Gly Asp Thr Thr Glu Gln Pro Glu His Arg Phe Ser Gly Met Ser 165 170 175 Pro His Met Gly Gly Ala Met Gln Gly Gly Gly Gly Gly Thr Tyr Gly 180 185 190 Gln Trp Ser Pro Ala Pro Gly Cys Pro Val Arg Ser Arg 195 200 205 <210> 11 <211> 1256 <212> ADN <213> Zea mays
7 <400> 11 gcacgagctc tgtctgtgtg cgagcgcaag agaaagggag tcagagagag agggaggaga 60 ccttgcagag gagcgaagca agcaaggtgg gaaagaggca gcaagggcgg cgggctgccg 120 gaaggggaac atgctccctc ctcatctcac agtacgaact gaaaaacaag agtaaagaat 180 ttccgtgaga tgagacagaa tggcgcggtg atgattcagt ttggccatca gatgcctgat 240 tacgactccc cggctaccca gtcaaccagt gagacgagcc atcaagaagc gtctggaatg 300 agcgaaggga gcctcaacga gcataataat gaccattcag gcaaccttga tgggtactcg 360 aagagtgacg aaaacaagat gatgtcagcg ttatccctgg gcaatccgga aacagcttac 420 gcacataatc cgaagcctga ccgtactcag tccttcgcca tatcataccc atatgccgat 480 ccatactacg gtggcgcggt ggcagcagct tatggcccgc atgctatcat gcaccctcag 540 ctggttggca tggttccgtc ctctcgagtg ccactgccga tcgagccagc cgctgaagag 600 cccatctatg tcaacgcgaa gcagtaccac gctattctcc ggaggagaca gctccgtgca 660 aagctagagg cggaaaacaa gctcgtgaaa agccgcaagc cgtacctcca cgagtctcgg 720 cacctgcacg cgatgaagag agctcgggga acaggcgggc ggttcctgaa cacgaagcag 780 cagccggagt cccccggcag cggcggctcc tcggacgcgc aacgcgtgcc cgcgaccgcg 840 agcggcggcc tgttcacgaa gcatgagcac agcctgccgc ccggcggtcg ccaccactat 900 cacgcgagag ggggcggtga gtagggagcc ccgacactgg caactcatcc ttggcttatc 960 agcgattcga ctcggctctc gctcgtctga aactgaactc tctgcaacta ctgtaactgt 1020 aactaaactg ggtgtgcccg gattggcggt cgttctgttc tactactact agtaccttag 1080 tacctgctac gcgtcgttgg gtctggacta gagagccgtg ctggttcttt gatgaacttg 1140 gctggacttg aggtgttgac tagcgcgaaa ctgagttcca tgtaaacttt tgcttcaaga 1200 ccgatgactg gcggcataat aagtagcagt aataaccaaa aaaaaaaaaa aaaaaa 1256
<210> 12 <211> 244 <212> PRT <213> Zea. mays <400> 12 Met Arg Gln Asn Gly Ala Val Met lie Gln Phe Gly His Gln Met Pro 1 5 10 15 Asp Tyr Asp Ser Pro Ala Thr Gln Ser Thr Ser Glu Thr Ser His Gln 20 25 30 Glu Ala Ser Gly Met Ser Glu Gly Ser Leu Asn Glu His Asn Asn Asp 35 40 45 His Ser Gly Asn Leu Asp Gly Tyr Ser Lys Ser Asp Glu Asn Lys Met 50 55 60 Met Ser Ala Leu Ser Leu Gly Asn Pro Glu Thr Ala Tyr Ala His Asn 65 70 75 80 Pro Lys Pro Asp Arg Thr Gln Ser Phe Ala lie Ser Tyr Pro Tyr Ala 85 90 95 Asp Pro Tyr Tyr Gly Gly Ala Val Ala Ala Ala Tyr Gly Pro His Ala 100 105 110 lie Met His Pro Gln Leu Val Gly Met Val Pro Ser Ser Arg Val Pro 115 120 125 Leu Pro lie Glu Pro Ala Ala Glu Glu -Pro lie Tyr Val" Asn Ala Lys 130 · 135 140 Gln Tyr His Ala lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu Glu 145 150 155 160
8 Ala Glu Asn Lys Leu Val Lys Ser Arg Lys Pro Tyr Leu His Glu Ser 165 170 175 Arg His Leu His Ala Met Lys A g Ala Arg Gly Thr Gly Gly Arg Phe 180 185 190 Leu Asn Thr Lys Gln Gln Pro Glu Ser Pro Gly Ser Gly Gly Ser Ser 195 200 205 Asp Ala Gln Arg Val Pro Ala Thr Ala Ser Gly Gly Leu Phe Thr Lys 210 215 220 His Glu His Ser Leu Pro Pro Gly Gly Arg His His Tyr His Ala Arg 225 230 235 240
Gly Gly Gly Glu
<210> 13 <211> 1203 <212> ADN <213> Zea mays <400> 13 ccacgcgtcc ggcaagagaa agggagtcag agagagagag agagggagga gaccttgcag 60 aggagcgaag caagcaaggt gggaaagagg cagcagcaag ggcggcgggc tgccggaagg 120 ggaacatgct ccctcctcat ctcacagaga atggcgcggt gatgattcag tttggccatc 180 agatgcctga ttacgactcc ccggctaccc agtcaaccag tgagacgagc catcaagaag 240 cgtctggaat gagcgaaggg agcctcaacg agcataataa tgaccattca ggcaaccttg 300 atgggtactc gaagagtgac gaaaacaaga tgatgtcagc gttatccctg ggcaatccgg 360 aaacagctta cgcacataat ccgaagcctg accgtactca gtccttcgcc atatcatacc 420 catatgccga tccatactac ggtggcgcgg tggcagcagc ttatggcccg catgctatca 480 tgcaccctca gctggttggc atggttccgt cctctcgagt gccactgccg atcgagccag 540 ccgctgaaga gcccatctat gtcaacgcga agcagtacca cgctattctc cggaggagac 600 agctccgtgc aaagctagag gcggaaaaca agctcgtgaa aagccgcaag ccgtacctcc 660 acgagtctcg gcacctgcac gcgatgaaga gagctcgggg aacaggcggg cggttcctga 720 acacgaagca gcagccggag tcccccggca gcggcggctc ctcggacgcg caacgcgtgc 780 ccgcgaccgc gagcggcggc ctgttcacga agcatgagca cagcctgccg cccggcggtc 840 gccaccacta tcacgcgaga gggggcggtg agtagggagc cccgacactg gcaactcatc 900 cttggcttat cagcgattcg actcggctct ccctcgtctg aaactgaact ctctgcaact 960 actgtaactg taactaaact gggtgtgccc ggattggcgg tcgttctgtt ctactactag 1020 tacctgctac gcgtcgttgg gttgggtctg gactagagag cgtgctggtt ctttgatgaa 1080 cttggctgga cttgagggtg ttgactagcg cgaagctgag ttccatgtaa aacttttgct 1140 tcaagaccga tgactggcgg cataataagt agcagtaata accaaaaaaa aaaaaaaaaa 1200 aag 1203
<210> 14 <211> 288 <212> PRT <213> Zea mays <400> 14 Pro Ala Arg Glu Arg Glu Ser Glu Arg Glu Arg Glu Gly Gly Asp Leu 1 5 10 15 Ala Glu Glu Arg Ser Lys Gln Gly Gly Lys Glu Ala Ala Ala Arg Ala 20 25 30
9 Ala Gly Cys Arg lys Gly Asn Met Leu Pro Pro His Leu Thr Glu Asn 35 40 45 Gly Ala Val Met lie Gln Phe Gly His Gln Met Pro Asp Tyr Asp Ser 50 55 60 Pro Ala Thr Gln Ser Thr Ser Glu Thr Ser His Gln Glu Ala Ser Gly 65 70 75 80 Met Ser Glu Gly Ser Leu Asn Glu His Asn Asn Asp His Ser Gly Asn 85 90 95 Leu Asp Gly Tyr Ser Lys Ser Asp Glu Asn Lys Met Met Ser Ala Leu 100 105 110 Ser Leu Gly Asn Pro Glu Thr Ala Tyr Ala His Asn Pro Lys Pro Asp 115 120 125 Arg Thr Gln Ser Phe Ala lie Ser Tyr Pro Tyr Ala Asp Pro Tyr Tyr 130 135 140 Gly Gly Ala Val Ala Ala Ala Tyr Gly Pro His Ala lie Met His Pro 145 150 155 160
Gln Leu Val Gly Met Val Pro Ser Ser Arg Val Pro Leu Pro lie Glu 165 170 175 Pro Ala Ala Glu Glu Pro lie Tyr Val Asn Ala Lys Gln Tyr His Ala 180 185 190 lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu Glu Ala Glu Asn Lys 195 200 205 Leu Val Lys Ser Arg Lys Pro Tyr Leu His Glu Ser Arg His Leu His 210 215 220 Ala Met Lys Arg Ala Arg Gly Thr Gly Gly Arg Phe Leu Asn Thr Lys 225 230 235 240
Gln Gln Pro Glu Ser Pro Gly Ser Gly Gly Ser Ser Asp Ala Gln Arg 245 250 255 Val Pro Ala Thr Ala Ser Gly Gly Leu Phe Thr Lys His Glu His Ser 260 265 270 Leu Pro Pro Gly Gly Arg His His Tyr His Ala Arg Gly Gly Gly Glu 275 280 285 <210> 15 <211> 1301 <212> ADN <213> Zea mays <400> 15 gcacgagcca gtgcgacggc cacggcctga gcggcgctgc cagcaaggcg gctagtatga 60 gcagcatgga gtcgcggccg ggccgaacga acctggtgga gcccataggg cacggcgccg 120 cgctgccgtc cggcggccag gcagtgcagc cgtggtggac gagctccggg gctgtgctcg 180 gtgcagtctc gccagccgtc gtggcggtgg cgcccgggag cgggacgggg attagcctgt 240 cgagcagccc ggcaggtggt agtggtggtg gcggcgcggc taaaggagcc gcgagtgacg 300
10 agagcagcga ggattcacgg agatctgggg aaccaaaaga tggaagcgct agtcaagaaa 360 agaaccatgc cacatcgcag atacccgctc tggcgccaga gtatttggca ccatactcgc 420 agctggaact gaaccaatca attgcttctg cagcatatca gtacccagat ccttactatg 480 caggcatggt tgctccctat ggaagtcatg ctgtggctca ttttcagcta cctggactaa 540 ctcaatctcg aatgccatta cctcttgaag tatccgagga gcctgtttat gtaaatgcca 600 agcagtacca tggtatctta agacgacggc agtcccgtgc taaggctgaa cttgagaaaa 660 aggtggtcaa agccagaaag ccataccttc acgagtctcg tcatcagcac gcgatgagga 720 gggcaagagg aaacggggga cgcttcctga acacaaagaa aagtgacagt ggtgctccca 780 atggaggcga aaacgccgag catctccatg tccctcccga cttactacag ctacgacaga 840 acgaggcttg aagtagcggt atggctctgg catccttgaa cagcagttcc tgtccacggg 900 cgtaggcatt cgagaccgga ttcatatagc tctccacagc atacgcgcag ccatctctgc 960 ggtaacgcac gttctcctga acgagctttg tagcgagata ggtatgcaag tgcaatctgg 1020 gcgcaggaat ccatcatcaa gtgcccaatg cccatggggt aggtacgctg tttcaggcaa 1080 ttcattcttg gctttcacgt tccacccttg tgtaactggt gtgttgtaaa tgtgtggaaa 1140 actaagcttg tgctctgtat cgggccgttc agcggaactg caaaacgcct gtataattaa 1200 gatcgaactt tggattaact cggtaatgct ttgtctggtt ttcttttaaa aaaaaaaaaa 1260 aaaaaaaaaa aaaaaaaaaa aacaaaaaaa aaaaaaaaaa 1301
<210> 16 <211> 264 <212> PRT <213> Zea mays <400> 16 Met Ser Ser Met Glu Ser Arg Pro Gly Arg Thr Asn Leu Val Glu Pro
1 5 10 15 lie Gly His Gly Ala Ala Leu Pro Ser Gly Gly Gln Ala Val Gln Pro 20 25 30 Trp Trp Thr Ser Ser Gly Ala Val Leu Gly Ala Val Ser Pro Ala Val 35 40 45 Val Ala Val Ala Pro Gly Ser Gly Thr Gly lie Ser Leu Ser Ser Ser 50 55 60 Pro Ala Gly Gly Ser Gly Gly Gly Gly Ala Ala Lys Gly Ala Ala Ser 65 70 75 80 Asp Glu Ser Ser Glu Asp Ser Arg Arg Ser Gly Glu Pro Lys Asp Gly 85 90 95 Ser Ala Ser Gln Glu Lys Asn His Ala Thr Ser Gln lie Pro Ala Leu 100 105 110 Ala Pro Glu Tyr Leu Ala Pro Tyr Ser Gln Leu Glu Leu Asn Gln Ser 115 120 125 lie Ala Ser Ala Ala Tyr Gln Tyr Pro Asp Pro Tyr Tyr Ala Gly Met 130 135 140 Val Ala Pro Tyr Gly Ser His Ala Val Ala His Phe Gln Leu Pro Gly 145 150 155 160
Leu Thr Gln Ser Arg Met Pro Leu Pro Leu Glu Val Ser Glu Glu Pro 165 170 175 Val Tyr Val Asn Lys Gln Tyr His Gly lie Leu Arg Arg Arg Gln 180 185 190
11 Ser Arg Ala Lys Ala Glu Leu Glu Lys Lys Val Val Lys Ala Arg Lys 195 200 205 Pro Tyr Leu His Glu Ser Arg His Gln His Ala Met Arg Arg Ala Arg 210 215 220 Gly Asn Gly Gly Arg Phe Leu Asn Thr Lys Lys Ser Asp Sar Gly Ala 225 230 235 240
Pro Asn Gly Gly Glu Asn Ala Glu His Leu His Val Pro Pro Asp Leu 245 250 255 Leu Gln Leu Arg Gln Asn Glu Ala 260 <210> 17 <211> 1258 <212> ADN <213> ea mays <400> 17 gcacgaggcc acgccgccgg ccacgcccca gacgaccccg cccgccgccg ccgcctcccg 60 ctccctccgc gcgcagccct cgtccggccg cccgggtccg agcgcgctcg ctcctcctcc 120 ccacgtcgga cagtttaagt gtggcttcat tgcatgagta gttgcagtta gcgtggcttt 180 tctccgtgct tgctcctggt cgtgctttgc cttgcaaagg aaggaatcat gacatctgtt 240 gttcacagtg tttcaggtga ccacagggct gaggatcaaa atcaacagaa gaagcaagct 300 gaacctgggg accagcaaga agccccagtt actagttcag atagccaacc aacagtaggc 360 acaccatcaa cagattatgt ggcaccctat gcccctcatg acatgagcca tgcaatgggt 420 caatacgctt atccaaatat tgacccatac tatggaagcc tttatgcacc agcttacggt 480 ggacagccat tgatgcatcc accgttagtt ggaatgcatc cggctggctt acctttgcct 540 accgatgcaa ttgaagagcc tgtgtatgta aatgcaaagc aatacaatgc catattaaga 600 cggcgtcaat ctcgggctaa agctgaatca gaacgaaagc ttatcaaggg gcgtaagccc 660 tatctccatg agtcacgtca tcagcatgcc ttgaaaaggg ccaggggagc tggaggtcgg 720 tttctcaact caaagtcaga tgacaaggaa gagaactccg actcgagtca caaagagaat 780 cagaacggag ttgcgcccca caggagcggc caaccgtcaa cccctccgtc tcccaacggt 840 gcatcgtcag ctaatcaggg caggcagtcg tgaatgatgg atgattcaaa actcacagct 900 gaagagattt cagcccctga gctagatatg gcagcagttt tgtacagaaa acgctagcaa 960 catggtgtcg gtcggtcggt cggttgttgt aggacatgtt ccatagaaaa agcatagacg 1020 agtctacagg ttttggagcc ttggtttggt cctctgtgta ttcacctttc tgtacaatct 1080 tagtagcgtt gtgtaccttc ccctggaagg aaggatagct tcagttagcg cttcagaaag 1140 tcaagtgtgt agcatattgg cttattgttt gctttgcttg gacaatggag atttgggagt 1200 ggagttcata accctgctga ataaatactc ttagctggct aaaaaaaaaa aaaaaaaa 1258
<210> 18 <211> 214 <212> PRT <213> Zea mays <400> 18 Met Thr Ser Val Val His Ser Val Ser Gly Asp His Arg Ala Glu Asp 1 5 10 15 Gln Asn Gln Gln Lys Lys Gln Ala Glu Pro Gly Asp Gln Gln Glu Ala 20 25 30 Pro Val Thr Ser Ser Asp- Ser Gln Pro Thr Val Gly Thr Pro Ser Thr 35 40 45
12 Asp Tyr Val Ala Pro Tyr Ala Pro His Asp Met Ser His Ala Met Gly 50 55 60 Gln Tyr Ala Tyr Pro Asn lie Asp Pro Tyr Tyr Gly Ser Leu Tyr Ala 65 70 75 80 Ala Ala Tyr Gly Gly Gln Pro Leu Met His Pro Pro Leu Val Gly Met 85 90 95 His Pro Ala Gly Leu Pro Leu Pro Thr Asp Ala lie Glu Glu Pro Val 100 105 110 Tyr Val Asn Ala Lys Gln Tyr Asn Ala lie Leu Arg Arg Arg Gln Ser 115 120 125 Arg Ala Lys Ala Glu Ser Glu Arg Lys Leu lie Lys Gly Arg Lys Pro 130 135 140 Tyr Leu His Glu Ser Arg His Gln His Ala Leu Lys Arg Ala Arg Gly 145 150 155 160
Ala Gly Gly Arg Phe Leu Asn Ser Lys Ser Asp Asp Lys Glu Glu Asn 165 170 175 Ser Asp Ser Ser His Lys Glu Asn Gln Asn Gly Val Ala Pro His Arg 180 185 190 Ser Gly Gln Pro Ser Thr Pro Pro Ser Pro Asn Gly Ala Ser Ser Ala 195 200 205 Asn Gln Gly Arg Gln Ser 210 <210> 19 <211> 1170 <212> ADN <213> Zea mays <400> 19 gcacgagcca cgccgtcggc cacgccccga cgaccaacac ctgctccctc cgccgccgcc 60 cgtgtcctcc cgctccgtcc gcgcgccgcc ctcatacctc caagcgcggt tggatctgct 120 ctgggtccaa gtccgctcga tcctcctctc gtcggaaact ttatgtgtgc cttcatccac 180 gaagagctga agatatcaca tgactagttg cagttagtgt ggcttttctc cctgcttggt 240 cctgattgtg tgctttgcct tgcaaaggaa ggaatcatga cctctgttgt tcagagcgtt 300 tcaggtgacc acagggctga ggatcaaagt catcagaaga agcaaactga acctggggac 360 cagcaagaag ccccagttac tagttcagat agccaaccaa cagtgggcac accatcaaca 420 gattatgtgg caccctatgc ccctcatgac atgagccatg caatgggtca atatgcttat 480 ccaaatattg atccatacta tggaagtctt tatgcggcgg cttatggtgg acatccattg 540 atgcatccaa cattagtcgg aatgcatccg gctggcttac ctttgcctac cgatgcaatt 600 gaagagccag tgtatgtaaa tgcaaagcaa tacaatgcca tattaagacg gcgtcaatct 660 cgggctaaag ctgaatcaga acggaagctt gtcaagggcc gcaagcccta tctccatgag 720 tcacggcatc agcatgcctt gaaaagggcc aggggagctg gaggtcggtt tctcaattcg 780 aagtcagatg acaaggaaga gaactccgac tcaagtcaaa aagagattca gaacggagtt 840 gcgccccaaa agggtggcca accgtcaacc cctccgtctc ccaacggtgc gtcgtcagct 900 tatcaggcgc ctagtcgtga atgatgattc ggaactcaca actgaagaga ttttagtccc 960 tgacgctagt tgtggcagca gctttgtaca gtaagtgcta gcgggcagca gcgaaatggt 1020 gtcatagaaa aacgttgacg agtcagacag gttttggagt cttggttttt tttcctctgt 1080
13 ttattttacc tgtctgcaat tttagtagct ttgtgtccct tcccctggat agttttttgg 1140 tcagcgctta agaaaaaaaa aaaaaaaaaa 1170
<210> 20 <211> 215 <212> PRT <213> Zea mays <400> 20 Met Thr Ser Val Val Gln Ser Val Ser Gly Asp His Arg Ala Glu Asp 1 5 10 15 Gln Ser His Gln Lys Lys Gln Thr Glu Pro Gly Asp Gln Gln Glu Ala 20 25 30 Pro Val Thr Ser Ser Asp Ser Gln Pro Thr Val Gly Thr Pro Ser Thr 35 40 45 Asp Tyr Val Ala Pro Tyr Ala Pro His Asp Met Ser His Ala Met Gly 50 55 60 Gln Tyr Ala Tyr Pro Asn lie Asp Pro Tyr Tyr Gly Ser Leu Tyr Ala . 65 70 75 80 Ala Ala Tyr Gly Gly His Pro Leu Met His Pro Thr Leu Val Gly Met 85 90 95 His Pro Ala Gly Leu Pro Leu Pro Thr Asp Ala lie Glu Glu Pro Val 100 105 110 Tyr Val Asn Ala Lys Gln Tyr Asn Ala lie Leu Arg Arg Arg Gln Ser 115 120 125 Arg Ala Lys Ala Glu Ser Glu Arg Lys Leu Val Lys Gly Arg Lys Pro 130 135 140 Tyr Leu His Glu Ser Arg His Gln His Ala Leu Lys Arg Ala Arg Gly 145 150 155 160
Ala Gly Gly Arg Phe Leu Asn Ser Lys Ser Asp Asp Lys Glu Glu Asn 165 170 175 Ser Asp Ser Ser Gln Lys Glu lie Gln Asn Gly Val Ala Pro Gln Lys 180 185 190 Gly Gly Gln Pro Ser Thr Pro Pro Ser Pro Asn Gly Ala Ser Ser Ala 195 200 205 Tyr Gln Ala Pro Ser Arg Glu 210 215 <210> 21 <211> 1892 <212> ADN <213> Zea mays <400> 21 ccacgcgtcc gcccgctggg gctgggctac ctcgttcgct tcgctgcctc tgcctactcc
14 tctctcccct ctttctccgc tcatgtgctg gtccatcgtc tgcctcctcg gtttgtcctg 120 aatccttgga cagacgcaca caggctcagc tcaggcggtt gctggatcct ttggcgttcc 180 ccatccggcc aagaatcctg caagagcctg cttggagttg gagccggcca aacctgctgc 240 cgtcgacgtc tcgggcgagg cagccttgag catcagtctc cttgacgagg caagcaggcc 300 atgatgagct tcaagggaca cgaggggttc ggtcaggtgt ccggagccgg gatgagccag 360 gcctcccatg gcgccgcgcc tgccggagcc ccgctgccgt ggtgggctgg ggcccagctg 420 ctgtccggcg agccggcgcc cctgtccccg gaggaggcgc cccgggacac ccagttccag 480 gtcgtgccgg gggcctctca gggcacgccg gatccagcgc cgcccaaggg agggacacct 540 aaggtcctca agttctctgt gttccaaggg aatttggagt cgggtggtaa aggagagaaa 600 accccaaaga actctaccgc tgtcgttctg cagtcgccat tcgcggaata caatggtcgt 660 ttcgagatcg gtctcggtca atctatgctg gtcccttcca gttattcttg tgctgaccag 720 tgctatggca tgcttacgac ttatggaatg agatccatgt ctggtgggag aatgctgttg 780 ccactaattg cgccagccga tgcacccgtt tatgtgaacc cgaaacagta cgaaggcatc 840 ctccgtcgtc gccgtgctcg cgctaaggcg gagagcgaga acaggctcac caaaggcaga 900 aagccttatc tccatgagtc gcgccacctc cacgcgatgc gccgggtgag aggctccggc 960 gggcgcttcc tcaacacgaa taaaggaggg cacggcacgg acgttgctgc aaacgggggc 1020 agcaagatgg cggcggcggc ggcaccatcc cgtctcgcca tgccccctag cgctgagcct 1080 ccatggctgt cagggctcag cgacggcagc aacccgtgct gccactcccg gagtagtgtc 1140 tccagcttgt ccgggtccta cgtggcgagc atctacggtg gcttggagca gcacctccgg 1200 gcgccgccct tcttcacccc gctgccgccc gtcatggacg gcgaccacgg cggccccacg 1260 gccgccacca tctcctcctt caagtgggcg gccagcgacg gctgctgcga gctcctcagg 1320 gcgtgaaccg aggagggagg ggatggctac tcagacgaac ggccttctcc ccgatggctg 1380 gttgtctgta ggcaaatcat tcttggctgt tctgcattgg ggtgcgacct acacatcatc 1440 cgcctaccgt acctacccca cccgtgtccc tgaaattcca gggtgcttgg gttacttaca 1500 ggggtcttgt gtggtgatgt ggctccccca tatgcatttg ctgtaacata gcgtacccaa 1560 accactgttg cttggtactt ctcgctatca ctgcctcatc agtatggatt ctgcatttct 1620 gcgttgtcac agtgtatgaa taattgaggc gtcagacttc agggttgctc cagttcttgg 1680 agataggtct gggtttgttt gaagcttgcc tggaggtctg aaactttgtg tttggtgaag 1740 atgctacgtt attgcagttt gaatctgtaa gtttgggatc agcattcagt tgttgcatcg 1800 tctgtgctct ggtgccgagg tgttcgttct gaatatttga ttcaattcaa aatcttcagc 1860 taagttacta ctgggacaaa aaaaaaaaaa aa 1892
<210> 22 <211> 341 <212> PRT <213> Zea mays . <400> 22 Met Met Ser Phe Lys Gly His Glu Gly Phe Gly Gln Val Ser Gly Ala 1 5 10 15 Gly Met Ser Gln Ala Ser His Gly Ala Ala Pro Ala Gly Ala Pro Leu 20 25 30 Pro Trp Trp Ala Gly Ala Gln Leu Leu Ser Gly Glu Pro Ala Pro Leu 35 40 45 Ser Pro Glu Glu Ala Pro Arg Asp Thr Gln Phe Gln Val Val Pro Gly 50 55 60 Ala Ser Gln Gly Thr Pro Asp Pro Ala Pro Pro Lys Gly Gly Thr Pro 65 70 75 80 Lys Val Leu Lys Phe Ser Val Phe Gln Gly Asn Leu Glu Ser Gly Gly 85 90 95 Gly Glu Lys Thr Pro Lys Asn Ser Thr Ala Val Val Leu Gln Ser 100 105 110
15 Pro Phe Ala Glu Tyr Asn Gly Arg Phe Glu lie Gly Leu Gly Gln Ser 115 120 125 Met Leu Val Pro Ser Ser Tyr Ser Cys Ala Asp Gln Cys Tyr Gly Met 130 135 140 Leu Thr Thr Tyr Gly Met Arg Ser Met Ser Gly Gly Arg Met Leu Leu 145 150 155 160
Pro Leu lie Ala Pro Ala Asp Ala Pro Val Tyr Val Asn Pro Lys Gln 165 170 175
Tyr Glu Gly lie Leu Arg Arg Arg Arg Ala Arg Ala Lys Ala Glu Ser 180 185 190 Glu Asn Arg Leu Thr Lys Gly Arg Lys Pro Tyr Leu His Glu Ser Arg 195 200 205 His Leu His Ala Met Arg Arg Val Arg Gly Ser Gly Gly Arg Phe Leu 210 215 - 220 Asn Thr Asn Lys Gly Gly His Gly Thr Asp Val Ala Ala Asn Gly Gly 225 230 235 240
Ser Lys Met Ala Ala Ala Ala Ala Pro Ser Arg Leu Ala Met Pro Pro 245 250 255
Ser Ala Glu Pro Pro Trp Leu Ser Gly Leu Ser Asp Gly Ser Asn Pro 260 265 270 Cys Cys His Ser Arg Ser Ser Val Ser Ser Leu Ser Gly Ser Tyr Val 275 280 285 Ala Ser lie Tyr Gly Gly Leu Glu Gln His Leu Arg Ala Pro Pro Phe 290 295 300 Phe Thr Pro Leu Pro Pro Val Met Asp Gly Asp His Gly Gly Pro Thr 305 310 315 320
Ala Ala Thr lie Ser Ser Phe Lys Trp Ala Ala Ser Asp Gly Cys Cys 325 ' 330 335
Glu Leu Leu Arg Ala 340 <210> 23 <211> 323 <212> ADN <213> Zea mays <220> <221> inseguro <222> (201) <223> n = A, C, <220> <221> inseguro <222> (244) <223> n = A, C,
16 <220>. <221> inseguro <222> (276) <223> n = A, C, G, o T <220> <221> inseguro <222> (279) <223> n = A, C, G, o T <220> <221> inseguro <222> (296) <223> n = A, C, G, o T <220> <221> inseguro <222> (320) <223> n = A, C, G, o T <400> 23 acgccatcat gcgtcggcgc tgtgccegtg ccaaagcaga gagggaaaat aggctggtca 60 aaggcaggaa gccatatctc catgagtcac gccatcagca tgcactgcgt cgcccgcgag 120 gctctggcgg acgcttcctg aacacaaaga aagaatccag cgggaaggat gctggtggtg 180 gcagcaaggc aatgtttcaa ncaaccccct catgcgccag gtggcgttct cccaagctcc 240 aaanatccac cagtccagac ctgggccaac cccgancanc gttttccacc tgttcnggtt 300 tccaaagttt tttcaacctn ttt , 323
<210> 24 <211> 77 <212> PRT <213> Zea mays <220> <221> INSEGURO <222> (67) <223> Xaa = cualquier aminoácido <400> 24 Ala lie Met Arg Arg Arg Cys Ala Arg Ala Lys Ala Glu Arg Glu Asn 1 5 10 15 Arg Leu Val Lys Gly Arg Lys Pro Tyr Leu His Glu Ser Arg His Gln 20 25 30 His Ala Leu Arg Arg Pro Arg Gly Ser Gly Gly Arg Phe leu Asn Thr 35 40 45 Lys Lys Glu Ser Ser Gly Lys Asp Ala Gly Gly Gly Ser lys Ala Met 50 55 60 Phe Gln Xaa Thr Pro Ser Cys Ala Arg Trp Arg Ser Pro 65 70 75 <210> 25 <211> 1195
17 <212> ADN <213> Zea mays <400> 25 gcaccagacc agaggaaggg acggcgggga ggtggcaagg cgcagagagc aggttcgctt 60 ggcggacgca ccgagggagg cgtgtgggag ccatgcttct tccgtcttcg tcttcgtctt 120 ccgcttccgc ttccgcttcc aaaggtaact cctttgggaa aaccgttaac gatcatctga 180 ggtcaacttt gagttttgat aacaagcaac ctccatttgc aagtcaaaac tttgactacg 240 gtcaaacaat agcttgcatt tcatacccgt acaatcattc tggctcagga gatgtctggg 300 cagcctatga gtcacgcacc agcgctgcca ctgtgttccg ttcccaaatt gctggtgggg 360 gtacatccac aagaattccc ttgcctttgg aattagcaga gaatgaaccc atatatgtga 420 atcccaaaca atatcacggg atacttcgca gaagacagtt acgtgccaag ttagaggctc 480 agaacaagct agtcagagcc cgaaagcctt accttcatga gtctaggcat cttcatgcaa 540 tgaagagggc acgaggttcc ggtggacgat tcctcaacac taagcagctc cagcagtctc 600 acactgccct caccaggtcc accaccacaa gtggcacaag ctcctcaggc tcaactcatc 660 tgcggcttgg tggtggcgca gccgcagctg gagatcgatc tgtgctggca cccaaaacaa 720 tggcctcaca agacagtagc aagaaggccg tttcttcagc cctcgccttc actgcgactc 780 caatgctgcg cagagatgac ggcttcttgc agcacccaag ccatcttttc agtttttctg 840 gtcattttgg gcaggcaagc gcgcaagctg gcgtccataa tggaagtcag catagggttc 900 cagttatgag atgaccggtt tgcgaaccat agctggtgat ccaggcgtct agggtcaact 960 tcgctgtggt gtcttagtct ctcaggcaat tcatccttgg cttaatttct ggctttttat 1020 tagaaggtac caaaatgtgt tccataccgt tgtggccaca gagcccataa accagggggt 1080 ttgatggttg gcactcctac ccaaactatt gtcttgttgc agtggtgttt gttagaataa 1140 accttgacta ttattctgta caaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 1195
<210> 26 <211> 273 <212> PRT <213> Zea mays <400> 26 Met Leu Leu Pro Ser Ser Ser Ser Ser Ser Ala Ser Ala Ser Ala Ser 1 5 10 15 Lys Gly Asn Ser Phe Gly Lys Thr Val Asn Asp His Leu Arg Ser Thr 20 25 30 Leu Ser Phe Asp Asn Lys Gln Pro Pro Phe Ala Ser Gln' Asn Phe Asp 35 40 45 Tyr Gly Gln Thr lie Ala Cys lie Ser Tyr Pro Tyr Asn His Ser Gly 50 55 60 Ser Gly Asp Val Trp Ala Ala Tyr Glu Ser Arg Thr Ser Ala Ala Thr 65 70 75 80 Val Phe Arg Ser Gln lie Ala Gly Gly Gly Thr Ser Thr Arg lie Pro 85 '90 95 Leu Pro Leu Glu Leu Ala Glu Asn Glu Pro lie Tyr Val Asn Pro Lys 100 105 110 Gln Tyr His Gly lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu Glu 115 120 125 Ala Gln Asn Lys Leu Val Arg Ala Arg Lys Pro Tyr Leu His Glu 130 135 140
18 Arg His Leu His Ala Met Lys Arg Ala Arg Gly Ser Gly Gly Arg Phe 145 150 155 160
Leu Asn Thr Lys Gln Leu Gln G-ln Ser His Thr Ala Leu Thr Arg Ser 165 170 175 Thr Thr Thr Ser Gly Thr Ser Ser Ser Gly Ser Thr His Leu Arg Leu 180 185 190 Gly Gly Gly Ala Ala Ala Ala Gly Asp Arg Ser Val Leu Ala Pro Lys 195 200 205 Thr Met Ala Ser Gln Asp Ser Ser Lys Lys Ala Val Ser Ser Ala Leu 210 215 220 Ala Phe Thr Ala Thr Pro Met Leu Arg Arg Asp Asp Gly Phe Leu Gln 225 230 235 240
His Pro Ser His Leu Phe Ser Phe Ser Gly His Phe Gly Gln Ala Ser 245 250 255 Ala Gln Ala Gly Val His Asn Gly Ser Gln His Arg Val Pro Val Met 260 265 270 Arg
<210> 27 <211> 1376 <212> ADN <213> Zea mays <400> 27 tctctatcta tctatacggt tcaagggact gaagaaggta gagagagaaa ctcgaagggg 60 agaggacaga agagggagat acaggttaat ttttaggtac cagatcatct gatttctcag 120 aagcaaaatg ttgtttggag ctcagtgaca ccatcttgta atgcctgtga ttttacggga 180 aatggaggat cattctgtcc atcccatgtc taagtctaac catggctcct tgtcaggaaa 240 tggttatgag atgaaacatt caggccataa agtttgcgat agggattcat catcggagtc 300 tgatcggtct caccaagaag catcagcagc aagtgaaagc agtccaaatg aacacacatc 360 aactcaatca gacaatgatg aagatcatgg gaaagataat caggacacaa tgaagccagt 420 attgtccttg gggaaggaag gctctgcctt tttggcccca aaattacatt acagcccatc 480 ttttgcttgt attccttata ctgctgatgc ttattatagt gcggttgggg tcttgacagg 540 atatcctcca catgccattg tccatcccca gcaaaatgat acaacgaaca ctccgggtat 600 gttacctgtg gaacctgcag aagaaccaat atatgttaat gcaaaacaat accatgcaat 660 ccttaggagg aggcaaacac gtgctaaatt ggaggcccag aacaagatgg tgaaaaatcg 720 gaagccatat cttcatgagt cccgacatcg tcatgccatg aaacgggctc gtggatcagg 780 aggacggttc ctcaacacaa agcagctcca ggagcagaac cagcagtatc aggcatcgag 840 tggttcattg tgctcaaaga tcattgccaa cagcataatc tcccaaagtg gccccacctg 900 cacgccctct tctggcactg caggtgcttc aacagccggc caggaccgca gctgcttgcc 960 ctcagttggc ttccgcccca cgacaaactt cagtgaccaa ggtcgaggag gcttgaagct 1020 ggccgtgatc ggcatgcagc agcgtgtttc caccataagg tgaagagaag tgggcacaac 1080 accattccca ggcacactgc ctgtggcaac tcatccttgg ctcttggaac tttgaatatg 1140 caatcgacat gtagcttgag atcctcagaa taaaccaaac cttjcagttat atgcaagcct 1200 tttttgaggt tgctgttgct gtacctgaga actgtggtta ggttatgagt ttgttcctca 1260 aaactgaccc atacatgaca tgctaccttg tgctgagttt ctgagacaaa gccatcgaaa 1320 catgatcttg tggttcagta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376
19 <210> 28 <211> 300 <212> PRT <213> Zea mays <400> 28 Met Pro Val lie Leu Arg Glu Met Glu Asp His Ser Val His Pro Met 1 5 10 15
Ser Lys Ser Asn His Gly Ser Leu Ser Gly Asn Gly Tyr Glu Met Lys 20 25 30 His Ser Gly His Lys Val Cys Asp Arg Asp Ser Ser Ser Glu Ser Asp 35 40 45 Arg Ser His Gln Glu Ala Ser Ala Ala Ser Glu Ser Ser Ero Asn Glu 50 55 60 His Thr Ser Thr Gln Ser Asp Asn Asp Glu Asp His Gly Lys Asp Asn 65 70 75 80
Gln Asp Thr Met Lys Pro Val Leu Ser Leu Gly Lys Glu Gly Ser Ala 85 90 95
Phe Leu Ala Pro Lys Leu His Tyr Ser Pro Ser Phe Ala Cys lie Pro 100 105 110 Tyr Thr Ala Asp Ala Tyr Tyr Ser Ala Val Gly Val Leu Thr Gly Tyr 115 120 125 Pro Pro His Ala lie Val His Pro Gln Gln Asn Asp Thr Thr Asn Thr
•130 135 . 140 Pro Gly Met Leu Pro Val Glu Pro Ala Glu Glu Pro lie Tyr Val Asn 145 150 155 160
Ala Lys Gln Tyr His Ala lie Leu Arg Arg Arg Gln Thr Arg Ala Lys 165 170 175
Leu Glu Ala Gln Asn Lys Met Val Lys Asn Arg Lys Pro Tyr Leu His 180 185 190 Glu Ser Arg His Arg His Ala Met Lys Arg Ala Arg Gly Ser Gly Gly 195 200 205 Arg Phe Leu Asn Thr Lys Gln Leu Gln Glu Gln Asn Gln Gln Tyr Gln 210 215 220 Ala Ser Ser Gly Ser Leu Cys Ser Lys lie lie Ala Asn Ser lie lie 225 230 235 240
Ser Gln Ser Gly Pro Thr Cys Thr Pro Ser Ser Gly Thr Ala Gly Ala 245 250 255
Ser Thr Ala Gly Gln Asp , Arg Ser Cys Leu Pro Ser Val Gly Phe Arg 260 265 270 Pro Thr Thr Asn Phe Ser Asp Gln' Gly Arg Gly Gly Leu Lys Leu Ala 275 280 285
20 Val lie Gly Met Gln Gln Arg Val Ser Thr lie Arg 290 295 300 <210> 29 <211> 1492 <212> ADN <213> Zea mays <400> 29 gcacgagctc acttgcttcg acgtatttct caatctatct atacggttca agggaccgaa 60 gaaggtagag agagaaactt gaaggggaga ggaaggagat acaggttcat gttcatttag 120 gtgtcagttc atctgatttc tcagaagcaa aatgttgttt ggagctcagt gacaccatct 180 tgtaatgcat gtgcctttta cgggaaatgg aggatcattc tgtccatcca aagtctaagt 240 ctaaccatgg ttccttgtca ggaaatggtt atgagatgaa aaatccaggc catgaagttt 300 gtgataggga ttcatcatca gagtctgatc gatctcaccc agaagcatca gcagtgagtg 360 aaagcagtct agatgaacac acatcaactc aatcagacaa tgatgaagat catgggaagg 420 ataatcagga cacattgaag ccagtattgt ccttggggaa ggaagggtct gcctttttgg 480 ccccaaaaat agattacaac ccgtcttttc cttatattcc ttatactgct gacgcttact 540 atggtggcgt tggggtcttg acaggatatg ctccgcatgc cattgtccat ccccagcaaa 600 atgatacaac aaatagtccg gttatgttgc ctgcggaacc tgcagaagaa gaaccaatat 660 atgtcaatgc aaaacaatac catgcaatcc ttaggaggag gcagacacgt gctaaactgg 720 aggcgcagaa caagatggtg aaaggtcgga agccatacct tcatgagtct cgacaccgtc 780 atgccatgaa gcgggcccgt ggctcaggag ggcggttcct caacacaaag cagcagctcc 840 aggagcagaa ccagcggtac caggcgtcga gtggttcaat gtgctcaaag accattggca 900 acagcgtaat ctcccaaagt ggccccattt gcacgccctc ttctgacgct gcaggtgctt 960 cagcagccag ccaggaccgc ggctgcttgc cctcggttgg cttccgcccc acagccaact 1020 tcagtgagca aggtggaggc ggctcgaagc tggtcatgaa cggcatgcag cagcgtgttt 1080 ccaccataag gtgaagagaa gtgggcacga caccattccc aggcgcgcac tgcctgtggc 1140 aactcatcct tggcttttga aactatggat atgcaatgga catgtagctt cgagttcctc 1200 agaataacca aacgtgaaga atatgcaaag tccttttgag atttgctgta gctgaaagaa 1260 ctgtggttag gttgagtttc ttcctggaga ctgatccata catgacatgc tacctcgtgc 1320 tgagtttctg aggtgaagcc atcgaaacat gaccgtgtgg ttcagtaaaa aaaaaaaaaa 1380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 1492 <210> 30 <211> 301 <212> PRT <213> Zea mays <400> 30 Met Cys Leu Leu Arg Glu Met Glu Asp His Ser Val His Pro Lys Ser 1 5 10 15 Lys Ser Asn His Gly Ser Leu Ser Gly Asn Gly Tyr Glu Met Lys Asn 20 25 30 Pro Gly His Glu Val Cys Asp Arg Asp Ser Ser Ser Glu Ser Asp Arg 35 40 45 Ser His Pro Glu Ala Ser Ala Val Ser Glu Ser Ser Leu Asp Glu His 50 55 60 Thr Ser Thr Gln Ser Asp Asn Asp Glu Asp His Gly Lys Asp Asn Gln 65 70 75 80 Asp Thr Leu Lys Pro Val Leu Ser Leu Gly Lys Glu Gly Ser Ala Phe 85 90 95
21 Leu Ala Pro Lys lie Asp Tyr Asn Pro Ser Phe Pro Tyr lie Pro Tyr 100 105 110 Thr Ala Asp Ala Tyr Tyr Gly Gly Val Gly Val Leu Thr Gly Tyr Ala 115 · 120 125 Pro His Ala lie Val His Pro Gln Gln Asn Asp Thr Thr Asn Ser Pro 130 135 140 Val Met Leu Pro Ala Glu Pro Ala Glu Glu Glu Pro lie Tyr Val Asn 145 150 155 160
Ala Lys Gln Tyr His Ala lie Leu Arg Arg Arg Gln Thr Arg Ala Lys 165 170 175
Leu Glu Ala Gln Asn Lys Met Val Lys Gly Arg Lys Pro Tyr Leu His 180 185 190 Glu Ser Arg His Arg His Ala Met Lys Arg ALa Arg Gly Ser Gly Gly 195 200 205 Arg Phe Leu Asn Thr Lys Gln Gln Leu Gln Glu Gln Asn Gln Arg Tyr 210 215 220 Gln Ala Ser Ser Gly Ser Met Cys Ser Lys Thr lie Gly Asn Ser Val 225 230 235 240 lie Ser Gln Ser Gly Pro lie Cys Thr Pro Ser Ser Asp Ala Ala Gly 245 250 255
Ala Ser Ala Ala Ser Gln Asp Arg Gly Cys Leu Pro Ser Val Gly Phe 260 265 270 Arg Pro Thr Ala Asn Phe Ser Glu Gln Gly Gly Gly Gly Ser Lys Leu 275 280 285 Val Met Asn Gly Met Gln Gln Arg Val Ser Thr lie Arg 290 295 300 <210> 31 <211> 725 <212> ADN <213> Zea mays <220> <221> inseguro <222> (546) <223> n = A, C, G. o T <220> <221> inseguro <222> (554) <223> n = A, C, G, o T <220> <221> inseguro <222> (636) <223> n = A, C, G, o T
22 <220> <221> inseguro <222> (671) <223> n = A, C, G, o T <220> <221> inseguro <222> (697) <223> n = A, C, G, o T <400> 31 gcagcaaaca ctagggtacc attgccagtt gggcctgcag cagaggaacc catatttgtc 60 aatgcaaagc aatacaatgc tatcctccgg aggaggcaaa aacgcgcaaa actggaggcc 120 caaaataaac tggtgaaagg tcggaagcca tatctccatg aatctcggca tcgtcatgca 180 atgaagcgag tccgtggacc agggcgtttc ctcaacaaaa aggagctcca ggagcagcag 240 ctgaaggcac tgccttcact tcagactcca acaggtgggg tcagcaaaat ggcctttggc 300 aggaacctat gccctgaaag cagcacatct cactcgcctt cgacgagctc tacaatctcg 360 agtgcttcaa actggagtgg cacgctagct catcaagage acgttagctt cgcatctgct 420 aataaattcc tccccagcat gaacttccac gcggagaatg gagtgaaaag atggccatca 480 atggcgtccg ccaccacacc cctgtcctga gtgaacaacc ttcaactgtg ggggtgctgt 540 gctggnacca tcantgggcg cgctccgtgt gcccgtggca attcatcttg gcttatgatg 600 tatcttatag ttaatttgct ttcactttca tatggnactt gtctcagatt aaactcgtga 660 tatttattgc nactgggatg actggaaata atctcangtt tcttaccaaa aaaaaaaaaa 720 aaaaa 725
<210> 32 <211> 169 <212> PRT <213> Zea mays <400> 32 Ala Ala Asn Thr Arg Val Pro Leu Pro Val Gly Pro Ala Ala Glu Glu 1 5 10 15 Pro lie P e Val Asn Ala Lys Gln Tyr Asn Ala lie Leu Arg Arg Arg 20 25 30 Gln Lys Arg Ala Lys Leu Glu Ala Gln Asn Lys Leu Val Lys Gly Arg 35 40 45 Lys Pro Tyr Leu His Glu Ser Arg His Arg His Ala Met Lys Arg Val 50 55 60 Arg Gly Pro Gly Arg Phe Leu Asn Lys Lys Glu Leu Gln Glu Gln Gln 65 70 75 80
Leu Lys Ala Leu Pro Ser Leu Gln Thr Pro Thr Gly Gly Val Ser Lys 85 90 95 Met Ala Phe Gly Arg Asn Leu Cys Pro Glu Ser Ser Thr Ser His Ser 100 105 110 Pro Ser Thr Ser Ser Thr lie Ser Ser Ala Ser Asn Trp Ser Gly Thr 115 120 125 Leu Ala His Gln Glu His Val Ser Phe Ala Ser Ala Asn Lys Phe Leu 130 135 140
23 Pro Ser Met Asn Phe His Ala Glu Asn Gly Val Lys Arg Trp Pro Ser 145 150 155 Met Ala Ser Ala Thr Thr Pro Leu Ser 165 <210> 33 <211> 831 <212> ADN <213> Zea mays <400> 33 ccacgcgtcc gcatatatgt gaatcccaaa caatatcacg ggatacttcg cagaagacag 60 ttacgtgcca agctagaggc tcagaacaag ctagtcagag cccgaaagtc ttaccttcat 120 gagtctaggc atcttcatgc aatgaagagg gcacgaggtt ccggtggacg attcctcaac 180 actaagcagc tccagcagtc tcacacagcc ctcaccaggt ccaccaccac aagtggcaca 240 agctcctcag gctcaactca tctgcggctt ggtggtggcg cagccgcagc tggagatcga 300 tctgtgctgg cacccaaaac aatggcctca caagacagta*gcaagaaggc cgtttcttca 360 gccctcgcct tcactgcgac tccaatgctg cgcagagatg acggcttctt gcagcaccca 420 agccatcttt tcagtttttc tggtcatttt gggcaggcaa gcgcgcaagc tggcgtccat 480 aatggaagtc agcatagggt tccagttatg agatgaccgg tttgcgaacc atagctggtg 540 atccaggcgt ctagggtcaa cttcgctgtg gtgtcttagt ctctcaggca attcatcctt 600 ggcttaattt ctggcttttt attagaaggt accaaaatgt gttccatacc gttgtggcca 660 cagagcccat aaaccagggg gtttgatggt tggcactcct acccaaacta ttgttgcagt 720 ggtgtttgtt agaataaacc ttgactatta ttctgtacaa tttgccttta tcttgtactg 780 ccaattattg tgtagtggtc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa g 831
<210> 34 <211> 98 <212> PRT <213> Zea mays <400> 34 lie Tyr Val Asn Pro Lys Gln Tyr His Gly lie Leu Arg Arg Arg Gln 1 5 10 15 Leu Arg Ala Lys Leu Glu Ala Gln Asn Lys leu Val Arg Ala Arg Lys 20 25 30 Ser Tyr Leu His Glu Ser Arg His Leu His Ala Met Lys Arg Ala Arg 35 40 45 Gly Ser Gly Gly Arg Phe Leu Asn Thr Lys Gln Leu Gln Gln Ser His 50 55 60 Thr Ala Leu Thr Arg Ser Thr Thr Thr Ser Gly Thr Ser Ser Ser Gly 65 70 75 80
Ser Thr His Leu Arg Leu Gly Gly Gly Ala Ala Ala Ala Gly Asp Arg 85 90 95 Ser Val
<210> 35 <211> 1307
24 <212> ADN <213> Zea mays <400> 35 ccacgcgtoc gctgtctgtg tgcgagcgca agagaaaggg agtcagagag agagagagag 60 ggaggagacc ttgcagagga gcgaagcaag caaggtggga aagaggcagc agcaagggcg 120 gcgggctgcc ggaaggggaa catgctccct cctcatctca cagtacgaac tgaaaaacaa 180 gagtaaagaa tttccgtgag atgagacaga atggcgcggt gatgattcag tttggccatc 240 agatgcctga ttacgactcc ccggctaccc agtcaaccag tgagacgagc catcaagaag 300 cgtctggaat gagcgaaggg agcctcaacg agcataataa tgaccattca ggcaaccttg 360 atgggtactc gaagagtgac gaaaacaaga tgatgtcagc gttatccctg ggcaatccgg 420 aaacagctta cgcacataat ccgaagcctg accgtactca gtccttcgcc atatcatacc 480 catatgccga tccatactac ggtggcgcgg tggcagcagc ttatggcccg catgctatca 540 tgcaccctca gctggttggc atggttccgt cctctcgagt gccactgccg atcgagccag 600 ccgctgaaga gcccatctat gtcaacgcga agcagtacca cgctattctc cggaggagac 660 agctccgtgc aaagctagag gcggaaaaca agctcgtgaa aagccgcaag ccgtacctcc 720 acgagtctcg gcacctgcac gcgatgaaga gagctcgggg aacaggcggg cggttcctga 780 acacgaagca gcagccggag tcccccggca gcggcggctc ctcggacgcg caacgcgtgc 840 ccgcgaccgc gagcggcggc ctgttcacga agcatgagca cagcctgccg cccggcggtc 900 gccaccacta tcacgcgaga gggggcggtg agtagggagc cccgacactg gcaactcatc 960 cttggcttat cagcgattcg actcggctct ccctcgtctg aaactgaact ctctgcaact 1020 actgtaactg taactaaact gggtgtgccc ggattggcgg tcgttctgtt ctactactag 1080 tacctgctac gcgtcgttgg gttgggtctg gactagagag cgtgctggtt ctttgatgaa 1140 cttggctgga cttgagggtg ttgactagcg cgaagctgag ttccatgtaa aacttttgct 1200 tcaagaccga tgactggcgg cataataagt- agcagtaata cccaaaaaaa aaaaaaaaaa 1260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaag 1307
<210> 36 <211> 244 <212> PRT <213> Zea mays <400> 36 Met Arg Gln Asn Gly Ala Val Met lie Gln Phe Gly His Gln Met Pro 1 5 10 15 Asp Tyr Asp Ser Pro Ala T r Gln Ser Thr Ser Glu Thr Ser His Gln 20 25 30 Glu Ala Ser Gly Met Ser Glu Gly Ser Leu Asn Glu His Asn Asn Asp 35 40 45 His Ser Gly Asn Leu Asp Gly Tyr Ser Lys Ser Asp Glu Asn Lys Met 50 55 60 Met Ser Ala Leu Ser Leu Gly Asn Pro Glu Thr Ala Tyr Ala His Asn 65 70 75 BO Pro Lys Pro Asp Arg Thr Gln Ser Phe Ala lie Ser Tyr Pro Tyr Ala 85 90 95 Asp Pro Tyr Tyr Gly Gly Ala Val Ala Ala Ala Tyr Gly Pro His Ala 100 105 110 lie Met His Pro Gln Leu Val Gly Met Val Pro Ser Ser Arg Val Pro 115 120 125 Leu Pro lie Glu Pro Ala Ala Glu Glu Pro lie Tyr Val Asn Ala Lys 130 135 140
25 Gln Tyr His Ala lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu Glu 145 150 155 160
Ala Glu Asn Lys Leu Val Lys Ser Arg Lys Pro Tyr 'Leu His Glu Ser 165 170 175 Arg His Leu His Ala Met Lys Arg Ala Arg Gly Thr Gly Gly Arg Phe 180 185 190 Leu Asn Thr Lys Gln Gln Pro Glu Ser Pro Gly Ser Gly Gly Ser Ser 195 200 205 Asp Ala Gln Arg Val Pro Ala Thr Ala Ser Gly Gly Leu Ehe Thr Lys 210 215 220 His Glu His Ser Leu Pro Pro Gly Gly Arg His His Tyr His Ala Arg 225 230 235 240
Gly Gly Gly Glu
<210> 37 <211> 816 <212> ADN <213> Zea mays <400> 37 ccacgcgtcc gcgcagaaca agatggtgaa aggccggaag ccataccttc atgagtctcg 60 acaccgtcat gccatgaagc gggcccgtgg ctcaggaggg cggttcctca acacaaagca 120 gcagccccag gagcagaacc agcagtacca ggcgtcgagt ggttcaatgt gctcaaagac 180 cattggcaac agcgtaatct cccaaagtgg ccccatttgc acgccctctt ctgacgctgc 240 aggtgcttca gcagccagcc aggaccgcgg ctgcttgccc tcggtgggct tccgccccac 300 agccaacttc agtgagcaag gtggaggcgg ctcgaagctg gtcgtgáacg gcatgcagca 360 gcgtgtttcc accataaggt gaagagaagt gggcacgaca ccattcccag gcgcgcactg 420 cctgtggcaa ctcatccttg gcttttgaaa ctatggatat gcaatggaca tgtagcttcg 480 agttcctcag aataaccaaa cgtgaagaat atgcaaagtc cttttgagat ttgctgtagc 540 tgaaagaact gtggttaggt tatgagtttc ttcctggaga ctgatccata catgacatgc 600 tacctcgtgc tgagtttctg aggtgaagcc atcgaaacat gaccgtgtgg ttcagtaccc 660 ttgctgcctt cagtgtctga taagctagct ctccagtttg cagtttctct gaattccagc 720 atgtctagtc tctgcttatc ttttgcatgt aacgtgatgg tgacttagca tacacatcta 780 ttcatccatc tatgttctca aaaaaaaaaa aaaaag 816
<210> 38 <211> 78 <212> PRT <213> Zea mays <400> 38 His Ala Ser Ala Gln Asn Lys Met Val Lys Gly Arg Lys Pro Tyr Leu 1 5 10 15 His Glu Ser Arg His Arg His Ala Met Lys Arg Ala Arg Gly Ser Gly 20 25 30 Gly Arg Phe Leu Asn Thr Lys Gln Gln Pro Gln Glu Gln Asn Gln Gln 35 40 45
26 Tyr Gln Ala Ser Ser Gly Ser Met Cys Ser Lys Thr lie Gly Asn Ser 50 55 60 Val lie Ser Gln Ser Gly Pro lie Cys Thr Pro Ser Ser Asp 65 70 75 <210> 39 <211> 1630 <212> ADN <213> Argemona mexicana <400> 39 gcacgagtgc agacaagagt agattttatg aaatcgatgg ctctaaaatc tctaaaaagt 60 gagtgttcta gggtttattc ttttactgtt ctcaataaca attggatagg agattgattg 120 tttttgaagt aatttgaacc atgcactcga ttcctgggaa tgtgaatgca acagaatcgg 180 acgtgcaacg tactccgcaa tcaactattt gttctcaacc ttggtggtgt ggtactgtgt 240 ataacactgg ttcgtcagct gagttgggag aaagcacaat aaaatcgtct tcaatggaac 300 agccagacgg tggaatgggt attgatacca gagaatcaca tggtgatggt ggtcctaatg 360 agggggatgg tattacgaga aagatgcaca ccaccatggc ctcccaatct gggccagatg 420 gaaactatgg acatgaacat gggaatctgc agcatgctgc atctgcaatg ccccaaacta 480 gtggtgaata cgtcataccg cgtccacagt ttgagcttgt tggtcactca gttgcatgtg 540 caacgtaccc gtattctgat atgtattata ctggaatgat ggctgctttg ggaactcagg 600 ctcaggtaca tcctcattta tttggtgtac aacacaccag aatgccttta cctcttgaaa 660 tggctgaaga gcctgtctat gtaaatgcga agcaatatca tggaattctg agaogaaggc 720 agtcgcgtgc aaaggctgag ctagaaagga aactgattaa atctagaaag ccgtaccttc 780 atgaatctcg gcaccaacat gctatgagaa gggcaagggg ttgtggaggc cgttttctca 840 acacaaaaaa actcgaaaac gggtcatcta agcatacaac tgagaacagc atggcttctg 900 attgtaatgg taaccggaac tccccaagtg gtcaacaaga aatagaaggt tccaacgtgc 960 aggaatcaca ttcctacttt aacagcaatg ataaaagctg ctaccaacat aatcagggtc 1020 tgcagttatc aagtttccat ccattatctg gtgagagagg agaggaagga gactgttcag 1080 gcctgcagcg aggaagcatc tcggtgaacc aggcccagaa cagggccctc accatccagt 1140 gaacctctga gtaggggaat agggtttctc catcgtcagt atcccgtttg ctgttactgc 1200 tctgggactt caaataccat gtaagcaacg gaaagcagca atggcgctga agggatggac 1260 gcaaaccaga aacggattcc ccccaaggta attggtgttt ctcaggcaat tcattcttgg 1320 cttggttctt gtgtttgatg gggaaagagg agtgtaggtt ctatttggtt ctgtggtgtc 1380 cttacaactt ctctactctt tccctcttgt ttttttttta tcccttgttg tacaaaggaa 1440 atgatagtgg ctgttttaga atctaagtag tgagaagaaa ccaaaccaaa cccttttttc 1500 ttcaaaattt cgtgaaacat tgttttaact ctgtagacat caaaattttc taggcatgta 1560 aaatattcgt cttttttttt ttccatgaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1620 aaaaaaaaaa 1630 <210> 40 <211> 333 <212> PRT <213> Argemona mexicana <400> 40 Met His Ser lie Pro Gly Asn Val Asn Ala Thr Glu Ser Asp Val Gln 1 5 10 15 Arg Thr Pro Gln Ser Thr lie Cys Ser Gln Pro Trp Trp Cys Gly Thr 20 25 30 Val Tyr Asn Thr Gly Ser Ser Ala Glu Leu Gly Glu Ser Thr lie Lys 35 40 45 Ser Ser Ser Met Glu Gln Pro Asp Gly Gly Met Gly lie Asp Thr Arg 50 55 60
27 Glu Ser His Gly Asp Gly Gly Pro Asn Glu Gly Asp Gly lie Thr Arg 65 70 . 75 80
Lys Met His Thr Thr Met Ala Ser Gln Ser Gly Pro Asp Gly Asn Tyr 85 90 95
Gly His Glu His Gly Asn Leu Gln His Ala Ala Ser Ala Met Pro Gln 100 105 110 Thr Ser Gly Glu Tyr Val lie Pro Arg Pro Gln Phe Glu Leu Val Gly 115 120 125 His Ser Val Ala Cys Ala Thr Tyr Pro Tyr Ser Asp Met Tyr Tyr Thr 130 135 140 Gly Met Met Ala Ala Leu Gly Thr Gln Ala Gln Val His Pro His Leu 145 150 155 160
Phe Gly Val Gln His Thr Arg Met Pro Leu Pro Leu Glu Met Ala Glu 165 170 175
Glu Pro Val Tyr Val Asn Ala Lys Gln Tyr His Gly lie Leu Arg Arg 1-80 185 190 Arg Gln Ser Arg Ala Lys Ala Glu Leu Glu Arg Lys Leu lie Lys Ser 195 200 205 Arg Lys Pro Tyr Leu His Glu Ser Arg His Gln His Ala Met Arg Arg 210 215 220 Ala Arg Gly Cys Gly Gly Arg Phe Leu Asn Thr Lys Lys Leu Glu Asn 225 230 235 240
Gly Ser Ser Lys His Thr Thr Glu Asn Ser Met Ala Ser Asp Cys Asn 245 250 255
Gly Asn Arg Asn Ser Pro Ser Gly Gln Gln Glu lie Glu Gly Ser Asn 260 265 270 Val Gln Glu Ser His Ser Tyr Phe Asn Ser Asn Asp Lys Ser Cys Tyr 275 280 285 Gln His Asn Gln Gly Leu Gln Leu Ser Ser Phe His Pro Leu Ser Gly 290 295 300 Glu Arg Gly Glu Glu Gly Asp Cys Ser Gly Leu Gln Arg Gly Ser lie 305 310 315 320
Ser Val Asn Gln Ala Gln Asn Arg Ala Leu Thr lie Gln 325 330 <210> 41 <211> 1565 <212> ADN <213> Argemona mexicana <400> 41 ca'agaaagaa aagagagaag aaagaaaatt ttttgaaggt gggtttgaac agaggagaca
28 tgaccagatc tatcccaaca tctcttctcc ttatttctct cactttacca aatcccaaag 120 taaattcact ccagaagcgc gtaatatagg ttttcaaaaa cagttctgag gattttagat 180 tgttttcatc ttggtttgga atttaca~tag tgaagttaag tgaacaagaa tgcaagacaa 240 gtcaatttca catagtgttg ttagttgtcc aatttggtgg acttctactg gatcccaagt 300 tccacagagt tgtttatcaa agagtttaag cgtaaccttc gactcttctc gtcaagattg 360 cggtagtttg aagcagctag gttttcaact tcaagatcag gattcatcct cgactcaatc 420 aactggtcag tcgcatcatg aagtgggaaa tatgtctgga agcaacccta ctgggcaatg 480 catttcagct cagtgcgaaa aagttactta cgggaaacaa ggagatgttc aaacgaaatc 540 aattctatca cttggagctc cagaagttgt tctccctcaa caagttgatt ataaccacca 600 ctcagtggct cgtataccct atcattacgt tgatccgtat tacggtggca taatggcgtc 660 ttatggacca caggctatta ttcacccaca aatgatgggt ataacacctg cacgagtccc 720 attgcctctt gatcttgcag aaaatgagcc catgtatgtt aatgcaaaac agtaccgagc 780 aattcttaga cggaggcagt cccgtgctaa gcttgaggct caaaataaac ttatcaaaga 840 tcgcaagcct tatctacatg aatctcggca tcttcatgca ttgaagaggg ctaggggatc 900 tggtggacgt tttctcaaca cgaagcagct gcaagagttg aaacaaaaca actctaatgg 960 ccaaaatacc tccgagtcag cttatctaca gttgggagga aatctatctg aatcagaatt 1020 tggcaacggt ggcggtgctt ccaccacatc ctgctctgac atcactacag cctcaaacag 1080 cgaccacatt ttccgtcaac agaatctcag gtttgcgggt tacactcaca tgggtgggac 1140 catgcaagat ggaggtggag ggggcattat gagtaacggg, tctcaccacc gtgttcccgt 1200 tacacagtaa aaaacatggg gagaaaaaca actttgtcag ccttttcgat tttggtgtga 1260 agaatggtgt gtactctcag ggtggaactg gagaactggc tggcttgtgt tgtttaccca 1320 tgggcaaatc atccttggct ttgttacctt ttatttatca ctatactttt tatatgatgt 1380 ttcttgctat atatgttttg ttgattttaa cttccataga tggacaatga tgaatttctg 1440 atactggatt gtccttgaaa ctcttcgctt ttattatata ttttgcgaaa aaaaaaaaaa 1500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1560 aaaaa 1565
<210> 42 <211> 326 <212> PRT <213> Argemona mexicana <400> 42 Met Gln Asp Lys Ser lie Ser His Ser Val Val Ser Cys Pro lie Trp 1 5 10 15 Trp Thr Ser Thr Gly Ser Gln Val Pro Gln Ser Cys Leu Ser Lys Ser 20 25 30 Leu Ser Val Thr Phe Asp Ser Ser Arg Gln Asp Cys Gly Ser Leu Lys 35 40 45 Gln Leu Gly Phe Gln Leu Gln Asp Gln Asp Ser Ser Ser Thr Gln Ser 50 55 60 Thr Gl Gln Ser His His Glu Val Gly Asn Met Ser Gly Ser Asn Pro 65 70 75 80 Thr Gly Gln Cys lie Ser Ala Gln Cys Glu Lys Val Thr Tyr Gly Lys 85 90 95 Gln Gly Asp Val Gln Thr Lys Ser lie Leu Ser Leu Gly Ala Pro Glu 100 105 110 Val Val Leu Pro Gln Gln Val Asp Tyr Asn His His Ser Val Ala Arg 115 120 125 lie Pro Tyr His Tyr Val Asp Pro Tyr Tyr Gly Gly lie Met Ala Ser 130 135 140
29 Tyr Gly Pro Glii Ala lie lie His Pro Gln Met Met Gly lie Thr Pro 145 150 155 160 Ala Arg Val Pro Leu Pro Leu Asp Leu Ala Glu Asn Glu Pro Met Tyr 165 170 175 Val Asn Ala Lys Gln Tyr Arg Ala lie Leu Arg Arg Arg Gln Ser Arg 180 185 190 Ala Lys Leu Glu Ala Gln Asn Lys Leu lie Lys Asp Arg Lys Pro Tyr 195 200 205 Leu His Glu Ser Arg His Leu His Ala Leu Lys Arg Ala Arg Gly Ser 210 215 220 Gly Gly Arg Phe Leu Asn Thr Lys Gln Leu Gln Glu Leu Lys Gln Asn 225 230 235 240 Asn Ser Asn Gly Gln Asn Thr Ser Glu Ser Ala Tyr Leu Gln Leu Gly 245 250 255 Gly Asn Leu Ser Glu Ser Glu Phe Gly Asn Gly Gly Gly Ala Ser Thr 260 265 270 Thr Ser Cys Ser Asp lie Thr Thr Ala Ser Asn Ser Asp His lie Phe 275 280 285 Arg Gln Gln Asn leu Arg Phe Ala Gly Tyr Thr His Met Gly Gly Thr 290 295 300 Met Gln Asp Gly Gly Gly Gly Gly lie Met Ser Asn Gly Ser His His 305 310 315 320 Arg Val pro Val Thr Gln 325 <210> 43 <211> 1187 <212> ADN <213> Oyza sativa <400> 43 gcacgaggca gaggagagaa gcaaggtgag aagtgaggag -gcagcaaggg aggaggtttg 60 ccggagaggg gacatgctcc ctcctcatct cacagaaaat ggcacagtaa tgattcagtt 120 tggtcataaa atgcctgact acgagtcatc agctacccaa tcaactagtg gatctcctcg 180 tgaagtgtct ggaatgagcg aaggaagcct caatgagcag aatgatcaat ctggtaatct 240 tgatggttac acgaagagtg atgaaggtaa gatgatgtca gctttatctc tgggcaaatc 300 agaaactgtg tatgcacatt cggaacctga ccgtagccaa ccctttggca tatcatatcc 360 atatgctgat tcgttctatg gtggtgctgt agcgacttat ggcacacatg ctattatgca 420 tccccagatt gtgggcgtga tgtcatcctc ccgagtcccg ctaccaatag aaccagccac 480 cgaagagcct atttatgtaa atgcaaagca ataccatgcg attctccgaa ggagacagct 540 ccgtgcaaag ttagaggctg aaaacaagct ggtgaaaaac cgcaagccgt acctccatga 600 atcccggcat caacacgcga tgaagagagc tcggggaaca ggggggagat tcctcaacac 660 aaagcagcag cctgaagctt cagatggtgg caccccaagg ctcgtctctg caaacggcgt 720 tgtgttctca aagcacgagc acagcttgtc gtccagtgat ctccatcatc gtcgtgtgaa 780 agagggcgct tgagatcctc gccgtttctg tcatggcaaa tcatccttgg cttatgtgtg 840 gtgcccagca aaaaaaaatc tgactgaacc tgtgtgtaaa ctgatgggta tgggtgggtt 900 ttgtgcaact gtaactaggg tgcttgacat ctgtgtctgt tgttcctctg cctccttagt 960
30 ttggagacgg tgcagctgca gctggtacca gtaatctgat catgctagac ttgtgacaag 1020 gacaaaacta gcaccccgtt atgtttcctg gcttctgaat ttggtggtca ttcagtaagc 1080 aagcactcga cgtcagcggg agggggttgc ttcgattgat ctagttcttt cgcgataaac 1140 ttatttaatt ttgaacaaag gttggtttca aaaaaaaaaa aaaaaaa 1187
<210> 44 <211> 239 <212> PRT <213> Oyza sativa <400> 44 Met Leu Pro Pro His Leu Thr Glu Asn Gly Thr Val Met lie Gln Phe 1 5 10 15 Gly His Lys Met Pro Asp Tyr Glu Ser Ser Ala Thr Gln Ser Thr Ser 20 25 30 Gly Ser Pro Arg Glu Val Ser Gly Met Ser Glu Gly Ser Leu Asn Glu 35 40 - 45 Gln Asn Asp Gln Ser Gly Asn Leu Asp Gly Tyr Thr Lys Ser Asp Glu 50 55 60 Gly Lys Met Met Ser Ala Leu Ser Leu Gly Lys Ser Glu Thr Val Tyr 65 70 75 80 Ala His Ser Glu Pro Asp Arg Ser Gln Pro Phe Gly lie Ser Tyr Pro 85 90 95 Tyr Ala Asp Ser Phe Tyr Gly Gly Ala Val Ala Thr Tyr Gly Thr His 100 105 110 Ala lie Met His Pro Gln lie Val Gly Val Met Ser Ser Ser Arg Val 115 120 125 Pro Leu Pro lie Glu Pro Ala Thr Glu Glu Pro lie Tyr Val Asn Ala 130 135 140 Lys Gln Tyr His Ala lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu 145 150 155 160
Glu Ala Glu Asn Lys Leu Val Lys Asn Arg Lys Pro Tyr Leu His Glu 165 170 175 Ser Arg His Gln His Ala Met Lys Arg Ala Arg Gly Thr Gly Gly Arg 180 185 190 Phe Leu Asn Thr Lys Gln Gln Pro Glu Ala Ser Asp Gly Gly Thr Pro 195 200 205 Arg Leu Val Ser Ala Asn Gly Val Val Phe Ser Lys His Glu His Ser 210 215 220 Leu Ser Ser Ser Asp Leu His His Arg Arg Val Lys Glu Gly Ala 225 230 235 <210> 45 <211> 1442
31 <212> ADN <213> Oyza sativa <400> 45 gcacgagtac agcgctccgc attagggctc gcctctcgtt ggctagagcg cgagagccag 60 tagccgcagc tgcagcaagc agcagcagca gcgaagagcc tgagccccag aggaggcgtg 120 caccgcctcc gattggccgg cctctcggag agagagagag agagagagat cgatcgagtc 180 ctattggccg ccgcctccgc gccctggctg ctcactggtg agcgagcatg gagtcgaggc 240 cggggggaac caacctcgtg gagccgaggg ggcagggcgc gctgccgtcc ggcataccga 300 tccagcagcc gtggtggacg acctccgccg gggtcggggc ggtgtcgccc gccgtcgtgg 360 cgccggggag cggtgcgggg atcagcctgt cgggcaggga tggcggcggc gacgacgcgg 420 cagaggagag cagcgatgac tcacgaagat caggggagac caaagatgga agcactgatc 480 aagaaaagca tcatgcaaca tcgcagatga ctgctttggc atcagactat ttaacaccat 540 tttcacagct ggaactaaac caaccaattg cttcggcagc ataccagtac cctgactctt 600 actatatggg catggttggt ccctatggac ctcaagctat gtccgcacag actcatttcc 660 agctacctgg attaactcac tctcgtatgc cgttgcctct tgaaatatct gaggagcctg 720 tttatgtaaa tgctaagcaa tatcatggaa ttttaagacg gaggcagtca cgtgcgaagg 780 ctgaacttga gaaaaaagtt gttaaatcaa gaaagcccta tcttcatgag tctcgtcatc 840 aacatgctat gcgaagggca agaggaacgg gtggacgctt cctgaacaca aagaaaaatg 900 aagatggtgc tcccagtgag aaagccgaac caaacaaagg agagcagaac tccgggtatc 960 gccggatccc tcctgactta cagctcctac agaaggaaac atgaagtagc ggctcgaaac 1020 ctagaacagt ggcttctgtc caccggcatt cactcttgag gtgattcttg ctccagaatt 1080 gtgctccatc tttcaaatga tcttcatcga gcaaagtaat tatatgtaca ttcctctgaa 1140 tgatctatgc accaattgtt gatcctggca gggtaataat ctggatgtat tgagtccatc 1200 acagtgcgaa tgtcacgggt agatctgctg ttttcaggca attcattctt ggctttctat 1260 cccacccgtt gttgttgcaa gttaagctag cagtacttgt ctcagtgtcc gtgagacgtt 1320 tgtgtaagat taggttaaac tagaagttgt aatgctgtat taagtgtttg tatttctaat 1380 atgaaccgta acaaggccag agcagaactc gttatacata caaaaaaaaa aaaaaaaaaa 1440 aa ' 1442
<210> 46 <211> 258 <212> PRT <213> Oyza sativa <400> 46 Met Glu Ser Arg Pro Gly Gly Thr Asn Leu Val Glu Pro Arg Gly Gln 1 5 10 15 Gly Ala Leu Pro Ser Gly lie Pro lie Gln Gln Pro Trp Trp Thr Thr 20 25 30 Ser Ala Gly Val Gly Ala Val Ser Pro Ala Val Val Ala Pro Gly Ser 35 40 45 Gly Ala Gly lie Ser Leu Ser Gly Arg Asp Gly Gly Gly Asp Asp Ala 50 55 60 Ala Glu Glu Ser Ser Asp Asp Ser Arg Arg Ser Gly Glu Thr Lys Asp 65 70 75 80 Gly Ser Thr Asp Gln Glu Lys His His Ala Thr Ser Gln Met Thr Ala 85 90 95 Leu Ala Ser Asp Tyr Leu Thr Pro Phe Ser Gln Leu Glu Leu Asn Gln 100 105 110 Pro lie Ala Ser Ala Ala Tyr Gln Tyr Pro Asp Ser Tyr Tyr Met Gly 115 120 125
32 Met Val Gly Pro Tyr Gly Pro Gln Ala Met Ser Ala Gln Thr His Phe 130 135 140 Gln Leu Pro Gly Leu Thr His Ser Arg Met Pro Leu Pro Leu Glu lie 145 150 155 160
Ser Glu Glu Pro Val Tyr Val Asn Ala Lys Gln Tyr His Gly lie Leu 165 ?0 175
Arg Arg Arg Gln Ser Arg Ala Lys Ala Glu Leu Glu Lys Lys Val Val 180 185 190 Lys Ser Arg Lys Pro Tyr Leu His Glu Ser Arg His Gln His Ala Met 195 200 205 Arg Arg Ala Arg Gly Thr Gly Gly Arg Phe Leu Asn Thr Lys Lys Asn 210 215 220 Glu Asp Gly Ala Pro Ser Giu Lys Ala Glu Pro Asn Lys Gly Glu Gln 225 230 235 240
Asn Ser Gly Tyr Arg Arg lie Pro Pro Asp Leu Gln Leu Leu Gln Lys 245 250 255
Glu Thr
<210> 47 <211> 423 <212> ADN <213> Oyza sativa <220> <221> inseguro <222> (223) <223> n = A, C, G <220> <221> inseguro <222> (330) <223> n = A, C, G <220> <221> inseguro <222> (369) <223> n = A, C, G <220> <221> inseguro <222> (389) <223> n = A, C, G <220> <221> inseguro <222> (402) <223> n = A, C, G
33 <400> 47 cattggttct aatcttgaca gagtttaagg ttggcacttt ctgtcagaag ttaagttagg 60 acttccacaa aattatacca tctctgggtg ttcttatagg tgtttctcac tatcaggaat 120 gtacagttct tgcagctgtc aagttctttg tacctatgtt tctgtatctt ctaaagattt 180 tgattcgtct gcactgtgca gccatatctc catgagtcac ggnatcaaca tgccctgaaa 240 agggctaggg gagctggagg ccgatttctt aattcaaaat cggatgacaa ggaaagagca 300 ttctgattcc aagttccaag agataaacan gatggagttg cacccccgtg ataatgggca 360 aacgtctanc tctccgtctt caaaggggng gatcatcagc tnaacaaaat aaagaagtca 420 aaa 423
<210> 48 <211> 34 <212> PRT <213> Oyza sativa <220> <221> INSEGURO <222> (9) <223> Xaa = cualquier aminoácido <400> 48 Gln Pro Tyr Leu His Glu Ser Arg Xaa Gln His Ala Leu Lys Arg Ala 1 5 10 15 Arg Gly Ala Gly Gly Arg Phe Leu Asn Ser Lys Ser Asp Asp Lys Glu 20 25 30 Arg Ala
<210> 49 <211> 479 <212> ADN <213> Oyza sativa <400> 49 ctcttctcat ctcatctccc tctcctctcc tctcgccgtc gccgtcgccg tcgccgccgc 60 tcgccgccgg cggggataga gttcgccggg atcgcctcgc cgggagagtt ccctcaccat 120 cccgcacctc cgctcgcctg gcctcttcct cccggaagtg tggtgtgctg caagctcctg 180 tctctcctac aaggtttcaa aaccaaaata tgcctgaagc acacggaaag ctggggtgat 240 taacgtctgt ttcttttgac tacaatcatc ctgattctgc ttctgtctgc aaaaacaacc 300 aagccatgac gtctgtagtt catgatgttt caggcaacca tggagctgat gagcggcaaa 360 aacagcaaag gcaaggtgaa cctgaggacc aagcaagaag cctcagttac tagtacagat 420 agccatacaa tggtaagcaa caccttcaac agattatgcg acaacctatg cccatcacg 479 <210> 50 <211> 35 <212> PRT <213> Oyza sativa <400> 50 Met Thr Ser Val Val His Asp Val Ser Gly Asn His Gly Ala Asp Glu 1 5 10 15 Arg Gln Lys Gln Gln Arg Gln Gly Glu Pro Glu Asp Gln Ala Arg Ser 20 25 30
34 Leu Ser Tyr 35 <210> 51 <211> 1107 <212> ADN <213> Oyza sativa <400> 51 gcacgagcaa ttatccttgt attgaccaat gctatggtct tatgaccacc tacgcgatga 60 aatcaatgag tggcgggcga atgctactgc cgctgaacgc gccagccgat gcgccgatct 120 atgtcaacgc gaagcagtac gaaggcatcc tccgccgtcg ccgtgcccgc gccaaggccc 180 agagggagaa caggctggtc aaaggcagga agccctacct ccacgagtcg cgccaccgcc 240 acgccatgcg ccgggccaga ggctccggcg gccgcttcct caacaccaag aaagaagcca 300 ccgccgccgg atgcggcggc agcagcaaga cgcccctcgc gtccctcgtc agccccgccg 360 acgtagccca tcgtccaggc tccggcggcc gcgcgtccag cctctccggc tccgacgtgt 420 cgtcgccggg aggcgtcatg tacgaccacc accgccacga cgacgccgac gcggcggacc 480 actacaacag catcgaccac cacctccgca cgccgttctt caccccgctc ccgatcatca 540 tggacagcgg cggcggcggc ggcgaccacg cctcacacto cgccgccgcc gtcgccgccc 600 ccttcaggtg ggcgacggcg gccggcgacg gctgctgcga gctcctcaag gcgtgacagc 660 cttgaggcgg ggatctccag gcgtgcccag agctgctgct gatcgatcac catcagcttt 720 ggctgcctgt aggcaaatca ttcttggctc tttacttgca ttggggttct tgcaagcaac 780 tctcctcgtc acctaccaaa actgtccctg aaacttctct agtgctgggg tctcgatcag 840 ggatgatgat gtgatggagg agaggcttac ccatatgcct gtaaattatg gttagtgttc 900 tgattaagca actagtagta cttggtaatt actggctatg aattagtagt atggactctg 960 gtgtcaggtt gctctttgtc tgaataaact ggagtcgttt gaagctttgc aaaaaaaaaa 1020 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1080 aaaaaaaaaa aaaaaaaaaa aaaaaaa 1107
<210> 52 <211> 217 <212> PRT <213> Oyza sativa <400> 52 Thr Ser Asn Tyr Pro Cys lie Asp Gln Cys Tyr Gly Leu Met Thr Thr 1 5 10 15 Tyr Ala Met Lys Ser Met Ser Gly Gly Arg Met Leu Leu Pro Leu Asn 20 25 30 Ala Pro Ala Asp Ala Pro lie Tyr Val Asn Ala Lys Gln Tyr Glu Gly 35 40 45 lie Leu Arg Arg Arg Arg Ala Arg Ala Lys Ala Gln Arg Glu Asn Arg 50 55 60 Leu Val Lys Gly Arg Lys Pro Tyr Leu His Glu Ser Arg His Arg His 65 70 75 80 Ala Met Arg Arg Ala Arg Gly Ser Gly Gly Arg Phe Leu Asn Thr Lys 85 90 95 Lys Glu Ala Thr Ala Ala Gly Cys Gly Gly Ser Ser Lys Thr Pro Leu 100 105 110 Ala Ser Leu Val Ser Pro Ala Asp Val Ala His Arg Pro Gly Ser Gly 115 120 125
35 Gly Arg Ala Ser Ser Leu Ser Gly Ser Asp Val Ser Ser Pro Gly Gly 130 135 140 Val Met Tyr Asp His His Arg His Asp Asp Ala Asp Ala Ala Asp His 145 150 155 160
Tyr Asn Ser lie Asp His His Leu Arg Thr Pro Phe Phe Thr Pro Leu 165 170 175 Pro lie lie Met Asp Ser Gly Gly Gly Gly Gly Asp His Ala Ser His 180 185 190 Ser Ala Ala Ala Val Ala Ala Pro Phe Arg Trp Ala Thr Ala Ala Gly 195 200 205 Asp Gly Cys Cys Glu Leu Leu Lys Ala 210 215 <210> 53 <211> 977 <212> ADN <213> Oyza sativa <400> 53 gcacgaggca aactctagga tgccattgcc tgttgatcct tctgtagaag agcccatatt 60 tgtcaatgca aagcaataca atgcgatcct tagaagaagg caaacgcgtg caaaattgga 120 ggcccaaaat aaggcggtga aaggtcggaa gccttacctc catgaatctc gacatcatca 180 tgctatgaag cgagcccgtg gatcaggtgg tcggttcctt accaaaaagg agctgctgga 240 acagcagcag cagcagcagc agcagaagcc accaccggca tcagctcagt ctccaacagg 300 tagagccaga acgagcggcg gtgccgttgt ccttggcaag aacctgtgcc cagagaacag 360 cacatcctgc tcgccatcga caccgacagg ctccgagatc tccagcatct catttggggg 420 cggcatgctg gctcaccaag agcacatcag cttcgcatcc gctgatcgcc accccacaat 4B0 gaaccagaac caccgtgtcc ccgtcatgag gtgaaaacct cgggatcgcg ggacacgggc .540 ggttctggtt taccctcact ggcgcactcc ggtgtgcccg tggcaattca tccttggctt 600 atgaagtatc tacctgataa tagtctgctg tcagtttata tgcaatgcaa cctctgtcag 660 ataaactctt atagtttgtt ttattgtaag ctatgactga acgaactgtc gagcagatgg 720 ctaatttgta tgttgtgggt acagaaatcc tgaagctttt gatgtaccta attgcctttt 780 gcttatactc ttggtgtata cccattacca agttgcctta aaaaccctcc aattatgtaa 840 tcagtcatgg ttttatagaa ccttgccaca tgtaatcaat cacctgtttt tgtaaattga 900 tctataaacg ctataggctg ctgtgttatc tgcatttaaa aaaaaaaaaa aaaaaaaaaa 960 aaaaaaaaaa aaaaaaa 977
<210> 54 <2H> 168 <212> PRT <213> Oyza sativa <400> 54 Ala Asn Ser Arg Met Pro Leu Pro Val Asp Pro Ser Val Glu Glu Pro 1 5 10 15 lie Phe Val Asn Ala Lys Gln Tyr Asn Ala lie Leu Arg Arg Arg Gln 20 25 30 Thr Arg Ala Lys Leu Glu Ala Gln Asn Lys Ala Val Lys Gly Arg Lys 35 40 45
36 Pro Tyr Leu His Glu Ser Arg His His His Ala Met Lys Arg Ala Arg 50 55 60 Gly Ser Gly Gly Arg Phe Leu Thr Lys Lys Glu Leu Leu Glu Gln Gln 65 '70 75 80 Gln Gln Gln Gln Gln Lys Pro Pro Pro Ala Ser Ala Gln Ser Pro 85 90 95
Thr Gly Arg Ala Arg Thr Ser Gly Gly Ala Val Val Leu Gly Lys Asn 100 105 110 Leu Cys Pro Glu Asn Ser Thr Ser Cys Pro Ser Thr Pro Thr Gly 115 120 125 Ser Glu lie Ser Ser lie Ser Phe Gly Gly Met Leu Ala His Gln 130 135 140 Glu His lie Ser Phe Ala Ser Ala Asp Arg His Pro Thr Met Asn Gln 145 150 15S 160
Asn His Arg Val Pro Val Met Arg 165 <210> 55 <211> 465 <212> ADN <213> Oyza sativa <220> <221> inseguro <222> (280) <223> n = A, C, G, o T <220> <221> inseguro <222> (325) <223> n = A, C, G, o T <220> <221> inseguro <222> (349) <223> n = A, C, G, o T <220> <221> inseguro <222> (358) <223> n = A, C, G, o T <220> <221> inseguro <222> (368) <223> n = A, C, G, o T <220> <221> inseguro <222> (379) <223> n = A, C, G, o T
37 <220> <221> inseguro <222> (385) <223> n = A, C, G, o T <220> <221> inseguro <222> (425) <223> n = A, C, G, o T <220> <221> inseguro <222> (429) .. (430) <223> n = A, C, G, o T <220> <221> inseguro <222> (436) <223> n = A, C, G, o T <220> <221> inseguro <222> (459) <223> n = A, C, G, o T <220> <221> inseguro <222> (464) <223> n = A, C, G, o T <400> 55 cttacagcag ccttaccttc acgaatctcg gcatcgccat gcaatgaaga gggctagggg 60 cactggtggg cgattcctga ataccaagca gctccagctg cagcaacagt ctcacactac 120 ctccaccaag accáccacag acagccaaaa ttcttcaggt tcaagtcatc tacggctagg 180 tggtggcgca atcggagatc aaactccatt tccgttcaaa gcaatggatt cacaagctaa 240 catcaagaga gctgcagctt ctgcttccac cttcactgtn acttctgcgg gacaaaaaga 300 cgacgccttc ttcgaccgcc atggncaaca tctcaataac ttctccggnc attttggnca 360 agcaagcnca caaaggggng tcggnaagca tgcataaccg gtcaaaagca agagggttcc 420 tgctnatgnn gatganatga aagagcagct tggaaatcna acant 465 <210> 56 <211> 131 <212> PRT <213> Oyza sativa <220> <221> INSEGURO <222> (123) <223> Xaa = cualquier aminoácido <400> 56 Leu Gln Gln Pro Tyr, Leu His Glu Ser Arg His Arg His Ala Met Lys 1 5 10 15 Arg Ala Arg Gly Thr Gly Gly Arg Phe Leu Asn Thr Lys Gln Leu Gln 20 25 30 Leu Gln Gln Gln Ser His Thr Thr Ser Thr Lys Thr Thr Thr Asp Ser 35 40 45
38 Gln Asn Ser Ser Gly Ser Ser His Leu Arg Leu Gly Gly Gly Ala lie 50 55 60 Gly Asp Gln Thr Pro Phe Pro Phe Lys Ala Met Asp Ser Gln Ala Asn 65 70 75 80 lie Lys Arg Ala Ala Ala Ser Ala Ser Thr Phe Thr Val Thr Ser Ala 85 90 95 Gly Gln Lys Asp Asp Ala Phe Phe Asp Arg His Gly Gln His Leu Asn 100 105 110 Asn Phe Ser Gly His Phe Gly Gln Ala Ser Xaa Gln Arg Gly Val Gly 115 120 125 Lys His Ala 130 <210> 57 <211> 1482 <212> ADN <213> Glycine max <400> 57 tttctgttct tctctgggga tctgaagaca tgcagtccaa gtctgaaact gcaaatcgac 60 tgagatcaga tcctcattcc tttcaacctg gcagtgttta ttctgagcct tggtggcgtg 120 gtattgggta caatcctgtg gcccaaacaa tggctggggc aaatgcatcc aattcatcgt 180 ctcttgaatg ccctaatggt gattctgaat ccaatgaaga aggtcaatct ttgtccaata 240 gcgggatgaa tgaggaagat gatgatgcca ctaaggattc acagcctgct gttcctaatg 300 gaacaggaaa ttatgggcaa gaacagcaag ggatgcagca tactgcatca tctgcaccct 360 ccatgcgtga agaatgcctt actcagacac cacagctgga acttgtcggt cattcaattg 420 catgtgctac aaatccttat caggatccgt attatggggg catgatggca gcttatggtc 480 accaacagtt gggatatgct ccttttatag gaatgcctc tgccagaatg cctttgcccc 540 ttgagatggc tcaagaacct gtgtatgtga atgccaaaca gtaccaagga attctgaggc 600 gaagacaggc tcgtgctaaa gcagagcttg aaaggaagct cataaaatct agaaagccat 660 atcttcatga atctaggcat cagcatgcta tgagaagggc aaggggtact ggaggacgat 720 ttgcaaagaa aactgacggt gagggctcaa accactcagg caaggaaaag gataatggta 780 ctgattctgt cctatcatca caatcaatta gttcatctgg ttctgaacct ttacattctg 840 actctgccga aacctggaat tctcctaaca tgcaacaaga tgcaagagca tcaaaagtgc 900 acaacaggtt caaagcaccc tgttaccaaa atggcagtgg ctcctaccat aatcataatg 960 gattgcaatc ttcagtgtac cattcatcct caggtgaaag actggaggaa agggattgtt 1020 cgggtcagca actgaaccac aattgatggg gggttagagg ccgaggttgg tttgtatcca 1080 agtgacatat ttggtgaata ccttggttat ctgtaaacac tcttggcaat atatatgcca 1140 agcggcaaat cattcttggc tttgttcttg tgtttgtggt gttaatgata ctatgggggg 1200 ggtggggggg gggggaatga ttggtatttg agatttctgt tgaagtcagt caatcaatcc 1260 ttcgttcttt tctcattttt gcattttgta aagttttata gtggttagga tggtcacttc 1320 agaagattat ggagtatggt gagaaacaaa ctcttgatgt gccaacactc gtttgactgg 1380 tttatctttg tgtagttcaa ccggttgtta atgttaacat aagacatcat aggataatga 1440 acatgctgtt agttacatta catcaaaaaa aaaaaaaaaa aa 1482
<210> 58 <211> 338 <212> PRT <213> Glycine max
39 <400> 58 Met Gln Ser Lys Ser Glu Thr Ala Asn Arg Leu Arg Ser Asp Pro His 1 5 ' 10 15
Ser Phe Gln Pro Gly Ser Val Tyr Ser Glu Pro Trp Trp Arg Gly lie 20 25 30 Gly Tyr Asn Pro Val Ala Gln Thr Met Ala Gly Ala Asn Ala Ser Asn 35 40 45 Ser Ser Ser Leu Glu Cys Pro Asn Gly Asp Ser Glu Ser Asn Glu Glu 50 55 60 Gly Gln Ser Leu Ser Asn Ser Gly Met Asn Glu Glu Asp Asp Asp Ala 65 70 75 80
Thr Lys Asp Ser Gln Pro Ala Val Pro Asn Gly Thr Gly Asn Tyr Gly 85 . 90 95
Gln Glu Gln Gln Gly Met Gln His Thr Ala Ser- Ser Ala Pro Ser Met 100 105 110 Arg Glu Glu Cys Leu Thr Gln Thr Pro Gln Leu Glu Leu Val Gly His 115 120 125 Ser lie Ala Cys Ala Thr Asn Pro Tyr Gln Asp Pro Tyr Tyr Gly Gly
130 135 140 Met Met Ala Ala Tyr Gly His Gln Gln Leu Gly Tyr Ala Pro Phe lie 145 150 155 160
Gly Met Pro His Ala Arg Met Pro Leu Pro Leu Glu Met Ala Gln Glu 165 170 175
Pro Val Tyr Val Asn Ala Lys Gln Tyr Gln Gly lie Leu Arg Arg Arg 180 185 190 Gln Ala Arg Ala Lys Ala Glu Leu Glu Arg Lys Leu lie Lys Ser Arg 195 200 205 Lys Pro Tyr Leu His Glu Ser Arg His Gln His Ala Met Arg Arg Ala 210 215 220 Arg Gly Thr Gly Gly Arg Phe Ala Lys Lys Thr Asp Gly Glu Gly Ser 225 230 235 240
Asn His Ser Gly Lys Glu Lys Asp Asn Gly Thr Asp Ser Val Leu Ser 245 250 255
Ser Gln Ser lie Ser Ser Ser Gly Ser Glu Pro Leu His Ser Asp Ser 260 265 270 Ala Glu Thr Trp Asn Ser Pro Asn Met Gln Gln Asp Ala Arg Ala Ser 275 280 285 Lys Val His Asn Arg Phe Lys Ala Pro Cys Tyr Gln Asn Gly Ser Gly 290 295 300 Ser Tyr His Asn His Asn Gly Leu Gln Ser Ser Val Tyr His Ser Ser 305 310 315 320
40 Gly Glu Arg Leu Glu Glu Arg Asp Cys Ser Gly Gln Gln Leu Asn 325 330 335 His Asn
<210> 59 <211> 1385 <212> ADN <213>Glycine <400> 59 gcacgagggg attttgagtg gaggggaaaa gttgtgctaa gatgccgggg aaagctgaca 60 ctgatgattg gcgagtagag cggggtgagc agattcagtt tcagtcttcc atttactctc 120 atcatcagcc ttggtggtgt ggagtggggg aaaatgcctc taaatcatct tcagctgatc 180 agttaaatgg ttcaatcgtg aatggtatca cgcggtctga gaccaatgat aagtcaggtg 240 aaggtgttgc caaagaatac caaaacatca aacatgccgt gttgtcaacc ccatttacca 300 tggacaaaca tcttgctcca aatccccaga tggaacttgt tggtcattca gttgttttaa 360 catctcctta ttcagatgca cagcatggtc aaatcttgac tacttacggg caacaagtta 420 tgataaaccc tcaattgtac ggaatgtatc atgctagaat gcctttgcca cctgaaatgg 480 aagaggagcc tgtttatgtc aatgcaaagc agtatcatgg tattttgagg cgaagacagt 540 cacgtgctaa ggctgagctt gaaaagaaag taatcaaaaa caggaagcca tacctccatg 600 aatcccgtca ccttcatgcc atgagaaggg ctagaggcaa tggtggtcgc tttctcaaca 660 aaaagaagct cgaaaattac aattctgatg ccacttcaga cattgggcaa aatactggtg 720 caaacccctc aacaaactca cctaacactc aacatttgtt caccaacaat gagaatctag 780 gctcatcaaa tgcgtcacaa gccacggttc aggacatgca cagagtggag agtttcaata 840 ttggttacca taatggaaat ggtcttgcag aactgtacca ttcacaagca aatggaaaaa 900 aggagggaaa ctgctttggt aaagagaggg accctaataa tggggctttc aaatgacact 960 tcgcccagcc atacagcaac agttaggtga agatgaaggg tttttatctc atccaacttg 1020 tgatgctgta ttgaaggcaa ttcattcttg gcttagttaa gtggtgagac cagtgacatg 1080 gagtacactc tgccttgttt ggtctctccc cttgcatttg tttctcttta caagtccata 1140 tgtaaaaatg gataacggaa agaaaaagaa aaatcacttt tgtttgagaa cttttttaag 1200 tttgttttta actgtgtgaa ggtttcataa aattgtggac tgacttgtgt gacatatgct 1260 ccacaaaacc ttaaaacttt cgtctatttt gtccaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaagggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380 aaaaa 1335
<210> 60 <211> 304 <212> PRT <213> Glycine max <400> 60 et Pro Gly Lys Ala Asp Thr Asp Asp Trp Arg Val Glu Arg Gly Glu 1 5 10 15 Gln lie Gln Phe Gln Ser Ser lie Tyr Ser His His Gln Pro Trp Trp 20 25 30 Cys Gly Val Gly Glu Asn Ala Ser Lys Ser Ser Ser Ala Asp Gln Leu 35 40 45 Asn Gly Ser lie Val Asn Gly lie Thr Arg Ser Glu Thr Asn Asp Lys 50 55 60 Gly Glu Gly Val Ala Lys Glu Tyr Gln Asn lie Lys His Ala Val 70 75 80
41 Leu Ser Thr Pro Ehe Thr Met Asp Lys His Leu Ala Pro Asn Pro Gln 85 90 95 Met Glu Leu Val Gly His Ser Val Val leu Thr Ser Pro Tyr Ser Asp 100 105 110 Ala Gln His Gly Gln lie Leu Thr Thr Tyr Gly Gln Gln Val Met lie 115 120 125 Asn Pro Gln Leu Tyr Gly Met Tyr His Ala Arg Met Pro Leu Pro Pro 130 135 · 140 Glu Met Glu Glu Glu Pro Val Tyr Val Asn Ala Lys Gln Tyr His Gly 145 150 155 160 lie Leu Arg Arg Arg Gln Ser Arg Ala Lys Ala Glu Leu Glu Lys Lys 165 170 175 Val lie Lys Asn Arg Lys Ero Tyr Leu His Glu- Ser Arg His Leu His 180 185 190 Ala Met Arg Arg Ala Arg Gly Asn Gly Gly Arg Phe Leu Asn Lys Lys 195 200 205 Lys Leu Glu Asn Tyr Asn Ser Asp Ala Thr Ser Asp lie Gly Gln Asn 210 215 220 Thr Gly Ala Asn Pro Ser Thr Asn Ser Pro Asn Thr Gln His Leu Phe 225 230 235 240
Thr Asn Asn Glu Asn Leu Gly Ser Ser Asn Ala Ser Gln Ala Thr Val 245 250 255 Gln Asp Met His Arg Val Glu Ser Phe Asn lie Gly Tyr His Asn Gly 260 265 270 Asn Gly Leu Ala Glu Leu Tyr His Ser Gln Ala Asn Gly Lys Lys Glu 275 280 285 Gly Asn Cys Phe Gly Lys Glu Arg Asp Pro Asn Asn Gly Ala Phe Lys 290 295 300 <210> 61 <211> 1401 <212> ADN <213> Glycine max <400> 61 gaagtcttta tgtgacctgg gtggaatgat tctgtgtctg catgtgtgaa ttctggcaag 60 ggaactaggg atctgaagat aagatatgca atctaaatct gaaactgcaa atcaactgag 120 gtctgatcca cattccttta cacctaacaa tgcttattct gaaccctggt ggcgaggtat 180 tcagtacaat cctgtccccc aagcaatgtt aggagtgaat gcatctaatt catcttcact 240 tgaacgccct aatggtgatt cggaatccag tgaagaggat gatgatgcca ctaaagaatc 300 acaacccact gctcctaatc aatcaggaaa ttatggacag gaccaccaag cgatgcaaca 360 ttcttcatca tctgcacctt tggtacgtga tgattgcctt acacaggctc cacaagtgga 420 acttgttggc cactcaattg gatacactcc ttttatagga atgccccatg ccagaatggc 480 tttgcccctt gagatggctc aagagcctgt ttatgtgaat gccaaacaat accaaggaat 540 tctgagacga agacaggctc gtgctaaagc agagcttgaa aagaaattaa taaaagtcag 600
42 aaagccatat cttcatgaat cccggcatca gcatgctata agaagagcac gaggtaatgg 660 agggcgtttt gcaaagaaaa ctgaagttga ggcttcaaac cacatgaaca aggaaaagga 720 tatgggtact ggccaggtcc cattgtcacg gtcaattagt tcatctggtt ttggatcact 780 accctctgac tctgctgaga cctggaattc tcctagtgtg caacaagatg caagaggatc 840 tcaagtgcat gagagatttg aagaacgcaa ctatgcaaat gttttgcagt catcatctac 900 tttttgtttg cactcgggtg aaagagtgga ggaaggggac tgttcaggtc aacaacgggg 960 aagcatcttg tcagagcaca cctcacagag gcgtcttgct attcagtaaa ccactgcatg 1020 tgttgatgct gaggttggta tatataattg agtgaactag taggttgagt accttggcta 1080 tctatctgta aacattggca atttgcatgc atgtcaagcg gcaaatcatt cttggctggg 1140 tttcagctgt tcatgatatg gggagaagaa tgattgattg ggccatcata cttgtgttgt 1200 tgaagtctac cagtccttca ttatatcctc tttttcattt tttctgtttt tgtacagaga 1260 tagtagttag caaagtcaag ccaacggatt agaagacttg atgaaacaaa ctactgactc 1320 actttcctct ggcggcttta ttttatgtta ctcaccggtt attaatgctt aatatgagac 1380 atcatatgag agatttgctg 1401
<210> 62 <211> 307 <212> PRT <213> Glycine max <400> 62 Met Gln Ser Lys Ser Glu Thr Ala Asn Gln Leu Arg Ser Asp Pro His 1 5 10 15 Ser Phe Thr Pro Asn Asn Ala Tyr Ser Glu Pro Trp Trp Arg Gly lie 20 25 30 Gln Tyr Asn Pro Val Pro Gln Ala Met Leu Gly Val Asn Ala Ser Asn 35 40 45 Ser Ser Ser Leu Glu Arg Pro Asn Gly Asp Ser Glu Ser Ser Glu Glu 50 55 60 Asp Asp Asp Ala Thr Lys Glu Ser Gln Pro Thr Ala Pro Asn Gln Ser 65 70 75 80 Gly Asn Tyr Gly Gln Asp His Gln Ala Met Gln His Ser Ser Ser Ser 85 90 95 Ala Pro Leu Val Arg Asp Asp Cys Leu Thr Gln Ala Pro Gln Val Glu 100 105 110 Leu Val Gly His Ser lie Gly Tyr Thr Pro Phe lie Gly Met Pro His 1 115 120 125 Ala Arg Met Ala Leu Pro Leu Glu Met Ala Gln Glu Pro Val Tyr Val 130 135 140 Asn Ala Lys Gln Tyr Gln Gly lie Leu Arg Arg Arg Gln Ala Arg Ala 145 150 155 160
Lys Ala Glu Leu Glu Lys Lys Leu lie Lys Val Arg Lys Pro Tyr Leu 165 170 175 His Glu Ser Arg His Gln His Ala lie Arg Arg Ala Arg Gly Asn Gly 180 185 190 Gly Arg Phe Ala Lys Lys Thr Glu Val Glu Ala Ser Asn His Met Asn 195 200 205
43 Lys Glu Lys Asp Met Gly Thr Gly Gln Val Pro Leu Ser Arg Ser lie 210 215 220 Ser Ser Ser Gly Phe Gly Ser Leu Pro Ser Asp Ser Ala Glu Thr Trp 225 230 235 240
Asn Ser Pro Ser Val Gln Gln Asp Ala Arg Gly Ser Gln Val His Glu 245 250 255 Arg Phe Glu Glu Arg Asn Tyr Ala Asn Val Leu Gln Ser Ser Ser Thr 260 265 270 Phe Cys Leu His Ser Gly Glu Arg Val Glu Glu Gly Asp Cys Ser Gly 275 280 285 Gln Gln Arg Gly Ser lie Leu Ser Glu His Thr Ser Gln Arg Arg Leu 290 295 300 Ala lie Gln 305 <210> 63 <211> 1241 <212> ADN <213> Glycine max <400> 63 gcacgaggtc ctaagttgta agaaacactc tcttctcctt tctcactatt gttctgttac 60 tgttttttgc agcaacactt cagttcaatt aacgaactac accactttct ttctcttctt 120 cgactgctct gtaaccgaaa acctcccttt cccagtttcg aatcttttgt ttctgccttt 180 ggttactgtt tttccgagcc atgctattca ttattgtcct tcgaatcgga ttgattggga 240 cactgtattg catgtaaatc aggaaatcat gacttctact catgacctct cagataatga 300 agctgatgac cagcagcagt cggaatcaca aatggagcct ttatctgcaa atggaatttc .360 ttatgcaggt attgctactc agaatgttca gtatgcaaca ccttcacagc ttggaactgg 420 gcatgctgtg gtaccgccca cttacccata tccagatcca tactacagaa gtatctttgc 480 tccctatgat gcacaaactt atcccccaca accctatggt ggaaatccaa tggtccacct 540 tcagttaatg ggaattcaac aagcaggtgt tcctttgcca actgatacag ttgaggagcc 600 tgtgtttgtc aatgcaaaac agtatcatgg tatattaaga cgcagacagt cccgtgctaa 660 agctgaatca gaaaaaaagg ctgcaaggaa tcggaagcca tacttgcatg aatctcgaca 720 tttgcatgca ctgagaagag caagaggatg tggaggtcgg tttttgaatt caaagaaaga 780 tgagaatcaa caggatgagg ttgcatcaac tgacgaatca cagtccacta tcaatctcaa 840 ttctgataaa aatgagcttg caccatcaga tagaacatcc taaaactaca gaaatggtga 900 tgctgtagat tgcagggatc tgttgtgtat atctatattg ggagatgaat ctccaaccaa 960 cagtatcctc agatatctcc ctattattca ttctgtcgta caacgccata ggtataagta 1020 taggttgtgt agtaggtatg ttaggaggtt gcaaaataaa acaagtaaaa tgtaaattga 1080 agtgattcaa ctaagtctat ccccaatgtg gtcctttctt gcctttttag gtatttttat 1140 tgtgtgggct tttctttgta ttatttggtg cctctgaggg aaagagaaga gattatccga 1200 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1241
<210> 64 <211> 204 <212> PRT <213> Glycine max <400> 64 Met Thr Ser Thr His Asp Leu Ser Asp Asn Glu Ala Asp Asp Gln Gln 1 5 10 15
« 44 Gln Ser Glu Ser Gln Met Glu Pro Leu Ser Ala Asn Gly lie Ser Tyr 20 25 30 Ala Gly lie Ala Thr Gln Asn Val Gln Tyr Ala Thr Pro Ser Gln Leu 35 40 45 Gly Thr Gly His Ala Val Val Pro Pro Thr Tyr Pro Tyr Pro Asp Pro 50 55 60 Tyr Tyr Arg Ser lie Phe Ala Pro Tyr Asp Ala Gln Thr Tyr Pro Pro 65 70 75 80 Gln Pro Tyr Gly Gly Asn Pro Met Val His Leu Gln Leu Met Gly lie 85 90 95 Gln Gln Ala Gly Val Pro Leu Pro Thr Asp Thr Val Glu Glu Pro Val 100 105 110 Phe Val Asn Ala Lys Gln Tyr His Gly lie Leu Arg Arg Arg Gln Ser 115 120 ' 125 Arg Ala Lys Ala Glu Ser Glu Lys Lys Ala Ala Arg Asn Arg Lys Pro 130 135 140 Tyr Leu His Glu Ser Arg His Leu His Ala Leu Arg Arg Ala Arg Gly 145 150 155 160
Cys Gly Gly Arg Phe Leu Asn Ser Lys Lys Asp Glu Asn Gln Gln Asp 165 170 175 Glu Val Ala Ser Thr Asp Glu Ser Gln Ser Thr lie Asn Leu Asn Ser 180 185 190 Asp Lys Asn Glu Leu Ala Pro Ser Asp Arg Thr Ser 195 200 <210> 65 <211> 1716 <212> ADN <213> Glycine max <400> 65 gcacgaggta cgtaccgaca tgactccaac ctgatggggt taaacactgc ttctgcgtag 60 gattcgatgc cgctactcct tcttcagttt ctacaactga gtttcatatc tcctttctat 120 tgatgtttat gctgaagact gaataaaagt ctgagaaagc tgcttactac aaaccaacaa 180 gattaactaa gaaatcatct tttgggacga tgcaaactgt ttatcttaaa gagcacgaag 240 gaaatgcgca caattttgtg ggcacgttgt cttctgcagc ttcagcaccc tggtggagtg 300 cttttggatc tcaatctgtt catcagggag agtcttgtgg ccaagtgaaa cccttttcat 360 tggagctgcc aaactgcata gaccaacttg ctgccactaa gccactagca agaggagctg 420 accaagtgtt gggtaaaggg cacataactc agtttacaat ctttccagat gattgtaaaa 480 tgtcagatga tgcgcaaaag cttcagacaa ccatgtcact gcagtcatcg cttactgatc 540 cacagtctcg ttttgagata gggtttagtc tgcccacgat atgtgcaaaa tatccttata 600 cggatcaatt ttatggactc ttctcagctt atgcacctca aatttcggga cgtataatgc 660 tgccacttaa catgacatct gatgatgaac caatttacgt .aaatgctaag cagtaccatg 720 gaatcattag acgtcggcag tcccgtgcca aagctgtact tgatcacaaa ttgactaaac 780 gtcgcaagcc ctatatgcac gaatcacgcc atctccatgc aatgcggcga ccaagaggat 840 gtgggggtcg cttcttgaac actaagaatt ctgttgacgg aaatggtaaa attggaaatg 900 aagtgcataa aactgttggt gaacaattgc agtctagtgg ctctcagagt tctgaattcc 960
45 ttcaatctga ggttggaact tttaattcat caaaagagac taatggaagc agtccaaata 1020 tttctggttc agaggtgact agcatgtatt cgcggggagg tcttgacagc ttttctctca 1080 atcatcttgg atctgctgtc cactcttttg cagacatgat agatggtggg cgcggtatga 1140 tcatacccac caaatgggtt gcagcagcag gtaactgctg caaccttaaa gtttgatttg 1200 caaagaatca agggtgggct tgctgtagca ttgcaccagg cccatcctcg atgaggccag 1260 atgaagaagc ttcgtttcag ttgcgtgtgc tgactgtgac aagtttcgct cggtaagatc 1320 gtcctcacat ctggtctagg caatccatcc ttggctcata ctttggcaat ccatccttgg 1380 ctcattgtaa ctgaaggcaa ctcatccttg gcttgatgta cttgcagtaa tttgtctttc 1440 tgcacaggaa tgttgttggc atggtacaaa ctaatgactt gatatcctga tgcagaagac 1500 aactatgttt ctgtctttgt gtgaaaatga aagcatgaaa ctctagttat gtgtgcttcg 1560 aataatgtct aaacgtggtg ttgtattttg tatttctgac ttcgaggaac aatgtattat 1620 agaaccttgt tctgtggtct ttgttagaaa aaataaagca ttggtgtgtt tttctccaaa 1680 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaag 1716
<210> 66 <211> 328 <212> P T <213> Glycine max <400> 66 Met Gln Thr Val Tyr Leu Lys Glu His Glu Gly Asn Ala His Asn Phe 1 5 10 15 Val Gly Thr Leu Ser Ser Ala Ala Ser Ala Pro Trp Trp Ser Ala Phe 20 25 30 Gly Ser Gln Ser Val His Gln Gly Glu Ser Cys Gly Gln Val Lys Pro 35 40 45 Phe Ser Leu Glu Leu Pro Asn Cys lie Asp Gln Leu Ala Ala Thr Lys 50 55 60 Pro Leu Ala Arg Gly Ala Asp Gln Val Leu Gly Lys Gly His lie Thr 65 70 75 80 Gln Phe Thr lie Phe Pro Asp Asp Cys Lys Met Ser Asp Asp Ala Gln 85 90 95 Lys Leu Gln Thr Thr Met Ser Leu Gln Ser Ser Leu Thr Asp Pro Gln 100 105 110 Ser Arg Phe Glu lie Gly Phe Ser Leu Pro Thr lie Cys Ala Lys Tyr 115 120 125 Pro Tyr Thr Asp Gln Phe Tyr Gly Leu Phe Ser Ala Tyr Ala Pro Gln 130 135 140 lie Ser Gly Arg lie Met Leu Pro Leu Asn Met Thr Ser Asp Asp Glu 145 150 155 160
Pro lie Tyr Val Asn Ala Lys Gln Tyr His Gly lie lie Arg Arg Arg 165 170 175 Gln Ser Arg Ala Lys Ala Val Leu Asp His Lys Leu Thr Lys Arg Arg 180 185 190 Lys Pro Tyr Met His Glu Ser Arg His Leu His Ala Met Arg Arg Pro 195 200 205
46 Arg Gly Cys Gly Gly Arg Ehe Leu Asn Thr Lys Asn Ser Val Asp Gly 210 215 220 Asn Gly Lys Ile Gly Asn Glu Val His Lys Thr Val Gly Glu Gln Leu 225 230 235 240
Gln Ser Ser Gly Ser Gln Ser Ser Glu Ehe Leu Gln Ser Glu Val Gly 245 250 255 Thr Phe Asn Ser Ser Lys Glu Thr Asn Gly Ser Ser Pro Asn lie Ser 260 265 270 Gly Ser Glu Val Thr Ser Met Tyr Ser Arg Gly Gly Leu Asp Ser Phe 275 280 285 Ser Leu Asn His Leu Gly Ser Ala Val His Ser Phe Ala Asp Met lie 290 295 300 Asp Gly Gly Arg Gly Met lie lie Pro Thr Lys Trp Val Ala Ala Ala 305 310 315 320
Gly Asn Cys Cys Asn Leu Lys Val 325 <210> 67 <211> 1103 <212> ADN <213> Glycine max <400> 67 gcacgaggaa atgaagaatt agagggagtg agaggaggaa gaagaagaag aagattccag 60 aatccagagt gagaaacatt aggcttatca gaggagacat gcccgagttg aaccgacaat 120 tctattacta ctctttgctt ctttcttcat gcctcatcaa atcccaaagg atataattga 180 aggttttggg aactaaggct gcaatattgt atacattcta ctcaaggaat ggctcatact 240 tcttatcctt gtggtgatcc ttattttggt agttcaatag ttgcttatgg aacacaggct 300 attactcaac aaatggtgcc ccagatgctg ggattagcat ccaccagaat tgcattacca 360 gttgagcttg cagaagatgg gcccatttat gtcaatgcca aacaatacca tggtatactg 420 agaaggcgac agtcacgagc aaagcttaag gctcaaaaca aactcatcaa aagtcgtaag 480 ccatatcttc atgagtctcg gcaccgccac gcattgaaaa gggttagggg aactgggggg 540 cgctttctta gtgccaaaca gcttcaacag tttaatgcag aacttgtcac cgatgcccat 600 tcaggcccgg gccctgtcaa tgtttatcaa aagaaagatg catctgaggc agaaagtcat 660 ccctcaagaa ctggaaaaaa tgcatctatc acattcacag caatctctgg cttgacaagt 720 atgtccggta acagtgtcag tttcaggcgg cctgagcaca acttcttggg gaactctcct 780 aatataggtg gatcgtcgca atgcagtggg ggactcacct ttggtggtgg agctcggcaa 840 tgtacttcag ttggccggtg agaggtggaa ccaatcaaaa tcaagttcac tggtctggca 900 aatcatcctt ggcttagtca ctttactttc tgtgtttcat gtgttgttac ggaaatgttg 960 tcttttggaa gactctgcat tagcactcag acttttgcta gtgctttccc atgtattttg 1020 aaagttgctc ttgtttctgt tgttgaactg gaccagaaag tttgtgcttg aaaatttaac 1080 tttttaaaaa aaaaaaaaaa aaa 1103
<210> 68 <211> 210 <212> PRT <213> Glycine max <400> 68 Met Ala His Thr Ser Tyr Pro Cys Gly Asp Pro Tyr Phe Gly Ser Ser 1 5 10 15
47 lie Val Ala Tyr Gly Thr Gln Ala lie Thr Gln Gln Met Val Pro Gln 20 25 30 Met Leu Gly Leu Ala Ser Thr Arg lie Ala Leu Pro Val Glu Leu Ala 35 40 45 Glu Asp Gly Pro lie Tyr Val Asn Ala Lys Gln Tyr His Gly lie Leu 50 55 60 Arg Arg Arg Gln Ser Arg Ala Lys Leu Lys Ala Gln Asn Lys Leu lie 65 70 75 80 Lys Ser Arg Lys Pro Tyr Leu His Glu Ser Arg His Arg His Ala Leu 85 90 95 Lys Arg Val Arg Gly Thr Gly Gly Arg Phe Leu Ser Ala Lys Gln Leu 100 105 110 Gln Gln Phe Asn Ala Glu Leu Val Thr Asp Ala' His Ser Gly Pro Gly 115 120 125 Pro Val Asn Val Tyr Gln Lys Lys Asp Ala Ser Glu Ala Glu Ser His 130 135 140 Pro Ser Arg Thr Gly Lys Asn Ala Ser lie Thr Phe Thr Ala lie Ser 145 150 155 160
Gly Leu Thr Ser Met Ser Gly Asn Ser Val Ser Phe Arg Arg Pro Glu 165 170 175. His Asn Phe Leu Gly Asn Ser Pro Asn lie Gly Gly Ser Ser Gln Cys 180 185 190 Ser Gly Gly Leu Thr Phe Gly Gly Gly Ala Arg Gln Cys Thr Ser Val 195 200 205 Gly Arg 210 <210> 69 <211> 1128 <212> ADN <213> Glycine max <400> 69 gcacgagggg tttgggtttc aagagaggag acatgcttaa cttcaaccca acacttcaag 60 tacttgcttc ttcataccct taccagatcc caaaggtcac gatctaattt taagtgatta 120 gtctgatgag cattttgaag gttacatgaa gcaatttctc tttttgaatc ttcctgacac 180 cgagatcaat tgttcacaag ttgattgcaa tcactcaatg gctcattctt cttatcccta 240 cggcgatcca attcttgctt atggaccaca agctattagt catccccaaa tggtacccca 300 gatgctggga ctagcatcca ccagagtggc attaccactt gatcttgctg aagatggacc 360 gatttatgtc aacgcgaaac aataccatgg tatactgaga aggcgacagt cacgagcaaa 420 acttgaggct cagaacaaac ttatcaaaag tcgtaagcca tatcttcatg agtctcggca 480 ccgccatgct ttgaataggg ttaggggatc tgggggtcga tttctgagta ccaaacagct 540 tgcacagtct aatgcagaat ttgtcaccgg tgcacattct ggttctgacc ctaccaacat 600 atatcagaaa gaacatccat tagaggtgga aagtcattcc tcaaaagatg gagataatgc 660 atcattcata acaacctact ccgaccggcc atgtttatct ggcaacaacc tcaattttcg 720 gcagcaggag tgcatgtttc tggggaattc tgcaaacatg agtggagcac cacagtgcag 780
48 tgggggactc acctttggcg gagcaaagca acgcacttca gttgtccggt gagagaagaa 840 actgatcgaa accgacttca ccggtcaggc aaatcatcct tggcttagtc acttttgtct 900 gtgtcttaat gtgttcgtac taaatgatca ttttgagaga ctcttcagtc tgcattagca 960 ctaataagac ctttccaatt gctttggcat gtattttaaa gttgctattg tactggattc 1020 tgaactggat tggaatagtc tgtgcatgga actagtatgt ttgtgttagt tactgttgaa 1080 tttccttctt taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 1128
<210> 70 <211> 228 <212> PRT <213> Glycine max <400> 70 Met Lys Gln Phe Leu Phe Leu Asn Leu Pro Asp Thr Glu lie Asn Cys 1 5 10 15 Ser Gln Val Asp Cys Asn His Ser Met Ala His Ser Ser Tyr Pro Tyr 20 25 30 Gly Asp Pro lie Leu Ala Tyr Gly Pro Gln Ala lie Ser His Pro Gln 35 40 45 Met Val Pro Gln Met Leu Gly Leu Ala Ser Thr Arg Val Ala Leu Pro 50 55 gO Leu Asp Leu Ala Glu Asp Gly Pro lie Tyr Val Asn Ala Lys Gln Tyr 65 70 75 80 His Gly lie Leu Arg Arg Arg Gln Ser Arg Ala Lys Leu Glu Ala Gln 85 90 95 Asn Lys Leu lie Lys Ser Arg Lys Pro Tyr Leu His Glu Ser Arg His 100 105 110 Arg His Ala Leu Asn Arg Val Arg Gly Ser Gly Gly Arg Phe Leu Ser 115 120 125 Thr Lys Gln Leu Ala Gln Ser Asn Ala Glu Phe Val Thr Gly Ala His 130 135 140 Ser Gly Ser Asp Pro Thr Asn lie Tyr Gln Lys Glu His Pro Leu Glu 145 150 155 160
Val Glu Ser His Ser Ser Lys Asp Gly Asp Asn Ala Ser Phe lie Thr 165 170 175 Thr Tyr Ser Asp Arg Pro Cys Leu Ser Gly Asn Asn Leu Asn Phe Arg 180 185 190 Gln Gln Glu Cys Met Phe Leu Gly Asn Ser Ala Asn Met Ser Gly Ala 195 200 205 Pro Gln Cys Ser Gly Gly Leu Thr Phe Gly Gly Ala Lys Gln Arg Thr 210 215 220 Ser Val Val Arg 225
49 <210> 71 <211> 1286 <212> ADN <213> Ilelianthus <400> 71 gcacgagctt ctagattttc tctccgattc gtcgccccaa attttagggt ttttactttt 60 cgtcctctat actcgtagat cttggtgtaa cagtattgca taagtttcat gtcctcttct 120 gccatgcgag cgaattcatc tgattcgtct cctccagaac agtcgttaga cagggaatca 180 cagtctgatg aagttcttag tgaggaagaa gatgatgcaa gcaaagaaac acaaaatgct 240 tcgtcttttc gttcagataa aagttatcag cagcagggag taccaaatat ccttccaaat 300 aatggcgaaa ccgtagggca ggtcccacaa ctagaacttg tcggtcacac tattgcctgt 360 gctccaaatc cttattgtga tccatattat ggtggaatga tggcagctta tggtcagcct 420 tttgttcatc ctcagtttct tgagcaagca aggatgcctt tgccacttga aatggcgcaa 480 gagcctgttt acgtgaatgc caaacaatac catgcgatat taaggcgaag gcaatcccgt 540 gcaaaagcag agcttgagaa gaaacttata aaagacagaa agccttatct tcatgaatca 600 cggcatcagc atgctttgag aagggtaagg ggcaccggtg gtcgttttgc aaagaaaact 660 gacgttaata agaacacaac aggttcgggt tcaggttctg ccatgtcatc atcccagtcg 720 gtgaattcaa accgggtgca ctcagaatct gccgagagct tggacacacc aaggggtgga 780 ttggtaaatt cacacaatac tcgcacgtat cttgataacg gaggttcttt aggccagcag 840 tggataaaca tttcatctaa ccaatcttca cagagggctg ttgccatgaa gtgatgtcga 900 gtgtttaaca ccctttgtgt ctatccgtgg cttctaagct ggccggcaaa tcattcttgg 960 ctcatgttaa tatgagggac aaacaggtaa atgtaccttt tggtgtcctc tttggtttta 1020 ctttcaggat ttctttcttc ggaactgatg ttatgtacaa agtttgcttt tggggataga 1080 agaattggtt gggttgggtt tgtgtgttct tttctgaatg tttggtatat ttggaggtga 1140 agcatggagt ttaagatgtg cttatgtcta tcgtctaatt gtaggggcat atagtgctcc 1200 acagcctcca gcacatgtgt aatgtcgtgg ctgttgaaaa ttggagcttc atatttactg 1260 ttttgcaaaa aaaaaaaaaa aaaaaa 1286
<210> 72 <211> 261 <212> PRT <213> Ilelianthus sp . <400> 72 Met Ser Ser Ser Ala et Arg Ala Ser Asp Ser Ser Pro Pro 1 5 15 Glu Gln Ser Leu Asp Arg Glu Ser Gln Ser Asp Glu Val Leu Ser Glu 20 25 30 Glu Glu Asp Asp Ala Ser Lys Glu Thr Gln Asn Ala Ser Ser Phe Arg 35 40 45 Ser Asp Lys Ser Tyr Gln Gln Gln Gly Val Pro Asn lie Leu Pro Asn 50 55 60 Asn Gly Glu Thr Val Gly Gln Val Pro Gln Leu Glu Leu Val Gly His 65 70 75 80 Thr lie Ala Cys Ala Pro Asn Pro Tyr Cys Asp Pro Tyr Tyr Gly Gly 85 90 95 Met Met Ala Ala Tyr Gly Gln Pro Phe Val His Pro Gln Phe Leu Glu 100 105 110 Gln Ala Arg Met Pro Leu Pro Leu Glu Met Ala Gln Glu Pro Val Tyr 115 120 125
50 Val Asn Ala Lys Gln Tyr His Ala lie Leu Arg Arg Arg Gln Ser Arg 130 135 140 Ala Lys Ala Glu Leu Glu Lys Lys Leu lie Lys Asp Arg Lys Pro Tyr 145 150 155 160
Leu His Glu Ser Arg His Gln His Ala Leu Arg Arg Val Arg Gly Thr 165 170 175 Gly Gly Arg Phe Ala Lys Lys Thr Asp Val Asn Lys Asn Thr Thr Gly 180 185 190 Ser Gly Ser Gly Ser Ala Met Ser Ser Ser Gln Ser Val Asn Ser Asn 195 200 205 Arg Val His Ser Glu Ser Ala Glu Ser Leu Asp Thr Pro Arg Gly Gly 210 215 220 Leu Val Asn Ser His Asn Thr Arg Thr Tyr Leu Asp Asn Gly Gly Ser 225 230 235, 240
Leu Gly Gln Gln Trp lie Asn lie Ser Ser Asn Gln Ser Ser Gln Arg 245 250 255 Ala Val Ala Met Lys 260 <210> 73 <211> 1306 <212> ADN <213> Triticum aestivum <400> 73 ggagaaacgg aaacagagac agagggagag gagacttgca gaggagagga gagaagaggc 60 ggaacaaggg aggagggagg ggtcgccgga agggggacat gctccctccg catctcacat 120 ctcgcagctt gaactgagag caagagcaga agcccatgag atgagacgca agcaaaatat 180 gcaagaaaat ggcacaatca tgattcagtt tggtcagcaa gtgcctaact gcgagtcctc 240 agctagcgat tctcctcaag aagtgtccgg aatgagcgaa gggagcttta atgagcagaa 300 tgatcaatct ggtaatcgcg atggctatac gaagagtagt gatgaaggca agatgatgtc 360 ggctttgtct ctgggcaatt cagaaatggc atacacaccg ccaaaacctg accgcactca 420 tccctttgcc atatcatacc catatgctga tccttactat ggtggtgcag tggcagccta 480 tggcgcacat gctattatgc acccccagat ggtgggcatg gtaccatcct ctcgagtgcc 540 actaccgatt gaaccagctg ccgccgaaga gcccatttat gtgaatgcga agcaatacca 600 tgccattctc cgaaggagac agctccgcgc aaaattagag gctgaaaata agctggtcaa 660 aagccgtaag ccgtacctgc atgagtcccg gcaccagcac gcgatgaagc gggctcgggg 720 aacaggcggg cggttcctca acgcaaagga gaagtctgaa gcttcaggcg gcggcaatgc 780 atcagcgagg tctggccacg ccggcgttcc cccggatggc ggcatgttct cgaagcacga 840 ccacacctta ccatccggtg acttccatta ccgcgcgaga gggggcgcct agggtgggca 900 cgcagttgcc ccctggcaaa tcatccttgg cttatgtgtg tggcgaatga ccgtcaactc 960 ggtccagtga tattgtaaaa ctgaatttag agtctgtgca attgtgttac ttgggggttt 1020 ggtagacagc ccttgtgttt ggggagggga cgatgcagct gcagctgcag ccggttctct 1080 tgttgtggta ggtttgtgtg gcatggcagg tgctgctaag ctggagcctg cttgaactgt 1140 tttcctgtca ctttgttgtt tggggtaata atgaccatct tgtatgatat tagtactgac 1200 ttggagtaag taataaccat tcccggcgtg atgcatttgc gcccgtggtg gtgtttctgt 1260 tgaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1306
<210> 74 <211> 243
51 <212> PRT <213> Triticum aestivum <400> 74 Met Arg Arg Lys Gln Asn Met Gln Glu Asn Gly Thr lie Met lie Gln
1 5 10 15 Phe Gly Gln Gln Val Pro Asn Cys Glu Ser Ser Ala Ser Asp Ser Pro 20 25 30 Gln Glu Val Ser Gly Met Ser' Glu Gly Ser Phe Asn Glu Gln Asn Asp 35 40 45 Gln Ser Gly Asn Arg Asp Gly Tyr Thr Lys Ser Ser Asp Glu Gly Lys 50 55 60 Met Met Ser Ala Leu Ser Leu Gly Asn Ser Glu Met Ala Tyr Thr Pro 65 70 75 80
Pro Lys Pro Asp Arg Thr His Pro Phe Ala lie- Ser Tyr Pro Tyr Ala 85 90 95
Asp Pro Tyr Tyr Gly Gly Ala Val Ala Ala Tyr Gly Ala His Ala lie 100 105 110 Met His Pro Gln Met Val Gly Met Val Pro Ser Ser Arg Val Pro Leu 115 120 125 Pro lie Glu Pro Ala Ala Ala Glu Glu Pro lie Tyr Val Asn Ala Lys 130 135 140 Gln Tyr His Ala lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu Glu 145 150 155 160
Ala Glu Asn Lys Leu Val Lys Ser Arg Lys Pro Tyr Leu His Glu Ser 165 170 175
Arg His Gln His Ala Met Lys Arg Ala Arg Gly Thr Gly Gly Arg Phe 180 185 190 Leu Asn Ala Lys Glu Lys Ser Glu Ala Ser Gly Gly Gly Asn Ala Ser 195 200 205 Ala Arg Ser Gly His Ala Gly Val Pro Pro Asp Gly Gly Met Phe Ser 210 215 220 Lys His Asp His Thr Leu Pro Ser Gly Asp Phe His Tyr Arg Ala Arg 225 230 235 ' 240
Gly Gly Ala
<210> 75 <211> 1077 <212> ADN <213> Triticum aestivum <400> 75 gcacgaggtt ggaaagtaac aaaccatgac ttctgtcacc gacggtgttt caggtgatca
52 tagagctgat gagcagcaga agcaagctgc tgctcaaggg aaccaggaag aggccccagc 120 tactagtata ggtagtcagg caatggtggc aacaccttcc acagattatg tcacacccta 180 tggccaccag gaagcttgcc atgcaatggg tcaaattgct tacccaactg tcgatccatt 240 ctatggaagc ctttatgcag cctacggtgg acaacctatg atgcatccac caatggtcgg 300 aatgcatgca gccgcaatac cgttgcctac tgatgcaatt gaagagcctg tgtatgtgaa 360 tgcaaagcaa tataatgcca tattaaggcg gcgccaatct cgggctaaag cagagtcaga 420 aaggaagctt atcaagggcc gcaagccata tctccatgag tcgcggcatc aacatgcctt 480 gaaaagggcc aggggagccg gaggccggtt tcttaacgca aagtcagacg acaatgaaga 540 gcattctgat tccagctcca aagataagca gaatggcgtt gcaccccgca gcagtggcca 600 atcctcccaa tctcccaaag gcgcgácttc ggctgataag tcagcaaacc atgaatgaga 660 tgctagaagg tccgccggac gcgacgatcc atgccaacag ttttgtacag tatatatatg 720 ctagtgagcg agagagagtc gcgccggcgg gtgccatagg atatatccgc tctgctctat 780 agtagtgata gacttatcga cagatttttt tgcagcattg gtccgtgttt gctcggtttg 840 gtttctacat tctgtacaat gagtagtttt ttttgtggtt tttgtgttcc ggggttagcc 900 gcgggtttgg tcaggaggct tttgtagctt ataaaagaag tataattagt gctacattgt 960 tttctttggt gtggatttgg tctcttagct gtgctgcatc ctcattcgtg gtgcagaaaa 1020 taatatctgg gtatacataa taatagctct gcctgcagct ttctttgcca aaaaaaa 1077
<210> 76 <211> 210 <212> PRT <213> Triticum aestivum <400> 76 Met Thr Ser Val Thr Asp Gly Val Ser Gly Asp His Arg Ala Asp Glu 1 5 10 15 Gln Gln Lys Gln Ala Ala Ala Gln Gly Asn Gln Glu Glu Ala Pro Ala 20 25 30 Thr Ser lie Gly Ser Gln Ala Met Val Ala Thr Pro Ser Thr Asp Tyr 35 40 45 Val Thr Pro Tyr Gly His Gln Glu Ala Cys His Ala Met Gly Gln lie 50 55 60 Ala Tyr Pro Thr Val Asp Pro Phe Tyr Gly Ser Leu Tyr Ala Ala Tyr 65 70 75 80 Gly Gly Gln Pro Met Met His Pro Pro Met Val Gly Met His Ala Ala 85 90 95 Ala lie Pro Leu Pro Thr Asp Ala lie Glu Glu Pro Val Tyr Val Asn 100 105 110 Ala Lys Gln Tyr Asn Ala lie Leu Arg Arg Arg Gln Ser Arg Ala Lys 115 120 125 Ala Glu Ser Glu Arg Lys Leu lie Lys Gly Arg Lys Pro Tyr Leu His 130 135 140 Glu Ser Arg His Gln His Ala Leu Lys Arg Ala Arg Gly Ala Gly Gly 145 150 155 160
Arg Phe Leu Asn Ala Lys Ser Asp Asp Asn Glu Glu His Ser Asp Ser 165 170 175 Ser Ser Lys Asp Lys Gln Asn Gly Val Ala Pro Arg Ser Ser Gly Gln 180 185 190
53 Ser Ser Gln Ser Pro Lys Gly Ala Thr Ser Ala Asp Lys Ser Ala Asn 195 200 205 His Glu 210 <210> 77 <211> 1378 <212> ADN <213> Triticum aestivum <400> 77 gcacgaggag attcccctct ccgcggcgca gacgaccacc cgccggccgc ccctgccgtc 60 gctctgctag gcagcgatga tgagcttcaa gggccacgac ggattcgggc aggcctccaa 120 tggtggtggt ggtggtggag cctccgtgcc atggtggácg gtgtcccaga tgctgtacgg 180 ggagccgggg gccgccttgt cgtcgtcgcc ggaggcggag cctcgccggg acgcccagtt 240 ccaggtcgtg cccagagctc agggcatcct ggatccactg ccggcgccca agagcggggc 300 tcctgaggtc ctcaagttct cggtgttcca agggaatttg gagtcgggag gcaacaaagg 360 agagaagccc atggagcact ccgccaccat cgcactgcag tcgccgctcc cggaatacaa 420 cagtcgcttc gaatttggcc cgggtccttc catgatgtct tctggttatc cttcagccga 480 gcagtgctat ggcctgctta ccacttacgc gatgaaatct acgcctggtg gccgattgct 540 cttgccactg aatgcaacag ctgacgcgcc gatttacgtg aatgcgaagc agtatgaagg 600 catccttcgc cgccgccgtg ctcgtgccaa ggtggagcga gagaatcagc tggtgaaagg 660 aagaaagccg tatcttcacg aatcacgcca ccgccacgcg atgcgccggg cgaggggcac 720 gggagggcgc ttcctcaaca ccaagaagga ggggaatggc aaggacgctg gaggaggagg 780 caagagggca gagtgcgccc cgcccacgcg cttcgccacg tctccgagct ccgtcatccc 840 gagcaacccg cactcccgga gcagcatctc gagcctctcc ggctcggagg tgtcgagcat 900 gtacgaccac gacgacgtgg accactacaa cagcatcgag cacctccgga cgcccttctt 960 caccccgctg ccgatcatca tggacggcga gcacggggca tccgccccct tcaagtgggc 1020 cacggccgcc gacggctgct gtgagctcct caaggcgtga cttgaggggg gtacacgcag.1080 gcacccagat caagagccgg ccatggccgg ctctggctcc gtctggttgt ctgcaggcaa 1140 atcattcttg gctctactgc attggggtgt ccttccacgt cgcattacct cttccctgag 1200 aactccggtg ctggttctca gggatcttgt gatgatgggg ctccccatat gcctgtaaaa 1260 tagtatcgga agcactagca gtgtactacg ggtatgaact ctgtggtact atcaggtatc 1320 tgtgtcagaa ctcagaataa gtatcaaact tcagggtcta aaaaaaaaaa aaaaaaaa 1378 <210> 78 <211> 327 <212> PRT <213> Triticum aestivum <400> 78 Met Met Ser Phe Lys Gly His Asp Gly Phe Gly Gln Ala Ser Asn Gly 1 5 10 15 Gly Gly Gly Gly Gly Ala Ser Val Pro Trp Trp Thr Val Ser Gln Met 20 25 30 leu Tyr Gly Glu Pro Gly Ala Ala Leu Ser Ser Ser Pro Glu Ala Glu 35 40 45 Pro Arg Arg Asp Ala Gln Phe Gln Val Val Pro Arg Ala Gln Gly lie 50 55 60 Leu Asp Pro Leu Pro Ala Pro Lys Ser Gly Ala Pro Glu Val Leu Lys 65 70 75 80
54 Phe Ser Val Phe Gln Gly Asn Leu Glu Ser Gly Gly Asn Lys Gly Glu 85 90 95 Lys Pro Met Glu His Ser Ala Thr lie Ala Leu Gln Ser Pro Leu Pro 100 105 110 Glu Tyr Asn Ser Arg Phe Glu Phe Gly Pro Gly Pro Ser Met Met Ser 115 120 125 Ser Gly Tyr Pro Ser Ala Glu Gln Cys Tyr Gly Leu Leu Thr Thr Tyr 130 135 140 Ala Met Lys Ser Thr Pro Gly Gly Arg Leu Leu Leu Pro Leu Asn Ala 145 150 155 160
Thr Ala Asp Ala Pro lie Tyr Val Asn Ala Lys Gln Tyr Glu Gly lie 165 170 175 Leu Arg Arg Arg Arg Ala Arg Ala Lys Val Glu Arg Glu Asn Gln Leu 180 185 190 Val Lys Gly Arg Lys Pro Tyr Leu His Glu Ser Arg His Arg His Ala 195 200 205 Met Arg Arg Ala Arg Gly Thr Gly Gly Arg Phe Leu Asn Thr Lys Lys 210 215 220 Glu Gly Asn Gly Lys Asp Ala Gly Gly Gly Gly Lys Arg Ala Glu Cys 225 230 235 240
Ala Pro Pro Thr Arg Phe Ala Thr Ser Pro Ser Ser Val lie Pro Ser 245 250 255 Asn Pro His Ser Arg Ser Ser lie Ser Ser Leu Ser Gly Ser Glu Val 260 265 270 Ser Ser Met Tyr Asp His Asp Asp Val Asp His Tyr Asn Ser lie Glu 275 280 285 His Leu Arg Thr Pro Phe Phe Thr Pro Leu Pro lie lie Met Asp Gly 290 295 300 Glu His Gly Ala Ser Ala Pro Phe Lys Trp Ala Thr Ala Ala Asp Gly 305 310 315 320
Cys Cys Glu Leu Leu Lys' Ala 325 <210> 79 <211> 1192 <212> ADN <213> Triticum aestivum <400> 79 gcacgaggga gtgacgcggt cgaggagggg cgtgcggggg gcagacagag agggagcgca 60 aagggacggc ggaggcaagc tagcttcccg ggggcggacg caccgagaga gggcggcggg 120 agggaggagg cgcgtgggag ccatgcttct cccctcttct tcgtcttcct cctacgatcc 180 caaaggtgac tcctttggga aatcggttga cgatcatatg aggtcaactt tgacttttgg 240 tgataagcat tctgtatatg caggtcaaaa cactgactat ggccacccaa tggcttgcat 300
55 ttcatacccg ttcaacgatt ctggttctgg agtttgggcg gcctatgggt cacgggctat 360 gttccagccc ctcatggcgg gcggaggggc atctgcaacg gcaagagttc cattgcccgt 420 cgaactagca gcggatgagc ccatatttgt caatcccaaa caatataatg ggattctccg 480 gcgaaggcag ctgcgcgcta agttagaggc ccagaataaa ctcaccaaaa acagaaagcc 540 ctacctccac gagtcgcgcc atcttcacgc gatgaagcgg gcaagaggtt ccgggggacg 600 tttcctcaat tccaaacagc tgaagcagca gcagcagtct ggcagtgcct gcaccaaggc 660 cattgcggat ggcgcgaatt ccctgggttc gacccatcta cggctaggca gcggcgcagc 720 cggagaccga accaactcgg tgtccaaggc gatgtcctcc caagagaaca gcaagagagt 780 cgccgccccg gctcccgcct tcaccatgat tcaagcggcg cgcaaagacg acgacttctt 840 ccaccatcac gcccaccatc tcagcttctc cggtcatttt ggccagtcaa gcgaccgata 900 tacgtaataa ggggtcctcc gcgccccggt gtggtcaggc aactcatcct tggctttatt 960 tctggcgtgt taggacttca gagatagttt atctcacagt gctttgcagc ccatagttct 1020 cggcttgatg ttcggtatgc aaatgttggt gtactggtgc gttggaacaa aagtttgatg 1080 tgttcacatg acgattggtc gcggaactca tcttgtgttc tgctcgaccc taaaaaaaaa 1140 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ac 1192
<210> 80 <211> 254 <212> PRT <213> Triticum aestivum <400> 80 Met Leu Leu Pro Ser Ser Ser Ser Ser Ser Tyr Asp Pro Lys Gly Asp 1 5 10 15 Ser Phe Gly Lys Ser Val Asp Asp His Met Arg Ser Thr Leu Thr Phe 20 25 30 Gly Asp Lys His Ser Val Tyr Ala Gly Gln Asn Thr Asp Tyr Gly His 35 40 45 Pro Met Ala Cys lie Ser Tyr Pro Phe Asn Asp Ser Gly Ser Gly Val 50 55 60 Trp Ala Ala Tyr Gly Ser Arg Ala Met Phe Gln Pro Leu Met Ala Gly 65 70 75 80 Gly Gly Ala Ser Ala Thr Ala Arg Val Pro Leu Pro Val Glu Leu Ala 85 90 95 Ala Asp Glu Pro lie Phe Val Asn Pro Lys Gln Tyr Asn Gly lie Leu 100 105 110 Arg Arg Arg Gln Leu Arg Ala Lys Leu Glu Ala Gln Asn Lys Leu Thr 115 120 125 Lys Asn Arg Lys Pro Tyr Leu His Glu Ser Arg His Leu His Ala Met 130 135 140 Lys Arg Ala Arg Gly Ser Gly Gly Arg Phe Leu Asn Ser Lys Gln Leu 145 150 155 160
Lys Gln Gln Gln Gln Ser Gly Ser Ala Cys Thr Lys Ala lie Ala Asp 165 170 175 Gly Ala Asn Ser Leu Gly Ser Thr His Leu Arg Leu Gly Ser Gly Ala 180 185 190
56 Ala Gly Asp Arg Thr Asn Ser Val Ser Lys Ala Met Ser Ser Gln Glu 195 200 205 Asn Ser Lys Arg Val Ala Ala Pro Ala Pro Ala Phe Thr Met lie Gln 210 215 220 Ala Ala Arg Lys Asp Asp Asp Phe Phe His His His Ala His His Leu 225 230 235 240
Ser Phe Ser Gly His Phe Gly Gln Ser Ser Asp Arg Tyr Thr 245 250 <210> 81 <211> 1260 <212> ADN <213> Triticum aestivum <400> 81 gcacgagaag attatctctg taaactataa gttctgacag gtcttttgct ttattagtgg 60 ctcttctctc tgatgatgtt cacatcgccg aagccccatt tacagtgagg tgaattgatg 120 cgattatatc ttcatgctaa cagtaacacc ctttttgttt cagacaatga caatgatcat 180 gggaagcccg atcagcacat ggtaaagccg cttttatctt tggggaaccc agagactgtt 240 gctcccccac caatgcttga ttgtagccaa tcatttgcat atattcctta tactgctgat 300 gcttatgctg ggatctttcc aggatatgcc tcgcacgcta ttgttcatcc ccaattgaat 360 gctgcaacaa actctcgtgt gccgctccct gttgagcctg cagcagaaga gccaatgttt 420 gttaatgcaa agcagtacca tgcaattctt aggaggaggc agatacgtgc taaattggag 480 gcccaaaata agctggtgaa agcccggaag ccataccttc atgaatctcg gcaccgccat 540 gccatgaagc gagctcgtgg aacaggaggg cggttcctca acacaaagca actcgaggag 600 cagaagcaga agcaggcttc aggtggtgca agctgtacaa aggtccttgg caagaataca 660 ctccttcaga gtagccccgc cttcgcacct tcggcatcag ctccctccaa catgtcaagc 720 ttttcaacaa ccggcatgtt ggctaatcaa gagcgcacct gcttcccctc ggttggcttc 780 cgtcccacgg ttagcttcag tgcactgaat ggcaacggga agctggcccc aaacggcatg 840 caccagcgcg cttccatgat gaggtaaagc aaagcaccct ctggtgcgct gccggtggca 900 attcatcctt ggcttatgaa gatgttccgg aaatgtggtt gcaatatcag ctggaccaag 960 acattgttat gagtcctttt gagtttcatc tagttgaaag cactggtgtg ctgatgcaga 1020 ctgaaatctt catcacattt cttttgtgtg tacttattca aataaggcac accttgatta 1080 tcccagagac cggagttggg catggttgcg aaaccatagg cctatacttc cttacctgtt 1140 gtgaatgtat ctggtaatgt acttaagaga tggttgagcc tcgagctttg atgaatgctg 1200 ttgcagttca tcaactttgc aacctggttt gcctgatttc aaaaaaaaaa aaaaaaaaaa 1260
<210> 82 <211> 249 <212> PRT <213> Triticum aestivum <400> 82 Met Arg Leu Tyr Leu His Ala Asn Ser Asn Thr Leu Phe Val Ser Asp 1 5 10 15 Asn Asp Asn Asp His Gly Lys Pro Asp Gln His Met Val Lys Pro Leu 20 25 30 Leu Ser Leu Gly Asn Pro Glu Thr Val Ala Pro Pro Pro Met Leu Asp 35 40 45 Cys Ser Gln Ser Phe Ala Tyr lie Pro Tyr Thr Ala Asp Ala Tyr Ala 50 55 60
57 Gly lie Phe Pro Gly Tyr Ala Ser His Ala lie Val His Pro Gln Leu 65 70 75 80
Asn Ala Ala Thr Asn Ser Arg Val Pro Leu Pro Val Glu Pro Ala Ala 85 90 95 Glu Glu Pro Met Phe Val Asn Ala Lys Gln Tyr His Ala lie Leu Arg 100 105 110 Arg Arg Gln lie Arg Ala Lys Leu Glu Ala Gln Asn Lys Leu Val Lys 115 120 125 Ala Arg Lys Pro Tyr Leu His Glu Ser Arg His Arg His Ala Met Lys 130 135 140 Arg Ala Arg Gly Thr Gly Gly Arg Phe Leu Asn Thr Lys Gln Leu Glu 145 150 155 160
Glu Gln Lys Gln Lys Gln Ala Ser Gly Gly Ala Ser Cys Thr Lys Val 165 170 175 Leu Gly Lys Asn Thr Leu Leu Gln Ser Ser Pro Ala Phe Ala Pro Ser 180 185 190 Ala Ser Ala Pro Ser Asn Met Ser Ser Phe Ser Thr Thr Gly Met Leu 195 200 205 Ala Asn Gln Glu Arg Thr Cys Phe Pro Ser Val Gly Phe Arg Pro Thr 210 215 220 Val Ser Phe Ser Ala Leu Asn Gly Asn Gly Lys Leu Ala Pro Asn Gly 225 230 235 240
Met His Gln Arg Ala Ser Met Met Arg 245 <210> 83 <211> 887 <212> ADN <213> Canna edulis <400> 83 gcacgagatt cactcccagt tcttctcccc ggttttccgc ctctctccgc aggttttcga 6Q cgtctggttt gccctaaatc agctgaatgg atcagccgcc tggccacccc gccgtccctc 120 cggtgatggg cgtcgccgct ggagtgcctt atgcaactgc cgctgccgcc ggaccctatc 180 aggcctacca gaacctctac caccagcagc aacagcagca gcagcaacaa ctccagatgt 240 tctgggccga ccagtaccgt gagatcgagc aaactaccga cttccggaac cacagcctgc 300 cgctcgcgcg gatcaagaag atcatgaagg ccgacgagga cgtgcgtatg atcgctgccg 360 aggcgcctgt ggtgttcgcc cgcgcctgcg agatgttcat cctggaactc acccaccggt 420 cgtgggctca cgccgaggag aacaagcgcc ggacactgca gaagaacgat atagccgcgg 480 ccatcagccg caccgacgtg ttcgattttc tcattgatat cgtgccaagg gaggagggga 540 aggaagatgt tgcccacgcc ctcggacccc cagctggtgg tgaccccctc gcttactatt 600 atgtccagaa gtagaagctg ctgctgtgtg agtctttaat taaatgtctc catgttctca 660 atttcataaa tgccttagtg tgattataaa catagggcat ggggtttggt ttgttacctg 720 aagtgcactg aatttaatct ctagtgaact tgctttgcat agctggtgat gtgttcttgt 780 tagtaagttt atattgtttg ggtattgtcc atctaactac atgtatgctt atggcaagca 840 tcattacatt gatatggatg ggcatttacg ctgctctcat tcgcgcc 887
58 <210> 84 <211> 175 <212> PRT <213> Canna edulis <400> 84 Met Asp Gln Pro Pro Gly His Pro Ala Val Pro Pro Val Met Gly Val 1 5 10 15 Ala Ala Gly Val Pro Tyr Ala Thr Ala Ala Ala Ala Gly Pro Tyr Gln 20 25 30 Ala Tyr Gln Asn Leu Tyr His Gln Gln Gln Gln Gln Gln Gln Gln Gln 35 40 45 Leu Gln Met Phe Trp Ala Asp Gln Tyr Arg Glu lie Glu Gln Thr Thr 50 55 60 Asp Phe Arg Asn His Ser Leu Pro Leu Ala Arg lie Lys Lys lie Met 65 70 75 80
Lys Ala Asp Glu Asp Val Arg Met lie Ala Ala Glu Ala Pro Val Val 85 90 95 Phe Ala Arg Ala Cys Glu Met Phe lie Leu Glu Leu Thr His Arg Ser 100 105 110 Trp Ala His Ala Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp 115 120 125 lie Ala Ala Ala lie Ser Arg Thr Asp Val Phe Asp Phe Leu He Asp 130 135 140 He Val Pro Arg Glu Glu Gly Lys Glu Asp Val Ala His Ala Leu Gly 145 150 155 160
Pro Pro Ala Gly Gly Asp Pro Leu Ala Tyr Tyr Tyr Val Gln Lys 165 170 175 <210> 85 <211> 988 <212> ADN <213> Vitis sp. <400> 85 caaaaaaaaa atcccaaaac aagcagagac accctcctcc ctcgaatcaa attacaaaga 60 aatggagaac aaccagcagg cccaatcctc cccataccca ccacagcaac cctttcacca 120 tcttctgcag cagcaacagc agcagcttca gatgttttgg tcctaccaac gccaagagat 180 cgagcaggtg aacgacttca agaaccacca actgcctctg gcccgcatca agaagattat 240 gaaggcggat gaggatgtcc ggatgatctc ggcggaggcc ccaatcctct tcgccaaggc 300 ctgcgagctc ttcattctgg agctgacgat aaggtcgtgg ttgcacgcgg aggagaacaa 360 gaggaggaca ctgcagaaga atgatatcgc cgcggcgatt-actaggacgg atatatttga 420 ttttttggtg gatattgtgc cgagggatga gatcaaggac gaggggggct tggggatggt 480 agggtcgacg gccagtgggg tgccgtacta ttatccgccg atggggcagc ccgcgccggg 540 agtaatgatg ggaaggccgg cggttccggg ggtggatccg ggggtgtacg tgcagccgcc 600 gtcgcaggca tggcagtcgg tgtggcagac ggcagaggac gggtcgtacg ggagcggagg 660 gagcagtgga caggggaatc ttgatggcca aggttaagca aacgcccatt gtggatgttg 720 tggtgcttcc cggcatgatg gaaactatcg agctcgtgga cagaacttgg attttccttg 780 gctatgaatt gctctgttat tatttgtgaa aactagttgg tttttaatgt aatggcttca 840
59 attagaaact tgttaaaaac cgtgatttgg accagtgcag tgatatgact caactaatcc 900 tatgtgcagt tctaaatgta aggtccatgt ttttcatttt aactgaatga ttctagttat 960 ctgattaaaa aaaaaaaaaa aaaaaaaa 988
<210> 86 <211> 211 <212> PRT <213> Vitis sp. <400> 86 Met Glu Asn Asn Gln Gln Ala Gln Ser Ser Pro Tyr Pro Pro Gln Gln
1 5 10 15 Pro Phe His His Leu Leu Gln Gln Gln Gln Gln Gln Leu Gln Met Phe 20 25 30 Trp Ser Tyr Gln Arg Gln Glu lie Glu Gln Val Asn Asp Phe Lys Asn 35 • 40 45 His Gln Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp Glu 50 55 60 Asp Val Arg Met lie Ser Ala Glu Ala Pro lie Leu Phe Ala Lys Ala 65 70 75 80
Cys Glu Leu Phe lie Leu Glu Leu Thr lie Arg Ser Trp Leu His · Ala 85 90 95 Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp lie Ala Ala Ala 100 105 110 lie Thr Arg Thr Asp lie Phe Asp Phe Leu Val Asp lie Val Pro Arg 115 120 125 Asp Glu lie Lys Asp Glu Gly Gly Leu Gly Met Val Gly Ser Thr Ala 130 135 140 Ser Gly Val Pro Tyr Tyr Tyr Pro Pro Met Gly Gln Pro Ala Pro Gly 145 150 155 160
Val Met Met Gly Arg Pro Ala Val Pro Gly Val Asp Pro Gly Val Tyr 165 170 175 Val Gln Pro Pro Ser Gln Ala Trp Gln Ser Val Trp Gln Thr Ala Glu 180 185 190 Asp Gly Ser Tyr Gly Ser Gly Gly Ser Ser Gly Gln Gly Asn Leu Asp 195 200 205 Gly Gln Gly 210 <210> 87 <211> 1572 <212> ADN <213> Zea mays
60 <400> 87 ccacgcgtcc gcataagaaa aaaaatgaag cttgccattt cgctcagggc cctgcagcgg 60 cggcagctgg cgggagagag gcttgggact gggccgcccg gccgcgagga ataaactcac 120 tcctgtcttc atacgtatcc atagccggca ggcggcagta cctgtatgtg gttttagcta 180 tacgcgacct cagttcgggc gcaagctaca accccgacca ggcgagaaga agcatcgata 240 gtgtgacgag ctaacccacc accagcaacg taatccaaat ccatggacaa ccagccgctg 300 ccctactcca caggccagcc ccctgccccc ggaggagccc cggtggcggg catgcctggc 360 gcggccggcc tcccacccgt gccgcaccac cacctgctcc agcagcagca ggcccagctg 420 caggcgttct gggcgtacca gcgccaggag gcggagcgcg cgtccgcgtc ggacttcaag 480 aaccaccagc tgcctctggc ccggatcaag aagatcatga aggccgacga ggacgtgcgc 540 atgatctccg ccgaggcgcc cgtgctgttc gccaaggcct gcgagctctt catcctcgag 600 ctcactatcc gctcctggct ccacgccgag gagaacaagc gccgcaccct gcagcgcaac 660 gacgtcgccg cggccatcgc gcgcaccgac gtcttcgatt tcctcgtcga catcgtgccc 720 cgcgaggagg ccaaggagga gcccggcagc gccctcggct tcgcggcgcc tggtaccggc 780 gtcgtcgggg ctggcgcccc gggcggggcg ccagccgccg ggatgcccta ctactatccg 840 ccgatggggc agccggcgcc gatgatgccg gcctggcatg ttccggcctg ggacccggcc 900 tggcagcaag gggcagcgga tgtcgatcag agcggcagct tcagcgagga aggacaaggg 960 tttggagcag gccatggcgg cgccgctagc ttccctcctg cgcctccgac ctccgagtga 1020 tcgatcggcg cgtctcttgg tcctggcctc ctggcttagc tacatgtgca tgatgtcaat 1080 cgttcaatgt gccatgctgt gtatactcta cagcaaacgt ggtaatggag ctgctatgca 1140 tacagaacga ataaggcgtg acgtgtgaga ccgtaagagt acgtagtact aatatgtaga 1200 tgcacgtgac gtgccaatta atcaaagatt aacatgcagt taattaatta gtcctcctac 1260 cgaggtgcct catctatatt ttttttccat ttatatatcg agttcacaca atccataaga 1320 atacaaactt cggcaaggtt taggatttgg ggaacttgag gcttggggag ttagggttcc 1380 atggctaccg gtcgtgatga cacatggggc atcaaggtag attaagggtc tgtttgtttg 1440 aacttttaga gtttttttga aaagttgttg ttgaactttt gatactgaga agccaattca 1500 acgatgttat tagttcctga aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1560 aaaaaaaaaa ag 1572
<210> 88 <211> 245 <212> PRT <213> Zea mays <400> 88 Met Asp Asn Gln Pro Leu Pro Tyr Ser Thr Gly Gln Pro Pro Ala Pro 1 5 10 15 Gly Gly Ala Pro Val Ala Gly Met Pro Gly Ala Ala Gly Leu Pro Pro 20 25 30 Val Pro His His His Leu Leu Gln Gln Gln Gln Ala Gln Leu Gln Ala 35 40 45 Phe Trp Ala Tyr Gln Arg Gln Glu Ala Glu Arg Ala Ser Ala Ser Asp 50 55 60 Phe Lys Asn His Gln Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys 65 70 75 80
Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val Leu Phe 85 90 95 Ala Lys Ala Cys Glu Leu Phe lie Leu Glu Leu Thr lie Arg Ser Trp 100 105 110 Leu His Ala Glu Glu Asn Lys Arg Arg Thr Leu Gln Arg Asn Asp Val 115 120 125
61 Ala Ala Ala lie Ala Arg Thr Asp Val Phe Asp Phe Leu Val Asp lie 130 135 140 Val Pro Arg Glu Glu Ala Lys Glu Glu Pro Gly Ser Ala Leu Gly Phe 145 150 155 160
Ala Ala Pro Gly Thr Gly Val Val Gly Ala Gly Ala Pro Gly Gly Ala 165 170 175 Pro Ala Ala Gly Met Pro Tyr Tyr Tyr Pro Pro Met Gly Gln Pro Ala 180 185 190 Pro Met Met Pro Ala Trp His Val Pro Ala Trp Asp Pro Ala Trp Gln 195 200 205 Gln Gly Ala Ala Asp Val Asp Gln Ser Gly Ser Phe Ser Glu Glu Gly 210 215 220 Gln Gly Phe Gly Ala Gly His Gly Gly Ala Ala Ser Phe Pro Pro Ala 225 230 235 240
Pro Pro Thr Ser Glu 245 <210> 89 <211> 1164 <212> ADN <213> Zea mays <400> 89 gcacgagtct ccccccattc tccaatccgt gccctagtcg agccagccgc gaggaaggag 60 gcgtctcgcc tagcgcccgc ccgtcggccg accttctgct gcaccttcga actctggaaa 120 gatcatagat ttttgggcaa tagcaagtgg acatggaacc atcctctcag cctcagcctg 180 cgatgggtgt cgccgccggt gggtcacaag tgtatcctgc gtctgcctac ccgcctgcag 240 caacagtagc tcctcctgct gttgcatctg ctggtttaca gtcagtgcaa ccattcccag 300 ccaaccctgc ccatatgagt gctcagcacc agattgtcta ccaacaagct caacagttcc 360 accaacagct ccagcagcag caacagcagc agcttcagca gttctgggtc gaacgcatga 420 ctgaaatcga ggcaacagct gatttcagga accacaactt gccacttgcg aggataaaga 480 agatcatgaa ggccgacgaa gatgtccgca tgatctcagc cgaagctccc gtggtcttcg 540 caaaagcttg cgagatattc atactggagc tgacgctgag gtcgtggatg cacaccgagg 600 agaacaagcg ccgcaccttg cagaagaacg acattgccgc agccatcacc aggaccgaca 660 tttacgactt cttggtcgac attgttccca gggatgagat gaaggacgac ggaatcgggc 720 ttcctaggcc cgggctgcca cccatgggag ccccagctga cgcatatcca tactactaca 780 tgccacagca gcaggtgcct ggtcctggga tggtttatgg cgcccagcaa ggccacccgg 840 tgacgtatct gtggcaggat cctcaggaac agcaggagca agctcctgaa gagcagcagt 900 ctctgcatga aagggactga ggatgtcgct caagctatca cctgattttt cagagctctc 960 attttaggtt ctctaaactg caggttttcg ttggctaata tcgttgggta tcaaactgaa 1020 acaggtaggg tgtagcatca tggtagtttg atttctgctg tggtgttagt tggagggata 1080 atgattagcg gctagtggat taaagttacc cataccgttt cctttcgttc caaaaaaaaa 1140 aaaaaaaaaa aaaaaaaaaa aaaa 1164
<210> 90 <211> 255 <212> PRT <213> Zea mays
62 <400> 90 Met Glu Pro Ser Ser Gln Pro Gln Pro Ala Met Gly Val Ala Ala Gly 1 5 . 10 15 Gly Ser Gln Val Tyr Pro Ala Ser Ala Tyr Pro Pro Ala Ala Thr Val 20 25 30 Ala Pro Pro Ala Val Ala Ser Ala Gly Leu Gln Ser Val Gln Pro Phe 35 40 45 Pro Ala Asn Pro Ala His Met Ser Ala Gln His Gln lie Val Tyr Gln 50 55 60 Gln Ala Gln Gln Phe His Gln Gln Leu Gln Gln Gln Gln Gln Gln Gln 65 70 75 80 Leu Gln Gln Phe Trp Val Glu Arg Met Thr Glu lie Glu Ala Thr Ala 85 90 95 Asp Phe Arg Asn His Asn Leu Pro Leu Ala Arg lie Lys Lys lie Met 100 105 110 Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val Val 115 120 125 Phe Ala Lys Ala Cys Glu lie Phe lie Leu Glu Leu Thr Leu Arg Ser 130 135 140 Trp Met His Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp 145 150 ' 155 160 lie Ala Ala Ala lie Thr Arg Thr Asp lie Tyr Asp Phe Leu Val Asp 165 170 175 lie Val Pro Arg Asp Glu Met Lys Asp Asp Gly lie Gly Leu Pro Arg 180 185 190 Pro Gly Leu Pro Pro Met Gly Ala Pro Ala Asp Ala Tyr Pro Tyr Tyr 195 200 205 Tyr Met Pro Gln Gln Gln Val Pro Gly Pro Gly Met Val Tyr Gly Ala 210 215 220 Gln Gln Gly His Pro Val Thr Tyr Leu Trp Gln Asp Pro Gln Glu Gln 225 230 235 240
Gln Glu Gln Ala Pro Glu Glu Gln Gln Ser Leu His Glu Arg Asp 245 250 255 <210> 91 <211> 1270 <212> ADN <213> Zea mays <400> 91 gcacgaggac gagacagaga gagaaggcca agaggcttcc tctccccatt cctcccttcc 60 gtgccctagc cgagccagcc gcgaggaagg aggcatcccg ccgtctcgcc tggcgcccgc 120 ccgtcggccg accttctgcc gcagcttcca attgtaaaaa gatcatagat ttttgtgcaa 180 gagcgagtgg atatggaacc atcccctcag cctatgggtg tcgctgccgg tgggtcacaa 240
63 gtgtatcctg cctctgccta tccgcctgca gcaacagtag ctcctgcttc tgttgtatct 300 gctggtttac agtcagggca gccattccca gccaatcctg gtcatatgag tgctcagcac 360 cagattgtct accaacaagc tcaacaattc caccaacagc tccagcagca acaacaacag 420 cagcttcagc agttctgggt tgaacgcatg actgaaattg aggcgacgac tgatttcaag 480 aaccacaact tgccacttgc gaggataaag aagatcatga aggccgatga agatgttcgc 540 atgatctcag ctgaagctcc tgtagtcttt gcaaaagctt gtgagatatt catactggag 600 ctgacactta ggtcgtggat gcacactgag gagaacaagc gccgcacctt gcaaaagaat 660 gacattgcag cagcgatcac taggactgac atttatgact tcttggtcga cattgttccc 720 agggatgaga tgaaggagga cggaattggg cttcctaggg ctggtctgcc acccatggga 780 gccccagctg atgcatatcc atactactac atgccacagc agcaggtgcc tggttctgga 840 atggtttatg gtgcccagca agggcaccca gtgacttatt tgtggcagga gcctcagcaa 900 cagcaggagc aagctcctga agagcagcaa tctgcatgaa agtggctgag aatattgctc 960 agaagctatc acctgattca gagttctcat tttaggttgt ccaaactgca ggttttctta 1020 gtaatatcgt tggttatcaa actgaaacag gcgattctaa gtagggtgta gcatcatggt 1080 agtttcattt ctgcttgtga tgttagttga aaggataatg attagtggct agtggattaa 1140 agttaccata ccatttcctt ctattccgaa agtttgcctc catgaggcct ctgatatgac 1200 gtgctagttg ttaatgcttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260 aaaaaaaaaa 1270
<210> 92 <211> 248 <212> PRT <213> Zea mays <400> 92 et Glu Pro Ser Pro Gln Pro Met Gly Val Ala Ala Gly Gly Ser Gln 1 5 10 15 Val Tyr Pro Ala Ser Ala Tyr Pro Pro Ala Ala Thr Val Ala Pro Ala 20 25 30 Ser Val Val Ser Ala Gly Leu Gln Ser Gly Gln Pro Phe Pro Ala Asn 35 40 45 Pro Gly His Met Ser Ala Gln His Gln lie Val Tyr Gln Gln Ala Gln 50 55 60 Gln Phe His Gln Gln Leu Gln Gln Gln Gln Gln Gln Gln Leu Gln Gln 65 70 75 80 Phe Trp Val Glu Arg Met Thr Glu lie Glu Ala Thr Thr Asp Phe Lys 85 90 95 Asn His Asn Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp 100 105 110 Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val Val Phe Ala Lys 115 120 125 Ala Cys Glu lie Phe lie Leu Glu Leu Thr Leu Arg Ser Trp Met His 130 135 140 Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp lie Ala Ala 145 150 155 160
Ala lie Thr Arg Thr Asp lie Tyr Asp Phe Leu Val Asp lie Val Pro 165 170 175
64 Arg Asp Glu Met Lys Glu Asp Gly lie Gly Leu Pro Arg Ala Gly Leu 180 185 190 Pro Pro Met Gly Ala Pro Ala Asp Ala Tyr Pro Tyr Tyr Tyr Met Pro 195 200 205 Gln Gln Gln Val Pro Gly Ser Gly Met Val Tyr Gly Ala Gln Gln Gly 210 215 220 His Pro Val Thr Tyr Leu Trp Gln Glu Pro Gln Gln Gln Gln Glu Gln 225 230 235 240
Ala Pro Glu Glu Gln Gln Ser Ala 245 <210> 93 <211> 511 <212> ADN <213> Zea mays <220> <221> inseguro <222> (442) <223> n = A, C, G, o ' <220> <221> inseguro <222> (452) <223> n = A, C, G, o ' <220> <221> inseguro <222> (474) · <223> n = A, C, G, o ' <220> <221> inseguro <222> (497) <223> n = A, C, G, o ' <220> <221> inseguro <222> (504) <223> n = A, C, G, o ' <400> 93 gactcaactc agtgctcagc accagatggt gtaccagcag gctcagcaat ttcatcaaca 60 acttcagcaa cagcaggaac aacagctcag ggagttctgg actacccaga tggatgagat 120 caagcaagca aatgacttca agatccacac cttgccactt gcaaggataa agaagataat 180 gaaggctgat gaggatgtgc ggatgatctc tgcagaagct cctgttgtgt ttgcgaaggc 240 atgcgaggta ttcatattag agctgacatt gaggtcatgg atgcacacag aggagaacaa 300 gcgccggacc ttgcagaaga acgacattgc agctgccatc accaggactg atatatatga 360 cttcttggtg gacataatcc cgagggatga aatgaaagag gaagggcttc ggacataatc 420 ccatagttgg cctgccgcct gntatggggg cntccagctt gatcatgggt cttnatccat 480 tattactatg tggccantta acangtgcca a 511
<210> 94 <211> 135
65 <212> PRT <213> Zea mays <400> 94 Thr Gln leu Ser Ala Gln His Gln Met Val Tyr Gln Gln Ala Gln Gln 1 5 10 15
Phe His Gln Gln Leu Gln Gln Gln Gln Glu Gln Gln Leu Arg Glu Phe 20 25 30 Trp Thr Thr Gln Met Asp Glu lie Lys Gln Ala Asn Asp Phe Lys lie 35 40 45 His Thr Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp Glu 50 55 60 Asp Val Arg Met lie Ser Ala Glu Ala Pro Val Val Phe Ala Lys Ala 65 70 75 80
Cys Glu Val Phe lie Leu Glu Leu Thr Leu Arg- Ser Trp Met His Thr 85 90 95
Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp lie Cys Ser Cys 100 105 110 His His Pro Gly Leu lie Tyr Met Thr Ser Leu Val Asp lie lie Pro 115 120 125 Arg Asp Glu Met lys Glu Glu 130 135 <210> 95 <211> 499 <212> ADN <213> Zea mays <220> <221> inseguro <222> (278) <223> n = A, C, G <220> <221> inseguro <222> (368) <223> n = A, C, G <220> <221> inseguro <222> (390) .. (391 <223> n = A, C, G <220> <221> inseguro <222> (452) <223> n = A, C, G <220> <221> inseguro
66 <222> (468) <223> n = A, C, G, o T <220> <221> inseguro <222> (474) <223> n = A, C, G, o T <220> <221> inseguro <222> (480) <223> n = A, C, G, o T <220> <221> inseguro <222> (486) <223> n = A, C, G, o T <400> 95 ctttctcccc tgttgttgtt gatccaaaaa gccacctccc cccaacccaa tcccgtcgtc 60 actctctcac tccactgcct ccggaacacc ctagcaatgg atcccaactc cagcatccct 120 cccccggtga tgggcgcggc ggtggcgtac cctccggcgg ccggcgccgc gtactccgcc 180 gggccgtacg cgcacgcgca cgcggcgttg ggcgcgctgt acccgcctcc cccggcgccg 240 ggtcccccct cctcgcacca gggcggcgcg gcggcggngc agctgcagct gttctgggcg 300 gagcagtacc gcgagatcga ggcgacgacg gacttcaaga accacaacct gccgctgggc 360 cgcatcanga agatcatgaa ggcggacgan ngactgcgca tgatcgccgc cgaggcgccg 420 gtggtgttcg cccgcgcctg cgagatgttc ancctggagc tgaccaancg cggntgggcn 480 cacgcngagg aaaaaaaac 499
<210> 96 <211> 134 <212> PRT <213> Zea mays <220> <221> INSEGURO <222> (61) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (91) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (98).. (99) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (119) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (124) <223> Xaa = cualquier aminoácido
67 <400> 96 Met Asp Pro Asn Ser Ser lie Pro Pro Pro Val Met Gly Ala Ala Val 1 5 , 10 15 Ala Tyr Pro Pro Ala Ala Gly Ala Ala Tyr Ser Ala Gly Pro Tyr Ala 20 25 30 His Ala His Ala Ala Leu Gly Ala Leu Tyr Pro Pro Pro Pro Ala Pro 35 40 45 Gly Pro Pro Ser Ser His Gln Gly Gly Ala Ala Ala Xaa Gln Leu Gln 50 55 60 Leu Phe Trp Ala Glu Gln Tyr Arg Glu lie Glu Ala Thr Thr Asp Phe 65 70 75 80 Lys Asn His Asn Leu Pro Leu Gly Arg lie Xaa Lys lie Met Lys Ala 85 90 95 Asp Xaa Xaa Leu Arg Met lie Ala Ala Glu Ala- Pro Val Val Phe Ala 100 105 110 Arg Ala Cys Glu Met Phe Xaa Leu Glu Leu Thr Xaa Arg Gly Trp Ala 115 120 125 His Ala Glu Glu Lys Lys 130 <210> 97 <211> 1060 <212> ADN <213> Zea mays <400> 97 gcacgagaag caccttcctc ttcctcttcc tccgcccccc aatccccctc gtctcacaac 60 cctagctgcc cccgaatcca tggatcccaa caaatccagc accccgccgc cgcctccagt 120 catgggtgcc cccgttgcct accctccgcc ggcgtaccct cccggtgtgg ccgccggcgc 180 cggcgcctac ccgccgcagc tctacgcgcc gccggctgct gccgcggccc agcaggcggc 240 ggccgcgcag cagcagcagc tgcagatatt ctgggcggag cagtaccgcg agatcgaggc 300 cactaccgac ttcaagaatc acaacctccc gctcgcccgc atcaagaaga tcatgaaagc 360 cgacgaggac gtccgcatga tcgccgccga ggctcccgtg gtgttcgccc gggcctgcga 420 gatgttcatc ctcgagctca cccatcgcgg ctgggcgcac gccgaagaga acaagcgccg 480 cacgctccag aaatccgaca ttgccgctgc catcgcccgc accgaggtat tcgacttcct 540 tgtggacatc gttccgcgcg acgacggtaa agacgctgat gcggcggccg ccgcagctgc 600 cgcggctgcc gggatcccgc gccccgccgc cggagtacca gccaccgacc ctctcgccta 660 ctactacgtg cctcagcagt aatgtatcat catcacgtta ttgttccgtc tatgtgcctg 720 agcaataatg tatcatcatt gccttattgt tccggggcag ttgtgttatt tgtgtctgtt 780 tagttgctgc tgctgttacc gcgtaatagc atatgtgtta tctgtgtcTg tttagttgct 840 gctgctgttg ccgcgtaata aaacttggtc gtttacgggg ctccctcaag attaagaatt 900 gagttgtttg atggtagaat cctggtaagg ttgttgtaac tggggggcgc ctttgtttgg 960 gctggtagtg tatgcctagg cctcacttat ctgatgctgt aatgcgacaa gtattatgtg 1020 gttgtctggt aattattgtg caaaaaaaaa aaaaaaaaaa 1060
<210> 98 <211> 200 <212> PRT <213> Zea mays
68 <400> 98 Met Asp Pro Asn Lys Ser Ser Thr Pro Pro Pro Pro Pro Val Met Gly 1 5 10 15 Ala Pro Val Ala Tyr Pro Pro Pro Ala Tyr Pro Pro Gly Val Ala Ala 20 25 30 Gly Ala Gly Ala Tyr Pro Pro Gln Leu Tyr Ala Pro Pro Ala Ala Ala 35 40 45 Ala Ala Gln Gln Ala Ala Ala Ala Gln Gln Gln Gln Leu Gln lie Phe 50 55 60 Trp Ala Glu Gln Tyr Arg Glu lie Glu Ala Thr Thr Asp Phe Lys Asn 65 70 75 80
His Asn Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp Glu 85 90 95 Asp Val Arg Met lie Ala Ala Glu Ala Pro Val Val Phe Ala Arg Ala 100 105 110 Cys Glu Met Phe lie Leu Glu Leu Thr His Arg Gly Trp Ala His Ala 115 120 125 Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Ser Asp lie Ala Ala Ala 130 135 140 lie Ala Arg Thr Glu Val Phe Asp Phe Leu Val Asp lie Val Pro Arg 145 150 155 160
Asp Asp Gly Lys Asp Ala Asp Ala Ala Ala Ala Ala Ala Ala Ala Ala 165 170 175 Ala Gly lie Pro Arg Pro Ala Ala Gly Val Pro Ala Thr Asp Pro Leu 180 185 190 Ala Tyr Tyr Tyr Val Pro Gln Gln 195 200 <210> 99 <211> 901 <212> ADN <213> Zea mays <400> 99 gcacgagtga ccgccggaac accctaggca atggagccca aatccaccac ccctcccccg 60 ccccccgtga tgggcgcgcc catcgcgtat cctcccccgc ccggcgccgc gtaccccgcc 120 gggccgtacg tgcacgcgcc ggcggccgcg ctctaccctc ctcctcccct gccgccggcg 180 cccccctcct cgcagcaggg cgccgcggcg gcgcaccagc agcagctatt ctgggcggag 240 caataccgcg agatcgaggc caccaccgac ttcaagaacc acaacctgcc gctcgcccgc 300 atcaagaaga tcatgaaggc cgacgaggac gtgcgcatga tcgccgccga ggcgcccgtc 360 gtcttctccc gcgcctgcga gatgttcatc ctcgagctca cccaccgcgg ctgggcacac 420 gccgaggaga acaagcgccg cacgctgcag aagtccgaca tcgccgccgc cgtcgcgcgc 480 accgaggtct tcgacttcct cgtcgacatc gtgccgcggg acgaggccaa ggacgccgac 540 tccgccgcca tgggagcagc cgggatcccg caccccgccg ccggcctgcc cgccgccgat 600 cccatgggct actactacgt ccagccgcag taacgaattt gcttccttat catggtttcg 660 cttccatgca gcctttgcgg gtttttagta aactattatt attactgaga gtgccctgtt 720 gttacccatg ctctgttgtt gccacccaat aactcgatga cctgatgatc atctgatgtg 780
69 cctcccgttc cgtaacaagt gattccattt ctgattaaaa aaaaaaaaaa aaaaaaaaaa 840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaccaa aaaaaaaaaa aaaaaaaaaa 900 a _ 901
<210> 100 <211> 200 <212> PRT <213> Zea mays <400> 100 Met Glu Pro Lys Ser Thr Thr Pro Ero Pro Pro Pro Val Met Gly Ala 1 5 10 15 Pro lie Ala Tyr Pro Pro Pro Pro Gly Ala Ala Tyr Pro Ala Gly Pro 20 25 30 Tyr Val His Ala Pro Ala Ala Ala Leu Tyr Pro Pro Pro Pro Leu Pro 35 40 45 Pro Ala Pro Pro Ser Ser Gln Gln Gly Ala Ala Ala Ala His Gln Gln 50 55 60 Gln Leu Phe Trp Ala Glu Gln Tyr Arg Glu lie Glu Ala Thr Thr Asp 65 70 75 80 Phe Lys Asn His Asn Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys 85 90 95 Ala Asp Glu Asp Val Arg Met lie Ala Ala Glu Ala Pro Val Val Phe 100 105 110 Ser Arg Ala Cys Glu Met Phe lie Leu Glu Leu Thr His Arg Gly Trp 115 120 125 Ala His Ala Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Ser Asp lie 130 135 140 Ala Ala Ala Val Ala Arg Thr Glu Val Phe Asp Phe Leu Val Asp lie 145 150 155 160
Val Pro Arg Asp Glu Ala Lys Asp Ala Asp Ser Ala Ala Met Gly Ala 165 170 175 Ala Gly lie Pro His Pro Ala Ala Gly Leu Pro Ala Ala Asp Pro Met 180 185 190 Gly Tyr Tyr Tyr Val Gln Pro Gln 195 200 <210> 101 <211> 1118 <212> ADN <213> Oyza sativa <400> 101 cacacacagc tacaaatcga ctgtaattaa ggtacgtata tataggtgac aatggacaac 60 cagcagctac cctacgccgg tcagccggcg gccgcaggcg ccggagcccc ggtgccgggc 120 gtgcctggcg cgggcgggcc gccggcggtg ccgcaccacc acctgctcca gcagcagcag 180
70 gcgcagctgc aggcgttctg ggcgtaccag cggcaggagg cggagcgcgc gtcggcgtcg 240 gacttcaaga accaccagct gccgctggcg cggatcaaga agatcatgaa ggcggacgag 300 gacgtgcgca tgatctcggc ggaggcgccc gtgctgttcg ccaaggcgtg cgagctcttc 360 atcctggagc tcaccatccg ctcgtggctg cacgccgagg agaacaagcg ccgcaccctg 420 cagcgcaacg acgtcgccgc cgccatcgcg cgcaccgacg tgttcgactt cctcgtcgac 480 atcgtgccgc gggaggaggc caaggaggag cccggcagcg cgctcgggtt cgcggcggga 540 gggcccgccg gcgccgttgg agcggccggc cccgccgcgg ggctgccgta ctactacccg 600 ccgatggggc agccggcgcc gatgatgccg gcgtggcatg ttccggcgtg ggacccggcg 660 tggcagcaag gagcagcgcc ggatgtggac cagggcgccg ccggcagctt cagcgaggaa 720 gggcagcaag gttttgcagg ccatggcggt gcggcagcta gcttccctcc tgcacctcca 780 agctccgaat agtgatgatc catatggttc catgcatgca tcgctgaggt gctagctagc 840 tactatagct gctcaaatca aatgctcaat gtgtcggtaa ttaattaatg tggtacgtat 900 taacttaacc gatgtacgta atggacgctc aagctaatta agggatgtac aatttactaa 960 ttaatttaat ttgtaatata tagccgatta actagcaagg tgacccagta ctatttgtaa 1020 tttcttttcc cgttatgcta ctaattgtgg acgcacaaac cattaccgga acagaaatta 1080 ctactgatga attactataa aaaaaaaaaa aaaaaaaa 1118
<210> 102 <211> 246 <212> PRT <213> Oyza sativa <400> 102 Met Asp Asn Gln Gln Leu Pro Tyr Ala Gly Gln Pro Ala Ala Ala Gly 1 5 10 15 Ala Gly Ala Pro Val Pro Gly Val Pro Gly Ala Gly Gly Pro Pro Ala 20 25 30 Val Pro His His His Leu Leu Gln Gln Gln Gln Ala Gln Leu Gln Ala 35 40 45 Phe Trp Ala Tyr Gln Arg Gln Glu Ala Glu Arg Ala Ser Ala Ser Asp 50 55 60 Phe Lys Asn His Gln Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys 65 70 75 80 Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val Leu Phe 85 90 95 Ala Lys Ala Cys Glu Leu Phe lie Leu Glu Leu Thr lie Arg Ser Trp 100 105 110 Leu His Ala Glu Glu Asn Lys Arg Arg Thr Leu Gln Arg Asn Asp Val 115 120 ' 125 Ala Ala Ala lie Ala Arg Thr Asp Val Phe Asp Phe Leu Val Asp lie 130 135 140 Val Pro Arg Glu Glu Ala Lys Glu Glu Pro Gly Ser Ala Leu Gly Phe 145 150 155 160
Ala Ala Gly Gly Pro Ala Gly Ala Val Gly Ala Ala Gly Pro Ala Ala 165 170 175 Gly Leu Pro Tyr Tyr Tyr Pro Pro Met Gly Gln Pro Ala Pro Met Met 180 185 190
71 Pro Ala Trp His Val Pro Ala Trp Asp Pro Ala Trp Gln Gln Gly Ala 195 200 205 Ala Pro Asp Val Asp Gln Gly Ala Ala Gly Ser Phe Ser Glu Glu Gly 210 215 220 Gln Gln Gly Phe Ala Gly His Gly Gly Ala Ala Ala Ser Phe Pro Pro 225 230 235 240
Ala Pro Pro Ser Ser Glu 245 <210> 103 <211> 1343 <212> ADN <213> Oyza sativa <400> 103 tctgacccaa gggcgaccgc gtctccctct ctctctctct ctccgccgcc gacgccgagg 60 gctccacgag agggaggtgg gcggcgcggc ccttcgccgg agggagcgct ctccgccgcc 120 gccgctcccg ctcccgccgg cgcgggagat ccgggcgtcg tctctcgggc ctttggcttt 180 ggacggacaa gagctgacat ggaaccatcc tcacagcctc agcctgtgat gggtgttgcc 240 actggtgggt cacaagcata tcctcctcct gctgctgcat atccacctca agccatggtt 300 cctggagctc ctgctgttgt tcctcctggc-tcacagccat cagcaccatt ccccactaat 360 ccagctcaac tcagtgctca gcaccagcta gtctaccaac aagcccagca atttcatcag 420 cagctgcagc aacagcaaca gcagcaactc cgtgagttct gggctaacca aatggaagag 480 attgagcaaa caaccgactt caagaaccac agcttgccac tcgcaaggat aaagaagata 540 atgaaggctg atgaggatgt ccggatgatc tcggcagaag cccccgttgt cttcgcaaag 600 gcatgcgagg tattcatatt agagttaaca ttgaggtcgt ggatgcacac ggaggagaac 660 aagcgccgga ccttgcagaa gaatgacatt gcagctgcca tcaccaggac tgatatctat 720 gacttcttgg tggacatagt tcccagggat gaaatgaaag aagaagggct tgggcttccg 780 agggttggcc taccgcctaa tgtggggggc gcagcagaca catatccata ttactacgtg 840 ccagcgcagc aggggcctgg atcaggaatg atgtacggtg gacagcaagg tcacccggtg 900 acgtatgtgt ggcagcagcc tcaagagcaa caggaagagg cccctgaaga gcagcactct 960 ctgccagaaa gtagctaaag atgatacagt gaagttgtga cattgatata cattgtcctg 1020 tgaacttagg gcctctaaaa ctcagtgctc ttgtcaaaac tattcccatg attgttggct 1080 gaaacgggta atctgattag gtcttaggct ttcctaatgt tagttctgct ctgctatggc 1140 agcagtagaa aaaaaaaaga ttgtgatttg gtaggtgatt tgcaactaat gtagtaactg 1200 taccttacct ttcatcagtt tctaatccaa tactcaaaag tgctggcatg tggagaccct 1260 tgtatgaatt gagtgtttgt tcatgtcatg catcagtctg ttgcctcatt tatcagtcat 1320 catgcctcct gctttgcaaa aaa 1343
<210> 104 <211> 259 <212> PRT <213> Oyza sativa <400> 104 Met Glu Pro Ser Ser Gln Pro Gln Pro Val Met Gly Val Ala Thr Gly 1 5 10 15 Gly Ser Gln Ala Tyr Pro Pro Pro Ala Ala Ala Tyr Pro Pro Gln Ala 20 25 30 Met Val Pro Gly Ala Pro Ala Val Val Pro Pro Gly Ser Gln Pro Ser 35 40 45
72 Ala Pro Phe Pro Thr Asn Pro Ala Gln Leu Ser Ala Gln His Gln Leu 50 55 60 Val Tyr Gln Gln Ala Gln Gln Phe His Gln Gln Leu Gln Gln Gln Gln 65 70 75 80 Gln Gln Gln Leu Arg Glu Phe Trp Ala Asn Gln Met Glu Glu lie Glu 85 90 95 Gln Thr Thr Asp Phe Lys Asn His Ser Leu Pro Leu Ala Arg lie Lys 100 105 110 Lys lie Met Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala 115 120 125 Pro Val Val Phe Ala Lys Ala Cys Glu Val Phe lie Leu Glu Leu Thr 130 135 140 Leu Arg Ser Trp Met His Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln 145 150 155 160
Lys Asn Asp lie Ala Ala Ala lie Thr Arg Thr Asp lie Tyr Asp Phe 165 170 175 Leu Val Asp lie Val Pro Arg Asp Glu Met Lys Glu Glu Gly Leu Gly 180 185 190 Leu Pro Arg Val Gly Leu Pro Pro Asn Val Gly Gly Ala Ala Asp Thr 195 200 205 Tyr Pro Tyr Tyr Tyr Val Pro Ala Gln Gln Gly Pro Gly Ser Gly Met 210 215 220 Met Tyr Gly Gly Gln Gln Gly His Pro Val Thr Tyr Val Trp Gln Gln 225 230 235 240
Pro Gln Glu Gln Gln Glu Glu Ala Pro Glu Glu Gln His Ser Leu Pro 245 250 255 Glu Ser Ser
<210> 105 <211> 1085 <212> ADN <213> Oyza sativa <400> 105 gcacgagaag gaatctacgt tgcatgcata agacgtgttg gaaatatcat aagttttggg 60 acaagcaaga gaggacatgg agccatcatc acaacctcag ccggcaattg gtgttgttgc 120 tggtggatca caagtgtacc ctgcataccg gcctgcagca acagtgccta cagctcctgc 180 tgtcattcct gccggttcac agccagcacc gtcgttccct gccaaccctg atcaactgag 240 tgctcagcac cagctcgtct atcagcaagc ccagcaattt caccagcagc ttcagcagca 300 gcaacagcgt caactccagc agttttgggc tgaacgtctg gtcgatattg aacaaactac 360 tgacttcaag aaccacagct tgccacttgc taggataaag aagatcatga aggcagatga 420 ggacgttcgc atgatctccg cagaggctcc tgtgatcttt gcgaaagcat gtgagatatt 480 catactggag ctgaccctga gatcatggat gcacacggag gagaacaagc gccgtacctt 540 gcagaagaat gacatagcag ctgccatcac caggacggat atgtacgatt tcttggtaga 600 tatagttccc agggatgact tgaaggagga gggagttggg ctccctaggg ctggattgcc 660
73 gcccttgggt gtccctgctg actcatatcc gtatggctac tatgtgccac agcagcaggt^ 720 cccaggtgca ggaatagcgt atggtggtca gcaaggtcat ccggggtatc tgtggcagga 780 tcctcaggaa cagcaggaag agcctcctgc agagcagcaa agtgattaag aagagtaaat 840 gatccctgtg aattgtcaag aagcttacca cctgattcag aattttactt ttagccaggt 900 tgtcgtctat tctgaattta tgaataggat taggattctc tcatggtagt tgcatttctg 960 ctgtagtgga aaaggattta tgacatgaga gtatgagact aatgggtttc agttactata 1020 ccgtttcctg tcaatccaaa agttggcctt tgcgaggcca ttgatataaa aaaaaaaaaa 1080 aaaaa 1085
<210> 106 <211> 250 <212> PRT <213> Oyza sativa <400> 106 Met Glu Pro Ser Ser Gln Pro Gln Pro Ala lie Gly Val Val Ala Gly 1 5 10 15 Gly Ser Gln Val Tyr Pro Ala Tyr Arg Pro Ala Ala Thr Val Pro Thr 20 25 30 Ala Pro Ala Val lie Pro Ala Gly Ser Gln Pro Ala Pro Ser Phe Pro 35 40 45 Ala Asn Pro Asp Gln Leu Ser Ala Gln His Gln Leu Val Tyr Gln Gln 50 55 60 Ala Gln Gln Phe His Gln Gln Leu Gln · Gln Gln Gln Gln Arg Gln leu 65 70 75 80 Gln Gln Phe Trp Ala Glu Arg Leu Val Asp lie Glu Gln Thr Thr Asp 85 90 95 Phe Lys Asn His Ser Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys 100 105 110 Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val lie Phe 115 120 125 Ala Lys Ala Cys Glu lie Phe lie Leu Glu Leu Thr Leu Arg Ser Trp 130 135 140 Met His Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp lie 145 150 ' 155 160
Ala Ala Ala lie Thr Arg Thr Asp Met Tyr Asp Phe Leu Val Asp lie 165 170 175 Val Pro Arg Asp Asp Leu Lys Glu Glu Gly Val Gly Leu Pro Arg Ala 180 185 190 Gly Leu Pro Pro Leu Gly Val Pro Ala Asp Ser Tyr Pro Tyr Gly Tyr 195 200 205 Tyr Val Pro Gln Gln Glh Val Pro Gly Ala Gly lie Ala Tyr Gly Gly 210 215 220 Gln Gln Gly His Pro Gly Tyr Leu Trp Gln Asp Pro Gln Glu Gln Gln 225 230 235 240
74 Glu Glu Pro Pro Ala Glu Gln Gln Ser Asp 245 250 <210> 107 <211> 893 <212> ADN <213> Oyza sativa <400> 107 gcacgagaaa gagagagctt ttccatcccc aaatcccctc ctcctcctca aaccctagct 60 aagctccgct cgcagcagcc atggatccca ccaaatccag cacgccgccg ccggtgatgg 120 gcgcgcccgt cggcttcccg cctggcgcgt accctccgcc tccccccggc ggcgcagcag 180 cagctgcaga tgttctgggc ggagcagtac cgcgagatcg aggccaccac cgacttcaag 240 aaccacaacc tccccctggc ccgcatcaag aagatcatga aggccgacga ggacgtccgc 300 atgatcgccg ccgaggcccc cgtcgtgttc gcccgcgcct gcgagatgtt catcctcgag 360 ctcacccacc gcggctgggc gcacgccgag gagaacaagc gccgtacgct gcagaagtcc 420 gacattgccg ccgccatcgc gcgcaccgag gtgttcgact tcctcgtcga catcgtgccc 480 cgcgacgacg ccaaggacgc cgacgccgcc gcggccgcgg cggcggccgg catcccccgc 540 cccgccgccg gtgtgccggc caccgatccg ctcgcctact actatgtgcc ccagcagtaa 600 tgtatctgat taaccccttt caagcctttt ctaagcgaag gatgtgttgt tgtttgttgt 660 tgctgttgct gttcttgttg ttgttgttgc cgcgtaataa gatatgttga taatttatgg 720 cttcccctga gcttaaagaa tttgagcttt tggttctaga atctgggtaa aattgttgta 780 atggggaaga ctgtatgact gtatttgtag tgcatgtctt aacttgtcgg atagtgtaat 840 ccgataatfca ttatgcggtt agctggttac ctctcaaaaa aaaaaaaaaa aaa 893
<210> 108 <211> 172 <212> PRT <213> Oyza sativa <400> 108 Met Asp Pro Thr Lys Ser Ser Thr Pro Pro Pro Val Met Gly Ala Pro 1 5 10 15 Val Gly Phe Pro Pro Gly Ala Tyr Pro Pro Pro Pro Pro Ala Ala Gln 20 • 25 30 Gln Gln Leu Gln Met Phe Trp Ala Glu Gln Tyr Arg Glu lie Glu Ala 35 40 45 Thr Thr Asp Phe Lys Asn His Asn Leu Pro Leu Ala Arg lie Lys Lys 50 55 60 lie Met Lys Ala Asp Glu Asp Val Arg Met lie Ala Ala Glu Ala Pro 65 70 75 80
Val Val Phe Ala Arg Ala Cys Glu Met .Phe lie Leu Glu Leu Thr His 85 90 95 Arg Gly Trp Ala His Ala Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys 100 105 110 Ser Asp lie Ala Ala Ala lie Ala Arg Thr Glu Val Phe Asp Phe Leu 115 120 125 Val Asp lie Val Pro Arg Asp Asp Ala Lys Asp Ala Asp Ala Ala Ala 130 135. 140
75 Ala Ala Ala Ala Ala Gly lie Pro Arg Pro Ala Ala Gly Val Pro Ala 145 150 155 160
Thr Asp Pro Leu Ala Tyr Tyr Tyr Val Pro Gln Gln 165 170 <210> 109 <211> 1054 <212> ADN <213> Glycine max <400> 109 gcacgagggg tctctctgtc tctctcggat catcaaaatc agaaagaatt gggggaatgg 60 agaacaacca gcaacaaggc gctcaagccc aatcgggacc gtaccccggc ggcgccggtg 120 gaagtgcagg tgcaggtgca ggtgcaggcg cggccccgtt ccagcacctg ctccagcagc 180 agcagcagca gctgcagatg ttctggtcgt accagcggca agagatcgag cacgtgaacg 240 acttcaagaa ccaccagctc cccttggccc gcatcaagaa gatcatgaag gccgacgagg 300 acgtccgcat gatctccgcc gaggccccca tcctcttcgc caaggcctgc gagctcttca 360 tcctcgagct caccatccgc tcctggctcc acgccgacga gaacaagcgc cgcaccctcc 420 agaagaacga catcgccgcc gccatcactc gcaccgacat tttcgacttc ctcgtcgaca 480 tcgtcccccg cgacgagatc aaggacgacg ccgcgctcgt cggggcaacg gccagtgggg 540 tgccttacta ctacccgccc attggccagc ctgccgggat gatgattggc cgccccgccg 600 tcgatcccgc caccggagtt tatgtccagc cgccctccca ggcctggcag tccgtctggc 660 agtccgccgc cgaggacacg ccctacggca ccggtgccca ggggaacctt gatggccaga 720 gctgagcgac aaccatgccg aaacggactg tcaggagtta tgaagattct gaacttgctt 780 ggaattttga ttgcttgcaa tttg'gaaatg gttttgttaa ctaaattttt atgggatgac 840 actatgaacc tgttaactcg atgaacagca tgatttaact acttctgtac aaaaatttaa 900 aactaaacaa tgatccttct gtgtgaactt gtttgatcat ctgctaatac tatttatttc 960 ctcgtaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1020 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 1054
<210> 110 <211> 222 <212> PRT <213> Glycine max <400> 110 Met Glu Asn Asn Gln Gln Gln Gly Ala Gln Ala Gln Ser Gly Pro Tyr 1 5 10 15 Pro Gly Gly Ala Gly Gly Ser Ala Gly Ala Gly Ala Gly Ala Gly Ala 20 25 30 Ala Pro Phe Gln His Leu Leu Gln Gln Gln Gln Gln Gln Leu Gln Met 35 40 45 Phe Trp Ser Tyr Gln Arg Gln Glu lie Glu His Val Asn Asp Phe Lys 50 55 60 Asn His Gln Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp 65 70 75 80 Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro lie Leu Phe Ala Lys 85 90 95 Ala Cys Glu Leu Phe lie Leu Glu Leu Thr lie Arg Ser Trp Leu His 100 105 110
76 Ala Asp Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp lie Ala Ala 115 120 125 Ala lie Thr Arg Thr Asp lie Phe Asp Phe Leu Val Asp lie Val Pro 130 135 140 Arg Asp Glu lie Lys Asp Asp Ala Ala Leu Val Gly Ala Thr Ala Ser 145 lso 155 160
Gly Val Pro Tyr Tyr Tyr Pro Pro lie Gly Gln Pro Ala Gly Met Met 165 170 175 lie Gly Arg Pro Ala Val Asp Pro Ala Thr Gly Val Tyr Val Gln Pro 180 185 190 Pro Ser Gln Ala Trp Gln Ser Val Trp Gln Ser Ala Ala Glu Asp Thr 195 200 205 Pro Tyr Gly Thr Gly Ala Gln Gly Asn Leu Asp Gly Gln Ser 210 215 220 <210> 111 <211> 1036 <212> ADN <213> Glycine max <400> 111 gcacgagccc acacacactc tttctctctc tctctttccc tgatcatcaa aatcagaaaa 60 aattggggga atggagacca acaaccagca acaacaacaa caaggagctc aagcccaatc 120 gggaccctac cccgtcgccg gcgccggcgg cagtgcaggt gcaggtgcag gcgctcctcc 180 ccctttccag caccttctcc agcagcagca gcagcagctc cagatgttct ggtcttacca 240 gcgtcaagaa atcgagcacg tgaacgactt taagaatcac cagctccctc ttgcccgcat 300 caagaagatc atgaaggccg acgaggatgt ccgcatgatc tccgccgagg cccccatcct 360 cttcgccaag gcctgcgagc tcttcatcct cgagctcacc atccgctcct ggctccacgc 420 cgaggagaac aagcgccgca ccctccagaa gaacgacatc gccgccgcca tcacccgcac 480 cgacattttc gacttcctcg ttgatattgt cccccgcgac gagatcaagg acgacgctgc 540 tcttgtgggg gccaccgcca gtggggtgcc ttactactac ccgcccattg gacagcctgc 600 cgggatgatg attggccgcc ccgccgtcga tcccgccacc ggggtttatg tccagccgcc 660 ctcccaggca tggcagtccg tctggcagtc cgctgccgag gacgcttcct atggcaccgg 720 cggggccggt gcccagcgga gccttgatgg ccagagttga gtgacatcga tgccgatgat 780 ggacagtcag gagttatgaa gattctgaac ttgctgcaat ttagaaatgg ttttgtttac 840 taaattttta tgggatgaca ctgtgaacct gttaactcga tgaacagcat gatttaacta 900 cttttgtaca aaaatttaaa actaaacact gatccttctg tgtgaaacat gtatgatcat 960 ctgccaatac tgtttatttc ctcataagtc atgataccac tcgtatactt tgctaaaaaa 1020 aaaaaaaaaa aaaaaa 1036
<210> 112 <211> 229 <212> PRT <213> Glycine max <400> 112 Met Glu Thr Asn Asn Glu Gln Gln Gln Gln Gln Gly Ala Gln Ala Gln
1 ' 5 10 15 Ser Gly Pro Tyr Pro Val Ala Gly Ala Gly Gly Ser Ala Gly Ala Gly 20 25 30
77 Ala Gly Ala Pro Pro Pro Phe Gln His Leu Leu Gln Gln Gln Gln Gln 35 40 45 Gln Leu Gln Met Phe Trp Ser Tyr Gln Arg Gln Glu lie Glu His Val 50 55 60 Asn Asp Phe Lys Asn His Gln Leu Pro Leu Ala Arg lie Lys Lys lie 65 70 75 80
Met Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro lie 85 90 95
Leu Phe Ala Lys Ala Cys Glu Leu Phe lie Leu Glu Leu Thr lie Arg 100 105 110 Ser Trp Leu His Ala Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn 115 120 125 Asp lie Ala Ala Ala lie Thr Arg Thr Asp lie Phe Asp Phe Leu Val 130 135 140 Asp lie Val Pro Arg Asp Glu lie Lys Asp Asp Ala Ala Leu Val Gly 145 150 155 160
Ala Thr Ala Ser Gly Val Pro Tyr Tyr Tyr Pro Pro lie Gly Gln Pro 165 170 175
Ala Gly Met Met lie Gly Arg Pro Ala Val Asp Pro Ala Thr Gly Val 180 185 190 Tyr Val Gln Pro Pro Ser Gln Ala Trp Gln Ser Val Trp Gln Ser Ala 195 200 205 Ala Glu Asp Ala Ser Tyr Gly Thr Gly Gly Ala Gly Ala Gln Arg Ser 210 215 220 Leu Asp Gly Gln Ser 225 <210> 113 <211> 514 <212> ADN <213> Glycine max <220> <221> inseguro '<222> (424) <223> n = A, C, G <220> <221> inseguro <222> (430) <223> n = A, C, G <220> <221> inseguro <222> (464) <223> n = A, C, G
78 <220> <221> inseguro <222> (506) <223> n = A, C, G, o T <400> 113 tagggttttc tcctccccca ttgacccacc gtccatcgca aaggaagtcg cgcccaattt 60 ccatggtttg tagattaaat cttaaagcag taagtcatca tggataaatc agagcagact 120 cagcagcaac atcagcatgg gatgggcgtt gccacaggtg ctagccaaat ggcctattct 180 tctcactacc cgactgctcc catggtggct tctggcacgc ctgctgtagc tgttccttcc 240 ccaactcagg ctccagctgc cttctctagt tctgctcacc agcttgcata ccagcaagca 300 cagcatttcc accaccaaca gcagcaacac caacaacagc agcttcaaat gttctggtca 360 aaccaaatgc aagaaattga gcaaacaatt gactttaaaa accacagtct tcctcttgct 420 cggntaaaan agataatgaa agctgatgaa gatgtccgga tganttctgc aagaagctcc 480 aagtcaatat ttgcaaaagc atgtgnaatg gtca 514
<210> 114 <211> 126 <212> PRT <213> Glycine max <220> <221> INSEGURO <222> (109) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (111) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (122) <223> Xaa = cualquier aminoácido <400> 114 Met Asp Lys Ser Glu Gln Thr Gln Gln Gln His Gln His Gly Met Gly 1 5 10 15 Val Ala Thr Gly Ala Ser Gln Met Ala Tyr Ser Ser His Tyr Pro Thr 20 25 30 Ala Pro Met Val Ala Ser Gly Thr Pro Ala Val Ala Val Pro Ser Pro 35 40 45 Thr Gln Ala Pro Ala Ala Phe Ser Ser Ser Ala His Gln Leu Ala Tvr 50 55 60 Gln Gln Ala Gln His Phe His His Gln Gln Gln Gln His Gln Gln Gln 65 70 75 80
Gln Leu Gln Met Phe Trp Ser Asn Gln Met Gln Glu lie Glu Gln Thr 85 90 95 lie Asp Phe Lys Asn His Ser Leu Pro Leu Ala Arg Xaa Lys Xaa lie 100 105 110
79 Met Lys Ala Asp Glu Asp Val Arg Met Xaa Ser Ala Arg Ser 115 120 125 <210> 115 <211> 1363 <212> ADN <213> Glycine max <400> 115 ttcggcacga gttgaaacca aaccaaacca aaccaaacca aacctctctt tctcagtttc 60 tctctcttag ggttttctcc tcccccattg acccaccgtc catcgcaaag gaagtcgcgc 120 ccaatttcca tggaactgta aagagattat agtttgtaga ttaaatctta aagcagtaag 180 tcatcatgga taaatcagag cagactcagc agcaacatca gcatgggatg ggcgttgcca 240 caggtgctag ccaaatggcc tattcttctc actacccgac tgctcccatg gtggcttctg 300 gcacgcctgc tgtagctgtt ccttccccaa ctcaggctcc agctgccttc tctagttctg 360 ctcaccagct tgcataccag caagcacagc atttccacca ccaacagcag caacaccaac 420 aacagcagct tcaaatgttc tggtcaaacc aaatgcaaga aattgagcaa acaattgact 480 ttaaaaacca cagtcttcct cttgctcgga taaaaaagat aatgaaagct gatgaagatg 540 tccggatgat ttctgcagaa gctccagtca tatttgcaaa agcatgtgaa atgttcatat 600 tagagttgac gttgagatct tggatccaca cagaagagaa caagaggaga actctacaaa 660 agaatgatat agcagctgct atttcgagaa acgatgtttt tgatttcttg gttgatatta 720 tcccaagaga tgagttgaaa gaggaaggac ttggaataac caaggctact attccattgg 780 tgaattctcc agctgatatg ccatattact atgtccctcc acagcatcct gttgtaggac 840 ctcctgggat gatcatgggc aagcccgttg gtgctgagca agcaacgctg tattctacac 900 agcagcctcg acctcccatg gcgttcatgc catggcccca tacacaaccc cagcaacagc 960 agccacccca acatcaacaa acagactcat gatgaccatg caattcaatt aggtcggaaa 1020 gtagcatgca ccttatgatt attacaaatt tacttaatgc ctttaagtca gctgtagttt 1080 agtgttttgc attgaaaaat gccaaagatt gtttgaggtt tcttgcactc atttatgatt 1140 gtatgagctc ttatgctgag ttacttttgg ttgtgtttat ttgaggtact ggtgtggtag 1200 ttaaattagt ttgtagctgt ccataagtaa acagcgtagc tgcttaatta ggaggtctga 1260 aatgatgaaa tagtttgtat tgttattgca gaaggtaggt tttattcagt atttcattct 1320 attgcaatgg ctgaatttaa tgctcaaaaa aaaaaaaaaa aaa 1363
<210> 116 <211> 268 <212> PRT <213> Glycine max <400> 116 Met Asp Lys Ser Glu Gln T r Gln Gln Gln Hls Gln His Gly Met Gly 1 5 10 15 Val Ala Thr Gly Ala Ser Gln Met Ala Tyr Ser Ser His Tyr Pro Thr 20 25 30 Ala Pro Met Val Ala Ser Gly Thr Pro Ala Val Ala Val Pro Ser Pro 35 40 45 Thr Gln Ala Pro Ala Ala Phe Ser Ser Ser Ala His Gln Leu Ala Tyr 50 55 60 Gln Gln Ala Gln His Phe His His Gln Gln Gln Gln His Gln Gln Gln 65 70 75 80 Gln Leu Gln Met Phe Trp Ser Asn Gln Met Gln Glu lie Glu Gln Thr 85 90 95
80 lie Asp Phe Lys Asn His Ser Leu Pro Leu Ala Arg lie Lys Lys lie 100 105 110 Met Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val 115 120 125 lie Phe Ala Lys Ala Cys Glu Met Phe lie Leu Glu Leu Thr Leu Arq 130 135 140 Ser Trp lie His Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn 145 150 155 160
Asp lie Ala Ala Ala lie Ser Arg Asn Asp Val Phe Asp Phe Leu Val 165 170 175 Asp lie lie Pro Arg Asp Glu Leu Lys Glu Glu Gly Leu Gly lie Thr 180 185 190 Lys Ala Thr lie Pro Leu Val Asn Ser Pro Ala Asp Met Pro Tyr Tyr 195 200 205 Tyr Val Pro Pro Gln His Pro Val Val Gly Pro Pro Gly Met lie Met 210 215 220 Gly Lys Pro Val Gly Ala Glu Gln Ala Thr Leu Tyr Ser Thr Gln Gln 225 230 235 240
Pro Arg pro Pro Met Ala Phe Met Pro Trp Pro His Thr Gln Pro Gln 245 250 255 Gln Gln Gln Pro Pro Gln His Gln Gln Thr Asp Ser 260 265 <210> 117 <211> 1505 <212> AND <213> Glycine max <400> 117 gcacgagctc caccgtccat tgcaaagtct tgcgcccaat ttccatggaa ctgtaaagag 60 aggatagtta gaagattaaa tcttaaagca gtaagtcatc atggataaat cagagcagac 120 tcaacagcag cagcagcaac aacagcatgt gatgggagtt gccgcagggg ctagccaaat 180 ggcctattct tctcactacc cgactgcttc catggtggct tctggcacgc ccgctgtaac 240 tgctccttcc ccaactcagg ctccagctgc cttctctagt tctgctcacc agcttgcata 300 ccagcaagca cagcatttcc accaccaaca gcagcaacac caacaacagc agcttcaaat 360 gttctggtca aaccaaatgc aagaaattga gcaaacaatt gactttaaaa accatagcct 420 tcctcttgct cggataaaaa agataatgaa agctgatgaa gatgtccgga tgatttcagc 480 agaagctccg gtcatatttg caaaagcttg tgaaatgttc atattagagt tgacgttgcg 540 atcttggatc cacacagaag agaacaagag gagaactcta caaaagaatg atatagcagc 600 tgctatttcg agaaacgatg tttttgattt cttggttgat attattccaa gagatgagtt 660 gaaagaggaa ggacttggaa taaccaaggc tactattccg ttagtgggtt ctccagctga 720 tatgccatat tactatgtcc ctccacagca tcctgttgta ggaccacctg ggatgatcat 780 gggcaagccc attggcgctg agcaagcaac actatattct acacagcagc ctcgacctcc 840 tgtggcgttc atgccatggc ctcatacaca acccctgcaa cagcagccac cccaacatca 900 acaaacagac tcatgatgac tatgcaattc aattaggttg gaaagtagcc tgcacctttt 960 gattattaca aatttactta atgcctttca gccagctgta gtttagtgtt gtgcattgaa 1020 aaaaagcaaa agattgtttt gaggtttctt gcactcattt atgattgtat gagctcttgt 1080 gatgagttac ttttggttgt gtttactatt ggtgtagtgg ttaaattatt tggcagctgt 1140 ccataaccag agagcgtagc tgcttaatta ggaggtttga tatgatgaaa tagtttgtat 1200
81 tgttattgca gaaggtaggt ttaattcagt attccattct actgcaatgg ctgaatttat 1260 tgctcatctg catagtacta gttgatgttt tttcctgtga ctcgttatgt gttagagtgc 1320 gaagaagaat gagtgtgcca tatttattct tcccctgttc ttgcgccaca ctctcggaaa 1380 aacaaatgtt tccgatcatt tcaattattt ccaggaacat caatatagtg gttgatgttt 1440 aatgctgtca ctgcaaaaaa aaatatgttt tttacagttg gaaaaaaaaa aaaaaaaaaa 1500 aaaaa 1505
<210> 118 <211> 271 <212> PRT <213> Glycine max <400> 118 Met Asp Lys Ser Glu Gln Thr Gln Gln Gln Gln Gln Gln Gln Gln His 1 5 10 15 Val Met Gly Val Ala Ala Gly Ala Ser Gln Met Ala Tyr Ser Ser His 20 25 30 Tyr Pro Thr Ala Ser Met Val Ala Ser Gly Thr Pro Ala Val Thr Ala 35 40 45 Pro Ser Pro Thr Gln Ala Pro Ala Ala Phe Ser Ser Ser Ala His Gln 50 55 60 Leu Ala Tyr Gln Gln Ala Gln His Phe His His Gln Gln Gln Gln His 65 70 , 75 80 Gln Gln Gln Gln Leu Gln Met Phe Trp Ser Asn Gln Met Gln Glu lie 85 90 95 Glu Gln Thr lie Asp Phe Lys Asn His Ser Leu Pro Leu Ala Arg lie 100 105 110 Lys Lys lie Met Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu 115 120 125 Ala Pro Val lie Phe Ala Lys Ala Cys Glu Met Phe lie Leu Glu Leu 130 135 140 Thr Leu Arg Ser Trp lie His Thr Glu Glu Asn Lys- Arg Arg Thr Leu 145 150 155 160
Gln Lys Asn Asp lie Ala Ala Ala lie Ser Arg Asn Asp Val Phe Asp 165 170 175 Phe Leu Val Asp lie lie Pro Arg Asp Glu Leu Lys Glu Glu Gly Leu 180 185 190 Gly lie Thr Lys Ala Thr lie Pro Leu Val Gly Ser Pro Ala Asp Met 195 200 205 Pro Tyr Tyr Tyr Val Pro Pro Gln His Pro Val Val Gly Pro Pro Gly 210 215 220 Met lie Met Gly Lys Pro lie Gly Ala Glu Gln Ala Thr Leu Tyr Ser 225 230 235 240
82 Thr Gln Gln Pro Arg Pro Pro Val Ala Phe Met Pro Trp Pro His Thr 245 250 255 Gln Pro Leu Gln Gln Gln Pro Pro Gln His Gln Gln Thr Asp Ser 260 265 270 <210> 119 <211> 730 <212> ADN <213> Glyci <400> 119 gcacgagtga ctttaaaaac catagccttc ctcttgctcg gataaaaaag ataatgaaag 60 ctgatgaaga tgtccggatg atttcagcag aagctccggt catatttgca aaagcttgtg 120 aaatgttcat attagagttg acgttgcgat cttggatcca cacagaagag aacaagagga 180 gaactctaca aaagaatgat atagcagctg ctatttcgag aaacgatgtt tttgatttct 240 tggttgatat tattccaaga gatgagttga aagaggaagg acttggaata accaaggcta 300 ctattccgtt agtgggttct ccagctgata tgccatatta ctatgtccct ccacagcatc 360 ctgttgtagg accacctggg atgatcatgg gcaagcccat tggcgctgag caagcaacac 420 tatattctac acagcagcct cgacctcctg tggcgttcat gccatggcct catacacaac 480 ccctgcaaca gcagccaccc caacatcaac aaacagactc atgatgacta tgcaattcaa 540 ttaggttgga aagtagcctg caccttttga ttattacaaa tttacttaat gcctttcagc 600 cagctgtagt ttagtgttgt gcattgaaaa aaagcaaaag attgttttga ggtttcttgc 660 actcatttat gattgtatga gctcttgtga tgagttactt ttggttgtgt ttaaaaaaaa 720 aaaaaaaaaa 730
<210> 120 <211> 171 <212> PRT <213> Glycine max <400> 120 Asp Phe Lys Asn His Ser Leu Pro Leu Ala Arg lie Lys Lys lie Met 1 5 10 15 Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val lie 20 25 30 Phe Ala Lys Ala Cys Glu Met Phe lie Leu Glu Leu Thr Leu Arg Ser 35 40 45 Trp lie His Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp 50 ' 55 60 lie Ala Ala Ala lie Ser Arg Asn Asp Val Phe Asp Phe Leu Val Asp 65 70 75 80 lie lie Pro Arg Asp Glu Leu Lys Glu Glu Gly Leu Gly lie Thr Lys 85 90 95 Ala Thr lie Pro Leu Val Gly Ser Pro Ala Asp Met Pro Tyr Tyr Tyr 100 105 110 Val Pro Pro Gln His Pro Val Val Gly Pro Pro Gly Met lie Met Gly 115 120 125 Lys Pro lie Gly Ala Glu Gln Ala Thr Leu Tyr Ser Thr Gln Gln Pro 130 135 140
83 Arg Pro Pro Val Ala Phe Met Pro Trp Pro His Thr Gln Pro Leu Gln 145 150 155 160
Gln Gln Pro Pro Gln His Gln Gln Thr Asp Ser 165 170 <210> 121 <211> 1139 <212> ADN <213> Glycine max <400> 121 gcacgagaca cagcttttgt tctcgcactt cgctgtctga ggttctggat tctcagtgtt 60 tgcgaagcgc tgcatcatcc tttggggaag aatggatcat caagggcata gccagaaccc 120 atctatgggg gtggttggta gtggagctca attagcatat ggttctaacc catatcagcc 180 aggccaaata actgggccac cggggtctgt tgtgacatca gttggtacca ttcaatccac 240 acctgctgga gctcagctag gacagcatca acttgcttat cagcatattc atcagcaaca 300 acaacaccag cttcagcaac agctccaaca attttggtca aaccagtacc aagaaattga 360 gaaggttact gatttcaaga accacagtct tcccctggca aggatcaaga agattatgaa 420 ggctgacgag gatgttagga tgatatcagc cgaagcacca gtcatctttg caagggcatg 480 tgaaatgttc atattagagt taaccctgcg ttcttggaat cacactgaag agaacaaaag 540 gcgaacactt caaaaaaatg atattgctgc tgcaatcaca aggactgaca tctttgattt 600 cttggttgac attgtgcctc gtgaggactt gaaagatgaa gtgcttgcat caatcccaag 660 aggaacaatg cctgttgcag ggcctgctga tgcccttcca tattgctaca tgccgcctca 720 gcatgcgtcc caagttggag ctgctggtgt tataatgggt aagcctgtga tggacccaaa 780 catgtatgct cagcagtctc acccctacat ggcaccacaa atgtggccac agccaccaga 840 ccaacgacag tcgtccccag aacattagct gatgtgtcgt ggaaattaag ataaccaggc 900 accggaatca gttgtgaatg tcaaactgaa tggttgggaa gatccatact acattgcgag 960 cagaagctgt agctgatagt ttacatgcaa tgcagactat aaacatatgt agataatgtg 1020 ctagggaaaa cttaacctta tctttgattt agctggataa aatggtattt ttcatgttta 1080 aatttacagg tcatcagatg ataatattta tttactggtg caaaaaaaaa aaaaaaaaa 1139
<210> 122 <211> 258 <212> PRT <213> Glycine max <400> 122 Met Asp His Gln Gly His Ser Gln Asn Pro Ser Met Gly Val Val Gly 1 5 10 15 Ser Gly Ala Gln Leu Ala Tyr Gly Ser Asn Pro Tyr Gln Pro Gly Gln 20 25 30 lie Thr Gly Pro Pro Gly Ser Val Val Thr Ser Val Gly Thr lie Gln 35 40 45 Ser Thr Pro Ala Gly Ala Gln Leu Gly Gln His Gln Leu Ala Tyr Gln 50 55 60 His lie His Gln Gln Gln Gln His Gln Leu Gln Gln Gln Leu Gln Gln 65 70 75 80 Phe Trp Ser Asn Gln Tyr Gln Glu lie Glu Lys Val Thr Asp Phe Lys 85 90 95
84 Asn His Ser Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp 100 105 110 Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val lie Phe Ala Arg 115 120 125 Ala Cys Glu Met Phe lie Leu Glu Leu Thr Leu Arg Ser Trp Asn His 130 135 140 Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn Asp lie Ala Ala 145 150 155 160
Ala lie Thr Arg Thr Asp lie Phe Asp Phe Leu Val Asp lie Val Pro 165 170 175 Arg Glu Asp Leu Lys Asp Glu Val Leu Ala Ser lie Pro Arg Gly Thr 180 ¦ 185 190 Met Pro Val Ala Gly Pro Ala Asp Ala Leu Pro Tyr Cys Tyr Met Pro 195 200 205 Pro Gln His Ala Ser Gln Val Gly Ala Ala Gly Val lie Met Gly Lys 210 215 220 Pro Val Met Asp Pro Asn Met Tyr Ala Gln Gln Ser His Pro Tyr Met 225 230 235 240
Ala Pro Gln Met Trp Pro Gln Pro Pro Gln Arg Gln Ser Ser Pro 245 255 Glu His
<210> 123 <211> 1493 <212> ADN <213> Triticum aestivum <400> 123 ggcaccagct ctggcttcca agtctataca taatataggg accgagcttg cggttttgcc 60 aagggtgatg gggaccgagc aagggaagga aggaacggga gcgggggagg ggcgcgtgga 120 ggtgcgcacg gggccgaggc cagcgctgcc ggcgccgcag cagcgggcgg tggacgggtt 180 ctggagggag cggcaggagg agatggaggc gacggcggac ttcaacgacc gcatactgcc 240 catggcccgc ctcaagaggc tcatccgcgc cgaggaggac ggcatgatga tcgccgccga 300 cacgccggcg tacctggcca agctctgcga gctcttcgtg caggagctcg ccgtgcgcgc 360 ctgggcgtgc gcccaatccc accaccgccg catcatactg gaatcggaca tcgccgaggc 420 catcgccttc acccagtcgt acgacttcct cgccaccgtg ctcctcgagc accaacggga 480 ggcgcggctg gccggccgtg ctgctatccc gacaacggtt ccggtgacgg cggcgagggc 540 aaggctcatc accaggaagc gccacatgcc ggacccgaat cctccacggc cggtgcatgg 600 ggtgcggaga attcgtcctc gtgcgcttcc tatcccgccg ccgtcggact ttcgctacgt 660 gccggttcca tttccgttca cctcggcgcc gataggagcc gcagcgatgg cggaggggct 720 gatgattctc ccacccatca accacgcgac taccgagcgc gtgttcttcc tggacaggaa 780 cagcggcact gacttcgcag gtgaaaactc tgctgctgaa actatagcat ctccgcctcc 840 tccggcaggg cctgcaggag cagtggcgct gcccactgtc catcctgctg cttactactt 900 gtgcgcttac ccggtgacca acgacgttga ggcctttgcc gttggcaaca ctgatcctga 960 tgtcatccca ccggagattg tagtgggaga cgtcgccatc ccaccggaga ttatagaggg 1020 aaacgtcgcc gatggcaacg gcgacggcgg acagcagcag cagcagagcg aaaaccttgg 1080 tggtaatggt gagagtgtgg tggtgtcgca aagcaatggt gtgcaggaag atggtgcaga 1140 tgggatgttt ctgaaggaga tcctcatgga tgaagacctg atgtttcccg acgctgagct 1200
85 ttttccgttg gtgggcgctg cacctggtcc agaggatttc atcgtcgacc aagatgttct 1260 cgacgacgtc ttcgccaacc cgagcagcag cgcaagcagc gactgaaccg aaagaagatc 1320 agagcgggac gcagcatcgg ttgattcatc tatcgtctct cgacctgcta ctctatgcta 1380 gccgctatat cggttaataa atttgggaat aagtttgtgt tcgtgcgtgt gacatggact 1440 gtatggttcg ccctgaattt atcgtattgc aatatatagc cgtgattgtg tgt 1493
<210> 124 <211> 434 <212> PRT <213> Triticum aestivum <400> 124 Ala Pro Ala Leu Ala Ser Lys Ser lie His Asn lie Gly Thr Glu Leu 1 5 10 15 Ala Val Leu Pro Arg Val Met Gly Thr Glu Gln Gly Lys Glu Gly Thr 20 25 30 Gly Ala Gly Glu Gly Arg Val Glu Val Arg Thr' Gly Pro Arg Pro Ala 35 40 45 Leu Pro Ala Pro Gln Gln Arg Ala Val Asp Gly Phe Trp Arg Glu Arg 50 55 60 Gln Glu Glu Met Glu Ala Thr Ala Asp Phe Asn Asp Arg lie Leu Pro 65 70 75 80 Met Ala Arg Leu Lys Arg Leu lie Arg Ala Glu Glu Asp Gly Met Met 85 90 95 lie Ala Ala Asp Thr Pro Ala Tyr Leu Ala Lys Leu Cys Glu Leu Phe 100 105 110 Val Gln Glu Leu Ala Val Arg Ala Trp Ala Cys Ala Gln Ser His His 115 120 125 Arg Arg lie lie Leu Glu Ser Asp lie Ala Glu Ala lie Ala Phe Thr 130 135 140 Gln Ser Tyr Asp Phe Leu Ala Thr Val Leu Leu Glu His Gln Arg Glu 145 150 155 160
Ala Arg Leu Ala Gly Arg Ala Ala lie Pro Thr Thr Val Pro Val Thr 165 170 175 Ala Ala Arg Ala Arg Leu lie Thr Arg Lys Arg His Met Pro Asp Pro 180 185 190 Asn Pro Pro Arg Pro Val His Gly Val Arg Arg lie Arg Pro Arg Ala 195 200 205 Leu Pro lie Pro Pro Pro Ser Asp Phe Arg Tyr Val Pro Val Pro Phe
210 215 220 Pro Phe Thr Ser Ala Prü lie Gly Ala Ala Ala Met Ala Glu Gly Leu 225 230 , 235 240
Met lie Leu Pro Pro lie Asn His Ala Thr Thr Glu Arg Val Phe Phe 245 250 255
86 Leu Asp Arg Asn Ser Gly Thr Asp Phe Ala Gly Glu Asn Ser Ala Ala 260 265 270 Glu Thr lie Ala Ser Pro Pro P-ro Pro Ala Gly Pro Ala Gly Ala Val 275 280 285 Ala Leu Pro Thr Val His Pro Ala Ala Tyr Tyr Leu Cys Ala Tyr Pro 290 295 300 Val Thr Asn Asp Val Glu Ala Phe Ala Val Gly Asn Thr Asp Pro Asp 305 310 315 320
Val lie Pro Pro Glu lie Val Val Gly Asp Val Ala lie Pro Pro Glu 325 330 335 lie lie Glu Gly Asn Val Ala Asp Gly Asn Gly Asp Gly Gly Gln Gln 340 345 350 Gln Gln Gln Ser Glu Asn Leu Gly Gly Asn Gly Glu Ser Val Val Val 355 360 365 Ser Gln Ser Asn Gly Val Gln Glu Asp Gly Ala Asp Gly Met Phe Leu 370 375 380 Lys Glu lie Leu Met Asp Glu Asp Leu Met Phe Pro Asp Ala Glu Leu 385 390 395 400
Phe Pro Leu Val Gly Ala Ala Pro Gly Pro Glu Asp Phe lie Val Asp 405 410 415
Gln Asp Val Leu Asp Asp Val Phe Ala Asn Pro Ser Ser Ser Ala Ser 420 425 430 Ser Asp
<210> 125 <211> 660 <212> ADN <213> Triticum aestivum <220> <221> inseguro <222> (483) <223> n = A, C, G, o T <220> <221> inseguro <222> (614) <223> n = A, C, G, o T <220> <221> inseguro <222> (630) <223> n = A, C, G, o T <220> <221> inseguro
87 <222> (644) <223> n = A, C, G, o T <220> <221> inseguro <222> (647) <223> n = A, C, G, o T <400> 125 ggcaccgagc tagcttggca atggccgcga gggcgtgtcc tgctgcttct ggttaccgtg 60 tgtgctgaag catctgacgc gcttgcgccg agcagcagga gctagccgtt catgctcttc 120 ttccctcccc ttggcatctg aagcagtaag agctcaagtt cacagagggc gttcgtccga 180 tctacaaagc ccagctgtac atcgccttag ctagcttgca gatcgcaagc tagatagtaa 240 tggagaacca ccagctgccc tacaccaccc agccgccggc aacgggcgcg gccggaggag 300 ccccggtgcc tggcgtgcct gggccaccgc cggtgccaca ccaccacctg ctccagcagc 360 agcaggccca gctgcaggcg ttctgggcgt accagcggca ggaggcggag cgcgcatcgg 420 cgtccgactt caagaaccac cagctgccgc tggctcggat caagaagatc atgaaggccg 480 acnaagacgt gcgcatgatc tccgcggagg cgcccgtgct cttcgccaag gcctgcgagc 540 tctttattct cgaagctcac cattccgctt cctggctgca cgcccgagga agaacaagcc 600 gccgcacaac ttgnagcgca aacgacgttn cccgcttgcc aatnggngcc gccacccgac 660
<210> 126 <211> 147 <212> P T <213> Triticum aestivum <220> <221> INSEGURO <222> (82) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (125) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (131) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (135) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (142) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (145) <223> Xaa = cualquier aminoácido <400> 126 Met Glu Asn His Gln Leu Pro Tyr Thr Thr Gln Pro Pro Ala Thr Gly 1 5 10 15
88 Ala Ala Gly Gly Ala Pro Val Pro Gly Val Pro Gly Pro Pro Pro Val 20 25 30 Pro His His His Leu Leu Gln Gln Gln Gln Ala Gln Leu Gln Ala Phe 35 40 45 Trp Ala Tyr Gln Arg Gln Glu Ala Glu Arg Ala Ser Ala Ser Asp Phe 50 55 60 Lys Asn His Gln Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala 65 75 80 Asp Xaa Asp Val Arg Met lie Ser Ala Glu Ala Pro Val Leu Phe Ala 85 90 95 Lys Ala Cys Glu Leu Phe lie Leu Glu Ala His His Ser Ala Ser Trp 100 105 HO Leu His Ala Arg Gly Arg Thr Ser Arg Arg Thr Thr Xaa Ser Ala Asn 115 120 125 Asp Val Xaa Arg Leu Pro Xaa Gly Ala Ala Thr Arg Arg Xaa Phe Glu 130 135 140 Xaa Phe Leu 145 <210> 127 <211> 1874 <212> ADN ' <213> Triticum aestivum <400> 127 gcacgagccc acccacaacc ctagctcccc cgaacccatg gatcccacca aatccagcac 60 cccgccgccg ccccccgtcc tgggcgcgcc cgtcggctac ccgccggggg cgtaccctcc 120 tccgccgggc gcccccgcgg ccgcctaccc gccgcagctc tacgcgccgc cgggcgccgc 180 cgccgcccag caggccgcgg cgcagcagca gcagcagctg caggtgttct gggcggagca 240 gtaccgcgag atcgaggcca ccaccgactt caagaaccac aacctcccgc tggcccggat 300 caagaagatc atgaaggccg acgaggacgt ccgcatgatc gccgccgagg cccccgtcgt 360 cttcgcccgc gcctgcgaga tgttcatcct cgagctcacc caccgcggct gggcgcacgc 420 cgaggagaac aagcgccgca cgctccagaa gtccgacatt gcggccgcca tcgcccgcac 480 cgaggtcttc gacttcctcg tggacatcgt gccccgggac gacgccaagg acgccgaggc 540 ggccgccgcc gcggccatgg ccacggcggc ggccgggatc ccgcgcccgg ccgccggcgt 600 gcctgccacc gacccgagta tggcatacta ctatgtcccc cagcagtaat gtatcatcga 660 tctaaacttg cgcatttcta atcggagaat gtgttgttgt tctgtgactg tccttggtgc 720 tgttgttgct gcggcgtaat aagatttatg ggcctcccct gagcttatga attgagctgt 780 tcggttctag tattacagta ggattgttgt aatgggggag gccgtatgat tgcttccgta 840 gtgcatgact aactggccac ccagtgtaat ctgataacta ttatctggcg cctcccatgg 900 ttactatgta tttatgttct tcacacagtc ctctttgtct ctaccacttc gaggagttct 960 tcggaaggat gggctccaag atgcttctgg tcaccgctct cttggtgggc atagcctctc 1020 agagctatgc caccaggagc cttgacggaa accacttggc tgatcagaag tacggcggcg 1080 gcggctacgg aggtggcggt gggggctccg gaggtggtgg tggctacgga ggaggtggca 1140 gcggcggcgg gggtggctat ggaggaggcg gcggcggtgg ctacggagga ggaggcggcg 1200 gttacacacc gatgccaaca ccgtcgaccc ccagccacag cggatcctgc gactactgga 1260 agggccaccc ggagaagatc atcgactgca tcggcagcct gggcagcatc ctgggctccc 1320 tcggagaggt gtgccactcc ttcttcggca gcaagatcca taccctgcag gacgcgctgt 1380 gcaacacccg gaccgactgc tacggcgacc tgctgcgcga gggcgccgcc gcctacatca 1440 acgccatcgc cgccaagaag gagaagttcg cctacaccgc ctaccaggtc aaggagtgcg 1500
89 tcgccgtcgg gctcacctcc gagttcgccg ccgccgcgca ggccgccatg ttgaagaagg 1560 ccaactacgc ctgccactac taggaggcta ggctaccggc cggccgcccc agctggtggt 1620 cgtcggtggc taaataagtc catatatgca tgcacgtgtc gtgcatgttt tcatgcagtt 1680 tcccggatgc gcgcgcgcgt gtcctccgct atgcctttat gtgtttgctt gccgtctgat 1740 gatgcatgcc atgccgtctc atatatacgt agtgatgctt aatgctttgc ttgcttttct 1800 tatcttcgtt ggtgatgtaa gaataatttg attgaggagt tattagtgaa agacatagta 1860 tgcaaaaaaa aaaa 1874
<210> 128 <211> 203 <212> PRT <213> Triticum aestivum <400> 128 et Asp Pro Thr Lys Ser Ser Thr Pro Pro Pro Pro Pro Val Leu Gly 1 5 10 15 Ala Pro Val Gly Tyr Pro Pro Gly Ala Tyr Pro Pro Pro Ero Gly Ala 20 25 30 Pro Ala Ala Ala Tyr Pro Pro Gln Leu Tyr Ala Pro Pro Gly Ala Ala 35 40 45 Ala Ala Gln Gln Ala Ala Ala Gln Gln Gln Gln Gln Leu Gln Val Phe 50 55 60 Trp Ala Glu Gln Tyr Arg Glu lie Glu Ala Thr Thr Asp Phe Lys Asn 65 70 75 80 His Asn Leu Pro Leu Ala Arg lie Lys Lys lie Met Lys Ala Asp Glu 85 90 95 Asp Val Arg Met lie Ala Ala Glu Ala Pro Val Val Phe Ala Arg Ala 100 105 110 Cys Glu Met Phe lie Leu Glu Leu Thr His Arg Gly Trp Ala His Ala 115 120 125 Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Ser Asp lie Ala Ala Ala 130 135 140 lie Ala Arg Thr Glu Val Phe Asp Phe Leu Val Asp lie Val Pro Arg 145 150 155 160
Asp Asp Ala Lys Asp Ala Glu Ala Ala Ala Ala Ala Ala Met Ala Thr 165 170 175 Ala Ala Ala Gly lie Pro Arg Pro Ala Ala Gly Val Pro Ala Thr Asp 180 185 190 Pro Ser Met Ala Tyr Tyr Tyr Val Pro Gln Gln 195 200 <210> 129 <211> 629 <212> ADN <213> Amaranthus retroflexus
90 <220> <221> inseguro <222> (566) .. (567) .. (568) <223> n = A, C, G, o T <220> <221> inseguro <222> (606) .. (607) .. (608) <223> n = A, C, G, o T <220> <221> inseguro <222> (626) .. (627) .. (628) .. (629) <223> n = Ar C, G, o T <400> 129 gcacgaggat ggatcatcat catcgtggag ggttccatgg ttaccgcaaa caacatcccc 60 tttctaagtc ctcctcttct gaaatgagat tgacatcgga ggtgttaccg gctgagatga 120 atcacatacg cccaactagc aatggaaaag gagtatcaca tgacatgaac aaccatacca 180 ataaccatca tccctacaac aatagcaaca acaacaacaa tggtttcagc aacggaaata 240 gtaatcactc agcatcaacc gatcaagata acaatgagtg cactgtacgc gagcaagatc 300 gctttatgcc catcgccaat gtcattagga tcatgcgcaa gattcttcct cctcatgcca 350 aaatctccga tgatgctaag gaaactatcc aggagtgtgt atcagagtac atcagcttca 420 taacaggtga agccaacgag aggtgccaaa gggaacaacg taagaccata actgctgaag 480 atgttctttg ggcgatgagc aagttgggat tcgatgacta catcgaaccc ctcacactgt 540 acttgcatcg atacagggaa ctcgannngg aacgtggttc catccgcact tgtgagccac 600 tcctcnnnct cagtcgtgct gccatnnnn 629
<210> 130 <211> 198 <212> PRT -<213> Amaranthus retroflexus <220> <221> INSEGURO <222> (186) .. (187) <223> Xaa = cualquier aminoácido <400> 130 Met Asp His His His Arg Gly Gly Phe His Gly Tyr Arg Lys Gln His 1 5 10 15 Pro Leu Ser Lys Ser Ser Ser Ser Glu Met Arg Leu Thr Ser Glu Val 20 25 30 Leu Pro Ala Glu Met Asn His lie Arg Pro Thr Ser Asn Gly Lys Gly 35 40 45 Val Ser His Asp Met Asn Asn His Thr Asn Asn His His Pro Tyr Asn 50 55 60 Asn Ser Asn Asn Asn Asn Asn Gly Phe Ser Asn Gly Asn Ser Asn His 65 70 75 80
Ser Ala Ser Thr Asp Gln Asp Asn Asn Glu Cys Thr Val Arg Glu Gln 85 90 95 Asp Arg Phe Met Pro lie Ala Asn Val lie Arg lie Met Arg Lys lie 100 105 110
91 Leu Pro Pro His Ala lys lie Ser Asp Asp Ala Lys Glu Thr lie Gln 115 120 125 Glu Cys Val Ser Glu Tyr lie Ser Phe lie Thr Gly Glu Ala Asn Glu 130 135 140 Arg Cys Gln Arg Glu Gln Arg Lys Thr lie Thr Ala Glu Asp Val Leu 145 150 155 160
Trp Ala Met Ser Lys Leu Gly Phe Asp Asp Tyr lie Glu Pro Leu Thr 165 170 175 Leu Tyr Leu His Arg Tyr Arg Glu Leu Xaa Xaa Glu Arg Gly Ser lie 180 185 190 Arg Thr Cys Glu Pro Leu 195 <210> 131 <211> 625 <212> ADN <213> Momodica charantia <220> <221> inseguro <222> (597) .. (598) .. (599) <223> n = A, C, G, o T <220> <221> inseguro <222> (620) .. (621) .. (622) .. (623) <223> n = A, C, G, o T <400> 131 gcacgaggct agctagctag gtctctctac tcagttagag agagaaagaa aaagaaaaca 60 a9999aa9a9 agagagagag gcatggaata tggaggagga ggaggagatg ggttccatag 120 ctacagaagg cagcagccaa acacaaaacc aagctctgct ttgaacatgt tgctgaccac 180 aaacaagcca tccgccaaca accaccacca ccacttaaac ggccaaaacg ccaccaccac 240 caccaactcc tctgctgctg ccgccccgac cctggccccg gccgctgctg ccaacaacaa 300 cgagcagcag tgcgtcgtgc gggagcaaga ccaatacatg ccgatcgcca acgtgatacg 360 catcatgcgg cggatcttac cctcccatgc aaagatatcc gacgatgcca aggagaccat 420 ccaagagtgt gtgtcggagt acat.tagctt catcaccggc gaggccaacg agcggtgcca 480 gcgagagcag cgcaagacgg tgacggcgga ggacgtcctt tgggccatgg ggaagcttgg 540 cttcgacgac tacatcgagc cactcaccgt gttcctcaac cgctaccggg agtcagnnng 600 cgatcgaatc cgaacggagn nnntc 625
<210> 132 <211> 179 <212> PRT <213> Momodica charantia <220> <221> INSEGURO <222> (172) .. (173) <223> Xaa = cualquier aminoácido
92 <400> 132 Met Glu Tyr Gly Gly Gly Gly Gly Asp Gly Phe His Ser Tyr Arg Arg 1 5 . 10 15 Gln Gln Pro Asn Thr Lys Pro Ser Ser Ala Leu Asn Met Leu Leu Thr 20 25 30 Thr Asn Lys Pro Ser Ala Asn Asn His His His His Leu Asn Gly Gln 35 40 45 Asn Ala Thr Thr Thr Thr Asn Ser Ser Ala Ala Ala Ala Pro Thr Leu 50 55 60 Ala Pro Ala Ala Ala Ala Asn Asn Asn Glu Gln Gln Cys Val Val Arq 65 75 80 Glu Gln Asp Gln Tyr Met Pro lie Ala Asn Val lie Arg lie Met Arg 85 90 95 Arg lie Leu Pro Ser His Ala Lys lie Ser Asp Asp Ala Lys Glu Thr 100 105 HO lie Gln Glu Cys Val Ser Glu Tyr lie Ser Phe lie Thr Gly Glu Ala 115 120 125 Asn Glu Arg Cys Gln Arg Glu Gln Arg Lys Thr Val Thr Ala Glu Asp 130 135 140 Val Leu Trp Ala Met Gly Lys Leu Gly Phe Asp Asp Tyr lie Glu Pro 145 150 155 160
Leu Thr Val Phe Leu Asn Arg Tyr Arg Glu Ser Xaa Xaa Asp Arg lie 165 170 175 Arg Thr Glu
<210> 133 <211> 1173 <212> ADN <213> Zea mays <400> 133 ccacgcgtcc gccaccacac cacgagcgcg cgataaccct agctagcttc aggtagtagc 60 gagagccaat ggactccagc agcttcctcc ctgccgccgg cgcggagaat ggctcggcgg 120 cgggcggcgc caacaatggc ggcgctgctc agcagcatgc ggcgccggcg atccgcgagc 180 aggaccggct gatgccgatc gcgaacgtga tccgcatcat gcggcgcgtg ctgccggcgc 240 acgccaagat ctcggacgac gccaaggaga cgatccagga gtgcgtgtcg gagtacatca 300 gcttcatcac gggggaggcc aacgagcggt gccagcggga gcagcgcaag accatcaccg 360 ccgaggacgt gctgtgggcc atgagccgcc tcggcttcga cgactacgtc gagccgctcg 420 gcgcctacct ccaccgctac cgcgagttcg agggcgacgc gcgcggcgtc gggctcgtcc 480 cgggggccgc cccatcgcgc ggcggcgacc accacccgca ctccatgtcg ccagcggcga 540 tgctcaagtc ccgcgggcca gtctccggag ccgccatgct accgcaccac caccaccacc 600 acgacatgca gatgcacgcc gccatgtacg ggggaacggc cgtgcccccg ccggccgggc 660 ctcctcacca cggcgggttc ctcatgccac acccacaggg tagtagccac tacctgcctt 720 acgcgtacga gcccacgtac ggcggtgagc acgccatggc tgcatactat ggaggcgccg 780 cgtacgcgcc cggcaacggc gggagcggcg acggcagtgg cagtggcggc ggtggcggga 840 gcgcgtcgca cacaccgcag ggcagcggcg gcttggagca cccgcacccg ttcgcgtaca 900 agtagctagt tcgtacgtcg ttcgacttga gcaagccatc gatctgctga tctgaacgta 960
93 cgctgtattg tacacgcatg cacgtacgta tcggcggcta .gctctcctgt ttaagttgta 1020 ctgtgattct gtcccggccg gctagcaact tagtatcttc cttcagtctc tagtttctta 1080 gcagtcgtag aagtgttcaa tgcttgccag tgtgttgttt tagggccggg gtaaaccatc 1140 cgatgagatt atttcaaaaa aaaaaaaaaa aaa 1173
<210> 134 <211> 278 <212> PRT <213> Zea mays <400> 134 Met Asp Ser Ser Ser Phe Leu Pro Ala Ala Gly Ala Glu Asn Gly Ser 1 5 10 15 Ala Ala Gly Gly Ala Asn Asn Gly Gly Ala Ala Gln Gln His Ala Ala 20 25 30 Pro Ala lie Arg Glu Gln Asp Arg Leu Met Pro lie Ala Asn Val lie 35 40 · 45 Arg lie Met Arg Arg Val Leu Pro Ala His Ala Lys lie Ser Asp Asp 50 55 60 Ala Lys Glu Thr lie Gln Glu Cys Val Ser Glu Tyr lie Ser Phe lie 65 70 75 80 Thr Gly Glu Ala Asn Glu Arg Cys Gln Arg Glu Gln Arg Lys Thr lie 85 90 95 Thr Ala Glu Asp Val Leu Trp Ala Met Ser Arg Leu Gly Phe Asp Asp 100 105 110 Tyr Val Glu Pro Leu Gly Ala Tyr Leu His Arg Tyr Arg Glu Phe Glu 115 120 125 Gly Asp Ala Arg Gly Val Gly Leu Val Pro Gly Ala Ala Pro Ser Arg 130 135 140 Gly Gly Asp His His Pro His Ser Met Ser Pro Ala Ala Met Leu Lys 145 150 155 . 160
Ser Arg Gly Pro Val Ser Gly Ala Ala Met Leu Pro His His His His 165 170 175 His His Asp Met Gln Met His Ala Ala Met Tyr Gly Gly Thr Ala Val 180 185 190 Pro Pro Pro Ala Gly Pro Pro His His Gly Gly Phe Leu Met Pro His 195 200 205 Pro Gln Gly Ser Ser His Tyr Leu Pro Tyr Ala Tyr Glu Pro Thr Tyr 210 215 220 Gly Gly Glu His Ala Met Ala Ala Tyr Tyr Gly Gly Ala Ala Tyr Ala 225 , 230 235 240
Pro Gly Asn Gly Gly Ser Gly Asp Gly Ser Gly Ser Gly Gly Gly Gly 245 250 255
94 Gly Ser Ala Ser His Thr Pro Gln Gly Ser Gly Gly Leu Glu His Pro 260 265 270 His Pro Phe Ala Tyr Lys 275 <210> 135 <211> 1269 <212> ADN <213> Zea mays <400> 135 ccacgcgtcc gcatgaataa tccccaaaac cctaaagcca gtgctccttg caccttgcca 60 ccggagcttc ccaaagaagc agtggcgacc gacgaagcac cgccgccaat gggcaacaac 120 aacaacacgg aatcggcgac ggcgacgatg gtccgggagc aggaccggct gatgcccgtg 180 gccaacgtgt cccgcatcat gcgccaagtg ctgcctccgt acgccaagat ctccgacgac 240 gccaaggagg tgatccagga gtgcgtgtcg gagttcatca gcttcgtcac tggcgaggcg 300 aacgagcggt gccacaccga gcgccgcaag accgtcacct ccgaggacat cgtgtgggcc 360 atgagccgcc tcggcttcga cgactacgtc gcgcccctcg gcgccttcct ccagcgcatg 420 cgcgacgaca gcgaccacgg cggtgaagag cgcggcggcc ctgcagggcg tggtggctcg 480 cgccgcggct cgtcgtcctt gccgctccac tgcccgcagc agatgcacca cctgcaccca 540 gccgtctgcc ggcgtccgca ccagagcgtg tcgcctgctg caggatacgc cgtccggccc 600 gttccccgcc cgatgccagc cagtgggtac cgcatgcagg gcggagacca ccgcagcgtg 660 ggcggcgtgg ctccctgcag ctacggaggg gcgctcgtcc aggccggtgg aacccaacac 720 gttgttggat tccacgacga cgaggcaagc tcttcgagtg aaaatccgcc gccggagggg 780 cgtgccgctg gctcgaacta gcctagcttc tcagttcccc gtgtacaata agaggggcgg 840 tcgcggcgcc gcgccgcgcc cttgggttgg gccgggcgct atgctgcagt ttggtttgta 900 aactaacgag cctagggtag ctggtgcacg cgcgccacct cgccggacgt cgccgtcgtc 960 gtcggcatgg acttaaccgg cgggccctgt tgttatttct caagtttgta gccaacgcac 1020 tgttcggtgc gttccataat ttaatttacc atgttgctct cgaaatgaaa aaaaaaaaaa 1080 aaaaaagggc ggccgccctt tttttttttt tttttttttt tcctcttaag gcaaggcaac 1140 tcctgtttgt aggggaatcg ttatggttct gcttctgatt gctcctagtt cttccatcat 1200 tttcgtgttc aaagagaagg ctcccagaaa ataaaataac gattgctatg aaaaaaaaaa 1260 aaaaaaaag 1269
<210> 136 <211> 262 <212> PRT <213> Zea mays <400> 136 Met Asn Asn Pro Gln Asn Pro Lys Ala Ser Ala Pro Cys Thr Leu Pro 10 15 Pro Glu Leu Pro Lys Glu Ala Val Ala Thr Asp Glu Ala Pro Pro Pro 20 25 30 Met Gly Asn Asn Asn Asn Thr Glu Ser Ala Thr Ala Thr Met Val Arq 35 40 45 Glu Gln Asp Arg Leu Met Pro Val Ala Asn Val Ser Arg lie Met Arq 50 55 60 Gln Val Leu Pro Pro Tyr Ala Lys lie Ser Asp Asp Ala Lys Glu Val 65 70 75 80 lie Gln Glu Cys Val Ser Glu Phe lie Ser Phe Val Thr Gly Glu Ala 85 90 95
95 Asn Glu Arg Cys His Thr Glu Arg Arg Lys Thr Val Thr Ser Glu Asp 100 105 110 lie Val Trp Ala Met Ser Arg Leu Gly Phe Asp Asp Tyr Val Ala Pro 115 120 125 Leu Gly Ala Phe Leu Gln Arg Met Arg Asp Asp Ser Asp His Gly Gly 130 135 140 Glu Glu Arg Gly Gly Pro Ala Gly Arg Gly Gly Ser Arg Arg Gly Ser 145 150 155 160
Ser Ser Leu Pro Leu His Cys Pro Gln Gln Met His His Leu His Pro 165 170 175 Ala Val Cys Arg Arg Pro His Gln Ser Val Ser Pro Ala Ala Gly Tyr 180 185 190 Ala Val Arg Pro Val Pro Arg Pro Met Pro Ala Ser Gly Tyr Arg Met 195 200 205 Gln Gly Gly Asp His Arg Ser Val Gly Gly Val Ala Pro Cys Ser Tyr 210 215 220 Gly Gly Ala Leu Val Gln Ala Gly Gly Thr Gln His Val Val Gly Phe 225 230 235 240
His Asp Asp Glu Ala Ser Ser Ser Ser Glu Asn Pro Pro Pro Glu Gly 245 250 255 Arg Ala Ala Gly Ser Asn 260 <210> 137 <211> 481 <212> ADN <213> Argemona mexicana <220> <221> inseguro <222> (410) <223> n = A, C, G, o T <220> <221> inseguro <222> (471) <223> n = A, C, G, o T <400> 137 cgagagaaag agttggtgaa gaagaagaag aagttgaaaa gagatggaac gtggtggtgg 60 tggtggtggt agtggtggtg gtttccatgg atatcagaaa ctcccaaaat caaactccgc 120 tggaatgatg ctctcggagc tatcgáataa caacaacaat attgacgtaa actctacatg 180 tactgtacga gagcaagatc gatacatgcc aattgctaat gtgatcagga tcatgcgtaa 240 ggtacttcct actcatgcca ágatctctga cgatgccaaa gaaactatcc aagaatgtgt 300 ctcagaatac atcagtttca tcacaagtga agccaatgat cgttgccaac gtgaacaaag 360 aaagacaatc acagctgaag atgttttatg ggcgatgagc aaactagggn ttgatgagta 420 cattgaacct ctaactcttt accttcaacg ttatcgtgag tttgaaggtg nacgttggtc 480 a 481
96 <210> 138 <211> 146 <212> PRT <213> Argemona mexicana <220> <221> INSEGURO <222> (123) <223> Xaa = cualquier aminoácido <220> <221> INSEGURO <222> (143) <223> Xaa = cualquier aminoácido <400> 138 Met Glu Arg Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Phe His Gly 1 5 10 15
Tyr Gln Lys Leu Pro Lys Ser Asn Ser Ala Gly Met Met Leu Ser Glu 20 25 30 Leu Ser Asn Asn Asn Asn Asn lie Asp Val Asn Ser Thr Cys Thr Val 35 40 45 Arg Glu Gln Asp Arg Tyr Met Pro lie Ala Asn Val lie Arg lie Met 50 55 60 Arg Lys Val Leu Pro Thr His Ala Lys lie Ser Asp Asp Ala Lys Glu 65 70 75 80
Thr lie Gln Glu Cys Val Ser Glu Tyr lie Ser Phe lie Thr Ser Glu 85 90 95
Ala Asn Asp Arg Cys Gln Arg Glu Gln Arg Lys Thr lie Thr Ala Glu 100 105 110 Asp Val Leu Trp Ala Met Ser Lys Leu Gly Xaa Asp Glu Tyr lie Glu 115 120 125 Pro Leu Thr Leu Tyr Leu Gln Arg Tyr Arg Glu Phe Glu Gly Xaa Arq 130 135 140 Trp Ser 145 <210> 139 <211> 1154 <212> ADN <213> Glycine max <220> <221> inseguro <222> (3) <223> n = A, C, G, o T
97 <400> 139 atnacacaca cctaccttat aactatggaa actggaggct ttcatggcta ccgcaagctc 60 cccaacacaa cctctgggtt gaagctgtca gtgtcagaca tgaacatgaa catgaggcag 120 cagcaggtag catcatcaga tcagaactgc agcaaccaca gtgcagcagg agaggagaac 180 gaatgcacgg tgagggagca agacaggttc atgccaatcg ctaacgtgat acggatcatg 240 cgcaagattc tccctccaca cgcaaaaatc tccgatgatg caaaggagac aatccaagag 300 tgcgtgtcgg agtacatcag cttcatcacc ggggaggcca acgagcgttg ccagagggag 360 cagcgcaaga ccataaccgc agaggacgtg ctttgggcaa tgagtaagct tggattcgac 420 gactacatcg aaccgttaac catgtacctt caccgctacc gtgagctgga gggtgaccgc 480 acctctatga ggggtgaacc gctcgggaag aggactgtgg aatatgccac gcttgctact 540 gcttttgtgc cgccaccctt tcatcaccac aatggctact ttggtgctgc catgcccatg 600 gggacttacg ttagggaaac gccaccaaat gctgcgtcat ctcatcacca tcatggaatc 660 tccaatgctc atgaaccaaa tgctcgctcc atataaaatb aatgaagagt actgttcagt 720 aggagaacaa gacttcttgg acttgattag cttaactctc agtgattgct gttagagtac 780 tgttgttgag gatggttaat tttataatta agggctggga attggggagt tagtatatat 840 tcctaatcct aattatgtgc atctttaatt tatggaataa ctttgttttt tgttttaact 900 tctgataatt tggattttct gatgtttaat gtggttttgt ctatccctta ttaacagtgc 960 caagcttaag gttttagcca tgctccaaaa tggaatactt gtactgttat gttgttctgg 1020 tagtgatggt gatgaaacct gcaagttatg tttatgtata aagccactat tgatcaaaat 1080 tagagaaatt atcatttaat aagtatcctc ccatgttaat tttaaaaaaa aaaaaaaaaa 1140 actcgagacc ggca 1154
<210> 140 <211> 223 <212> PRT <213> Glycine max <400> 140 Met Glu Thr Gly Gly Phe His Gly Tyr Arg Lys Leu Pro Asn Thr Thr 1 5 10 15 Ser Gly Leu Lys Leu Ser Val Ser Asp Met Asn Met Asn Met Arg Gln 20 25 30 Gln Gln Val Ala Ser Ser Asp Gln Asn Cys Ser Asn His Ser Ala Ala 35 40 45 Gly Glu Glu Asn Glu Cys Thr Val Arg Glu Gln Asp Arg Phe Met Pro 50 55 60 lie Ala Asn Val lie Arg lie Met Arg Lys lie Leu Pro Pro His Ala 65 70 75 80 Lys lie Ser Asp Asp Ala Lys Glu Thr lie Gln Glu Cys Val Ser Glu 85 90 95 Tyr lie Ser Phe lie Thr Gly Glu Ala Asn Glu Arg Cys Gln Arg Glu 100 105 ' 110 Gln Arg Lys Thr lie Thr Ala Glu Asp Val Leu Trp Ala Met Ser Lys 115 120 125 Leu Gly Phe Asp Asp Tyr lie Glu Pro Leu Thr Met Tyr Leu His Arg 130 135 140 Tyr Arg Glu Leu Glu Gly Asp Arg Thr Ser Met Arg Gly Glu Pro Leu 145 150 155 160
98 Gly Lys Arg Thr Val Glu Tyr Ala Thr leu Ala Thr Ala Phe Val Pro 165 170 175 Pro Pro Phe His His His Asn Gly Tyr Phe Gly Ala Ala Met Pro Met 180 185 190 Gly Thr Tyr Val Arg Glu Thr Pro Pro Asn Ala Ala Ser Ser His His 195 200 205 His His Gly lie Ser Asn Ala His Glu Pro Asn Ala Arg Ser lie 210 215 220 <210> 141 <211> 942 <212> ADN <213> Glycine max <400> 141 gcacgagctc tcttataatc acacacacac ctaccttaat agctatggaa actggaggct 60 ttcacggcta ccgcaagctc cccaacacca ccgctgggtt gaagctgtca gtgtcagaca 120 tgaacatgag gcagcaggta gcatcatcag atcacagtgc agccacagga gaggagaacg 180 aatgcacggt gagggagcaa gacaggttca tgccaatcgc caacgtgatt aggatcatgc 240 gcaagattct ccctccacac gcaaaaatct cggacgatgc aaaagaaaca atccaagagt 300 gcgtgtctga gtacatcagc ttcatcacag gtgaggcgaa cgagcgttgc cagagggagc 360 agcggaagac cataaccgca gaggacgtgc tttgggccat gagcaagctt ggattcgacg 420 actacatcga accgttgacc atgtaccttc accgctaccg tgaacttgag ggtgaccgca 480 cctctatgag gggtgaacca ctcgggaaga ggactgtgga atacgccacg cttggtgttg 540 ctactgcttt tgtccctcca ccctatcatc accacaatgg gtactttggt gctgccatgc 600 ccatggggac ttacgttagg gaagcgccac caaatacagc ctcctcccat caccaccacc 660 accaccacca ccaccatgct cgtggaatct ccaatgctca tgaaccaaat gctcgctcca 720 tataaaatta tataattatg actaggattc agaacaagac ttgatgatga ttagcttaac 780 tctcagtaat tggtgctaga gtactactgt tgttgaggat actttatttt ataattaagg 840 gctgggaagg gagttagtat attcctaatc ctaactatgt gcatctttaa tttatgaaat 900 cactttgttt taacctttga tgaaaaaaaa aaaaaaaaaa aa 942
<210> 142 <211> 240 <212> RT <213> Glycine max <400> 142 Thr Ser Ser Leu lie lie Thr His Thr Pro Thr Leu lie Ala Met Glu 1 5 10 15 Thr Gly Gly Phe His Gly Tyr Arg Lys Leu Pro Asn Thr Thr Ala Gly 20 25 30 Leu Lys Leu Ser Val Ser Asp Met Asn Met Arg Gln Gln Val Ala Ser 35 40 ¦ 45 Ser Asp His Ser Ala Ala Thr Gly Glu Glu Asn Glu Cys Thr Val Arq 50 55 ' 60 Glu Gln Asp Arg Phe Met Pro lie Ala Asn Val lie Arg lie Met Arq 65 70 75 80
99 Lys lie Leu Pro Pro His Ala Lys lie Ser Asp Asp Ala Lys Glu Thr 85 90 95 lie Gln Glu Cys Val Ser Glu Tyr lie Ser Phe lie Thr Gly Glu Ala 100 105 110 Asn Glu Arg Cys Gln Arg Glu Gln Arg Lys Thr lie Thr Ala Glu Asp 115 120 125 Val Leu Trp Ala Met Ser Lys Leu Gly Phe Asp Asp Tyr lie Glu Pro 130 135 140 Leu Thr Met Tyr Leu His Arg Tyr Arg Glu Leu Glu Gly Asp Arg Thr 145 · 150 155 160
Ser Met Arg Gly Glu Pro Leu Gly Lys Arg Thr Val Glu Tyr Ala Thr 165 170 175 Leu Gly Val Ala Thr Ala Phe Val Pro Pro Pro Tyr His His His Asn 180 185 190 Gly Tyr Phe Gly Ala Ala Met Pro Met Gly Thr Tyr Val Arg Glu Ala 195 200 205 Pro Pro Asn Thr Ala Ser Ser His His His His His His His His His 210 215 220 His Ala Arg Gly lie Ser Asn Ala His Glu Ero Asn Ala Arg Ser lie 225 230 235 240
<210> 143 <211> 796 <212> ADN <213> Glycine max <400> 143 gcacgagcaa tggcgggagt gagggaacag gaccagtaca tgccgatagc gaacgtgata 60 aggatcatgc gtcggattct gccagcgcac gcgaagatct cagacgacgc gaaggagacg 120 atccaggagt gcgtgtctga gtacatcagt ttcatcacgg cggaggcgaa cgagcggtgc 180 cagcgggagc agcggaagac ggtgaccgca gaggatgtgt tgtgggcgat ggagaagctt 240 ggctttgaca actacgctca ccctctctct ctttaccttc accgctaccg cgagagtgaa 300 ggagaacctg cttctgtcag acgcgcttct tctgcaatgg ggatcaataa taatatggtg 360 cacccacctt atattaattc tcatggcttt ggaatgtttg attttgaccc atcatcgcaa 420 gggttttaca gggacgatca taacgctgct tctggatctg gtggttttgt tgcgcctttt 480 gatccttatg ctaacatcaa acgtgatgcc ctgtgatcat gtaagaacaa caactagtgc 540 atgctgcttt ttcacttggt tagttatatt caagcacaag cacatgcagg tgcagctgca 600 actatttagc ttcatctaca aatctttttt cctctcttct tctcatgctt taattattta 660 gagacaatac ttgttattca ttgttatgct caattgctag cttctattca tcgtcgactg 720 tctgtattgt tgatgttcat tacagtaaca gataagatgg taactgcttt actacttcaa 780 aaaaaaaaaa aaaaaa 796
<210> 144 <211> 171 <212> PRT <213> Glycine max
100 <400> 144 Ala Arg Ala Met Ala Gly Val Arg Glu Gln Asp Gln Tyr Met Pro lie
1 5 10 15 Ala Asn Val lie Arg lie Met Arg Arg lie Leu Pro Ala His Ala Lys 20 25 30 lie Ser Asp Asp Ala Lys Glu Thr lie Gln Glu Cys Val Ser Glu Tyr 35 40 45 lie Ser Phe lie Thr Ala Glu Ala Asn Glu Arg Cys Gln Arg Glu Gln 50 55 60 Arg Lys Thr Val Thr Ala Glu Asp Val Leu Trp Ala Met Glu Lys Leu 65 70 75 80
Gly Phe Asp Asn Tyr Ala His Pro Leu Ser Leu Tyr Leu Kis Arg Tyr 85 90 95 Arg Glu Ser Glu Gly Glu Pro Ala Ser Val Arg Arg Ala Ser Ser Ala 100 105 110 Met Gly lie Asn Asn Asn Met Val His Pro Pro Tyr lie Asn Ser His 115 120 125 Gly Phe Gly Met Phe Asp Phe Asp Pro Ser Ser Gln Gly Phe Tyr Arg
130 135 140 Asp Asp His Asn Ala Ala Ser Gly Ser Gly Gly Phe Val Ala Pro Phe 145 150 155 160
Asp Pro Tyr Ala Asn lie Lys Arg Asp Ala Leu 165 170 <210> 145 <211> 905 <212> ADN <213> Vernonia mespilifolia <400> 145 gcacgagcca atttctagag agagaacgag agagaattct ctaaagagga aaaatagatg 60 gaacgtggag gaggtttcca tggctaccac aggctcccca tccaccctac atctggaatc 120 caacaatcgg atatgaagct aaagctacca gaaatgacca acaataactc gtccactgat 180 gacaatgagt gcaccgttcg agaacaggac cgcttcatgc cgatagcaaa cgtgatccgc 240 atcatgcgga agatccttcc tccacatgcc aagatctctg atgatgccaa agagacgatc 300 caagaatgtg tttcagagta cattagcttt gtcacaggcg aggcaaatga ccgctgccag 360 cgtgagcaaa ggaagaccat cacagctgaa gatgtgctct gggctatgag caaactggga 420 tttgatgatt atatcgagcc cttgactgtg tatctccatc 'gctacaggga gtttgatggt 480 ggcgaacgtg gatccataag gggtgagccc cttgtgaaga ggagtacttc tgatcctggt 540 cactttggga tggcttcttt tgtgcctgct tttcatatgg gtcatcataa cggcttcttt 600 ggtcctgcaa gcattggtgg tttcctgaaa gacccatcga gtgctggccc ttcgggacct 660 gcagtcgctg ggtttgagcc gtatgctcag tgtaaagagt aactgcaaaa agtaggggtt 720 gggatgagat gatgatgatg gtggtggtgg tggtggtttg ttttgttttg ttctttcttt 780 tttttttctt ctttcttttc ttggtcattg aggaacaaac ttacattggt tcactttggc 840 taggcatgta aacggttaac atgcttatca agtagtagtt ttcgatcaaa aaaaaaaaaa 900 aaaaa 905
101 <210> 146 <211> 214 <212> PRT <213> Vernonia mespilifolia <400> 146 Met Glu Arg Gly Gly Gly Phe His Gly Tyr His Arg Leu Pro lie His 1 5 10 15 Pro Thr Ser Gly lie Gln Gln Ser Asp Met Lys Leu Lys Leu Pro Glu 20 25 30 Met Thr Asn Asn Asn Ser Ser Thr Asp Asp Asn- Glu Cys Thr Val Arg 35 40 45 Glu Gln Asp Arg Phe Met Pro lie Ala Asn Val lie Arg lie Met Arg 50 55 60 Lys lie Leu Pro Pro His Ala Lys lie Ser Asp Asp Ala Lys Glu Thr 65 70 75 80 lie Gln Glu Cys Val Ser Glu Tyr lie Ser Phe Val Thr Gly Glu Ala 85 90 95 Asn Asp Arg Cys Gln Arg Glu Gln Arg Lys Thr lie Thr Ala Glu Asp 100 . 105 110 Val Leu Trp Ala Met Ser Lys Leu Gly Phe Asp Asp Tyr lie Glu Pro 115 120 125 Leu Thr Val Tyr Leu His Arg Tyr Arg Glu Phe Asp Gly Gly Glu Arg 130 135 140 Gly Ser lie Arg Gly Glu Pro Leu Val Lys Arg Ser Thr Ser Asp Pro 145 150 155 160
Gly His Phe Gly Met Ala Ser Phe Val Pro Ala Phe His Met Gly His 165 170 175 His Asn Gly Phe Phe Gly Pro Ala Ser lie Gly Gly Phe Leu Lys Asp 180 185 190 Pro Ser Ser Ala Gly Pro Ser Gly Pro Ala Val Ala Gly Phe Glu Pro 195 200 205 Tyr Ala Gln Cys Lys Glu 210 <210> 147 <211> 1098 <212> ADN <213> Triticum aestivum <400> 147 gcacgagcaa gtgcgagtgc gactacctgc attgcacctt ggctagccct agacatggag 60 aacgacggcg tccccaacgg accagcggcg ccggcaccta cccaggggac gccggtggtg 120 cgggagcagg accggctgat gccgatcgcg aacgtgatcc gcatcatgcg ccgtgcgctc 180 cctgcccacg ccaagatctc cgacgacgcc aaggaggcga ttcaggaatg cgtgtccgag 240 ttcatcagct tcgtcaccgg cgaggccaac gaacggtgcc gcatgcagca ccgcaagacc 300
102 gtcaacgccg aagacatcgt gtgggcccta aaccgcctcg gcttcgacga ctacgtcgtg 360 cccctcagcg tcttcctgca ccgcatgcgc gaccccgagg cggggacagg tggtgccgct 420 gcaggcgaca gccgcgccgt gacgagtgcg cctccccgcg cggccccgcc cgtgatccac 480 gccgtgccgc tgcaggctca gcgcccgatg tacgcgcccc cggctccgtt gcaggttgag 540 aatcagatgc agcggcctgt gtacgctccc ccggctccgg tgcaggttca gatgcagcgg 600 ggcatctatg ggccccgggc tccagtgcac gggtacgccg tcggaatggc gcccgtgcgg 660 gccaacgtcg gcgggcagta ccaggtgttc ggcggagagg gtgtcatggc ccagcaatac 720 tacgggtacg ggtacgagga aggagcgtac ggcgcaggta gcagcaacgg aggagccgcc 780 attggcgacg aggagagctc gtccaacggc gtgccggcac cgggggaggg catgggggag 840 ccagagccag agccagcagc agaagaatcg catgacaagc ccgtccaatc tggctagtcg 900 cgtgcgcggc gcgcgttagc ttctgcgtcc tgtgtactgt aataatttgc cgtgtcgatc 960 cggccatggt ttgtgtgtgc gtagtgctta tctaatgtgg gcttgtcctc tagtaattca 1020 tgtattgctt atctaatgtg gacttgtcct ctagtaattc atgtactctt tgctgttgaa 1080 aaaaaaaaaa aaaaaaaa 1098 <210> 148 <211> 280 <212> PRT <213> Triticum aestivum <400> 148 Met Glu Asn Asp Gly Val Pro Asn Gly Pro Ala Ala Pro Ala Pro Thr
1 5 10 15 Gln Gly Thr Pro Val Val Arg Glu Gln Asp Arg Leu Met Pro lie Ala 20 25 30 Asn Val lie Arg lie Met Arg Arg Ala Leu Pro Ala His Ala Lys lie 35 40 45 Ser Asp Asp Ala Lys Glu Ala lie Gln Glu Cys Val Ser Glu Phe lie
50 55 60 Ser Phe Val Thr Gly Glu Ala Asn Glu Arg Cys Arg Met Gln His Arg
65 70 75 80 Lys Thr Val Asn Ala Glu Asp lie Val Trp Ala Leu Asn Arg Leu Gly 85 90 95 Phe Asp Asp Tyr Val Val Pro Leu Ser Val Phe Leu His Arg Met Arg 100 105 HO Asp Pro Glu Ala Gly Thr Gly Gly Ala Ala Ala Gly Asp Ser Arg Ala 115 120 125 Val Thr Ser Ala Pro Pro Arg Ala Ala Pro Pro Val lie His Ala Val
130 135 140 Pro Leu Gln Ala Gln Arg Pro Met Tyr Ala Pro Pro Ala Pro Leu Gln
145 150 155 160
Val Glu Asn Gln Met Gln Arg Pro Val Tyr Ala Pro Pro Ala Pro Val 165 170 175 Gln Val Gln Met Gln Arg Gly lie Tyr Gly Pro Arg Ala Pro Val His 180 185 190 Gly Tyr Ala Val Gly Met Ala Pro Val "Arg Ala Asn Val Gly Gly Gln 195 200 205
103 Tyr Gln Val Phe Gly Gly Glu Gly Val Met Ala Gln Gln Tyr Tyr Gly
210 215 220 Tyr Gly Tyr Glu Glu. Gly Ala Tyr Gly Ala Gly Ser Ser Asn Gly Gly 225 230 ~ 235 240
Ala Ala lie Gly Asp Glu Glu Ser Ser Ser Asn Gly Val Pro Ala Pro 245 250 255 Gly Glu Gly Met Gly Glu Pro Glu Pro Glu Pro Ala Ala Glu Glu Ser 260 265 270 His Asp Lys Pro Val Gln Ser Gly 275 280 <210> 149 <211> 932 <212> ADN <213> Canna edulis <400> 149 gcaccagctc aaatctccga attagggttt ctgtgccttg tctccaatgg cggaatcggg 60 ggccccgggc acgcccgaga gcggacattc cggcggcgga tctggcgcgc gggagcagga 120 ccgctgcctc cccattgcca acattgggcg gattatgagg aaggccgtac ccgagaacgg 180 caagatcgcc aaggacgcca aggaatccgt ccaggagtgc gtctccgagt tcatcagctt 240 cgtcaccagc gaggcgagcg ataagtgccg ccgcgagaaa aggaagacga tcaacggcga 300 tgatcttctg tgggctatgc ggatgcttgg cttcgaagag tacgtcgagc ctcttaagct 360 ctacttgcag ctctacagag agatggaggg aaacgtcatg gtttcacgtc ccgctgatca 420 atgatcaacc aggaaaaaga gatggagcaa ttaacaggca gcccacagat tcgttcaatg 480 gcatgtagga tggttctcaa gaaagcaaac ttttgcttac tatttcaagg tgtaggccct 540 ttgttagtgt agttaataag ttatagttgc tgcaggttat ttttgttctt atttgtactc 600 ttgtccaata ccttttcctc taagtgaaca acattcagag aatggctctt ctetaggact 660 tggacgaagg cacgaagcac tgatctgaag ttatgatcca ttcaaccatc taaaattaat 720 tttaaatttt aaattgagac aatgttttga cccttgtttc gacatttccc gacagcccta 780 ctgtaatgta aagatgactt ggatagcaaa attgttaaaa aggtacaatt cctgcaatgt 840 tttacaagtc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 932 <210> 150 <211> 121 <212> PRT <213> Canna edulis <400> 150 Met Ala Glu Ser Gly Ala Pro Gly Thr Pro Glu Ser Gly His Ser Gly
1 5 10 15 Gly Gly Ser Gly Ala Arg Glu Gln Asp Arg Cys Leu Pro lie Ala Asn 20 25 30 lie Gly Arg lie Met Arg Lys Ala Val Pro Glu Asn Gly Lys lie Ala 35 40 45 Lys Asp Ala Lys Glu Ser Val Gln Glu Cys Val Ser Glu Phe lie Ser 50 55 60
104 Phe Val Thr Ser Glu Ala Ser Asp Lys Cys Arg Arg Glu Lys Arg Lys
65 70 75 80
Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met Arg Met Leu Gly Phe 85 90 95 Glu Glu Tyr Val Glu Pro Leu Lys Leu Tyr Leu Gln Leu Tyr Arg Glu 100 105 110 Met Glu Gly Asn Val Met Val Ser Arg 115 120 <210> 151 <211> 863 <212> ADN <213> Momodica charantia <400> 151 gcacgagcag gatctcgctc acatggcgga ggctccgacg agtccagccg gcggcagcca 60 cgagagcggc ggcgagcaga gccccaatac cggtggggtt cgggagcagg accgatacct 120 cccgatcgct aacattagcc ggatcatgaa gaaggccttg cccgctaatg gcaagatcgc 180 caaggacgcc aaggacaccg tccaggaarg cgtctccgaa ttcatcagct tcatcactag 240 cgaggcgagc gataagtgcc agaaggagaa gagaaagacc attaatgggg atgatttgct 300 gtgggcaatg gcgacattgg gtttcgagga ctatattgat ccgcttaagt cgtatctaac 360 taggtacaga gagttggagt gtgatgctaa gggatcttct aggggtggtg atgagtctgc 420 taaaagagat gcagttgggg ccttgcctgg ccaaaattcc cagcagtaca tgcagccggg 480 agcaatgacc tacattaaca cccaaggaca gcatttgatc attccttcaa tgcagaataa 540 tgaataggag actcctgcat' tccctcttgg attgtctgaa atctgaggct ggtagaagcg 600 ttcaacacct atatagcatc tttacaatcg atttggctaa tttattatga aatgatgata 660 ttatatatat ttctggggtt tctctgttgg ttctggattt gattttggtt tgggctttta 720 aggtgggctt cgattttatt gatgctctcg tcatctaaag ttattgtaaa tttgggacct 780 tcaatttagt atagttgctt tggtaatttg gaaactggaa aaaaaaaaaa aaaaaaaaaa 840 aaaaaaaaaa aaaaaaaaaa aaa 863 <210> 152 <211> 174 <212> PRT <213> Momodica charantia <400> 152 Met Ala Glu Ala Pro Thr Ser Pro Ala Gly Gly Ser His Glu Ser Gly
1 5 10 15 Gly Glu Gln Ser Pro Asn Thr Gly Gly Val Arg Glu Gln Asp Arg Tyr 20 25 30 Leu Pro lie Ala Asn lie Ser Arg lie Met Lys Lys Ala Leu Pro Ala 35 40 45 Asn Gly Lys lie Ala Lys Asp Ala Lys Asp Thr Val Gln Glu Cys Val 50 55 60 Ser Glu Phe lie Ser' Phe lie Thr Ser Glu Ala Ser Asp Lys Cys Gln 65 70 75 80
Lys Glu Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met 85 90 95
105 Ala Thr Leu Gly Phe Glu Asp Tyr lie Asp Pro Leu Lys Ser Tyr Leu 100 105 110 Thr Arg Tyr Arg Glu Leu Glu Cys Asp Ala Lys Gly Ser Ser Arg Gly 115 120 125 Gly Asp Glu Ser Ala Lys Arg Asp Ala Val Gly Ala Leu Pro Gly Gln
130 135 140 Asn Ser Gln Gln Tyr Met Gln Pro Gly Ala Met Thr Tyr lie Asn Thr 145 150 155 160
Gln Gly Gln His Leu lie lie Pro Ser Met Gln Asn Asn Glu 165 170 <210> 153 <211> 1179 <212> ADN <213> Eucalyptus grandis <400> 153 gcaccagttt ccccccgccc ccccgatcgc cgcccctccc gccggggccg gcggcggcgg 60 ggcgtcggcg gcggcggcgg aggatgtggg gagctttctc acggaggatg aggtttcttc 120 tcttctatgt tttttttttt gcagctgctc ggcttgcctg ccctctcggg cgacgacgcg 180 atggcggagg ctccggcgag tcccggcggc ggcggcagcc acgagagcgg cgagcacagc 240 ccccggtccg gcggcgccgt ccgcgagcag gacaggtacc tccccatcgc caacatcagc 300 cgcatcatga agaaggccct ccccgccaac ggcaagatcg ccaaggacgc caaggagacc 360 gtgcaggagt gcgtctccga gttcatcagc ttcatcacca gcgaggcgag cgacaagtgc 420 cagagggaga agaggaagac gatcaacggc gacgacttgc tctggcccat ggcgacctta 480 gggtttgagg attacctcga tccgcttaag atttacctgg ccagatacag ggagatggag 540 ggggatacca aggggtcagc taaagtgggg gaagcatcta ctaaaagaga tggcgccgca 600 gttcagtcag ttcctaatgc acagattgct catcaaggtt ctttctctca cggcaccaac 660 tattcgcatt ctcaagttca ccatcctgcg cttccgatgc atggctcaga atgacatgtt 720 ccagcccttg ttgcatgaga tgaagaagtc atcacacttg ttccaggcgt ttgactcatc 780 tcggcatcaa gatattcata agatgtgctg ctgacatttt agggtggtct ctgccaattg 840 tgttcatttg gagttgtttt ccagtgggct gtatatttta gcatctgcat catatttgct 900 ttcagcctta catatgtctg gtttagattt acttgataat gtagaaaggt aagcccccct 960 gcgagtattt atcttattgt catttagatt cgacacccaa ggaggacgag aatgaagttt 1020 ctttttagct ctctgtttcg ttggagttgt cttgtgtatt cttgagttag aaacttgtga 1080 acaaattggt atgcacagtc catgtttatg tgacaatgtc gaggtctgag tgtataatcc 1140 agagtccaat tcagatcgta aaaaaaaaaa aaaaaaaaa 1179 <210> 154 <211> 177 <212> PRT <213> Eucalyptus grandis <400> 154 Met Ala Glu Ala Pro Ala Ser Pro Gly Gly Gly Gly Ser His Glu Ser
1 5 10 15 Gly Glu His Ser Pro Arg Ser Gly Gly Ala Val Arg Glu Gln Asp Arg 20 25 30 Tyr Leu Pro lie Ala Asn lie Ser Arg lie Met Lys Lys Ala Leu Pro 35 40 45
106 Ala Asn Gly Lys lie Ala Lys Asp Ala Lys Glu Thr Val Gln Glu Cvs 50 55 _ 60 Val Ser Glu Phe lie Ser Phe lie Thr Ser Glu Ala Ser Asp Lys Cys 65 '70 75 80
Gln Arg Glu Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Pro 85 90 95 Met Ala Thr Leu Gly Phe Glu Asp Tyr Leu Asp Pro Leu Lys lie Tyr 100 105 110 Leu Ala Arg Tyr Arg Glu Met Glu Gly Asp Thr Lys Gly Ser Ala Lys 115 120 125 Val Gly Glu Ala Ser Thr Lys Arg Asp Gly Ala Ala Val Gln Ser Val
130 135 140 Pro Asn Ala Gln lie Ala His Gln Gly Ser Phe Ser His Gly Thr Asn 145 150 155 160
Tyr Ser His Ser Gln Val His His Pro Ala Leu Pro Met His Gly Ser 165 170 175 Glu <210> 155 <211> 983 <212> ADN <213> Zea mays <400> 155 gcacgagccg gagcgcctcc tcttctccag cgtccgatcc ccattcccca cctctcctcc 60 ctccgccgcc agctcccgcc cccttctctc ccctcctcgc ctccccgcgc gcgcgttttt 120 ataagggttt cggcggaggc gcccggtcgc tggcgatggc cgacgacggc gggagccacg 180 agggcagcgg cggcggcgga ggcgtccggg agcaggaccg gttcctgccc atcgccaaca 240 tcagccggat catgaagaag gccgtcccgg ccaacggcaa gatcgccaag gacgctaagg 300 agaccctgca ggagtgcgtc tccgagttca tatcattcgt gaccagcgag gccagcgaca 360 aatgccagaa ggagaaacga aagacaatca acggggacga tttgctctgg gcgatggcca 420 ctttaggatt cgaggagtac gtcgagcctc tcaagattta cctacaaaag tacaaagaga 480 tggagggtga tagcaagctg tctacaaagg ctggcgaggg ctctgtaaag aaggatgcaa 540 ttagtcccca tggtggcacc agtagctcaa gtaatcagtt ggttcagcat ggagtctaca 600 accaagggat gggctatatg cagccacagt accacaatgg ggaaacctaa taaagggcta 660 atacagcagc aatttatgct agggaagtct ctgcattgct taccatgtgt attggcagaa 720 aacaggaggc acttacaaag ggtgttaatc tctgcgatgg ctgcctctca ggtgtaaatt 780 ggcttcggtt tagcgctgct tttgtccgta tatttaggat gatttgactg ttgctacttt 840 tggcaacctt ttacatttac agatatgtat tattcagcat aaatataata tagtagtcct 900 aggcctaaat aatggtgatt aacataccaa gtcttttatc aggctactcg ttttctggaa 960 caaaaaaaaa aaaaaaaaaa aaa 933 <210> 156 <211> 164 <212> PRT <213> Zea mays
107 <400> 156 et Ala Asp Asp Gly Gly Ser His Glu Gly Ser Gly Gly Gly Gly Gly
1 5 10 15 Val Arg Glu Gln Asp Arg Phe Leu Pro lie Ala Asn lie Ser Arg lie 20 25 30 Met Lys Lys Ala Val Pro Ala Asn Gly Lys lie Ala Lys Asp Ala Lys 35 40 45 Glu Thr Leu Gln Glu Cys Val Ser Glu Phe lie Ser Phe Val Thr Ser 50 55 60 Glu Ala Ser Asp Lys Cys Gln Lys Glu Lys Arg Lys Thr lie Asn Gly
65 70 75 80
Asp Asp Leu Leu Trp Ala Met Ala Thr Leu Gly Phe Glu Glu Tyr Val 85 90 95 Glu Pro Leu Lys lie Tyr Leu Gln Lys Tyr Lys Glu Met Glu Gly Asp 100 105 110 Ser Lys Leu Ser Thr Lys Ala Gly Glu Gly Ser Val Lys Lys Asp Ala 115 120 125 lie Ser Pro His Gly Gly Thr Ser Ser Ser Ser Asn Gln Leu Val Gln
130 135 140 His Gly Val Tyr Asn Gln Gly Met Gly Tyr Met Gln Pro Gln Tyr His
145 150 155 160
Asn Gly Glu Thr <210> 157 <211> 1021 <212> ADN <213> Zea mays <400> 157 ggcacgagcg ctcctgttct tctcgcatcc ccagcccagg tggtgtcccc tgtcgcgttg 60 atgcatgctc cctcggcggt ggccttgagc tgaggcggcg gagcgatgcc ggactcggac 120 aacgactccg gcgggccgag caacgccggg ggcgagctgt cgtcgccgcg ggagcaggac 180 cggttcctgc ccatcgccaa cgtgagccgg atcatgaaga aggcgctccc ggccaacgcc 240 aagatcagca aggacgccaa ggagacggtg caggagtgcg tgtccgagtt catctccttc 300 atcaccggcg aggcctccga caagtgccag cgcgagaagc gcaagaccat caacggcgac 360 gacctgctgt gggccatgac cacgctcggc ttcgaggact acgtcgagcc gctcaagcac 420 tacctgcaca agttccgcga gatcgagggc gagagggccg ccgcgtccgc cggcgcctcg 480 ggctcgcagc agcagcagca gcagggcgag ctgcccagag gcgccgccaa tgccgccggg 540 tacgccgggt acggcgcgcc tggctccggc ggcatgatga tgatgatgat ggggcagccc 600 atgtacggcg gctcgcagcc gcagcaacag ccgccgccgc ctcagccgcc acagcagcag 660 cagcaacatc aacagcatca catggcaata ggaggcagag gaggattcgg ccaacaaggc 720 ggcggcggcg gctcctcgtc gtcgtcaggg cttggccggc aagacagggc gtgagttgcg 780 acgatacgtt cagaatcaga atcgctgata ctcctacgta gaattatacc tcctacctaa 840 ttgatgacac cgcaccgcac ctcgttgtgc tgcctgtcct tgtacgttta ctaattactg 900 ctgcctgtat gtaaatcaaa atctgaggct cccatttcga aacggacggt gaactactct 960 tcccgtttcg tttcatacga gaatcgaact cgttttcaat taaaaaaaaa aaaaaaaaaa 1020 a 1021
108 <210> 158 <211> 222 <212> PRT <213> Zea mays <400> 158 Met Pro Asp Ser Asp Asn Asp Ser Gly Gly Pro Ser Asn Ala Gly Gly
1 5 10 15 Glu Leu Ser Ser Pro Arg Glu Gln Asp Arg Phe Leu Pro lie Ala Asn 20 25 30 Val Ser Arg lie Met Lys Lys Ala Leu Pro Ala Asn Ala Lys lie Ser 35 40 45 Lys Asp Ala Lys Glu Thr Val Gln Glu Cys Val Ser Glu Phe lie Ser 50 55 60 Phe lie Thr Gly Glu Ala Ser Asp Lys Cys Gln-Arg Glu Lys Arg Lys
65 70 75 80 Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met Thr Thr Leu Gly Phe 85 90 95 Glu Asp Tyr Val Glu Pro Leu Lys His Tyr Leu His Lys Phe Arg Glu 100 105 110 lie Glu Gly Glu Arg Ala Ala Ala Ser Ala Gly Ala Ser Gly Ser Gln 115 120 125 Gln Gln Gln Gln Gln Gly Glu Leu Pro Arg Gly Ala Ala Asn Ala Ala
130 135 140 Gly Tyr Ala Gly Tyr Gly Ala Pro Gly Ser Gly Gly Met Met Met Met
145 150 155 160
Met Met Gly Gln Pro Met Tyr Gly Gly Ser Gln Pro Gln Gln Gln Pro 165 170 175 Pro Pro Pro Gln Pro Pro Gln Gln Gln Gln Gln His Gln Gln His His 180 185 190 Met Ala lie Gly Gly Arg Gly Gly Phe Gly Gln Gln Gly Giy Gly Gly 195 200 205 Gly Ser Ser Ser Ser Ser Gly Leu Gly Arg Gln Asp Arg Ala 210 215 220 <210> 159 <211> 1055 <212> ADN <213> Oyza sativa <400> 159 gcacgagctt acatctctct ctctcctctc ttctcttctt cctcccagac tagtcagtct 60 ctcccaagaa cacccactcc tctagtctct ctctcgagag agagaaaatt gatgattctt 120 gggatgattt tgaggcgtct gatttgctga agaggaggag gaggatgccg gactcggaca 180 acgactccgg cgggccgagc aactacgcgg gaggggagct gtcgtcgccg cgggagcagg 240
109 acaggttcct gccgatcgcg aacgtgagca ggatcatgaa gaaggcgctg ccggcgaacg 300 ccaagatcag caaggacgcc aaggagacgg tgcaggagtg cgtctccgag ttcatctcct 360 tcatcaccgg cgaggcctcc gacaagtgcc agcgcgagaa gcgcaagacc atcaacggcg 420 acgacctgct ctggcccatg accaccctcg gcttcgagga ctacgtcgac cccctcaagc 480 actacctcca caagtzccgc gagatcgagg gcgagcgcgc cgccgcctcc accaccggcg 540 ccggcaccag cgccgcctcc accacgccgc cgcagcagca gcacaccgcc aatgccgccg 600 gcggctacgc cgggtacgcc gccccgggag ccggccccgg cggcatgatg atgatgatgg 660 ggcagcccat gtacggctcg ccgccaccgc cgccacagca gcagcagcag caacaccacc 720 acatggcaat gggaggaaga ggcggcttcg gtcatcatcc cggcggcggc ggcggcgggt 780 cgtcgtcgtc gtcggggcac ggtcggcaaa acaggggcgc ttgacatcgc tccgagacga 840 gtagcatgca ccatggtaca tatatacagt aatcagcagc tgttcatttt tctátgatta 900 ctagttgact taagcttgca aatttgctaá tctgagctcc tgagtttttt tttttggtca 960 gcaatttcaa gatggtcaga agctaaattt gtctatttgt tactgataaa ttatttgttc 1020 tctcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 1055 <210> 160 <211> 219 <212> PRT <213> Oyza sativa <400> 160 Met Pro Asp Ser Asp Asn Asp Ser Gly Gly Pro Ser Asn Tyr Ala Gly 10 15 Gly Glu Leu Ser Ser Pro Arg Glu Gln Asp Arg Phe Leu Pro lie Ala 20 25 30 Asn Val Ser Arg lie Met Lys Lys Ala Leu Pro Ala Asn Ala Lys lie 35 40 45 Ser Lys Asp Ala Lys Glu Thr Val Gln Glu Cys Val Ser Glu Phe lie 50 55 60 Ser Phe lie Thr Gly Glu Ala Ser Asp Lys Cys Gln Arg Glu Lys Arg 65 70 75 80 Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met Thr Thr Leu Gly 85 90 95 Phe Glu Asp Tyr Val Asp Pro Leu Lys His Tyr Leu His Lys Phe Arg 100 105 110 Glu lie Glu Gly Glu Arg Ala Ala Ala Ser Thr Thr Gly Ala Gly Thr 115 120 125 Ser Ala Ala Ser Thr Thr Pro Pro Gln Gln Gln His Thr Ala Asn Ala 130 135 140 Ala Gly Gly Tyr Ala Gly Tyr Ala Ala Pro Gly Ala Gly Pro Gly Gly 145 150 155 160
Met Met Met Met Met Gly Gln Pro Met Tyr Gly Ser Pro Pro Pro Pro 165 170 175 Pro Gln Gln Gln Gln Glh Gln His His His Met Ala Met Gly Gly Arg 180 185 190 Gly Gly Phe Gly His His Pro Gly Gly Gly Gly Gly Gly Ser Ser Ser 195 200 205
110 Ser Ser Gly His Gly Arg Gln Asn Arg Gly Ala 210 215 <210> 161 <211> 873 <212> ADN <213> Oyza sativa <400> 161 gtttttggag ggcggcgcgg ggatggcgga cgcggggcac gacgagagcg ggagcccgcc 60 gaggagcggc ggggtgaggg agcaggacag gttcctgcce atcgccaaca tcagccgcat 120 catgaagaag gccgtcccgg cgaacggcaa gatcgccaag gacgccaagg agaccctgca 180 ggagtgcgtc tcggagttca tctccttcgt caccagcgag gcgagcgaca aatgtcagaa 240 ggagaagcgc aagaccatca acggggaaga tctcctcttt gcgatgggta cgcttggctt 300 tgaggagtac gttgatccgt tgaagatcta tttacacaag tacagagaga tggagggtga 360 tagtaagctg tcctcaaagg ctggtgatgg ttcagtaaag aaggatacaa ttggtccgca 420 cagtggcgct agtagctcaa gtgcgcaagg gatggttggg gcttacaccc aagggatggg 480 ttatatgcaa cctcagtatc ataatgggga cacctaaaga tgaggacagt gaaaattttc 540 agtaactggt gtcctctgtg agttattatc catctgttaa ggaagaaccc acattagggc 600 catatttatt agtagaagac taaagcactt gaagggtgtt ggtttagaaa gggtgttaac 660 agttggctgt ggcgattgct tcacagatgt aaattgcttc ataagtggtt taatgcttgt 720 ttttgcctgt atattcagag caattttcac atattggtag ttctgcaatc ttttgcattc 780 ccatacatgt atcaggtggc acaaatctat tgcaagtacc ctagcattga ataatgctgg 840 ttaacatata aaaaaaaaaa aaaaaaaaaa aaa 873 <210> 162 <211> 164 <212> PRT <213> Oyza sativa <400> 162 Met Ala Asp Ala Gly His Asp Glu Ser Gly Ser Pro Pro Arg Ser Gly
1 - 5 10 15 Gly Val Arg Glu Gln Asp Arg Phe Leu' Pro lie Ala Asn lie Ser Arg 20 25 30 lie Met Lys Lys Ala Val Pro Ala Asn Gly Lys lie Ala lys Asp Ala 35 40 45 Lys Glu Thr Leu Gln Glu Cys Val Ser Glu Phe lie Ser Phe Val Thr 50 55 60 Ser Glu Ala Ser Asp Lys Cys Gln Lys Glu Lys Arg Lys Thr lie Asn 65 70 75 80
Gly Glu Asp Leu Leu Phe Ala Met Gly Thr Leu Gly Phe Glu Glu Tyr 85 90 95 Val Asp Pro Leu Lys lie Tyr Leu His Lys Tyr Arg Glu Met Glu Gly 100 105 110 Asp Ser Lys Leu Ser Ser Lys Ala Gly Asp Gly Ser Val Lys Lys Asp 115 120 125 Thr lie Gly Pro His Ser Gly Ala Ser Ser Ser Ser Ala Gln Gly Met 130 135 140
111 Val Gly Ala Tyr Thr Gln Gly Met Gly Tyr et Gln Pro Gln Tyr His 145 150 155 160
Asn Gly Asp Thr <210> 163 <211> 799 <212> ADN <213> Glycine max <400> 163 gcacgagacg aaagcaacgg tgaagatgaa taatgagtga ggcaatccaa tggtgagaaa 60 ggagtccgtg aaagcagaga cttatcgaga aacaacggca cagaaggttc cacgtgggaa 120 gcagataaag gaatattaag cagagagatc caacggacac tgctagtgaa ggcagaagaa 180 gaagattcct ggattgattg tgaagatggc tgagtcggac aacgactcgg gaggggcgca 240 gaacgcggga aacagtggaa acttgagcga gttgtcgcct cgggaacagg accggtttct 300 ccccatagcg aacgtgagca ggatcatgaa gaaggccttg ccggcgaacg cgaagatctc 360 gaaggacgcg aaggagacgg tgcaggaatg cgtgtcggag ttcatcagct tcataacggg 420 tgaggcgtcg gacaagtgcc agagggagaa gcgcaagacc atcaacggcg acgatcttct 480 ctgggccatg acaaccctgg gattcgaaga gtacgtggag cctctgaaga tttacctcca 540 gcgcttccgc gagatggagg gagagaagac cgtggccgcc cgcgactctt ctaaggactc 600 ggcctccgcc tcctcctatc atcagggaca cgtgtacggc tcccctgcct accatcatca 660 agtgcctggg cccacttatc ctgcccctgg tagacccaga tgacgtgctc ctctattcgc 720 cactccctag actttttata ttatattatt taattaaact ctcttctcca ctcaaccttt 780 gcaaaaaaaa aaaaaaaaa 799 <210> 164 <211> 165 <212> PRT <213> Glycine max <400> 164. Met Ala Glu Ser Asp Asn Asp Ser Gly Gly Ala Gln Asn Ala Gly Asn
1 5 10 15 Ser Gly Asn Leu Ser Glu Leu Ser Pro Arg Glu Gln Asp Arg Phe Leu 20 25 30 Pro lie Ala Asn Val Ser Arg lie Met Lys Lys Ala Leu Pro Ala Asn 35 40 45 Ala Lys lie Ser Lys Asp Ala Lys Glu Thr Val Gln Glu Cys Val Ser 50 55 60 Glu Phe lie Ser Phe lie Thr Gly Glu Ala Ser Asp Lys Cys Gln Arg 65 70 75 80
Glu Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met Thr 85 90 95 Thr Leu Gly Phe Glu Glu Tyr Val Glu Pro Leu Lys lie Tyr Leu Gln 100 105 110 Arg Phe Arg Glu Met Glu Gly Glu Lys Thr Val Ala Ala Arg Asp Ser 115 120 125
112 Ser Lys Asp Ser Ala Ser Ala Ser Ser Tyr His Gln Gly His Val Tyr
130 135 . 140 Gly Ser Pro Ala Tyr His His Gln Val Pro Gly Pro Thr Tyr Pro Ala 145 150 155 160
Pro Gly Arg Pro Arg 165 <210> 165 <211> 644 ¿C212> ADN <213> Glyclne max <400> 165 gcacgagcag tttctggggc atctcaaaat caatggaaga tattggaggc agttcctcaa 60 acgacaacaa caacaatggt ggcatcatca aggaacagga ccggttgctg ccaatagcca 120 atgttggtcg gctcatgaag cggattcttc ctcagaacgc caaaatctcg aaggaggcga 180 aggagacgat gcaggaatgt gtgtcggagt tcataagctt cgtgacgagt gaggcttcgg 240 agaagtgcag gaaggagagg aggaagacag tgaatggtga tgacatttgt tgggccttgg 300 caacactagg ctttgataac tatgctgaac caatgagaag gtacttgcat agatatagag 360 aggttgaggt agatcataat aaggtcaatc ttcaagaaaa agggaatagt cctgaagaga 420 aagacgatga attatttaaa ttgagcaata gaggggttgg gctttgacca attattatgc 480 ttatagtaga caggaactcg ttaatccatt catactcatc actgattact gattagatga 540 attagtaatt ttaaggtttt tgtgaggatg agataatata tgtaataatt ttcttgtctt 600 aattggaatt tatcgagctt agaacaaaaa aaaaaaaaaa aaaa 644 <210> 166 <211> 152 <212> PRT <213> Glycine max <400> 166 Ser Phe Trp Gly lie Ser Lys Ser Met Glu Asp lie Gly Gly Ser Ser
1 5 10 15 Ser Asn Asp Asn Asn Asn Asn Gly Gly lie lie Lys Glu Gln Asp Arg 20 25 30 Leu Leu Pro lie Ala Asn Val Gly Arg Leu Met Lys Arg lie Leu Pro 35 40 45 Gln Asn Ala Lys lie Ser Lys Glu Ala Lys Glu Thr Met Gln Glu Cys 50 55 60 Val Ser Glu Phe lie Ser Phe Val Thr Ser Glu Ala Ser Glu Lys Cys 65 70 75 80
Arg Lys Glu Arg Arg Lys Thr Val Asn Gly Asp Asp lie Cys Trp Ala 85 90 95 Leu Ala Thr Leu Gly Phe Asp Asn Tyr Ala Glu Pro Met Arg Arg Tyr 100 105 110 Leu His Arg Tyr Arg Glu Val Glu Val Asp His Asn Lys Val Asn Leu 115 120 125
113 Gln Glu Lys Gly Asn Ser Pro Glu Glu Lys Asp Asp Glu Leu Phe Lys 130 135 . 140 Leu Ser Asn Arg Gly Val Gly Leu 145 150 <210> 167 <211> 879 <212> ADN <213> Glycine max <400> 167 gcacgagaag gaacgtgaaa gtaaaacgga cggtggcgat agaagcgtct ctcatctcca 60 tcgtctcctc actcctctct tctccagcgt tcattttttc tcgcgcccaa atacaaaatc 120 acatcacaac agggttccgg cgaccatgtc cgatgctccg gcgagtccat gcggcggcgg 180 cggcggaggc agccacgaga gcggcgagca cagtccccgc tccaatttcc gcgagcagga 240 ccgcttcctc cccatcgcca acatcagccg catcatgaag aaagcgcttc ctcccaacgg 300 gaaaatcgcc aaggacgcca aggaaaccgt gcaggaatgc gtctccgagt tcatcagctt 360 cgtcaccagc gaagcgagcg ataagtgtca gagagagaag aggaagacca tcaacggcga 420 cgatttgctt tgggctatga ccactttagg tttcgaggag tatattgatc cgctcaaggt 480 ttacctcgcc gcttacagag agattgaggg tgattcaaag ggttcggcca agggtggaga 540 tgcatctgct aagagagatg tttatcagag tcctaatggc caggttgctc atcaaggttc 600 tttctcacaa ggtgttaatt atacgaattc ttagccccag gctcaacata tgatagttcc 660 gatgcaaggc caagagtaga tattgatcct ctccttcagt gtttgacatg tgtgatctaa 720 atgccagtgg aacttttatg tcaatatgtg cccttggtat aatgaatgca ttttatgtta 780 tgtaaacact acatgcgggg atgttggttc ttgtgaccag atattattta ttaagactta 840 catttatctt tggaaaaaaa aaaaaaaaaa aaaaaaaaa 879 <210> 168 <211> 162 <212> PRT <213> Glycine max <400> 168 Met Ser Asp Ala Pro Ala Ser Pro Cys Gly Gly Gly Gly Gly Gly Ser
1 5 10 15 His Glu Ser Gly Glu His Ser Pro Arg Ser Asn Phe Arg Glu Gln Asp 20 25 30 Arg Phe Leu Pro lie Ala Asn lie Ser Arg lie Met Lys Lys Ala Leu 35 40 45 Pro Pro Asn Gly Lys lie Ala Lys Asp Ala Lys Glu Thr Val Gln Glu 50 55 60 Cys Val Ser Glu Phe lie Ser Phe Val Thr Ser Glu Ala Ser Asp Lys 65 70 75 80
Cys Gln Arg Glu Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu Trp 85 90 95 Ala Met Thr Thr Leu Gly Phe Glu Glu Tyr lie Asp Pro Leu Lys Val 100 105 110 Tyr Leu Ala Ala Tyr Arg Glu lie Glu Gly Asp Ser Lys Gly Ser Ala 115 120 125
114 Lys Gly Gly Asp Ala Ser Ala Lys Arg Asp Val Tyr Gln Ser Pro Asn
130 135 . 140 Gly Gln Val Ala His Gln Gly Ser Phe Ser Gln Gly Val Asn Tyr Thr
145 150 ' 155 160
Asn Ser <210> 169 <211> 771 <212> ADN <213> Glycine max <400> 169 gcacgagagt ctttagaaaa gatatccatg gctgagtccg acaacgagtc aggaggtcac 60 acggggaacg cgagcgggag caacgagttg tccggttgca gggagcaaga caggttcctc 120 ccaatagcaa acgtgagcag gatcatgaag aaggcgttgc cggcgaacgc gaagatatcg 180 aaggaggcga aggagacggt gcaggagtgc gtgtcggagt tcatcagctt cataacagga 240 gaggcttccg ataagtgcca gaaggagaag aggaagacga tcaacggcga cgatcttctc 300 tgggccatga ctaccctggg cttcgaggac tacgtggatc ctctcaagat ttacctgcac 360 aagtataggg agatggaggg ggagaaaacc gctatgatgg gaaggccaca tgagagggat 420 gagggttatg gccatggcca tggtcatgca actcctatga tgacgatgat gatggggcat 480 cagccccagc accagcacca gcaccagcac cagcaccagc accagggaca cgtgtatgga 540 tctggatcag catcttctgc aagaactaga tagcatgtgt catctgttta agcttaattg 600 attttattat gaggatgata tgatataaga tttatattcg tatatgtttg gttttagaaa 660 tacaccagct ccagcttgta attgcttgaa acttccttgt tgagagaata tagacattat 720 tgtggatggt gatgtggcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 771 <210> 170 <211> 181 <212> PRT <213> Glycine max <400> 170 Met Ala Glu Ser Asp Asn Glu Ser Gly Gly His Thr Gly Asn Ala Ser
1 5 10 15 Gly Ser Asn Glu Leu Ser Gly Cys Arg Glu Gln Asp Arg Phe Leu Pro 20 25 30 lie Ala Asn Val Ser Arg lie Met Lys Lys Ala Leu Pro Ala Asn Ala 35 40 45 Lys lie Ser Lys Glu Ala Lys Glu Thr Val Gln Glu Cys Val Ser Glu
50 55 60 Phe lie Ser Phe lie Thr Gly Glu Ala Ser Asp Lys Cys Gln Lys Glu 65 70 75 80
Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met Thr Thr 85 90 95 Leu Gly Phe Glu Asp Tyr Val Asp Pro Leu Lys lie Tyr Leu His Lys 100 105 110 Tyr Arg Glu Met Glu Gly Glu Lys Thr Ala Met Met Gly Arg Pro His 115 120 125
115 Ser Gly Ser Pro Arg Gly Gly Gly Gly Gly Gly Ser Val Arg Glu Gln
20 25 30 sp Arg Phe Leu Pro lie Ala Asn lie Ser Arg lie Met Lys Lys Ala
35 40 45 ' lie Pro Ala Asn Gly Lys lie Ala Lys Asp Ala Lys Glu Thr Val Gln
50 55 60 Glu Cys Val Ser Glu Phe lie Ser Phe lie Thr Ser Glu Ala Ser Asp 65 70 * 75 80
Lys Cys Gln Arg Glu Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu 85 90 95
Trp Ala Met Ala Thr Leu Gly Phe Glu Asp Tyr lie Glu Pro Leu Lys
100 105 110
Val Tyr Leu Gln Lys Tyr Arg Glu Met Glu Gly Asp Ser Lys Leu Thr
115 120 · 125 Ala Lys Ser Ser Asp Gly Ser lie Lys Lys Asp Ala Leu Gly His Val
130 135 ' 140 Gly Ala Ser Ser Ser Ala Ala Glu Gly Met Gly Gln Gln Gly Ala Tyr 145 150 155 160
Asn Gln Gly Met Gly Tyr Met Gln Pro Gln Tyr His Asn Gly Asp lie 165 170 175
Ser Asn <210> 198 <211> 228 <212> PRT <213> Arabidopsis thaliana <220> <221> caracteristica_misc <222> <223> gi 6729485 <400> 198 Met Ala Glu Ser Gln Thr Gly Gly Gly Gly Gly Gly Ser His Glu Ser
1 5 10 15
Gly Gly Asp Gln Ser Pro Arg Ser Leu Asn Val Arg Glu Gln Asp Arg
20 25 30 Phe Leu Pro lie Ala Asn lie Ser Arg lie Met Lys Arg Gly Leu Pro
35 40 45 Leu Asn Gly Lys lie Ala Lys Asp Ala Lys Glu Thr Met Gln Glu Cys
50 55 60 Val Ser Glu Phe lie Ser Phe Val Thr Ser Glu Ala Ser Asp Lys Cys 65 70 75 80
116 Gln Arg Glu Lys Arg Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Ala 85 90 95
Met Ala Thr Leu Gly Phe Glu Asp Tyr lie Asp Pro Leu Lys Val Tyr
100 105 110 Leu Met Arg Tyr Arg Glu Met Glu Gly Asp Thr Lys Gly Ser Gly Lys
115 120 125 Giy Gly Glu Ser Ser Ala Lys Arg Asp Gly Gln Pro Ser Gln Val Ser
130 135 140 Gln Phe Ser Gln Val Pro Gln Gln Gly Ser Phe Ser Gln Gly Pro Tvr
145 150 155 160
Gly Asn Ser Gln Ser Leu Arg Phe Gly Asn Ser lie Glu Kis Leu Glu 165 170 175
Val. Leu Met Ser Ser Thr Arg Thr Leu Phe lie Thr lie Phe Arg Asp
180 185 - 190 Ser Thr Met Pro Val Val Ser Glu Asn Leu Ser Asp Pro Leu Ser lie
195 200 205 Asp Met Asp Cys Glu Ala lie Tyr His His Phe lie Gly Leu Leu lie
210 215 220 Leu Ser Cys Lys 225 <210> 199 <211> 161 <212> PRT <213> Arabidopsis thaliana <220> <221> caracteristica_misc <222> <223> gi 2244810 <400> 199 Met Ala Asp Ser Asp Asn Asp Ser' Gly Gly His Lye Asp Gly Gly Asn
1 5 10 15
Ala Ser Thr Arg Glu Gln Asp Arg Phe Leu Pro lie Ala Asn Val Ser
20 25 30 Arg lie Met Lys Lys Ala Leu Pro Ala Asn Ala Lys lie Ser Lys Asp
35 40 45 Ala Lys Glu Thr Val Gln Glu Cys Val Ser Glu Phe lie Ser Phe lie
50 55 60 Thr Gly Glu Ala Ser Asp Lys Cys Gln Arg Glu Lys Arg Lys Thr lie 65 70 75 80
Asn Gly Asp Asp Leu Leu Trp Ala Met Thr Thr Leu Gly Phe Glu Asp 85 90 95
117 Tyr Val Glu Pro Leu Lys Val Tyr Leu Gln Lys Tyr Arg Glu Val Glu
100 - 105 110
Gly Glu Lys Thr Thr Thr Ala Gly Arg Gln Gly Asp Lys Glu Gly Gly
115 120 125 Gly Gly Gly Gly Gly Ala Gly Ser Gly Ser Gly Gly Ala Pro Met Tyr
130 135 140 Gly Gly Gly Met Val Thr Thr Met Gly His Gln Phe Ser His His Phe 145 150 155 160
Ser <210> 200 <211> 187 <212> PRT <213> Arabidopsis thaliana <220> <221> caracteristica_misc <222> <223> gi 2398529 <400> 200 Arg Asp Arg Asp Ser Gly Gly Gly Gln Asn Gly Asn Asn Gln Asn Gly
1 5 10 15
Gln Ser Ser Leu Ser Pro Arg Glu Gln Asp Arg Phe Leu Pro lie Ala
20 25 30
Asn Val Ser Arg lie Met Lys Lys Ala Leu Pro Ala Asn Ala Lys lie
35 40 45 Ser Lys Asp Ala Lys Glu Thr Met Gln Glu Cys Val Ser Glu Phe lie
50 55 60 Ser Phe Val Thr Gly Glu Ala Ser Asp Lys Cys Gln Lys Glu Lys Arg 65 70 75 80
Lys Thr lie Asn Gly Asp Asp Leu Leu Trp Ala Met Thr Thr Leu Gly 85 90 95
Phe Glu Asp Tyr Val Glu Pro Leu Lys Val Tyr Leu Gln Arg Phe Arg
100 105 110
Glu lie Glu Gly Glu Arg Thr Gly Leu Gly Arg Pro Gln Thr Gly Gly
115 120 125 Glu Val Gly Glu His Gln Arg Asp Ala Val Gly Asp Gly Gly Gly Phe
130 135 140 Tyr Gly Gly Gly Gly Gly Met Gln Tyr His Gln His His Gln Phe Leu 145 150 155 160
His Gln Gln Asn His Met Tyr Gly Ala Thr Gly Gly Gly Ser Asp Ser 165 170 175
118 Gly Gly Gly Ala Ala Ser Gly Arg Thr Arg Thr 180 185 <210> 201 <211> 160 <212> PRT <213> Arabidopsis thaliana <220> <221> característica mise <222> <223> gi 3738293 <400> 201 Met Ala Gly Asn Tyr His Ser Phe Gln Asn Pro lie Pro Arg Tyr Gln 1 5 10 15 Asn Tyr Asn Phe Gly Ser Ser Ser Ser Asn His Gln His Glu His Asp 20 25 30 Gly Leu Val Val Val Val Glu Asp Gln Gln Gln Glu Glu Ser Met Met 35 40 45 Val Lys Glu Gln Asp Arg Leu Leu Ero lie Ala Asn Val Gly Arg lie
50 55 60 Met Lys Asn lie Leu Pro Ala Asn Ala Lys Val Ser Lys Glu Ala Lys 65 70 75 80
Glu Thr Met Gln Glu Cys Val Ser Glu Phe lie Ser Phe Val Thr Gly 85 90 95
Glu Ala Ser Asp Lys Cys His Lys Glu Lys Arg Lys Thr Val Asn Gly 100 105 110 Asp Asp lie Cys Trp Ala Met Ala Asn Leu Gly Phe Asp Asp Tyr Ala 115 120 125 Ala Gln Leu Lys Lys Tyr Leu His Arg Tyr Arg Val Leu Glu Gly Glu 130 135 140 Lys Pro Asn His His Gly Lys Gly Gly Pro Lys Ser Ser Pro Asp Asn 145 150 155 160
<210> 202 <211> 308 <212> PRT <213> Arabidopsis thaliana <220> <221> característica_misc <222> <223> gi 4587559 <400> 202 Met Gln Val Phe Gln Arg Lys Glu Asp Ser Ser Trp Gly Asn Ser Met
1 5 10 is
119 Pro Thr Thr Asn Ser Asn lie Gln Gly Ser Glu Ser Phe Ser Leu Thr
20 . 25 30 Lys Asp Met lie Met Ser Thr Thr Gln Leu Pro Ala Met Lys His Ser
35 40 45 Gly Leu Gln Leu Gln Asn Gln Asp Ser Thr Ser Ser Gln Ser Thr Glu
50 55 60 Glu Glu Ser Gly Gly Gly Glu Val Ala Ser Phe Gly Glu Tyr Lys Arg
65 70 75 80
Tyr Gly Cys Ser lie Val Asn Asn Asn Leu Ser- Gly Tyr lie Glu Asn 85 90 95
Leu Gly Lys Pro lie Glu Asn Tyr Thr Lys Ser lie Thr Thr Ser Ser
100 105 110 Met Val Ser Gln Asp Ser Val Phe Pro Ala Pro Thr Ser Gly Gln lie
115 120 125 Ser Trp Ser Leu Gln Cys Ala Glu Thr Ser His Phe Asn Gly Phe Leu
130 135 140 Ala Pro Glu Tyr Ala Ser Thr Pro Thr Ala Leu Pro His Leu Glu Met 145 150 155 160
Met Gly Leu Val Ser Ser Arg Val Pro Leu Pro His His lie Gln Glu 165 170 175
Asn Glu Pro lie Phe Val Asn Ala Lys Gln Tyr His Ala lie Leu Arg
180 185 190 Arg Arg Lys His Arg Ala Lys Leu Glu Ala Gln Asn Lys Leu lie Lys
195 ' 200 205 Cys Arg Lys Pro Tyr Leu His Glu Ser Arg His Leu His Ala Leu Lys
210 215 220 Arg Ala Arg Gly Ser Gly Gly Arg Phe Leu Asn Thr Lys Lys Leu Gln 225 230 235 240
Glu Ser Ser Asn Ser Leu Cys Ser Ser Gln Met Ala Asn Gly Gln Asn 245 250 255
Phe Ser Met Ser Pro His Gly Gly Gly Ser Gly lie Gly Ser Ser Ser
260 265 270 lie Ser Pro Ser Ser Asn Ser Asn Cys lie Asn Met Phe Gln Asn Pro
275 280 285 Gln Phe Arg Phe Ser Gly Tyr Pro Ser Thr His His Ala Ser Ala Leu 290 295 300 Met Ser Gly Thr 305 <210> 203 <211> 25
120 <212> ADN <213> construcción sintética <400> 203 acagtacagt acagtacagt acagt 35 <210> 204 <211> 25 <212> ADN <213> construcción sintética <400> 204 actgtactgt actgtacgtg actgt 35
<210> 205 <211> 765 <212> ADN <213> Oyza sativa <400> 205 atggaggccg gctacccggg cgcggcggcg aacggcgctg ccgccgacgg gaacggtggc 60 gcgcagcagg cggcggccgc gccggctata cgtgagcagg accggctgat gccgatcgcg 120 aacgtgatcc gcatcatgcg ccgcgtgctc ccggcgcacg ccaagatctc ggacgacgcc 180 aaggagacga tccaggagtg cgtgtcggag tacatcagct tcatcaccgg ggaggccaac 240 gagcggtgcc agcgcgagca gcgcaagacc atcaccgccg aggacgtgct ctgggccatg 300 agccgcctcg gcttcgacga ctacgtcgag cccctcggcg tctacctcca ccgctaccgc 360 gagttcgagg gggagtcccg cggcgtcggc gtcggcgtcg gcgccgcgcg cggcgaccac 420 caccatggtc acgtcggtgg gatgctcaag tcccgcgcgc agggctccat ggtgacgcac 480 cacgacatgc agatgcacgc ggccatgtac ggtggcggcg cggtgccgcc gccgccgcat 540 cctcctccgc accaccacgc gttccaccag ctcatgccgc cgcaccacgg ccagtacgcg 600 ccgccgtacg acatgtacgg cggcgagcac gggatggcgg cgtactacgg cgggatgtac 660 gcgcccggca gcggcggcga cgggagcggc agcagcggca gcggtggcgc cggcacgccg 720 cagaccgtca acttcgagca ccagcatccg ttcggataca agtag 765 <210> 206 <211> 254 <212> PRT <213> Oyza sativa <400> 206 Met Glu Ala Gly Tyr Pro Gly Ala Ala Ala Asn Gly Ala Ala Ala Asp 1 5 10 15 Gly Asn Gly Gly Ala Gln Gln Ala Ala Ala Ala Pro Ala lie Arg Glu 20 25 30 Gln Asp Arg Leu Met Pro lie Ala Asn Val lie Arg lie Met Arg Arg 35 40 45 Val Leu Pro Ala His Ala Lys lie Ser Asp Asp Ala Lys Glu Thr lie 50 55 60 Gln Glu Cys Val Ser Glu Tyr lie Ser Phe lie Thr Gly Glu Ala Asn 65 70 75 80
121 Glu Arg Cys Gln Arg Glu Gln Arg Lys Thr lie Thr Ala Glu Asp Val 85 90 95 leu Trp Ala Met Ser Arg Leu Gly Phe Asp Asp Tyr Val Glu Pro Leu 100 105 110 Gly Val Tyr Leu His Arg Tyr Arg Glu Phe Glu Gly Glu Ser Arg Gly 115 120 125 Val Gly Val Gly Val Gly Ala Ala Arg Gly Asp His His His Gly His
130 135 140 Val Gly Gly Met Leu Lys Ser Arg Ala Gln Gly Ser Met Val Thr His 145 150 155 160
His Asp Met Gln Met His Ala Ala Met Tyr Gly Gly Gly Ala Val Pro 165 170 175 Pro Pro Pro His Pro Pro Pro His His His Ala Phe His Gln Leu Met 180 185 190 Pro Pro His His Gly Gln Tyr Ala Pro Pro Tyr Asp Met Tyr Gly Gly 195 200 205 Glu His Gly Met Ala Ala Tyr Tyr Gly Gly Met Tyr Ala Pro Gly Ser
210 . 215 220 Gly Gly Asp Gly Ser Gly Ser Ser Gly Ser Gly Gly Ala Gly Thr Pro
225 230 235 240
Gln Thr Val Asn Phe Glu His Gln His Pro Phe Gly Tyr Lys 245 250 <210> 207 <211> 1499 <212> ADN <213> Catalpa speciosa <400> 207 gcacgaggtg ctctttaaaa ttcacaagta catctgacct ctacatcaac acacattgac 60 tctaaattct ctctctaaat tctgtcaacc cccaaattct agggttttgt tttaattgtc 120 atcagatttc gccttaacag gacacattgg ttgatttctt tggagaaatt aggggagcat 180 gcaatccaag tcccagagcg gcaaccaagg agaatccaac ctttataatg ttcctaactc 240 caaagtaaat ccggattctt ggtggaataa tactggatat aattcctttt cctcaacaat 300 gatgggtgga aatgcatcag attcatcatc cctagaacaa tctgtgga g gacagtcgca 360 gtctaaaggt ggtataaatg aggaagatga tgatactacc aaacgatcac caagtagtac 420 acctctgctg ccagatagaa actataggca ggagggtccg agtctccagc aagctccacc 480 taccatacat ccaagaaaca atgggatcgt taatcaggcc ccacagcttg agcttggtgg 540 gcattcagta gcttgtgggt caaatcctta tgatccatat tacggaggaa tgatggcagc 600 ttatggccag ccattggttc ctcctcattt atatgatatg catcatgcaa ggatggcact 660 gcccctggag atgactcaag agcctgtata tgtgaatgcc aagcagtacc atggcattct 720 gcggaggcgg cagtctcgtg ctaaagctga gcttgaaaag aagttaataa aagttcggaa 780 gccttatctc catgagtctc gacaccaaca tgccttaagg agggcaaggg ggactggagg 840 acgatttgca aagaagtccg atgcagatac ttccaagggg actggacccg gctcatccat 900 cccatcgcag cttattagct catcacgagg ttctgagcca gtgcctgagg ctcagaattt 960 gtacaacgct gatgatggca attttagaag gcaaaccaac ttgcaggaac cggcacttca 1020 gttgggcaag acaggtgaag ggcccacttc aagtcacaag tggggaaata caacctcgaa 1080 ccatgcactt gctatgcagt aaagtcatac ttattggaag gtacaaatgc tggttacttg 1140 tttaaatctt ggctttccca agctgagcgg caattcattc ttggctgttt ctattttatc 1200 tcgtggagga ggaaggatga gagtctttgt ttcttagctt ctcttaatgt ctattgttct 1260
122 tcccttgtgt acaaaatgtc ttttagcatt agaggcaaag tttgagttag gacaagacaa 1320 ccgaagtttg ggtagggaaa acttggttta taacttaaga ttcttgtaaa gttccgcaag 1380 gagtcgcatg catgtgtttg ctacttacat ttgttgcact ttcgaattgt gaacccaaaa 1440 gcatcaatgg tgtttgaata gaacttttaa aagccaaaaa aaaaaaaaaa aaaaaaaaa 1499 <210> 208 <211> 307 <212> PRT <213> Catalpa speciosa <400> 208 Met Gln Ser Lys Ser Gln Ser Gly Asn Gln Gly Glu Ser Asn Leu Tyr 1 5 10 15 Asn Val Pro Asn Ser Lys Val Asn Pro Asp Ser Trp Trp Asn Asn Thr 20 25 30 Gly Tyr Asn Ser Phe Ser Ser Thr Met Met Gly Gly Asn Ala Ser Asp 35 40 45 Ser Ser Ser Leu Glu Gln Ser Val Asp Gly Gln Ser Gln Ser Lys Gly
50 55 60 Gly lie Asn Glu Glu Asp Asp Asp Thr Thr Lys Arg Ser Pro Ser Ser 65 70 75 80 Thr Pro Leu Leu Pro Asp Arg Asn Tyr Arg Gln Glu Gly Pro Ser Leu 85 90 95 Gln Gln Ala Pro Pro Thr lie His Pro Arg Asn Asn Gly lie Val Asn 100 105 110 Gln Ala Pro Gln Leu Glu Leu Gly Gly His Ser Val Ala Cys Gly Ser 115 120 125 Asn Pro Tyr Asp Pro Tyr Tyr Gly Gly Met Met Ala Ala Tyr Gly Gln
130 ' 135 140 Pro Leu Val Pro Pro His Leu Tyr Asp Met His His Ala Arg Met Ala 145 150 155 160
Leu Pro Leu Glu Met Thr Gln Glu Pro Val Tyr Val Asn Ala Lys Gln 165 170 175 Tyr His Gly lie Leu Arg Arg Arg Gln Ser Arg Ala Lys Ala Glu Leu. 180 185 190 Glu Lys Lys Leu lie Lys Val Arg Lys Pro Tyr Leu His Glu Ser Arg 195 200 205 His Gln His Ala Leu Arg Arg Ala Arg Gly Thr Gly Gly Arg Phe Ala
210 215 220 Lys Lys Ser Asp Ala Asp Thr Ser Lys Gly Thr Gly Pro Gly Ser Ser 225 230 235 240 lie Pro Ser Gln Leu lie Ser Ser Ser Arg Gly Ser Glu Pro Val Pro 245 250 255
123 Glu Ala Gln Asn Leu Tyr Asn Ala Asp Asp Gly Asn Phe Arg Arg Gln 260 . 265 270 Thr Asn leu Gln Glu Pro Ala Leu Gln Leu Gly Lys Thr Gly Glu Gly 275 280 285 Pro Thr Ser Ser His Lys Trp Gly Asn Thr Thr Ser Asn His Ala Leu
290 295 300 Ala et Gln 305 <210> 209 <211> 1626 <212> ADN <213> Zea mays <400> 209 ccacgcgtcc gcgatcagcg tcagttacca cgacgaccga-- tcttgctcgc cagcgagagc 60 gacccctccc ctccctactt cccatgctga tctcggcgcg cttctcttcc tcctccccca 120 gagccgggca ctgatttccc ttggctgctg ctgctggatt ctttggtgtt ccatcaggcc 180 aaggatcccg caaagagctc cggagccaag cctgctgcag ccgtcgcgtc gggtgaggca 240 ggcttcagct tcagtctcct actcgacgag gcaagcggat cggagcgggc ctccgctccg 300 ccatgatgag cttcaagggc cacgaggggt ttggccaggt ggccgccgcc ggtgccggga 360 gccaggctgc ctcccatggt ggagcaggcc cgctgccatg gtgggcgggg ccccagctgc 420 tgttcggcga gccggcgccc ccgtcaccgg aggagacgcg ccgggacgcc cagttccagg 480 tcgtgccggg ggttcagggc acgccggatc cagcgccgcc caagacaggg acacctgagg 540 tcctcaaatt ctctgtcttt caagggaatt tggagtcggg tggtaaagga gagaaaaccc 600 caaagaactc taccactatt gctcttcagt caccgttccc agaatacaat ggccgtttcg 660 agattggtct tggtcaatct atgctggccc cttccaatta tccttgtgct gaccagtgct 720 atggcatgct tgcggcttat ggaatgagat cgatgtctgg tgggagaatg ctgttgccac 780 taaatgcgac agctgatgca cccatctatg tgaatccgaa gcagtacgaa ggcatcctcc 840 gccgtcgccg tgctcgcgcc aaggcggaga gcgagaacag gctcgccaaa ggcagaaagc 900 cctatctcca cgagtcgcgc cacctccacg cgatgcgtcg ggtaagaggc accggcgggc 960 gcttcgtcaa cacgaagaaa gaagggcgtg gcacgggcgt tgcttcgaac gggggcagca 1020 agacggctgc agcggcaccg tcgcgcctcg ccatgccccc tagcttccag agtagcgtcg 1080 ccagcctgtc tggctccgac gtgtcaaaca tgtacagcgg cggcttggag cagcaccttc 1140 gggcgccgca cttcttcacc ccgctgccac ccatcatgga ggacggcgac cacggtggtc 1200 cccccacccg catctcctcc tccttcaagt gggcagccag cgacggctgc tgcgagctcc 1260 tcaaggcgtg aaccgacgag gaggagggga tggctactca gacgaacggc cttctcgccg 1320 atggctggtc gtctgtaggc aaatcattct tggctgttcc gcattggggt gcaacctcat 1380 ccacatcatc tacctaccca gtaggccagt accccctgtt ccctgaacag tgcttgggtt 1440 acaggggtcc tcctgtgtgt gtgatgatgt ggtgtgcctc ccccacatgc atttgctgta 1500 acataatagt gtacccaaac cactgcttcg gactatcatt gtctgtctcg gtatggattc 1560 tctgttgtca cagtgtctga ataattgagg cgtcagactt caaagttaaa aaaaaaaaaa 1620 aaaaaa 1626 <210> 210 <211> 322 <212> PRT <213> Zea mays <400> 210 Met Met Ser Phe Lys Gly His Glu Gly Phe Gly Gln Val Ala Ala Ala
1 5 10 15 Gly Ala Gly Ser Gln Ala Ala Ser His Gly Gly Ala Gly Pro Leu Pro 20 25 30
124 Trp Trp Ala Gly Pro Gln leu Leu Phe Gly Glu Pro Ala Pro Pro Ser
35 0 45 Pro Glu Glu Thr Arg Arg Asp Ala Gln Phe Gln Val Val Pro Gly Val 50 55 60 Gln Gly Thr Pro Asp Pro Ala Pro Pro Lys Thr Gly Thr Pro Glu Val 65 70 75 80
Leu Lys Phe Ser Val Phe Gln Gly Asn Leu Glu Ser Gly Gly Lys Gly 85 90 95
Glu Lys Thr Pro Lys Asn Ser Thr Thr lie Ala Leu Gln Ser Pro Phe 100 105 110 Pro Glu Tyr Asn Gly Arg Phe Glu lie Gly Leu Gly Gln Ser Met Leu 115 120 125 Ala Pro Ser Asn Tyr Pro Cys Ala Asp Gln Cys Tyr Gly Met Leu Ala 130 135 140 Ala Tyr Gly Met Arg Ser Met Ser Gly Gly Arg Met Leu Leu Pro Leu 145 150 155 160
Asn Ala Thr Ala Asp Ala Pro lie Tyr Val Asn Pro Lys Gln Tyr Glu 165 170 175
Gly lie Leu Arg Arg Arg Arg Ala Arg Ala Lys Ala Glu Ser Glu Asn 180 185 190 Arg Leu Ala Lys Gly Arg Lys Pro Tyr Leu His Glu Ser Arg His Leu 195 200 205 His Ala Met Arg Arg Val Arg Gly Thr Gly Gly Arg Phe Val Asn Thr 210 215 220 Lys Lys Glu Gly Arg Gly Thr Gly Val Ala Ser Asn Gly Gly Ser Lys 225 230 235 240
Thr Ala Ala Ala Ala Pro Ser Arg Leu Ala Met Pro Pro Ser Phe Gln 245 250 255
Ser Ser Val Ala Ser Leu Ser Gly Ser Asp Val Ser Asn Met Tyr Ser 260 265 270 Gly Gly Leu Glu Gln His Leu Arg Ala Pro His Phe Phe Thr Pro Leu 275 280 285 Pro Pro lie Met Glu Asp Gly Asp His Gly Gly Pro Pro Thr Arg lie 290 295 300 Ser Ser Ser Phe Lys Trp Ala Ala Ser Asp Gly Cys Cys Glu Leu Leu 305 310 315 320
Lys Ala
125 <210> 211 <211> 1569 <212> ADN <213> Oyza sativa <400> 211 gcacgaggcg atctttcccc agagagagag agagagagag agagagtctt gattggggga 60 ggagagaggg agagagagaa agagagagga cagaaaatgt ttgtggatct tgagtaatgc 120 cttctaataa tgataatgct gttgcaagaa atggagaatc atcctgtcca atgcatggcc 180 aagaccaact atgattttct tgccaggaat aactatccaa tgaaacagtt agticagagg 240 aactctgatg gtgactcgtc accaacaaag tctggggagt ctcaccaaga agcatctgca 300 gtaagtgaca gcagtctcaa cggacaacac acctcaccac aatcagtgct tgtcccctca 360 gatattaaca acaatgatag ttgtggggag cgggaccatg gcactaagtc ggtattgtct 420 ttggggaaca cagaagctgc ctttcctcct tcaaagttcg attacaacca gccttttgca 480 tgtgtttctt atccatatgg tactgatcca tattatggtg gagtattaac aggatacact 540 tcacatgcat ttgttcatcc tcaaattact ggtgctgcaa actctaggat gccattgcct 600 gttgatcctt ctgtagaaga gcccatattt gtcaatgcaa agcaatacaa tgcgatcctt 660 agaagaaggc aaacgcgtgc aaaattggag gcccaaaata aggcggtgaa aggtcggaag 720 ccttacctcc atgaatctcg acatcatcat gctatgaagc gagcccgtgg atcaggtggt 780 cggttcctta ccaaaaagga gctgctggaa cagcagcago agcagcagca gcagaagcca 840 ccaccggcat cagctcagtc tccaacaggt agagccagaa cgagcggcgg tgccgttgtc 900 cttggcaaga acctgtgccc agagaacagc acatcctgct cgccatcgac accgacaggc 960 tccgagatct ccagcatctc atttgggggc ggcatgctgg ctcaccaaga gcacatcagc 1020 ttcgcatccg ctgatcgcca ccccacaatg aaccagaacc accgtgtccc cgtcatgagg 1080 tgaaaacctc gggatcgcgg gacacgggcg gttctggttt accctcactg gcgcactccg 1140 gtgtgcccgt ggcaattcat ccttggctta tgaagtatct acctgataat agtctgctgt 1200 cagtttatat gcaatgcaac ctctgtcaga taaactctta tagtttgttt tattgtaagc 1260 tatgactgaa cgaactgtcg agcagatggc taatttgtat gttgtgggta cagaaatcct 1320 gaagcttttg atgtacctaa ttgccttttg cttatactct tggtgtatac ccattaccaa 1380 gttgccttaa aaaccctcca attatgtaat cagtcatggt tttatagaac cttgccacat 1440 gtaatcaatc acctgttttt gtaaattgat ctataaacgc taaaaaaaaa aaaaaaaaaa 1500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1560 aaaaaaaaa 1569 <210> 212 <211> 317 <212> PRT <213> Oyza sativa <400> 212 Met lie Met Leu leu Gln Glu et Glu Asn His Pro Val Gln Cys Met
1 5 10 15 Ala Lys Thr Asn Tyr Asp P e Leu Ala Arg Asn Asn Tyr Pro Met Lys 20 25 30 Gln Leu Val Gln Arg Asn Ser Asp Gly Asp Ser Ser Pro Thr Lys Ser 35 40 45 Gly Glu Ser His Gln Glu Ala Ser Ala Val Ser Asp Ser Ser Leu Asn 50 55 60 Gly Gln His Thr Ser Pro Gln Ser Val Phe Val Pro Ser Asp Xle Asn 65 70 75 80 Asn Asn Asp Ser Cys Gly Glu Arg Asp His Gly Thr Lys Ser Val Leu 85 90 95
126 Ser Leu Gly Asn Thr Glu Ala Ala Phe Pro Pro Ser Lys Phe Asp Tyr 100 . 105 110 Asn Gln Pro Phe Ala Cys Val Ser Tyr Pro Tyr Gly Thr Asp Pro Tyr 115 120 125 Tyr Gly Gly Val Leu Thr Gly Tyr Thr Ser His Ala Phe Val His Pro
130 135 140 Gln lie Thr Gly Ala Ala Asn Ser Arg Met Pro Leu Pro Val Asp Pro 145 150 155 160
Ser Val Glu Glu Pro lie Phe Val Asn Ala Lys Gln Tyr Asn Ala lie 165 170 175 Leu Arg Arg Arg Gln Thr Arg Ala Lys Leu Glu Ala Gln Asn Lys Ala 180 185 190 Val Lys Gly Arg Lys Pro Tyr Leu His Glu Ser Arg His His His Ala 195 200 205 Met Lys Arg Ala Arg Gly Ser Gly Gly Arg Phe Leu Thr Lys Lys Glu
210 215 220 Leu Leu Glu Gln Gln Gln Gln Gln Gln Gln Gln Lys Pro Pro Pro Ala 225 230 235 240
Ser Ala Gln Ser Pro Thr Gly Arg Ala Arg Thr Ser Gly Gly Ala Val 245 250 255 Val Leu Gly Lys Asn Leu Cys Pro Glu Asn Ser Thr Ser Cys Ser Pro 260 265 270 Ser Thr Pro Thr Gly Ser Glu lie Ser Ser lie Ser Phe Gly Gly Gly 275 280 285 Met Leu Ala His Gln Glu His lie Ser Phe Ala Ser Ala Asp Arg His
290 295 300 Pro Thr Met Asn Gln Asn His Arg Val Pro Val Met Arg 305 310 315 <210> 213 <211> 1375 <212> ADN <213> Glycine max <400> 213 gcacgaggag gttgcagact tagaaagaga gagagagaga gaatgggtct catctcaatg 60 caatttaggt tctgaaaacc aaagcttttc ataggaaaag ttgtgctaag atgccaggga 120 aacctgacac tgatgattgg cgtgtagagc gtggggagca gattcagttt cagtcttcca 180 tttactctca tcatcagcct tggtggcgcg gagtggggga aaatgcctcc aaatcatctt 240 cagatgatca gttaaatggt tcaatcgtga atggtatcac gcggtctgag accaatgata 300 agtcaggcgg aggtgttgcc aaagaatacc aaaacatcaa acatgccatg ttgtcaaccc 360 catttaccat ggagaaacat ettgctccaa atccccagat ggaacttgtt ggtcattcag 420 ttgttttaac atctccttat tcagatgcac agtatggtca aatcttgact acttacgggc 480 aacaagttat gataaatcct cagttgtatg gaatgcatca tgctagaatg cctttgccac 540 ttgaaatgga agaggagcct gtttatgtca atgcgaagca gtatcatggt attttgaggc 600 gaagacagtc acgtgctaag gctgagattg aaaagaaagt aatcaaaaac aggaagccat 660
127 acctccatga atcccgtcac cttcatgcaa tgagaagggc aagaggcaac ggtggtcgct 720 ttctcaacac aaagaagctt gaaaataaca attctaattc cacttcagac aaaggcaaca 780 atactcgtgc aaacgcctca acaaactcgc ctaacactca acttttgttc accaacaatt 840 tgaatctagg ctcatcaaat gtttcacaag ccacagttca gcacatgcac acagagcaga 900 gtttcactat aggttaccat aatggaaatg gtcttacagc actataccgt tcacaagcaa 960 atgggaaaaa ggagggaaac tgctttggta aagagaggga ccctaatggg gatttcaaat 1020 aacacttccc tcagccatac agcaagagtg aagatgaagg gctttatctc atccaacttg 1080 tgatgctgta tagaaggcaa ttcattcttg gcttagttaa gtggtgagac cagtgacatg 1140 gtgtacacta tggccttgtt tggtctctcc cttgcttttg tttctctcta caagtccata 1200 tgtaaaatgg ataacagaaa gaaaaagaaa aatcactttg gtttgagaac tttttaaagt 1260 ttatattaac tgtgttaagg ttcataaaac tgtagactga tttgtgtgac atgctccaca 1320 gaaccttaaa ttttcctcta ttttgtccta aaaaaaaaaa aaaaaaaaaa aaaaa 1375 <210> 214 <211> 303 <212> PRT <213> Glycine max <400> 214 Met Pro Gly Lys Pro Asp Thr Asp Asp Trp Arg Val Glu Arg Gly Glu
1 5 10 15 Gln lie Gln P e Gln Ser Ser lie Tyr Ser His His Gln Pro Trp Trp 20 25 30 Arg Gly Val Gly Glu Asn Ala Ser Lys Ser Ser ser Asp Asp Gln Leu 35 40 45 Asn Gly Ser lie Val Asn Gly lie Thr Arg Ser Glu Thr Asn Asp Lys 50 55 60 Ser Gly Gly Gly Val Ala Lys Glu Tyr Gln Asn lie Lys His Ala Met 65 70 75 80 Leu Ser Thr Pro Phe Thr Met Glu Lys His Leu Ala Pro Asn Pro Gln 85 90 95 Met Glu Leu Val Gly His Ser Val Val Leu Thr Ser Pro Tyr Ser Asp 100 105 110 Ala Gln Tyr Gly Gln lie Leu Thr Thr Tyr Gly Gln Gln Val Met lie 115 120 125 Asn Pro Gln Leu Tyr Gly Met His His Ala Arg Met Pro Leu Pro Leu
130 135 140 Glu Met Glu Glu Glu Pro Val Tyr Val Asn Ala Lys Gln Tyr His Gly 145 150 155 160 lie Leu Arg Arg Arg Gln Ser Arg Ala Lys Ala Glu lie Glu Lys Lys 165 170 175 Val lie Lys Asn Arg Lys Pro Tyr Leu His Glu Ser Arg His Leu His 180 185 190 Ala Met Arg Arg Ala Arg Gly Asn Gly Gly Arg Phe Leu Asn Thr Lys 195 200 205
128 Lys leu Glu Asn Asn Asn Ser Asn Ser Thr Ser Asp Lys Gly Asn Asn
210 215 . 220 Thr Arg Ala Asn Ala Ser Thr Asn Ser Pro Asn Thr Gln leu leu Phe
225 230 235 240
Thr Asn Asn leu Asn leu Gly Ser Ser Asn Val Ser Gln Ala Thr Val 245 250 255 Gln His Met His Thr Glu Gln Ser Phe Thr lie Gly Tyr His Asn Gly 260 265 270 Asn Gly leu Thr Ala leu Tyr Arg Ser Gln Ala Asn Gly lys lys Glu 275 280 285 Gly Asn Cys Phe Gly lys Glu Arg Asp Pro Asn Gly Asp Phe lys 290 295 300 <210> 215 <211> 1192 <212> ADN <213> Triticum aestivum <400> 215 gcacgaggga gtgacgcggt cgaggagggg cgtgcggggg gcagacagag agggagcgca 60 aagggacggc ggaggcaagc tagcttcccg ggggcggacg caccgagaga gggcggcggg 120 agggaggagg cgcgtgggag ccatgcttct cccctcttct tcgtcttcct cctacgatcc 180 caaaggtgac tcctttggga aatcggttga cgatcatatg aggtcaactt tgacttttgg 240 tgataagcat tctgtatttg caagtcaaaa cactgactat ggccacccaa tggcttgcat 300 ttcataccca ttcaatgatt ctggttctgt ttgggcggcc tatgggtcac gggctatgtt 360 ccagcccctc atggcggaag gaggggcatc tgcgaccgca agagttccat tgcctgtcga 420 attagcagcg gatgagccca tatttgtcaa tcccaaacaa tataatggga ttctccggcg 480 aaggcagctg cgcgccaagt tagaggccca gaataaactc acaaaaaaca gaaagcccta 540 cctccacgag tctcgccatc ttcacgcgat gaagcgggca agaggttccg ggggacgttt 600 cctcaattcc aaacagctga agcagcagca gcagcagtct ggcagtgcat gcacgaaggc 660 cattgcggat ggcgcgaatt ccttgggttc aacccatcta cggctaggca gcggcgcagc 720 cggagaccga agcaactcgg cgtccaaggc gatgtcctcc caagagaaca gcaagagagt 780 cgccgccccg gctcccgcct tcaccatgat tcaagcggcg cgcaaagacg acgacttctt 840 ccaccatcac ggccaccatc tcagcttctc cgaccacttc ggccagtcga gcgaccggta 900 tacgtaacaa ggggtcctct gtgccccggt gtggtctggc aactcatcct tggctttatt 960 tctggcgtgt tagggtttca gagatagtgt atctcatagt actactgttg tactgctttg 1020 cacccacata gttctctgct tgatgttcgg catgcaaatg ttggtgtact ggtgcgttgg 1080 gacaaaagtt tgatgtgttt acatgacaat tggtcgcgga actcatcttg tgttctgctc 1140 gactctaatg tgtgtgctca catgtgaatt ccgtaaaaaa aaaaaaaaaa aa 1192 <210> 216 <211> 254 <212> PRT <213> Triticum aestivum <400> 216 Met Leu Leu Pro Ser Ser Ser Ser Ser Ser Tyr Asp Pro Lys Gly Asp 1 5 10 15 Ser Phe Gly Lys Ser Val Asp Asp His Met Arg Ser Thr Leu Thr Phe 20 25 30
129 Gly Asp Lys His Ser Val Phe Ala Ser Gln Asn Thr Asp Tyr Gly His
35 40 45 Pro Met Ala Cys lie Ser Tyr Pro Phe Asn Asp Ser Gly Ser Val Trp
50 55 60 Ala Ala Tyr Gly Ser Arg Ala Met Phe Gln Pro Leu Met Ala Glu Gly 65 70 75 80
Gly Ala Ser Ala Thr Ala Arg Val Pro Leu Pro Val Glu Leu Ala Ala 85 90 95
Asp Glu Pro lie Phe Val Asn Pro Lys Gln Tyr Asn Gly lie Leu Arg
100 105 110 Arg Arg Gln Leu Arg Ala Lys Leu Glu Ala Gln Asn Lys Leu Thr Lys
115 120 125 Asn Arg Lys Pro Tyr Leu His Glu Ser Arg His Leu His Ala Met Lys
130 135 - 140 Arg Ala Arg Gly Ser Gly Gly Arg Phe Leu Asn Ser Lys Gln Leu Lys 145 150 155 160
Gln Gln Gln Gln Gln Ser Gly Ser Ala Cys Thr Lys Ala lie Ala Asp 165 170 175
Gly Ala Asn Ser Leu Gly Ser Thr His Leu Arg Leu Gly Ser Gly Ala
180 185 190 Ala Gly Asp Arg Ser Asn Ser Ala Ser Lys Ala Met Ser Ser Gln Glu
195 200 205 Asn Ser Lys Arg Val Ala Ala Pro Ala Pro Ala Phe Thr Met lie Gln
210 215 220 Ala Ala Arg Lys Asp Asp Asp Phe Phe His His His Gly His His Leu 225 230 235 240
Ser Phe Ser Asp His Phe Gly Gln Ser Ser Asp Arg Tyr Thr 245 250 <210> 217 <211> 298 <212> PRT <213> Arabidopsis thaliana <220> <221> caracteristica_misc <222> <223> gi 9293997 <400> 217 Met His Ser Lys Ser Asp Ser Gly Gly Asn Lys Val Asp Ser Glu Val 1 5 10 15
His Gly Thr Val Ser Ser Ser lie Asn Ser Leu Asn Pro Trp His Arg 20 25 30
130 Ala Ala Ala Ala Cys Asn Ala Asn Ser Ser Val Glu Ala Gly Asp Lys
35 40 45 Ser Ser Lys Ser lie Ala Leu Ala Leu Glu Ser Asn Gly Ser Lys Ser
50 55 60 Pro Ser Asn Arg Asp Asn Thr Val Asn Lys Glu Ser Gln Val Thr Thr
65 70 75 80
Ser Pro Gln Ser Ala Gly Asp Tyr Ser Asp Lys Asn Gln Glu Ser Leu 85 90 95
His His Gly lie Thr Gln Pro Pro Pro His Pro Gln Leu Val Gly His
100 105 110 Thr Val Gly Trp Ala Ser Ser Asn Pro Tyr Gln Asp Pro Tyr Tyr Ala
115 120 125 Gly Val Met Gly Ala Tyr Gly His His Pro Leu Gly Phe Val Pro Tyr
130 135 140 Gly Gly Met Pro His Ser Arg Met Pro Leu Pro Pro Glu Met Ala Gln
145 150 155 160
Glu Pro Val Phe Val Asn Ala Lys Gln Tyr Gln Ala lie Leu Arg Arg 165 170 175
Arg Gln Ala Arg Ala Lys Ala Glu Leu Glu Lys Lys Leu lie Lys Ser
180 185 190 Arg Lys Pro Tyr Leu His Glu Ser Arg His Gln His Ala Met Arg Arg
195 200 205 Pro Arg Gly Thr Gly Gly Arg Phe Ala Lys Lys Thr Asn Thr Glu Ala
210 215 220 Ser Lys Arg Lys Ala Glu Glu Lys Ser Asn Gly His Val Thr Gln Ser
225 230 235 240
Pro Ser Ser Ser Asn Ser Asp Gln Gly Glu Ala Trp Asn Gly Asp Tyr 245 250 255
Arg Thr Pro Gln Gly Asp Glu Met Gln Ser Ser Ala Tyr Lys Arg Arg
260 265 270 Glu Glu Gly Glu Cys Ser Gly Gln Gln Trp Asn Ser Leu Ser Ser Asn
275 280 285 His Pro Ser Gln Ala Arg Leu Ala lie Lys 290 295 <210> 218 <211> 238 <212> PRT <213> Oyza sativa
131 <220> <221> caracteristica_misc <222> <223> gi 7489565 <400> 218 Met Leu Pro Pro His Leu Thr Glu Asn Gly Thr Val Met lie Gln Phe
1 5 10 15
Gly His Lys Met Pro Asp Tyr Glu Ser Ser Ala Thr Gln Ser Thr Ser
20 25 30 Gly Ser Pro Arg Glu Val Ser Gly Met Ser Glu Gly Ser Leu Asn Glu
35 40 45 Gln Asn Asp Gln Ser Gly Asn Leu Asp Gly Tyr Thr Lys Ser Asp Glu
50 ' 55 60 Gly Lys Met Met Ser Ala Leu Ser Leu Gly Lys Ser Glu Thr Val Tyr
65 70 75 80
Ala His Ser Glu Pro Asp Arg Se Gln Pro he Gly lie Ser Tyr Pro 85 90 95
Tyr Ala Asp Ser Phe Tyr Gly Gly Ala Val Ala Thr Tyr Gly Thr His
100 105 110 Ala lie Met His Pro Gln lie Val Gly Val Met Ser Ser Ser Arg Val
115 120 125 Pro Leu Pro lie Glu Pro Ala Thr Glu Glu Pro lie Tyr Val Asn Ala
130 135 140 Lys Gln Tyr His Ala lie Leu Arg Arg Arg Gln Leu Arg Ala Lys Leu
145 150 155 160
Glu Ala Glu Asn Lys Leu Val Lys Asn Arg Lys Pro Tyr Leu His Glu 165 170 175
Ser Arg His Gln His Ala Met Lys Arg Ala Arg Gly Thr Gly Gly Arg
180 185 190 Phe Leu Asn Thr Lys Gln Gln Pro Glu Ala Ser Asp Gly Gly Thr Pro
195 200 205 Arg Leu Val Ser Ala Asn Gly Val Val Phe Ser Lys His Glu His Ser
210 215 220 Leu Ser Ser Ser Asp Leu His His Arg Ala Lys Glu Gly Ala 225 230 235 <210> 219 <211> 215 <212> PRT <213> Vitis riparia
132 <220> <221> caracteristica_misc <222> <223> gi 7141243 <400> 219 Met Met Pro Met Thr Met Ala Glu Tyr His Leu Ala Pro Pro Ser Gln
1 5 10 15 Leu Glu Leu Val Gly His Ser lie Val Gln Ser Gln Phe Leu Gly Val 20 25 30 Asn Val Ala Arg Met Ala Leu Pro lie' Glü Met Ala Glu Glu Pro Val 35 40 45 Tyr Val Asn Ala Lys Gln Tyr His Gly lie Leu Arg Arg Arg Gln Ser
50 55 60 Arg Ala Lys Ala Glu Leu Glu Lys Lys Leu lie Lys Val Arg Lys Pro
65 70 75 80
Tyr Leu His Glu Ser Arg His Gln His Ala Met Arg Arg Ala Arg Gly 85 90 95 Cys Gly Gly Arg Phe Leu Asn Thr Lys Lys Leu Asp Ser Asn Ala Ser 100 105 110 Tyr Asp Met Pro Asp Lys Gly Ser Asp Pro Asp Val Asn Leu Ser Thr 115 120 125 Arg Pro lie Ser Ser Ser Val Ser Glu Ser Leu Pro Phe Asn Ser Ser
130 135 140 Arg Asn Glu Asp Ser Pro Thr Ser His Leu Asp Ala Arg Gly Pro Ser
145 150 155 160
Val Gln Glu Leu His Asn Arg Gln Thr Ser Ser Met Glu Met Ala Thr 165 170 175 Ser Leu Leu Ser Thr Gln Pro Gly lie Ser Val Gly Arg Thr Tyr His 180 185 190 Ser Leu Lys Met Met lie Gly Val Glu Arg Arg Arg Pro Arg Lys Ala 195 200 205 Ala Ser lie Arg Glu Phe Trp 210 215 <210> 220 <211> 1329 <212> ADN <213> Glycine max <400> 220 gcacgagtag ggttttctcc tcccccattg acccaccgtc catcgcaaag gaagtcgcgc 60 ccaatttcca tggtttgtag attaaatctt aaagcagtaa gtcatcatgg ataaatcaga 120 gcagactcag cagcaacatc agcatgggat gggcgttgcc acaggtgcta gccaaatggc 180 ctattcttct cactacccga ctgctcccat ggtggcttct ggcacgcctg ctgtagctgt 240 tccttcccca actcaggctc cagctgcctt ctctagttct gctcaccagc ttgcatacca 300
133 gcaagcacag catttccacc accaacagca gcaacaccaa caacagcagc ttcaaatgtt 360 ctggtcaaac caaatgcaag aaattgagca aacaattgac tttaaaaacc acagtcttcc 420 tcttgctcgg ataaaaaaga taatgaaagc tgatgaagat gtccggatga tttctgcaga 480 agctccagtc atatttgcaa aagcatgtga aatgttcata ttagagttga cgttgagatc 540 ttggatccac acagaagaga acaagaggag aactctacaa aagaatgata tagcagctgc 600 tatttcgaga aacgatgttt ttgatttctt ggttgatatt atcccaagag atgagttgaa 660 agaggaagga cttggaataa ccaaggctac tattccattg gtgaattctc cagctgatat 720 gccatattac tatgtccctc cacagcatcc tgttgtagga cctcctggga tgatcatggg 780 caagcccgtt ggtgctgagc aagcaacgct gtattctaca cagcagcctc gacctcccat 840 ggcgttcatg ccatggcccc atacacaacc ccagcaacag cagccacccc aacatcaaca 900 aacagactca tgatgacaat gcaattcaat taggtcggaa agtagcatgc accttatgat 960 tattacaaat ttacttaatg cctttaagtc agctgtagtt tagtgttttg cattgaaaaa 1020 tgccaaagat tgtttgaggt ttcttgcact catttatgat tgtatgagct cttatgctga 1080 gttacttttg gttgtgttta tttgaggtac tggtgtggta gttaaattag tttgtagctg 1140 tccataagta aacagcgtag ctgcttaatt aggaggtctg aaatgatgaa atagtttgta 1200 ttgttattgc agaaggtagg ttttattcag tatttcaaaa aaaaaaaaaa aaaaaaaaaa 1260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaa 1329 <210> 221 <211> 268 <212> PRT <213> Glycine max <400> 221 Met Asp Lys Ser Glu Gln Thr Gln Gln Gln His Gln His Gly Met Gly
1 5 10 15 Val Ala Thr Gly Ala Ser Gln Met Ala Tyr Ser Ser His Tyr Pro Thr 20 25 30 Ala Pro Met Val Ala Ser Gly Thr Pro Ala Val Ala Val Pro Ser Pro 35 40 45 Thr Gln Ala Pro Ala Ala Phe Ser Ser Ser Ala His Gln Leu Ala Tyr
50 55 60 Gln Gln Ala Gln His Phe His His Gln Gln Gln Gln His Gln Gln Gln 65 70 75 80 Gln Leu Gln Met Phe Trp Ser Asn Gln Met Gln Glu lie Glu Gln Thr 85 90 95 lie Asp Phe Lys Asn His Ser Leu Pro Leu Ala Arg lie Lys Lys lie 100 105 110 Met Lys Ala Asp Glu Asp Val Arg Met lie Ser Ala Glu Ala Pro Val 115 120 125 lie Phe Ala Lys Ala Cys Glu Met Phe lie Leu Glu Leu Thr Leu Arg
130 135 140 Ser Trp lie His Thr Glu Glu Asn Lys Arg Arg Thr Leu Gln Lys Asn 145 150 155 160
Asp lie Ala Ala Ala lie Ser Arg Asn Asp Val Phe Asp Phe Leu Val 165 170 175
134 Asp lie lie Pro Arg Asp Glu Leu Lys Glu Glu Gly Leu Gly lie Thr
180 185 190 Lys Ala Thr lie Pro Leu Val Asn Ser Pro Ala Asp Met Pro Tyr Tyr
195 200 205 Tyr Val Pro Pro Gln His Pro Val Val Gly Pro Pro Gly Met lie Met
210 215 220 Gly Lys Pro Val Gly Ala Glu Gln Ala Thr Leu Tyr Ser Thr Gln Gln 225 230 235 240
Pro Arg Pro Pro Met Ala Phe Met Pro Trp Pro His Thr Gln Pro Gln 245 250 255
Gln Gln Gln Pro Pro Gln His Gln Gln Thr Asp Ser 260 '265 <210> 222 <211> 199 <212> PRT <213> Arabidopsis thaliana <220> <221> característica_misc <222> <223> gi 15223482 <400> 222 Met Glu Gln Ser Glu Glu Gly Gln Gln Gln Gln Gln Gln Gly Val Met 1 5 10 15
Asp Tyr Val Pro Pro His Ala Tyr Gln Ser Gly Pro Val Asn Ala Ala
20 25 30 Ser His Met Ala Phe Gln Gln Ala His His Phe His His His His Gln
35 40 45 Gln Gln Gln Gln Gln Gln Leu Gln Met Phe Trp Ala Asn Gln Met Gln
50 55 60 Glu lie Glu His Thr Thr Asp Phe Lys Asn His Thr Leu Pro Leu Ala 65 70 75 80
Arg lie Lys Lys lie Met Lys Ala Asp Glu Asp Val Arg Met lie Ser 85 90 95
Ala Glu Ala Pro Val lie Phe Ala Lys Ala Cys Glu Met Phe lie Leu
100 105 110 Glu Leu Thr Leu Arg Ala Trp lie His Thr Glu Glu Asn Lys Arg Arg
115 120 125 Thr Leu Gln Lys Asn Asp lie Ala Ala Ala lie Ser Arg Thr Asp Val
130 135 140 Phe Asp Phe Leu Val Asp lie lie Pro Arg Asp Glu Leu Lys Glu Glu 145 150 155 160
135