[go: up one dir, main page]

PT1711612E - Cassetes de expressão para a expressão transgénica bidireccional de ácidos nucleicos em plantas - Google Patents

Cassetes de expressão para a expressão transgénica bidireccional de ácidos nucleicos em plantas Download PDF

Info

Publication number
PT1711612E
PT1711612E PT04740603T PT04740603T PT1711612E PT 1711612 E PT1711612 E PT 1711612E PT 04740603 T PT04740603 T PT 04740603T PT 04740603 T PT04740603 T PT 04740603T PT 1711612 E PT1711612 E PT 1711612E
Authority
PT
Portugal
Prior art keywords
seq
acid sequences
expression
sequences
promoter
Prior art date
Application number
PT04740603T
Other languages
English (en)
Inventor
Irene Kunze
Karin Herbers
Ute Heim
Original Assignee
Sungene Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sungene Gmbh filed Critical Sungene Gmbh
Publication of PT1711612E publication Critical patent/PT1711612E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

1
DESCRIÇÃO "CASSETES DE EXPRESSÃO PARA A EXPRESSÃO TRANSGÉNICA BIDIRECCIONAL DE ÁCIDOS NUCLEICOS EM PLANTAS" A invenção refere-se não só a cassetes e vectores de expressão, que contêm promotores bidireccionais vegetais, bem como à utilização destas cassetes ou vectores de expressão para a expressão transgénica de sequências de ácidos nucleicos em organismos vegetais. A invenção refere-se, igualmente, a organismos vegetais transgénicos transformados com estas cassetes ou vectores de expressão, não descurando culturas, partes ou material de reprodução derivados, bem como à utilização das mesmas para a produção de géneros alimentícios, forragem, sementes, produtos farmacêuticos ou de química fina. A produção de plantas transgénicas é uma técnica de base da biotecnologia vegetal e, consequentemente, uma condição essencial não só para a investigação vegetal de base, bem como para a produção de plantas com novas e melhoradas características direccionadas para a agricultura, para o aumento da qualidade dos géneros alimentícios ou para a produção de determinados produtos químicos ou farmacêuticos. Uma condição essencial para a expressão transgénica de determinados genes em plantas é a disponibilização de promotores especificamente vegetais. São conhecidos diferentes promotores vegetais. Os promotores constitutivos, mais utilizados até à data em plantas, são quase exclusivamente virais ou promotores isolados de Agrobacterium, como por exemplo o promotor CaMV35S do vírus mosaico da couve-flor (Odell et al. (1985) Nature 313:810-812). A crescente complexidade dos trabalhos 2 de biotecnologia vegetal exige muitas vezes a transformação com várias construções de expressão. A múltipla utilização de um mesmo promotor é especialmente problemática em plantas, uma vez que a múltipla existência de sequências reguladoras idênticas pode originar um silenciamento genético ("Silencing") (Kumpatla et al. (1998) TIBS 3:97-104; Selker (1999) Cell 97:157-160). Existe, assim, uma crescente necessidade de novos promotores. Uma solução alternativa para o problema reside na utilização dos chamados promotores "bidireccionais", i.e. sequências reguladoras que provocam, em ambas as direcções, uma transcrição das sequências de ADN localizadas a montante e a jusante. Neste caso, poderão, por exemplo, e com o controlo de uma sequência de ADN, ser introduzidos, numa célula, um gene alvo e um gene marcador.
Até ao momento, não se encontra, ainda, muito relatada, a expressão transgénica com controlo de promotores bidireccionais. Relatada está sim a produção de promotores bidireccionais a partir de promotores polares no sentido da expressão de ácidos nucleicos em plantas por meio da fusão com outros elementos transcripcionais (Xie M (2001) Nature Biotech 19:677-679). O promotor 35S foi, igualmente, convertido num promotor bidireccional (Dong JZ et al. (1991) B10/TECHNOLOGY 9: 858-863). A WO 02/64804 descreve a construção de um complexo de um promotor bidireccional com base na fusão de elementos do "enhancer" e do promotor nuclear de diferentes sequências virais (CaMV 35S, CsVMVj e vegetais (Act2, PRbl b) . A US20020108142 descreve uma sequência reguladora a partir de um intrão da proteina IV de transferência do fosfatidilinositol de Lotus japonicus (PLP-IV; Banco de genes ACC.-No.: AF367434) e a sua utilização como promotor bidireccional. Este fragmento de 3 intrão possui uma actividade transcripcional, somente, na zona infectada dos nódulos. Outros tecidos, raízes, folhas ou flores não apresentam qualquer coloração.
Até à data, não foram, ainda, divulgados promotores vegetais que permitam uma expressão bidireccional, ubíqua (i.e. substancialmente não específica de tecidos) e constitutiva em plantas. A WO 03/006660 descreve um promotor de um gene putativo de ferredoxina, bem como construções de expressão, vectores e plantas transgénicas, que contêm este promotor. As sequências isoladas, flanqueadas pelo elemento 836 bp 5' e fundidas ao gene da glucuronidase mostram, no tabaco transgénico, uma surpreendente amostra de expressão constitutiva. A sequência corresponde a um segmento da sequência no cromossoma 4 de Arabidopsis thaliana tal como depositado no Banco de genes em Acc. No. Z97337 (versão Z97337.2; par de bases 85117 a 85952; o gene que comece por bp 85953 é anotado com "strong similarity to ferredoxin [2Fe-2S] I, Nostoc muscorum"). A actividade detectada nas anteras/pólens dos botões florais fechados foi de fraca intensidade, e nas flores maduras foi, praticamente, nula. Em oposição às reservas decorrentes dos resultados divulgados na literatura de especialidade em relação à aptidão do promotor para a eficiente expressão de marcadores de selecção (por exemplo, devido à suposta especificidade das folhas ou à função no transporte de electrões durante o processo fotossintético) , foi possível demonstrar uma selecção altamente eficiente através da combinação com, por exemplo, o gene de resistência à canamicina (nptll). Na WO 03/006660 encontra-se, apenas, reportada a sua utilização enquanto promotor constitutivo 4 "normal". Não se encontra divulgado o uso enquanto promotor bidireccional.
No sentido de integrar o maior número de genes num genoma vegetal, através de um complexo de transferência, é necessário limitar o número e a dimensão das sequências reguladoras para a expressão de ácidos nucleicos transgénicos. Os promotores que actuem de forma bidireccional contribuem para a prossecução deste objectivo. Particularmente vantajosa é a utilização de um promotor bidireccional quando as respectivas actividades são coordenadas com a mesma intensidade e se encontram localizadas no mesmo pequeno fragmento de ADN. Uma vez que a utilização de sequências virais para a expressão em plantas transgénicas encontra pouca aceitação, é vantajoso o recurso a sequências reguladoras também de plantas. 0 objectivo no qual foi baseada a presente invenção foi, exactamente, fornecer cassetes de expressão transgénica com sequências reguladoras de plantas que medeiem a expressão (constitutiva) independente de desenvolvimento, ubiqua e bidireccional de duas sequências de ácidos nucleicos a expressar transgenicamente.
Este objectivo foi atingido por meio da invenção que aqui se apresenta. Um primeiro aspecto da invenção refere-se, assim, a cassettes de expressão para a expressão transgénica de duas sequências de ácidos nucleicos numa célula vegetal contendo pelo menos uma sequência reguladora seleccionada do grupo constituído por a) pelo promotor descrito em SEQ ID NO: 1 ou 2, 5 b) por equivalentes funcionais do promotor descrito em SEC ID NO: 1 ou 2, possuindo uma identidade de pelo menos 80% da sequência descrita em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEC ID NO: 1 ou 2, b) por equivalentes funcionais do promotor descrito em SEQ ID NO: 1 ou 2, possuindo, pelo menos, 25 nucleótidos consecutivos das sequências descritas em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, e c) por fragmentos funcionalmente equivalentes das sequências a) ou b) ou c) , possuindo, pelo menos, 25 nucleótidos consecutivos das referidas sequências a) ou b) ou c) e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, em que a sequência reguladora mencionada seja disposta entre duas sequências de ácidos nucleicos, e se apresente não só heteróloga em relação à referida sequência de ácidos nucleicos como também, funcionalmente, unida às mesmas, de tal forma que a expressão de duas diferentes sequências de ácidos ribonucleicos seja levada a cabo em, pelo menos, uma célula vegetal, e as tais sequências de ácidos ribonucleicos seleccionadas das sequências de ácidos ribonucleicos codifiquem i) sequências de aminoácidos ou ii) sequências de ácidos ribonucleicos que fomentem uma redução na expressão de, pelo menos, um gene endógeno da referida célula vegetal. 6 A invenção refere-se, para além disso, a um processo para expressão transgénica de duas sequências de ácidos ribonucleicos em células vegetais, no qual uma cassete de expressão contenha, pelo menos, um sequência reguladora seleccionada do grupo composto a) pelo promotor descrito em SEQ ID NO: 1 ou 2, b) por equivalentes funcionais do promotor descrito em SEQ ID NO: 1 ou 2, possuindo uma identidade de pelo menos 80% da sequência descrita em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, b) por equivalentes funcionais do promotor descrito em SEQ ID NO: 1 ou 2, possuindo, pelo menos, 25 nucleótidos consecutivos das sequências descritas em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, e c) por fragmentos funcionalmente equivalentes das sequências a) ou b) ou c), possuindo, pelo menos, 25 nucleótidos consecutivos das referidas sequências a) ou b) ou c) e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, introduzida em, pelo menos, uma célula vegetal, e em que a sequência reguladora referida, é disposta entre duas sequências de ácidos nucleicos, e se apresente não só heteróloga em relação à referida sequência de ácidos nucleicos como também, funcionalmente, unida às mesmas, de tal forma que a expressão de duas diferentes sequências de ácidos ribonucleicos seja levada a cabo em, pelo menos, uma célula vegetal, e na qual as tais sequências de ácidos 7 ribonucleicos sejam seleccionadas das sequências de ácidos ribonucleicos e codifiquem i) sequências de aminoácidos ou ii) sequências de ácidos ribonucleicos que fomentem uma redução na expressão de, pelo menos, um gene endógeno da referida célula vegetal. A sequência de ADN empregue na presente invenção como promotor bidireccional corresponde à região intergénica entre um gene putativo da ferredoxina (FD) e um gene putativo O-acetil-serina-liase (OASTL) em Arabidopsis thaliana.
Foram conseguidos grandes resultados junto de plantas da familia das Brassicaceae, como por exemplo, a arabidopsis ou a colza. Contudo, foi, igualmente, possível conseguir muito bons resultados (especialmente na expressão de marcadores de selecção) noutras espécies vegetais (como por exemplo, o tabaco). A actividade da «expressão" é, basicamente, independente da natureza do ácido nucleico localizado a jusante. A utilização do promotor bidireccional é apropriada para a expressão de marcadores de selecção e para qualquer outro ácido nucleico.
Desta forma, de acordo com uma concretização preferida, as duas sequências de ácidos nucleicos, a expressar transgenicamente e presentes nas cassetes de expressão de acordo com a presente invenção, ou as sequências de ácidos ribonucleicos expressas no processo da presente invenção, apresentam-se diferentes. Neste contexto «diferente" significa que as sequências de ácidos ribonucleicos, expressas transgenicamente a partir de ambos os lados do promotor bidireccional, se apresentam de forma diferente em pelo menos uma base. Ambas as sequências de ácidos nucleicos codificam, preferencialmente, diferentes proteínas, em especial para as que se apresentem desiguais em termos de função e/ou actividade. A presente invenção possibilita o aumento do número de unidades de transcripção com um reduzido número de sequências de promotores. No caso de fusões translacionais, é, igualmente, possível regular mais de duas proteínas. Uma particular vantagem desta invenção é o facto da expressão destes trangenes múltiplos ter lugar, de forma simultânea, sincronizada e com o controlo do promotor bidireccional. 0 promotor é bastante adequado para uma coordenação da expressão de ácidos nucleicos. Como tal, é possível a expressão simultânea de i) proteína alvo e marcador de selecção ou proteína relatora ii) marcador de selecção e proteína relatora ii) duas proteínas alvo, por exemploda mesma via metabólica
iii) mutação sense de ARN e mutação antisense de ARN iv) diferentes proteínas para a defesa contra patogenias e muito mais, bem como originar melhores resultados em plantas. „Expressão" inclui a transcripção da sequência de ácidos nucleicos, a expressar transgenicamente, mas poderá também, no caso de um quadro de leitura aberto na orientação "sense", incluir a translação do ARN transcrito 9 da sequência de ácidos nucleicos a ser expressa transgenicamente num polipeptideo correspondente. „A cassete de expressão para a expressão transgénica de ácidos nucleicos ou o processo para a expressão transgénica de ácidos nucleicos abrange todas as construções ou processos resultantes de métodos de engenharia genética, nos quais tanto a) um dos promotores de acordo com a presente invenção (por exemplo, o promotor descrito em SEC ID NO: 1 ou 2, ou um dos equivalentes funcionais), como b) a sequência de ácidos nucleicos a expressar com o controlo do referido promotor, ou c) (a) e (b) não se encontram no seu ambiente genético natural (i.e. na sua localização cromossómica natural) ou foram transformados por métodos da engenharia genética, com possíveis modificações como uma substituição, adição, eliminação, inversão ou inserção de um ou mais resíduos de nucleótidos. De acordo com uma concretização preferida, a sequência de ácidos nucleicos, a expressar com o controlo de um dos promotores de acordo com a presente invenção, é heteróloga em relação ao referido promotor, i.e. não se encontra naturalmente sob o controlo do mesmo; esse controlo foi sim produzido de uma forma não natural (por exemplo, por meio de processos da engenharia genética).
As cassetes de expressão de acordo com a presente invenção, os vectores daí derivados, ou os processos de 10 acordo com a presente invenção podem incluir equivalentes funcionais em relação às sequências do promotor descritas em SEQ ID NO: 1 ou 2. As sequências de equivalentes funcionais abrangem igualmente todas as sequências que derivam da cadeia complementar das sequências definidas em SEQ ID NO: 1 ou 2, e contêm, substancialmente, a mesma actividade do promotor. Equivalentes funcionais em relação aos promotores da invenção significam principalmente mutações naturais ou artificiais das sequências do promotor descritas em SEC ID NO: 1 ou 2, e seus homólogos de outros géneros e espécies de plantas, que apresentam, substancialmente, a mesma actividade do promotor.
Uma actividade do promotor é referida como sendo, basicamente, a mesma, quando a transcripção de um determinado gene, a ser expresso com o controlo de um determinado promotor derivado da SEQ ID NO: 1 ou 2 nas condições ainda assim inalteradas, exibe uma localização dentro da planta que é, pelo menos, 50%, preferencialmente pelo menos 70%, de especial preferência pelo menos 90%, de extrema preferência pelo menos 95% coincidente com uma expressão comparativa obtida com o recurso a um dos promotores descritos em SEQ ID NO : 1 ou 2. Neste caso, é possivel que o nivel de expressão difira, acima ou abaixo, do valor de comparação. Assim, as sequências preferidas são aquelas cujo nivel de expressão, medido por meio do ARNm transcrito ou da proteína traduzida subsequentemente, e sob condições ainda assim inalteradas, exceda quantitativamente em não mais de 50%, preferencialmente 25%, de especial preferência 10%, um valor de comparação obtido com o promotor descrito em SEQ ID NO: 1 ou 2. As sequências particularmente preferidas são aquelas, cujo nível de expressão, medido por meio do ARNm transcrito ou da 11 proteína traduzida subsequentemente, e sob condições ainda assim inalteradas, excede quantitativamente em mais de 50%, preferencialmente 100%, de especial preferência 500%, de extrema preferência 1000%, um valor de comparação obtido com o promotor descrito em SEQ ID NO: 1 ou 2. O valor de comparação preferido é o nível de expressão do ARNm natural do respectivo gene ou do produto natural do gene. Um outro valor de comparação preferido é o nível de expressão obtido com uma sequência de ácidos nucleicos preferida e definida, e, preferencialmente, as sequências de ácidos nucleicos que codificam proteínas facilmente quantificavéis. É, aqui, dada uma preferência muito particular às proteínas relatoras (Schenbom E & Groskreutz D (1999) Mol Biotechnol 13(1): 29-44) como a „proteína fluorescente verde" (GFP) (Chui WL et al., Curr Biol 1996, 6:325-330; Leffel SM et al., Biotechniques. 23(5):912-8, 1997), a cloranfenicol transferase, uma luciferase (Millar et al., Plant Mol Biol Rep 1992 10:324-414) ou a beta-galactosidase, com especial preferência para a beta-glucuronidase (Jefferson et al. (1987) EMBO J. 6:3901-3907) .
Condições ainda assim inalteradas significa que a expressão, iniciada por meio de uma das cassetes de expressão a ser comparada, não é modificada pela combinação com sequências de controlo genético adicionais, como por exemplo as sequências facilitadoras. Condições inalteradas significa ainda que todas as condições gerais, como por exemplo a espécie das plantas, o seu estado de evolução, as condições de cultura e de ensaio (como o tampão, a temperatura, o substrato, etc.), são mantidas idênticas entre as expressões a comparar. 12
As mutações abrangem substituições, adições, eliminações, inversões ou inserções de um ou de mais resíduos de nucleótidos. Assim, a presente invenção abrange, também, por exemplo sequências de ácidos nucleicos obtidas por meio da modificação de um promotor, conforme descrito em SEQ ID NO: 1 ou 2. 0 objectivo de uma modificação deste tipo poderá ser a posterior delimitação da sequência aí contida ou, por exemplo, a inserção de outros pontos de corte de enzimas de restrição, a eliminação de ADN redundante ou a adição de outras sequências, como, por exemplo, outras sequências reguladoras.
Nos locais em que sejam adequadas inserções, eliminações ou substituições, como, por exemplo, transições e transversões, é possível utilizar técnicas conhecidas como a mutagénese in vitro, a "primer repair", a restrição ou a ligação. Manipulações como a restrição, a "chewing-back" ou o preenchimento de "sticky ends" por forma a obter "blunt ends" possibilitam terminais complementares dos fragmentos para a ligação. Podem, igualmente, ser obtidos resultados análogos com o recurso à reacção em cadeia da polimerase (PCR) utilizando determinados iniciadores de oligonucleótidos. A identidade entre dois ácidos nucleicos corresponde à identidade da sequência de ácidos nucleicos ao longo de toda a sequência para cada caso, calculada por comparação e por meio do algoritmo do programa GAP (Wisconsin Package Version 10.0, University of Wisconsin, Genetics Computer Group (GCG), Madison, USA) com os seguintes parâmetros: 13
Gap Weight: 12 Average Match: 2,912
Length Weight: 4 Average Mismatch:-2,003 A título exemplificativo, uma sequência que tenha uma identidade com uma base de pelo menos 50% de ácidos nucleicos em relação à sequência de SEQ ID NO: 1, significa uma sequência que tem uma identidade de pelo menos 50% em comparação com a sequência SEQ ID NO: 1, segundo o referido algoritmo de programação com os parâmetros mencionados.
Os equivalentes funcionais do promotor descrito em SEQ ID NO: 1, abrange, preferencialmente, as sequências que possuam uma identidade de pelo menos 80 %, preferencialmente 90%, de especial preferência 95%, de extrema preferência 98%, de muito extrema preferência 99% da sequência descrita em SEQ ID NO: 1, e, substancialmente, a mesma actividade do promotor, como a sequência descrita em SEC ID NO: 1.
Os equivalentes funcionais do promotor de acordo com a SEC ID NO: 2, abrange, preferencialmente, as sequências que possuam uma identidade de pelo menos 80 %, preferencialmente 90%, de especial preferência 95%, de extrema preferência 98%, de muito extrema preferência 99% da sequência descrita em SEQ ID NO: 2, e, substancialmente, a mesma actividade do promotor, como a sequência descrita em SEC ID NO: 2.
Outros exemplos para as cassetes de expressão ou vectores, de acordo com a invenção, para aplicação de sequências do promotor, permitem facilmente encontrar, por exemplo, em diversos organismos, cuja sequência genómica seja conhecida, como por exemplo de arabidopsis thaliana, 14 brassica napus, nicotiana tabacum, solanum tuberosum, helianthium annuus, linum sativum), por meio da comparação da identidade em bancos de dados. 0 processo para a produção de equivalentes funcionais de acordo com a presente invenção abrange, preferencialmente, a introdução de mutações num promotor, conforme descrito em SEC ID NO: 1. Poderá «aleatoriamente" ocorrer uma mutagénese, na qual as sequências alteradas são, subsequentemente, analisadas em termos de propriedades e por meio de um procedimento "trial-by-error". Particularmente vantajosos são os critérios de selecção que incluem, por exemplo, uma maior resistência a um marcador de selecção, o nivel da expressão resultante da sequência de ácidos nucleicos introduzida.
In einer weiteren Ausfuhrungsform der Erfindung kõnnen essentielle regulatorische Elemente der erfindungsgemáBen Promotoren gezielt isoliert und ais solche oder in Kombination mit anderen regulatorischen Elementen eingesetzt werden. Por conseguinte, um aspecto da invenção abrange equivalentes funcionais do promotor descrito em SEQ ID NO: 1 ou 2, possuindo, pelo menos 25, preferencialmente pelo menos 50, de especial preferência pelo menos 100, de extrema preferência 200, de muito extrema preferência pelo menos 400, nucleótidos consecutivos das sequências descritas em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2.
De forma alternativa, as sequências não essenciais de um dos promotores da invenção podem ser apagadas sem afectar significativamente as propriedades mencionadas. Um outro aspecto da invenção abrange, assim, fragmentos 15 funcionalmente equivalentes de uma das sequências do promotor da invenção com pelo menos 25, preferencialmente pelo menos 50, de especial preferência pelo menos 100, de extrema preferência pelo menos 200, de muito extrema preferência pelo menos 400, nucleótidos consecutivos de uma das sequências do promotor da invenção, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2.
Recorrendo a uma rotina de busca de elementos do promotor, poderá ocorrer a delimitação da sequência do promotor para determinadas regiões reguladoras essenciais. Em regiões relevantes para a actividade do promotor, encontram-se, frequentemente, e em grande escala, determinados elementos do promotor. Esta análise pode ser levada a cabo com o recurso a, por exemplo, programas informáticos como o PLACE ("Plant Cis-acting Regulatory DNA Elements") (Higo K et al. (1999) Nucleic Acids Res 27:1, 297-300) ou à base de dados da BIOBASE "Transfac" (Biologische Datenbanken GmbH, Braunschweig).
Os processos para a mutagénese de sequências de ácidos nucleicos são, já, conhecidos dos especialistas e incluem, por exemplo, a utilização de oligonucleótidos com uma ou mais mutações comparadas com a região a alterar (por exemplo, no âmbito de uma "Site-specific mutagenesis") . São, normalmente, utilizados "primers" com aproximadamente 15 a aproximadamente 75 nucleótidos ou mais, com preferencialmente cerca de 10 a cerca de 25 ou mais resíduos de nucleótidos localizados em ambos os lados da sequência a alterar. É do conhecimento dos especialistas os pormenores e os procedimentos desses processos de mutagénese (Kunkel et al. (1987) Methods Enzymol 154:367- 16 382; Tomic et al. (1990) Nucl Acids Res 12: 1656; Upender et al. (1995) Biotechniques 18 (1):29-30,- US 4 237 224). Pode, igualmente, ser conseguida uma mutagénese através do tratamento de, por exemplo, vectores que incluam uma das sequências de ácidos nucleicos da invenção com agentes modificantes como a hidroxilamina.
Para além de ligadas a um dos promotores da invenção, as sequências de ácidos nucleicos que se encontram presentes nas cassetes de expressão da invenção, e a serem expressas transgenicamente, podem estar, funcionalmente, ligadas a outras sequências de controlo genético
Uma ligação funcional significa, por exemplo, uma ordem sequencial de um promotor, da sequência de ácidos nucleicos a expressar transgenicamente e, se apropriado, de outros elementos regulatórios, como por exemplo, um terminador; de tal forma que cada um dos elementos regulatórios seja capaz de cumprir a sua função na expressão transgénica da sequência de ácidos nucleicos, dependendo da ordem das sequências de ácidos nucleicos para a mutação sense de ARN ou a mutação antisense de ARN. Não é necessária uma directa ligação no sentido químico. As sequências de controlo genético, como por exemplo as sequências do "enhancer", também podem exercer a sua função a partir de posições remotas ou, até mesmo, de outras moléculas de ADN na sequência alvo. As ordens preferidas são aquelas em que a sequência de ácidos nucleicos, a expressar transgenicamente, se encontra posicionada atrás da sequência que actua como promotor, por forma a que as duas sequências estejam, covalentemente, ligadas. Nesta ligação, a distância entre a sequência do promotor e a sequência de ácidos nucleicos, a expressar transgenicamente, é 17 preferencialmente de menos de 200 pares de bases, de especial preferência de menos de 100 pares de bases, de extrema preferência de menos de 50 pares de bases. A produção de uma ligação funcional pode ser conseguida com o recurso a uma recombinação convencional e a técnicas de clonagem, conforme descrito por exemplo em Maniatis T et al. (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, e em Silhavy TJ et al. (1984) Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY und in Ausubel FM et al.(1987) Current Protocols in Molecular Biology, Greene Publishing Assoe, and Wiley Interscience. Contudo, outras sequências que tenham, por exemplo, a função ou de um elemento de ligação com determinados pontos específicos de corte de endonucleases de restrição ou de um único péptido podem, também, ser posicionadas entre as duas sequências. A inserção de sequências pode, igualmente, conduzir à expressão de proteínas de fusão. O termo sequências de controlo genético deve ser, genericamente, entendido e significa todas as sequências com uma influência na existência da função da cassete de expressão transgénica da invenção. As sequências de controlo genético modificam, por exemplo, a transcrição e tradução em organismos procarióticos ou eucarióticos. As cassetes de expressão da invenção incluem, preferencialmente, enquanto sequência de controlo genético adicional, um dos promotores da invenção, 5' a montante de determinada sequência de ácidos nucleicos a expressar transgenicamente, e uma sequência de terminador, 3' a jusante; e se adequado outros elementos regulatórios 18 frequentes, em cada caso funcionalmente ligados à sequência de ácidos nucleicos a expressar transgenicamente.
As sequências de controlo genético incluem, também, outros promotores, elementos do promotor ou promotores mínimos capazes de modificar as propriedades que controlam a expressão. É, assim, possível, que, dependendo de determinados factores de pressão e através de sequências de controlo genético, ocorra, por exemplo, a adicional expressão específica do tecido. São descritos elementos como, por exemplo, o stress hídrico, os ácidos abscísicos (Lam E e Chua NH, (1991) J Biol Chem 266(26):17131-17135) e o stress térmico (Schõffl F et al. (1989) Mol Gen Genetics 217(2-3):246-53).
Uma outra possibilidade é outros promotores, que possibilitem a expressão noutros tecidos vegetais ou noutros organismos como, por exemplo, as bactérias E. coli, estarem, funcionalmente, ligados à sequência de ácidos nucleicos a expressar. Promotores vegetais adequados são, em princípio, todos os promotores acima descritos. É concebível que, por exemplo, uma determinada sequência de ácidos nucleicos seja descrita por um promotor (por exemplo, um dos promotores da invenção) num tecido vegetal como a mutação sense de ARN e traduzida na correspodente proteína; e a mesma sequência de ácidos nucleicos pode ser transcrita por outro promotor com uma diferente especificidade num tecido diferente como a mutação antisense de ARN, sendo a correspondente proteína regulada negativamente. Esta situação pode ser implementada pela cassete de expressão da invenção, posicionando um promotor à frente da sequência de ácidos nucleicos, a expressar transgenicamente, e o outro promotor atrás. 19
As sequências de controlo genético abrangem, igualmente, a região 5' não traduzida, intrões ou a região 3' não codificante, preferencialmente do gene pFD e/ou do gene OASTL. Foi comprovado que as regiões não traduzidas podem desempenhar uma significativa função na regulação da expressão dos genes. Sendo assim, ficou demonstrado que as sequências não traduzidas 5' podem reforçar a expressão transiente de genes heterólogos. E podem, para além disso, promover a especificidade dos tecidos (Rouster J et al. (1998) Plant J. 15:435-440.). Pelo contrário, a região 5' não traduzida do gene opaco-2 elimina a expressão. A eliminação da região correspondente conduz a um aumento da actividade do gene (Lohmer S et al. (1993) Plant Cell 5:65— 73). A sequência de ácidos nucleicos indicada em SEC ID NO: 2 inclui o segmento do gene FD e do gene OASTL, representando o promotor e a região 5' não traduzida até ao start codon ATG da respectiva proteína. Encontra-se presente um intrão na região 5' não traduzida do gene OASTL, conforme pode ser provado pela estrutura dos clones de cDNA. Os limites do intrão encontram-se localizados a 14 bp (lado 3' do intrão) e 281 bp (lado 5' do intrão) . Correspondendo a numeração do par de bases à numeração do promotor descrito em SEQ ID NO: 2. O intrão tem uma função de forte promoção da expressão em ambas as direcções da transcrição. A razão para esta situação poderá ser a existência de um "enhancer" nesta região.
De acordo com uma concretização preferida, é, assim, descrito o promotor bidireccional da invenção por meio da sequência descrita em SEC ID NO: 2, ou por sequências que possuam uma identidade de pelo menos 80%, preferencialmente de pelo menos 90%, de especial preferência de pelo menos 95%, de extrema preferência de pelo menos 98%, de muito 20 extrema preferência de pelo menos 99% da sequência descrita em SEQ ID NO: 2. São conhecidas dos especialistas outras sequências 5' não traduzidas e intrões com a função de promover a expressão. McElroy e os seus colaboradores (McElroy et al. (1991) Mol Gen Genet 231(1):150-160) relataram uma construção com base num promotor da actina 1 do arroz (Actl) no sentido de modificar plantas monocotiledóneas. A utilização do intrão Actl combinado com o promotor 35S em células de arroz transgénico conduziu a uma taxa de expressão dez vezes mais forte, numa comparação com a utilização isolada do promotor 35S. A optimização do ambiente de sequências do local de iniciação da tradução do gene repórter (GUS) resultou num aumento de quatro vezes da expressão GUS em células de arroz transformadas. A combinação do optimizado local de iniciação da tradução e do intrão Actl resultou num aumento de quarenta vezes da expressão GUS em células de arroz transformadas pelo promotor CaMV35S; em cálulas de milho transformadas foram obtidos resultados similares. No total, foi concluído das investigações acima descritas que os vectores de expressão com base no promotor Actl são adequadas para o suficiente controlo da forte expressão constitutiva do ADN estrangeiro em células transformadas de plantas monocotiledóneas. A cassete de expressão pode incluir uma ou mais das chamadas sequências do "enhancer", funcionalmente, ligadas ao promotor, tornando possível uma aumentada expressão transgénica da sequência de ácidos nucleicos. É, igualmente, possível inserir adicionais sequências vantajosas, como por exemplo outros elementos regulatórios ou terminadores, no final 3' de sequências de ácidos 21 nucleicos a expressar transgenicamente. As sequências de ácidos nucleicos a expressar transgenicamente podem estar presentes numa ou mais cópias de uma das cassetes de expressão da invenção.
As sequências de controlo significam, também, aquelas que possibilitam uma homóloga recombinação ou inserção num genoma de um organismo hospedeiro, ou que permitem a eliminação a partir do genoma. Na recombinação homóloga, o promotor natural de um determinado gene pode, por exemplo, ser substituído por um dos promotores da invenção. Métodos como a tecnologia CreAox permitem a eliminação específica do tecido, induzível nalgumas circunstâncias, da cassete de expressão a partir do genoma do organismo hospedeiro (Sauer B. (1998) Methods. 14(4):381-92). Neste caso, são anexadas a um gene alvo determinadas sequências flanqueadas (sequências lox), que permitem, posteriormente, a eliminação por meio da cre recombinase. 0 promotor a introduzir pode ser colocado, por meio de uma recombinação homóloga, à frente do gene alvo, a expressar transgenicamente, criando, assim, uma ligação entre o promotor e as sequências de ADN, por exemplo, homólogas a sequências endógenas que precedem o quadro de leitura do gene alvo. Essas sequências devem ser entendidas como sequências de controlo genético. Após uma célula ter sido modificada com a adequada construção de ADN, as duas sequências homólogas podem interagir e, assim, colocar a sequência do promotor no local desejado em frente ao gene alvo, por forma a que a sequência do promotor passe, agora, a estar funcionalmente ligada ao gene alvo, formando a cassete de expressão da invenção. A selecção das sequências homólogas determina o local de inserção do promotor. É 22 possível, neste caso, gerar a cassete de expressão por meio da recombinação homóloga e através de uma recombinação recíproca simples ou dupla. Na recombinação recíproca simples, existe a utilização de apenas uma sequência de recombinação simples, sendo inserido todo o ADN introduzido. Na recombinação recíproca dupla, o ADN a ser introduzido é flanqueado por duas sequências homólogas, e é inserida a região de flanqueamento. 0 último processo é adequado para substituir, como se descreve acima, o promotor natural de um determinado gene por um dos promotores da invenção e, assim, modificando a localização e o "timing" da expressão do gene. Esta ligação funcional representa uma cassete de expressão da invenção.
Para a bem sucedida selecção de células recombinadas de forma homóloga ou células transformadas, é, normalmente, necessário introduzir, de forma adicional, um marcador seleccionável. São, de seguida, mencionados vários marcadores adequados. 0 marcador de selecção permite a selecção de células transformadas e não transformadas. A recombinação homóloga é um evento relativamente raro em eucariotas superiores, especialmente em plantas. São predominantes as integrações aleatórias no genoma hospedeiro. Uma possibilidade de eliminar aleatoriamente sequências integradas e, assim, enriquecer clones de células que possuam uma correcta recombinação homóloga consiste em utilizar um sistema de recombinação específica da sequência tal como descrito em U.S. Pat. N°. 6 110 736.
Os sinais de poliadenilação adequados como sequências de controlo são os sinais de poliadenilação vegetais, e preferencialmente os de agrobacterium tumefaciens. De acordo com uma concretização preferida, a cassete de 23 expressão contém uma sequência de terminador que se apresenta funcional em plantas. As sequências de terminador que se apresentam funcionais em plantas significam, em geral, sequências capazes de realizar a terminação de transcrição de uma sequência de ADN em plantas. Exemplos de sequências de terminador adequadas são o terminador OCS (sintese de octopina) e NOS (síntese de nopalina) . É dada particular preferência a sequências de terminador vegetais. As sequências de terminador vegetais significam, no geral, as sequências, que são parte integrante de um gene de plantas natural. De particular preferência para esta ligação é o terminador do gene inibidor da catepsina D de batata (Banco de genes Acc. No.: X74985) ou o terminador do gene da proteína de armazenamento VÍLEIB3 (Banco de genes Acc. No.: Z26489) da fava. Estes terminadores são, pelo menos, equivalentes aos terminadores virais ou de T-ADN. 0 especialista conhece uma grande série de ácidos nucleicos e proteínas, cuja expressão recombinante é vantajosa com o controlo de cassetes de expressão ou processos da invenção. Para além disso, é, também, do conhecimento do especialista uma grande número de genes cuja repressão ou desligação por meio da expressão de uma apropriada mutação sense de ARN pode conseguir efeitos vantajosos. Podem ser mencionados exemplos não-restritivos de efeitos vantajosos: - facilitada produção de um organismo transgénico, através, por exemplo, da expressão de marcadores de selecção 24 - concretização de uma resistência contra factores abióticos de stress (calor, frio, aridez, elevada humidade, toxinas ambientais, radiação UV) concretização de uma resistência contra factores bióticos de stress (patogenias, virus, insectos e doenças) - melhoria das propriedades da alimentação animal e humana - melhoria da taxa de crescimento ou de produção.
Seguem-se, abaixo, alguns exemplos concretos de ácidos nucleicos, cuja expressão proporcione os efeitos vantajosos desejados: 1. Marcadores de selecção 0 marcador de selecção abrange tanto os marcadores de selecção positivos, que conferem resistência contra um antibiótico, herbicida ou biocida, como também marcadores de selecção negativos que proporcionam sensibilidade aos factores mencionados, e marcadores que oferecem ao organismo modificado uma vantagem em termos de crescimento (por exemplo, através da expressão de genes-chave da biossintese de citoquina; Ebinuma H et al. (2000) Proc Natl Acad Sei USA 94: 2117-2121). No caso de selecção positiva, apenas prosperam os organismos que expressem o correspondente marcador de selecção, enquanto que no caso de uma selecção negativa são precisamente estes mesmo que morrem. Na produção de plantas transgénicas é preferida a utilização de um marcador de selecção positivo. É, também, preferido o uso de marcadores de selecção que 25 proporcionem vantagens em termos de crescimento. Podem ser usados marcadores de selecção negativos se a intenção for eliminar determinados genes ou secções de genoma de um organismo (por exemplo, como parte de um processo de cruzamento). 0 marcador seleccionável introduzido com a cassete de expressão confere, às células transformados ou recombinadas de forma bem sucedida, resistência contra a biocida (por exemplo, um herbicida como a fosfinotricina, o glifosato ou o bromoxinil), um inibidor do metabolismo como o 2-de (s)oxiglucose-6-fosfato (WO 98/45456) ou um antibiótico, como por exemplo canamicina, G418, bleomicina, a higromicina. 0 marcador de selecção permite a selecção de células transformadas de não transformadas (McCormick et al. (1986) Plant Cell Rep 5:81-84). Os marcadores de selecção particularmente preferidos são os que conferem resistência contra herbicidas. São conhecidos dos especialistas vários marcadores de selecção deste tipo e as sequências que os codificam. Podem ser mencionados exemplos não-restritivos: i) marcadores de selecção positivos: O marcador seleccionável introduzido com a cassete de expressão confere, às células transformadas com sucesso, resistência contra um produto biocida (por exemplo, um herbicida como a fosfinotricina, o glifosato ou o bromoxinil), um inibidor do metabolismo como o 2-de (s)oxiglucose-6-fosfato (WO 98/45456) ou um antibiótico, como por exemplo tetraciclina, ampicilina, canamicina, G418, neomicina, bleomicina, higromicina. 0 marcador de selecção permite a selecção de células transformadas de não transformadas (McCormick et al. (1986) Plant Cell Reports 26 5:81-84). Os marcadores de selecção particularmente preferidos são os que conferem resistência contra herbicidas. Exemplos de marcadores de selecção que podem ser mencionados: - sequências de ADN que codificam as fosfinotricina acetiltransferases (PAT; taambém de denominação gene de resistência "bar") e conduzem à detoxificação do herbicida fosfinotricina (PPT) (de Block et al. 81987 EMBO J 6:2513-2518). Os genes bar adequados podem ser isolados de, por exemplo, Strepctomicos higroscopicus ou S. viridocromogenes. São conhecidas dos especialistas as correspondentes sequências (Banco de genes Acc.-No.: X17220, X05822, M22827, X65195; US 5 489 520) . Também se encontram descritos genes artificiais, por exemplo, para a expressão em plastideos AJ028212. Em Becker et al. (1994) Plant J 5:299-307, encontra-se descrito um gene Pat artifical. Os genes conferem resistência ao herbicida bialaphos e são muito utilizados como marcadores em plantas trangénicas (Vickers JE et al. (1996) Plant Mol Biol Rep 14:363-368; Thompson CJ et al. (1987) EMBO J 6:2519-2523) . - os genes da 5-enolpiruvilshikimato-3-fosfato-sintase (EPSP sintase) que proporcionam uma resistência ao glifosato (N-(fosfonometil)glicina)(Steinrucken HC et al. (1980) Biochem Biophys Res Commun 94:1207-1212; Levin JG e Sprinson DB (1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode of action of glyphosate; A literature analysis, p. 48-74. In: Grossbard E e Atkinson D (eds.). The herbicide glyphosate. Buttersworths, Boston.). As variantes EPSPS tolerantes 27 ao glifosato são, preferencialmente, utilizadas como marcadores de selecção (Padgette SR et al. (1996). New weed control opportunities: development of soybeans with a Roundup Ready™ gene. In: Herbicide Resistant Crops (Duke SO ed.), pp. 53-84. CRC Press, Boca Raton, FL; Saroha MK e Malik VS (1998) J Plant Biochem Biotechnol 7:65-72). O gene EPSPS proveniente da estirpe CP4 de Agrobacterium sp. apresenta uma natural tolerância ao glifosato, que pode ser transferida para plantas transgénicas adequadas (Padgette SR et al. 81995) Crop Science 35(5):1451-1461). As 5-Enolpiruvilshikimato-3-fosfato-sintases, tolerantes ao glifosato, encontram-se descritas, por exemplo, em US 5 510 471; US 5 776 760; US 5 864 425; US 5 633 435; US 5 627 061; US 5 463 175; EP 0 218 571. No Banco de genes X63374, encontram-se descritas outras sequências. O gene aroA é também preferido (M10947). - o gene gox (glifosato oxidoreductase de Achromobacter sp.)codifica as enzimas que degradam o glifosato. O GOX proporciona resistência ao glifosato (Padgette SR et al. (1996) J Nutr. 126 (3):702-16; Shah D et al. (1986) Science 233: 478-481). - o gene deh (codifica uma dealogenase, que inibe o dalapon),(Banco de genes Acc.-No.: AX022822, AX022820 bem como W099/27116) - genes bxn, que codificam a enzina nitrilase que degrada o bromoxinil. Por exemplo, a nitrilase de Klebsiella ozanenae. No Banco de genes, por exemplo, em Acc.-No, podem ser encontradas as sequências: E01313 e U03196. 28 as fosfotransferases de neomicina conferem resistência a antibióticos (aminoglicósidos) como neomicina, G418, higromicina, paromomicina ou canamicina, reduzindo o seu efeito inibidor por meio de uma reacção de fosforilação. É dada particular preferência ao gene nptll. Podem ser obtidas sequências do Banco de genes (AF080390 Minitransposon mTn5-GNm; AF080389 Minitransposon mTn5-Nm, sequência completa) . Para além disso, o gene é já parte integrante de inúmeros vectores de expressão e pode, assim, ser isolado com o recurso a processos familiares ao especialista (como por exemplo, a reacção em cadeia da polimerase) (AF234316 pCAMBIA-2301; AF234315 pCAMBIA-2300, AF234314 pCAMBIA-2201). 0 gene deh codifica uma aminoglicosido-3'O-fosfotransferase da E. coli, Tn5 (Genbank Acc.-No: U00004 Posição 1401-2300; Beck et al. (1982) Gene 19 327-336). - o gene DOGR1. O gene DOGRl foi isolado da levedura Saccharomyces cerevisiae(EP 0 807 836). Codifica uma 2-desoxiglucose-6-fosfato fosfatase, que oferece resistência ao 2-DOG (Randez-Gil et al. 1995, Yeast 11, 1233-1240; Sanz et al. (1994) Yeast 10:1195-1202, Sequência: Banco de genes Acc.-No: NC001140 cromossoma VIII, Posição da Saccharomyces cervisiae 194799-194056). - as acetolactato-sintases inibidoras de sulfonilureia e imidazalinona, que proporcionam uma resistência a herbicidas imidazolinona/sulfonil. Podem, por exemplo, ser encontrados exemplos adequados no Banco de genes em Acc.-No: a sequência X51514 para Arahidopsis thaliana Csr 1.2 Gen (EC 4.1.3.18) (Sathasivan K et al. (1990) Nucleic Acids Res. 18(8):2188). As acetolactato 29 sintases que oferecem uma resistência ao herbicida imidazolinona encontram-se descritas no Banco de gens Acc.-No.: ABO49823, AF094326, X07645, X07644, A19547, A19546, A19545, 105376, 105373, AL133315. as higromicina fosfotranferases (X74325 P. gene pseudomallei for hygromycin phosphotransferase) que proporciona uma resistência ao antibiótico higromicina. O gene é parte integrante de inúmeros vectores de expressão e pode, assim, ser isolado com o recurso a processos familiares ao especialista (como por exemplo a reacção em cadeia da polimerase) (AF294981 pINDEX4; AF234301 pCAMBIA-1380; AF234300 pCAMBIA-1304; AF234299 pCAMBIA-1303; AF234298 pCAMBIA-1302; AF354046 pCAMBIA1305.; AF354045 pCAMBIA-1305.1) . - gene de resistência ao a) cloranfenicol (cloranfenicol-acetiltransferase), b) tetraciclina, encontram-se descritos vários genes de resistência, por exemplo X65876 S. ordonez genes cias D tetA and tetR for tetracycline resistance and repressor proteins X51366 Bacillus cereus plasmid pBC16 tetracycline resistance gene. Para além disso, o gene é já parte integrante de vários vectores de expressão e pode, assim, ser isolado com o recurso a processos familiares ao especialista (como por exemplo, a reacção em cadeia da polimerase) c) estreptomicina, encontram-se descritos vários genes de resistência, por exemplo no Banco de genes 30
Acc.-No.: AJ278607 Corynebacterium acetoacidophilum ant gene for streptomycin adenylyltransferase. d) zeocina, o gene de resistência correspondente é parte integrante de inúmeros vectores de clonagem (por exemplo, L36849 Cloning vector pZEO) e pode, assim, ser isolado com o recurso a processos familiares do especialista (como por exemplo, a reacção em cadeia da polimerase). e) ampicilina (gene da β-lactamase; Datta N, Richmond MH. (1966) Biochem J. 98(1):204 — 9; Heffron F et al (1975) J. Bacteriol 122: 250-256; o gene Amp foi, primeiro, clonado para preparar o vector da E. coli pBR322, Bolívar F et al. (1977) Gene 2:95-114). A sequência é parte integrante de vários vectores de clonagem e pode ser isolado com o recurso a processos familiares ao especialista (por exemplo, a reacção em cadeia da polimerase). - Genes como a isopenteniltransferase de Agrobacterium tumefaciens (estirpe: P022) (Banco de genes Acc.-No.: AB025109). O gene ipt é uma enzima-chave da biossíntese de citoquina. A sua sobreexpressão facilita a regeneração de plantas (por exemplo, a selecção no meio livre de citoquina) . O processo para a utilização do gene ipt encontra-se, já, descrito (Ebinuma H et al. (2000) Proc Natl Acad Sei USA 94:2117-2121; Ebinuma H et al. (2000) Selection of Marker-free transgenic plants using the oncogenes (ipt, rol A, B, C) of Agrobacterium as selectable markers, In Molecular Biology of Woody Plants. Kluwer Academic Publishers). 31
Muitos outros marcadores de selecção positivos, que conferem às plantas transformadas uma vantagem em termos de crescimento em comparação com as não-transformadas, e processos para a sua utilização encontram-se descritos em EP-A 0 601 092. De nomear, por exemplo, a β-glucuronidase (em ligação com por exemplo citoquinina-glucuronido), manose-6-fosfato-isomerase (em ligação com manose), UDP-galactose-4-epimerase (em ligação, por exemplo, com galactose), com particular preferência para a manose-6-fosfato-isomerase. ii) marcadores de selecção negativos
Os marcadores de selecção negativos permitem, por exemplo, a selecção de organismos com sequências eliminadas com sucesso e que abrangem genes marcadores (Koprek T et ai. (1999) Plant J 19(6):719-726). No caso de selecção negativa, um composto, por exemplo, sem desvantagem para a planta, é convertido num composto desvantajoso por meio do marcador de selecção negativo introduzido na planta. Também adequados são os genes que apresentam um efeito desvantajoso, como por exemplo timidina quinase (TK), fragmento da toxina A da difteria(DT-A), o produto do gene codA que codifica uma citosina deaminase (Gleave AP et al. (1999) Plant Mol Biol. 40 (2) :223-35; Perera RJ et al. (1993) Plant Mol. Biol 23(4): 793-799; Stougaard J (1993) Plant J 3:755-761), o gene citocromo P450 (Koprek et al. (1999) Plant J 16:719-726), genes que codificam uma haloalcana dealogenase(Naested H (1999) Plant J 18:571-576), o gene iaaH (Sundaresan V et al. (1995) Genes & Development 9:1797-1810) ou o gene tms2 (Fedoroff NV & Smith DL (1993) Plant J 3:273-289). 32
As concentrações utilizadas em cada caso para a selecção de antibióticos, herbicidas, biocidas ou toxinas têm de sofrer uma adaptação às condições ou organismos particulares de teste. Os exemplos que podem ser mencionados para plantas são a canamicina (Km) 50mgA, a higromicina B 40 mg/1, a fosfinotricina (ppt) 6 mgA. É também possível expressar analogias funcionais desses ácidos nucleicos que codificam marcadores de selecção. Analogias funcionais significam, aqui, todas as sequências que têm, substancialmente, a mesma função, i.e. são capazes de seleccionar organismos transformados. É, também, perfeitamente possível que a analogia funcional apresente diferentes características. Pode, por exemplo, possuir uma actividade mais elevada ou mais reduzida, ou possuir outras funcionalidades. 2. Uma melhorada protecção da planta contra factores de stress abiótico como a aridez, o calor e o frio, por exemplo, através da sobreexpressão de polipéptidos "anticongelantes" de Myoxocephalus Scorpius (WO 00/00512), Myoxocephalus octodecemspinosus, o activador de transcrição CBF1 da Arabidopsis thaliana, desidrogenases do glutamato (WO 97/12983, WO 98/11240), genes da quinase de proteínas independentes de cálcio(WO 98/26045), calcineurinas (WO 99/05902), famesil-transferases (WO 99/06580), Pei ZM et al., Science 1998, 282: 287-290), ferritina (Deak M et al., Nature Biotechnology 1999, 17:192-196), oxalatoxidase (WO 99/04013; Dunwell JM Biotechnology and Genetic Engeneering Reviews 1998, 15:1-32), Faktor DREB1A (dehydration response element B IA; Kasuga M et al., Nature Biotechnology 1999, 17:276-286), genes da 33 síntese de trealose ou manitol como a trealosefosfato sintase ou a trealosefosfato fosfatase (WO 97/42326), ou através da inibição de genes como a trealase (WO 97/50561). Os ácidos particularmente preferidos são os ácidos nucleicos que codificam o activador transcripcional CBF1 da Arabidopsis thaliana (Banco de genes Acc.: U77378) ou a proteína anticongelante de Myoxocephalus octodecemspinosus (Banco de genes Acc.-No.: AF306348) ou equivalentes funcionais. 3. Expressão de enzimas metabólicas para utilização nas áreas da alimentação animal e vegetal, por exemplo a expressão de fitases e celulases. É dada particular preferência aos ácidos nucleicos como o artificial cADN que codifica uma fitase microbial (Banco de genes Acc.-No.: A19451) ou equivalentes funcionais. 4. A concretização de uma resistência por exemplo a cogumelos, insectos, nematódeos e doenças através da secreção objectivada ou da acumulação de determinadas metabolitos e proteínas na epiderme do embrião. De mencionar, por exemplo, as glucosinolates (defesa contra herbívoros), quitinases ou gluconases e outras enzimas que destroem a parede da célula de parasitas, proteínas inibidoras de ribossoma (RIPs) e outras proteínas de resistência e respostas a stress, induzidas numa lesão ou ataque microbial, ou quimicamente por meio, por exemplo, de ácido salicílico, ácido jasmónico ou etileno, lisozimas de fontes não vegetais como por exemplo a lisozima T4 ou lisozima de vários mamíferos, proteínas insecticidas como a endotoxina Bacillus thuringiensis, inibidor da alfa-amilase ou inibidores da protease (inibidor da 34 tripsina do feijão frade), glucanases, lectinas como a fitohemaglutinina, a aglutinina do gérmen de trigo, RNAses ou ribozimas. É dada particular preferência aos ácidos nucleicos como os que codificam a endoquitinase (chit42) de Trichoderma harzianum (Banco de genes Acc.-No.: S78423) ou para as proteínas do citocromo P-450 multifuncional N-hidroxilante(CYP79) de Sorghum bicolor (Banco de genes Acc.-No.: U32624) ou equivalentes funcionais. 5. É conhecida a acumulação de glucosinolatos em plantas do género Cardales, especialmente a colza para proteger de pestes (Rask L et ai.(2000) Plant Mol Biol 42:93-113; Menard R et al. (1999) Phytochemistry 52:29-35), a expressão da endotoxina de Bacillus thuringiensis sob controlo do promotor 35S CaMV (Vaeck et al. (1987) Nature 328:33-37) ou a protecção do tabaco contra ataque fúngico através da expressão de uma quitonase do feijão com o controlo do promotor CaMV ((Broglie et al. (1991) Science 254:1194-119. A expressão do genes artificiais crylA(b) e crylA(c), que codificam as delta-endotoxinas específicas de Lepidoptera de Bacillus thuringiensis podem originar resistência a pestes de insectos em várias plantas. Desta forma, é possível atingir, no arroz, uma resistência a duas das principais pestes do arroz, o Chilo suppressalis e o Scirpophaga íncertulas), (Cheng X et al. (1998) Proc Natl Acad Sei USA 95 (6) :2767-2772; Nayak P et al. (1997) Proc Natl Acad Sei USA 94(6):2111-2116) 5. A expressão de genes que provoquem uma acumulação de produtos de química fina, como por exemplo, de 35 tocoferoles, tocotrienoles ou carotenóides. Um exemplo que pode ser mencionado é a desaturação de fitoeno. É dada particular preferência aos ácidos nucleicos que codificam a desaturação de fitoeno de Narcissus pseudonarcissus (Banco de genes Acc.-No.: X78815) ou equivalentes funcionais dos mesmos. 6. A produção de neutracêuticos como por exemplo os ácidos gordos polinsaturados, como por exemplo o ácido araquidónico ou EP (ácido eicosapentanóico) ou DHÀ (ácido docosahexanoico) através da expressão de elongases e/ou dessaturases de ácidos gordos e/ou da produção de proteínas com o valor nutricional melhorado como com, por exemplo, uma elevada quantidade de aminoácidos essenciais (por exemplo, gene da albumina 2S rica em metionina da Castanha-do-Brasil). É dada preferência aos ácidos nucleicos que codifiquem a albumina 2S rica em metionina de Bertholletia excelsa (Banco de genes Acc.-No.:AB044391, a Δβ-acilipido desaturase de Physcomitrella patens (Banco de genes Acc.-No.: AJ222 980; Girke et al. (1998) Plant J 15:39-48), a Δβ-desaturase de Mortierella alpina (Sakuradani et al. (1999) Gene 238:445-453), a A5-dessaturase de Caenorhabditis elegans (Michaelson et al. 1998, FEBS Letters 439:215-218), a A5-desaturação de ácidos gordos (des-5) de Caenorhabditis elegans (GenBank Acc.-No.: AF078796), a A5-desaturase de Mortierella alpina (Michaelson et al. J Biol Chem 273:19055-19059), a Δβ-desaturase de Caenorhabditis elegans (Beaudoin et al. (2000) Proc Natl. Acad Sei USA 97:6421-6426), a Δ6-elongase de Pyscomitrella patens (Zank et al. (2000) Biochemical Society Transactions 28:654-657) ou equivalentes funcionais. 36 7. A produção de produtos de química fina (como por exemplo as enzimas) e farmacêuticos (como os anticorpos ou vacinas, conforme descrito em Hood EE, Jilka JM. (1999) Curr Opin Biotechnol. 10(4) :382 — 6; Ma JK, Vine ND (1999) Curr Top Microbiol Immunol 236:275-92). Em plantas de milho transgénico, foi, por exemplo, possível produzir, em larga escala, avidine recombinante da clara de ovo de galinha e beta-glucuronisase bacterial (GUS) (Hood et al. (1999) Adv Exp Med Biol 464:127-47). Estas proteínas recombinantes de plantas do milho são comercializadas pela firma Sigma Chemicals Co. como produtos bioquímicos. 8. Atingir uma elevada capacidade de armazenamento em células que, normalmente, incluem poucas proteínas ou lípidos de armazenamento com o intuito de aumentar a capacidade de produção destas substâncias, por exemplo por meio da expressão de uma acetil-CoA-carboxilase. É dada particular preferência a ácidos nucleicos que codifiquem a acetil-CoA carboxilase (Accase) de Medicago sativa (Banco de genes Acc.-No.: L25042) ou equivalentes funcionais. São mencionados outros exemplos vantajosos em Dunwell JM (2000) J Exp Bot. 51 Spec No:487-96. É, também, possível expressar analogias funcionais desses ácidos nucleicos e proteínas. Analogias funcionais significam, aqui, todas as sequências que têm, substancialmente, a mesma função, i.e. são capazes da função (por exemplo, uma conversão de substrato ou transdução do sinal), como a proteína, também, mencionada como exemplo. É, também, perfeitamente possível que a 37 analogia funcional apresente diferentes características. Pode, por exemplo, possuir uma actividade mais elevada ou mais reduzida, ou possuir outras funcionalidades. Analogias funcionais significam, aqui, outras sequências que codificam as proteínas de fusão com uma das proteínas preferidas e outras proteínas, por exemplo uma outra proteína preferida ou, então, uma sequência do péptido sinal.
Com o controlo dos promotores da invenção, é possível a expressão de ácidos nucleicos em todos os compartimentos da célula, como por exemplo no sistema endomembranar, no vacúolo e nos cloroplastos. Por meio da utilização da via secretória, é possível a concretização de desejadas reacções de glicosilação. É, também, possível a secreção da proteína alvo para a superfície da célula ou a secreção para o meio de cultura, por exemplo no uso de células de cultura de suspensão ou proplastos. Por meio da utilização de uma adequada estratégia de clonagem, as sequências alvo necessárias podem ser tidas em conta em variações de vector individuais e introduzidas no vector, junto com o gene alvo a ser clonado. Como sequências alvo, podem ser utilizadas tanto as sequências intrínsecas do gene, quando presentes, como as hererólogas. Outras sequências alvo preferidas para a ligação funcional, mas não restrictas a esta situação, são as adicionais sequências heterólogas, no sentido de assegurar a localização subcelular em apoplastos, no vacúolo, em plastídeos, no mitocôndrias, no retículo endoplásmico (ER), no núcleo celular, em elaioplastos ou outros compartimentos; e nos "enhancers" da tradução como a sequência 5' "leader" do vírus mosaico do tabaco (Gallie et al. (1987) Nucl Acids Res 15 8693-8711) e afins. 0 processo para o transporte, para os plastídeos, de proteínas, que 38 não se encontram localizadas nos plastídeos de uma forma objectivada, encontra-se já descrita (Klosgen RB & Weil JH (1991) Mol Gen Genet 225(2):297-304/ Van Breusegem F et al. (1998) Plant Mol Biol 38 (3) : 491-496) . As sequências preferidas são a) pequenas subunidades (SSU) da ribulose-bisfosfato carboxilase (Rubisco ssu) de ervilha, milho, girassol b) péptidos de trânsito derivados de genes da biossintese de ácidos gordos vegetais como o péptido de trânsito da "Acyl Carrier Protein" (ACP) plastidica, a estearil-ACP-dessaturase, a β-ketoacil-ACP sintase ou a acil-ACP-tioesterase. c) péptidos de trânsito para GBSSI ("Starch Granule
Bound Starch Synthase I") d) gene LHCP II.
As sequências alvo podem ser ligadas a outras sequências alvo que difiram das sequências que codifiquem o péptido de trânsito, no sentido de assegurar a localização subcelular em apoplastos, no vacúolo, em plastideos, no mitocôndrias, no retículo endoplásmico (ER), no núcleo celular, em elaioplastos ou outros compartimentos. É, igualmente, possível utilizar "enhancers" da tradução como a sequência 5' "leader" do vírus mosaico do tabaco (Gallie et al. (1987) Nucl Acids 15:8693-8711) e afins. O especialista tem, também, conhecimento de que não tem de realizar a expressão dos genes acima descritos, directamente por meio do uso de sequências de ácidos 39 nucleicos que codificam este genes, ou de reprimi-los através da mutação antisense. Pode, também, utilizar, por exemplo, os factores de transcrição artificiais do tipo de proteínas de dedos de zinco (Beerli RR et al. (2000) Proc Natl Acad Sei USA 97(4):1495-500). Estes factores estão armazenados nas zonas reguladoras dos genes endógenos a expressar ou reprimir, e resultam, dependendo do factor, na expressão ou repressão do gene endógeno. Sendo assim, os efeitos desejados podem, igualmente, ser atingidos por meio da expressão de um apropriado factor da transcrição dos dedos de zinco com o controlo de um dos promotores da invenção. Por meio de "Silencing" dos genes, as cassetes de expressão da invenção podem, também, ser utilizadas para suprimir ou reduzir a replicação ou/e tradução de genes alvo.
As cassetes de expressão da invenção podem, também, ser utilizadas para a expressão de ácidos nucleicos que medeiem os chamados efeitos "antisense" e podem, pois, por exemplo, reduzir a expressão de uma proteína alvo.
Os genes e proteínas de preferência, cuja supressão seja uma condição para o vantajoso fenótipo, incluem, a título exemplificativo, mas não restritivo a) poligalacturonase para prevenir a degradação de células e a deterioração de plantas e frutos, como o tomate por exemplo. Preferidas são as sequências de ácidos nucleicos como o gene da poligalacturonase do tomate (Banco de genes Acc.-No.: X14074) ou homólogas de outras espécies e tipos. 40 b) redução da expressão proteínas alergénicas como, por exemplo, as descritas em Tada Y et al. (1996) FEBS Lett 391(3):341-345 oder Nakamura R (1996) Biosci Biotechnol Biochem 60(8):1215-1221. c) alteração da cor das flores por meio da supressão da expressão de enzimas da biossíntese de antocianina. Encontram-se descritos os respectivos procedimentos (por exemplo, em Forkmann G, Martens S. (2001) Curr Opin Biotechnol 12(2):155-160). Preferidas são as sequências de ácidos nucleicos como a flavonóide-3'-hidroxilase (Banco de genes Acc.-No.: AB045593), a diidroflavanol-4-reductase (Banco de genes Acc.-No.: AF017451), a calcona isomerase (Banco de genes Acc.-No.: AF017451), a calcona sintase (Banco de genes Acc.-No.: AB061022), a flavanona 3-beta-hidroxilase (Banco de genes Acc.-No.: X72592) ou a flavona sintase II (Banco de genes Acc.-No.: AB045592) ou homólogas de outras espécies e tipos. d) modificação do conteúdo de amilose/amilopectina em termos de quantidade e por meio da supressão da enzima ramificadora Q, responsável pela ligação alfa-1,6-glicosídeo. Encontram-se descritos os respectivos procedimentos (por exemplo, em Scwall GP et al. (2000) Nat Biotechnol 18(5):551-554). Preferidas são as sequências de ácidos nucleicos como a enzima ramificadora do amido (Banco de genes Acc.-No.: AR123356; US 6,169,226) ou homólogas de outros géneros e tipos.
Um ácido nucleico „antisense" significa, primeiramente, uma sequência de ácidos nucleicos, que é, totalmente ou em 41 parte, complementar de, pelo menos, uma parte da cadeia da dita proteína alvo. Como matriz de partida para a respectiva construção "antisense", o especialista sabe que pode usar, de forma alternativa, o cADN ou o gene correspondente. 0 ácido nucleico "antisense" é, preferencialmente, complementar à região da proteína alvo que codifica, ou a uma parte desta. 0 ácido nucleico "antisense" pode, igualmente, ser complementar à região da proteína alvo que não codifica, ou a uma parte desta. Partindo da informação da sequência para uma proteína alvo, um ácido nucleico "antisense" pode ser concebido de uma forma familiar ao especialista, tomando em consideração as regras do par de bases de Watson e Crick. Um ácido nucleico "antisense" pode, preferencialmente, ser complementar a toda, ou parte, da sequência de ácidos nucleicos de uma proteína alvo. De acordo com uma concretização preferida, o ácido nucleico "antisense" é um oligonucleótido com um comprimento de, por exemplo, 15, 20, 25, 30, 35, 40, 45 ou 50 nucleótidos.
Os ácidos nucleicos "antisense" incluem, numa concretização preferida, moléculas de ácidos nucleicos de configuração alfa-anomérica. As moléculas de ácidos nucleicos de configuração alfa-anomérica formam híbribos especiais em cadeia dupla com ARN complementar, no qual as cadeias correm paralelamente, em contraste com as normais unidades beta (Gaultier at al. (1987) Nucleid Acids Res 15:6625-6641).
Também incluída está a utilização das sequências acima descritas em orientação "sense" que, do conhecimento do especialista, pode levar a um co-supressão A expressão de "sense" de ARN para um gene endógeno pode reduzir ou 42 desligar a respectiva expressão, de forma similar à descrita para as abordagens "antisense" (Goring et al. (1991) Proc Natl Acad Sei USA 88:1770-1774; Smith et al. (1990) Mol Gen Genet 224:447-481; Napoli et al. (1990) Plant Cell 2:279-289; Van der Krol et al. (1990) Plant Cell 2:291-299). A construção introduzida pode, assim, representar, no todo ou em parte, o gene a reduzir. A possibilidade de tradução não é necessária. É, também, de especial preferência, a utilização de processos com a regulação de genes por meio de ARN em cadeia dupla ("double-stranded RNA interference") . São do conhecimento do especialista os respectivos processos, encontrando-se estes descritos de forma pormenorizada (por exemplo, Matzke MA et al. (2000) Plant Mol Biol 43:401-415; Fire A. et al (1998) Nature 391:806-811; WO 99/32619; WO 99/53050; WO 00/68374; WO 00/44914; WO 00/44895; WO 00/49035; WO 00/63364). É feita uma referência expressa aos processos e métodos descritos nas referências indicadas. Por meio da introdução simultânea de cadeia e cadeia complementar, é, aqui, originada uma supressão altamente eficiente de genes nativos. É possivel e vantajoso, acoplar a estratégia "antisense" com um processo de ribozima. As ribozimas são, cataliticamente, sequências de ARN activas que, acopladas com sequências "antisense", clivam de forma catalítica, as sequências alvo (Tanner NK. FEMS Microbiol Rev. 1999; 23 (3):257-75). O que poderá aumentar a eficácia de uma estratégia "antisense". É do conhecimento de especialista a expressão de ribozimas no sentido da redução de determinadas proteínas, encontrando-se descrita, por exemplo, em EP-A1 0 291 533, EP-A1 0 321 201 e EP-A1 43 Ο 360 257. Podem ser determinadas sequências alvo e ribozimas adequadas, conforme, por exemplo, descreve Steinecke (Ribozymes, Methods in Cell Biology 50, Galbraith et al. eds. Academic Press, Inc. (1995), 449-460), por meio de cálculos de estrutura secundária de ARN ribossómico e ARN alvo, bem como através da respectiva interacção (Bayley CC et al., Plant Mol Bi 1992; 18 (2) : 353-361; Lloyd AM and Davis RW et al., Mol Gen Genet. 1994 Mar;242 (6) : 653-657) . Os exemplos que devem ser nomeados são as ribozimas "hammerhead"(Haselhoff and Gerlach (1988) Nature 334:585-591) . As ribozimas preferidas são baseadas em derivados da Tetrahymena L-19 IVS RNA (US 4 987 071; US 5 116 742) . Podem ser seleccionadas outras ribozimas com selectividade para um L119 ARNm (Bartel D und Szostak JW (1993) Science 261:1411-1418).
Numa outra variante, a expressão da proteína alvo pode ser reduzida utilizando sequências de ácidos nucleicos que sejam complementares aos elementos regulatórios dos genes da proteína alvo, formem com estes uma estrutura hélica tripla e previnam a transcrição do gene (Helene C (1991) Anticancer Drug Des. 6(6):569-84,- Helene C et al. (1992) Ann NY Acad Sei 660:27-36; Mâher LJ (1992) Bioassays 14(12):807-815) .
Os promotores bidireccionais da invenção são, particularmente, vantajosos quando esta é utilizada para regular duas enzimas de uma via metabólica. Por exemplo, a 2'-metil-fitilhidroquinona metiltransferase e a homogentisate fifilpirofosfatotransferase podem, simultaneamente, ser expressas por meio de um dos promotores da invenção, originando um aumento de tocoferoles. Para além disso, a inibição da homogentisate 44 dioxigenase (por exemplo, através da expressão de um ARNds correspondente) e a sobre expressão da tirosina aminotransferase conduz a um aumento no conteúdo de tocoferoles. No metabolismo dos carotenóides, a inibição da alfa-ciclase e a sobreexpressão da beta-ciclase provoca uma alteração no conteúdo de alfa-caroteno e beta-caroteno. É possivel evitar efeitos pós-transcripcionais de "silencing" por meio da inibição paralela da transcrição do gene SDE3 e da sobreexpressão da proteina recombinante (Wo 02/063039).
As partes de anticorpos imunologicamente activas podem, igualmente, ser expressas, de forma vantajosa, por meio da utilização dos promotores da invenção. Como tal, por exemplo, a cadeia pesada de um anticorpo IgGl pode ser expressa numa direcção, e a cadeia leve na outra direcção. Após a tradução, ambos constroem um anticorpo funcional (Wo 02/101006).
Uma outra possibilidade é a expressão simultânea de transportadores de iões relacionados com stress, junto com genes de herbicidas, no sentido de aumentar a tolerância aos efeitos ambientais.
Muitas enzimas são compostas por duas ou mais sub-unidades, ambas necessárias ao funcionamento. Por meio de um dos promotores bidireccionais da invenção, é possivel a expressão simultânea de duas sub-unidades. Um exemplo é a sobreexpressão das alfa e beta sub-unidades da FSH.
No sentido de estabelecer sistemas de transformação regulados por este promotor bidireccional, é, 45 particularmente, valiosa uma construção composta por um gene para o marcador de selecção e um gene repórter.
As cassetes de expressão da invenção e os vectores dai derivados podem compreender outris elementos funcionais. 0 termo "elemento funcional" deve ser, genericamente, entendido e inclui todos os elementos com uma influência na produção, multiplicação ou função tanto das cassetes de expressão da invenção, como dos vectores ou organismos dai derivados. Podem, por exemplo, ser mencionados os seguintes exemplos não-restritivos: a) genes repórter
Os genes ou proteinas repórter codificam, facilmente, proteínas quantificáveis e asseguram, por meio de actividade intrínseca da cor ou enzimática, uma avaliação da eficácia da transformação ou do local ou do "timing" da expressão (Schenbom E & Groskreutz D (1999) Mol Biotechnol 13(1):29-44). Podem, por exemplo, ser mencionados os seguintes exemplos: - „proteína fluorescente verde" (GFP)(Chui WL et al.,
Curr Biol 1996, 6:325-330; Leffel SM et al.r
Biotechniques. 23 (5):912-8, 1997; Sheen et al. (1995)
Plant Journal 8 (5):777-784; Haseloff et al.(1997) Proc Natl Acad Sei USA 94 (6):2122-2127,- Reichel et al. (1996) Proc Natl Acad Sei USA 93(12):5888-5893,- Tian et al. (1997) Plant Cell Rep 16:267-271; WO 97/41228). - cloranfenicol transferase (Fromm et al. (1985) Proc Natl Acad Sei USA 82:5824-5828), 46 -luziferase (Millar et al. (1992) Plant Mol Biol Rep 10:324-414; Ow et al. (1986) Science, 234:856-859); permite a detecção de bioluminescência. - a beta-galactosidade codifica uma enzima para a qual estão disponíveis vários substratos cromogénicos. - beta-Glucuronidase (GUS) (Jefferson et al. (1987) EMBO J 6:3901-3907) ou o gene uidA que codifica um enzima para vários substratos cromogénicos. - o produto do gene R-Locus: proteína que regula a produção de pigmentos antocianinos (coloração vermelha) em tecidos vegetais e, desta forma, possibilita a análise directa da actividade do promotor sem adicionar auxiliares adicionais ou substratos cromogénicos (Dellaporta et al., In: Chromosome Structure and Function: Impact of New Concepts, 18th Stadler Genetics Symposium 11:263-282, 1988). - a beta-lactamase (Sutcliffe 1978) Proc Natl Acad Sei USA J 75:3737-3741), enzima para diferentes substratos cromogénicos (por exemplo, o PADAC, uma cefalosporina cromogénica). - o produto do gene xylE (Zukowsky et al. (1983) Proc Natl Acad Sei USA 80:1101-1105), a catecol dioxigenase, que pode converter catecoles cromogénicos. - a alfa-amilase (Ikuta et al. (1990) Bio/Technol. 8:241-242) . 47 - tirosinase (Katz et al. (1983) J Gen Microbiol 129:2703-2714, enzima que oxida a tirosima em DOPA e dopaquinona, que subsequentemente formam a melanina de fácil detecção. - a equorina (Prasher et al.(1985) Biochem Biophys Res Commun 126(3):1259-1268) pode ser utilizada na detecção de bioluminescência sensível ao cálcio. b) as origens de replicação que asseguram uma multiplicação das cassetes ou vectores de expressão da invenção, por exemplo, em E. coli. De nomear, por exemplo, a chamada ORI (origem de replicação de ADN, a ori pBR322 ou a ori P15A (Sambrook at al.: Molecular Cloning. A Laboratory Manual, 2nd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989) . c) elementos, como por exemplo, as "sequências de border" que possibilitam uma transferência mediada por agrobatérias em células vegetais no sentido da transferência e integração para o genoma vegetal, como a extremidade direita ou esquerda do T-ADN ou da região vir. d) as múltiplas regiões de clonagem (MCS) permitem e facilitam a inserção de uma ou mais sequências de ácidos nucleicos. São conhecidos dos especialistas diferentes caminhos no sentido de conseguir uma cassete de expressão da invenção. A produção de uma cassete de expressão da invenção tem lugar, por exemplo, por meio da fusão de um dos promotores da invenção (ou de um equivalente funcional ou parte 48 equivalente funcionalmente, como descrito em SEQ ID NO: 1 ou 2, ou de um equivalente funcional com uma sequência de ácidos nucleicos a expressar; se adequado com uma sequência que codifique um péptido de trânsito, preferencialmente um péptido de trânsito especifico de cloroplasto, preferencialmente disposto entre o promotor e a respectiva sequência de ácidos nucleicos, bem com um terminador ou sinal de poliadenilação. Para este objectivo, são, pois, utilizadas técnicas convencionais de recombinação e clonagem (conforme acima descrito) .
Contudo, a cassete de expressão, também, compreende construções, nas quais o promotor, sem ter sido previamente ligado a uma sequência de ácidos nucleicos, é introduzido no genoma hospedeiro, por meio, por exemplo, de uma recombinação homóloga objectivada ou de uma inserção aleatória; ai, assume o controlo regulatório das sequências de ácidos nucleicos funcionalmente ligados a este e controla a respectiva expressão. A inserção do promotor, -por meio, por exemplo, de uma recombinação homóloga - em frente a um ácido nucleico que codifica um determinado polipéptido, resulta numa cassete de expressão da invenção que controla a expressão desse polipéptido na planta. A inserção do promotor pode, igualmente, ter lugar por meio da expressão da mutação antisense de ARN para os ácidos nucleicos que codificam um determinado polipéptido. Desta forma, a expressão de determinado polipéptido em plantas é regulada negativamente ou desligada. É, igualmente, e de forma análoga, possível, a expressão de uma sequência de ácidos nucleicos, por meio, por exemplo, de uma recombinação homóloga, atrás do promotor natural endógeno, resultando na cassete de 49 expressão da invenção que controla a expressão da sequência de ácidos nucleicos a expressar transgenicamente. Os vectores que compreendem as cassetes de expressão acima mencionadas encontram-se, também, de acordo com a invenção. Os vectores podem, por exemplo, ser plasmideos, cosmideos, fagos, virus ou outras agrobatérias.
Um outro aspecto da invenção refere-se, igualmente, a organismos transgénicos transformados com, pelo menos, uma cassete de expressão ou um vector da invenção, bem como a células, culturas celulares, tecidos, partes - por exemplo, de folhas, raízes, etc. de organismos vegetais - ou material de reprodução derivado desses organismos.
Organismo, organismos inciais ou hospedeiros significam organismos.
No âmbito da invenção, encontram-se incluídos todos os géneros e espécies de plantas superiores e inferiores do reino vegetal. Estão, igualmente, incluídas as plantas maduras, sementes, rebentos e plântulas, bem como partes daí derivadas, e material e culturas de reprodução, como por exemplo culturas celulares. As plantas maduras incluem plantas em qualquer estado de desenvolvimento além da fase de plântula. Plântula significa uma planta jovem e imatura num inicial estado de desenvolvimento.
As plantas anuais, pereniais, monocotiledónias e dicotiledónias correspondem aos organismos hospedeiros preferidos para a produção de plantas transgénicas. São preferidas as plantas das seguintes famílias: Amaranthaceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae, Compositae, Cruciferae, Cucurbitaceae, 50
Labiatae, Leguminosas, Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, Rubiaceae, Saxifragaceae,
Scrophulariaceae, Solanacea, Sterculiaceae, Tetragoniacea, Theaceae, Umbelliferae.
As plantas monocotiledónias preferidas são, em especial, seleccionadas de plantas de culturas monocotiledónias como, por exemplo, as da família das Gramineae como o arroz, o milho, o trigo ou outras espécies de cereais como a cevada, o milho painço, o centeio, o triticale ou a aveia, ou a cana-de-açúcar e outras espécies de gramíneas.
As plantas dicotiledónias são, em especial, seleccionadas de plantas de culturas dicotiledónias, como por exemplo - as Asteraceae como o girassol, a Tagetes patula ou a calêndula e muitas outras, - as Compositae, em especial do género Lactuca, e nomeadamente da espécie sativa (alface) e outras mais, as Cruciferae, em especial do género Brassica, nomeadamente da espécie napus (colza), campestris (beterraba), oleracea cv Tastie (couve), oleracea cv Snowball Y (couve-flor) e oleracea cv Emperor (bróculos) e outras espécies de couve; e do género Arabidopsis, muito em especial da espécie thaliana e outras mais, as Cucurbitaceae como o melão, o pepino ou a aboborinha e outras mais, 51 as Leguminosae, em especial do género Glycine, nomeadamente da espécie max (soja), soja e alfalfa, ervilha, leguminosas ou amendoim e outras mais - as Rubiaceae, preferencialmente da subclasse das Lamiidae como por exemplo a Coffea arabica oder Coffea liberica (arbusto do café) e outras mais, - as Solanaceae, em especial do género Lycopersicon, nomeadamente da espécie esculentum (tomate) e do género Solanum, muito particularmente da espécie tuberosum (batata) e melongena (beringela), bem como o tabaco ou a pimento e outras mais, - as Sterculiaceae, preferencialmente da subclasse das Dílleniidae, como por exemplo o Theobroma cacao (cacau) e outras mais, as Theaceae, preferencialmente da subclasse das Dílleniidae, como por exemplo a Camellia sinensis ou a Thea sinensis (chá) e outras mais, - as Umbelliferae, nomeadamente do género Daucus (muito especialmente da espécie carota (cenoura) e Apium (muito particularmente da espécie graveolens dulce (aipo-rábano) e outras mais; e do género Capsicum, muito especialmente da espécie annum (pimenta) e outras mais, como o linho, a soja, o algodão, o cânhamo, o pepino, o espinafre, a cenoura, a beterraba sacarina e outras espécies de árvores, frutos secos e videiras, nomeadamente a banana e o quivi. 52 É dada preferência à Nicotiana tabacum, à Tagetes erecta e à Calendula officinalis, e não só a todos os géneros e espécies utilizados para a alimentação humana e animal, como os cereais acima descritos, bem como os adequados para a produção de óleos, como as sementes oleaginosas (como a colza), as espécies de frutos secos, a soja, o girassol, a abóbora e o amendoim. A maior preferência vai para todas as plantas da família das Brassicaceae, nomeadamente da espécie Brassica, como as seguintes: Brassica napus (colza), campestris (beterraba), oleracea cv Tastie (couve), oleracea cv Snowball Y (couve-flor) e oleracea cv Emperor (bróculos) e outras espécies de couve; e do género Arabidopsis, muito em especial da espécie thaliana. Os organismos vegetais, no sentido dos objectivos da invenção, são, adicionalmente, organismos fotossinteticamente activos, como por exemplo as algas, as ciano-bactérias e o musgo. As algas preferidas são as algas verdes, como por exemplo as algas do género Haematococcus, Phaedactylum tricomatum, Volvox ou Dunaliella. É dada particular preferência às algas dos géneros Chlorophyceae, Phaeophpyceae, Rhodophyceae, Myxophyceae, Xanthophyceae, Bacillariophyceae (Diatomeen) e Euglenophyceae.
A produção de um organismo modificado ou de uma célula modificada requer a introdução do adequado ADN na célula hospedeira apropriada. Para este processo, referido como transformação, é necessário um grande número de métodos (ver também Keown et al. (1990) Methods in Enzymology 185:527-537). Desta forma, o ADN pode, por exemplo, ser introduzido, de forma directa, por meio de microinjecção ou bombardeamento com as micropartículas recobertas de ADN. A 53 célula pode, igualmente, ser permeabilizada quimicamente, por exemplo com polietileno glicol, por forma a que o ADN possa entrar na célula por difusão. 0 ADN pode, também, ter lugar por meio de uma fusão de protoplastos com outras unidades que contenham o ADN, como as mini-células, as células, os lisosomas ou os liposomas. A electroporação é um outro método adequado para a introdução de ADN, através do qual as células sofrem uma permeabilização reversível por meio de um impulso eléctrico.
No caso das plantas, e no sentido da transformação trasiente e estável, são usados os métodos descritos para a transformação e regeneração de plantas a partir de tecidos ou células vegetais. Métodos adequados são, particularmente, a transformação de protoplastos através de polietileno glicol introduzido na absorção de ADN, o processo biolistico que utiliza uma pistola génica, o chamado processo de bombardeamento de partículas, a eletroporação, a incubação de embriões secos na solução de ADN e a microinjecção.
Para além destas técnicas de transformação "directa", a transformação pode ser levada a cabo por meio de uma infecção bacteriana com Agrobacterium tumefaciens ou Agrobaterium rhizogenes. Estas cadeias contêm um plasmídeo (Ti ou Ri) que é transferido para a planta após a infecção com Agrobaterium. Uma parte desse plasmídeo, conhecido com T-ADN (ADN transferido) é integrado no genoma da célula vegetal. A transformação mediada por Agrobaterium é a mais indicada para células vegetais dicotiledónias e diplóides, 54 enquanto que as técnicas de transformação directa são adequadas para todos os tipos de células. A introdução nas células vegetais da cassete de expressão da invenção pode ser, de forma vantajosa, conseguida por meio d vectores.
Numa variante vantajosa, a introdução da cassete de expressão é realizada por meio de vectores de plasmideo. Os vectores preferidos são os que possibilitam uma integração estável da cassete de expressão no genoma hospedeiro.
No caso da injecção ou da electroporação de ADN em plantas vegetais, não existem requisitos especiais para o plasmideo utilizado. Podem ser usados plasmideos simples como os da série pUC. Para a regeneração de plantas completas a partir de células transformadas, é necessária a presença no plasmideo de um marcador de selecção adicional.
Encontram-se descritas técnicas de transformação para os vários organismos vegetais monocotiledónias e dicotiledónias. Para além disso, estão disponíveis vários vectores plasmidicos possíveis para a introdução de genes estrangeiros em plantas que, regularmente, contêm uma origem de replicação para a replicação em E. coli e um gene marcador para a selecção de bactérias transformadas. Exemplos são os pBR322, da série pUC, da série M13mp, PACYC184 etc. A cassete de expressão pode ser introduzida no vector por meio de um adequado ponto de corte de restrição. 0 plasmideo resultante é, depois, introduzido em E. coli. São seleccionadas e cultivadas E. Colis transformadas 55 correctamente, e o plasmídeo recombinante é isolado por meio de métodos familiares ao especialista. A análise e a sequencialização de restrição podem ser, então, utilizadas para verificar a fase de clonagem.
As células transformadas, ou seja as que incluem o ADN introduzido e integrado no ADN da célula hospedeira, podem ser seleccionadas de células não transformadas, se um marcador seleccionável for uma parte integrante do ADN introduzido. Qualquer gene que possa conferir resistência a antibióticos ou herbicidas pode, por exemplo, ser marcador. As células transformadas, que expressem um gene marcador deste tipo, estão em condições de sobreviver na presença de concentrações de um adequado antibiótico ou herbicida que mate um tipo selvagem não transformado. Exemplos são gene bar que oferece resitência ao herbicida fosfinotricina(Rathore KS et al., Plant Mol Biol. 1993 Mar; 21(5):871-884), o gene nptll que confere resistência à canamicina, o gene hpt com resitência à higromicina, ou o gene EPSP que proporciona resistência contra o herbicida glifosato. Dependendo do método para a introdução de ADN, podem ser necessários outros genes no plasmídeo do vector. Se forem utilizadas agrobactérias, a cassete de expressão deve ser integrada nos plasmídeos especiais, ou no vector intermédio (em inglês: vector "shuttle") ou num vector binário. Se, por exemplo, se recorrer à utilização de um plasmídeo Ti ou Ri, a extremidade direita, na maior parte dos casos a extremidade direita e esquerda do T-ADN do plasmídeo Ti ou Ri, é ligada, como região flanqueante, à cassete de expressão. São, preferencialmente, utilizados vectores binários. Os vectores binários podem replicar tanto em E. coli como em Agrobacterium. Possuem, normalmente, um gene de marcador de selecção e um "linker" 56 ou "polilinker" flanqueado pela sequência da extremidade direita e esquerda do T-ADN. Podem ser, directamente, transformados em Agrobaterium (Holsters et al. (1978) Mol. Gen. Genet. 163:181-187). 0 gene marcador de selecção permite uma selecção das agrobactérias transformadas e é, por exemplo, o gene nptll que oferece uma resistência à canamicina. A agrobactéria que, neste caso, corresponde ao organismo hospedeiro deverá conter, já, um plasmideo com a região vir. Uma situação necessária para a transferência do T-ADN para a célula vegetal. Uma agrobactéria transformada desta forma pode ser utilizada para transformar células vegetais.
A utilização do T-ADN para a transformação de células vegetais tem sido, fortemente, investigada e descrita (EP 120516; Hoekema, In: The Binary Plant Vector System, Offsetdrukkerij Kanters B.V., Alblasserdam, Chapter V; Fraley et al. (1986) CRC Crit. Rev. Plant. Sei., 4:1-46 and An et al. (1985) EMBO J. 4:277-287). São conhecidos diversos vectores binários e alguns encontram-se disponível em termos comerciais, como por exemplo o pBIN19 (Clontech Laboratories, Inc. U.S.A.) Para uma transferência do ADN para uma célula vegetal, são cocultivados os explantes vegetais com Agrobacterium tumefaciens ou Agrobaterium rhizogenes. Partindo de material vegetal infectado (por exemplo, de partes de folhas, da raiz ou do caule, mas também protoplastos ou suspensões de células vegetais), é possível regenerar plantas inteiras por meio da utilização de um meio adequado que possa incluir, por exemplo, antibióticos ou biocidas no sentido da selecção de células transformadas. As plantas resultantes podem, então, ser analisadas em termos da presença do ADN introduzido, neste caso a cassete de expressão da invenção. Assim que o ADN 57 esteja integrado no genoma hospedeiro, o tipo de gene corresponente fica, normalmente, estável e a respectiva inserção marca presença nas gerações posteriores. A cassete de expressão integrada inclui, em regra, um marcador de selecção (ver acima). 0 marcador de selecção permite a selecção de células transformadas de não transformadas (McCormick et al. (1986) Plant Cell Rep 5:81-84). As plantas resultantes podem crescer e cruzarem de forma normal. Deveriam ser cultivadas duas ou mais gerações, no sentido de garantir que a integração genómica estabilize e transite para as gerações posteriores.
Estes processos conhecidos encontram-se descritos, por exemplo, em B. Jenes et al., Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, publicados por Kung SD & Wu R, Academic Press (1993), S.128 - 143, e divulgados em Potrykus I (1991) Annu Rev Plant Physiol Plant Mol Biol 42:205-225). A construção a expressar é, preferencialmente, clonada num vector que é adequado para a transformação de Agrobacterium tumefaciens, por exemplo o pBinl9 (Bevan et al. (1984) Nucl Acids Res 12 : 8711f.)
Assim que tenha sido produzida uma célula vegetal, pode ser obtida uma planta completa com o recurso a processos conhecidos do especialista. Veja-se o exemplo das culturas de callus. A formação de rebentos e raizes destas massas de células indiferenciadas pode ser induzida de uma forma já conhecida. Os rebentos resultantes podem ser plantados e crescer. A eficácia da expressão de ácidos nucleicos expressos transgenicamente pode, por exemplo, ser medida in vitro por 58 meio de reprodução de rebentos com o recurso a um dos métodos acima descritos. De acordo com a invenção, as células, culturas celulares, partes - por exemplo, de folhas, raízes, etc. no caso de organismos de plantas transgénicas -, e material de reprodução como sementes ou frutos, são derivados dos organismos transgénicos acima descritos.
As plantas da invenção geneticamente transformadas que podem ser consumidas pelos humanos e pelos animais podem, também, ser utilizadas como produtos alimentares para os humanos e para os animais, directamente ou após a já conhecida preparação. Um outro aspecto da invenção refere-se à utilização dos organismos transgénicos acima descritos e de células, culturas celulares, partes - por exemplo, de folhas, raizes, etc. no caso de organismos de plantas transgénicas -, bem como material de reprodução genética como sementes ou frutos derivados, no sentido da produção de géneros alimentícios para os humanos e para os animais, não descurando a preparação de produtos 'farmacêuticos e de química fina. É dada, também, preferência, a um processo para a produção recombinante de produtos farmacêuticos ou de química fina em organismos hospedeiros; um organismo hospedeiro é transformado com uma das cassetes ou vectores de expressão acima descritos e esta cassete de expressão compreende um ou mais genes estruturais que codificam o químico fino objectivado ou catalizam a biossíntese desse mesmo produto químico, sendo o organismo hospedeiro cultivado, e o desejado produto químico isolado do meio onde a cultura se desenvolve. Este processo é, largamente, utilizado para produtos de química fina como enzimas, 59 vitaminas, aminoácidos, açucares, ácidos gordos, aromatizantes ou corantes de cariz natural ou artificial. É, também, preferida a produção de tocoferoles e tocotrienoles, bem como de carotinóides. A cultura de organismos hospedeiros transformados, bem como o isolamento de organismos hospedeiros e de meios de cultura é levada a cabo através de processos já conhecidos do especialista. A produção de produtos de quimica fina, como por exemplo anticorpos ou vacinas encontra-se descrita em Hood EE, Jilka JM. (1999). Curr Opin Biotechnol 10(4):382-6,- Ma JK, Vine ND (1999). Curr Top Microbiol Immunol 236:275-92.
Sequências 1. SEQ ID NO: 1 Promotor bidireccional de Arabidopsis thaliana. Regiões intergénicas entre o gene putativo FD e o gene putativo OASTL até ao assumido começo da transcrição. 2. SEQ ID NO: 2 Promotor bidireccional de Arabidopsis thaliana, inclusivamente das regiões 5' não traduzidas do gene putativo FD e do gene putativo OASTL até antes do "ATG-Start-Codon". Comparativamente com a sequência nativa, a presente sequência inclui um C adicional na posição 4 (contrariamente à sequência nativa de Arabidopsis), por meio da introdução de uma sequência de reconhecimento BamHI. 3. SEQ ID NO: 3
Sequência do plasmideo pUH200. O gene GUS é expresso na direcção do gene FD, 60 e o gene nptll na direcção do gene OASTL. 4. SEQ ID NO: 4 Sequência do plasmídeo pUH201. O gene GUS é expresso na direcção do gene OASTL, e o gene nptll na direcção do gene FD. 5. SEQ ID NO: 5 oligonucleotídeo "primer" pFD3 5'- acggatccgagagacagagagacggagacaaaa-3' 6. SEQ ID NO: 6 oligonucleotídeo "primer" pFD4 5'- gcggatccaagcttcactgcttaaattc-3' Descrição das Figuras
Fig. 1: Apresentação esquemática da unidade bidireccional nos vectores UH200 e UH201. RB: Extremidade direita ("Border") da agrobactéria T-DNA; CATpA: Terminadores do inibidor da catepsina D; nptll: gene da neomicina fosfotransferase II (gene resistente à canamicina); FD: Regiões intergénicas entre o gene FD e o gene OASTL (+/- indicam a direcção de leitura do gene FD); GUS: gene da beta-glucuronidase; 35SpA: Terminador do gene 35S CaMV; LB: Extremidade esquerda ("Border") da agrobactéria T-DNA.
Fig. 2: Análise da actividade GUS em folhas de plantas transgénicas da colza transformadas com UH200 (orientação do gene da ferredoxina) ou UH201 (orientação do gene OASTL), comparada com as plantas do tipo selvagem (WT). São mostrados os resultados de várias linhas de UH200 e UH201 de plantas de colza transformadas (identificadas com o 61 número da respectiva linha no eixo x) . A actividade GUS é indicada pMol metilumbeliferona (MU) / mg (Proteína) min.
Exemplos Métodos gerais A síntese química de oligonucleotídeos pode, por exemplo, ser levada a cabo, de forma já conhecida, através do método de fosfoamidite (Voet, Voet, 2aedição, Wiley Press New York, Páginas 896-897) . As fases da clonagem realizadas com o objectivo da presente invenção, como por exemplo os pontos de restrição, as electroforeses em gel de agarose, a purificação de fragmentosde ADN, a transferência de ácidos nucleicos para membranas de nitrocelulose e nilon, a ligação de fragmentos de ADN, a transformação de células de E.coli, a cultura de bactérias, a replicação de fagos e a análise sequencial de ADN recombinante têm lugar de acordo com o descrito em Sambrook et al. (1989) Cold
Spring Harbor Laboratory Press; ISBN 0-87969-309-6. As moléculas de ADN recombinante são sequencializadas por meio de do método de Sanger (Sange et al. (1977) Proc Natl Acad Sei USA 74:5463-5467).
Exemplo 1: O isolamento de ADN genómico de Arabidopsis thaliana, tabaco e colza O ADN genómico de Arabidopsis thaliana, tabaco e colza foi isolado com o recurso ao "DNeasy Plant Mini Kit" de Qiagen Kat. No. 60106, e de acordo com as respectivas normas. 62
Exemplo 2: Transformação de tabaco e colza A transformação de tabaco ocorre com a infecção de Agrobacterium tumefaciens, de acordo com o método desenvovido por Horsch (Horsch et ai. (1985) Science 227: 1229-1231). Todas as construções utilizadas para a transformação em Agrobacterium tumefaciens foram transformadas através do método congelamento/descongelamento (repetidos congelamentos e descongelamentos). As colónias de agrobactérias que contêm a construção objectivada foram seleccionadas no meio YEB(1 % extracto de carne de bovino (Difco), 0,5% de caseína enzima-hidrolisato, 0,1% de extracto de aveia(Duchefa), 0,5% de sacarose, 2 mM MgS04, 1,5% de agar) -meio com 50 yg/ml de canamicina, 40 pg/ml de gentamicina, 100 yg/ml de espectinomicina e 25 pg/ml de rifampicina. As plantas do tabaco (Nicotiana tabacum L. cv. Samsun NN) foram transformadas centrifugando 10 ml de uma cultura de uma noite de Agrobacterium tumefaciens (crescida durante a selecção), descartando o sobrenadante, e resuspendendo a bactéria no mesmo volume do meio livre de antibiótico. Os discos de folhas de plantas estéreis (diâmetro de cerca de 1 cm) foram mergulhados nesta solução de bactérias num prato Petri estéril. Os discos de folhas foram, depois, colocados em medio MS(Murashige e Skoog (1962) Physiol Plant 15:473pp.) com 2% de sacarose e 0,8% de bacto-agar. Após 2 dias de incubação no escuro e a 25°C, foram transferidas para o meio MS com 100 mg/1 de canamicina, 500 mg/1 de claforam, 1 mg/1 de benzilaminopurina (BAP) , 0,2 mg/1 de ácidos naftilacéticos (NAA), 1,6% de glucose e 0,8% de bacto-agar e o cultivo progrediu (16 horas de luz/8 horas de escuro). Os rebentos crescentes foram transferidos para o meio MS livre de hormonas com 2% de sacarose, 250 63 mg/1 de claforam e 0,8% de bacto-agar. A transformação de colza ocorreu por meio da transformação do pecíolo e segundo o descrito por Moloney et al. (Moloney MM et al. (1989) Plant Cell Rep 8:238-242
Exemplo 3: Investigação da expressão bidireccional do promotor FD a) Isolamento PCR do promotor FD de Arabidopsis thaliana O promotor putativo bidireccional foi amplificado por PCR do ADN genónico da Arabidopsis thaliana com os "primers" FD3 e FD4. Os nucleótidos a negrito para uma localização BamHI foram anexados ao "primer" FD3. Foi introduzido num „primer" FD4 numa localização BamHI por meio da inserção de um C (negrito) como a diferença em relação à sequência genómica. "Primer" FD3: (SEQ ID NO: 5 5''-acggatccgagagacagagagacggagacaaaa-3' "Primer" FD4: (SEQ ID NO: 6) 5'-gcggatccaagcttcactgcttaaattc-3'
Mistura de reacção:
Ιμΐ DNA 37μ1 H20 5plpeia 10x lplFD3 "Primer" ΙΟμΜ lplFD4 "Primer" ΙΟμΜ 4μ1 dNTP 2,5mM lplPfu Turbo- ADN polimerase (Stratagene)
Condições de PCR: 64
1 ciclo com 5 minutos a 95°C 25 ciclos, 52°C para 1 minuto, 72°C para 1 minuto e 95°C para 30 segundos 1 ciclo com 72°C para 10 minutos,
e arrefecimento final a 4°C até ao próximo procedimento, b) construção de cassetes de expressão FD:GUS O produto PCR que inclui o promotor FD foi clivado com a enzima de restrição BamHI e ligado ao vector pGUSINT37 (SunGene), também clivado pela BamHI. A clonagem indirecta resultou nos dois plasmideos pFD+GUS e pFD-GUS, nos quais o fragmento de promotor é colocado em frente ao gene GUS em direcções opostas. O plasmideo pFD+GUS compreende o promotor na direcção da transcrição do gene putativo de ferredoxina, o plasmideo pFD-GUS na orientação do gene anotado OASTL (cistina sintase).
Exemplo 4: Produção de vectores para a análise simultânea de ambas as direcções de transcrição do promotor FD
Para a análise de ambas as direcções de expressão, os genes do marcador de selecção Nptll e do gene repórter da glucuronidade foram colocados em duas construções sob o controlo do promotor bidireccional. Como tal, os plasmideos pFD+GUS e pFD-GUS foram clivados com EcoRI/Sall e clonados nos vectores pS5NptllCat (derivado do vector pSUN; WO 02/00900). O plasmideo resultante UH200(SEQ ID NO: 3) compreende o gene GUS sob controlo de elementos transcripcionais que actuam na direcção do gene da ferredoxina, e o gene Nptll sob o controlo de elementos 65 transcripcionais que actuam na direcção do gene OASTL. No plasmídeo resultante UH201(SEQ ID NO: 4) o gene GUS encontra-se sob o controlo de factores direccionados para o OASTL, e o gene Nptll está sob o controlo de elementos que controlam o gene da ferredoxina (ver Fig. 1) . Ambas as contruções foram transformadas na cadeia de agrobactérias GV3101 [pMP90] e no tabaco e colza de acordo com as respectivas normas.
Exemplo: 5 Resultados da análise da resistência à canamicina das plantas de tabaco transgénicas A regeneração selectiva das plantas do tabaco ocorreu em 100mg/l de canamicina. 86% dos explantes que foram transformados com a construção UH200 desenvolverem rebentos. 89% dos rebentos cortados deitaram raizes no meio com canamicina, e todos eram transgénicos conforme a análise PCR. 70% dos explantes da experiência de transformação com rebentos desenvolvidos UH201; 90% dos quais deitaram raizes. Também aqui a análise PCR revelou que as plantas compreendiam a adequada construção e eram, como tal, transgénicas. Este exemplo mostra que ambas as orientações dos promotores eram adequadas para a expressão de marcadores de selecção durante a regeneração selectiva de tabaco.
Exemplo 6: Resultados da análise da resistência à canamicina das plantas de colza transgénicas A regeneração selectiva das plantas da colza ocorreu em 18 mg/1 de canamicina. A eficácia da transformação foi de 11% para a construção UH200 e 10% para a construção UH201. Simultaneamente, a eficácia da transformação com o controlo 66 do promotor da nopalina sintase foi de 8%. Este exemplo evidencia que a regeneração selectiva, tanto com o controlo do promotor na direcção OASTL (UH200) como na direcção FD (UH201), é comparável com o nosP normalmente utilizado.
Exemplo 7: Análise GUS da especificidade do tecido do promotor bidireccional nas plantas de tabaco e colza transgénicos.
As duas orientações dos promotores mostraram as mesmas especificidades de tecido, com excepção dos pólens, nas plantas de tabaco e colza transgénicos (tabela 1). Enquanto que na colza não foi encontrada qualquer actividade nos pólens, os pólens do tabaco mostraram uma distinta coloração azul e, como tal, uma actividade do promotor. A expressão GUS regulada por ambas as orientações foi, predominantemente, encontrada no tecido verde. Não foi detectada qualquer expressão nas raízes nem nas pétalas. No colza, e já nas primeiras fases de desenvolvimento das sementes, foi detectada uma actividade do GUS. 67
Tabela: 1: Perspectiva das especificidades do tecido no tabaco e na colza
Durante a regeneração selectiva, a actividade do promotor foi seguida de novos rebentos com X-Gluc. Os rebentos transgénicos mostraram uma forte coloração azul. Esta experiência demonstrou, novamente, a mesma actividade do promotor bidireccional em ambas as direcções.
Exemplo 8: Análise GUS quantitativa do promotor bidireccional nas plantas de tabaco transgénico
Para a análise quantitativa da intensidade do promotor FD, foi analisado, em paralelo, material recolhido de folhas e sementes transgénicas de ambas as construções. A 68 análise quantitativa GUS foi levada a cabo de acordo com as normas descritas por Jefferson com MUG e 4-metilumbeliferona como padrão. Foi detectada uma quantidade similar de actividade GUS nas sementes das plantas de ambas as orientações. No material recolhido de folhas, a expressão era mensurável em ambas as direcções, mas a intensidade era menos uniforme que no material retirado de sementes.
Exemplo 9: Análise GUS quantitativa do promotor bidireccional nas plantas de colza transgénica A colza foi, também, transformada - tal como acima descrito - com as construções UH200 e UH201. Uma análise GUS quantitativa de material recolhido de folhas de plantas de colza transgénica mostrou que ambas as direcções do promotor apresentavam uma mesma actividade. Na Fig.2 são apresentados os valores das linhas individuais. 0 nivel de expressão corresponde a outros promotores vegetais polares. 69
listagem das sequências <110> SunGene GmbH&Co.KGaA <120> Cassetes de expressão para a expressão transgénica bidireccional de ácidos nucleicos em plantas <130> AE 20030535 <160> 6 <170> Patentln Ver. 3,1
<210> 1 <211> 429 <212> ADN <213> Arabidopsis thaliana <220> <221> promotor <222> (1)..(429) <223> <400> 1 gtatggaata aaatcttcga atgatgagat atatgatctc tttggtgtca gtcacatggc 60 acacgctatc aatttagaaa aacgcggtgg ttggtcacca gaattactac ttctcggtct 120 gatttggtca tatccgtatt aagtccggtt aatattttcc ataactgggg tttgaacatt 180 cggtttcttt ttttcagtta gtccgatttg gagttttgag tatggaaaaa taatactgaa 240 tttatttgtt caaactgttt tggaaaaaat atttccctta attacgaata taattaaaat 300 tttaaaattc attttattag atcttggtta attcggttta atgcattaat gaatttcggt 360 ttaagtcggt tttcggtttt tatgtcccac cactatctac aaccgatgat caaccttatc 420 tccgtattc 429
<210> 2 <211> 836 <212> ADN <213> Arabidopsis thaliana <220> <221> promotor <222> (344)..(772) <223> 70 <220> <221> Intrão <222> (14)..(281)
<223> Io intrão do gene QASTL <220> <221> 5'UTR <222> (773)..(836)
<223> 5'UTR do gene FD <220> <221> 5'UTR <222> (1)..(343) <223> 5'-UTR do intrão que inclui o gene OASTL <400> 2 gatccaagct tcactgctta aattcacaaa aagagaaaag taagaccaaa ggaataaatc 60 atcctcaaac caaaaacaca tcatacaaaa tcatcaaaca taaatctcca gatgtatgag 120 caccaatcca gttatacaac actcttaaca ccaaatcaac agatttaaca gcgaaataag 180 cttaagccca tacaattatc cgatccaaac aaatataatc gaaaccggca gaggaataag 240 caagtgaatc aaaaagtatg ggacgaggaa gaagatgata cctgaatgag aaagtcaata 300 accttgaccc gaatcgtttt gaagaaaatg gagaaaatcg gttgtatgga ataaaatctt 360 cgaatgatga gatatatgat ctctttggtg tcagtcacat ggcacacgct atcaatttag 420 aaaaacgcgg tggttggtca ccagaattac tacttctcgg tctgatttgg tcatatccgt 480 attaagtccg gttaatattt tccataactg gggtttgaac attcggtttc tttttttcag 540 ttagtccgat ttggagtttt gagtatggaa aaataatact gaatttattt gttcaaactg 600 ttttggaaaa aatatttccc ttaattacga atataattaa aattttaaaa ttcattttat 660 tagatcttgg ttaattcggt ttaatgcatt aatgaatttc ggtttaagtc ggttttcggt 720 ttttatgtcc caccactatc tacaaccgat gatcaacctt atctccgtat tcaccacaaa 780 cagtcatcac tctcacttga cacaaaaact cttttgtctc cgtctctctg tctctc 836
<210> 3 <211> 11533 <212> ADN 71 <213> Sequência artificial <220> <223> Vector de expressão UH200 <400> 3 ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct gtcaaacact 120 gatagtttaa actgaaggcg ggaaacgaca atcagatcta gtaggaaaca gctatgacca 180 tgattacgcc aagcttgcat gccgatcccc cccactccgc cctacactcg tatatatatg 240 cctaaacctg ccccgttcct catatgtgat attattattt cattattagg tataagatag 300 taaacgataa ggaaagacaa tttattgaga aagccatgct aaaatataga tagatatacc 360 ttagcaggtg tttattttac aacataacat aacatagtag ctagccagca ggcaggctaa 420 aacatagtat agtctatctg cagggggtac ggtcgactct agactagtgg atccgtcgaa 480 gctagcttgg gtcccgctca gaagaactcg tcaagaaggc gatagaaggc gatgcgctgc 540 gaatcgggag cggcgatacc gtaaagcacg aggaagcggt cagcccattc gccgccaagc 600 tcttcagcaa tatcacgggt agccaacgct atgtcctgat agcggtccgc cacacccagc 660 cggccacagt cgatgaatcc agaaaagcgg ccattttcca ccatgatatt cggcaagcag 720 gcatcgccat gggtcacgac gagatcctcg ccgtcgggca tgcgcgcctt gagcctggcg 780 aacagttcgg ctggcgcgag cccctgatgc tcttcgtcca gatcatcctg atcgacaaga 840 ccggcttcca tccgagtacg tgctcgctcg atgcgatgtt tcgcttggtg gtcgaatggg 900 caggtagccg gatcaagcgt atgcagccgc cgcattgcat cagccatgat ggatactttc 960 tcggcaggag caaggtgaga tgacaggaga tcctgccccg gcacttcgcc caatagcagc 1020 cagtcccttc ccgcttcagt gacaacgtcg agcacagctg cgcaaggaac gcccgtcgtg 1080 gccagccacg atagccgcgc tgcctcgtcc tgcagttcat tcagggcacc ggacaggtcg 1140 gtcttgacaa aaagaaccgg gcgcccctgc gctgacagcc ggaacacggc ggcatcagag 1200 cagccgattg tctgttgtgc ccagtcatag ccgaatagcc tctccaccca agcggccgga 1260 gaacctgcgt gcaatccatc ttgttcaatc caagctccca tgggccctcg actagagtcg 1320 agatccgata tcgcccgggc tcgactctag aggatccaag cttcactgct taaattcaca 1380 aaaagagaaa agtaagacca aaggaataaa tcatcctcaa accaaaaaca catcatacaa 1440 aatcatcaaa cataaatctc cagatgtatg agcaccaatc cagttataca acactcttaa 1500 caccaaatca acagatttaa cagcgaaata agcttaagcc catacaatta tccgatccaa 1560 acaaatataa tcgaaaccgg cagaggaata agcaagtgaa tcaaaaagta tgggacgagg 1620 aagaagatga tacctgaatg agaaagtcaa taaccttgac ccgaatcgtt ttgaagaaaa 1680 tggagaaaat cggttgtatg gaataaaatc ttcgaatgat gagatatatg atctctttgg 1740 72 tgtcagtcac atggcacacg ctatcaattt agaaaaacgc ggtggttggt caccagaatt 1800 actacttctc ggtctgattt ggtcatatcc gtattaagtc cggttaatat tttccataac 1860 tggggtttga acattcggtt tctttttttc agttagtccg atttggagtt ttgagtatgg 1920 aaaaataata ctgaatttat ttgttcaaac tgttttggaa aaaatatttc ccttaattac 1980 gaatataatt aaaattttaa aattcatttt attagatctt ggttaattcg gtttaatgca 2040 ttaatgaatt tcggtttaag tcggttttcg gtttttatgt cccaccacta tctacaaccg 2100 atgatcaacc ttatctccgt attcaccaca aacagtcatc actctcactt gacacaaaaa 2160 ctcttttgtc tccgtctctc tgtctctcgg atccccgggt aggtcagtcc cttatgttac 2220 gtcctgtaga aaccccaacc cgtgaaatca aaaaactcga cggcctgtgg gcattcagtc 2280 tggatcgcga aaactgtgga attggtcagc gttggtggga aagcgcgtta caagaaagcc 2340 gggcaattgc tgtgccagga gtttttaacg atcaagttcg ccgatgccag atattcgtaa 2400 ttatgccggc aacgtcttgg tatcagcgcc gaagtcttta ttccgaaagg ttgggcaggc 2460 cagcgtatcg tgctgcgttt cgatgcggtc actcattacg gcaaagtgtg ggtcaataat 2520 caggaagtga tggagcatca gggcggctat acgccatttg aagccgatgt cacgccgtat 2580 gttattgccg ggaaaagtgt acgtaagttt ctgcttctac ctttgatata tatataataa 2640 ttatcattaa ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta 2700 gtatatagca attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc 2760 taatatatga ccaaaatttg ttgatgtgca ggtatcaccg tttgtgtgaa caacgaactg 2820 aactggcaga ctatcccgcc gggaatggtg attaccgacg aaaacggcaa gaaaaagcag 2880 tcttacttcc atgatttctt taactatgcc ggaatccatc gcagcgtaat gctctacacc 2940 acgccgaaca cctgggtgga cgatatcacc gtggtgacgc atgtcgcgca agactgtaac 3000 cacgcgtctg ttgactggca ggtggtggcc aatggtgatg tcagcgttga actgcgtgat 3060 gcggatcaac aggtggttgc aactggacaa ggcactagcg ggactttgca agtggtgaat 3120 ccgcacctct ggcaaccggg tgaaggttat ctctatgaac tgtgcgtcac agccaaaagc 3180 cagacagagt gtgatatcta cccgcttcgc gtcggcatcc ggtcagtggc agtgaagggc 3240 gaacagttcc tgattaacca caaaccgttc tactttactg gctttggtcg tcatgaagat 3300 gcggacttac gtggcaaagg attcgataac gtgctgatgg tgcacgacca cgcattaatg 3360 gactggattg gggccaactc ctaccgtacc tcgcattacc cttacgctga agagatgctc 3420 gactgggcag atgaacatgg catcgtggtg attgatgaaa ctgctgctgt cggctttaac 3480 ctctctttag gcattggttt cgaagcgggc aacaagccga aagaactgta cagcgaagag 3540 gcagtcaacg gggaaactca gcaagcgcac ttacaggcga ttaaagagct gatagcgcgt 3600 gacaaaaacc acccaagcgt ggtgatgtgg agtattgcca acgaaccgga tacccgtccg 3660 caagtgcacg ggaatatttc gccactggcg gaagcaacgc gtaaactcga cccgacgcgt 3720 ccgatcacct gcgtcaatgt aatgttctgc gacgctcaca ccgataccat cagcgatctc 3780 tttgatgtgc tgtgcctgaa ccgttattac ggatggtatg tccaaagcgg cgatttggaa 3840 73 acggcagaga aggtactgga aaaagaactt ctggcctggc aggagaaact gcatcagccg 3900 attatcatca ccgaatacgg cgtggatacg ttagccgggc tgcactcaat gtacaccgac 3960 atgtggagtg aagagtatca gtgtgcatgg ctggatatgt atcaccgcgt ctttgatcgc 4020 gtcagcgccg tcgtcggtga acaggtatgg aatttcgccg attttgcgac ctcgcaaggc 4080 atattgcgcg ttggcggtaa caagaaaggg atcttcactc gcgaccgcaa accgaagtcg 4140 gcggcttttc tgctgcaaaa acgctggact ggcatgaact tcggtgaaaa accgcagcag 4200 ggaggcaaac aatgaatcaa caactctcct ggcgcaccat cgtcggctac agcctcggga 4260 attgctaccg agctcggtac ccggcgcaaa aatcaccagt ctctctctac aaatctatct 4320 ctctctattt ttctccagaa taatgtgtga gtagttccca gataagggaa ttagggttct 4380 tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 4440 aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg accgggtacc 4500 gagctcgaat tcactggccg tcgttttaca acgactcagc agcttgacag gaggcccgat 4560 ctagtaacat agatgacacc gcgcgcgata atttatccta gtttgcgcgc tatattttgt 4620 tttctatcgc gtattaaatg tataattgcg ggactctaat cataaaaacc catctcataa 4680 ataacgtcat gcattacatg ttaattatta catgcttaac gtaattcaac agaaattata 4740 tgataatcat cgcaagaccg gcaacaggat tcaatcttaa gaaactttat tgccaaatgt 4800 ttgaacgatc ggggatcatc cgggtctgtg gcgggaactc cacgaaaata tccgaacgca 4860 gcaagatcgg tcgatcgact cagatctggg taactggcct aactggcctt ggaggagctg 4920 gcaactcaaa atccctttgc caaaaaccaa catcatgcca tccaccatgc ttgtatccag 4980 ccgcgcgcaa tgtaccccgc gctgtgtatc ccaaagcctc atgcaaccta acagatggat 5040 cgtttggaag gcctataaca gcaaccacag acttaaaacc ttgcgcctcc atagacttaa 5100 gcaaatgtgt gtacaatgta gatcctaggc ccaacctttg atgcctatgt gacacgtaaa 5160 cagtactctc aactgtccaa tcgtaagcgt tcctagcctt ccagggccca gcgtaagcaa 5220 taccagccac aacaccctca acctcagcaa ccaaccaagg gtatctatct tgcaacctct 5280 ctaggtcatc aatccactct tgtggtgttt gtggctctgt cctaaagttc actgtagacg 5340 tctcaatgta atggttaacg atgtcacaaa ccgcggccat atcggctgct gtagctggcc 5400 taatctcaac tggtctcctc tccggagaca tgtcgagatt atttggattg agagtgaata 5460 tgagactcta attggatacc gaggggaatt tatggaacgt cagtggagca tttttgacaa 5520 gaaatatttg ctagctgata gtgaccttag gcgacttttg aacgcgcaat aatggtttct 5580 gacgtatgtg cttagctcat taaactccag aaacccgcgg ctgagtggct ccttcaacgt 5640 tgcggttctg tcagttccaa acgtaaaacg gcttgtcccg cgtcatcggc gggggtcata 5700 acgtgactcc cttaattctc cgctcatgat cagattgtcg tttcccgcct tcagtttaaa 5760 ctatcagtgt ttgacaggat cctgcttggt aataattgtc attagattgt ttttatgcat 5820 agatgcactc gaaatcagcc aattttagac aagtatcaaa cggatgttaa ttcagtacat 5880 taaagacgtc cgcaatgtgt tattaagttg tctaagcgtc aatttgttta caccacaata 5940 74 tatcctgcca ccagccagcc aacagctccc cgaccggcag ctcggcacaa aatcaccacg 6000 cgttaccacc acgccggccg gccgcatggt gttgaccgtg ttcgccggca ttgccgagtt 6060 cgagcgttcc ctaatcatcg accgcacccg gagcgggcgc gaggccgcca aggcccgagg 6120 cgtgaagttt ggcccccgcc ctaccctcac cccggcacag atcgcgcacg cccgcgagct 6180 gatcgaccag gaaggccgca ccgtgaaaga ggcggctgca ctgcttggcg tgcatcgctc 6240 gaccctgtac cgcgcacttg agcgcagcga ggaagtgacg cccaccgagg ccaggcggcg 6300 cggtgccttc cgtgaggacg cattgaccga ggccgacgcc ctggcggccg ccgagaatga 6360 acgccaagag gaacaagcat gaaaccgcac caggacggcc aggacgaacc gtttttcatt 6420 accgaagaga tcgaggcgga gatgatcgcg gccgggtacg tgttcgagcc gcccgcgcac 6480 gtctcaaccg tgcggctgca tgaaatcctg gccggtttgt ctgatgccaa gctggcggcc 6540 tggccggcca gcttggccgc tgaagaaacc gagcgccgcc gtctaaaaag gtgatgtgta 6600 tttgagtaaa acagcttgcg tcatgcggtc gctgcgtata tgatgcgatg agtaaataaa 6660 caaatacgca aggggaacgc atgaaggtta tcgctgtact taaccagaaa ggcgggtcag 6720 gcaagacgac catcgcaacc catctagccc gcgccctgca aatcgccggg gccgatgttc 6780 tgttagtcga ttccgatccc cagggcagtg cccgcgattg ggcggccgtg cgggaagatc 6840 aaccgctaac cgttgtcggc atcgaccgcc cgacgattga ccgcgacgtg aaggccatcg 6900 gccggcgcga cttcgtagtg atcgacggag cgccccaggc ggcggacttg gctgtgtccg 6960 cgatcaaggc agccgacttc gtgctgattc cggtgcagcc aagcccttac gacatatggg 7020 ccaccgccga cctggtggag ctggttaagc agcgcattga ggtcacggat ggaaggctac 7080 aagcggcctt tgtcgtgtcg cgggcgatca aaggcacgcg catcggcggt gaggttgccg 7140 aggcgctggc cgggtacgag ctgcccattc ttgagtcccg tatcacgcag cgcgtgagct 7200 acccaggcac tgccgccgcc ggcacaaccg ttcttgaatc agaacccgag ggcgacgctg 7260 cccgcgaggt ccaggcgctg gccgctgaaa ttaaatcaaa actcatttga gttaatgagg 7320 taaagagaaa atgagcaaaa gcacaaacac gctaagtgcc ggccgtccga gcgcacgcag 7380 cagcaaggct gcaacgttgg ccagcctggc agacacgcca gccatgaagc gggtcaactt 7440 tcagttgccg gcggaggatc acaccaagct gaagatgtac gcggtacgcc aaggcaagac 7500 cattaccgag ctgctatctg aatacatcgc gcagctacca gagtaaatga gcaaatgaat 7560 aaatgagtag atgaatttta gcggctaaag gaggcggcat ggaaaatcaa gaacaaccag 7620 gcaccgacgc cgtggaatgc cccatgtgtg gaggaacggg cggttggcca ggcgtaagcg 7680 gctgggttgt ctgccggccc tgcaatggca ctggaacccc caagcccgag gaatcggcgt 7740 gagcggtcgc aaaccatccg gcccggtaca aatcggcgcg gcgctgggtg atgacctggt 7800 ggagaagttg aaggccgcgc aggccgccca gcggcaacgc atcgaggcag aagcacgccc 7860 cggtgaatcg tggcaagcgg ccgctgatcg aatccgcaaa gaatcccggc aaccgccggc 7920 agccggtgcg ccgtcgatta ggaagccgcc caagggcgac gagcaaccag attttttcgt 7980 tccgatgctc tatgacgtgg gcacccgcga tagtcgcagc atcatggacg tggccgtttt 8040 75 ccgtctgtcg aagcgtgacc gacgagctgg cgaggtgatc cgctacgagc ttccagacgg 8100 gcacgtagag gtttccgcag ggccggccgg catggccagt gtgtgggatt acgacctggt 8160 actgatggcg gtttcccatc taaccgaatc catgaaccga taccgggaag ggaagggaga 8220 caagcccggc cgcgtgttcc gtccacacgt tgcggacgta ctcaagttct gccggcgagc 8280 cgatggcgga aagcagaaag acgacctggt agaaacctgc attcggttaa acaccacgca 8340 cgttgccatg cagcgtacga agaaggccaa gaacggccgc ctggtgacgg tatccgaggg 8400 tgaagccttg attagccgct acaagatcgt aaagagcgaa accgggcggc cggagtacat 8460 cgagatcgag ctagctgatt ggatgtaccg cgagatcaca gaaggcaaga acccggacgt 8520 gctgacggtt caccccgatt actttttgat cgatcccggc atcggccgtt ttctctaccg 8580 cctggcacgc cgcgccgcag gcaaggcaga agccagatgg ttgttcaaga cgatctacga 8640 acgcagtggc agcgccggag agttcaagaa gttctgtttc accgtgcgca agctgatcgg 8700 gtcaaatgac ctgccggagt acgatttgaa ggaggaggcg gggcaggctg gcccgatcct 8760 agtcatgcgc taccgcaacc tgatcgaggg cgaagcatcc gccggttcct aatgtacgga 8820 gcagatgcta gggcaaattg ccctagcagg ggaaaaaggt cgaaaaggtc tctttcctgt 8880 ggatagcacg tacattggga acccaaagcc gtacattggg aaccggaacc cgtacattgg 8940 gaacccaaag ccgtacattg ggaaccggtc acacatgtaa gtgactgata taaaagagaa 9000 aaaaggcgat ttttccgcct aaaactcttt aaaacttatt aaaactctta aaacccgcct 9060 ggcctgtgca taactgtctg gccagcgcac agccgaagag ctgcaaaaag cgcctaccct 9120 tcggtcgctg cgctccctac gccccgccgc ttcgcgtcgg cctatcgcgg ccgctggccg 9180 ctcaaaaatg gctggcctac ggccaggcaa tctaccaggg cgcggacaag ccgcgccgtc 9240 gccactcgac cgccggcgcc cacatcaagg caccctgcct cgcgcgtttc ggtgatgacg 9300 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 9360 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 9420 ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga 9480 gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag 9540 aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 9600 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 9660 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 9720 aaaggccgcg.ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 9780 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 9840 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 9900 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9960 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 10020 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 10080 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 10140 76 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 10200 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 10260 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 10320 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 10380 ctcacgttaa gggattttgg tcatgcatga tatatctccc aatttgtgta gggcttatta 10440 tgcacgctta aaaataataa aagcagactt gacctgatag tttggctgtg agcaattatg 10500 tgcttagtgc atctaacgct tgagttaagc cgcgccgcga agcggcgtcg gcttgaacga 10560 atttctagct agacattatt tgccgactac cttggtgatc tcgcctttca cgtagtggac 10620 aaattcttcc aactgatctg cgcgcgaggc caagcgatct tcttcttgtc caagataagc 10680 ctgtctagct tcaagtatga cgggctgata ctgggccggc aggcgctcca ttgcccagtc 10740 ggcagcgaca tccttcggcg cgattttgcc ggttactgcg ctgtaccaaa tgcgggacaa 10800 cgtaagcact acatttcgct catcgccagc ccagtcgggc ggcgagttcc atagcgttaa 10860 ggtttcattt agcgcctcaa atagatcctg ttcaggaacc ggatcaaaga gttcctccgc 10920 cgctggacct accaaggcaa cgctatgttc tcttgctttt gtcagcaaga tagccagatc 10980 aatgtcgatc gtggctggct cgaagatacc tgcaagaatg tcattgcgct gccattctcc 11040 aaattgcagt tcgcgcttag ctggataacg ccacggaatg atgtcgtcgt gcacaacaat 11100 ggtgacttct acagcgcgga gaatctcgct ctctccaggg gaagccgaag tttccaaaag 11160 gtcgttgatc aaagctcgcc gcgttgtttc atcaagcctt acggtcaccg taaccagcaa 11220 atcaatatca ctgtgtggct tcaggccgcc atccactgcg gagccgtaca aatgtacggc 11280 cagcaacgtc ggttcgagat ggcgctcgat gacgccaact acctctgata gttgagtcga 11340 tacttcggcg atcaccgctt cccccatgat gtttaacttt gttttagggc gactgccctg 11400 ctgcgtaaca tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg 11460 ctgcttggat gcccgaggca tagactgtac cccaaaaaaa cagtcataac aagccatgaa 11520 aaccgccact gcg 11533
<210> 4 <211> 11533 <212> ADN <213> Sequência artificial <220> <223> Vector de expressão UH201 <400> 4 ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 77 ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct gtcaaacact 120 gatagtttaa actgaaggcg ggaaacgaca atcagatcta gtaggaaaca gctatgacca 180 tgattacgcc aagcttgcat gccgatcccc cccactccgc cctacactcg tatatatatg 240 cctaaacctg ccccgttcct catatgtgat attattattt cattattagg tataagatag 300 taaacgataa ggaaagacaa tttattgaga aagccatgct aaaatataga tagatatacc 360 ttagcaggtg tttattttac aacataacat aacatagtag ctagccagca ggcaggctaa 420 aacatagtat agtctatctg cagggggtac ggtcgactct agactagtgg atccgtcgaa 480 gctagcttgg gtcccgctca gaagaactcg tcaagaaggc gatagaaggc gatgcgctgc 540 gaatcgggag cggcgatacc gtaaagcacg aggaagcggt cagcccattc gccgccaagc 600 tcttcagcaa tatcacgggt agccaacgct atgtcctgat agcggtccgc cacacccagc 660 cggccacagt cgatgaatcc agaaaagcgg ccattttcca ccatgatatt cggcaagcag 720 gcatcgccat gggtcacgac gagatcctcg ccgtcgggca tgcgcgcctt gagcctggcg 780 aacagttcgg ctggcgcgag cccctgatgc tcttcgtcca gatcatcctg atcgacaaga 840 ccggcttcca tccgagtacg tgctcgctcg atgcgatgtt tcgcttggtg gtcgaatggg 900 caggtagccg gatcaagcgt atgcagccgc cgcattgcat cagccatgat ggatactttc 960 tcggcaggag caaggtgaga tgacaggaga tcctgccccg gcacttcgcc caatagcagc 1020 cagtcccttc ccgcttcagt gacaacgtcg agcacagctg cgcaaggaac gcccgtcgtg 1080 gccagccacg atagccgcgc tgcctcgtcc tgcagttcat tcagggcacc ggacaggtcg 1140 gtcttgacaa aaagaaccgg gcgcccctgc gctgacagcc ggaacacggc ggcatcagag 1200 cagccgattg tctgttgtgc ccagtcatag ccgaatagcc tctccaccca agcggccgga 1260 gaacctgcgt gcaatccatc ttgttcaatc caagctccca tgggccctcg actagagtcg 1320 agatccgata tcgcccgggc tcgactctag aggatccaag cttcactgct taaattcaca 1380 aaaagagaaa agtaagacca aaggaataaa tcatcctcaa accaaaaaca catcatacaa 1440 aatcatcaaa cataaatctc cagatgtatg agcaccaatc cagttataca acactcttaa 1500 caccaaatca acagatttaa cagcgaaata agcttaagcc catacaatta tccgatccaa 1560 acaaatataa tcgaaaccgg cagaggaata agcaagtgaa tcaaaaagta tgggacgagg 1620 aagaagatga tacctgaatg agaaagtcaa taaccttgac ccgaatcgtt ttgaagaaaa 1680 tggagaaaat cggttgtatg gaataaaatc ttcgaatgat gagatatatg atctctttgg 1740 tgtcagtcac atggcacacg ctatcaattt agaaaaacgc ggtggttggt caccagaatt 1800 actacttctc ggtctgattt ggtcatatcc gtattaagtc cggttaatat tttccataac 1860 tggggtttga acattcggtt tctttttttc agttagtccg atttggagtt ttgagtatgg 1920 aaaaataata ctgaatttat ttgttcaaac tgttttggaa aaaatatttc ccttaattac 1980 gaatataatt aaaattttaa aattcatttt attagatctt ggttaattcg gtttaatgca 2040 ttaatgaatt tcggtttaag tcggttttcg gtttttatgt cccaccacta tctacaaccg 2100 atgatcaacc ttatctccgt attaaccaca aacagtcatc actctcactt gacacaaaaa 2160 78 ctcttttgtc tccgtctctc tgtctctcgg atccccgggt aggtcagtcc cttatgttac 2220 gtcctgtaga aaccccaacc cgtgaaatca aaaaactcga cggcctgtgg gcattcagtc 2280 tggatcgcga aaactgtgga attggtcagc gttggtggga aagcgcgtta caagaaagcc 2340 gggcaattgc tgtgccagga gtttttaacg atcaagttcg ccgatgccag atattcgtaa 2400 ttatgccggc aacgtcttgg tatcagcgcc gaagtcttta ttccgaaagg ttgggcaggc 2460 cagcgtatcg tgctgcgttt cgatgcggtc actcattacg gcaaagtgtg ggtcaataat 2520 caggaagtga tggagcatca gggcggctat acgccatttg aagccgatgt cacgccgtat 2580 gttattgccg ggaaaagtgt acgtaagttt ctgcttctac ctttgatata tatataataa 2640 ttatcattaa ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta 2700 gtatatagca attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc 2760 taatatatga ccaaaatttg ttgatgtgca ggtatcaccg tttgtgtgaa caacgaactg 2820 aactggcaga ctatcccgcc ggtaatggtg attaccgacg aaaacggcaa gaaaaagcag 2880 tcttacttcc atgatttctt taactatgcc ggaatccatc gcagcgtaat gctctacacc 2940 acgccgaaca cctgggtgga cgatatcacc gtggtgacgc atgtcgcgca agactgtaac 3000 cacgcgtctg ttgactggca ggtggtggcc aatggtgatg tcagcgttga actgcgtgat 3060 gcggatcaac aggtggttgc aactggacaa ggcactagcg ggactttgca agtggtgaat 3120 ccgcacctct ggcaaccggg tgaaggttat ctctatgaac tgtgcgtcac agccaaaagc 3180 cagacagagt gtgatatcta cccgcttcgc gtcggcatcc ggtcagtggc agtgaagggc 3240 gaacagttcc tgattaacca caaaccgttc tactttactg gctttggtcg tcatgaagat 3300 gcggacttac gtggcaaagg attcgataac gtgctgatgg tgcacgacca cgcattaatg 3360 gactggattg gggccaactc ctaccgtacc tcgcattacc cttacgctga agagatgctc 3420 gactgggcag atgaacatgg catcgtggtg attgatgaaa ctgctgctgt cggctttaac 3480 ctctctttag gcattggttt cgaagcgggc aacaacccga aagaactgta cagcgaagag 3540 gcagtcaacg gggaaactca gcaagcgcac ttacaggcga ttaaagagct gatagcgcgt 3600 gacaaaaacc acccaagcgt ggtgatgtgg agtattgcca acgaaccgga tacccgtccg 3660 caagtgcacg ggaatatttc gccactggcg gaagcaacgc gtaaactcga cccgacgcgt 3720 ccgatcacct gcgtcaatgt aatgttctgc gacgctcaca ccgataccat cagcgatctc 3780 tttgatgtgc tgtgcctgaa ccgttattac ggatggtatg tccaaagcgg cgatttggaa 3840 acggcagaga aggtactgga aaaagaactt ctggcctggc aggagaaact gcatcagccg 3900 attatcatca ccgaatacgg cgtggatacg ttagccgggc tgcactcaat gtacaccgac 3960 atgtggagtg aagagtatca gtgtgcatgg ctggatatgt atcaccgcgt ctttgatcgc 4020 gtcagcgccg tcgtcggtga acaggtatgg aatttcgccg attttgcgac ctcgcaaggc 4080 atattgcgcg ttggcggtaa caagaaaggg atcttcactc gcgaccgcaa accgaagtcg 4140 gcggcttttc tgctgcaaaa acgctggact ggcatgaact tcggtgaaaa accgcagcag 4200 ggaggcaaac aatgaatcaa caactctcct ggcgcaccat cgtcggctac agcctcggga 4260 79 attgctaccg agctcggtac ccggcgcaaa aatcaccagt ctctctctac aaatctatct 4320 ctctctattt ttctccagaa taatgtgtga gtagttccca gataagggaa ttagggttct 4380 tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 4440 aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg accgggtacc 4500 gagctcgaat tcactggccg tcgttttaca acgactcagc agcttgacag gaggcccgat 4560 ctagtaacat agatgacacc gcgcgcgata atttatccta gtttgcgcgc tatattttgt 4620 tttctatcgc gtattaaatg tataattgcg ggactctaat cataaaaacc catctcataa 4680 ataacgtcat gcattacatg ttaattatta catgcttaac gtaattcaac agaaattata 4740 tgataatcat cgcaagaccg gcaacaggat tcaatcttaa gaaactttat tgccaaatgt 4800 ttgaacgatc ggggatcatc cgggtctgtg gcgggaactc cacgaaaata tccgaacgca 4860 gcaagatcgg tcgatcgact cagatctggg taactggcct aactggcctt ggaggagctg 4920 gcaactcaaa atccctttgc caaaaaccaa catcatgcca tccaccatgc ttgtatccag 4980 ccgcgcgcaa tgtaccccgc gctgtgtatc ccaaagcctc atgcaaccta acagatggat 5040 cgtttggaag gcctataaca gcaaccacag acttaaaacc ttgcgcctcc atagacttaa 5100 gcaaatgtgt gtacaatgta gatcctaggc ccaacctttg atgcctatgt gacacgtaaa 5160 cagtactctc aactgtccaa tcgtaagcgt tcctagcctt ccagggccca gcgtaagcaa 5220 taccagccac aacaccctca acctcagcaa ccaaccaagg gtatctatct tgcaacctct 5280 ctaggtcatc aatccactct tgtggtgttt gtggctctgt cctaaagttc actgtagacg 5340 tctcaatgta atggttaacg atgtcacaaa ccgcggccat atcggctgct gtagctggcc 5400 taatctcaac tggtctcctc tccggagaca tgtcgagatt atttggattg agagtgaata 5460 tgagactcta attggatacc gaggggaatt tatggaacgt cagtggagca tttttgacaa 5520 gaaatatttg ctagctgata gtgaccttag gcgacttttg aacgcgcaat aatggtttct 5580 gacgtatgtg cttagctcat taaactccag aaacccgcgg ctgagtggct ccttcaacgt 5640 tgcggttctg tcagttccaa acgtaaaacg gcttgtcccg cgtcatcggc gggggtcata 5700 acgtgaatcc cttaattctc cgctcatgat cagattgtcg tttcccgcct tcagtttaaa 5760 ctatcagtgt ttgacaggat cctgcttggt aataattgtc attagattgt ttttatgcat 5820 agatgcactc gaaatcagcc aattttagac aagtatcaaa cggatgttaa ttcagtacat 5880 taaagacgtc cgcaatgtgt tattaagttg tctaagcgtc aatttgttta caccacaata 5940 tatcctgcca ccagccagcc aacagctccc cgaccggcag ctcggcacaa aatcaccacg 6000 cgttaccacc acgccggccg gccgcatggt gttgaccgtg ttcgccggca ttgccgagtt 6060 cgagcgttcc ctaatcatcg accgcacccg gagcgggcgc gaggccgcca aggcccgagg 6120 cgtgaagttt ggcccccgcc ctaccctcac cccggcacag atcgcgcacg cccgcgagct 6180 gatcgaccag gaaggccgca ccgtgaaaga ggcggctgca ctgcttggcg tgcatcgctc 6240 gaccctgtac cgcgcacttg agcgcagcga ggaagtgacg cccaccgagg ccaggcggcg 6300 cggtgccttc cgtgaggacg cattgaccga ggccgacgcc ctggcggccg ccgagaatga 6360 80 acgccaagag gaacaagcat gaaaccgcac caggacggcc aggacgaacc gtttttcatt 6420 accgaagaga tcgaggcgga gatgatcgcg gccgggtacg tgttcgagcc gcccgcgcac 6480 gtctcaaccg tgcggctgca tgaaatcctg gccggtttgt ctgatgccaa gctggcggcc 6540 tggccggcca gcttggccgc tgaagaaacc gagcgccgcc gtctaaaaag gtgatgtgta 6600 tttgagtaaa acagcttgcg tcatgcggtc gctgcgtata tgatgcgatg agtaaataaa 6660 caaatacgca aggggaacgc atgaaggtta tcgctgtact taaccagaaa ggcgggtcag 6720 gcaagacgac catcgcaacc catctagccc gcgccctgca actcgccggg gccgatgttc 6780 tgttagtcga ttccgatccc caggggcagtg cccgcgattg ggcggccgtg cgggaagatc 6840 aaccgctaac cgttgtcggc agcgaccgcc cgacgattga ccgcgacgtg aaggccatcg 6900 gccggcgcga cttcgtagtg atcgacggag cgccccaggc ggcggacttg gctgtgtccg 6960 cgatcaaggc agccgacttc gtgctgattc cggtgcagcc aagcccttac gacatatggg 7020 ccaccgccga cctggtggag ctggttaagc agcgcattga ggtcacggat ggaaggctac 7080 aagcggcctt tgtcgtgtcg cgggcgatca aaggcacgcg catcggcggt gaggttgccg 7140 aggcgctggc cgggtacgag ctgcccattc ttgagtcccg tatcacgcag cgcgtgagct 7200 acccaggcac tgccgccgcc ggcacaaccg ttcttgaatc agaacccgag ggcgacgctg 7260 cccgcgaggt ccaggcgctg gccgctgaaa ttaaatcaaa actcatttga gttaatgagg 7320 taaagagaaa atgagcaaaa gcacaaacac gctaagtgcc ggccgtccga gcgcacgcag 7380 cagcaaggct gcaacgttgg ccagcctggc agacacgcca gccatgaagc gggtcaactt 7440 tcagttgccg gcggaggatc acaccaagct gaagatgtac gcggtacgcc aaggcaagac 7500 cattaccgag ctgctatctg aatacatcgc gcagctacca gagtaaatga gcaaatgaat 7560 aaatgagtag atgaatttta gcggctaaag gaggcggcat ggaaaatcaa gaacaaccag 7620 gcaccgacgc cgtggaatgc cccatgtgtg gaggaacggg cggttggcca ggcgtaagcg 7680 gctgggttgt ctgccggccc tgcaatggca ctggaacccc caagcccgag gaatcggcgt 7740 gagcggtcgc aaaccatccg gcccggtaca aatcggcgcg gcgctgggtg atgacctggt 7800 ggagaagttg aaggccgcgc aggccgccca gcggcaacgc atcgaggcag aagcacgccc 7860 cggtgaatcg tggcaagcgg ccgctgatcg aatccgcaaa gaatcccggc aaccgccggc 7920 agccggtgcg ccgtcgatta ggaagccgcc caagggcgac gagcaaccag attttttcgt 7980 tccgatgctc tatgacgtgg gcacccgcga tagtcgcagc atcatggacg tggccgtttt 8040 ccgtctgtcg aagcgtgacc gacgagctgg cgaggtgatc cgctacgagc ttccagacgg 8100 gcacgtagag gtttcccaag ggccggccgg catggccagt gtgtgggatt acgacctggt 8160 actgatggcg gtttcccatc taaccgaatc catgaaccga taccgggaag ggaagggaga 8220 caagcccggc cgcgtgttcc gtccacacgt tgcggacgta ctcaagttct gccggcgagc 8280 cgatggcgga aagcagaaag acgacctggt agaaacctgc attcggttaa acaccacgca 8340 cgttgccatg cagcgtacga agaaggccaa gaacggccgc ctggtgacgg tatccgaggg 8400 tgaagccttg attagccgct acaagatcgt aaagagcgaa accgggcggc cggagtacat 8460 81 cgagatcgag ctagctgatt ggatgtaccg cgagatcaca gaaggcaaga acccggacgt 8520 gctgacggtt caccccgatt actttttgat cgatcccggc atcggccgtt ttctctaccg 8580 cctggcacgc cgcgccgcag gcaaggcaga agccagatgg ttgttcaaga cgatctacga 8640 acgcagtggc agcgccggag agttcaagaa gttctgtttc accgtgcgca agctgatcgg 8700 gtcaaatgac ctgccggagt acgatttgaa ggaggaggcg gggcaggctg gcccgatcct 8760 agtcatgcgc taccgcaacc tgatcgaggg cgaagcatcc gccggttcct aatgtacgga 8820 gcagatgcta gggcaaattg ccctagcagg ggaaaaaggt cgaaaaggtc tctttcctgt 8880 ggatagcacg tacattggga acccaaagcc gtacattggg aaccggaacc cgtacattgg 8940 gaacccaaag ccgtacattg ggaaccggtc acacatgtaa gtgactgata taaaagagaa 9000 aaaaggcgat ttttccgcct aaaactcttt aaaacttatt aaaactctta aaacccgcct 9060 ggcctgtgca taactgtctg gccagcgcac agccgaagag ctgcaaaaag cgcctaccct 9120 tcggtcgctg cgctccctac gccccgccgc ttcgcgtcgg cctatcgcgg ccgctggccg 9180 ctcaaaaatg gctggcctac ggccaggcaa tctaccaggg cgcggacaag ccgcgccgtc 9240 gccactcgac cgccggcgcc cacatcaagg caccctgcct cgcgcgtttc ggtgatgacg 9300 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 9360 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 9420 ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga 9480 gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag 9540 aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 9600 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 9660 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 9720 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 9780 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 9840 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 9900 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9960 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 10020 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 10080 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 10140 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 10200 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 10260 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 10320 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 10380 ctcacgttaa gggattttgg tcatgcatga tatatctccc aatttgtgta gggcttatta 10440 tgcacgctta aaaataataa aagcagactt gacctgatag tttggctgtg agcaattatg 10500 tgcttagtgc atctaacgct tgagttaagc cgcgccgcga agcggcgtcg gcttgaacga 10560 82 atttctagct agacattatt tgccgactac cttggtgatc tcgcctttca cgtagtggac 10620 aaattcttcc aactgatctg cgcgcgaggc caagcgatct tcttcttgtc caagataagc 10680 ctgtctagct tcaagtatga cgggctgata ctgggccggc aggcgctcca ttgcccagtc 10740 ggcagcgaca tccttcggcg cgattttgcc ggttactgcg ctgtaccaaa tgcgggacaa 10800 cgtaagcact acatttcgct catcgccagc ccagtcgggc ggcgagttcc atagcgttaa 10860 ggtttcattt agcgcctcaa atagatcctg ttcaggaacc ggatcaaaga gttcctccgc 10920 cgctggacct accaaggcaa cgctatgttc tcttgctttt gtcagcaaga tagccagatc 10980 aatgtcgatc gtggctggct cgaagatacc tgcaagaatg tcattgcgct gccattctcc 11040 aaattgcagt tcgcgcttag ctggataacg ccacggaatg atgtcgtcgt gcacaacaat 11100 ggtgacttct acagcgcgga gaatctcgct ctctccaggg gaagccgaag tttccaaaag 11160 gtcgttgatc aaagctcgcc gcgttgtttc atcaagcctt acggtcaccg taaccagcaa 11220 atcaatatca ctgtgtggct tcaggccgcc atccactgcg gagccgtaca aatgtacggc 11280 cagcaacgtc ggttcgagat ggcgctcgat gacgccaact acctctgata gttgagtcga 11340 tacttcggcg atcaccgctt cccccatgat gtttaacttt gttttagggc gactgccctg 11400 ctgcgtaaca tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg 11460 ctgcttggat gcccgaggca tagactgtac cccaaaaaaa cagtcataac aagccatgaa 11520 aaccgccact gcg 11533 <210> 5 <211> 33
<212> ADN <213> Sequência artificial <220> <223> iniciador de oligonucleótidos <400> 5 acggatccga gagacagaga gacggagaca aaa 33 <210> 6 <211> 28
<212> ADN <213> Sequência artificial <220> <223> iniciador de oligonucleótidos <4 Ο 0> 6 gcggatccaa gcttcactgc ttaaattc
Lisboa 18 de Setembro de 2007

Claims (17)

1 REIVINDICAÇÕES 1. Cassettes de expressão transgénica para a expressão de duas sequências de ácidos nucleicos numa célula vegetal contendo, pelo menos, uma sequência reguladora seleccionada do grupo composto a) pelo promotor descrito em SEQ ID NO: 1 ou 2, b) por equivalentes funcionais do promotor descrito em SEC ID NO: 1 ou 2, possuindo uma identidade de pelo menos 80% da sequência descrita em SEC ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEC ID NO: 1 ou 2, c) por equivalentes funcionais do promotor descrito em SEQ ID NO: 1 ou 2, possuindo, pelo menos, 25 nucleótidos consecutivos das sequências descritas em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, e d) por fragmentos funcionalmente equivalentes das sequências a) ou b) ou c), possuindo, pelo menos, 25 nucleótidos consecutivos das referidas sequências a) ou b) ou c) e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, em que a sequência reguladora seja disposta entre duas sequências de ácidos nucleicos, e se apresente não só heteróloga em relação às referidas sequências de ácidos nucleicos como também, funcionalmente, unida às mesmas, de tal forma que a expressão de duas diferentes sequências de ácidos ribonucleicos seja levada a cabo em, pelo menos, uma célula vegetal, e as tais sequências de ácidos ribonucleicos seleccionadas das sequências de ácidos ribonucleicos codifiquem 2 i) sequências de aminoácidos ou ii) sequências de ácidos ribonucleicos que fomentem uma redução na expressão de, pelo menos, um gene endógeno da referida célula vegetal.
2. Cassete de expressão de acordo com a reinvindicação 1, em que as duas sequências de ácidos nucleicos, a expressar transgenicamente, se apresentem diferentes e codifiquem uma das seguintes combinações i) marcador de selecção e proteína relatora ii) proteína alvo e marcador de selecção ou proteína relatora ii) duas proteínas alvo da mesma via metabólica iii) RNA sense e RNA antisense iv) diferentes proteínas para a defesa contra patogenias
3. Cassete de expressão de acordo com a reivindicação 1 ou 2, em que, pelo menos, uma das sequências de ácidos nucleicos, a expressar transgenicamente, seja seleccionada de ácidos nucleicos que codifiquem marcadores de selecção, genes repóter, celulases, quitinases, glucanases, proteínas inactivadoras de ribossomas, lisozimas, endotoxinas do Bacillus thuringiensis, inibidores da alfa-amilase, inibidores da protease, lectinas, ribonucleases, ribozimas, acetil-CoA carboxilases, fitases, albumina 2S da Castanha-do-Brasil (Bertholletia excelsa), proteínas anticongelantes, sintases de trealose fosfato, fosfatases de trealose-fosfato, trealases, factor de transcrição DREBlA, farnesil transferases, ferritina, oxalato oxidases, proteínas quinase dependentes de cálcio, calcineurinas, desidrogenases do glutamato, citocromo P-450 multifuncional 3 hidroxilante-N, activador transcripcional CBF1, desaturação de fitoeno, poligalacturonases, flavonóide-3'-hidroxilases, diidroxiflavonol-4 reductases, calcona isomerases, calcona sintases, beta-hidroxilases flavanona 3, falvona II sintases, enzima ramificadora Q, enzima ramificadora do amido.
4. Cassete de expressão transgénica de acordo com uma das reivindicações 1 a 3, em que, pelo menos, uma das sequências de ácidos nucleicos, a serem expressas transgenicamente, seja seleccionada do grupo composto por marcadores de selecção positivos, marcadores de selecção negativos e factores que ofereçam uma vantagem em termos de crescimento.
5. Cassete de expressão transgénica de acordo com a reivindicação 2 ou 4, e em que o marcador de selecção seja seleccionado do grupo composto por proteínas que proporcionem uma resistência contra antibióticos, inibidores do metabolismo, herbicidas ou biocidas.
6. Cassete de expressão transgénica de acordo com uma das reivindicações 2, 4 ou 5, e em que o marcador de selecção seja seleccionado do grupo composto por proteínas que proporcionem uma resistência contra fosfinotricina, glifosato, bromoxinil, dalapon, 2-desoxiglucose-6-fosfato, tetraciclina, ampicilina, canamicina, G 418, neomicina, paromomicina, bleomicina, zeocina, higromicina, cloramfenicol, herbicida sulfonil, herbicida imidazolinona.
7. Cassete de expressão de acordo com uma das reivindicações 2 ou 4 a 6, e em que o marcador de selecção seja seleccionado do grupo composto por fosfinotricina- 4 acetil transferases, 5-Enolpiruvilshikimate-3-fosfatsinta-ses, glifosato oxidoreductases, dealogenases, nitrilases, neomicina-fosfotransferases, genes D0GR1, acetolactate sintases, higromicina fosfotransferases, cloranfenicol acetil transferases, estreptomicina denilil transferases, beta-lactamases, genes teta, genes tetR, isopentenil transferases, timidinquinases, toxina A de difteria, citosina deaminase (codA), citocromo P450, haloalcana dealogenases, gene iaaH, gene tms2, β-glucuronidases, manose-6-fosfato-isomerases, UDP-galactose-4-epimerases.
8. Vector de expressão transgénica com uma cassete de expressão de acordo com uma das reivindicações 1 a 7.
9. Organismo vegetal transgénico transformado com o recurso a uma cassete de expressão transgénica de acordo com uma das reivindicações 1 a 7 ou um dos vectores de expressão transgénica de acordo com a reivindicação 8.
10. Organismo vegetal transgénico de acordo com a reivindicação 9, e seleccionado do grupo composto por Arabidopsis, tomate, tabaco, batata, milho, colza, trigo, cevada, girassol, milho painço, beterraba, centeio, aveia, beterraba sacarina, leguminosas e soja.
11. Células, culturas de células, partes ou material de reprodução transgénica, que sejam derivados de um organismo vegetal transgénico de acordo com a reivindicação 9 ou 10.
12. Processo para a expressão transgénica de duas sequências de ácidos ribonucleicos em células vegetais, em que uma cassete de expressão contenha, pelo menos, uma sequência reguladora seleccionada do grupo composto 5 a) pelo promotor descrito em SEQ ID NO: 1 ou 2, b) por equivalentes funcionais do promotor descrito em SEC ID NO: 1 ou 2, possuindo uma identidade de pelo menos 80% da sequência descrita em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEC ID NO: 1 ou 2, c) por equivalentes funcionais do promotor descrito em SEQ ID NO: 1 ou 2, possuindo, pelo menos, 25 nucleótidos consecutivos das sequências descritas em SEQ ID NO: 1 ou 2, e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, e d) por fragmentos funcionalmente equivalentes das sequências a) ou b) ou c), possuindo, pelo menos, 25 nucleótidos consecutivos das referidas sequências a) ou b) ou c) e, substancialmente, a mesma actividade do promotor descrito em SEQ ID NO: 1 ou 2, introduzida em, pelo menos, uma célula vegetal, em que a referida sequência reguladora seja disposta entre duas sequências de ácidos nucleicos, e se apresente não só heteróloga em relação às referidas sequências de ácidos nucleicos como também, funcionalmente, unida às mesmas, de tal forma que a expressão de duas diferentes sequências de ácidos ribonucleicos seja levada a cabo em, pelo menos, uma célula vegetal, e as tais sequências de ácidos ribonucleicos seleccionadas das sequências de ácidos ribonucleicos codifiquem i) sequências de aminoácidos ou ii) sequências de ácidos ribonucleicos que fomentem uma redução na expressão de, pelo menos, um gene endógeno da referida célula vegetal. 6
13. Processo de acordo com a reinvindicação 12, e em que as duas sequências de ácidos nucleicos, a serem expressas transgenicamente, se apresentem diferentes e codifiquem uma das seguintes combinações i) marcador de selecção e proteína relatora ii) proteína alvo e marcador de selecção ou proteína relatora ii) duas proteínas alvo da mesma via metabólica iii) RNA sense e RNA antisense iv) diferentes proteínas para a defesa contra patogenias
14. Processo de acordo com as reivindicações 12 ou 13, e em que, pelo menos, uma das sequências de ácidos nucleicos, a serem expressas transgenicamente, seja seleccionada de aminoácidos tal como definido numa das reivindicações 3 a 7.
15. Utilização de um organismo vegetal transgénico de acordo com as reivindicações 9 ou 10, ou culturas de células, partes ou material de reprodução daí derivados e de acordo com a reivindicação 11, no sentido da produção de géneros alimentícios, forragem, sementes, produtos farmacêuticos ou de química fina.
16. Utilização de acordo com a reivindicação 15, e em que os produtos de química fina sejam anticorpos, enzimas, proteínas farmacologicamente activas, vitaminas, aminoácidos, açucares, ácidos gordos saturados e insaturados, condimentos, aromatizantes ou corantes de cariz natural ou artificial. 7
17. Processo para a produção de produtos farmacêuticos ou de química fina em organismos vegetais transgénicos de acordo com as reinvidicações 9 ou 10, ou culturas de células, partes ou material de reprodução daí derivados e de acordo com a reivindicação 11, no sentido de cultivar o organismo vegetal transgénico e isolar os pretendidos produtos farmacêuticos ou de química fina. Lisboa 18 de Setembro de 2007
PT04740603T 2003-07-22 2004-07-03 Cassetes de expressão para a expressão transgénica bidireccional de ácidos nucleicos em plantas PT1711612E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10333479 2003-07-22

Publications (1)

Publication Number Publication Date
PT1711612E true PT1711612E (pt) 2007-10-02

Family

ID=34201375

Family Applications (1)

Application Number Title Priority Date Filing Date
PT04740603T PT1711612E (pt) 2003-07-22 2004-07-03 Cassetes de expressão para a expressão transgénica bidireccional de ácidos nucleicos em plantas

Country Status (10)

Country Link
US (1) US7557203B2 (pt)
EP (1) EP1711612B1 (pt)
AT (1) ATE368121T1 (pt)
AU (1) AU2004267161B2 (pt)
CA (1) CA2532903C (pt)
DE (1) DE502004004468D1 (pt)
ES (1) ES2289529T3 (pt)
PL (1) PL1711612T3 (pt)
PT (1) PT1711612E (pt)
WO (1) WO2005019459A1 (pt)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0922931A2 (pt) * 2008-12-17 2015-10-20 Basf Plant Science Gmbh polinucleotídeo, vetor, célula hospedeira, organismo transgênico não humano, método para expressar um ácido nucléico, e, uso do polinucleotídeo
WO2013086494A1 (en) * 2011-12-08 2013-06-13 Carnegie Institution Of Washington Sucrose transporters and methods of generating pathogen-resistant plants
EP2797407A4 (en) 2011-12-30 2015-07-08 Dow Agrosciences Llc METHOD AND CONSTRUCTION FOR SYNTHETIC BIDIRECTIONAL SCBV PLANT PROMOTER
HK1201121A1 (en) 2011-12-30 2015-08-28 Dow Agrosciences Llc Construct and method for synthetic bidirectional plant promoter ubi1
EP2862933B8 (en) * 2013-07-05 2019-12-11 bisy e.U. Bidirectional promoter
CN104651359B (zh) * 2013-11-25 2017-07-11 中国农业科学院生物技术研究所 从玉米中分离的双向启动子及其应用
BR112018011174A2 (pt) * 2015-11-30 2018-11-21 Du Pont polinucleotídeo recombinante, construto de dna, célula heteróloga, planta transgênica ou célula de planta, semente da planta transgênica, método para expressar um polinucleotídeo em uma planta e método para aprimorar a transcrição de um polinucleotídeo em uma célula hospedeira
CN114836427A (zh) * 2022-05-13 2022-08-02 杭州师范大学 一种培育apoaequorin转基因番茄的方法及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2413548C (en) * 2000-06-23 2015-12-22 Syngenta Participations Ag Root-specific promoter from arabidopsis
US7053265B2 (en) * 2000-10-02 2006-05-30 The Board Of Trustees Operating Michigan State University Application of bi-directional promoters for modification of gene expression
US7129343B2 (en) 2001-02-13 2006-10-31 University Of Florida Bi-directional dual promoter complex with enhanced promoter activity for transgene expression in eukaryotes
CA2454127C (en) 2001-07-13 2014-12-16 Sungene Gmbh & Co. Kgaa Expression cassette comprising an arabidopsis thaliana triose phosphate translocator promoter
CA2476281A1 (en) * 2002-02-08 2003-08-14 Smithkline Beecham Corporation Pyrimidine compounds

Also Published As

Publication number Publication date
AU2004267161A1 (en) 2005-03-03
WO2005019459A1 (de) 2005-03-03
US7557203B2 (en) 2009-07-07
PL1711612T3 (pl) 2007-12-31
ES2289529T3 (es) 2008-02-01
US20060150282A1 (en) 2006-07-06
EP1711612B1 (de) 2007-07-25
ATE368121T1 (de) 2007-08-15
AU2004267161B2 (en) 2009-10-29
EP1711612A1 (de) 2006-10-18
CA2532903C (en) 2013-01-08
CA2532903A1 (en) 2005-03-03
DE502004004468D1 (de) 2007-09-06

Similar Documents

Publication Publication Date Title
CN1842593B (zh) 精确育种
AU2008214568B2 (en) Nucleic acid sequences for regulation of embryo-specific expression in monocotyledonous plants
CN103820445B (zh) 一个植物花药特异表达启动子的鉴定和应用
AU2006217847B2 (en) Expression cassettes for seed-preferential expression in plants
AU2002354531B2 (en) Expression cassettes for the transgenic expression of nucleic acids
CA2532903C (en) Expression cassettes for the bi-directional transgenic expression of nucleic acids in plants
AU2006257101B2 (en) Starchy-endosperm and/or germinating embryo-specific expression in mono-cotyledonous plants
US7563944B2 (en) Expression cassette for nucleic acids in plant tissue containing starch
CN102471777B (zh) 用于在植物中胚乳-特异性表达的表达盒
AU2005222518B2 (en) Constitutive expression cassettes for regulation of plant expression
DE10133407A1 (de) Expressionskassetten zur transgenen Expression von Nukleinsäuren
WO2005113771A1 (en) An embryo preferred promoter and method of using same
US8642749B2 (en) Regulatory region preferentially expressing to seed embryo and method of using same
AU2011202732B2 (en) Constitutive expression cassettes for regulation of plant expression
Gallie Transgenic carrot (Daucus carota L.)
AU2006210283A1 (en) Transcription regulating nucleotide sequence from Solanaceae triose-phosphate translocator genes and their use in plant expression cassettes
KR20090084014A (ko) 선발표지 유전자 제거용 형질전환 벡터
WO2004024926A2 (de) Transgene expressionskassetten zur expression von nukleinsäuren in kohlenhydrat-speichernden sink-geweben von pflanzen
AU2006245701A1 (en) Expression cassettes for seed-preferential expression in plants
GALLIE 11 Transgenic Carrot (Daucus carota L.)
AU2006228605A1 (en) Expression cassettes for seed-preferential expression in plants