具体实施方式
全文使用以下缩写:
CB 大麻素
CBD 大麻二酚
CBDV 次大麻二酚(Cannabidivarin)
CBG 大麻萜酚(Cannabigerol)
Δ9-THC或THC 四氢大麻酚(Tetrahydrocannabinol)
CBN 大麻酚
CBNV Cannabinavarin
CBDA 大麻二酚酸(Cannabidiolic acid)
THCV 四氢次大麻酚(Tetrahydrocannabivarin)
UGT UDPG依赖性葡糖基转移酶
UDPG 尿苷二磷酸葡萄糖
UDP 尿苷二磷酸
AEA 花生四烯酸乙醇酰胺(Arachidonoyl ethanolamide,
aka,anandamide)
2-AG 2-花生四烯酸乙醇酰胺
1-AG 1-花生四烯酸乙醇酰胺
DHEA N-二十二碳六烯酰乙醇胺(N-Docosahexaenoyl
ethanolamine,aka,synaptamide)
SUS 蔗糖合成酶。
术语“吡喃葡萄糖苷”用于命名分子并且是通过葡萄糖的1-位(异头碳)上的羟基连接至糖苷配基的β-D-葡萄糖的简写。
术语“糖苷配基”在本申请中用于指糖苷化合物的非糖苷部分。
术语“前药”是指在施用后必须通过代谢过程进行化学转化才能成为活性药理学药剂的化合物。
术语“大麻素糖苷前药”通常指大麻素化合物、内源性大麻素化合物和类香草素化合物的糖苷。大麻素糖苷前药通常通过糖苷酶的作用经历糖苷键的水解,以将活性大麻素、内源性大麻素或类香草素化合物释放至受试者体内所需部位。本发明的大麻素糖苷前药也可以用术语“大麻糖苷(cannaboside)”来指代。
术语“大麻素”在本申请中用于泛指在大麻中发现的并且作用于大麻素受体的化合物。“大麻素”化合物包括但不限于,大麻二酚(CBD),次大麻二酚 (CBDV),大麻萜酚(CBG),四氢大麻酚(Δ9-THC或THC),大麻酚(CBN),大麻二酚酸(CBDA)和四氢次大麻酚(THCV)。特别优选的大麻素化合物是 CBD、CBDV、THC和CBN。
本申请中使用的术语“内源性大麻素”用于指以下化合物,包括花生四烯酸乙醇酰胺(AEA),2-花生四烯酸乙醇酰胺(2-AG),1-花生四烯酸乙醇酰胺(1-AG) 和二十二碳六烯酰乙醇胺(DHEA,synaptamide),油酰乙醇酰胺(OEA),二十碳五烯酸乙醇酰胺(eicsapentaenoyl ethanolamide),前列腺素乙醇胺,二十二碳六烯酰乙醇胺,亚麻酰基乙醇酰胺,5(Z),8(Z),11(Z)-二十碳三烯酸乙醇胺(蜂蜜酸乙醇胺),十七烷醇乙醇酰胺,硬脂酰乙醇酰胺,二十二碳烯酰乙醇酰胺 (docosaenoyl ethanolamide),神经酰基乙醇酰胺(nervonoyl ethanolamide),二十三烷酰乙醇酰胺,木蜡酰乙醇酰胺(lignoceroylethanolamide),肉豆蔻酰乙醇酰胺,十五烷酰乙醇酰胺,棕榈油酰基乙醇酰胺,二十二碳六烯酸(DHA)。特别优选的内源性大麻素是AEA、2-AG、1-AG和DHEA。
术语“类香草素”在本申请中用于指这样的化合物:其包括香草基并且作用于类香草素受体,如TRPV1。“类香草素”化合物包括但不限于香草醛(vanillin)、辣椒素和姜黄素。
如本文所使用的,术语“约”是指与标称值相差+/-10%的变化。应该理解,这样的变化总是包括在本文提供的给定值中,无论是否特别提及。
如本文所用,术语“受试者”或“患者”是指需要治疗的动物。在一个实施方案中,动物是人。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。
根据本发明,大麻素、内源性大麻素和类香草素被用作葡萄糖基转移酶的底物,在所述大麻素、内源性大麻素和类香草素上连接一个或多个糖分子以产生新的大麻素糖苷前药。所得到的大麻素糖苷前药表现出位点特异性或组织特异性递送,水性溶解度改善以改善大麻素、内源性大麻素和类香草素类药物分子的药理学递送,和/或持续释放或延迟释放。
还根据本发明,大麻素糖苷前药在糖苷键水解后转化以提供活性大麻素、内源性大麻素和类香草素药物。因此,本发明表明,具有疏水性糖苷配基部分的糖苷在胃肠道或糖苷酶表达增加的组织中经历葡萄糖水解,在靶组织或器官中产生疏水性大麻素化合物。
糖苷的葡萄糖残基通常在胃中被酸水解或被肠道中的糖苷酶酶切,包括被肠道微生物群落在肠道不同区域表达的α-糖苷酶和β-糖苷酶酶切。因此,糖苷在被摄入后被水解以将所需化合物释放到肠道或靶组织中。
在一个实施方案中,大麻素药物的糖基化提供了这样的大麻素糖苷前药:其能够在口服给药后保持在酸性胃环境中,从而允许前药递送到大肠中,在大肠中,大麻素糖苷配基可以被结肠细菌所产生的糖苷酶释放。
在一个实施方案中,大麻素药物的糖基化提供了这样的大麻素糖苷前药:其适合靶向递送至糖苷酶表达增加的组织。在向受试者胃肠外施用大麻素糖苷前药制剂后,大麻素糖苷配基被靶组织中的糖苷酶释放。
以下内容也在本发明的范围内:大麻素糖苷前药也可用作无需葡萄糖裂解的药剂,其中它们与单独的母体化合物相比表现出新的药效学性质。本发明大麻素糖苷前药的水性溶解度增加还使得能够得到在透皮或水性制剂中递送的新制剂,如果配制疏水性大麻素、内源性大麻素和类香草素分子这是不可能实现的。
在本发明的一个实施方案中,提供了具有式(I)结构的大麻素糖苷前药化合物,或其药学上相容的盐:
其中R是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基; R′是H或β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基;并且 A是通过大麻素化合物、内源性大麻素化合物或类类香草素化合物上的羟基反应而形成的糖苷配基部分。
根据本发明的一个实施方案,A为A′、A″或A″′;
其中A′为:
其中A″为:
并且其中A″′为:
其中G是H、β-D-吡喃葡萄糖基、3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基或β-D-吡喃葡萄糖基-(1→3)-β-D-吡喃葡萄糖基-(1→3)-D-吡喃葡萄糖基;或其药学上相容的盐。
根据本发明的一个实施方案,大麻素糖苷前药是大麻素的糖苷,其中前药具有式(I′)结构:
其中R为H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基; R′是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基;并且其中A′为:
其中G是β-D-吡喃葡萄糖基、3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基或β-D-吡喃葡萄糖基-(1-3)-β-D-吡喃葡萄糖基-(1-3)-D-吡喃葡萄糖基。
式(I′)化合物包括表1至4中列出的化合物。
根据本发明由CBD(VB101)的糖基化作用产生的、落入式(I′)范围内的示例性大麻二酚(CBD)-糖苷包括:
根据本发明由CBDV(VB201)的糖基化作用产生的、落入式(I′)范围内的示例性次大麻二酚(CBDV)-糖苷包括:
根据本发明由Δ9-THC(VB301)的糖基化作用产生的、落入式(I′)范围内的示例性四氢大麻酚(Δ9-THC)-糖苷包括:
根据本发明由CBN(VB401)的糖基化作用产生的、落入式(I′)范围内的示例性大麻酚(CBN)-糖苷包括:
根据本发明的一个实施方案,大麻素糖苷前药是内源性大麻素的糖苷,所述前药具有式(I″)结构:
其中
R为H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基;
R′为H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基;并且其中,A″为:
式(I″)化合物包括表5至8中列出的化合物。
根据本发明由AEA(VB501)的糖基化作用产生的、落入式(I″)范围内的示例性花生四烯酸乙醇胺(AEA)-糖苷包括:
根据本发明由2-AG(VB601)的糖基化作用产生的、落入式(I″)范围内的示例性2-花生四烯酸乙醇胺(2-AG)-糖苷包括:
根据本发明由1-AG(VB701)的糖基化作用产生的、落入式(I″)范围内的示例性1-花生四烯酸乙醇胺(1-AG)-糖苷包括:
根据本发明由DHEA(VB801)的糖基化作用产生的、落入式(I″)范围内的示例性N-二十二碳六烯酰乙醇胺(DHEA)-糖苷包括:
根据本发明的一个实施方案,大麻素糖苷前药是类香草素的糖苷,所述前药具有式(I″′)结构:
其中
R是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基;
R′是H或β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基;并且其中A″′为:
式(I″′)化合物包括表9至11中列出的化合物。
根据本发明由辣椒素(VB901)的糖基化作用产生的、落入式(I″′)范围内的示例性辣椒素-糖苷包括:
根据本发明由香草醛(VB1001)的糖基化作用产生的、落入式(I″′)范围内的示例性香草醛-糖苷包括:
根据本发明由姜黄素(VB1101)的糖基化作用产生的、落入式(I″′)范围内的示例性姜黄素-糖苷包括:
在一个实施方案中,提供了一种用于将大麻素药物位点特异性递送至受试者的方法,所述方法包括以下步骤:向需要其的受试者施用一种或多种根据本发明的大麻素糖苷前药。在一个实施方案中,递送位点是大肠。在一个实施方案中,递送位点是直肠。在一个实施方案中,递送位点是肝脏。在一个实施方案中,递送位点是皮肤。
在一个实施方案中,提供了促进将大麻素药物通过鼻内、立体定向或鞘内递送或跨越受试者的血脑屏障递送运输到大脑的方法,其包括向需要其的受试者施用根据本发明的大麻素糖苷前药。
根据本发明,大麻素糖苷前药可用于治疗受益于施用大麻素药物或施用大麻素药物可改善的病况。可以通过施用本发明的大麻素糖苷前药来治疗或改善的病况包括但不限于炎症性肠病,包括诱导克罗恩病(Crohn′s disease)和结肠炎缓解和诱导溃疡性结肠炎缓解。通过施用本发明的大麻素糖苷前药可以实现的益处是:肠道和直肠的炎症减轻,肠道、直肠中的疼痛减轻,以及神经性疼痛和腹痛减轻,和结直肠癌的增殖或细胞毒性抑制。大麻素或大麻素糖苷的其他治疗适应症、作用或应用可包括但不限于厌食,恶心,呕吐,疼痛,消耗综合征,HIV消耗(HIV-wasting),化疗引起的恶心和呕吐,癫痫,精神分裂症,肠易激综合征,抽搐,痉挛状态,惊厥病症(seizure disorder),酒精使用病症,药物滥用病症,成瘾,癌症,肌萎缩侧索硬化,多形性成胶质细胞瘤,神经胶质瘤,眼内压升高,青光眼,大麻使用障碍,图雷特氏综合征(Tourette′s syndrome),肌张力障碍,多发性硬化,白质病症,脱髓鞘病,慢性创伤性脑病,脑白质病,格林-巴利综合征(Guillain-Barre syndrome),炎性肠病,胃肠病,细菌感染,MRSA,败血症,败血性休克,病毒感染,关节炎,皮炎,类风湿性关节炎,系统性红斑狼疮,抗炎,抗痉挛,抗精神病,抗氧化,神经保护,抗癌,免疫调节作用,神经性疼痛,与疱疹后神经痛相关的神经性疼痛,糖尿病性神经病,带状疱疹,烧伤,光化性角化病,口腔疮疡和溃疡,会阴切开后疼痛,银屑病,瘙痒症,痛风,软骨钙质沉着病,关节疼痛,纤维肌痛,肌肉骨骼疼痛,神经病理性手术后并发症。
在一个实施方案中,大麻素糖苷前药以药物组合物的形式被施用,所述药物组合物还包括药学上可接受的载体、稀释剂、赋形剂或佐剂。在一个实施方案中,药物组合物包括一种或多种大麻素糖苷前药和一种或多种药学上可接受的载体、稀释剂、赋形剂和/或佐剂。为了向受试者施用,可将药物组合物配制成通过多种途径施用,包括但不限于口服,局部,直肠,肠胃外和鼻内施用。
药物组合物可以包括约1%至约95%的本发明的大麻素糖苷前药。配制成以单剂量形式施用的组合物可包括,例如,约20%至约90%的本发明的大麻素糖苷前药,而非单剂量形式的组合物可包括,例如,约5%至约20%的本发明的大麻素糖苷前药。单位剂量形式的非限制性实例包括片剂,安瓿,糖衣丸,栓剂和胶囊剂。
在优选的实施方案中,药物组合物被配制成口服施用。用于口服施用的药物组合物可以配制成,例如,片剂,锭剂(troche),糖锭剂(lozenge),水性或油性悬浮剂,可分散的粉剂或颗粒剂,乳剂硬胶囊剂或软胶囊剂,或糖浆剂或酏剂。这种组合物可以根据本领域已知的用于制备药物组合物的标准方法来制备,并且可以含有一种或多种选自以下组的试剂:甜味剂、调味剂、着色剂和防腐剂,从而提供药学上精美可口的制剂。片剂含有与合适的无毒的药学上可接受的赋形剂混合的活性成分,所述合适的无毒的药学上可接受的赋形剂包括,例如,惰性稀释剂,如碳酸钙、碳酸钠、乳糖、磷酸钙或磷酸钠;造粒剂和崩解剂,如玉米淀粉或海藻酸;粘合剂,如淀粉、明胶或阿拉伯胶,以及润滑剂,如硬脂酸镁、硬脂酸或滑石粉。片剂可以是未包衣的,或者可以通过已知技术对其进行包衣从而延迟在胃肠道中的崩解和吸收,并由此在较长时期内提供持续作用。例如,可以使用延时材料如单硬脂酸甘油酯或二硬脂酸甘油酯来进一步促进药物化合物向消化道中所需位置的递送。
用于口服使用的药物组合物还可以呈现为硬明胶胶囊的形式,其中活性成分与惰性固体稀释剂例如碳酸钙、磷酸钙或高岭土混合,或呈现为软明胶胶囊的形式,其中活性成分与水或油性介质如花生油、液体石蜡或橄榄油混合。
配制为水性悬浮剂的药物组合物含有与一种或多种合适的赋形剂混合的 (多种)活性化合物,所述合适的赋形剂例如悬浮剂,如羧甲基纤维素钠、甲基纤维素、羟丙基甲基纤维素、海藻酸钠、聚乙烯吡咯烷酮、羟丙基-β-环糊精、黄蓍胶和阿拉伯胶;分散剂或润湿剂,如天然存在的磷脂例如卵磷脂或环氧烷与脂肪酸的缩合产物,例如聚氧乙烯硬脂酸酯,或环氧乙烷与长链脂肪醇的缩合产物,例如七-十乙烯氧基鲸蜡醇(hepta-decaethyleneoxycetanol),或者环氧乙烷与衍生自脂肪酸和己糖醇的偏酯的缩合产物,例如聚氧乙烯山梨糖醇单油酸酯,或环氧乙烷与衍生自脂肪酸和己糖醇酐的偏酯的缩合产物,例如聚乙烯山梨醇酐单油酸酯。水性悬浮剂还可以含有一种或多种防腐剂,例如对羟基苯甲酸乙酯或正丙酯,一种或多种着色剂,一种或多种调味剂或一种或多种甜味剂,如蔗糖、甜菊糖或糖精。
可以通过将(多种)活性化合物悬浮于植物油(例如花生油、橄榄油、芝麻油或椰子油)或矿物油(例如液体石蜡)中而将药物组合物配制成油性悬浮剂。油性悬浮剂可以含有增稠剂,例如蜂蜡、硬石蜡或鲸蜡醇。可加入如上所述的甜味剂和/或调味剂来提供可口的口服制剂。可以通过加入抗氧化剂如抗坏血酸来保存这些组合物。
药物组合物可以配制成可分散的粉末剂或颗粒剂,其随后可以通过加入水用于制备水性悬浮剂。这种可分散的粉末剂或颗粒剂提供了与一种或多种分散剂或润湿剂、悬浮剂和/或防腐剂混合的活性成分。合适的分散剂或润湿剂和悬浮剂以上面已经提到的那些为例。这些组合物还可以包括另外的赋形剂,例如甜味剂、调味剂和着色剂。
本发明的药物组合物还可以配制成水包油乳剂。油相可以是植物油,例如橄榄油或花生油,或矿物油,例如液体石蜡,或者可以是这些油的混合物。包括在这些组合物中的合适的乳化剂包括天然存在的树胶,例如阿拉伯胶或黄蓍胶;天然存在的磷脂,例如大豆、卵磷脂;或衍生自脂肪酸和己糖醇、酐类的酯或偏酯,如脱水山梨糖醇单油酸酯,以及所述偏酯与环氧乙烷的缩合产物,例如聚氧乙烯山梨糖醇单油酸酯。乳剂还可以任选地含有甜味剂和调味剂。
可以通过将(多种)活性成分与一种或多种甜味剂(例如甘油、丙二醇、山梨糖醇或蔗糖)混合而将药物组合物配制成糖浆剂或酏剂。这样的制剂还可以任选地含有一种或多种缓和剂(demulcent)、防腐剂、调味剂和/或着色剂。如果需要,组合物中可以包括其它活性成分。在一个实施方案中,糖苷前药可以与其他成分或物质组合,所述其他成分或物质具有糖苷酶活性,或以其他方式改变多种化合物的体内药物代谢和药代动力学特征,包括纯化形式的那些成分或物质以及在食品、饮料和其他产品中发现的此类化合物。在一个实施方案中,大麻素糖苷前药与具有直接的糖苷酶活性或者有助于修饰肠道微生物群落 (这将改变肠道的一个或多个区域中的糖苷酶活性)的物质组合施用或一起配制。这种组合物的实例包括但不限于酸奶、益生元、益生菌或粪便移植物。
在进一步优选的实施方案中,药物组合物被配制成肠胃外施用。如本文所用,术语“肠胃外”包括皮下注射,静脉内、肌内、鞘内、胸骨内注射或输注技术。
可根据本领域已知的方法并使用一种或多种如上提及的合适的分散剂或润湿剂和/或悬浮剂,将胃肠外药物组合物配制成无菌可注射水性或油性悬浮剂。无菌可注射制剂可以是无毒的肠胃外可接受的稀释剂或溶剂中的无菌可注射溶液或混悬液,例如1,3-丁二醇溶液。可使用的可接受媒介和溶剂包括但不限于水、林格氏液、乳酸林格氏液和等渗氯化钠溶液。其他实例包括常规用作溶剂或悬浮介质的无菌固定油和各种温和固定油,包括例如合成甘油单酯或甘油二酯。脂肪酸如油酸也可用于制备注射剂。
由于大麻素的高亲脂性,这些分子通常很难通过膜如哺乳动物(包括人) 的皮肤吸收,并且大大地限制了在合理的时间范围内在合适的表面积上向需要其的受试者成功透皮施用治疗有效量的大麻素。因此提出,本发明的大麻素糖苷前药通过将疏水性大麻素糖苷配基与亲水糖苷部分缀合,提供了有利于被动扩散的两亲特性的分子,其更容易通过皮肤被吸收。
因此,在一个实施方案中,药物组合物被配制成局部施用。这种局部用制剂可以呈现为例如气溶胶喷雾剂,粉剂,棒剂,颗粒剂,乳膏剂,液体乳膏剂,糊剂,凝胶剂,洗剂,软膏剂,在海绵或棉花涂药器上,或作为水性液体、非水液体、水包油乳液或油包水液体乳液中的溶液剂或悬浮剂。
局部用药物组合物可以用增稠剂(胶凝剂)配制。本文使用的增稠剂可以包括阴离子聚合物,例如聚丙烯酸(Noveon,Inc.,Cleveland,Ohio的
),羧基聚亚甲基(carboxypolymethylene),羧甲基纤维素等,包括
聚合物的衍生物,例如
Ultrez 10,
940,
941,
954,
980,
981,
ETD 2001,
EZ-2和
EZ-3以及其他聚合物如
聚合乳化剂和
聚卡波非。增稠剂或胶凝剂的存在量足以提供组合物所需的流变性能。
局部用药物组合物可以用渗透促进剂配制。渗透促进剂的非限制性实例包括C8-C22脂肪酸,如异硬脂酸、辛酸和油酸;C8-C22脂肪醇,如油醇和月桂醇;C8-C22脂肪酸的低级烷基酯,如油酸乙酯、肉豆蔻酸异丙酯、硬脂酸丁酯和月桂酸甲酯;C6-C22二酸的二(低级)烷基酯,如己二酸二异丙酯;C8-C22 脂肪酸的甘油单酯,如甘油单月桂酸酯;四氢糠醇聚乙二醇醚;聚乙二醇、丙二醇;2-(2-乙氧基乙氧基)乙醇;二甘醇单甲醚;聚氧乙烯的烷基芳基醚;聚氧乙烯单甲醚;聚氧乙烯二甲醚;二甲基亚砜;甘油;乙酸乙酯;乙酰乙酸酯; N-烷基吡咯烷酮;和萜烯。
局部用药物组合物可以进一步包括如药物形成领域已知的润湿剂(表面活性剂)、润滑剂、润肤剂、抗微生物防腐剂和乳化剂。
通过使用微针阵列药物递送系统可以进一步促进大麻素糖苷前药的透皮递送。
制备药物组合物的其他药物组合物和方法是本领域已知的,并且描述于例如“Remington:The Science and Practice of Pharmacy”(以前称为“RemingtonsPharmaceutical Sciences”);Gennaro,A.,Lippincott,Williams&Wilkins,Philadelphia,PA(2000)中。
上述本发明的药物组合物包括能有效达到预期目的的量的一种或多种本发明的大麻素糖苷前药。因此,术语“治疗有效剂量”是指例如通过改善待治疗的疾病或病症的症状、预防该疾病或病症或改变疾病的病理来改善要治疗的受试者的状态的大麻素糖苷前药的量。确定化合物的治疗有效剂量完全在本领域技术人员的能力范围之内。在一个实施方案中,可以组合多种大麻素糖苷以使得能够以位点特异性的方式同时递送多种大麻素,包括THC和CBD,其在某些方面的影响可能是协同的(Russo 2006)。因此,在一个实施方案中,药物组合物包括一起配制成单一剂型的一种或多种CBD-糖苷和一种或多种THC-糖苷。
可以由医师根据与需要治疗的受试者相关的因素来确定要向受试者施用的确切剂量。调整剂量和施用以提供所需水平的大麻素糖苷前药和/或在前药水解后获得的大麻素药物化合物。在确定合适的剂量时可考虑的因素包括疾病状态的严重程度,受试者的一般健康状况,受试者的年龄、体重和性别,饮食,施用的时间和频率,(多种)药物组合,反应敏感性和对治疗的耐受/反应。可以由专业人员根据上述因素以及例如具体制剂的半衰期和清除率等因素来设计给药方案。
根据本发明,提供了一种生产大麻素糖苷的方法,所述方法包括在一种或多种糖基转移酶的存在下,将大麻素糖苷配基与一种或多种糖供体一起孵育。
在一个实施方案中,所述一种或多种糖基转移酶是UGT76G1或UGT76G1 样葡糖基转移酶。在一个实施方案中,所述一种或多种糖基转移酶包括UGT76G1 或UGT76G1样葡糖基转移酶和Os03g0702000或Os03g0702000样葡糖基转移酶。
在一个实施方案中,所述一种或多种糖供体选自由以下组成的组:UDP-葡萄糖,UDP-葡萄糖醛酸,UDP-甘露糖,UDP-果糖,UDP-木糖,UDP-鼠李糖, UDP-氟代脱氧葡萄糖及其组合。在一个优选的实施方案中,糖供体是UDP-葡萄糖。
根据本发明,大麻素糖苷配基是大麻素、内生大麻素或类香草素。在一个优选的实施方案中,通过本发明的方法产生的大麻素糖苷前药是式(I)的化合物。
在一个实施方案中,产生大麻素糖苷的方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶的存在下,将大麻素糖苷配基与UDP- 葡萄糖一起孵育。
在一个实施方案中,产生大麻素糖苷的方法包括在允许糖基化的条件下,在第一糖基转移酶和第二糖基转移酶的存在下,将大麻素糖苷配基与一种或多种糖供体一起孵育。在一个实施方案中,糖供体是UDP-葡萄糖,第一糖基转移酶是UGT76G1或UGT76G1-样葡糖基转移酶,第二糖基转移酶是Os03g0702000 或Os03g0702000-样葡糖基转移酶。
在一个实施方案中,产生大麻素糖苷的方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶和Os03g0702000或Os03g0702000样葡糖基转移酶的存在下,将大麻素糖苷配基与UDP-葡萄糖一起孵育。
在一个实施方案中,产生大麻素糖苷的方法包括在允许糖基化的条件下,在环糊精葡聚糖转移酶的存在下,将大麻素糖苷配基与麦芽糖糊精一起孵育。
在一个实施方案中,产生大麻素糖苷的方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶和环糊精葡聚糖转移酶的存在下,将大麻素糖苷配基与UDP-葡萄糖和麦芽糖糊精一起孵育。
在一个优选的实施方案中,在产生大麻素糖苷的方法中使用的糖基转移酶是UGT76G1或UGT76G1样葡糖基转移酶。在一个实施方案中,UGT76G1或 UGT76G1-样葡糖基转移酶包括如SEQ ID NO:1、3、5或7中所示的序列。
在一个实施方案中,在产生大麻素糖苷的方法中使用的糖基转移酶是Os03g0702000或Os03g0702000样葡糖基转移酶。在一个实施方案中, Os03g0702000或Os03g0702000样葡糖基转移酶包括如SEQ ID NO:9所示的序列。
在一个实施方案中,产生大麻素糖苷的方法进一步包括与蔗糖合成酶一起孵育。在一个实施方案中,蔗糖合成酶包括如SEQ ID NO:15、17、19、21、 23或25所示的序列。
在一个实施方案中,用于产生大麻素糖苷前药的方法包括在产生大麻素糖苷配基的细胞或植物中表达一种或多种糖基转移酶,并分离大麻素糖苷前药。
正如从C18分析型HPLC色谱柱加速洗脱所证明的,大麻素的糖基化改善了在水溶液中的溶解度,表明新型大麻素糖苷需要很少的有机溶剂来从疏水性色谱柱中洗脱。通过检验纯化的固体大麻糖苷的水性溶解度进一步证实了这种改善的溶解度,其中溶液成功制备成高达500mg/ml(50%质量/体积),具有大麻糖苷的高级(higher)糖苷形式的混合物。考虑到溶解度的显著改善和大麻素上的新型二级和三级糖基化作用,糖基化的大麻素可以作为有效的前药用于将大麻素选择性递送至所需组织,其中葡萄糖分子可以被水解从而释放糖苷配基大麻素。此外,糖基化作用通过保护CBD和CBDV使其免于氧化和C6′-羟基的闭环作用而促进了CBD和CBDV的稳定性,这分别防止其分解为Δ9-THC或Δ9-THCV,随后分别分解为大麻酚(CBN)或Cannabinavarin(CBNV)。
增加大麻素上糖类附着物的多样性和复杂性,以及施用糖苷混合物将改变前药的递送动力学,从而提供缓释制剂药物。大麻素在人类中的主要解毒机制是CYP450介导的CBD和CBDV的C7甲基的羟基化,或THC和CBN的C11 甲基的羟基化;由于空间位阻防止了大麻素-糖苷结合在CYP450活性位点,大麻素间苯二酚环的受体羟基的糖基化可以提供免受C7/C11羟基化并随后从体内消除的保护。事实上,CBD的羟基被认为有助于与小肠上皮中的解毒细胞色素 P450 CYP3A4的结合(Yamaori 2011)。由于这些作用导致的胃和小肠中的降解或代谢降低还可导致任意糖基化的产物在口服递送时总生物利用度更高。
在一些情况下,为了使化合物发挥其主要生物活性,可能需要在体内从糖苷中去除糖。因此,由于其主要生物学作用可能仅在口服摄入后发生,糖苷前药可以实现抵抗滥用的稳定药物制剂。由于大多数滥用抑制(abuse-deterrent) 化合物都是基于简单混合或配制的抑制物(deterrent),因此仍然可以通过简单的物理和化学方法来破坏它们。作为一个实例,本文所述的β-糖苷在β-糖苷酶的作用下将仅仅释放糖苷配基。已知β-糖苷酶由占据哺乳动物大肠的微生物分泌,因此在口服摄入后,糖苷前药将保持糖基化直至其到达大肠。类似的方法可用于通过糖基化的其它化合物的滥用抵抗,滥用抑制和位点特异性递送。已经发现,甜叶菊中的UGT76G1酶(SEQ ID NO.1)将糖供体UDP-葡萄糖(UDPG) 的葡萄糖分子转移到CBD的羟基上以产生新的CBD-O-糖苷(表1,图2和4)。 UDPG被UGT76G1反转化以产生β-D-葡萄糖残基,所述β-D-葡萄糖残基共价连接到CBD上的羟基受体位点。为了提高催化效率,进行了UGT76G1开放阅读框(ORF)密码子优化(SEQ ID NO.4和6)以在毕赤酵母(Pichiapastoris) 中表达。与其对甜菊醇糖苷的活性类似,UGT76G1具有高生产力且对于CBD 的平衡常数(Keq)为~24。通过实验和分析确定,UGT76G1具有将多个葡萄糖部分应用于CBD分子的独特能力。在CBD与UGT76G1和UDPG长时间一起孵育后,反应混合物的HPLC分析产生8种糖苷产物流动性基团,表明UGT76G1 能够糖基化CBD上的C2′和C6′羟基,以及糖基化具有二级和三级葡萄糖部分的初级葡萄糖残基。UGT76G1的二级和三级糖基化发生在受体糖的C3羟基上 (3→1连接性),正如其在甜叶菊中的活性所表明的那样,产生O-(3-1)-糖苷和后续产物。CBD-糖苷产物流动性基团还表明,CBD可以在UGT76G1活性位点上向前和向后对接,为糖基化形成相对于大麻素骨架而言顺式样构象(机制描绘在图3中),或者可能C1′(C6由Mazur2009描述)处的键的旋转自由度允许羟基在糖基化后旋转,将UDPG附近的另一个羟基置于活性位点中,在大麻素骨架上为糖基化形成反式样构象(机制描绘在图4中)。图6中描绘了对接在 UGT76G1的活性位点中的可能的CBD分子,其中CBD叠加在UGT76G1, RebaudiosideE(RebE)的双功能底物上(图6)。
由于CBD成功地被UGT76G1糖基化,将CBDV与UGT76G1和UDPG一起孵育以检验糖基化活性。在HPLC分析中观察到CBDV耗尽,此外还出现了另外四个产品峰移动性基团,这依赖于UGT76G1和UDPG的添加。所形成的四种新产物表现出与CDBV相同的吸光度特征,并且被确定为初级糖苷 CBDV-2′-O-吡喃葡萄糖苷、CBDV-6′-O-吡喃葡萄糖苷和二级糖苷 CBDV-2′-O-(3-1)-二吡喃葡萄糖苷和CBDV-6′-O-(3-1)-二吡喃葡萄糖苷(分别为化合物VB202、VB206、VB204和VB208,表2)。经过额外的反应时间,确定还形成了高级(higher order)糖苷产物。CBDV-糖苷生产与由UGT76G1生产 CBD-糖苷类似(表2),并且完成的Keq为~24。鉴于CBDV-糖苷产物的数目, UGT76G1将多个葡萄糖分子转移到CBDV上的C2′和C6′羟基上,并且转移到初级和二级糖基化上。
当大麻素Δ9-THC与UGT76G1和UDPG一起孵育时,反应混合物的HPLC 分析显示有三个主要产物峰流动性基团。这三种产物被鉴定为Δ9-THC-1-O-吡喃葡萄糖苷、Δ9-THC-1-O-(3-1)-二吡喃葡萄糖苷和Δ9-THC-1-O-(3-1,3-1)三吡喃葡萄糖苷(正式的吡喃编号,表3,图7)。鉴于Δ9-THC的刚性结构在C1′间苯二酚环附着物周围没有与CBD相同的旋转自由度,大麻素骨架在UGT76G1的活性位点被位于UDPG糖供体的Δ9-THC C1羟基识别(吡喃编号,图1B)。
由于UGT76G1对所有所分析的其他植物大麻素都展现出糖基化活性,因此还检验了其对大麻酚(CBN)的糖基化活性。观察到UGT76G1对CBN的有效糖基化,与Δ9-THC模式类似,两者在间苯二酚环的C1位都共享单个羟基受体基团。用UGT76G1观察到的活性与酶活性位点对大麻素的广泛识别是一致的。
因为它们在大麻素骨架上的相似位置上具有羟基,可以将其他大麻素底物插入到UGT76G1糖基化反应基础结构中以产生新的大麻素糖苷。理想的候选物是大麻萜酚(CBG)、大麻色原烯(cannabichromene)(CBC)、大麻二酚羟基醌 (cannabidiol hydroxyquinone)(CBDHQ),HU-331,Δ9-THC的其他异构体如Δ8-THC等,以及Δ9-THC的合成类似物如HU-210。
类似于UGT76G1的二级3→1次糖基化活性,确定在经UGT76G1初级糖基化后,稻的UGT酶Os03g0702000(SEQ ID NO.9)也能够将UDP-葡萄糖的其他葡萄糖部分转移到初级糖的C2-羟基上(表1-11,图7-图9和图12-14)。该糖基化活性与在已存在的初级葡萄糖残基上建立C2-羟基二级糖基化(2→1 连接性)中UGT Os03g0702000对甜菊醇糖苷的活性一致。用CBDV(表2,图 3)和THC(表2,图7)观察到了这种二级糖基化,分别产生新的CBDV和Δ9THC-1-O-(2-1)-二吡喃葡萄糖苷物质。与广泛的底物识别和反应性一致, Os03g0702000的这种活性进一步证明了图1A 中鉴定的剩余底物。
除了UDPG依赖性葡糖基转移酶活性外,环糊精-葡聚糖转移酶(CGTase, Toruzyme3.0L,Novozymes公司的招牌产品)能够将短的α-(1-4)-麦芽糖糊精链转移到大麻素的羟基上。CGTase还能够糖基化由UGT76G1和Os03g0702000 建立的初级和二级糖基化,导致以β-D-葡萄糖分子开始但终止于α-D-葡萄糖分子的碳水化合物附着物,称为β-引发的-α-葡糖基(β-primed-α-glucosyl)(表1-11)。经环糊精葡聚糖转移酶的α-糖基化介导的麦芽糖糊精转移可以发生在与大麻素共价连接的初级或二级糖的任意羟基上。本领域技术人员将会理解,这使得可能有任意数目的α-糖基链构象与表1-11中列出的糖苷连接。
与UGT76G1和Os03g0702000具有同源性的其他酶可用于产生相同的大麻素糖基化。用于建立初级糖基化的类似于UGT76G1的合适酶是UGT76进化枝的其他成员,如UGT76G2或UGT76H1。用UGT76G1蛋白质序列BLAST的结果产生49%一致性的最大同源性,多达66%阳性(相似一致性)。理想的候选物可能具有低的总肽一致性或相似性,但在UDPG催化位点附近的开口处可能具有保守的氨基酸。该序列以379位亮氨酸和一个更宽的肽序列SDFGLDQ(UGT76G1的375至381AA’s)为例。用于产生Os03g0702000的二级糖基化的合适的酶是UGT91进化枝的成员,包括UGT91D1和UGT91D2。
本文进行的糖基化反应包括以UDP-葡萄糖作为核苷酸糖供体,然而在UGT 之间存在一些交叉反应性,这允许使用其他核苷酸糖,如UDP-葡萄糖醛酸等。葡萄糖醛酸是肝脏中II相解毒UGT所使用的主要核苷酸糖,大麻素-葡萄糖醛酸苷是常见的解毒产物。可以用来提供碳水化合物部分以产生具有相似性质的新型糖苷的其他核苷酸糖包括UDP-葡萄糖醛酸、UDP-甘露糖、UDP-果糖、UDP- 木糖、UDP-鼠李糖、UDP-氟脱氧葡萄糖等。另外,核苷酸糖也可以组合使用以产生在同一糖苷配基骨架上含有多种类型的残基的糖苷。进一步改善本文所述的大麻素和其它化合物的溶解性和递送的其他策略包括将其糖基化,然后用其他配体或修饰使糖部分功能化。这样的实例包括硫酸化、肉豆蔻酰化、磷酸化、乙酰化等。
最近,因其在广泛的临床病理学中的作用和影响,内源性大麻素系统成为了研究热点。由于UGT76G1已被确定识别广泛类别的植物大麻素,因此假设相同的酶也会识别并糖基化内源性大麻素,内源性大麻素是被人类大麻素受体识别的内源性信号分子。在检验包括花生四烯乙醇胺(anandamide,AEA)、2-花生四烯酰乙醇酰胺(2-AG)、1-花生四烯酰乙醇酰胺(1-AG)和二十二碳六烯酰乙醇酰胺(DHEA,synaptamide)的四种原型内源性大麻素的样品时,发现 UGT76G1有效地糖基化每种内源性大麻素(表5-8,图9-12)。内源性大麻素的糖基化使得能够产生内源性大麻素-糖苷和其他脂肪酸神经递质-糖苷,代表了一种靶向递送内源性大麻素的新方法。
由于内源性大麻素如AEA、2-AG、1-AG和synaptamide被UGT76G1糖基化,因此假设相似的内源性大麻素也将是UGT76G1糖基化的合适底物。可能被 UGT76G1糖基化的其他内源性大麻素候选物包括油酰乙醇酰胺(OEA),二十碳五烯酸乙醇酰胺,前列腺素乙醇胺,二十二碳六烯酰乙醇胺,亚麻油酰基乙醇酰胺,5(Z),8(Z),11(Z)-二十碳三烯酸乙醇胺(蜂蜜酸乙醇胺),十七烷醇乙醇酰胺,硬脂酰乙醇酰胺,二十二碳烯酰乙醇酰胺,神经酰胺乙醇酰胺,二十三烷酰乙醇酰胺,木脂酰乙醇酰胺,肉豆蔻酰乙醇酰胺,十五烷酰乙醇酰胺,棕榈酰基乙醇酰胺,二十二碳六烯酸(DHA)和类似化合物。这些糖脂可能具有广泛的商业用途,范围从用作具有改善的溶解性和药代动力学性质的新型内源性大麻素药物的药物,至用作抗细菌剂,至用作与其他糖脂相似的洗涤剂,等等。
已经表征,AEA和CBD是1型toll样类香草素受体(toll-like vanilloid receptortype 1,TRPV1)的完全激动剂,所述1型toll样类香草素受体是辣椒素的受体。另外,已经证明其他大麻素和植物提取物(包括但不限于CBD、CBN、大麻萜酚(CBG)、和CBG的多种丙基同系物、THC和CBG)结合瞬时受体电位通道 (transient receptor potential channel,TRP)并对其具有活性(De Petrocellis 2011)。这包括刺激和脱敏TRPV1、TRPA1、TRPV2,以及TRPM8的拮抗作用。虽然刺激TRPV1会导致血管舒张和炎症,但辣椒素及其类似物可使受体对兴奋剂脱敏,并提供有效的抗炎作用(Bisogno 2001)。除了其他TRP之外,TRPA1可能会出现类似的作用。对于CBD,这可能在低于结合大麻素受体所需的浓度下,以及在人体临床试验和使用中通常达到的浓度范围内发生。除了作为TRPV1受体的直接激动剂之外,CBD还显示出抑制脂肪酸酰胺羟化酶(FAAH),该酶负责促进内源性大麻素花生四烯酸乙醇胺的代谢(Watanabe,1998;DE e Petrocellis 2010)。鉴于这些植物大麻素作为不同TRP的配体,因此假定UGT76G1能够糖基化相同TRP的多种不同配体,包括TRPM8、TRPV2、TRPA1和TRPV1。辣椒素能够旋转成CBD样结构(Bisogno 2001),因此推测辣椒素可能是UGT76G1 糖基化的合适底物。为此,据显示,UGT76G1能够以与美国商陆(Phytolacca americana)的PaGT3结构相同的方式糖基化辣椒素的类香草素部分 (Noguchi2009)。由于辣椒素的糖基化结构是类香草素头,进一步推测UGT76G1 能够糖基化最小的类香草素,即香草醛以及许多类似物。与此假设一致,通过 HPLC分析确定UGT76G1产生多种香草醛的糖苷产物(图14,表10)。为了更广泛地检验UGT76G1糖基化类香草素的能力,将姜黄素应用于糖基化反应作为底物,所述姜黄素是在姜黄香料中发现的良好表征的类香草素,从姜黄(Curcuma longa)中分离出来。与糖基化香草醛,UGT76G1能有效地糖基化姜黄素,产生多个糖苷产物峰,表明类似于用CBD和甜菊糖苷观察到的经UGT76G1产生的双功能识别和糖基化(图15A和15B,表11)。
大麻素糖苷也可以具有直接的生物活性和治疗效果,超过其糖苷配基形式的前药效用。槲皮素是一种抗氧化黄酮类化合物,在蔬菜中无处不在的,通常以其糖苷配基(aglyone)和糖基化形式存在。已经通过体外研究证明,槲皮素糖苷酸作为生物活性剂以及糖苷配基槲皮素的前体分子起作用(Terao 2011)。在许多情况下,包括发挥抗细菌和抗肿瘤作用的糖苷,糖苷残基对活性至关重要(Kren&Rezanka 2008)。
糖苷也被证明可以通过葡萄糖转运蛋白GLUT1来促进跨血脑屏障(BBB) 的转运。一个典型的实例是布洛芬的糖苷,能够显著增加大脑中布洛芬糖苷配基的浓度(Chen,2009)。与这些糖苷类似,本文所述的大麻素和其他化合物的糖苷可受益于跨BBB或其他屏障的增强的促进性转运。葡萄糖转运蛋白是一大组由人类基因组编码的膜蛋白,不仅在BBB中有发现,而且在许多不同的细胞和组织中有发现,包括脑、红细胞、脂肪、肌肉、肾脏、肝脏、肠和胰腺,因此专门定制糖基化以提供向任意这些组织的位点特异性递送。因此,在一个实施方案中,提供了促进大麻素药物跨越受试者的血脑屏障的转运的方法,所述方法包括向受试者施用根据本发明的大麻素糖苷前药。
由于少突胶质细胞保护性(少突保护性(oligoprotective))和一般神经保护作用,将大麻素和大麻二酚递送至大脑可能是特别有用的。已经证明,大麻素信号传递与少突胶质细胞分化(Gomez 2010)和大麻素促进少突胶质细胞祖细胞存活(Molina-Holgado2002)有关。包括大麻二酚作为主要成分的药物制剂已被批准用于治疗多发性硬化症(一种导致髓磷脂和少突胶质细胞祖细胞损失的神经退行性疾病)的肌肉痉挛和疼痛。已经证明,大麻二酚的作用通过减弱内质网应激途径来介导寡聚保护效应(Mecha 2012)。大麻二酚也因其抗精神病作用而被广泛研究,然而尚未描述其在保护少突胶质细胞和促进髓鞘再生方面的确切作用(Zuardi 2012)。尽管精神病的临床症状与表示髓鞘形成障碍的神经病理学分析之间存在相关性,但作为精神分裂症和其他精神病的驱动因素或原因的髓鞘形成障碍的作用仍然存在争议(Mighdoll 2015)。髓鞘再生也被认为可能有助于治疗阿尔茨海默病和其他形式的痴呆(Bartzokis 2004)。因此,对于其已建立的神经保护和少突保护效应,向大脑递送大麻素可能是特别有用的。大麻素糖苷药物制剂与影响其他方面的修复或再生(例如少突胶质细胞祖细胞分化或髓鞘再生)的其他试剂联合施用,也被证明是有益的。这包括例如抗LINGO-1 单克隆抗体、胍那苄(guanabenz),sephin1,苯扎托品,氯马斯汀,多不饱和脂肪酸等的化合物。
在本工作中,发现UGT76G1、Os03g0702000和环糊精葡聚糖转移酶 (CGTase)对不同化学结构的甜菊醇糖苷和糖苷配基产物进行初级、二级和三级糖基化,所述不同化学结构的甜菊醇糖苷和糖苷配基产物包括大麻素、内源性大麻素、香草醛、姜黄素和辣椒素。
在Dewitte 2016所描述的筛选和分析方法中,使用50mm HPLC分离柱结合高溶剂流动速率,限制了糖苷产物的分离和总体检测。因此,对于许多化合物的糖基化反应产物的解释是推测性的,但仍然强化了UGT76G1具有广泛底物特异性的现有发现的意义。显然,本文描述的工作证明UGT76G1不仅可以糖基化甜菊醇糖苷,而且还可以糖基化其它形式的糖苷,以及新的糖苷配基化合物如大麻二酚。内部研究使用改进的分离方法,包括150mm长的C18色谱柱和低溶剂流速,还可以清楚地检测二级和三级糖苷。这些化合物无法通过Dewitte 2016 中描述的方法检测到,并且为以下内容提供了额外的证明:UGT76G1不仅能糖基化具有不同化学结构的化合物的能力,而且还能对这些相同化合物的糖苷进行多个更高级的糖基化作用。
本文所述的反应在体外使用重组酶和所有必需的辅因子进行,并且在从植物组织中提取大麻素之前,大麻植物细胞中UGT76G1酶的表达可能用于大麻素的体内生物转化。由于UGT76G1是来自植物甜叶菊的酶,它将在大麻属中兼容表达。在大麻植物中表达UGT76G1的理想策略是对UGT76G1开放阅读框进行基因工程改造,使其处于生产大麻素的相同组织(即植物的分泌毛状体)特异性的启动子元件下。合适的启动子元件包括拟南芥的胞质O-乙酰丝氨酸(硫醇) 裂解酶(OASA1)的启动子(Gutierrez-Alcala 2005)。用UGT76G1转化的候选物包括栽培大麻(Cannabis sativa)、印度大麻(Cannabis indica)和莠草大麻(Cannabis ruderalis)。类似的方法可以使用UGT76G1和类似的酶用于在许多其他不同的植物物种中植物生产糖基化的二级代谢产物,并且当植物物种已经产生大量所需糖苷配基产物或已知酶底物时可能是特别有用的。
在进行植物大麻素糖基化反应的过程中,CBD和THC显示出显著的抗微生物活性,甚至在无菌过滤装置失效后能防止大规模反应混合物被污染。在缺乏严格卫生技术的情况下,在酶促加工期间利用甜菊醇糖苷作为底物的在先中试规模糖基化反应非常容易受到感染。在维护或保养非常有限的条件下,CBD和 THC中试规模反应在相同反应器中能保持无菌状态持续一周以上。为此,提出使用糖苷配基大麻素及其各自的糖苷作为有效的抗微生物剂。因此,在一个实施方案中,提供了一种抗微生物剂,其包括有效量的根据本发明的大麻素糖苷前药。
类似地,在大量生产大麻素糖苷和水溶液制剂后,观察到水中的多种大麻素-糖苷具有类似于洗涤剂的发泡性质。这与其他糖苷洗涤剂如8-辛基糖苷、8- 辛基硫糖苷和类似物质类似,并且为大麻素-糖苷用作洗涤剂提供了潜在用途。因此,在一个实施方案中,提供了一种去污剂,其包括有效量的本发明的大麻素糖苷前药。
核酸
本发明提供了包括编码糖基转移酶的核苷酸序列在内的核酸。本发明的糖基转移酶能够进行初级、二级、三级糖基化作用或其组合。在某些实施方案中,糖基转移酶能够进行初级、二级、三级糖基化作用。在其他实施方案中,糖基转移酶能够进行二级和三级糖基化。在某些实施方案中,核酸编码葡糖基转移酶,包括但不限于UDP-葡糖基转移酶。葡糖基转移酶包括但不限于甜叶菊UDP- 葡糖基转移酶,如UGT76G1或UGT74G1或稻(Oryzasativa)葡糖基转移酶,如Os03g0702000。在其他实施方案中,本发明提供了包括编码环糊精葡聚糖转移酶的核苷酸序列在内的核酸。还提供了包括编码蔗糖合成酶的核苷酸序列在内的核酸。
核酸包括但不限于基因组DNA、cDNA、RNA、片段和修饰版本,包括但不限于其密码子优化版本。例如,为了在毕赤酵母或大肠杆菌(E.coli)中表达,可以对核苷酸序列进行密码子优化。核酸可以包括单独的糖基转移酶或蔗糖合成酶的编码序列,或其与另外的编码序列(例如,包括但不限于纯化标签)的组合。
在某些实施方案中,核酸包括编码UGT76G1或UGT76G1样葡糖基转移酶的序列。UGT76G1样葡糖基转移酶包括,例如,UGT76G1进化枝的其他成员,如UGT76G2或UGT76H1。在某些实施方案中,核酸包括编码UGT76G1葡糖基转移酶的序列,其具有如下列出的SEQ IDNO:1、3、5和7中任意一个所示的氨基酸序列或其片段和变体。
SEQ ID NO:1(UGT76G1(天然蛋白质序列))
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKP KTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRREL ELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAH VSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILG KMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLD HDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWV VRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSG WNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEI ANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISS L
SEQ ID NO:3(在N-末端具有6×组氨酸标签的UGT76G1)
MHHHHHHGSGENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSI TIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEH GADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMT SSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSN WQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKH LTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLV DSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGA IGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYL ENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYES LESLVSYISSL
SEQ ID NO:5(在N-末端具有6×组氨酸-谷氨酰胺标签的UGT76G1)
MHQHQHQSGSMENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGF SITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINE HGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLM TSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYS NWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPK HLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGL VDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHG AIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVY LENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYE SLESLVSYISSL
SEQ ID NO:7
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKP KTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRREL ELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAH VSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILG KMIKQTRASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLD HDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWV VRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSG WNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEI ANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISS LGSHHHHHH
在某些实施方案中,核酸包括编码UGT76G1的序列,其具有如AAR06912.1 中所示的氨基酸序列。在某些实施方案中,核酸分子包括编码UGT76G1葡糖基转移酶的序列并且包括如下列出的SEQ ID NO:2、4、6和8中任意一个所示的核苷酸序列或其片段和变体。
SEQ ID NO:2(UGT76G1天然核酸序列)
ATGGAAAATAAAACGGAGACCACCGTTCGCCGGCGCCGGAGAATAATATTA TTCCCGGTACCATTTCAAGGCCACATTAACCCAATTCTTCAGCTAGCCAATG TGTTGTACTCTAAAGGATTCAGTATCACCATCTTTCACACCAACTTCAACA AACCCAAAACATCTAATTACCCTCACTTCACTTTCAGATTCATCCTCGACAA CGACCCACAAGACGAACGCATTTCCAATCTACCGACTCATGGTCCGCTCGC TGGTATGCGGATTCCGATTATCAACGAACACGGAGCTGACGAATTACGACG CGAACTGGAACTGTTGATGTTAGCTTCTGAAGAAGATGAAGAGGTATCGT GTTTAATCACGGATGCTCTTTGGTACTTCGCGCAATCTGTTGCTGACAGTCT TAACCTCCGACGGCTTGTTTTGATGACAAGCAGCTTGTTTAATTTTCATGCA CATGTTTCACTTCCTCAGTTTGATGAGCTTGGTTACCTCGATCCTGATGACAAAACCCGTTTGGAAGAACAAGCGAGTGGGTTTCCTATGCTAAAAGTGAAA GACATCAAGTCTGCGTATTCGAACTGGCAAATACTCAAAGAGATATTAGGG AAGATGATAAAACAAACAAGAGCATCTTCAGGAGTCATCTGGAACTCATTT AAGGAACTCGAAGAGTCTGAGCTCGAAACTGTTATCCGTGAGATCCCGGC TCCAAGTTTCTTGATACCACTCCCCAAGCATTTGACAGCCTCTTCCAGCAG CTTACTAGACCACGATCGAACCGTTTTTCAATGGTTAGACCAACAACCGCC AAGTTCGGTACTGTATGTTAGTTTTGGTAGTACTAGTGAAGTGGATGAGAA AGATTTCTTGGAAATAGCTCGTGGGTTGGTTGATAGCAAGCAGTCGTTTTT ATGGGTGGTTCGACCTGGGTTTGTCAAGGGTTCGACGTGGGTCGAACCGT TGCCAGATGGGTTCTTGGGTGAAAGAGGACGTATTGTGAAATGGGTTCCA CAGCAAGAAGTGCTAGCTCATGGAGCAATAGGCGCATTCTGGACTCATAGC GGATGGAACTCTACGTTGGAAAGCGTTTGTGAAGGTGTTCCTATGATTTTC TCGGATTTTGGGCTCGATCAACCGTTGAATGCTAGATACATGAGTGATGTTT TGAAGGTAGGGGTGTATTTGGAAAATGGGTGGGAAAGAGGAGAGATAGCA AATGCAATAAGAAGAGTTATGGTGGATGAAGAAGGAGAATACATTAGACA GAATGCAAGAGTTTTGAAACAAAAGGCAGATGTTTCTTTGATGAAGGGTG GTTCGTCTTACGAATCATTAGAGTCTCTAGTTTCTTACATTTCATCGTTGTAA
SEQ ID NO:4(为在毕赤酵母中表达而优化的编码SEQ ID NO:3的密码子的序列)
ATGCACCACCATCACCACCATGGTTCTGGTGAAAACAAAACTGAAACTAC TGTTAGAAGAAGAAGAAGAATCATTTTGTTTCCAGTACCATTTCAAGGCCA TATCAATCCAATTCTTCAATTGGCCAATGTTTTGTACTCCAAAGGATTCTCC ATCACCATTTTTCACACCAATTTCAACAAACCAAAGACTTCCAACTATCCT CACTTCACTTTCAGATTTATTTTGGATAATGATCCTCAAGATGAAAGAATTT CCAATCTTCCGACTCATGGTCCTTTGGCTGGTATGAGAATTCCAATCATCAA TGAACATGGTGCTGATGAATTAAGAAGAGAATTGGAACTTTTGATGTTGGC TTCTGAAGAAGATGAAGAAGTTTCATGTTTAATCACTGATGCTTTATGGTAT TTTGCTCAATCTGTTGCTGATTCTTTGAATTTGCGACGGTTGGTTTTGATGA CTTCTTCTTTGTTCAACTTTCATGCTCATGTTTCTTTACCTCAGTTTGATGAACTTGGATATTTGGATCCAGATGACAAAACTAGATTGGAAGAACAAGCTAGT GGGTTTCCTATGTTGAAAGTCAAAGATATCAAATCTGCTTACTCCAACTGG CAAATTCTCAAAGAAATTTTGGGAAAAATGATCAAACAAACAAAAGCTTC TTCTGGAGTCATTTGGAACTCATTCAAAGAATTGGAAGAATCTGAATTGGA AACTGTTATTAGAGAAATTCCTGCTCCAAGTTTTTTGATTCCTTTGCCAAAA CATTTGACTGCTTCTTCTTCTTCTTTATTGGATCACGATAGAACTGTTTTTCA ATGGTTAGATCAACAACCTCCATCTTCTGTTTTGTATGTTAGTTTTGGATCTA CTTCTGAAGTTGATGAAAAAGATTTTTTGGAAATTGCTAGAGGTTTGGTTG ATTCCAAACAAAGTTTTTTATGGGTTGTTAGACCAGGATTTGTCAAAGGAT CTACTTGGGTCGAACCTTTGCCAGATGGATTTTTGGGAGAAAGAGGAAGA ATTGTCAAATGGGTTCCACAGCAAGAAGTTTTGGCTCATGGTGCTATTGGT GCTTTTTGGACTCATTCTGGATGGAACTCTACTTTGGAATCTGTTTGTGAAG GTGTTCCAATGATTTTTTCTGATTTTGGTTTGGATCAACCATTGAATGCTAG ATACATGTCTGATGTTTTGAAAGTTGGTGTTTATTTGGAAAATGGGTGGGA AAGAGGTGAAATTGCCAATGCTATTAGAAGAGTCATGGTTGATGAAGAAG GAGAATACATTAGACAAAATGCTAGAGTTTTGAAACAAAAAGCTGATGTTTCTTTGATGAAGGGTGGATCTTCTTATGAATCTTTGGAATCTTTGGTTTCTTA CATTTCTTCTCTTTAA
SEQ ID NO:6(为在毕赤酵母中表达而优化的编码SEQ ID NO:5的密码子的序列)
ATGCATCAACATCAACACCAATCTGGATCTATGGAGAACAAGACCGAGACT ACAGTTAGAAGAAGAAGAAGAATAATCCTGTTTCCAGTACCATTCCAAGG ACACATCAACCCAATCTTGCAGTTAGCAAATGTACTTTATTCTAAAGGCTTT AGTATTACGATTTTTCACACTAATTTTAATAAGCCAAAAACATCCAATTACC CTCACTTCACATTCAGATTTATCTTGGATAACGATCCTCAAGATGAACGTAT CTCCAACCTGCCAACACATGGACCATTGGCCGGTATGCGTATTCCTATAATC AACGAGCATGGTGCTGATGAGCTTAGACGTGAACTGGAACTGTTGATGCT GGCATCGGAGGAAGATGAAGAGGTTAGTTGCTTGATAACGGATGCCCTCT GGTATTTCGCACAATCAGTCGCTGACTCCTTGAACCTTAGGAGATTGGTATT GATGACTAGTTCGTTGTTCAACTTCCATGCCCATGTTTCTTTGCCTCAATTT GATGAGCTGGGTTATTTGGATCCTGACGATAAGACTCGTTTAGAAGAACAG GCGTCAGGCTTCCCCATGTTAAAGGTTAAAGATATTAAGTCCGCCTATTCTA ACTGGCAAATTCTCAAAGAGATTCTAGGGAAAATGATTAAACAAACCAAG GCCTCTTCAGGAGTAATCTGGAACAGTTTCAAAGAACTAGAAGAATCCGA GTTGGAAACTGTTATTCGTGAAATCCCTGCTCCATCTTTCCTTATCCCATTA CCAAAGCACCTCACTGCCTCCTCTAGTTCTCTTCTGGACCATGATAGAACA GTCTTTCAGTGGCTCGATCAGCAACCTCCATCTTCTGTCTTGTACGTTAGTT TTGGTTCCACCTCGGAAGTAGATGAAAAAGACTTTCTGGAAATTGCTCGA GGACTAGTTGACTCCAAGCAATCCTTTCTGTGGGTTGTTAGACCTGGATTC GTAAAAGGATCCACCTGGGTAGAACCCCTCCCAGATGGATTTTTGGGCGA AAGGGGAAGAATTGTTAAATGGGTGCCTCAACAAGAAGTTTTAGCTCATG GGGCCATTGGAGCTTTTTGGACTCATAGTGGATGGAATTCTACCTTAGAATC TGTTTGTGAAGGAGTTCCAATGATTTTTTCTGATTTTGGATTGGATCAGCCT CTTAATGCCAGATATATGTCCGATGTCCTCAAGGTCGGAGTGTACCTGGAA AATGGTTGGGAGAGAGGTGAGATTGCAAATGCTATACGTAGAGTCATGGTT GATGAAGAGGGCGAGTATATTAGACAAAACGCTAGAGTGCTAAAGCAGAA GGCCGATGTTTCCCTTATGAAGGGGGGAAGTTCATATGAGAGTTTGGAATC CCTAGTGTCCTACATTTCTTCGCTATAA
SEQ ID NO:8(为在大肠杆菌中表达而优化的编码SEQ ID NO:7的密码子的序列)
ATGGAAAATAAAACCGAAACCACCGTCCGTCGCCGTCGTCGTATCATTCTG TTCCCGGTCCCGTTCCAAGGTCACATCAACCCGATTCTGCAGCTGGCCAAC GTGCTGTATAGCAAAGGTTTCTCTATCACCATCTTCCATACGAACTTCAACA AACCGAAAACCTCTAACTACCCGCACTTTACGTTCCGTTTTATTCTGGATAA CGACCCGCAGGATGAACGCATCAGTAATCTGCCGACCCATGGTCCGCTGG CGGGTATGCGTATTCCGATTATCAACGAACACGGCGCAGATGAACTGCGTC GCGAACTGGAACTGCTGATGCTGGCCTCTGAAGAAGATGAAGAAGTTAGT TGCCTGATCACCGACGCACTGTGGTATTTTGCCCAGAGTGTTGCAGATTCC CTGAACCTGCGTCGCCTGGTCCTGATGACGAGCTCTCTGTTCAATTTTCAT GCCCACGTTTCCCTGCCGCAGTTCGATGAACTGGGTTATCTGGACCCGGAT GACAAAACCCGCCTGGAAGAACAAGCTTCAGGCTTTCCGATGCTGAAAGT CAAAGATATTAAAAGTGCGTACTCCAACTGGCAGATTCTGAAAGAAATCCT GGGTAAAATGATCAAACAAACCCGTGCAAGTTCCGGCGTCATCTGGAATT CCTTCAAAGAACTGGAAGAATCAGAACTGGAAACGGTGATTCGCGAAATC CCGGCTCCGTCTTTTCTGATTCCGCTGCCGAAACATCTGACCGCGTCATCG AGCTCTCTGCTGGATCACGACCGTACGGTGTTTCAGTGGCTGGATCAGCAACCGCCGAGTTCCGTGCTGTACGTTAGCTTCGGTAGCACCTCTGAAGTGGAT GAAAAAGACTTTCTGGAAATCGCTCGTGGCCTGGTTGATTCAAAACAATC GTTCCTGTGGGTGGTTCGCCCGGGTTTTGTGAAAGGCAGCACGTGGGTTGAACCGCTGCCGGATGGCTTCCTGGGTGAACGTGGTCGCATTGTCAAATGG GTGCCGCAGCAAGAAGTGCTGGCACATGGTGCTATCGGCGCGTTTTGGAC CCACTCAGGTTGGAACTCGACGCTGGAAAGCGTTTGTGAAGGTGTCCCGATGATTTTCTCGGATTTTGGCCTGGACCAGCCGCTGAATGCACGTTATATGAG CGATGTTCTGAAAGTCGGTGTGTACCTGGAAAACGGTTGGGAACGCGGCG AAATTGCGAATGCCATCCGTCGCGTTATGGTCGATGAAGAAGGCGAATATA TCCGTCAGAATGCTCGCGTCCTGAAACAAAAAGCGGACGTTAGTCTGATG AAAGGCGGTTCATCGTACGAATCCCTGGAATCACTGGTCTCCTACATTTCTT CTCTGGGCTCGCATCATCATCATCATCATTAA
在某些实施方案中,核酸分子编码UGT76G1葡糖并且包括GenBank登录号AY345974.1所示的核苷酸序列或其变体或片段。
在某些实施方案中,核酸包括编码UGT76G2葡糖基转移酶的序列。在具体的实施方案中,核酸包括编码UGT76G2葡糖基转移酶的序列,UGT76G2葡糖基转移酶具有如下列出的SEQ ID NO:27所示的氨基酸序列或其变体和片段。
SEQ ID NO:27
MENKTETTVRRRRRIILFPVPVQGHINPILQLANVLYSKGFSITIFHTNFNKPKT SNYPHFTFRFILDNDPQDVRISNLPTHGPLTVMRILIINEHGADELQRELELLM LASEEDGEVSCLITDQIWYFTQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFD ELGYLDPDDKTRLEEQASGFPMLKVKDIKCGFSMWKQGKEIFENITKQTKAS SGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFPWLDQ QPSRSVLYVSFGSATEVDAKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVE PLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIF SAFAFDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGGYIRQ NASVLKQKADVSLMKGGSSYESLESLVAYISSL
在具体的实施方案中,核酸包括编码UGT76G2葡糖基转移酶的序列并且具有如下列出的SEQ ID NO:28所示的核酸序列或其变体和片段。
SEQ ID NO:28
ATGGAAAATAAAACGGAGACCACCGTTCGCCGGCGCCGGAGAATAATATTA TTCCCGGTACCAGTTCAAGGCCACATTAACCCAATTCTTCAGCTAGCCAAT GTGTTGTACTCCAAAGGATTCAGTATCACCATCTTTCACACCAACTTCAAC AAACCCAAAACATCTAATTACCCTCACTTCACTTTCAGATTCATCCTCGACA ACGACCCACAAGACGTACGCATTTCCAATCTACCGACTCATGGTCCGCTCA CTGTTATGCGGATTCTGATTATCAACGAACACGGAGCTGACGAATTACAAC GCGAACTGGAACTGTTGATGTTAGCTTCTGAAGAAGATGGAGAGGTATCG TGTTTAATCACCGATCAGATTTGGTACTTCACGCAATCTGTTGCTGACAGTC TTAACCTCCGACGGCTTGTTTTGATGACAAGCAGCTTGTTTAATTTTCATGC ACATGTTTCACTTCCTCAGTTTGATGAGCTTGGTTACCTCGATCCTGATGAC AAAACCCGTTTGGAAGAACAAGCGAGTGGGTTTCCTATGCTGAAAGTGAA AGATATCAAGTGTGGTTTTTCGATGTGGAAACAAGGCAAAGAGATATTCGA GAACATTACGAAACAAACAAAAGCATCTTCAGGAGTCATCTGGAACTCATTTAAGGAACTCGAAGAGTCTGAGCTCGAAACTGTTATCCGTGAGATCCCG GCTCCAAGTTTCTTGATACCACTCCCCAAGCATTTGACAGCCTCTTCCAGC AGCTTACTAGACCACGATCGAACCGTTTTTCCATGGTTAGACCAACAACCG TCACGTTCGGTACTGTATGTTAGTTTTGGTAGTGCTACTGAAGTGGATGCG AAAGATTTCTTGGAAATAGCTCGTGGGTTGGTTGATAGCAAGCAGTCGTTT TTATGGGTGGTTCGACCTGGTTTTGTCAAGGGTTCGACGTGGGTCGAACCG TTGCCAGATGGGTTCTTGGGTGAAAGAGGACGTATTGTGAAATGGGTTCCG CAGCAAGAAGTGCTAGCTCATGGAGCAATAGGCGCATTCTGGACTCATAGC GGATGGAACTCTACGTTGGAAAGCGTTTGTGAAGGTGTTCCTATGATTTTC TCGGCTTTTGCGTTCGATCAACCGTTGAATGCTAGATACATGAGTGATGTTT TGAAGGTAGGGGTGTATTTGGAAAATGGGTGGGAAAGAGGAGAGATAGCA AATGCAATAAGAAGAGTTATGGTGGATGAAGAAGGAGGATACATTAGACA GAATGCAAGTGTTTTGAAACAAAAGGCAGATGTTTCTTTGATGAAGGGTG GTTCGTCTTACGAATCATTAGAGTCTCTAGTTGCTTACATTTCATCGTTGTA A
在某些实施方案中,核酸包括编码UGT76H1葡糖基转移酶的序列。在具体的实施方案中,核酸包括编码UGT76H1葡糖基转移酶的序列,UGT76H1葡糖基转移酶具有如下列出的SEQ ID NO:29所示的氨基酸序列或其变体和片段。
SEQ ID NO:29
MLQLATYLHSQGISITIAQYPNFNSPDSSNHPELTFLPLSSGNLSVADISGGFFK FIQTLNHNCKPHFREYLVQNMSSDDKESIVIIRDNLMFFAGEIAGELGLPSIILR GSNAVMLTASDIIPQLHQEGRFPPPDSLLQETIPELVPFRYKDLPFIGYPIHQTLE FSITMMTPKSPASAILINTLEFLEQSALTQIRDHYKVPVFTIGPLHKIVTTRSTSI LEEDTSCINWLDKQSPKSVVYVSLGSLAKLDEKVASEMACGLAMSNHKFLW VVRPGMVHGFEWVEFLPDSLVGEMKARGLIVKWAPQTTVLAHNAVGGFWS HCGWNSTIECLAEGVPMMCQPFFADQLLNARYVSDVWKTGFEIVIEKGEIAC AIKRVLVDEEGEEMRQRAMEIKEKVKIAINDGGSSYDSFKDLVAFISSL
在具体的实施方案中,核酸包括编码UGT76H1葡糖的序列并具有如下列出的SEQID NO:30所示的核酸序列或其变体和片段。
ATGCTTCAGCTTGCAACTTACCTCCATTCTCAAGGGATTTCAATAACCATCG CTCAGTACCCCAACTTCAACTCGCCGGATTCTTCCAACCATCCAGAACTAA CCTTCCTCCCACTATCCTCCGGCAACTTATCCGTCGCCGACATCTCCGGCGG CTTTTTCAAGTTCATCCAAACTCTTAACCATAACTGCAAACCCCATTTCCGG GAATACCTTGTTCAGAACATGAGTTCTGATGATAAGGAATCAATCGTTATCA TCCGTGATAATCTCATGTTTTTCGCCGGAGAAATCGCCGGCGAGCTGGGTC TGCCTTCGATCATTTTACGTGGCAGCAATGCTGTCATGTTGACTGCTAGCGA CATCATCCCTCAACTTCATCAAGAAGGTCGTTTTCCGCCACCAGATTCTTTG TTGCAGGAAACAATTCCAGAACTGGTTCCATTCAGATACAAAGATCTACCA TTTATTGGCTATCCAATACATCAAACCCTTGAATTTAGTATCACCATGATGAC CCCCAAATCACCTGCTTCCGCCATTCTTATCAACACCCTCGAATTTCTTGAA CAATCGGCATTAACCCAGATCCGTGATCATTACAAAGTTCCAGTTTTTACAA TCGGACCATTGCACAAAATAGTCACAACTCGTTCCACTAGCATTCTTGAAG AAGATACAAGTTGCATCAATTGGTTAGATAAACAATCACCCAAATCAGTGG TTTATGTGAGTTTAGGAAGCTTAGCAAAGTTGGATGAAAAGGTTGCATCTG AAATGGCATGTGGTTTAGCCATGAGTAACCATAAGTTCCTATGGGTGGTTC GACCCGGTATGGTTCATGGGTTTGAATGGGTCGAGTTTTTGCCGGATAGTT TGGTGGGTGAAATGAAGGCTAGAGGTTTGATTGTGAAATGGGCACCCCAG ACGACGGTTTTGGCGCATAACGCGGTTGGTGGATTTTGGAGTCATTGCGGT TGGAACTCGACCATAGAATGCTTAGCTGAAGGGGTCCCGATGATGTGTCAA CCGTTTTTTGCTGATCAGTTGTTGAATGCTAGGTATGTGAGTGATGTTTGGA AGACGGGTTTTGAGATTGTTATCGAGAAAGGTGAGATTGCGTGCGCGATTA AACGAGTTTTGGTGGATGAAGAAGGCGAAGAAATGAGGCAGAGAGCTAT GGAGATTAAAGAAAAGGTTAAAATTGCAATCAACGATGGTGGTTCTTCTTA TGACTCGTTCAAGGACTTGGTGGCGTTTATTTCATCACTCTAA
在某些实施方案中,核酸包括编码稻(Oryza sativa)Os03g0702000或Os03g0702000样葡糖基转移酶的序列。Os03g0702000样葡糖基转移酶包括例如,UGT91进化枝的其他成员,如UGT91D1或UGT91D2。在某些实施方案中,核酸包括编码Os03g0702000葡糖基转移酶的序列,Os03g0702000葡糖基转移酶具有如下列出的SEQ ID NO:9所示的氨基酸序列或其变体和片段。
SEQ ID NO:9
MHQHQHQSGSMDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLAS RGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHD RPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPC AMMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTK GSSGMSLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLH EGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGT RFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSF DREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSY KD
在某些实施方案中,核酸分子编码Os03g0702000葡糖基转移酶并且包括如下详述的SEQ ID NO:10所示的核苷酸序列或其变体和片段。
SEQ ID NO:10
ATGCATCAGCACCAACATCAGAGCGGTTCTATGGACTCCGGCTACTCCTCC TCCTACGCCGCCGCCGCCGGGATGCACGTCGTGATCTGCCCGTGGCTCGCC TTCGGCCACCTGCTCCCGTGCCTCGACCTCGCCCAGCGCCTCGCGTCGCG GGGCCACCGCGTGTCGTTCGTCTCCACGCCGCGGAACATATCCCGCCTCCC GCCGGTGCGCCCCGCGCTCGCGCCGCTCGTCGCCTTCGTGGCGCTGCCGC TCCCGCGCGTCGAGGGGCTCCCCGACGGCGCCGAGTCCACCAACGACGTC CCCCACGACAGGCCGGACATGGTCGAGCTCCACCGGAGGGCCTTCGACGG GCTCGCCGCGCCCTTCTCGGAGTTCTTGGGCACCGCGTGCGCCGACTGGG TCATCGTCGACGTCTTCCACCACTGGGCCGCAGCCGCCGCTCTCGAGCAC AAGGTGCCATGTGCAATGATGTTGTTGGGCTCTGCACATATGATCGCTTCCA TAGCAGACAGACGGCTCGAGCGCGCGGAGACAGAGTCGCCTGCGGCTGC CGGGCAGGGACGCCCAGCGGCGGCGCCAACGTTCGAGGTGGCGAGGATG AAGTTGATACGAACCAAAGGCTCATCGGGAATGTCCCTCGCCGAGCGCTT CTCCTTGACGCTCTCGAGGAGCAGCCTCGTCGTCGGGCGGAGCTGCGTGG AGTTCGAGCCGGAGACCGTCCCGCTCCTGTCGACGCTCCGCGGTAAGCCT ATTACCTTCCTTGGCCTTATGCCGCCGTTGCATGAAGGCCGCCGCGAGGAC GGCGAGGATGCCACCGTCCGCTGGCTCGACGCGCAGCCGGCCAAGTCCGT CGTGTACGTCGCGCTAGGCAGCGAGGTGCCACTGGGAGTGGAGAAGGTCC ACGAGCTCGCGCTCGGGCTGGAGCTCGCCGGGACGCGCTTCCTCTGGGCT CTTAGGAAGCCCACTGGCGTCTCCGACGCCGACCTCCTCCCCGCCGGCTT CGAGGAGCGCACGCGCGGCCGCGGCGTCGTGGCGACGAGATGGGTTCCT CAGATGAGCATACTGGCGCACGCCGCCGTGGGCGCGTTCCTGACCCACTG CGGCTGGAACTCGACCATCGAGGGGCTCATGTTCGGCCACCCGCTTATCAT GCTGCCGATCTTCGGCGACCAGGGACCGAACGCGCGGCTAATCGAGGCGA AGAACGCCGGATTGCAGGTGGCAAGAAACGACGGCGATGGATCGTTCGAC CGAGAAGGCGTCGCGGCGGCGATTCGTGCAGTCGCGGTGGAGGAAGAAA GCAGCAAAGTGTTTCAAGCCAAAGCCAAGAAGCTGCAGGAGATCGTCGC GGACATGGCCTGCCATGAGAGGTACATCGACGGATTCATTCAGCAATTGAGATCTTACAAGGATTGA
在某些实施方案中,核酸分子编码Os03g0702000葡糖基转移酶并且包括如GenBank登录号XM_015773655所示的序列或其变体或片段。
在某些实施方案中,核酸包括编码UGT91D1葡糖基转移酶的序列。在某些实施方案中,核酸包括编码UGT91D1葡糖基转移酶的序列,UGT91D1葡糖基转移酶具有如下列出的SEQID NO:31所示的氨基酸序列或其变体和片段。
SEQ ID NO:31
MYNVTYHQNSKAMATSDSIVDDRKQLHVATFPWLAFGHILPFLQLSKLIAEK GHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIQYL KKAVDGLQPEVTRFLEQHSPDWIIYDFTHYWLPSIAASLGISRAYFCVITPWTI AYLAPSSDAMINDSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARMEPYEAP GISDGYRMGMVFKGSDCLLFKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEI PGDEKDETWVSIKKWLDGKQKGSVVYVALGSEALVSQTEVVELALGLELSG LPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVC GFLTHCGSGSIVEGLMFGHPLIMLPIFCDQPLNARLLEDKQVGIEIPRNEEDGC LTKESVARSLRSVVVENEGEIYKANARALSKIYNDTKVEKEYVSQFVDYLEK NARAVAIDHES
在某些实施方案中,核酸分子编码UGT91D1葡糖基转移酶并且包括如下详述的SEQID NO:32所示的核苷酸序列或其变体和片段。
SEQ ID NO:32
ATGTACAACGTTACTTATCATCAAAATTCAAAAGCAATGGCTACCAGTGAC TCCATAGTTGACGACCGTAAGCAGCTTCATGTTGCGACGTTCCCATGGCTT GCTTTCGGTCACATCCTCCCTTTCCTTCAGCTTTCGAAATTGATAGCTGAAA AGGGTCACAAAGTCTCGTTTCTTTCTACCACCAGAAACATTCAACGTCTCT CTTCTCATATCTCGCCACTCATAAATGTTGTTCAACTCACACTTCCACGTGT CCAAGAGCTGCCGGAGGATGCAGAGGCGACCACTGACGTCCACCCTGAA GATATTCAATATCTCAAGAAGGCTGTTGATGGTCTTCAACCGGAGGTCACC CGGTTTCTAGAACAACACTCTCCGGACTGGATTATTTATGATTTTACTCACT ACTGGTTGCCATCCATCGCGGCTAGCCTCGGTATCTCACGAGCCTACTTCT GCGTCATCACTCCATGGACCATTGCTTATTTGGCACCCTCATCTGACGCCAT GATAAATGATTCAGATGGTCGAACCACGGTTGAGGATCTCACGACACCGCC CAAGTGGTTTCCCTTTCCGACCAAAGTATGCTGGCGGAAGCATGATCTTGC CCGAATGGAGCCTTACGAAGCTCCGGGGATATCTGATGGATACCGTATGGGGATGGTTTTTAAGGGATCTGATTGTTTGCTTTTCAAATGTTACCATGAGTTT GGAACTCAATGGCTACCTCTTTTGGAGACACTACACCAAGTACCGGTGGTT CCGGTGGGATTACTGCCGCCGGAAATACCCGGAGACGAGAAAGATGAAAC ATGGGTGTCAATCAAGAAATGGCTCGATGGTAAACAAAAAGGCAGTGTGG TGTACGTTGCATTAGGAAGCGAGGCTTTGGTGAGCCAAACCGAGGTTGTT GAGTTAGCATTGGGTCTCGAGCTTTCTGGGTTGCCATTTGTTTGGGCTTATA GAAAACCAAAAGGTCCCGCGAAGTCAGACTCGGTGGAGTTGCCAGACGG GTTCGTGGAACGAACTCGTGACCGTGGGTTGGTCTGGACGAGTTGGGCAC CTCAGTTACGAATACTGAGCCACGAGTCAGTTTGTGGTTTCTTGACTCATT GTGGTTCTGGATCAATTGTGGAAGGGCTAATGTTTGGTCACCCTCTAATCAT GCTACCGATTTTTTGTGACCAACCTCTGAATGCTCGATTACTGGAGGACAA ACAGGTGGGAATCGAGATACCAAGAAATGAGGAAGATGGTTGCTTGACCA AGGAGTCGGTTGCTAGATCACTGAGGTCCGTTGTTGTGGAAAACGAAGGG GAGATCTACAAGGCGAACGCGAGGGCGCTGAGTAAAATCTATAACGACAC TAAGGTGGAAAAAGAATATGTAAGCCAATTCGTAGACTATTTGGAAAAGAA TGCGCGTGCGGTTGCCATCGATCATGAGAGTTAA
在某些实施方案中,核酸包括编码UGT91D2葡糖基转移酶的序列。在某些实施方案中,核酸包括编码UGT91D2葡糖基转移酶的序列,UGT91D2葡糖基转移酶具有如下列出的SEQID NO:33所示的氨基酸序列或其变体和片段。
SEQ ID NO:33
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQ RLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTR FLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMIN GSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVL KGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIK KWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGP AKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEG LMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVV VEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES
在某些实施方案中,核酸分子编码UGT91D2葡糖基转移酶并且包括如下详述的SEQID NO:34所示的核苷酸序列或其变体和片段。
SEQ ID NO:34
ATGGCCACATCTGACTCTATCGTTGATGACAGAAAACAATTGCATGTTGCT ACTTTCCCATGGTTGGCCTTTGGACACATTCTGCCCTACTTGCAATTGTCAA AGCTGATTGCAGAAAAAGGTCATAAGGTGTCCTTTTTGTCTACCACAAGAA ACATCCAGAGACTAAGTTCTCATATTTCTCCATTGATTAATGTGGTTCAGTT GACCTTGCCTAGAGTCCAAGAACTTCCCGAAGACGCAGAAGCTACTACTG ATGTTCACCCTGAAGATATCCCATATCTAAAGAAGGCATCTGATGGACTTCA ACCAGAAGTAACCAGGTTTTTGGAGCAGCACAGTCCTGACTGGATTATCTA TGATTATACTCATTACTGGCTTCCATCCATCGCAGCTAGTCTAGGCATTTCCA GAGCTCATTTCTCTGTCACTACCCCATGGGCAATTGCATATATGGGTCCTTC TGCTGATGCAATGATCAACGGTTCTGATGGTAGGACCACTGTTGAAGATTTAACTACACCTCCAAAGTGGTTCCCATTTCCTACTAAAGTTTGTTGGCGAAA ACACGATCTGGCACGTTTGGTCCCATATAAGGCTCCAGGTATCTCCGATGG ATATCGAATGGGTCTGGTGCTAAAGGGTTCTGATTGTCTGTTATCTAAGTGT TACCACGAATTTGGAACTCAATGGCTTCCTCTATTAGAGACTCTGCATCAA GTTCCAGTTGTTCCTGTCGGTCTGCTACCACCTGAAATTCCCGGTGACGAA AAGGACGAAACTTGGGTTTCCATAAAAAAATGGCTGGATGGTAAGCAGAA GGGTAGTGTTGTATATGTCGCTTTAGGCTCCGAGGTTTTGGTATCCCAGACT GAAGTTGTGGAACTTGCCTTAGGATTGGAGTTGTCCGGTTTGCCATTCGTC TGGGCATATAGAAAGCCAAAGGGACCAGCTAAGTCAGACTCAGTTGAATT GCCAGATGGTTTCGTAGAAAGGACAAGAGACAGAGGATTGGTTTGGACAT CATGGGCCCCACAATTGAGAATTCTGAGTCATGAAAGTGTGTGTGGATTCT TGACTCACTGTGGCTCTGGCAGTATTGTTGAAGGACTGATGTTTGGACACC CACTGATAATGTTGCCAATCTTCGGTGACCAACCTCTGAATGCAAGATTGC TGGAGGATAAACAAGTTGGTATCGAAATCCCAAGAAACGAGGAAGACGGC TGCCTGACTAAGGAATCAGTTGCACGTAGTTTAAGATCTGTAGTTGTTGAA AAAGAAGGTGAAATATATAAGGCTAACGCTAGAGAACTTTCAAAGATATAC AATGATACCAAGGTGGAGAAAGAATATGTTTCACAGTTTGTGGACTATTTG GAGAAAAACGCTAGAGCCGTTGCTATCGATCACGAATCATAG
在某些实施方案中,核酸包括编码甜叶菊UDP-糖基转移酶74G1的序列。在某些实施方案中,核酸包括编码甜叶菊UDP-糖基转移酶74G1的序列,甜叶菊UDP-糖基转移酶74G1包括如下列出的SEQ ID NO:13所示的氨基酸序列或其变体或片段。
SEQ ID NO:13
MAEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLN HSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGT TIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGET VSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYK LEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHHECMN WLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKL PENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVV AMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGV IIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKA
在某些实施方案中,核酸分子编码甜叶菊UDP-糖基转移酶74G1并且包括如下列出的SEQ ID NO:14所示的核苷酸序列或其变体或片段。
SEQ ID NO:14
ATGGCGGAACAACAAAAGATCAAGAAATCACCACACGTTCTACTCATCCC ATTCCCTTTACAAGGCCATATAAACCCTTTCATCCAGTTTGGCAAACGATTA ATCTCCAAAGGTGTCAAAACAACACTTGTTACCACCATCCACACCTTAAAC TCAACCCTAAACCACAGTAACACCACCACCACCTCCATCGAAATCCAAGC AATTTCCGATGGTTGTGATGAAGGCGGTTTTATGAGTGCAGGAGAATCATA TTTGGAAACATTCAAACAAGTTGGGTCTAAATCACTAGCTGACTTAATCAA GAAGCTTCAAAGTGAAGGAACCACAATTGATGCAATCATTTATGATTCTAT GACTGAATGGGTTTTAGATGTTGCAATTGAGTTTGGAATCGATGGTGGTTC GTTTTTCACTCAAGCTTGTGTTGTAAACAGCTTATATTATCATGTTCATAAG GGTTTGATTTCTTTGCCATTGGGTGAAACTGTTTCGGTTCCTGGATTTCCAG TGCTTCAACGGTGGGAGACACCGTTAATTTTGCAGAATCATGAGCAAATAC AGAGCCCTTGGTCTCAGATGTTGTTTGGTCAGTTTGCTAATATTGATCAAGC ACGTTGGGTCTTCACAAATAGTTTTTACAAGCTCGAGGAAGAGGTAATAGAGTGGACGAGAAAGATATGGAACTTGAAGGTAATCGGGCCAACACTTCCAT CCATGTACCTTGACAAACGACTTGATGATGATAAAGATAACGGATTTAATCT CTACAAAGCAAACCATCATGAGTGCATGAACTGGTTAGACGATAAGCCAA AGGAATCAGTTGTTTACGTAGCATTTGGTAGCCTGGTGAAACATGGACCCG AACAAGTGGAAGAAATCACACGGGCTTTAATAGATAGTGATGTCAACTTCT TGTGGGTTATCAAACATAAAGAAGAGGGAAAGCTCCCAGAAAATCTTTCG GAAGTAATAAAAACCGGAAAGGGTTTGATTGTAGCATGGTGCAAACAATT GGATGTGTTAGCACACGAATCAGTAGGATGCTTTGTTACACATTGTGGGTT CAACTCAACTCTTGAAGCAATAAGTCTTGGAGTCCCCGTTGTTGCAATGCC TCAATTTTCGGATCAAACTACAAATGCCAAGCTTCTAGATGAAATTTTGGG TGTTGGAGTTAGAGTTAAGGCTGATGAGAATGGGATAGTGAGAAGAGGAA ATCTTGCGTCATGTATTAAGATGATTATGGAGGAGGAAAGAGGAGTAATAA TCCGAAAGAATGCGGTAAAATGGAAGGATTTGGCTAAAGTAGCCGTTCAT GAAGGTGGTAGCTCAGACAATGATATTGTCGAATTTGTAAGTGAGCTAATT AAGGCTTAA
在某些实施方案中,核酸分子编码甜叶菊UDP-糖基转移酶74G1并且包括 GenBank登录号AY345982所示的序列或其变体或片段。
在其他实施方案中,本发明提供了包括编码环糊精葡聚糖转移酶的核苷酸序列(WO1996033267;US6271010)的核酸。
还提供了包括编码蔗糖合成酶的核苷酸序列的核酸。因此,在某些实施方案中,核酸包括编码蔗糖合成酶的序列,蔗糖合成酶包括如下列出的SEQ ID NO:15、17、19、21、23或25所示的氨基酸序列或其变体或片段。
SEQ ID NO:15(甜叶菊SUS1同种型)
MAERVLTRVHSLRERLDSTLATHRNEILLFLSRIESHGKGILKPHQVMTEFEAI CKEDQSKLSDGAFYEVLKCTQEAIVQPPWVALAIRLRPGVWEYVRVNVNVL VVEELSVPEYLHFKEELVNGTSNGNFVLELDFEPFTASFPRPTLTKSIGNGVEF LNRHLSAKMFHDKDSMHPLLDFLRTHHYKGKTMMLNDRIQNLNALQSVLR KASEYLSTLDAATPYSEFEHKFQEIGLERGWGDKAEVVMEMIHMLLDLLEAP DACTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPAL EREMLKRIKEQGLDIIPRILIVTRLLPDAVGTTCGQRLEKVFGAEHSHILRVPFR TEKGILRKWISRFEVWPYIETFTEDVAKEVTAELQAKPDLIIGNYSEGNLVASL LAHKLGVTQCTIAHALEKTKYPDSDIYWKNFEEKYHFSSQFTADLIAMNHTD FIITSTFQEIAGSKDTVGQYESHTAFTMPGLYRVVHGIDVFDPKFNIVSPGADM GIYYSYTEKEKRLTALHPEIDELLFSSVENEEHLCVLKDKSKPILFTMARLDNV KNLTGLVEWYAKNDRLRELVNLVVVGGDRRKESKDLEEQAQMQKMHELIET YKLNGQFRWISSQMNRVRNGELYRVIADTRGAFIQPAFYEAFGLTVVEAMTC GLPTFATLHGGPAEIIVHGKSGFHIDPYHGDQVTELLVNFFEKTKQDPGHWEAISKGGLQRIQEKYTWQIYSDRLLTLAGVYGFWKHVSKLDRLEIRRYLEMFYA LKYRKLAESVPLAVDE
SEQ ID NO:17(甜叶菊SUS2同种型)
MATSKLSRTHSMRERVEETLSAHRNEIVSLLSRYVAQGKAILQPHQILHELENI IGDVTSRQKLTDGPFGDALKTAQECIVLPPFVALAVRPRPGVWEYVRVDAYQL SVEQLTVSEYLTFKEELVGESNSSLMLELDFEPFNASFPRPTRSSSIGNGVQFLN RHLSSSMFRSKDCLEPLLDFLRTHRHNGHVMMLNDRITSMTRLQSSLVKAEE YLSKLPSDTDYSEFQYELQGMGFERGWGNNAERIIEMMHLLSDILQAPDPSIL ESFLARIPMVFNVVILSIHGYFGQANVLGLPDTGGQIVYILDQVRALENEMLL KLKHQGLDIKPRILIVTRLIPDAKGTSCNQRLERVSGTEHTHILRVPFRTEKGIL RKWISRFDVWPFLEKFTQDAASEISAELHGTPDLIIGNYSDGNLVASLLSYKM GVTQCNIAHALEKTKYPDSDLYWKKFDEKYHFSCQFTADLLAMNNADFIITS TYQEIAGTKNTVGQYESHSSFTLPGLYRVVHGIDVFDPKFNIVSPGADMSIYFS YTEKEKRLTSLHTTIEKLLFDPTQTEDYIGNLSDKSKPIIFSMARLDHVKNITGLVEWYAKNEKLRGLANLVVVAGYNNVKRSSDREEIAEIEKMHQLIKKYKLDG QMRWISAQTNRAQNGELYRYIADGRGIFVQPAIYEAFGLTVVEAMTCGLPTFA TCHGGPGEIIENGVSGFHIDPYHPDTASATMADFFQKCKEDPSYWFKISEAGL KRIYERYTWKIYSERLMTLAGVYSFWKYVSKLERRETRRYLEMFYILKFRDL VKSVPVATDDEA
SEQ ID NO:19(甜叶菊SUS3同种型)
MATPKLTRTPSMRERLEETLSAHRNDIVSLLSRYVDQGKAILQPHHLLDEIDN FIGDQNCRQKLADSLFGEILKSAQEGIILPPYVTLAVRPRPGVWDFLRVNVDE LSVEQLTVSEYLSFKEELVDGQSRNPFVLELDLEPFNATFPRMSRSSSIGNGVQ FLNRHLSSIMFRNKDCMDPFLDFLRAHKHKGYAMMLNDRIQTMSRLESSLA KAEDHLSKLPPETPYSEFEYVLQGMGFERGWGDNCERVLGMMHLLSDILQA PDPSILEKFLGKMPMIFNVVVLSIHGYFGQANVLGLPDTGGQVVYILDQVRSL ENEMLLKLRHQGLDIKPKILIVTRLIPNAKGTSCNQRLEKVSGTEYTYILRVPF RTEKGILGKWLSRFDIWPYLEAFTTDAASEIAAELHGVPDLLIGNYSDGNLVA SLLSNKLGVTQCNIAHALEKTKYPDSDLYWKKFEDKYHFSCQFTADLLAMN NADFIITSTYQEIAGTKNTVGQYENHSSFTLPGLYRVVHGIDVFDPKFNIVSPG ADMAIYFSYADKERRLTSLHPTIEKLLFDTEQNDVHIGNINDPSKPMIFTMARL DHVKNITGFVECYAKNNKLREHANLVVIAGYNDAKKSSDREEIAEIEKMHNL IKQYKLDGQMRWISAQTNRARNGEFYRYIADGRGVFVQPAFYEAFGLTVVE AMTCGLPTFATCHGGPAEIIEDGVSGFHIDPYHPDKMSTTLADFFQKCKEEPS YWGKISDGGLKRISERYTWKIYSERLMTLAGVYSFWKYVSKLERRETRRYLE MFYILKFRQLVKSVPLAVDEEP
SEQ ID NO:21(甜叶菊SUS4同种型)
MASASSSIMKRSESIVDTMPEALKQSRYHMKKCFLKYVEKGIRMMKRHHLIQ EMETAIEDKDEKAQLLDGLLGYILCTTQEAAVVPPCVAFAIRPNPGFWEFVKV NSNDLSVDGITATDYLKFKEMIVDETWAKDENALEIDFGSMDFNLPNMSLSC SIGNGVNFTSKFITCKLYAQSSCQQLLVDYLLSLNHQGENLMINDALNSVSKL RAALIVAHASLSSLPNDTPYQSFELRFKEWGFEKGWGDNAERARETIRFLLEV LQAPDPINLEALFSRIPNIFNVVLFSIHGYFGQSNVLGLPDTGGQVVYVLDQV VAMEEELLMRIKQQGLNFKPQILVVTRLLPDAKGTKCNQVLEPVLNTKHSHI LRVPFRTDKGVLRKWVSRFDIYPYLENFTQDASAKIIEMMEGKPDLIIGNYTD GNLVASLMANKLGTTLGTIAHALEKTKYEDSDMNWKQFDPKYHFSCQFTAD MIAMNSADFIITSTFQEIAGSKDRPGQYESHEAFTLPGLYRVVSGINVFDPKFNI ASPGADQTVYFPYTETKKRFTAFQPAIEELLFSKVENEEHIGYLEDKTKPIIFS MARLDTVKNITGLTEWFGENKRLRSLVNLVIVAGFFDPSKSKDREEMAEIKK MHLLIEKYQLKGQIRWIAAQTDKNRNSELYRFIADSKGAFVQPALYEAFGLTV IEAMNCGLPTFATNQGGPAEIIVDGVSGFQIDPNFGDQSSNKIADFFQKCKEDPGYWNNISEGGLKRIYECYTWKIYANKVLNMGNIYSFWKRLNKEQKEAKQRY IELFYNLHYKNLVRTVPIASDEAQPAPVSRAKLATQPTRRTQSRLQRLFGA
SEQ ID NO:23(甜叶菊SUS5同种型)
MAASSSPIMKRSESVLDTMPEALRQSRYHMKKCFLKYVGKGKRMVKLHHL MQEMETVIEDKDEKAQLLEGLLGYILCTTQEAAVVPPYVAFAIRPNPGFWEFV KVNSNDLSVKGITSTDYLKFKEMIVDETWANDENALEIDFGAMDFNLPTMSL SSSIGNGVNFTSKFIISKLYAHSGSQLQSLVDYLLSLNHQGEKLMINDKLNTVS KLQAALIVAHSFLSSLPNDTPYQSFELRFKEWGFEKGWGDYAERVQETIRFLL EVLQAPDPVNLEAFFSRVPNIFNIVLFSIHGYFGQSNVLGLPDTGGQVVYVLD QVVAMEEELLLRIKQQGLSFKPHILVVTRLLPDAKGTECSQVLEPVLNTKHSH ILRVPFRTEKGVLRKWVSRFDIYPYLEKFTQDASAKITEMMEGKPDLIIGNYT DGNLVASLMANKLGSTLGTIAHALEKTKYEDSDMKWKHLDTKYHFSCQFTA DMIAMNSADFIITSTFQEIAGSKDRPGQYESHEAFTLPGLYRVVSGINVFDPKF NIASPGADQTVYFPYTETPKRFTTFQPAIQELLFSKVENDEHIGYLEDKNKPIIF SMARLDMVKNITGLTEWFGENKRLRSLVNLVIVAGFFDPSKSKDREEMEEIK KMHLLIEKYELKGQIRWIVAQTDKNRNSELYRCIADSKGAFVQPALYEAFGLT VIEAMNCGLPTFATNQGGPAEIIVDGVSGFQIDPNYGDESSNKIADFFQKCKQDPGYWNRISDGGLMRIYECYTWKIYANKVLNMGNIYTFWKQLNKEQKDAK QRYIELFYNQHYKNLVRTVPIVSDEDDQVTRAKPATQPSTRRTQSALQRLLGA
SEQ ID NO:25(甜叶菊SUS6同种型)
MDFGIAETLAEALKQNRYHARRCFERFTSRGKRMVKPQELLHMIEKTIDDKL ERTKVLEGSMGQILSSTQEAIVIPPYVILGLRANPGQWAYVKINADDVTVESLT PSQYLKFKESIYDQEWAKDENALELDFGAFDFDTPRLILPSSIGNGLGYISKFM TSRIGGDLENAKPLLDHLLALKYHGEKLMINETIDTVSKLQKALIVADVYLSA HPKDEQYQTLEPKLKEWGFEKGWGDTAERVRETMKMLSEILQAPDPINMQS FFSRLPVVFNIVIFSIHGYFGQSDVLGLPDTGGQVVYILDQVKALEEEILLRIK MQGLNAKPRILVVSRLIPDAQGTKCNEEMEPILNTMHSHILRVPFRTSKGVVP QWVSRFDIYPYLERFSQDAASKILEVMECKPDLILGNYTDGNIVASLIAKKFG VTQGTIAHALEKTKYEDSDVNWKNFEKKYHFSCQFTADLISMNAADFIITST YQEIVGSKQRPGQYETHGAFSMPGLCRVVSGINVFDPKFNIASPGAEQSVYFP YTEKEKRLTDFHPAIKELLFNEQDNDEHMGYLADVTKPIIFSMARLDTVKNIT GLTEWFGKNKRLRSLVNLVVVAGFFDPSKSKDREEMEEIKKMHELIEKYKLK GQMRWIAAQNDRTRNGELYRCISDTKGAFVQPALYEAFGLTVIEAMNCGLPT FATNQGGPAEIIVDGVSGFHIDPVNGDESSNKIADFFTKCKVDGEYWDRVSQAGLQRIYECYTWKMYANKALNMGSMYGFWRQLNKETKQAKQRYIDILYNLQ FKNLAKTIEIPDFVTPKLQEPVKTEPTKPLQEARPREPVQKLVPEETRLPKLEL TKLGQPNLMSNARKPLIVLVSVLIVAYASKNLYRRYFK
在某些实施方案中,核酸分子编码蔗糖合成酶并且包括如下列出的SEQ ID NO:16、18、20、22、24或26所示的核苷酸序列或其片段或变体。
SEQ ID NO:16(编码SUS1同种型)
ATGGCGGAACGTGTACTCACTCGTGTTCACAGTCTTCGTGAGCGTCTCGAT TCAACTCTCGCAACTCATCGTAATGAAATCCTCTTGTTTCTTTCAAGGATTG AAAGCCATGGAAAAGGAATATTGAAGCCTCATCAAGTTATGACTGAATTTG AAGCTATCTGCAAAGAAGATCAGAGCAAACTCTCTGATGGTGCTTTTTATG AAGTTCTTAAATGCACACAGGAAGCAATAGTGCAACCTCCATGGGTTGCA CTCGCGATCCGTCTTCGACCCGGTGTTTGGGAATATGTTAGAGTCAATGTTA ATGTTTTGGTGGTTGAAGAATTAAGTGTTCCTGAATATCTTCACTTCAAAGA AGAATTGGTTAATGGAACATCGAATGGCAACTTCGTGTTGGAACTGGATTT TGAACCTTTTACCGCATCGTTTCCTCGACCAACTTTAACCAAGTCTATTGGT AATGGTGTTGAGTTTCTAAACAGACATTTATCTGCTAAAATGTTTCATGATAAGGATAGCATGCACCCTCTTCTTGATTTCCTACGGACTCACCACTATAAGGG AAAGACAATGATGTTGAATGATAGAATCCAAAACCTCAATGCTCTACAATC GGTGTTGCGAAAGGCGTCAGAGTACTTATCAACACTCGACGCAGCAACAC CGTACTCTGAGTTTGAACATAAGTTTCAAGAAATCGGGTTGGAGAGAGGT TGGGGTGATAAAGCGGAGGTCGTAATGGAGATGATCCACATGCTTCTAGAC CTTCTAGAAGCACCCGACGCATGCACACTCGAGAAGTTTCTCGGAAGAAT CCCAATGGTTTTCAATGTTGTCATTCTTTCGCCTCACGGCTACTTCGCCCAA GAAAATGTGTTGGGATATCCCGACACTGGCGGTCAGGTTGTTTACATCTTG GATCAAGTTCCCGCTCTGGAACGCGAGATGCTCAAAAGGATTAAGGAGCA AGGACTCGATATCATTCCTCGTATATTGATTGTTACGAGGCTTCTTCCCGAC GCGGTTGGGACCACATGCGGGCAACGTTTAGAGAAAGTGTTTGGAGCCGA ACACTCGCATATTCTTCGGGTCCCGTTTAGAACCGAAAAGGGTATTCTTCGT AAATGGATCTCTCGTTTTGAGGTGTGGCCTTACATCGAGACTTTCACCGAG GATGTTGCTAAAGAAGTTACAGCAGAGTTGCAAGCAAAACCAGATTTGAT CATTGGAAACTATAGTGAAGGAAATTTGGTTGCATCTTTGCTAGCTCACAA GTTGGGTGTCACTCAGTGTACCATTGCTCATGCTTTGGAGAAAACTAAATA CCCGGATTCTGATATCTACTGGAAGAACTTTGAGGAGAAATATCATTTCTCT TCGCAGTTTACCGCTGATCTTATCGCTATGAACCATACCGACTTCATCATCA CCAGTACTTTCCAAGAAATTGCTGGAAGTAAGGACACGGTTGGACAGTAC GAGAGTCATACCGCGTTCACAATGCCGGGATTGTATCGGGTGGTTCACGGG ATCGATGTTTTTGACCCCAAATTCAATATTGTTTCACCCGGGGCCGATATGG GAATTTACTACTCGTATACCGAGAAAGAAAAGAGGCTCACTGCGCTTCACC CTGAAATCGATGAACTTCTCTTTAGTTCCGTCGAAAACGAAGAACACTTAT GTGTGTTGAAGGATAAGAGTAAACCAATCTTGTTCACAATGGCGCGATTGG ATAATGTGAAGAATTTAACCGGACTGGTTGAATGGTACGCTAAAAACGACC GCCTTCGTGAGCTCGTGAACCTCGTGGTCGTCGGTGGTGACCGAAGGAAA GAGTCGAAAGATCTTGAAGAACAAGCTCAGATGCAGAAGATGCATGAACT TATCGAAACCTACAAACTCAACGGTCAGTTCAGGTGGATATCCTCACAAAT GAACCGCGTGAGGAACGGTGAGTTGTATCGCGTTATTGCTGACACACGAG GTGCGTTTATCCAGCCTGCGTTTTACGAGGCGTTTGGGTTGACGGTTGTGG AGGCCATGACTTGTGGCCTGCCGACATTCGCGACACTTCATGGTGGGCCCG CTGAGATTATTGTTCACGGGAAATCCGGGTTCCATATTGACCCGTATCACGG TGACCAGGTCACCGAGTTGCTGGTCAATTTCTTTGAGAAAACTAAACAAG ACCCGGGTCATTGGGAGGCCATTTCCAAGGGTGGTCTGCAACGTATTCAG GAGAAATACACGTGGCAGATTTATTCAGATAGGTTGTTGACGCTTGCCGGA GTTTATGGATTCTGGAAGCATGTGTCGAAGCTTGACAGGCTCGAGATCCGT CGTTATCTTGAAATGTTTTACGCGCTCAAGTATCGCAAACTGGCTGAATCTG TTCCATTGGCTGTTGATGAGTGA
SEQ ID NO:18(编码SUS2同种型)
ATGGCGACAAGTAAGTTGAGCAGAACGCATAGTATGCGTGAGCGTGTTGA AGAAACTCTTTCCGCTCATCGCAACGAAATCGTTTCTCTTCTTTCTAGGTAT GTGGCTCAGGGGAAGGCGATATTGCAGCCGCATCAGATACTCCATGAACTT GAGAATATCATCGGTGATGTTACTTCGCGCCAAAAGCTTACAGATGGTCCG TTTGGAGATGCGTTGAAGACAGCACAGGAATGTATAGTTCTACCTCCATTT GTAGCTTTAGCAGTTCGTCCAAGACCTGGTGTTTGGGAATACGTGCGCGTG GATGCATATCAACTAAGTGTGGAACAACTAACTGTTTCAGAGTATCTTACCT TCAAAGAAGAACTTGTTGGAGAGTCTAATAGTTCTTTAATGCTCGAGTTGG ATTTTGAGCCATTTAATGCTTCGTTTCCTAGACCAACCCGTTCTTCATCCATT GGCAATGGAGTTCAGTTCCTGAATCGCCACCTGTCGTCAAGCATGTTTCGC AGCAAAGATTGTTTAGAACCGCTTCTGGATTTCCTACGCACACACAGACAT AATGGACATGTAATGATGTTAAATGACCGCATAACAAGCATGACTAGACTT CAATCTTCTTTGGTCAAAGCAGAGGAATATCTTTCTAAACTACCATCTGATA CAGACTACTCTGAGTTTCAATATGAATTGCAAGGAATGGGTTTTGAAAGAG GATGGGGAAACAATGCTGAAAGAATCATTGAGATGATGCATCTTCTCTCAG ACATTCTACAAGCTCCAGATCCTTCCATTTTGGAATCTTTTCTTGCTAGAAT ACCTATGGTGTTTAATGTTGTTATATTATCAATACATGGCTACTTTGGGCAAG CAAATGTTTTGGGTTTGCCAGATACTGGTGGCCAGATTGTATATATATTGGA TCAAGTCCGTGCATTGGAAAATGAGATGCTTCTTAAATTAAAGCACCAAGG ACTGGATATCAAACCTAGGATTCTGATTGTGACTCGGTTAATACCTGATGCA AAAGGTACTTCATGTAACCAACGACTGGAAAGAGTCAGTGGAACTGAACA CACACATATACTTCGTGTTCCTTTTAGAACCGAGAAAGGAATTCTTCGTAAA TGGATCTCAAGGTTTGATGTATGGCCTTTTTTGGAGAAATTTACACAGGATG CAGCAAGTGAAATTTCTGCTGAGTTGCATGGTACTCCAGATCTTATAATTGG AAATTATAGTGATGGCAATCTTGTTGCCTCTTTATTATCTTACAAAATGGGA GTAACCCAGTGTAACATTGCTCATGCTTTAGAGAAAACAAAGTATCCAGAT TCTGATTTATATTGGAAGAAATTTGATGAGAAATATCACTTTTCTTGTCAATT TACTGCTGATCTTTTAGCCATGAACAATGCAGATTTTATCATCACCAGCACA TACCAAGAAATCGCGGGAACGAAAAATACTGTCGGACAATACGAGAGTCA TTCGTCTTTCACTCTCCCGGGGCTCTACAGGGTTGTTCATGGTATTGACGTT TTTGACCCTAAGTTCAACATTGTGTCTCCAGGGGCAGATATGTCTATATACT TCTCATACACCGAGAAGGAAAAAAGACTTACATCTCTTCATACTACAATTG AGAAGTTATTGTTTGACCCTACACAAACTGAAGATTACATTGGAAATCTGA GTGATAAATCAAAACCGATAATTTTTTCAATGGCAAGACTTGATCATGTGA AGAACATTACGGGTCTGGTTGAGTGGTACGCTAAGAATGAGAAGCTTAGA GGACTAGCAAACCTTGTTGTGGTTGCTGGTTATAATAATGTGAAGAGGTCT AGTGACAGAGAAGAAATTGCAGAAATTGAAAAAATGCATCAACTTATTAA GAAATACAAATTAGATGGTCAGATGAGATGGATTTCAGCACAAACAAACC GCGCACAAAATGGTGAACTTTATCGCTATATTGCTGATGGAAGGGGAATCT TTGTACAGCCCGCTATTTATGAAGCTTTTGGGCTGACAGTGGTGGAGGCCA TGACTTGTGGGCTTCCAACATTTGCAACTTGCCATGGTGGGCCAGGAGAG ATAATTGAAAATGGTGTTTCGGGCTTCCATATCGACCCGTATCATCCGGATACTGCATCAGCCACAATGGCTGATTTTTTTCAGAAATGCAAGGAGGACCCGA GTTATTGGTTCAAGATATCTGAAGCAGGGCTTAAAAGAATATATGAAAGGT ACACATGGAAAATTTACTCTGAACGGTTGATGACATTAGCTGGAGTTTATA GCTTCTGGAAGTATGTCTCGAAACTTGAGAGACGTGAAACAAGACGATAT CTTGAGATGTTTTATATTCTTAAGTTCCGTGATCTGGTAAAATCTGTTCCAGT GGCTACTGATGATGAGGCTTAG
SEQ ID NO:20(编码SUS3同种型)
ATGGCGACACCTAAGCTTACGCGAACACCAAGCATGCGAGAGCGTCTTGA AGAAACTTTATCAGCTCATCGCAACGATATCGTCTCTCTTCTTTCCAGGTAT GTAGATCAAGGTAAGGCCATATTGCAGCCCCACCACCTACTTGACGAAATC GATAACTTCATCGGAGATCAAAATTGCCGCCAAAAGCTTGCTGATAGTCTA TTCGGTGAAATCCTCAAGTCCGCACAGGAAGGTATAATTCTTCCTCCATATG TAACGCTTGCTGTTCGTCCAAGACCTGGTGTTTGGGACTTTTTGCGTGTGA ATGTCGATGAATTGAGTGTCGAGCAACTTACTGTTTCTGAGTATTTAAGCTT CAAGGAGGAGCTTGTAGATGGCCAGAGTAGGAACCCGTTTGTGTTGGAAC TGGATCTGGAACCGTTTAATGCAACATTTCCCCGGATGTCACGATCTTCATC CATCGGCAATGGAGTTCAGTTTCTCAACCGTCATCTCTCGTCAATTATGTTT CGCAACAAAGATTGTATGGATCCGTTTCTTGATTTCCTTCGTGCTCATAAAC ATAAAGGATACGCGATGATGTTGAATGATCGGATACAAACAATGTCTAGAC TTGAATCTTCTTTAGCAAAAGCGGAGGATCATCTCTCTAAACTACCACCCG AAACACCGTACTCCGAATTCGAATACGTATTGCAAGGAATGGGGTTTGAAA GAGGTTGGGGGGATAATTGTGAAAGAGTTCTTGGTATGATGCATCTTCTTT CTGACATTCTTCAAGCTCCAGATCCTTCGATTCTTGAAAAGTTTCTTGGAA AGATGCCGATGATCTTCAATGTTGTTGTGTTATCGATTCATGGTTACTTTGGT CAGGCTAATGTTTTGGGTTTGCCGGATACCGGTGGTCAGGTTGTATATATAT TGGATCAAGTACGTTCTTTGGAGAATGAAATGTTACTTAAATTAAGGCATC AAGGACTTGATATCAAACCCAAGATTCTAATTGTAACTCGATTGATACCAAA TGCCAAAGGTACTTCATGCAACCAACGATTGGAGAAAGTAAGTGGAACCG AATACACGTATATATTACGTGTCCCTTTTAGGACAGAGAAAGGGATTCTTGG TAAATGGTTATCAAGGTTTGATATATGGCCTTATTTGGAGGCGTTTACAACG GATGCAGCAAGTGAAATTGCTGCTGAGTTACACGGTGTTCCGGATCTTTTA ATAGGAAACTACAGTGATGGGAATCTCGTTGCCTCCTTGCTATCTAACAAAT TGGGCGTAACCCAGTGCAACATTGCACACGCGTTAGAGAAAACAAAGTATCCAGATTCCGACTTATATTGGAAGAAATTTGAGGACAAATATCACTTTTCAT GTCAATTTACCGCCGACCTTCTAGCAATGAACAATGCAGATTTTATCATCAC TAGCACATACCAAGAGATTGCAGGAACGAAAAACACCGTTGGACAATACG AGAATCATTCATCGTTCACTCTTCCGGGTCTATACAGGGTTGTTCACGGTAT CGATGTCTTTGACCCGAAGTTCAACATCGTGTCACCAGGGGCAGATATGGC AATTTACTTCTCATATGCCGATAAAGAGAGACGACTTACATCTCTACATCCC ACAATTGAGAAGCTATTGTTCGACACTGAGCAGAACGATGTACACATTGGA AATATAAATGACCCGTCTAAACCCATGATTTTCACAATGGCGAGGCTTGATC ATGTGAAGAATATAACTGGATTCGTCGAGTGTTATGCTAAAAATAATAAGTT GAGGGAACACGCAAATCTTGTGGTTATTGCTGGTTATAATGACGCGAAGAA ATCAAGTGATCGAGAAGAAATTGCGGAAATTGAAAAGATGCATAATCTTAT CAAGCAATACAAACTTGATGGTCAGATGAGATGGATATCAGCCCAAACAA ACCGGGCCCGAAATGGGGAATTTTATCGGTATATCGCTGATGGTAGGGGCG TTTTCGTCCAGCCCGCTTTCTATGAAGCATTTGGGCTTACGGTTGTGGAGG CGATGACATGTGGGCTCCCAACATTTGCCACGTGTCATGGTGGGCCTGCTG AGATCATTGAGGATGGTGTGTCGGGGTTCCATATTGATCCATATCATCCTGATAAGATGTCGACTACGTTAGCTGATTTTTTTCAAAAGTGCAAAGAGGAACC TAGTTACTGGGGTAAAATATCCGATGGCGGGCTGAAAAGAATAAGTGAAA GGTACACATGGAAGATATATTCGGAACGGTTGATGACGTTGGCGGGCGTAT ATAGCTTTTGGAAATATGTGTCAAAACTCGAGAGGCGTGAAACCCGTCGAT ACCTTGAGATGTTCTACATTTTAAAGTTTCGTCAACTGGTGAAGTCGGTTC CGCTAGCTGTTGATGAGGAGCCGTAA
SEQ ID NO:22(编码SUS4同种型)
ATGGCATCTGCTTCAAGTTCTATCATGAAACGGTCTGAATCAATAGTTGACA CCATGCCAGAAGCCTTAAAGCAGAGCCGCTATCATATGAAAAAATGTTTTC TAAAATATGTAGAAAAAGGAATTCGCATGATGAAAAGACATCATTTGATAC AAGAAATGGAGACCGCAATTGAAGACAAGGATGAAAAGGCTCAGCTTCTA GATGGCTTACTTGGCTACATCTTGTGCACAACTCAGGAAGCAGCCGTTGTT CCTCCTTGTGTTGCATTTGCTATAAGACCGAATCCTGGATTCTGGGAGTTTG TTAAAGTCAACTCTAATGATCTATCGGTTGATGGGATAACTGCCACAGATTA CTTGAAGTTCAAGGAAATGATCGTAGATGAGACATGGGCTAAAGATGAAA ATGCATTGGAGATTGACTTTGGATCGATGGACTTTAACCTACCAAACATGA GTTTATCTTGTTCGATTGGAAATGGTGTTAACTTCACATCAAAATTCATTAC TTGTAAACTTTACGCACAATCTAGTTGCCAACAACTGCTTGTTGATTACTTG CTCTCATTGAATCATCAAGGAGAAAATCTTATGATCAATGATGCATTAAACT CAGTCTCAAAACTTCGAGCGGCTTTAATTGTAGCTCATGCGTCGCTATCTTC GTTGCCCAACGATACTCCATATCAAAGCTTCGAGCTTAGATTCAAAGAATG GGGATTTGAGAAGGGATGGGGAGATAACGCGGAACGCGCGAGGGAAACA ATTCGGTTTCTTTTGGAGGTTCTTCAAGCACCCGATCCGATAAACCTCGAG GCTTTATTCAGCAGGATTCCAAACATATTCAACGTTGTTTTATTCTCGATTCA TGGGTATTTTGGTCAATCCAATGTTCTTGGATTGCCCGATACTGGTGGCCAA GTGGTTTATGTTTTGGATCAAGTGGTAGCTATGGAAGAAGAACTACTCATG AGGATCAAACAACAAGGACTCAACTTCAAGCCTCAAATTCTTGTGGTGAC CCGACTTCTTCCTGATGCTAAAGGGACCAAGTGTAATCAGGTGTTGGAACC AGTTCTGAACACGAAACATTCGCATATTCTTAGGGTTCCATTCAGGACTGAT AAAGGTGTTCTTCGTAAATGGGTATCTCGATTTGATATCTATCCATATCTCGA AAACTTCACTCAGGATGCAAGTGCGAAAATCATTGAAATGATGGAAGGGA AACCGGATCTTATCATCGGAAACTATACCGATGGAAACCTTGTTGCATCACT CATGGCTAACAAACTCGGAACGACATTGGGAACAATTGCACATGCTTTGG AGAAAACCAAATACGAAGATTCAGACATGAATTGGAAGCAATTCGACCCA AAATATCACTTCTCCTGCCAATTTACAGCCGATATGATTGCAATGAACTCAG CTGATTTCATCATCACAAGTACTTTCCAAGAAATCGCTGGAAGTAAAGATA GACCCGGACAATATGAAAGCCATGAAGCATTTACACTTCCAGGATTATACA GAGTTGTTTCAGGCATCAACGTGTTCGATCCCAAATTCAATATCGCGTCTCC AGGAGCCGATCAAACCGTTTATTTCCCGTACACCGAAACAAAGAAACGAT TCACTGCATTTCAACCCGCCATAGAGGAATTACTCTTCAGTAAAGTTGAAA ACGAAGAACACATTGGATACTTAGAAGACAAAACCAAACCGATCATATTCT CAATGGCGCGTCTCGACACAGTTAAGAACATAACAGGACTAACCGAATGG TTTGGAGAGAACAAACGGCTCCGAAGCTTGGTTAATCTTGTAATCGTGGCG GGTTTCTTTGACCCGTCAAAGTCAAAAGACAGAGAAGAAATGGCGGAAAT AAAGAAAATGCATTTATTGATTGAAAAATATCAGCTTAAAGGTCAAATAAG ATGGATTGCTGCACAAACTGATAAGAACCGAAACAGTGAGCTTTACCGGT TTATTGCTGACTCAAAAGGCGCGTTTGTGCAGCCCGCTTTGTATGAGGCGT TTGGGCTCACGGTTATTGAGGCGATGAACTGTGGTTTACCGACTTTTGCAA CTAATCAAGGTGGTCCAGCTGAGATTATCGTTGATGGTGTTTCTGGGTTCC AGATTGATCCTAATTTTGGTGATCAGTCTAGTAATAAGATTGCTGATTTCTTC CAGAAGTGTAAGGAAGATCCTGGTTATTGGAATAATATTTCAGAAGGCGGT TTGAAGCGTATATACGAATGTTATACTTGGAAGATTTATGCGAATAAAGTGT TGAATATGGGGAACATATACTCGTTTTGGAAGCGGTTAAACAAGGAACAAA AAGAAGCAAAACAAAGATACATTGAACTATTCTACAATCTACACTACAAGA ACTTGGTTAGGACTGTACCAATTGCTAGTGATGAAGCTCAACCTGCACCAG TGTCAAGGGCAAAACTTGCAACACAACCCACAAGACGTACGCAATCCAGGTTGCAAAGGCTGTTTGGAGCTTAA
SEQ ID NO:24(编码SUS5同种型)
ATGGCAGCTTCTTCAAGTCCCATTATGAAACGGTCTGAGTCAGTACTCGAC ACCATGCCAGAAGCTTTGAGGCAAAGTCGGTATCATATGAAAAAATGCTTT CTAAAATATGTAGGGAAAGGAAAGCGGATGGTGAAACTCCACCATTTGAT GCAAGAAATGGAGACCGTCATTGAGGACAAGGACGAAAAGGCTCAGCTC TTGGAAGGCTTACTTGGTTACATCTTGTGCACCACTCAGGAAGCAGCAGTT GTTCCTCCTTATGTCGCCTTTGCAATAAGGCCAAACCCTGGATTTTGGGAG TTTGTTAAAGTCAACTCTAATGATCTCTCGGTTAAAGGGATCACTTCCACC GATTACTTGAAGTTCAAGGAAATGATCGTTGACGAAACATGGGCTAATGAT GAAAATGCATTGGAGATCGACTTTGGAGCAATGGACTTTAACTTGCCAACA ATGAGCTTATCTTCTTCAATTGGAAATGGAGTTAACTTCACATCAAAGTTTA TTATTTCTAAACTTTATGCTCATTCTGGCAGCCAATTACAATCTCTAGTTGAT TACTTACTTTCATTAAATCATCAAGGAGAAAAACTTATGATAAATGACAAAC TAAACACAGTTTCAAAACTTCAAGCCGCTCTAATAGTAGCTCATTCTTTCCTTTCTTCATTGCCCAACGACACACCGTATCAAAGCTTTGAACTTAGATTTAA AGAGTGGGGTTTTGAAAAAGGATGGGGAGATTATGCAGAAAGGGTGCAA GAAACAATTCGGTTTTTGTTGGAGGTTCTTCAAGCACCCGACCCCGTAAACCTAGAGGCCTTTTTTAGCAGGGTTCCAAACATATTCAATATTGTTTTATTCTC GATTCATGGGTATTTTGGTCAATCCAATGTTCTTGGCTTGCCCGATACCGGA GGTCAGGTAGTTTATGTTTTGGATCAAGTTGTGGCAATGGAAGAAGAATTG CTACTTAGGATTAAGCAACAAGGACTCAGCTTCAAGCCTCATATTCTTGTG GTGACTCGACTTCTTCCCGATGCCAAAGGGACCGAGTGTAGCCAAGTTTT GGAACCAGTTCTCAACACGAAACACTCACACATTCTTAGAGTCCCATTTAG GACAGAAAAAGGTGTTCTTCGTAAATGGGTGTCTCGATTTGATATCTATCCA TACCTCGAAAAGTTTACTCAGGATGCAAGTGCAAAAATAACTGAAATGATG GAAGGAAAACCTGATCTTATCATTGGAAACTACACTGACGGAAACTTGGTT GCATCTCTCATGGCTAACAAACTCGGAAGCACATTGGGAACGATTGCACA CGCGTTAGAGAAGACTAAATACGAAGATTCAGACATGAAATGGAAACATT TGGACACAAAATATCACTTTTCTTGTCAATTTACAGCTGATATGATAGCAAT GAATTCAGCAGATTTCATCATCACTAGTACTTTCCAAGAAATTGCTGGAAG TAAAGATAGACCCGGTCAGTATGAAAGCCATGAAGCATTTACACTCCCGGG TTTATATAGAGTTGTTTCGGGCATCAACGTGTTTGATCCCAAATTCAACATT GCATCTCCGGGAGCTGATCAAACCGTTTATTTCCCTTACACGGAAACACCA AAACGATTCACTACTTTTCAACCCGCTATACAAGAATTACTCTTTAGTAAAG TTGAAAACGACGAACACATTGGATATTTAGAAGATAAGAATAAACCAATCA TCTTCTCAATGGCAAGACTCGACATGGTTAAGAACATAACGGGGCTAACCG AATGGTTTGGGGAAAACAAGCGGTTAAGAAGTTTGGTTAATCTTGTAATTG TGGCGGGGTTTTTTGATCCGTCAAAATCAAAAGATAGAGAAGAAATGGAA GAAATAAAGAAAATGCATTTGTTGATTGAGAAATATGAACTTAAAGGTCAA ATAAGATGGATAGTAGCACAAACTGATAAAAACAGAAATAGTGAACTTTAT CGTTGTATCGCTGACTCAAAGGGGGCGTTTGTGCAACCGGCTTTATATGAA GCGTTTGGGTTAACCGTTATTGAGGCTATGAATTGTGGGTTACCAACTTTTG CAACTAACCAAGGTGGTCCGGCTGAGATTATTGTTGATGGTGTTTCTGGGT TCCAAATCGATCCTAATTATGGCGACGAGTCTAGCAACAAGATCGCTGATT TTTTTCAAAAATGCAAACAGGATCCAGGATACTGGAATAGGATTTCAGACG GTGGTTTGATGCGTATATACGAATGCTACACATGGAAGATTTATGCAAATAA AGTGTTGAATATGGGGAACATTTACACATTTTGGAAGCAGTTAAACAAGGA ACAGAAAGATGCGAAACAAAGATACATTGAGCTATTCTACAATCAACATTA CAAGAATTTGGTTAGGACTGTGCCGATTGTAAGTGATGAAGATGACCAAGT TACAAGGGCAAAACCGGCAACACAACCTTCAACAAGGCGCACACAATCT GCCTTGCAAAGGCTGCTTGGAGCTTAA
SEQ ID NO:26(编码SUS6同种型)
ATGGATTTCGGTATAGCAGAGACTTTGGCCGAGGCATTGAAGCAAAACCG GTACCATGCAAGGAGATGCTTTGAGCGTTTTACATCACGTGGAAAAAGGAT GGTGAAGCCTCAAGAGTTATTACACATGATTGAAAAAACCATTGACGACA AGCTTGAAAGAACGAAGGTCTTGGAGGGCTCAATGGGACAAATCTTGAGT TCCACACAGGAGGCAATCGTTATTCCACCATATGTTATTTTAGGATTGAGAG CGAATCCAGGACAATGGGCATACGTTAAGATCAATGCTGATGACGTCACTG TTGAGTCACTCACACCTTCACAATATCTAAAGTTCAAAGAATCCATCTACG ATCAAGAATGGGCAAAGGACGAAAATGCCCTTGAACTAGATTTCGGAGCG TTCGACTTTGATACGCCTCGATTAATCCTCCCGTCATCTATCGGCAACGGAC TCGGTTACATTTCAAAGTTCATGACTTCAAGAATTGGTGGTGATCTAGAAA ACGCGAAGCCGTTGCTTGACCACTTGCTTGCTCTAAAATATCATGGAGAGA AGCTTATGATCAATGAGACAATAGATACAGTTTCAAAGCTCCAGAAAGCAT TAATTGTTGCTGATGTCTACTTATCTGCACACCCGAAAGACGAACAATATCA AACCTTAGAGCCCAAGCTTAAAGAATGGGGATTTGAGAAAGGATGGGGAG ATACTGCTGAAAGAGTTAGAGAGACAATGAAAATGCTTTCGGAGATTCTTC AAGCACCCGACCCGATTAACATGCAATCGTTCTTTAGCAGGCTTCCGGTGGTCTTCAATATTGTCATATTTTCTATTCATGGGTATTTTGGTCAATCAGATGTTC TTGGATTACCTGATACCGGAGGGCAGGTTGTTTACATTCTTGATCAAGTTAA AGCATTAGAGGAAGAGATATTGCTAAGAATAAAAATGCAAGGATTGAATGC AAAGCCTCGGATTCTTGTGGTGAGTCGACTCATTCCCGACGCACAAGGAA CAAAGTGTAACGAGGAAATGGAACCGATCTTGAACACAATGCATTCACAC ATCCTTCGGGTTCCTTTCAGAACCTCAAAAGGCGTTGTTCCTCAATGGGTA TCGCGGTTTGACATCTACCCGTATCTTGAAAGATTCTCACAGGACGCTGCC TCTAAAATACTTGAAGTAATGGAATGTAAACCAGATCTCATACTTGGAAACT ACACAGATGGAAACATTGTTGCATCACTTATAGCCAAAAAGTTTGGAGTAA CACAGGGGACGATTGCACACGCGTTAGAGAAGACAAAGTACGAAGATTCG GATGTTAACTGGAAAAACTTTGAAAAAAAGTATCATTTCTCATGTCAATTT ACCGCGGATTTGATCTCAATGAACGCTGCAGATTTCATAATCACAAGCACT TATCAAGAAATTGTGGGAAGCAAACAAAGACCCGGACAGTATGAGACCCA CGGGGCGTTTAGTATGCCCGGACTTTGTAGAGTCGTGTCGGGCATCAACGT GTTTGATCCTAAGTTCAACATTGCTTCACCCGGTGCGGAACAATCGGTTTAT TTTCCGTACACCGAGAAGGAGAAACGGTTAACGGATTTTCATCCCGCAATT AAAGAACTACTTTTCAACGAACAAGACAATGACGAGCATATGGGATACCT CGCGGATGTAACCAAACCGATAATATTCTCAATGGCGAGGCTCGATACGGT GAAGAACATAACAGGGTTAACCGAGTGGTTCGGTAAGAACAAACGACTTAGAAGTCTTGTAAACTTGGTTGTTGTCGCGGGGTTCTTCGATCCATCAAAAT CTAAAGACCGTGAAGAGATGGAGGAAATCAAGAAAATGCATGAACTAATA GAGAAATACAAACTCAAGGGTCAGATGAGATGGATCGCGGCTCAAAACGATAGGACCCGCAATGGTGAATTGTATCGGTGTATTTCCGATACGAAGGGAGC GTTTGTGCAGCCCGCGTTGTATGAGGCTTTTGGGCTCACGGTTATCGAGGC AATGAACTGCGGTCTCCCGACTTTTGCAACCAATCAAGGCGGGCCCGCGG AGATCATAGTTGACGGAGTTTCGGGATTTCATATTGATCCCGTTAACGGAGA TGAATCAAGCAACAAGATTGCTGATTTCTTCACGAAATGCAAAGTCGATGG CGAGTATTGGGACCGCGTGTCGCAAGCGGGACTTCAACGTATTTACGAGT GCTACACATGGAAGATGTATGCTAACAAAGCATTGAACATGGGTTCGATGT ATGGTTTTTGGAGGCAATTAAACAAAGAAACTAAGCAAGCGAAGCAACGA TACATCGATATCTTGTATAACTTACAATTCAAGAATTTGGCAAAAACCATTG AAATCCCTGATTTTGTGACTCCTAAACTTCAAGAACCGGTCAAAACCGAA CCAACAAAACCATTACAAGAAGCAAGACCTCGAGAACCGGTGCAAAAAC TGGTACCGGAAGAAACCCGACTGCCAAAACTAGAGTTGACCAAGCTTGGT CAACCGAATTTGATGAGCAATGCAAGAAAACCATTGATTGTTCTTGTTTCT GTGTTGATAGTTGCATATGCATCCAAGAACTTGTATAGGAGGTATTTCAAAT AG
在其他实施方案中,提供了包括如下序列的核酸:所述序列与SEQ ID NO: 2、4、6、8、10、14、16、18、20、22、24、26、28、30、32和34中所示序列及其片段或其互补序列中的任意一个具有至少50%,55%,60%,65%,70%, 75%,80%,85%,90%,95%,96%,97%,98%,99%或100%同一性。
在其他实施方案中,提供了编码包括如下序列的多肽的核酸,所述序列与 SEQ IDNO:1、3、5、7、9、13、15、17、19、21、23、25、27、29、30、31 和33中所示序列及其片段中的任意一个具有至少50%,55%,60%,65%,70%, 75%,80%,85%,90%,95%,96%,97%,98%,99%或100%同一性的序列。本领域技术人员将容易理解,总体序列同一性或相似性可能小于50%,而酶的区域(例如催化位点或邻近催化位点的区域)可具有保守的氨基酸。例如,在邻近UDPG催化位点的开口处有保守的氨基酸。特别是,UGT76G1的379位亮氨酸是保守的。在某些实施方案中,核酸编码这样的UDP-葡糖基转移酶:其在SEQ ID NO:1所示的UGT76G1的375至381位氨基酸残基的相应位置处具有序列SDFGLDQ。
在某些实施方案中,片段的长度为至少10个,至少20个,至少50个核苷酸。片段可以用作例如引物或探针。
还提供了与本发明的核酸或其互补序列杂交的核酸。在某些实施方案中,提供了与SEQ ID NO:2、4、6、8、10、14、16、18、20、22、24、26、28、 30、32和34所示序列或其互补序列中的任意一个在低、中或高严格条件下进行杂交的核酸。本领域技术人员容易理解,杂交和杂交强度(即,核酸之间的缔合强度)受例如核酸之间的互补程度、所涉及的条件的严格性、形成的杂交体的Tm和核酸内的G:C比等因素影响。这样的技术人员可以容易地确定适当的严格条件(参见,例如,Sambrook,等人,Molecular Cloning:A Laboratory Manual, 2nded.,Cold Spring Harbor Laboratory Press,New York(1989)pp.9.50-51,11.48-49 and11.2-11.3)。
通常在高严格条件下,只有高度相似的序列才会在这些条件下杂交(通常>95%的同一性)。通常在中严格条件下,具有大于80%同一性的那些序列会杂交,在低严格条件下,具有大于50%同一性的那些序列会杂交。
当用于核酸杂交时,“高严格条件”的非限制性实例包括相当于以下的条件:当使用长度约500个核苷酸的探针时,在由5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2O和1.85g/l EDTA,用NaOH调节至pH 7.4)、0.5%SDS、5×Denhardt 试剂和100μg/ml变性鲑鱼精子DNA组成的溶液中在42℃下结合或杂交,随后在42℃下在含有0.1×SSPE、1.0%SDS的溶液中洗涤。当用于核酸杂交时,“中严格条件”的非限制性实例包括相当于以下的条件:当使用长度约500个核苷酸的探针时,在由5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2O和1.85g/lEDTA,用NaOH调节至pH 7.4)、0.5%SDS、5×Denhardt试剂和100μg/ml变性鲑鱼精子DNA组成的溶液中在42℃下结合或杂交,随后在42℃下在含有1.0×SSPE、 1.0%SDS的溶液中洗涤。当用于核酸杂交时,“低严格条件”的非限制性实例包括相当于以下的条件:当使用长度约500个核苷酸的探针时,在由5×SSPE(43.8 g/l NaCl,6.9g/l NaH2PO4H2O和1.85g/lEDTA,用NaOH调节至pH 7.4)、0.5% SDS、5×Denhardt试剂和100μg/ml变性鲑鱼精子DNA组成的溶液中在42℃下结合或杂交,随后在42℃下在含有5×SSPE、0.1%SDS的溶液中洗涤。
多核苷酸包括单独的编码序列多肽,与其他编码序列(例如纯化标签、定位信号、作为融合蛋白、作为前体蛋白等)组合的编码序列多肽,与非编码序列(例如,内含子或内含肽(intein)、调控元件如启动子(包括诱导型启动子、组织特异性启动子(如根特异性或叶特异性启动子)、增强子、终止子等)组合的编码序列多肽,和/或载体或宿主环境中的编码序列多肽,其中编码转录因子或转录因子同系物多肽的多核苷酸是内源性或外源性基因。
适当的其他编码序列(例如纯化标签、定位信号、作为融合蛋白、作为前体蛋白等),非编码序列(例如,调控元件如启动子(包括诱导型启动子、组织特异性启动子(如根特异性或叶特异性启动子)、增强子,终止子等)以及用于原核生物(如大肠杆菌)和真核细胞(包括但不限于酵母和植物细胞)的载体是本领域已知的。
多肽
本发明提供了糖基转移酶。本发明的糖基转移酶能够进行初级、二级和/或三级糖基化作用。在某些实施方案中,糖基转移酶能够进行初级、二级和三级糖基化作用。在其他实施方案中,糖基转移酶能够进行二级和/或三级糖基化。在某些实施方案中,糖基转移酶是葡糖基转移酶,其包括但不限于UDP-糖基转移酶。葡糖基转移酶包括但不限于甜叶菊UDP-葡糖基转移酶,如UGT76G1或 UGT74G1或稻(Oryza sativa)葡糖基转移酶,如Os03g0702000。在其他实施方案中,本发明提供了环糊精葡聚糖转移酶。还提供了蔗糖合成酶。
在某些实施方案中,提供了UGT76G1或UGT76G1样葡糖基转移酶。 UGT76G1样葡糖基转移酶包括,例如,UGT76G1进化枝的其他成员,如 UGT76G2或UGT76H1。因此,在某些实施方案中,提供了UGT76G1,其包括 SEQ ID NO:1、3、5和7中任意一个所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的UGT76G1,所述核酸分子包括SEQ ID NO:2、4、6和8中任意一个所示的序列。
在某些实施方案中,提供了UGT76G2,其包括SEQ ID NO:27所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的 UGT76G1,所述核酸分子包括SEQ ID NO:28所示的序列。
在某些实施方案中,提供了UGT76H1,其包括SEQ ID NO:29所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的 UGT76G1,所述核酸分子包括SEQ ID NO:30所示的序列。
在某些实施方案中,提供了Os03g0702000或Os03g0702000样葡糖基转移酶。Os03g0702000样葡糖基转移酶包括例如,UGT91进化枝的其他成员,如 UGT91D1或UGT91D2。因此,在某些实施方案中,提供了Os03g0702000,其包括SEQ ID NO:9所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的Os03g0702000,所述核酸分子包括SEQ ID NO:10 所示的序列。
在某些实施方案中,提供了UGT91D1,其包括SEQ ID NO:31所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的 UGT91D1,所述核酸分子包括SEQ ID NO:32所示的序列
在某些实施方案中,提供了UGT91D2,其包括SEQ ID NO:33所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的 UGT76G1,所述核酸分子包括SEQ ID NO:34所示的序列
在某些实施方案中,提供了甜叶菊UGT74G1。因此,在某些实施方案中,提供了UGT74G1,其包括SEQ ID NO:13所示的氨基酸序列或其片段和变体。在某些实施方案中,提供了由如下核酸分子编码的UGT74G1,所述核酸分子包括SEQ ID NO:14所示的序列。
在其他实施方案中,本发明提供了环糊精葡聚糖转移酶。环糊精-葡聚糖转移酶可商购获得(CGTase,Toruzyme 3.0L,Novozymes公司的商标)。
在某些实施方案中,提供了蔗糖合成酶。因此,在某些实施方案中,蔗糖合成酶包括SEQ ID NO:15、17、19、21、23或25所示的氨基酸序列或其片段和变体。在某些实施方案中,多肽包括由如下核酸分子编码的氨基酸序列,所述核酸分子包括SEQ ID NO:16、18、20、22、24或26所示的序列。
在其他实施方案中,提供了一种多肽,其包括与SEQ ID NO:1、3、5、7、 9、13、15、17、19、21、23、25、27、29、31和33中所示序列及其片段中的任意一个具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%, 95%,96%,97%,98%,99%或100%同一性的序列。本领域技术人员将容易理解,相关酶的总体序列同一性或相似性可能小于50%,而酶的区域(例如催化位点或邻近催化位点的区域)可具有保守的氨基酸,因此相关酶具有相似的活性。例如,在邻近UDPG催化位点的开口处有保守的氨基酸。特别是,UGT76G1 的379位亮氨酸是保守的。在某些实施方案中,核酸编码这样的UDP-葡糖基转移酶,其在位置处具有序列SDFGLDQ。在某些实施方案中,片段的长度为至少 10个,至少20个,至少50个氨基酸。在某些实施方案中,多肽序列含有异源序列,包括但不限于纯化标签,如HIS标签。在某些实施方案中,提供了在N- 末端包括6×HIS标签的多肽。在其他实施方案中,提供了在C-末端包括6×HIS 标签的多肽。
用于筛选糖基转移酶(包括葡糖基转移酶和环糊精葡聚糖转移酶)的活性的方法是本领域已知的。如此,本领域技术人员可以容易地确定糖基转移酶是否能够进行初级、二级和/或三级糖基化作用(参见,例如Dewitte等人,J Biotechnol.2016Sep 10;233:49-55.doi:10.1016/j.jbiotec.2016.06.034;Grubb等人, Plant J.(2014)79,92-105;Richman等人,Plant J.(2005)41,56-67;Tanaka等人, Plant Cell Rep.(1996)15,819-823;Tanaka等人,J.Nat.Prod(1993)56(12), 2068-2072.)。此外,用于筛选蔗糖合成酶的活性的方法也是本领域已知的 (Baroja-Fernandez等人,PNAS.(2012)109(1),321-326.doi: 10.1073/pnas.1117099109;Barratt等人,Plant Physiol.(2001)127,655-664;Huber and Akazawa,Plant Physiol.(1986)81,1008-1013)。
细胞和植物
本发明进一步提供了表达一种或多种本发明的多肽的细胞和植物。细胞和植物可以天然表达一种或多种本发明的多肽或已被修饰来表达一种或多种本发明的多肽。细胞可以是原核或真核细胞,包括但不限于大肠杆菌,酵母例如毕赤酵母,甜叶菊,美洲商陆(Phytolacca Americana),大麻属(Cannabis)包括但不限于栽培大麻、印度大麻和莠草大麻。
在某些实施方案中,提供了表达UGT76G1或UGT76G1样葡糖基转移酶(如 UGT76G2和UGT76H1)的细胞。因此,在某些实施方案中,提供了表达UGT76G1 葡糖基转移酶的细胞,所述UGT76G1葡糖基转移酶包括编码如SEQ ID NO:1、 3、5和7中任一个所示的氨基酸序列的序列。在某些实施方案中,提供了表达 UGT76G1样葡糖基转移酶的细胞,所述UGT76G1样葡糖基转移酶包括编码如 SEQ ID NO:27或29所示的氨基酸序列的序列。该细胞可进一步表达另外的葡糖基转移酶,如Os03g0702000或Os03g0702000样葡糖基转移酶(如UGT91D1和UGT91D2)和/或蔗糖合成酶,如包括SEQ ID NO:15、17、19、21、23或 25中所示序列的蔗糖合成酶。
因此,在某些实施方案中,提供了表达UGT76G1葡糖基转移酶和 Os03g0702000葡糖基转移酶的细胞,所述UGT76G1葡糖基转移酶包括编码如 SEQ ID NO:1、3、5和7中任一个所示的氨基酸序列的序列,所述Os03g0702000 葡糖基转移酶包括如SEQ ID NO:10中所示的序列。该细胞可以进一步表达包括SEQ ID NO:15、17、19、21、23或25中所示序列的蔗糖合成酶。
在某些实施方案中,提供了表达Os03g0702000或Os03g0702000样葡糖基转移酶的细胞。因此,在某些实施方案中,提供了表达Os03g0702000葡糖基转移酶的细胞,所述Os03g0702000葡糖基转移酶包括编码SEQ ID NO:10所示氨基酸序列的序列。该细胞可以进一步表达蔗糖合成酶,如包括SEQ ID NO: 15、17、19、21、23或25中所示序列的蔗糖合成酶。
转基因细胞和植物(包括植物细胞或植物外植体或植物组织)可以通过多种已建立的技术来生产。在构建包括本发明的多核苷酸的载体,最典型的是表达框后,可以使用标准技术将多核苷酸引入至细胞或植物中。任选地,植物细胞、外植体或组织可以被再生以产生转基因植物。
在某些实施方案中,提供了基因工程化以表达一种或多种本发明的蛋白质的大麻属植物。本领域技术人员将容易地理解用于基因工程化大麻属植物的合适载体和启动子。例如,可以使用组织特异性启动子,如分泌毛状体特异性启动子,使得本发明的蛋白质能在产生大麻素的相同组织(即植物的分泌毛状体) 中表达。合适的启动子元件包括来自拟南芥(Arabidopsis thaliana)的胞质O- 乙酰丝氨酸(硫醇)裂解酶(OASA1)的启动子(Gutierrez-Alcala 2005)。
现在,植物细胞的转化和再生是常规的,并且最适合的转化技术的选择将由从业人员确定。合适的方法可以包括但不限于:植物原生质体电穿孔;脂质体介导的转化;聚乙二醇(PEG)介导的转化;使用病毒转化;微注射植物细胞;微粒子轰击植物细胞;真空渗透;和根癌农杆菌(Agrobacterium tumeficiens)介导的转化。转化意指以引起序列稳定或瞬时表达的方式将核苷酸序列引入至植物中。
用克隆序列转化来修饰植物特征的成功例子包括:美国专利号5,571,706; 5,677,175;5,510,471;5,750,386;5,597,945;5,589,615;5,750,871;5,268,526; 5,780,708;5,538,880;5,773,269;5,736,369和5,610,042,其用于说明本技术领域的当前知识,并且其通过引用并入本文。
转化后,可以使用掺入转化载体中的显性选择标记来选择植物。通常,这样的标记将赋予已转化的植物以抗生素或除草剂抗性,可以通过将植物暴露于适当浓度的抗生素或除草剂中来完成转化体的选择。
方法
本发明进一步提供了用于生产大麻素糖苷前药的方法和通过该方法产生的大麻素糖苷前药。该方法可以在体外或体内(在细胞系统或植物体中(in planta)) 进行。在某些实施方案中,提供了生产大麻素糖苷前药的方法,所述方法包括在一种或多种糖基转移酶的存在下,将大麻素糖苷配基与一种或多种糖供体一起孵育。
糖苷配基包括但不限于:大麻素类,其包括但不限于大麻二酚、次大麻二酚、大麻萜酚、四氢大麻酚、大麻酚和大麻二酚酸,内源性大麻素类,其包括但不限于花生四烯酸乙醇酰胺(花生四烯酰乙醇胺,AEA)、2-花生四烯酸乙醇酰胺(2-AG)、1-花生四烯酸乙醇酰胺(1-AG)和二十二碳六烯酰乙醇酰胺 (DHEA,synaptamide);和类香草素,包括但不限于香草醛、姜黄素和辣椒素。
本领域技术人员将容易理解,所述一种或多种糖供体将取决于所述方法中使用的一种或多种糖基转移酶和/或所需终产物。例如,对于UDP-葡糖基转移酶,糖供体包括但不限于UDP-葡萄糖,UDP-葡萄糖醛酸,UDP-甘露糖,UDP-果糖, UDP-木糖,UDP-氟脱氧葡萄糖和UDP-鼠李糖。对于环糊精葡聚糖转移酶,糖供体包括麦芽糖糊精。
在某些实施方案中,提供了生产大麻素糖苷的方法,所述方法包括在糖基转移酶的存在下,将糖苷配基与糖供体一起孵育。还提供了通过上述方法产生的大麻素糖苷。在具体的实施方案中,提供了生产大麻素糖苷的方法,所述方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶的存在下,将糖苷配基与UDP-葡萄糖一起孵育。在其他具体的实施方案中,提供了生产糖苷前药的方法,所述方法包括在允许糖基化的条件下,在环糊精葡聚糖转移酶的存在下,将糖苷配基与麦芽糖糊精一起孵育。
产生大麻素糖苷的示例性方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶的存在下,将大麻素与UDP-葡萄糖一起孵育。还提供了通过上述方法产生的大麻素糖苷。
产生大麻素糖苷的另一个示例性方法包括在允许糖基化的条件下,在环糊精葡聚糖转移酶的存在下,将大麻素与麦芽糖糊精一起孵育。还提供了通过上述方法产生的大麻素糖苷。
在某些实施方案中,提供了生产大麻素糖苷的方法,所述方法包括在允许糖基化的条件下,在第一糖基转移酶和第二糖基转移酶的存在下,将糖苷配基与一种或多种糖供体一起孵育。还提供了通过上述方法产生的大麻素糖苷。
本领域技术人员将容易理解,第一糖基转移酶和第二糖基转移酶可同时提供或顺次添加。另外,如果使用多于一种糖供体,则糖供体可以同时提供或顺次添加。这样的技术人员会进一步意识到,所得大麻素糖苷的结构可能取决于糖基转移酶的提供顺序。另外,第一与第二糖基转移酶的比例可能影响所得产物。本领域技术人员将进一步认识到,糖基转移酶的活性水平可决定该比例,并且该比例可由本领域技术人员容易地确定。例如,第一与第二糖基转移酶的比例包括但不限于1:1、1:2、1:10、1:50,反之亦然。
在具体的实施方案中,提供了生产大麻素糖苷的方法,所述方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶和Os03g0702000 或Os03g0702000样葡糖基转移酶存在下,将糖苷配基与UDP-葡萄糖一起孵育。在可选的具体实施方案中,提供了生产大麻素糖苷的方法,所述方法包括在允许糖基化的条件下,在UGT76G1或UGT76G1样葡糖基转移酶和环糊精葡聚糖转移酶存在下,将糖苷配基与UDP-葡萄糖和麦芽糖糊精一起孵育。还提供了通过上述方法产生的大麻素糖苷。
产生大麻素-糖苷的示例性方法包括在允许糖基化的条件下,在UGT76G1 或UGT76G1样葡糖基转移酶和Os03g0702000或Os03g0702000样葡糖基转移酶的存在下,将大麻素(包括但不限于大麻二酚,次大麻二酚,大麻萜酚,四氢大麻酚,大麻酚和大麻二酚酸)与UDP-葡萄糖一起孵育。还提供了通过上述方法产生的大麻素糖苷。
生产大麻素糖苷的另一示例性方法包括在允许糖基化的条件下,在 UGT76G1或UGT76G1样葡糖基转移酶和环糊精葡聚糖转移酶的存在下,将大麻素类与UDP-葡萄糖和麦芽糖糊精一起孵育。还提供了通过上述方法产生的大麻素糖苷。
以下内容在本发明的范围内:上述糖基化方法中的每一种均可以应用于低级大麻素糖苷以形成高级大麻素糖苷。例如,使用本发明的任意糖基化方法可将大麻素单糖苷糖基化以形成二糖苷,或可将大麻素二糖苷糖基化以形成三糖苷等。
纯化大麻素糖苷的方法是本领域已知的,并且包括例如固相萃取法,如柱纯化。
本发明还提供了用于生产大麻素糖苷的细胞培养方法和在植物体中的方法。所述方法包括在产生糖苷配基的细胞或植物中表达一种或多种糖基转移酶,并分离大麻素糖苷。在某些实施方案中,还表达了一种或多种蔗糖合成酶。适合的载体和基因工程方法是本领域已知的。
本发明还提供了利用本发明的蔗糖合成酶将UDP转化为UDPG的方法。因此,在某些利用UDP-葡萄糖作为糖供体生产大麻素糖苷的方法的实施方案中,所述方法进一步包括使用蔗糖合成酶来回收利用UDP。在某些实施方案中,提供了生产大麻素糖苷的方法,所述方法包括在允许糖基化的条件下,在UGT76G1 葡糖基转移酶和蔗糖合成酶的存在下,将糖苷配基与UDP-葡萄糖一起孵育。
现在将参考具体实施例来描述本发明。将理解的是,以下实施例旨在描述本发明的实施方式,而不意图以任何方式限制本发明。
实施例
实施例1:将大麻素转化为大麻素糖苷前药
糖基化反应由50mM KPO4 pH 7.2、3mM MgCl2、0.005%CBD、2.5% UGT76G1纯化酶制剂和2.5mM UDP-葡萄糖组成。将缓冲液脱气并用氮气吹扫管,将反应保护避光,并在28℃下以180rpm搅拌孵育18小时。然后用等体积的乙酸乙酯萃取反应物3次,蒸发至干,并溶于半体积的HPLC级甲醇中。将 50微升注射到反相C18柱上并用从10%开始并增加到99%的乙腈梯度洗脱。通过在毕赤酵母中表达产生UGT76G1并通过标准分子生物学技术纯化。发现UGT76G1酶以UDP-葡萄糖依赖性方式糖基化CBD。该活性也与UDP-葡萄糖的存在量成比例。孵育温度为28℃,可接受的范围为20℃至30℃,因为高温会导致CBD显著降解。反应在黑暗中进行以防止底物的光降解。使用120至 200rpm的温和搅拌在惰性气氛中混合反应物。
用Δ9THC和CBDV代替反应中的底物CBD,并以相同的方式进行,得到相似的结果。对于CBD-糖苷,产生各种产物所需的酶组合列于表4中,对于 CBDV-糖苷,列于表5中,,对于Δ9THC-糖苷,列于表6中。
针对CBD活性筛选的其他酶是甜叶菊UGT74G1、UGT85C2、UGPase,大肠杆菌麦芽糖糊精磷酸转移酶(MalP)和欧洲玉米(O.sativa)Os03g0702000(SEQ ID NO.9)。除UGT76G1以外,用任何其他测试酶均未观察到初级糖基化活性。
实施例2:CBD-单糖苷的2-O糖基化
如实施例1中所述进行酶促反应,但包含相对于UGT76G1而言1:2比例的重组Os03g0702000酶。如实施例1中那样萃取和分析样品。优化重组 Os03g0702000酶密码子并在大肠杆菌BL21-DE3细胞中表达并通过固定化金属离子色谱法纯化。
实施例3:CBD转化成α-糖苷连接的CBD化合物。
如实施例1所示,将重组环糊精葡聚糖转移酶(CGTase,Toruzyme 3.0L商品名,Novozymes Inc.)加入到反应中,但没有UDPG或UGT76G1。麦芽糖糊精以0.05%终浓度使用,Toruzyme 3.0L以0.1%使用。如实施例1中那样萃取和分析样品。此外,进行实施例1的反应以将大麻素转化成大麻素-糖苷,然后加入CGTase和麦芽糖糊精,并给予足够的时间与大麻素糖-糖苷孵育。所得产物在大麻素骨架上含有β-糖基化,和由初级糖释放的α-糖基化。这种额外的处理产生了一类称为β-引发的、α-糖基化的大麻素的新化合物。
实施例4:大麻素糖苷的纯化
通过上述生物催化反应产生糖苷产物并通过C18固相提取纯化至均质。将 100mgHypersep C18柱(Thermo)在甲醇中水合,用50%甲醇水溶液冲洗,用水冲洗,糖基化反应过柱,用水洗涤,用10%、20%和30%甲醇洗涤,并用45 和60%甲醇水溶液洗脱糖苷产物。将洗脱液干燥并用乙酸乙酯萃取,并干燥至完全产生>95%纯的大麻素-糖苷,用于进一步分析和测试。
实施例5:大麻素糖苷前药的HPLC分析
图16至24分别提供了大麻素糖苷配基CBD、CBDV、Δ9-THC、CBN、1-AG 和2-AG、DHEA、AEA、辣椒素和香草醛的糖基化反应的反应产物的HPLC线图。如实施例1所述进行酶促反应。实线表示起始糖苷配基的洗脱曲线,虚线表示糖基化反应产物混合物的洗脱曲线。
在图16中,CBD糖苷配基保留时间为13.65min,在8.87、9.02、9.97、10.33 和10.37min处观察到产物峰。
在图17中,CBDV糖苷配基保留时间为12.75min,在8.53、9.70和10.01min 处观察到产物峰。
在图18中,THC糖苷配基保留时间为14.45min,在9.46、10.67、10.97、 11.28、11.67和12.49min处观察到产物峰。
在图19中,CBN糖苷配基保留时间为14.32min,在10.87、11.50和12.25min 处观察到产物峰。
在图20中,1-AG糖苷配基保留时间为14.18min并且2-AG糖苷配基保留时间为14.32min,在11.40、11.78、11.83、11.97、12.53、12.92、13.07和13.35 min处观察到产物峰。
在图21中,DHEA糖苷配基保留时间为13.78min,在10.09和12.43min 处观察到产物峰。
在图22中,AEA糖苷配基保留时间为13.87min,在12.47min处观察到产物峰。
在图23中,香草醛糖苷配基保留时间为1.95min,在1.25至1.35min处观察到产物峰。
在图24中,辣椒素糖苷配基保留时间为11.73min,在10.23min处观察到产物峰。
实施例6A:CBD糖苷的LCMS分析
如图16的HPLC线图所示,在+65小时的孵育时间后,输入的CBD糖苷配基(VB101,13.65′)已经耗尽至原始量的5%。CBD-糖苷在8.87、9.02、9.97、 10.33和10.37min时洗脱出HPLC柱。通过LCMS分析鉴定糖基化产物。糖基化产物“g1”是单糖苷,“g2”是二糖苷,“g3”是三糖苷,“g4″是四糖苷。在Shimadzu LC-MS 2010EV仪器上进行LC-LRMS。所用的LC柱是Silia Chrom XDB C18 5um,150A,4.6X50mm。该方法是12分钟5:95H2O:ACN梯度。对于LRMS,以正模式进行电喷雾电离(ESI)。
VB101(CBD糖苷配基)MS数据:LC/ESI-LRMS。[M+H]+(C21H31O2)计算值:m/z=315。实测值:m/z=315。
(CBDg1)MS数据:LC/ESI-LRMS。[M+H]+(C27H41O7)计算值:m/z=477。实测值:m/z=477。
VB104(CBDg2)MS数据:LC/ESI-LRMS。[M+H]+(C33H51O12)计算值:m/z =639。实测值:m/z=639。
VB110(CBDg2)MS数据:LC/ESI-LRMS。[M+H]+(C33H51O12)计算值:m/z =639。实测值:m/z=639。
(CBDg3)MS数据:LC/ESI-LRMS。[M+H]+(C39H61O17)计算值:m/z=801。实测值:m/z=801。[M+K+H]+(C39H61O17K)计算值:m/z=420。实测值: m/z=420。[M+ACN+H2O+H]+(C41H63NO17)计算值:m/z=860。实测值:m/z =860。
(CBDg4)MS数据:LC/ESI-LRMS。[M+H]+(C45H71O22)计算值:m/z=964。实测值:m/z=964。[M+H2O+H]+(C45H73O18)计算值:m/z=983。实测值:m/z =983。
(CBDg3)MS数据:LC/ESI-LRMS。[M+H]+(C39H61O17)计算值:m/z=801。实测值:m/z=801。[M+Na]+(C39H60O17Na)计算值:m/z=823。实测值:m/z= 823。[M+K+H]2+(C39H61O17K)计算值:m/z=420。实测值:m/z=420。
实施例6B:Δ9-THC糖苷的LCMS分析
以类似于实施例6A中进行的方式,通过LCMS分析鉴定Δ9-THC的糖基化反应产物(示于图18的HPLC线图中)。
VB301(THC糖苷配基)MS数据:LC/ESI-LRMS。[M+H]+(C21H31O2)计算值:m/z=315。实测值:m/z=315.[M+3ACN+2H]2+(C27H41N3O2)计算值:m/z =314。实测值:m/z=314。
VB304(THCg2)MS数据:LC/ESI-LRMS。[M+H]+(C33H51O12)计算值:m/z =639。实测值:m/z=639。
VB308(THCg3)MS数据:LC/ESI-LRMS。[M+H]+(C39H61O17)计算值:m/z =801。实测值:m/z=801。[M+Na]+(C39H60O17Na)计算值:m/z=823。实测值: m/z=823。[M+K+H]+(C39H61O17K)计算值:m/z=420。实测值:m/z=420。
实施例7:大麻素糖苷的NMR分析
图27描绘了分离的VB104的1NMR光谱,图28描绘了分离的VB110的1HMR光谱。这些产物中的每一种都是从CBD的糖基化反应产生的反应混合物中分离出来的。使用TopSpin采集和处理软件在Bruker Avance II 400MHz仪器上获得在CD3OD中制备的每种化合物的10mg/ml溶液的1H NMR光谱。
实施例8:溶解度分析
在Phenomenex Kinetex 2.6u 100A C18柱上,在配备有二极管阵列检测器的Dionex HPLC上,在增加乙腈的线性斜率上凭经验确定C18保留时间。表A中的CLogP值由ChemDraw(CambridgeSoft)预测。通过HPLC和建立的logP值分析参比大麻素(http://pubchem.ncbi.nlm.nih.gov/)并用于创建校准线,如图29 所示。预测的cLogP值与参比校准线相关联。如图29所示,将C18反相HPLC 保留时间与表A中呈现的cLogP值作图。数据点编号与表编号相关联。开放的钻石形表示新型大麻素糖苷,实心钻石形表示参比大麻素和衍生物。通过 ChemDraw(CambridgeSoft)预测ClogP值。对所有数据点进行线性回归 (R2=0.9455)。
表A:选择的大麻素糖苷和参比大麻素的CLogP值
| # |
化合物 |
保留时间 |
ClogP |
| 1 |
VB110 |
8.967 |
3.4 |
| 2 |
11-COOH-四氢大麻酚葡糖苷酸 |
9.347 |
3.7 |
| 3 |
VB104 |
10.720 |
4.3 |
| 4 |
VB304 |
11.250 |
4.7 |
| 5 |
VB302 |
11.688 |
5.7 |
| 6 |
11-COOH-四氢大麻酚 |
12.910 |
5.7 |
| 7 |
次大麻二酚 |
13.017 |
5.6 |
| 8 |
11-OH-四氢大麻酚 |
13.037 |
5.9 |
| 9 |
大麻二酚 |
13.647 |
6.6 |
| 10 |
大麻酚 |
14.178 |
7.3 |
| 11 |
四氢大麻酚 |
14.487 |
7.2 |
实施例9:生物利用度分析
为了研究糖基化作用影响位点特异性药物递送的效果,通过口服灌胃向三只小鼠施用VB110,并且在30、60和90分钟时处死动物。在施用10%乙醇US、 10%丙二醇USP、0.05%脱氧胆酸钠USP、79.95%盐水USP中的120mg/kg VB110 之前,八周大的雄性瑞士小鼠禁食12小时。终止和组织收获后,然后提取肠内容物并通过C18反相HPLC分析。如图30中的 A所示,小肠内容物显示完整的VB110,但没有解耦联的CBD。如图30中的 B所示,在60分钟和90分钟时间点,大肠内容物含有VB110和CBD。VB1l0的这种解偶联与番泻苷(sennoside)β-葡糖苷的大肠解偶联是一致的,并且是大肠微生物群分泌的β-糖苷酶的结果。
实施例10:施用CBD和CBD糖苷后大肠内容物的分析
为了研究CBD-糖苷在大肠中的代谢和解偶联,通过口服灌胃向小鼠施用 CBD-糖苷混合物的水溶液。作为对照,向第二只小鼠施用CBD的克列莫佛 (cremophor)、乙醇和盐水溶液。在2小时时将动物各自处死。终止和组织收获后,然后提取肠内容物并通过C18反相HPLC分析。在该实施例中使用的小鼠是在施用溶液前禁食12小时的八周大的雄性瑞士小鼠。
通过使用Shimadzu LC-MS 2010 EV进行的LCMS分析所得提取物。使用 SiliaChrom XDB C18 5um,150A,4.6X50mm进行LC分离。该方法是12分钟, 5:95的H2O:ACN梯度洗脱。通过电喷雾电离(ESI)以负模式进行低分辨率 MS。在分析过程中使用乙酸和甲酸作为样品添加剂,并且注射体积为20μl。
对施用口服CBD-糖苷混合物的动物的大肠内容物的分析表明存在糖苷配基和糖苷以及各自的羟基代谢物:
[CBD–H]、[2CBD-H]和[CBD*2OH+甲酸–H]MS数据:LC/ESI-LRMS。[M –H]-(C21H29O2)计算值:m/z=313。实测值:m/z=313。[2M–H]-(C42H59O4) 计算值:m/z=627。实测值:m/z=627.[M*2OH+甲酸–H]-(C22H31O6 -)计算值: m/z=391。实测值:m/z=391。
[CBDg1–H]、[CBDg1+Cl]和[2CBDg1–H]MS数据:LC/ESI-LRMS。[Mg1– H]-(C27H39O7)计算值:m/z=475。实测值:m/z=475.[Mg1+Cl]-(C27H40O7Cl) 计算值:m/z=511。实测值:m/z=511。[2Mg1–H]-(C54H79O14)计算值:m/z=951。实测值:m/z=951。
[CBDg2-H]和[CBDg2+乙酸–H]MS数据:LC/ESI-LRMS.[Mg2–H]- (C33H49O12)计算值:m/z=637。实测值:m/z=637.[Mg2+乙酸–H]-(C35H53O14 -) 计算值:m/z=697。实测值:m/z=697。
[CBDg3–H]、[CBDg3*OH–H]和[CBDg3*OH-2H]MS数据:LC/ESI-LRMS。 [Mg3–H]-(C39H59O17)计算值:m/z=799。实测值:m/z=799。[Mg3*OH–H]- (C39H59O18)计算值:m/z=815。实测值:m/z=815.[Mg3*OH–2H]-2(C39H58O18) 计算值:m/z=407。实测值:m/z=407。
分析口服CBD施用的动物的大肠内容物表明存在CBD的羟基代谢物:
[CBD*2OH+甲酸–H]和[2CBD*3OH+乙酸–H]MS数据:LC/ESI-LRMS. [M*2OH+甲酸–H]-(C22H31O6 -)计算值:m/z=391。实测值:m/z=391。[2M*3OH +乙酸–H]-(C44H63O12 -)计算值:m/z=783.9。实测值:m/z=784。
还提取来自相同动物的血浆和脑并通过HPLC分析CBD-糖苷和CBD的存在。CBD仅存在于接受CBD糖苷配基的对照动物中(数据未显示)。还提取了来自相同动物的小肠内容物并通过HPLC分析了CBD-糖苷和CBD的存在,但在小肠中不存在CBD糖苷配基(数据未显示,与实施例11中所示的THC解耦数据一致)。大肠内容物中CBD糖苷配基的存在表明成功递送了CBD-糖苷,并且随后通过仅存在于大肠中的β-糖苷酶来水解糖苷。大肠中存在解偶联的CBD,但小肠中不存在,表明仅在转运至大肠时才发生糖苷解偶联。CBD解毒代谢物 CBD-2OH的存在也与CBD的递送和吸收进入CBD开始代谢的肠上皮相一致。该实施例说明了施用CBD-糖苷的潜力,安全地将CBD-糖苷无吸收地转移通过小肠,转移到大肠,糖可以在大肠中解耦联以在局部释放CBD,避免了全身吸收并将CBD递送到其他组织,在其他组织中它可能会有不良影响。
实施例11:施用THC-糖苷时大肠内容物的分析
为了研究THC-糖苷在大肠中的代谢和解偶联,通过口服灌胃向两只小鼠使用呢THC-糖苷混合物的水溶液。第一只动物在2小时处死,第二只动物在4小时处死。终止和组织收获后,然后提取肠内容物并通过C18反相HPLC分析。在该实施例中使用的小鼠是在施用溶液前禁食12小时的八周大的雄性瑞士小鼠。
在与实施例10中使用的相同条件下,通过LCMS分析所得提取物。
在2小时后分析来自施用THC糖苷的小鼠的大肠内容物,结果表明THC 糖苷配基和THC糖苷都与各自的羟基代谢物一起存在:
[THC–H]、[THC*OH–H],[2THC*3OH+乙酸-H]和[THC*2OH+甲酸– H]MS数据:LC/ESI-LRMS.[M–H]-(C21H29O2)计算值:m/z=313。实测值: m/z=313。[M*OH–H]-(C21H29O3)计算值:m/z=329。实测值:m/z=329。[2M*3OH +乙酸–H]-(C44H63O12 -)计算值:m/z=783.9。实测值:m/z=783。[M*2OH+甲酸–H]-(C22H31O6 -)计算值:m/z=391。实测值:m/z=391。
[THCg1+Cl]、[THCg1+乙酸–H],[2THCg1–H]和[2THCg1+乙酸-H] MS数据:LC/ESI-LRMS。[Mg1+Cl]-(C27H40O7Cl-)计算值:m/z=511。实测值: m/z=511。[Mg1+乙酸-H]-(C29H43O9 -)计算值:m/z=535。实测值:m/z=535. [2Mg1–H]-(C54H79O14)计算值:m/z=951。实测值:m/z=951.[2Mg1+乙酸–H]- (C56H83O16 -)计算值:m/z=1011。实测值:m/z=1011。
[THCg2–H]、[THCg2+乙酸–H]和[THCg2*OH+甲酸-H]MS数据: LC/ESI-LRMS。[Mg2–H]-(C33H49O12)计算值:m/z=637。实测值:m/z=637。 [Mg2+乙酸–H]-(C35H53O14 -)计算值:m/z=697。实测值:m/z=697。[Mg2*OH+ 乙酸–H]-(C34H51O15 -)计算值:m/z=699。实测值:m/z=699。
[THCg3–H]、[THCg3+乙酸–H],[CBDg3*OH–H]和[CBDg3*OH–2H] MS数据:LC/ESI-LRMS。[Mg3–H]-(C39H59O17)计算值:m/z=799。实测值:m/z =799。[Mg3+乙酸–H]-(C41H63O19 -)计算值:m/z=859。实测值:m/z=859. [Mg3*OH–H]-(C39H59O18 -)计算值:m/z=815。实测值:m/z=815.[Mg3*OH– 2H]-2(C39H58O18 2-)计算值:m/z=407。实测值:m/z=407。
4小时后对THC糖苷混合物提取物的分析表明THC糖苷配基和THC糖苷都与各自的羟基代谢物一起被证实:
[THC–H]、[THC*OH+乙酸–H]、[2THC*3OH+乙酸-H]和[THC*2OH+ 甲酸–H]MS数据:LC/ESI-LRMS。[M–H]-(C21H29O2)计算值:m/z=313。实测值:m/z=313。[M*OH+乙酸–H]-(C23H33O5 -)计算值:m/z=389。实测值: m/z=389。[2M*3OH+乙酸–H]-(C44H63O12 -)计算值:m/z=783.9。实测值:m/z =784。[M*2OH+甲酸–H]-(C22H31O6 -)计算值:m/z=391。实测值:m/z=391。 [THCg1+Cl]、[THCg1+乙酸–H]、[2THCg1–H]和[2THCg1+乙酸-H] MS数据:LC/ESI-LRMS.[Mg1+Cl]-(C27H40O7Cl-)计算值:m/z=511。实测值: m/z=511。[Mg1+乙酸-H]-(C29H43O9 -)计算值:m/z=535。实测值:m/z=535。 [2Mg1–H]-(C54H79O14)计算值:m/z=951。实测值:m/z=951.[2Mg1+乙酸–H]- (C56H83O16 -)计算值:m/z=1011。实测值:m/z=1011。
[THCg2-H]和[THCg2+乙酸–H]MS数据:LC/ESI-LRMS。[Mg2–H]- (C33H49O12)计算值:m/z=637。实测值:m/z=637.。[Mg2+乙酸–H]-(C35H53O14 -) 计算值:m/z=697。实测值:m/z=697。
[THCg3–H]、[THCg3+乙酸–H]、[CBDg3*OH–H]、[CBDg3*OH–2H] 和[CBDg3*OH+乙酸–2H]MS数据:LC/ESI-LRMS。[Mg3–H]-(C39H59O17)计算值:m/z=799。实测值:m/z=799。[Mg3+乙酸–H]-(C41H63O19 -)计算值: m/z=859。实测值:m/z=859.[Mg3*OH–H]-(C39H59O18 -)计算值:m/z=815。实测值:m/z=815。[Mg3*OH–2H]-2(C39H58O18 2-)计算值:m/z=407。实测值: m/z=407.[Mg3*OH+乙酸–2H]-2(C41H62O20 2-)计算值:m/z=467。实测值: m/z=467。
还提取来自相同动物的血浆和脑并通过HPLC分析THC-糖苷和THC的存在,但在这些组织中未见到化合物(数据未显示)。还提取了来自相同动物的小肠内容物并通过HPLC分析THC-糖苷和THC的存在,但未观察到THC糖苷配基(数据未显示,与实施例10中所示的CBD脱偶联数据一致)。在2小时和4 小时时THC糖苷配基在大肠内容物中的存在表明THC糖苷的成功递送以及其随后在大肠中通过β-糖苷酶将糖苷水解。在大肠中存在解偶联的THC,但小肠中不存在,表明糖苷解耦联仅在转运至大肠时发生。THC解毒代谢物在大肠中的存在进一步证明了THC糖苷配基存在并被开始代谢的肠上皮吸收。该实施例说明了口服施用THC-糖苷的潜力,将THC-糖苷无吸收地转移通过小肠,转运到大肠,糖可以在大肠中解耦联以在局部释放THC,避免了全身性吸收,并将 THC递送至其他组织,在其他组织中它可能有不必要的精神作用。
实施例12:从甜叶菊中发现新的蔗糖合成酶同种型
许多研究小组已经利用简单的UDP至UDPG回收系统来减少产品形成所需的UDPG的量(Hardin 2004,Bungarang 2013)。这些研究已经表征了在叶组织中发现的初级蔗糖合成酶的同种型,其可能通过使果糖与UDPG反应,产生蔗糖和消耗的UDP来进行蔗糖的合成。
由于已知植物含有许多蔗糖合成酶的同种型,因此从甜叶菊植物中鉴定具有增强的对UDP+蔗糖→UDPG+果糖的反向反应的活性的替代SUS酶。由于甜叶菊糖苷在甜叶菊叶中以高水平出现,因此假定来自甜叶菊叶的蔗糖合成酶将具有提高的能够催化将UDP再循环至UDPG的反向反应的能力。在甜叶菊转录组内鉴定了六种蔗糖合成酶同种型,均与拟南芥中发现并与其同源物一起命名的6种同种型具有类似的同源性。如材料和方法中所述用这里列出的相应序列 ID信息克隆这些转录物。
测试了酶活性并分析了它们在UDPG输入减少的情况下增加UGT反应的能力。最佳同种型SrSUS4能够将UDP再循环至含有蔗糖的UDPG,与甜菊醇19-O- 葡糖基转移酶SrUGT74G1介导的甜菊醇生物糖苷向甜菊糖苷的糖基化一致。
进行靶向诱变以突变N末端的丝氨酸残基,其通常在植物中被磷酸化以防止二聚化(Hardin 2004)。SrSUS1-S13D突变体通过将13位的丝氨酸突变为天冬氨酸残基(S13D)而形成,从而形成磷酸模拟蛋白。此外,创建了 SrSus1-S13R,L14I,以用精氨酸(一种大的带电残基)取代丝氨酸,还防止酶的二聚化和失活。与其天然对应物相比,蔗糖合成酶突变体显示出改善的UDPG 生产活性。在甜菊转录组和设计的引物(SEQ ID NO.67和68)中鉴定了SrSUS5 (SEQ ID NO.19和20),但不能从cDNA扩增。SrSus4显示出一个令人印象深刻的UDPG回收活动,比SrSus1中看到的活性提高了20%。提出SrSus4是在蔗糖存在下进行将UDP转化为UDPG的反向反应的理想同种型。为了大规模纯化大麻素糖苷,使用C18快速色谱柱。洗涤带有33g树脂的Biotage快速C18 柱,上样,洗涤并使用蠕动泵洗脱,以达到与先前列出的与重力进料Hypersep 柱相似的分离和纯化。
用SUS同种型产生UDPG的相对活性如下:
SrSus4>SrSus1-未带标签>SrSus6>SrSus2>SrSus1>6xHis-SrSus1>SrSus3
实施例13:大麻素-糖苷的改善的体外催化性
由于通过UGT酶形成大麻素糖苷需要化学计量的核苷酸糖供体UDPG,因此在糖基化反应后再循环或重新夺回用过的UDP是有利的。利用来自甜叶菊的 SUS4亚型,仅使用UMP作为输入核苷酸成功生产了大麻素糖苷。
发生两步反应,首先从UMP产生UDP,然后与UGT反应一起从UDP产生UDPG。首先,制备含有50mM KPO4pH7.2、200mM UMP二钠盐、200mM ATP 二钠盐、1M MgCl2、10%UMPK重组酶在50%甘油中的5L反应物。将反应物在28℃下搅拌孵育>24小时。将5L反应物1用0.45微米过滤以去除沉淀物,然后施加到含有50mM KPO4pH7.2、50mM MgCl2、300mM蔗糖、在200mlDMSO中的200mg CBD、在50%甘油中的5L UGT76G1、在50%甘油中的2.5L SrSUS4的50L反应物中。然后将主要的50L反应物混合并使其反应。反应完成后,再加入在200ml DMSO中的200mg CBD,并在相同条件下继续孵育。在剩余的CBD被反应消耗之后,通过使用5kDa的超滤膜的切向流过滤来过滤混合物以除去酶和颗粒物,然后使用500Da的纳滤膜进行浓缩。然后将含有大麻糖苷的纳滤渗余物施加到水合的C18闪蒸柱,用10-30%甲醇洗涤,并用40-65%甲醇洗脱。然后通过旋转蒸发浓缩洗脱液以除去所有溶剂,在真空烧杯中壳冷冻并冻干至干燥。然后收集所产生的粉末状大麻糖苷并在-20℃密封小瓶中储存。蔗糖应无菌过滤,以避免焦糖化或糖分解,因为高压灭菌蔗糖储备溶液大大降低了反应活性。
显而易见的是,本发明的前述实施方案是示例并且可以以多种方式变化。这样的现在或将来的变化不被认为是脱离本发明的精神和范围,并且对于本领域技术人员而言显而易见的所有这样的修改意图被包括在以下权利要求的范围内。
参考文献
Bartzokis G.(2004).Age-related myelin breakdown:a developmental modelof cognitive decline and Alzheimer′s disease.Neurobiology of Aging.25:5-18.
Bisogno T,et al.(2001)Molecular targets for cannabidiol and itssynthetic analogues: effect on vanilloid VR1receptors and on the cellularuptake and enzymatic hydrolysis of anandamide.British Journal ofPharmacology.134,845-852.
Chen Q,et al.(2009).Synthesis,in vitro and in vivo characterizationof glycosyl derivatives of ibuprofen as novel prodrugs for brain drugdelivery.J Drug Targeting. 17(4):318-328.
Conchie J.,Findlay J.,Levvy GA.(1958).Mammalian Glycosidases,Distribution in the body.Biochem J.71(2):318-325.
De Petrocellis L,et al.(2011)Effects of cannabinoids and cannabinoid-enriched Cannabis extracts on TRP channels and endocannabinoid metabolicenzymes.British Journal of Pharmacology.163,1479-1494.
Dewitte G,et al.(2016)Screening of Recombinant GlycosyltransferasesReveals the Broad acceptor Specificity of Stevia UGT-76G1.Journal ofBiotechnology.Accepted Manuscript,DOI:http://dx.doi.org/doi:10.1016/j.jbiotec.2016.06.034.
Friend DR.,Chang GW.(1984).A Colon-Specific Drug-Delivery SystemBased on Drug Glycosides and the Glycosidases of the Colonic Bacteria.J MedChem. 27:261-266.
Friend DR.,Chang GW.(1985).Drug Glycosides:Potential Prodrugs forColon-Specific Drug Delivery.J Med Chem.28:51-57.
Gomez O.,Arevalo-Martin A.,Garcia-Ovejero D.,Ortega-Gutierrez S.,Cisneros JA., Almazan G,Sanchez-Rodriguez MA.,Molina-Holgado F.,Molina-Holgado E.(2010). The Constitutive Production of the Endocannabinoid 2-Arachidonoylglycerol Participates in Oligodendrocyte Differentiation.Glia.58:1913-1927.
Iuvone T.,Esposito G.,De Filippis D.,Scuderi C.,Steardo L.(2009).Cannabidiol:a promising drug for neurodegenerative disorders?CNS NeurosciTher.15(1):65-75.
Jarh,P.,Pate DW.,Brenneisen R.,Jarvinen T.(1998). Hydroxypropyl-beta-cyclodextrin and its combination with hydroxypropyl-methylcellulose increasesaqueous solubility of delta9-tetrahydrocannabinol.Life Sci.63(26):PL381-384.
Jiang R,et al.(2011)Identification of cytochrome P450 enzymesresponsible for metabolism of cannabidiol by human liver microsomes.LifeSciences.89,165-170. Kren V(2008)Glycoside vs.Aglycon:The Role of GlycosidicResidue in Biologic Activity.Glycoscience.pp2589-2644.
Kren V,Rezanka T(2008)Sweet antibiotics–the role of glycosidicresidues in antibiotic and antitumor activity and their randomization.FEMSMicrobiol Rev.32, 858-889.
Li S.,Li W.,Xiao Q.,Xia Y.(2012).Transglycosylation of stevioside toimprove the edulcorant quality by lower substitution using cornstarchhydrolyzate and CGTase.J Food Chem.138(2013):2064-2069.
Mazur A.,et al.(2009).Characterization of Human Hepatic andExtrahepatic UDP-Glucuronosyltransferase Enzymes Involved in the Metabolismof Classic Cannabinoids.Drug Metabolism and Disposition.37(7):1496-1504.
Mecha M.,Torrao AS.,Mestre L.,Carrillo-Salinas FJ.,Mechoulam R.,GuazaC. (2012).Cannabidiol protects oligodendrocyte progenitor cells frominflammation-induced apoptosis by attenuating endoplasmic reticulumstress.Cell Death and Disease.3(e331).
Mechoulam R.,Parker LA.,Gallily R.(2002).Cannabidiol:An Overview ofSome Pharmacological Aspects.42(S1):11S-19S.
Mighdoll MI.,Tao R.,Kleinman JE.,Hyde TM.(2015).Myelin,myelin-relateddisorders,and psychosis.Schizophr Res.161(1):85-93.
Molina-Holgado E.,Vela JM.,Arevalo-Martin A.,Almazan G.,Molina-Holgado F., Borrell J.,Guaza C.(2002).Cannabinoids Promote OligodendrocyteProgenitor Survival:Involvement of Cannavinoid Receptors andPhosphatidylinositol-3-Kinase/Akt Signaling.J.Neurosci.22(22):9742-9753.
Noguchi A,et al.(2009).Identification of an inducibleglucosyltransferase from Phytolacca americana L.cells that are capable ofglucosylating capsiacin.Plant Biotechnology.26,285-292.
Pacher P,et al.(2006)The endocannabinoid system as an emerging targetof pharmacotherapy.Pharmacology Review.58(3),389-462.
Richman A.,Swanso,A.,Humphrey T.,Chapman R.,McGarvey B.,Pocs R.,Brandle J.(2005).Functional genomics uncovers three glucosyltransferasesinvolved in the synthesis of the major sweet glucosides of Steviarebaudiana.Plant J.41(1):56-67.
Russo E.,Guy,GW.(2006)A tale of two cannabinoids:the therapeuticrationale for combining tetrahydrocannabinol and cannabidiol.MedicalHypotheses.66(2):234-46.
Tanaka H.,et al.(1993).Cannabis,21.1 Biotransformation of cannabinolto its glycosides by in vitro plant tissue.Journal of Natural Products.56(12):2068-2072.
Tanaka H.,et al.(1996).Cannabis 25,biotransformation of cannabidioland cannabidiolic acid by Pinellia ternata tissue segments.Plant CellReports. 15:819-823.
Terao J.,Murota K.,Kawai Y.(2011).Conjugated quercetin glucuronidesas bioactive metabolites and precursors of aglycone in vivo.Food Function.2:11-17.
Thomas A.,et al.(2007)Cannabidiol displays unexpectedly high potencyas an antagonist of CB1 and CB2 receptor agonists in vitro.British Journal ofPharmacology.150,613-623.
US Patent 8,410,064 B2.2013.Classical cannabinoid metabolites andmethods of use thereof.
US Patent 8,227,627 B2.2012.Prodrugs of tetrahydrocannabinol,compositions comprising prodrugs of tetrahyrocannabinol and methods of usingthe same.
Watanabe K,et al.(1998)Distribution and characterization ofanandamide amidohydrolase in mouse brain and liver.Life Sciences.62(14),1223-1229.
WO2009018389 A4.2009.Prodrugs of cannabidiol,compositions comprisingprodrugs of cannabidiol and methods of using the same.
WO2012011112 A1.2011.Non psychoactive cannabinoids and uses thereof.
WO 2014108899 A1.2014.Fluorinated CBD compounds,compositions and usesthereof.
Yamaori S,et al.(2011)Potent inhibition of human cytochrome P450 3Aisoforms by cannabidiol:Role of phenolic hydroxyl groups in the resorcinolmoiety.Life Sciences, 88,730-736.
Zuardi AW,et al.(2012).A Critical Review of the Antipyschotic Effectsof Cannabidiol:30 Years of a Translational Investigation.CurrentPharmaceutical Design,18,5131-5140。
序列表
<110> 活力生物制药有限公司
Vitality Biopharma, Inc.
<120> TBD
<130> 3334-103DR
<160> 34
<170> PatentIn版本3.5
<210> 1
<211> 458
<212> PRT
<213> 甜叶菊
<400> 1
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 2
<211> 1377
<212> DNA
<213> 甜叶菊
<400> 2
atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60
ccatttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctctaaagga 120
ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180
ttcactttca gattcatcct cgacaacgac ccacaagacg aacgcatttc caatctaccg 240
actcatggtc cgctcgctgg tatgcggatt ccgattatca acgaacacgg agctgacgaa 300
ttacgacgcg aactggaact gttgatgtta gcttctgaag aagatgaaga ggtatcgtgt 360
ttaatcacgg atgctctttg gtacttcgcg caatctgttg ctgacagtct taacctccga 420
cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480
tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540
gggtttccta tgctaaaagt gaaagacatc aagtctgcgt attcgaactg gcaaatactc 600
aaagagatat tagggaagat gataaaacaa acaagagcat cttcaggagt catctggaac 660
tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720
agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780
gatcgaaccg tttttcaatg gttagaccaa caaccgccaa gttcggtact gtatgttagt 840
tttggtagta ctagtgaagt ggatgagaaa gatttcttgg aaatagctcg tgggttggtt 900
gatagcaagc agtcgttttt atgggtggtt cgacctgggt ttgtcaaggg ttcgacgtgg 960
gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttcca 1020
cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080
tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggattt tgggctcgat 1140
caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200
gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260
gaatacatta gacagaatgc aagagttttg aaacaaaagg cagatgtttc tttgatgaag 1320
ggtggttcgt cttacgaatc attagagtct ctagtttctt acatttcatc gttgtaa 1377
<210> 3
<211> 467
<212> PRT
<213> 人工序列
<220>
<223> 在N末端具有6x组氨酸标签的UGT76G1
<400> 3
Met His His His His His His Gly Ser Gly Glu Asn Lys Thr Glu Thr
1 5 10 15
Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln
20 25 30
Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys
35 40 45
Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr
50 55 60
Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro
65 70 75 80
Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly
85 90 95
Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg
100 105 110
Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser
115 120 125
Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp
130 135 140
Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn
145 150 155 160
Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu
165 170 175
Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro
180 185 190
Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln Ile
195 200 205
Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser Ser
210 215 220
Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu Glu
225 230 235 240
Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu Pro
245 250 255
Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg Thr
260 265 270
Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr Val
275 280 285
Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu Ile
290 295 300
Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe Leu Trp Val Val Arg
305 310 315 320
Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu Pro Leu Pro Asp Gly
325 330 335
Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp Val Pro Gln Gln Glu
340 345 350
Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp Thr His Ser Gly Trp
355 360 365
Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val Pro Met Ile Phe Ser
370 375 380
Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp Val
385 390 395 400
Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu Ile
405 410 415
Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu Glu Gly Glu Tyr Ile
420 425 430
Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala Asp Val Ser Leu Met
435 440 445
Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr Ile
450 455 460
Ser Ser Leu
465
<210> 4
<211> 1404
<212> DNA
<213> 人工序列
<220>
<223> 为在毕赤酵母中表达而优化的编码SEQ ID NO:3密码子的序列
<400> 4
atgcaccacc atcaccacca tggttctggt gaaaacaaaa ctgaaactac tgttagaaga 60
agaagaagaa tcattttgtt tccagtacca tttcaaggcc atatcaatcc aattcttcaa 120
ttggccaatg ttttgtactc caaaggattc tccatcacca tttttcacac caatttcaac 180
aaaccaaaga cttccaacta tcctcacttc actttcagat ttattttgga taatgatcct 240
caagatgaaa gaatttccaa tcttccgact catggtcctt tggctggtat gagaattcca 300
atcatcaatg aacatggtgc tgatgaatta agaagagaat tggaactttt gatgttggct 360
tctgaagaag atgaagaagt ttcatgttta atcactgatg ctttatggta ttttgctcaa 420
tctgttgctg attctttgaa tttgcgacgg ttggttttga tgacttcttc tttgttcaac 480
tttcatgctc atgtttcttt acctcagttt gatgaacttg gatatttgga tccagatgac 540
aaaactagat tggaagaaca agctagtggg tttcctatgt tgaaagtcaa agatatcaaa 600
tctgcttact ccaactggca aattctcaaa gaaattttgg gaaaaatgat caaacaaaca 660
aaagcttctt ctggagtcat ttggaactca ttcaaagaat tggaagaatc tgaattggaa 720
actgttatta gagaaattcc tgctccaagt tttttgattc ctttgccaaa acatttgact 780
gcttcttctt cttctttatt ggatcacgat agaactgttt ttcaatggtt agatcaacaa 840
cctccatctt ctgttttgta tgttagtttt ggatctactt ctgaagttga tgaaaaagat 900
tttttggaaa ttgctagagg tttggttgat tccaaacaaa gttttttatg ggttgttaga 960
ccaggatttg tcaaaggatc tacttgggtc gaacctttgc cagatggatt tttgggagaa 1020
agaggaagaa ttgtcaaatg ggttccacag caagaagttt tggctcatgg tgctattggt 1080
gctttttgga ctcattctgg atggaactct actttggaat ctgtttgtga aggtgttcca 1140
atgatttttt ctgattttgg tttggatcaa ccattgaatg ctagatacat gtctgatgtt 1200
ttgaaagttg gtgtttattt ggaaaatggg tgggaaagag gtgaaattgc caatgctatt 1260
agaagagtca tggttgatga agaaggagaa tacattagac aaaatgctag agttttgaaa 1320
caaaaagctg atgtttcttt gatgaagggt ggatcttctt atgaatcttt ggaatctttg 1380
gtttcttaca tttcttctct ttaa 1404
<210> 5
<211> 468
<212> PRT
<213> 人工序列
<220>
<223> 在N末端具有6x组氨酸-谷氨酰胺标签的UGT76G1
<400> 5
Met His Gln His Gln His Gln Ser Gly Ser Met Glu Asn Lys Thr Glu
1 5 10 15
Thr Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe
20 25 30
Gln Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser
35 40 45
Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys
50 55 60
Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp
65 70 75 80
Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala
85 90 95
Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg
100 105 110
Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val
115 120 125
Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala
130 135 140
Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe
145 150 155 160
Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr
165 170 175
Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe
180 185 190
Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln
195 200 205
Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser
210 215 220
Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu
225 230 235 240
Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu
245 250 255
Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg
260 265 270
Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr
275 280 285
Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu
290 295 300
Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe Leu Trp Val Val
305 310 315 320
Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu Pro Leu Pro Asp
325 330 335
Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp Val Pro Gln Gln
340 345 350
Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp Thr His Ser Gly
355 360 365
Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val Pro Met Ile Phe
370 375 380
Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp
385 390 395 400
Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu
405 410 415
Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu Glu Gly Glu Tyr
420 425 430
Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala Asp Val Ser Leu
435 440 445
Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr
450 455 460
Ile Ser Ser Leu
465
<210> 6
<211> 1407
<212> DNA
<213> 人工序列
<220>
<223> 为在毕赤酵母中表达而优化的编码SEQ ID NO:5密码子的序列
<400> 6
atgcatcaac atcaacacca atctggatct atggagaaca agaccgagac tacagttaga 60
agaagaagaa gaataatcct gtttccagta ccattccaag gacacatcaa cccaatcttg 120
cagttagcaa atgtacttta ttctaaaggc tttagtatta cgatttttca cactaatttt 180
aataagccaa aaacatccaa ttaccctcac ttcacattca gatttatctt ggataacgat 240
cctcaagatg aacgtatctc caacctgcca acacatggac cattggccgg tatgcgtatt 300
cctataatca acgagcatgg tgctgatgag cttagacgtg aactggaact gttgatgctg 360
gcatcggagg aagatgaaga ggttagttgc ttgataacgg atgccctctg gtatttcgca 420
caatcagtcg ctgactcctt gaaccttagg agattggtat tgatgactag ttcgttgttc 480
aacttccatg cccatgtttc tttgcctcaa tttgatgagc tgggttattt ggatcctgac 540
gataagactc gtttagaaga acaggcgtca ggcttcccca tgttaaaggt taaagatatt 600
aagtccgcct attctaactg gcaaattctc aaagagattc tagggaaaat gattaaacaa 660
accaaggcct cttcaggagt aatctggaac agtttcaaag aactagaaga atccgagttg 720
gaaactgtta ttcgtgaaat ccctgctcca tctttcctta tcccattacc aaagcacctc 780
actgcctcct ctagttctct tctggaccat gatagaacag tctttcagtg gctcgatcag 840
caacctccat cttctgtctt gtacgttagt tttggttcca cctcggaagt agatgaaaaa 900
gactttctgg aaattgctcg aggactagtt gactccaagc aatcctttct gtgggttgtt 960
agacctggat tcgtaaaagg atccacctgg gtagaacccc tcccagatgg atttttgggc 1020
gaaaggggaa gaattgttaa atgggtgcct caacaagaag ttttagctca tggggccatt 1080
ggagcttttt ggactcatag tggatggaat tctaccttag aatctgtttg tgaaggagtt 1140
ccaatgattt tttctgattt tggattggat cagcctctta atgccagata tatgtccgat 1200
gtcctcaagg tcggagtgta cctggaaaat ggttgggaga gaggtgagat tgcaaatgct 1260
atacgtagag tcatggttga tgaagagggc gagtatatta gacaaaacgc tagagtgcta 1320
aagcagaagg ccgatgtttc ccttatgaag gggggaagtt catatgagag tttggaatcc 1380
ctagtgtcct acatttcttc gctataa 1407
<210> 7
<211> 466
<212> PRT
<213> 人工序列
<220>
<223> 在C末端具有6x组氨酸标签的UGT76G1
<400> 7
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser His His His His
450 455 460
His His
465
<210> 8
<211> 1401
<212> DNA
<213> 人工序列
<220>
<223> 为在大肠杆菌(Escherichia coli)中表达而优化的编码SEQ ID NO:7密码子的序列
<400> 8
atggaaaata aaaccgaaac caccgtccgt cgccgtcgtc gtatcattct gttcccggtc 60
ccgttccaag gtcacatcaa cccgattctg cagctggcca acgtgctgta tagcaaaggt 120
ttctctatca ccatcttcca tacgaacttc aacaaaccga aaacctctaa ctacccgcac 180
tttacgttcc gttttattct ggataacgac ccgcaggatg aacgcatcag taatctgccg 240
acccatggtc cgctggcggg tatgcgtatt ccgattatca acgaacacgg cgcagatgaa 300
ctgcgtcgcg aactggaact gctgatgctg gcctctgaag aagatgaaga agttagttgc 360
ctgatcaccg acgcactgtg gtattttgcc cagagtgttg cagattccct gaacctgcgt 420
cgcctggtcc tgatgacgag ctctctgttc aattttcatg cccacgtttc cctgccgcag 480
ttcgatgaac tgggttatct ggacccggat gacaaaaccc gcctggaaga acaagcttca 540
ggctttccga tgctgaaagt caaagatatt aaaagtgcgt actccaactg gcagattctg 600
aaagaaatcc tgggtaaaat gatcaaacaa acccgtgcaa gttccggcgt catctggaat 660
tccttcaaag aactggaaga atcagaactg gaaacggtga ttcgcgaaat cccggctccg 720
tcttttctga ttccgctgcc gaaacatctg accgcgtcat cgagctctct gctggatcac 780
gaccgtacgg tgtttcagtg gctggatcag caaccgccga gttccgtgct gtacgttagc 840
ttcggtagca cctctgaagt ggatgaaaaa gactttctgg aaatcgctcg tggcctggtt 900
gattcaaaac aatcgttcct gtgggtggtt cgcccgggtt ttgtgaaagg cagcacgtgg 960
gttgaaccgc tgccggatgg cttcctgggt gaacgtggtc gcattgtcaa atgggtgccg 1020
cagcaagaag tgctggcaca tggtgctatc ggcgcgtttt ggacccactc aggttggaac 1080
tcgacgctgg aaagcgtttg tgaaggtgtc ccgatgattt tctcggattt tggcctggac 1140
cagccgctga atgcacgtta tatgagcgat gttctgaaag tcggtgtgta cctggaaaac 1200
ggttgggaac gcggcgaaat tgcgaatgcc atccgtcgcg ttatggtcga tgaagaaggc 1260
gaatatatcc gtcagaatgc tcgcgtcctg aaacaaaaag cggacgttag tctgatgaaa 1320
ggcggttcat cgtacgaatc cctggaatca ctggtctcct acatttcttc tctgggctcg 1380
catcatcatc atcatcatta a 1401
<210> 9
<211> 472
<212> PRT
<213> 稻(Oryza sativa)
<400> 9
Met His Gln His Gln His Gln Ser Gly Ser Met Asp Ser Gly Tyr Ser
1 5 10 15
Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val Ile Cys Pro Trp
20 25 30
Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu Ala Gln Arg Leu
35 40 45
Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile
50 55 60
Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro Leu Val Ala Phe
65 70 75 80
Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro Asp Gly Ala Glu
85 90 95
Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met Val Glu Leu His
100 105 110
Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe Leu Gly
115 120 125
Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val Phe His His Trp Ala
130 135 140
Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala Met Met Leu Leu
145 150 155 160
Gly Ser Ala His Met Ile Ala Ser Ile Ala Asp Arg Arg Leu Glu Arg
165 170 175
Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly Arg Pro Ala Ala
180 185 190
Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile Arg Thr Lys Gly
195 200 205
Ser Ser Gly Met Ser Leu Ala Glu Arg Phe Ser Leu Thr Leu Ser Arg
210 215 220
Ser Ser Leu Val Val Gly Arg Ser Cys Val Glu Phe Glu Pro Glu Thr
225 230 235 240
Val Pro Leu Leu Ser Thr Leu Arg Gly Lys Pro Ile Thr Phe Leu Gly
245 250 255
Leu Met Pro Pro Leu His Glu Gly Arg Arg Glu Asp Gly Glu Asp Ala
260 265 270
Thr Val Arg Trp Leu Asp Ala Gln Pro Ala Lys Ser Val Val Tyr Val
275 280 285
Ala Leu Gly Ser Glu Val Pro Leu Gly Val Glu Lys Val His Glu Leu
290 295 300
Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe Leu Trp Ala Leu Arg
305 310 315 320
Lys Pro Thr Gly Val Ser Asp Ala Asp Leu Leu Pro Ala Gly Phe Glu
325 330 335
Glu Arg Thr Arg Gly Arg Gly Val Val Ala Thr Arg Trp Val Pro Gln
340 345 350
Met Ser Ile Leu Ala His Ala Ala Val Gly Ala Phe Leu Thr His Cys
355 360 365
Gly Trp Asn Ser Thr Ile Glu Gly Leu Met Phe Gly His Pro Leu Ile
370 375 380
Met Leu Pro Ile Phe Gly Asp Gln Gly Pro Asn Ala Arg Leu Ile Glu
385 390 395 400
Ala Lys Asn Ala Gly Leu Gln Val Ala Arg Asn Asp Gly Asp Gly Ser
405 410 415
Phe Asp Arg Glu Gly Val Ala Ala Ala Ile Arg Ala Val Ala Val Glu
420 425 430
Glu Glu Ser Ser Lys Val Phe Gln Ala Lys Ala Lys Lys Leu Gln Glu
435 440 445
Ile Val Ala Asp Met Ala Cys His Glu Arg Tyr Ile Asp Gly Phe Ile
450 455 460
Gln Gln Leu Arg Ser Tyr Lys Asp
465 470
<210> 10
<211> 1419
<212> DNA
<213> 稻
<400> 10
atgcatcagc accaacatca gagcggttct atggactccg gctactcctc ctcctacgcc 60
gccgccgccg ggatgcacgt cgtgatctgc ccgtggctcg ccttcggcca cctgctcccg 120
tgcctcgacc tcgcccagcg cctcgcgtcg cggggccacc gcgtgtcgtt cgtctccacg 180
ccgcggaaca tatcccgcct cccgccggtg cgccccgcgc tcgcgccgct cgtcgccttc 240
gtggcgctgc cgctcccgcg cgtcgagggg ctccccgacg gcgccgagtc caccaacgac 300
gtcccccacg acaggccgga catggtcgag ctccaccgga gggccttcga cgggctcgcc 360
gcgcccttct cggagttctt gggcaccgcg tgcgccgact gggtcatcgt cgacgtcttc 420
caccactggg ccgcagccgc cgctctcgag cacaaggtgc catgtgcaat gatgttgttg 480
ggctctgcac atatgatcgc ttccatagca gacagacggc tcgagcgcgc ggagacagag 540
tcgcctgcgg ctgccgggca gggacgccca gcggcggcgc caacgttcga ggtggcgagg 600
atgaagttga tacgaaccaa aggctcatcg ggaatgtccc tcgccgagcg cttctccttg 660
acgctctcga ggagcagcct cgtcgtcggg cggagctgcg tggagttcga gccggagacc 720
gtcccgctcc tgtcgacgct ccgcggtaag cctattacct tccttggcct tatgccgccg 780
ttgcatgaag gccgccgcga ggacggcgag gatgccaccg tccgctggct cgacgcgcag 840
ccggccaagt ccgtcgtgta cgtcgcgcta ggcagcgagg tgccactggg agtggagaag 900
gtccacgagc tcgcgctcgg gctggagctc gccgggacgc gcttcctctg ggctcttagg 960
aagcccactg gcgtctccga cgccgacctc ctccccgccg gcttcgagga gcgcacgcgc 1020
ggccgcggcg tcgtggcgac gagatgggtt cctcagatga gcatactggc gcacgccgcc 1080
gtgggcgcgt tcctgaccca ctgcggctgg aactcgacca tcgaggggct catgttcggc 1140
cacccgctta tcatgctgcc gatcttcggc gaccagggac cgaacgcgcg gctaatcgag 1200
gcgaagaacg ccggattgca ggtggcaaga aacgacggcg atggatcgtt cgaccgagaa 1260
ggcgtcgcgg cggcgattcg tgcagtcgcg gtggaggaag aaagcagcaa agtgtttcaa 1320
gccaaagcca agaagctgca ggagatcgtc gcggacatgg cctgccatga gaggtacatc 1380
gacggattca ttcagcaatt gagatcttac aaggattga 1419
<210> 11
<400> 11
000
<210> 12
<400> 12
000
<210> 13
<211> 460
<212> PRT
<213> 甜叶菊
<400> 13
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 14
<211> 1383
<212> DNA
<213> 甜叶菊
<400> 14
atggcggaac aacaaaagat caagaaatca ccacacgttc tactcatccc attcccttta 60
caaggccata taaacccttt catccagttt ggcaaacgat taatctccaa aggtgtcaaa 120
acaacacttg ttaccaccat ccacacctta aactcaaccc taaaccacag taacaccacc 180
accacctcca tcgaaatcca agcaatttcc gatggttgtg atgaaggcgg ttttatgagt 240
gcaggagaat catatttgga aacattcaaa caagttgggt ctaaatcact agctgactta 300
atcaagaagc ttcaaagtga aggaaccaca attgatgcaa tcatttatga ttctatgact 360
gaatgggttt tagatgttgc aattgagttt ggaatcgatg gtggttcgtt tttcactcaa 420
gcttgtgttg taaacagctt atattatcat gttcataagg gtttgatttc tttgccattg 480
ggtgaaactg tttcggttcc tggatttcca gtgcttcaac ggtgggagac accgttaatt 540
ttgcagaatc atgagcaaat acagagccct tggtctcaga tgttgtttgg tcagtttgct 600
aatattgatc aagcacgttg ggtcttcaca aatagttttt acaagctcga ggaagaggta 660
atagagtgga cgagaaagat atggaacttg aaggtaatcg ggccaacact tccatccatg 720
taccttgaca aacgacttga tgatgataaa gataacggat ttaatctcta caaagcaaac 780
catcatgagt gcatgaactg gttagacgat aagccaaagg aatcagttgt ttacgtagca 840
tttggtagcc tggtgaaaca tggacccgaa caagtggaag aaatcacacg ggctttaata 900
gatagtgatg tcaacttctt gtgggttatc aaacataaag aagagggaaa gctcccagaa 960
aatctttcgg aagtaataaa aaccggaaag ggtttgattg tagcatggtg caaacaattg 1020
gatgtgttag cacacgaatc agtaggatgc tttgttacac attgtgggtt caactcaact 1080
cttgaagcaa taagtcttgg agtccccgtt gttgcaatgc ctcaattttc ggatcaaact 1140
acaaatgcca agcttctaga tgaaattttg ggtgttggag ttagagttaa ggctgatgag 1200
aatgggatag tgagaagagg aaatcttgcg tcatgtatta agatgattat ggaggaggaa 1260
agaggagtaa taatccgaaa gaatgcggta aaatggaagg atttggctaa agtagccgtt 1320
catgaaggtg gtagctcaga caatgatatt gtcgaatttg taagtgagct aattaaggct 1380
taa 1383
<210> 15
<211> 806
<212> PRT
<213> 甜叶菊
<400> 15
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Ser Thr Leu Ala Thr His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Val Met
35 40 45
Thr Glu Phe Glu Ala Ile Cys Lys Glu Asp Gln Ser Lys Leu Ser Asp
50 55 60
Gly Ala Phe Tyr Glu Val Leu Lys Cys Thr Gln Glu Ala Ile Val Gln
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val Asn Val Leu Val Val Glu Glu Leu Ser Val
100 105 110
Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Arg Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Asp Ser Met His
165 170 175
Pro Leu Leu Asp Phe Leu Arg Thr His His Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Leu Asn Ala Leu Gln Ser Val Leu
195 200 205
Arg Lys Ala Ser Glu Tyr Leu Ser Thr Leu Asp Ala Ala Thr Pro Tyr
210 215 220
Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Lys Ala Glu Val Val Met Glu Met Ile His Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ala Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Ile Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Ile Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Val Thr Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Trp Lys Asn Phe Glu Glu Lys Tyr His Phe Ser Ser Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Thr Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met
515 520 525
Gly Ile Tyr Tyr Ser Tyr Thr Glu Lys Glu Lys Arg Leu Thr Ala Leu
530 535 540
His Pro Glu Ile Asp Glu Leu Leu Phe Ser Ser Val Glu Asn Glu Glu
545 550 555 560
His Leu Cys Val Leu Lys Asp Lys Ser Lys Pro Ile Leu Phe Thr Met
565 570 575
Ala Arg Leu Asp Asn Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr
580 585 590
Ala Lys Asn Asp Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Gln Met
610 615 620
Gln Lys Met His Glu Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Val Ile Ala Asp Thr Arg Gly Ala Phe Ile Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Leu His Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Val Thr Glu
705 710 715 720
Leu Leu Val Asn Phe Phe Glu Lys Thr Lys Gln Asp Pro Gly His Trp
725 730 735
Glu Ala Ile Ser Lys Gly Gly Leu Gln Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Gly Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val
785 790 795 800
Pro Leu Ala Val Asp Glu
805
<210> 16
<211> 2421
<212> DNA
<213> 甜叶菊
<400> 16
atggcggaac gtgtactcac tcgtgttcac agtcttcgtg agcgtctcga ttcaactctc 60
gcaactcatc gtaatgaaat cctcttgttt ctttcaagga ttgaaagcca tggaaaagga 120
atattgaagc ctcatcaagt tatgactgaa tttgaagcta tctgcaaaga agatcagagc 180
aaactctctg atggtgcttt ttatgaagtt cttaaatgca cacaggaagc aatagtgcaa 240
cctccatggg ttgcactcgc gatccgtctt cgacccggtg tttgggaata tgttagagtc 300
aatgttaatg ttttggtggt tgaagaatta agtgttcctg aatatcttca cttcaaagaa 360
gaattggtta atggaacatc gaatggcaac ttcgtgttgg aactggattt tgaacctttt 420
accgcatcgt ttcctcgacc aactttaacc aagtctattg gtaatggtgt tgagtttcta 480
aacagacatt tatctgctaa aatgtttcat gataaggata gcatgcaccc tcttcttgat 540
ttcctacgga ctcaccacta taagggaaag acaatgatgt tgaatgatag aatccaaaac 600
ctcaatgctc tacaatcggt gttgcgaaag gcgtcagagt acttatcaac actcgacgca 660
gcaacaccgt actctgagtt tgaacataag tttcaagaaa tcgggttgga gagaggttgg 720
ggtgataaag cggaggtcgt aatggagatg atccacatgc ttctagacct tctagaagca 780
cccgacgcat gcacactcga gaagtttctc ggaagaatcc caatggtttt caatgttgtc 840
attctttcgc ctcacggcta cttcgcccaa gaaaatgtgt tgggatatcc cgacactggc 900
ggtcaggttg tttacatctt ggatcaagtt cccgctctgg aacgcgagat gctcaaaagg 960
attaaggagc aaggactcga tatcattcct cgtatattga ttgttacgag gcttcttccc 1020
gacgcggttg ggaccacatg cgggcaacgt ttagagaaag tgtttggagc cgaacactcg 1080
catattcttc gggtcccgtt tagaaccgaa aagggtattc ttcgtaaatg gatctctcgt 1140
tttgaggtgt ggccttacat cgagactttc accgaggatg ttgctaaaga agttacagca 1200
gagttgcaag caaaaccaga tttgatcatt ggaaactata gtgaaggaaa tttggttgca 1260
tctttgctag ctcacaagtt gggtgtcact cagtgtacca ttgctcatgc tttggagaaa 1320
actaaatacc cggattctga tatctactgg aagaactttg aggagaaata tcatttctct 1380
tcgcagttta ccgctgatct tatcgctatg aaccataccg acttcatcat caccagtact 1440
ttccaagaaa ttgctggaag taaggacacg gttggacagt acgagagtca taccgcgttc 1500
acaatgccgg gattgtatcg ggtggttcac gggatcgatg tttttgaccc caaattcaat 1560
attgtttcac ccggggccga tatgggaatt tactactcgt ataccgagaa agaaaagagg 1620
ctcactgcgc ttcaccctga aatcgatgaa cttctcttta gttccgtcga aaacgaagaa 1680
cacttatgtg tgttgaagga taagagtaaa ccaatcttgt tcacaatggc gcgattggat 1740
aatgtgaaga atttaaccgg actggttgaa tggtacgcta aaaacgaccg ccttcgtgag 1800
ctcgtgaacc tcgtggtcgt cggtggtgac cgaaggaaag agtcgaaaga tcttgaagaa 1860
caagctcaga tgcagaagat gcatgaactt atcgaaacct acaaactcaa cggtcagttc 1920
aggtggatat cctcacaaat gaaccgcgtg aggaacggtg agttgtatcg cgttattgct 1980
gacacacgag gtgcgtttat ccagcctgcg ttttacgagg cgtttgggtt gacggttgtg 2040
gaggccatga cttgtggcct gccgacattc gcgacacttc atggtgggcc cgctgagatt 2100
attgttcacg ggaaatccgg gttccatatt gacccgtatc acggtgacca ggtcaccgag 2160
ttgctggtca atttctttga gaaaactaaa caagacccgg gtcattggga ggccatttcc 2220
aagggtggtc tgcaacgtat tcaggagaaa tacacgtggc agatttattc agataggttg 2280
ttgacgcttg ccggagttta tggattctgg aagcatgtgt cgaagcttga caggctcgag 2340
atccgtcgtt atcttgaaat gttttacgcg ctcaagtatc gcaaactggc tgaatctgtt 2400
ccattggctg ttgatgagtg a 2421
<210> 17
<211> 810
<212> PRT
<213> 甜叶菊
<400> 17
Met Ala Thr Ser Lys Leu Ser Arg Thr His Ser Met Arg Glu Arg Val
1 5 10 15
Glu Glu Thr Leu Ser Ala His Arg Asn Glu Ile Val Ser Leu Leu Ser
20 25 30
Arg Tyr Val Ala Gln Gly Lys Ala Ile Leu Gln Pro His Gln Ile Leu
35 40 45
His Glu Leu Glu Asn Ile Ile Gly Asp Val Thr Ser Arg Gln Lys Leu
50 55 60
Thr Asp Gly Pro Phe Gly Asp Ala Leu Lys Thr Ala Gln Glu Cys Ile
65 70 75 80
Val Leu Pro Pro Phe Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val
85 90 95
Trp Glu Tyr Val Arg Val Asp Ala Tyr Gln Leu Ser Val Glu Gln Leu
100 105 110
Thr Val Ser Glu Tyr Leu Thr Phe Lys Glu Glu Leu Val Gly Glu Ser
115 120 125
Asn Ser Ser Leu Met Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ser
130 135 140
Phe Pro Arg Pro Thr Arg Ser Ser Ser Ile Gly Asn Gly Val Gln Phe
145 150 155 160
Leu Asn Arg His Leu Ser Ser Ser Met Phe Arg Ser Lys Asp Cys Leu
165 170 175
Glu Pro Leu Leu Asp Phe Leu Arg Thr His Arg His Asn Gly His Val
180 185 190
Met Met Leu Asn Asp Arg Ile Thr Ser Met Thr Arg Leu Gln Ser Ser
195 200 205
Leu Val Lys Ala Glu Glu Tyr Leu Ser Lys Leu Pro Ser Asp Thr Asp
210 215 220
Tyr Ser Glu Phe Gln Tyr Glu Leu Gln Gly Met Gly Phe Glu Arg Gly
225 230 235 240
Trp Gly Asn Asn Ala Glu Arg Ile Ile Glu Met Met His Leu Leu Ser
245 250 255
Asp Ile Leu Gln Ala Pro Asp Pro Ser Ile Leu Glu Ser Phe Leu Ala
260 265 270
Arg Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Ile His Gly Tyr
275 280 285
Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Ile
290 295 300
Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu Leu
305 310 315 320
Lys Leu Lys His Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val
325 330 335
Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Ser Cys Asn Gln Arg Leu
340 345 350
Glu Arg Val Ser Gly Thr Glu His Thr His Ile Leu Arg Val Pro Phe
355 360 365
Arg Thr Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Asp Val
370 375 380
Trp Pro Phe Leu Glu Lys Phe Thr Gln Asp Ala Ala Ser Glu Ile Ser
385 390 395 400
Ala Glu Leu His Gly Thr Pro Asp Leu Ile Ile Gly Asn Tyr Ser Asp
405 410 415
Gly Asn Leu Val Ala Ser Leu Leu Ser Tyr Lys Met Gly Val Thr Gln
420 425 430
Cys Asn Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp
435 440 445
Leu Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Cys Gln Phe
450 455 460
Thr Ala Asp Leu Leu Ala Met Asn Asn Ala Asp Phe Ile Ile Thr Ser
465 470 475 480
Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr Glu
485 490 495
Ser His Ser Ser Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly
500 505 510
Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp
515 520 525
Met Ser Ile Tyr Phe Ser Tyr Thr Glu Lys Glu Lys Arg Leu Thr Ser
530 535 540
Leu His Thr Thr Ile Glu Lys Leu Leu Phe Asp Pro Thr Gln Thr Glu
545 550 555 560
Asp Tyr Ile Gly Asn Leu Ser Asp Lys Ser Lys Pro Ile Ile Phe Ser
565 570 575
Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Leu Val Glu Trp
580 585 590
Tyr Ala Lys Asn Glu Lys Leu Arg Gly Leu Ala Asn Leu Val Val Val
595 600 605
Ala Gly Tyr Asn Asn Val Lys Arg Ser Ser Asp Arg Glu Glu Ile Ala
610 615 620
Glu Ile Glu Lys Met His Gln Leu Ile Lys Lys Tyr Lys Leu Asp Gly
625 630 635 640
Gln Met Arg Trp Ile Ser Ala Gln Thr Asn Arg Ala Gln Asn Gly Glu
645 650 655
Leu Tyr Arg Tyr Ile Ala Asp Gly Arg Gly Ile Phe Val Gln Pro Ala
660 665 670
Ile Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly
675 680 685
Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Gly Glu Ile Ile Glu
690 695 700
Asn Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Thr Ala
705 710 715 720
Ser Ala Thr Met Ala Asp Phe Phe Gln Lys Cys Lys Glu Asp Pro Ser
725 730 735
Tyr Trp Phe Lys Ile Ser Glu Ala Gly Leu Lys Arg Ile Tyr Glu Arg
740 745 750
Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly Val
755 760 765
Tyr Ser Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr Arg
770 775 780
Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Asp Leu Val Lys
785 790 795 800
Ser Val Pro Val Ala Thr Asp Asp Glu Ala
805 810
<210> 18
<211> 2433
<212> DNA
<213> 甜叶菊
<400> 18
atggcgacaa gtaagttgag cagaacgcat agtatgcgtg agcgtgttga agaaactctt 60
tccgctcatc gcaacgaaat cgtttctctt ctttctaggt atgtggctca ggggaaggcg 120
atattgcagc cgcatcagat actccatgaa cttgagaata tcatcggtga tgttacttcg 180
cgccaaaagc ttacagatgg tccgtttgga gatgcgttga agacagcaca ggaatgtata 240
gttctacctc catttgtagc tttagcagtt cgtccaagac ctggtgtttg ggaatacgtg 300
cgcgtggatg catatcaact aagtgtggaa caactaactg tttcagagta tcttaccttc 360
aaagaagaac ttgttggaga gtctaatagt tctttaatgc tcgagttgga ttttgagcca 420
tttaatgctt cgtttcctag accaacccgt tcttcatcca ttggcaatgg agttcagttc 480
ctgaatcgcc acctgtcgtc aagcatgttt cgcagcaaag attgtttaga accgcttctg 540
gatttcctac gcacacacag acataatgga catgtaatga tgttaaatga ccgcataaca 600
agcatgacta gacttcaatc ttctttggtc aaagcagagg aatatctttc taaactacca 660
tctgatacag actactctga gtttcaatat gaattgcaag gaatgggttt tgaaagagga 720
tggggaaaca atgctgaaag aatcattgag atgatgcatc ttctctcaga cattctacaa 780
gctccagatc cttccatttt ggaatctttt cttgctagaa tacctatggt gtttaatgtt 840
gttatattat caatacatgg ctactttggg caagcaaatg ttttgggttt gccagatact 900
ggtggccaga ttgtatatat attggatcaa gtccgtgcat tggaaaatga gatgcttctt 960
aaattaaagc accaaggact ggatatcaaa cctaggattc tgattgtgac tcggttaata 1020
cctgatgcaa aaggtacttc atgtaaccaa cgactggaaa gagtcagtgg aactgaacac 1080
acacatatac ttcgtgttcc ttttagaacc gagaaaggaa ttcttcgtaa atggatctca 1140
aggtttgatg tatggccttt tttggagaaa tttacacagg atgcagcaag tgaaatttct 1200
gctgagttgc atggtactcc agatcttata attggaaatt atagtgatgg caatcttgtt 1260
gcctctttat tatcttacaa aatgggagta acccagtgta acattgctca tgctttagag 1320
aaaacaaagt atccagattc tgatttatat tggaagaaat ttgatgagaa atatcacttt 1380
tcttgtcaat ttactgctga tcttttagcc atgaacaatg cagattttat catcaccagc 1440
acataccaag aaatcgcggg aacgaaaaat actgtcggac aatacgagag tcattcgtct 1500
ttcactctcc cggggctcta cagggttgtt catggtattg acgtttttga ccctaagttc 1560
aacattgtgt ctccaggggc agatatgtct atatacttct catacaccga gaaggaaaaa 1620
agacttacat ctcttcatac tacaattgag aagttattgt ttgaccctac acaaactgaa 1680
gattacattg gaaatctgag tgataaatca aaaccgataa ttttttcaat ggcaagactt 1740
gatcatgtga agaacattac gggtctggtt gagtggtacg ctaagaatga gaagcttaga 1800
ggactagcaa accttgttgt ggttgctggt tataataatg tgaagaggtc tagtgacaga 1860
gaagaaattg cagaaattga aaaaatgcat caacttatta agaaatacaa attagatggt 1920
cagatgagat ggatttcagc acaaacaaac cgcgcacaaa atggtgaact ttatcgctat 1980
attgctgatg gaaggggaat ctttgtacag cccgctattt atgaagcttt tgggctgaca 2040
gtggtggagg ccatgacttg tgggcttcca acatttgcaa cttgccatgg tgggccagga 2100
gagataattg aaaatggtgt ttcgggcttc catatcgacc cgtatcatcc ggatactgca 2160
tcagccacaa tggctgattt ttttcagaaa tgcaaggagg acccgagtta ttggttcaag 2220
atatctgaag cagggcttaa aagaatatat gaaaggtaca catggaaaat ttactctgaa 2280
cggttgatga cattagctgg agtttatagc ttctggaagt atgtctcgaa acttgagaga 2340
cgtgaaacaa gacgatatct tgagatgttt tatattctta agttccgtga tctggtaaaa 2400
tctgttccag tggctactga tgatgaggct tag 2433
<210> 19
<211> 811
<212> PRT
<213> 甜叶菊
<400> 19
Met Ala Thr Pro Lys Leu Thr Arg Thr Pro Ser Met Arg Glu Arg Leu
1 5 10 15
Glu Glu Thr Leu Ser Ala His Arg Asn Asp Ile Val Ser Leu Leu Ser
20 25 30
Arg Tyr Val Asp Gln Gly Lys Ala Ile Leu Gln Pro His His Leu Leu
35 40 45
Asp Glu Ile Asp Asn Phe Ile Gly Asp Gln Asn Cys Arg Gln Lys Leu
50 55 60
Ala Asp Ser Leu Phe Gly Glu Ile Leu Lys Ser Ala Gln Glu Gly Ile
65 70 75 80
Ile Leu Pro Pro Tyr Val Thr Leu Ala Val Arg Pro Arg Pro Gly Val
85 90 95
Trp Asp Phe Leu Arg Val Asn Val Asp Glu Leu Ser Val Glu Gln Leu
100 105 110
Thr Val Ser Glu Tyr Leu Ser Phe Lys Glu Glu Leu Val Asp Gly Gln
115 120 125
Ser Arg Asn Pro Phe Val Leu Glu Leu Asp Leu Glu Pro Phe Asn Ala
130 135 140
Thr Phe Pro Arg Met Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln
145 150 155 160
Phe Leu Asn Arg His Leu Ser Ser Ile Met Phe Arg Asn Lys Asp Cys
165 170 175
Met Asp Pro Phe Leu Asp Phe Leu Arg Ala His Lys His Lys Gly Tyr
180 185 190
Ala Met Met Leu Asn Asp Arg Ile Gln Thr Met Ser Arg Leu Glu Ser
195 200 205
Ser Leu Ala Lys Ala Glu Asp His Leu Ser Lys Leu Pro Pro Glu Thr
210 215 220
Pro Tyr Ser Glu Phe Glu Tyr Val Leu Gln Gly Met Gly Phe Glu Arg
225 230 235 240
Gly Trp Gly Asp Asn Cys Glu Arg Val Leu Gly Met Met His Leu Leu
245 250 255
Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Ile Leu Glu Lys Phe Leu
260 265 270
Gly Lys Met Pro Met Ile Phe Asn Val Val Val Leu Ser Ile His Gly
275 280 285
Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln
290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ser Leu Glu Asn Glu Met Leu
305 310 315 320
Leu Lys Leu Arg His Gln Gly Leu Asp Ile Lys Pro Lys Ile Leu Ile
325 330 335
Val Thr Arg Leu Ile Pro Asn Ala Lys Gly Thr Ser Cys Asn Gln Arg
340 345 350
Leu Glu Lys Val Ser Gly Thr Glu Tyr Thr Tyr Ile Leu Arg Val Pro
355 360 365
Phe Arg Thr Glu Lys Gly Ile Leu Gly Lys Trp Leu Ser Arg Phe Asp
370 375 380
Ile Trp Pro Tyr Leu Glu Ala Phe Thr Thr Asp Ala Ala Ser Glu Ile
385 390 395 400
Ala Ala Glu Leu His Gly Val Pro Asp Leu Leu Ile Gly Asn Tyr Ser
405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Leu Ser Asn Lys Leu Gly Val Thr
420 425 430
Gln Cys Asn Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445
Asp Leu Tyr Trp Lys Lys Phe Glu Asp Lys Tyr His Phe Ser Cys Gln
450 455 460
Phe Thr Ala Asp Leu Leu Ala Met Asn Asn Ala Asp Phe Ile Ile Thr
465 470 475 480
Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr
485 490 495
Glu Asn His Ser Ser Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525
Asp Met Ala Ile Tyr Phe Ser Tyr Ala Asp Lys Glu Arg Arg Leu Thr
530 535 540
Ser Leu His Pro Thr Ile Glu Lys Leu Leu Phe Asp Thr Glu Gln Asn
545 550 555 560
Asp Val His Ile Gly Asn Ile Asn Asp Pro Ser Lys Pro Met Ile Phe
565 570 575
Thr Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Phe Val Glu
580 585 590
Cys Tyr Ala Lys Asn Asn Lys Leu Arg Glu His Ala Asn Leu Val Val
595 600 605
Ile Ala Gly Tyr Asn Asp Ala Lys Lys Ser Ser Asp Arg Glu Glu Ile
610 615 620
Ala Glu Ile Glu Lys Met His Asn Leu Ile Lys Gln Tyr Lys Leu Asp
625 630 635 640
Gly Gln Met Arg Trp Ile Ser Ala Gln Thr Asn Arg Ala Arg Asn Gly
645 650 655
Glu Phe Tyr Arg Tyr Ile Ala Asp Gly Arg Gly Val Phe Val Gln Pro
660 665 670
Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys
675 680 685
Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Ala Glu Ile Ile
690 695 700
Glu Asp Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Lys
705 710 715 720
Met Ser Thr Thr Leu Ala Asp Phe Phe Gln Lys Cys Lys Glu Glu Pro
725 730 735
Ser Tyr Trp Gly Lys Ile Ser Asp Gly Gly Leu Lys Arg Ile Ser Glu
740 745 750
Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly
755 760 765
Val Tyr Ser Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr
770 775 780
Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Gln Leu Val
785 790 795 800
Lys Ser Val Pro Leu Ala Val Asp Glu Glu Pro
805 810
<210> 20
<211> 2436
<212> DNA
<213> 甜叶菊
<400> 20
atggcgacac ctaagcttac gcgaacacca agcatgcgag agcgtcttga agaaacttta 60
tcagctcatc gcaacgatat cgtctctctt ctttccaggt atgtagatca aggtaaggcc 120
atattgcagc cccaccacct acttgacgaa atcgataact tcatcggaga tcaaaattgc 180
cgccaaaagc ttgctgatag tctattcggt gaaatcctca agtccgcaca ggaaggtata 240
attcttcctc catatgtaac gcttgctgtt cgtccaagac ctggtgtttg ggactttttg 300
cgtgtgaatg tcgatgaatt gagtgtcgag caacttactg tttctgagta tttaagcttc 360
aaggaggagc ttgtagatgg ccagagtagg aacccgtttg tgttggaact ggatctggaa 420
ccgtttaatg caacatttcc ccggatgtca cgatcttcat ccatcggcaa tggagttcag 480
tttctcaacc gtcatctctc gtcaattatg tttcgcaaca aagattgtat ggatccgttt 540
cttgatttcc ttcgtgctca taaacataaa ggatacgcga tgatgttgaa tgatcggata 600
caaacaatgt ctagacttga atcttcttta gcaaaagcgg aggatcatct ctctaaacta 660
ccacccgaaa caccgtactc cgaattcgaa tacgtattgc aaggaatggg gtttgaaaga 720
ggttgggggg ataattgtga aagagttctt ggtatgatgc atcttctttc tgacattctt 780
caagctccag atccttcgat tcttgaaaag tttcttggaa agatgccgat gatcttcaat 840
gttgttgtgt tatcgattca tggttacttt ggtcaggcta atgttttggg tttgccggat 900
accggtggtc aggttgtata tatattggat caagtacgtt ctttggagaa tgaaatgtta 960
cttaaattaa ggcatcaagg acttgatatc aaacccaaga ttctaattgt aactcgattg 1020
ataccaaatg ccaaaggtac ttcatgcaac caacgattgg agaaagtaag tggaaccgaa 1080
tacacgtata tattacgtgt cccttttagg acagagaaag ggattcttgg taaatggtta 1140
tcaaggtttg atatatggcc ttatttggag gcgtttacaa cggatgcagc aagtgaaatt 1200
gctgctgagt tacacggtgt tccggatctt ttaataggaa actacagtga tgggaatctc 1260
gttgcctcct tgctatctaa caaattgggc gtaacccagt gcaacattgc acacgcgtta 1320
gagaaaacaa agtatccaga ttccgactta tattggaaga aatttgagga caaatatcac 1380
ttttcatgtc aatttaccgc cgaccttcta gcaatgaaca atgcagattt tatcatcact 1440
agcacatacc aagagattgc aggaacgaaa aacaccgttg gacaatacga gaatcattca 1500
tcgttcactc ttccgggtct atacagggtt gttcacggta tcgatgtctt tgacccgaag 1560
ttcaacatcg tgtcaccagg ggcagatatg gcaatttact tctcatatgc cgataaagag 1620
agacgactta catctctaca tcccacaatt gagaagctat tgttcgacac tgagcagaac 1680
gatgtacaca ttggaaatat aaatgacccg tctaaaccca tgattttcac aatggcgagg 1740
cttgatcatg tgaagaatat aactggattc gtcgagtgtt atgctaaaaa taataagttg 1800
agggaacacg caaatcttgt ggttattgct ggttataatg acgcgaagaa atcaagtgat 1860
cgagaagaaa ttgcggaaat tgaaaagatg cataatctta tcaagcaata caaacttgat 1920
ggtcagatga gatggatatc agcccaaaca aaccgggccc gaaatgggga attttatcgg 1980
tatatcgctg atggtagggg cgttttcgtc cagcccgctt tctatgaagc atttgggctt 2040
acggttgtgg aggcgatgac atgtgggctc ccaacatttg ccacgtgtca tggtgggcct 2100
gctgagatca ttgaggatgg tgtgtcgggg ttccatattg atccatatca tcctgataag 2160
atgtcgacta cgttagctga tttttttcaa aagtgcaaag aggaacctag ttactggggt 2220
aaaatatccg atggcgggct gaaaagaata agtgaaaggt acacatggaa gatatattcg 2280
gaacggttga tgacgttggc gggcgtatat agcttttgga aatatgtgtc aaaactcgag 2340
aggcgtgaaa cccgtcgata ccttgagatg ttctacattt taaagtttcg tcaactggtg 2400
aagtcggttc cgctagctgt tgatgaggag ccgtaa 2436
<210> 21
<211> 842
<212> PRT
<213> 甜叶菊
<400> 21
Met Ala Ser Ala Ser Ser Ser Ile Met Lys Arg Ser Glu Ser Ile Val
1 5 10 15
Asp Thr Met Pro Glu Ala Leu Lys Gln Ser Arg Tyr His Met Lys Lys
20 25 30
Cys Phe Leu Lys Tyr Val Glu Lys Gly Ile Arg Met Met Lys Arg His
35 40 45
His Leu Ile Gln Glu Met Glu Thr Ala Ile Glu Asp Lys Asp Glu Lys
50 55 60
Ala Gln Leu Leu Asp Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Gln
65 70 75 80
Glu Ala Ala Val Val Pro Pro Cys Val Ala Phe Ala Ile Arg Pro Asn
85 90 95
Pro Gly Phe Trp Glu Phe Val Lys Val Asn Ser Asn Asp Leu Ser Val
100 105 110
Asp Gly Ile Thr Ala Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val
115 120 125
Asp Glu Thr Trp Ala Lys Asp Glu Asn Ala Leu Glu Ile Asp Phe Gly
130 135 140
Ser Met Asp Phe Asn Leu Pro Asn Met Ser Leu Ser Cys Ser Ile Gly
145 150 155 160
Asn Gly Val Asn Phe Thr Ser Lys Phe Ile Thr Cys Lys Leu Tyr Ala
165 170 175
Gln Ser Ser Cys Gln Gln Leu Leu Val Asp Tyr Leu Leu Ser Leu Asn
180 185 190
His Gln Gly Glu Asn Leu Met Ile Asn Asp Ala Leu Asn Ser Val Ser
195 200 205
Lys Leu Arg Ala Ala Leu Ile Val Ala His Ala Ser Leu Ser Ser Leu
210 215 220
Pro Asn Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Glu Trp
225 230 235 240
Gly Phe Glu Lys Gly Trp Gly Asp Asn Ala Glu Arg Ala Arg Glu Thr
245 250 255
Ile Arg Phe Leu Leu Glu Val Leu Gln Ala Pro Asp Pro Ile Asn Leu
260 265 270
Glu Ala Leu Phe Ser Arg Ile Pro Asn Ile Phe Asn Val Val Leu Phe
275 280 285
Ser Ile His Gly Tyr Phe Gly Gln Ser Asn Val Leu Gly Leu Pro Asp
290 295 300
Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Met Glu
305 310 315 320
Glu Glu Leu Leu Met Arg Ile Lys Gln Gln Gly Leu Asn Phe Lys Pro
325 330 335
Gln Ile Leu Val Val Thr Arg Leu Leu Pro Asp Ala Lys Gly Thr Lys
340 345 350
Cys Asn Gln Val Leu Glu Pro Val Leu Asn Thr Lys His Ser His Ile
355 360 365
Leu Arg Val Pro Phe Arg Thr Asp Lys Gly Val Leu Arg Lys Trp Val
370 375 380
Ser Arg Phe Asp Ile Tyr Pro Tyr Leu Glu Asn Phe Thr Gln Asp Ala
385 390 395 400
Ser Ala Lys Ile Ile Glu Met Met Glu Gly Lys Pro Asp Leu Ile Ile
405 410 415
Gly Asn Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Asn Lys
420 425 430
Leu Gly Thr Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys
435 440 445
Tyr Glu Asp Ser Asp Met Asn Trp Lys Gln Phe Asp Pro Lys Tyr His
450 455 460
Phe Ser Cys Gln Phe Thr Ala Asp Met Ile Ala Met Asn Ser Ala Asp
465 470 475 480
Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp Arg
485 490 495
Pro Gly Gln Tyr Glu Ser His Glu Ala Phe Thr Leu Pro Gly Leu Tyr
500 505 510
Arg Val Val Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala
515 520 525
Ser Pro Gly Ala Asp Gln Thr Val Tyr Phe Pro Tyr Thr Glu Thr Lys
530 535 540
Lys Arg Phe Thr Ala Phe Gln Pro Ala Ile Glu Glu Leu Leu Phe Ser
545 550 555 560
Lys Val Glu Asn Glu Glu His Ile Gly Tyr Leu Glu Asp Lys Thr Lys
565 570 575
Pro Ile Ile Phe Ser Met Ala Arg Leu Asp Thr Val Lys Asn Ile Thr
580 585 590
Gly Leu Thr Glu Trp Phe Gly Glu Asn Lys Arg Leu Arg Ser Leu Val
595 600 605
Asn Leu Val Ile Val Ala Gly Phe Phe Asp Pro Ser Lys Ser Lys Asp
610 615 620
Arg Glu Glu Met Ala Glu Ile Lys Lys Met His Leu Leu Ile Glu Lys
625 630 635 640
Tyr Gln Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Lys
645 650 655
Asn Arg Asn Ser Glu Leu Tyr Arg Phe Ile Ala Asp Ser Lys Gly Ala
660 665 670
Phe Val Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu
675 680 685
Ala Met Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro
690 695 700
Ala Glu Ile Ile Val Asp Gly Val Ser Gly Phe Gln Ile Asp Pro Asn
705 710 715 720
Phe Gly Asp Gln Ser Ser Asn Lys Ile Ala Asp Phe Phe Gln Lys Cys
725 730 735
Lys Glu Asp Pro Gly Tyr Trp Asn Asn Ile Ser Glu Gly Gly Leu Lys
740 745 750
Arg Ile Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu
755 760 765
Asn Met Gly Asn Ile Tyr Ser Phe Trp Lys Arg Leu Asn Lys Glu Gln
770 775 780
Lys Glu Ala Lys Gln Arg Tyr Ile Glu Leu Phe Tyr Asn Leu His Tyr
785 790 795 800
Lys Asn Leu Val Arg Thr Val Pro Ile Ala Ser Asp Glu Ala Gln Pro
805 810 815
Ala Pro Val Ser Arg Ala Lys Leu Ala Thr Gln Pro Thr Arg Arg Thr
820 825 830
Gln Ser Arg Leu Gln Arg Leu Phe Gly Ala
835 840
<210> 22
<211> 2529
<212> DNA
<213> 甜叶菊
<400> 22
atggcatctg cttcaagttc tatcatgaaa cggtctgaat caatagttga caccatgcca 60
gaagccttaa agcagagccg ctatcatatg aaaaaatgtt ttctaaaata tgtagaaaaa 120
ggaattcgca tgatgaaaag acatcatttg atacaagaaa tggagaccgc aattgaagac 180
aaggatgaaa aggctcagct tctagatggc ttacttggct acatcttgtg cacaactcag 240
gaagcagccg ttgttcctcc ttgtgttgca tttgctataa gaccgaatcc tggattctgg 300
gagtttgtta aagtcaactc taatgatcta tcggttgatg ggataactgc cacagattac 360
ttgaagttca aggaaatgat cgtagatgag acatgggcta aagatgaaaa tgcattggag 420
attgactttg gatcgatgga ctttaaccta ccaaacatga gtttatcttg ttcgattgga 480
aatggtgtta acttcacatc aaaattcatt acttgtaaac tttacgcaca atctagttgc 540
caacaactgc ttgttgatta cttgctctca ttgaatcatc aaggagaaaa tcttatgatc 600
aatgatgcat taaactcagt ctcaaaactt cgagcggctt taattgtagc tcatgcgtcg 660
ctatcttcgt tgcccaacga tactccatat caaagcttcg agcttagatt caaagaatgg 720
ggatttgaga agggatgggg agataacgcg gaacgcgcga gggaaacaat tcggtttctt 780
ttggaggttc ttcaagcacc cgatccgata aacctcgagg ctttattcag caggattcca 840
aacatattca acgttgtttt attctcgatt catgggtatt ttggtcaatc caatgttctt 900
ggattgcccg atactggtgg ccaagtggtt tatgttttgg atcaagtggt agctatggaa 960
gaagaactac tcatgaggat caaacaacaa ggactcaact tcaagcctca aattcttgtg 1020
gtgacccgac ttcttcctga tgctaaaggg accaagtgta atcaggtgtt ggaaccagtt 1080
ctgaacacga aacattcgca tattcttagg gttccattca ggactgataa aggtgttctt 1140
cgtaaatggg tatctcgatt tgatatctat ccatatctcg aaaacttcac tcaggatgca 1200
agtgcgaaaa tcattgaaat gatggaaggg aaaccggatc ttatcatcgg aaactatacc 1260
gatggaaacc ttgttgcatc actcatggct aacaaactcg gaacgacatt gggaacaatt 1320
gcacatgctt tggagaaaac caaatacgaa gattcagaca tgaattggaa gcaattcgac 1380
ccaaaatatc acttctcctg ccaatttaca gccgatatga ttgcaatgaa ctcagctgat 1440
ttcatcatca caagtacttt ccaagaaatc gctggaagta aagatagacc cggacaatat 1500
gaaagccatg aagcatttac acttccagga ttatacagag ttgtttcagg catcaacgtg 1560
ttcgatccca aattcaatat cgcgtctcca ggagccgatc aaaccgttta tttcccgtac 1620
accgaaacaa agaaacgatt cactgcattt caacccgcca tagaggaatt actcttcagt 1680
aaagttgaaa acgaagaaca cattggatac ttagaagaca aaaccaaacc gatcatattc 1740
tcaatggcgc gtctcgacac agttaagaac ataacaggac taaccgaatg gtttggagag 1800
aacaaacggc tccgaagctt ggttaatctt gtaatcgtgg cgggtttctt tgacccgtca 1860
aagtcaaaag acagagaaga aatggcggaa ataaagaaaa tgcatttatt gattgaaaaa 1920
tatcagctta aaggtcaaat aagatggatt gctgcacaaa ctgataagaa ccgaaacagt 1980
gagctttacc ggtttattgc tgactcaaaa ggcgcgtttg tgcagcccgc tttgtatgag 2040
gcgtttgggc tcacggttat tgaggcgatg aactgtggtt taccgacttt tgcaactaat 2100
caaggtggtc cagctgagat tatcgttgat ggtgtttctg ggttccagat tgatcctaat 2160
tttggtgatc agtctagtaa taagattgct gatttcttcc agaagtgtaa ggaagatcct 2220
ggttattgga ataatatttc agaaggcggt ttgaagcgta tatacgaatg ttatacttgg 2280
aagatttatg cgaataaagt gttgaatatg gggaacatat actcgttttg gaagcggtta 2340
aacaaggaac aaaaagaagc aaaacaaaga tacattgaac tattctacaa tctacactac 2400
aagaacttgg ttaggactgt accaattgct agtgatgaag ctcaacctgc accagtgtca 2460
agggcaaaac ttgcaacaca acccacaaga cgtacgcaat ccaggttgca aaggctgttt 2520
ggagcttaa 2529
<210> 23
<211> 842
<212> PRT
<213> 甜叶菊
<400> 23
Met Ala Ala Ser Ser Ser Pro Ile Met Lys Arg Ser Glu Ser Val Leu
1 5 10 15
Asp Thr Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys
20 25 30
Cys Phe Leu Lys Tyr Val Gly Lys Gly Lys Arg Met Val Lys Leu His
35 40 45
His Leu Met Gln Glu Met Glu Thr Val Ile Glu Asp Lys Asp Glu Lys
50 55 60
Ala Gln Leu Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Gln
65 70 75 80
Glu Ala Ala Val Val Pro Pro Tyr Val Ala Phe Ala Ile Arg Pro Asn
85 90 95
Pro Gly Phe Trp Glu Phe Val Lys Val Asn Ser Asn Asp Leu Ser Val
100 105 110
Lys Gly Ile Thr Ser Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val
115 120 125
Asp Glu Thr Trp Ala Asn Asp Glu Asn Ala Leu Glu Ile Asp Phe Gly
130 135 140
Ala Met Asp Phe Asn Leu Pro Thr Met Ser Leu Ser Ser Ser Ile Gly
145 150 155 160
Asn Gly Val Asn Phe Thr Ser Lys Phe Ile Ile Ser Lys Leu Tyr Ala
165 170 175
His Ser Gly Ser Gln Leu Gln Ser Leu Val Asp Tyr Leu Leu Ser Leu
180 185 190
Asn His Gln Gly Glu Lys Leu Met Ile Asn Asp Lys Leu Asn Thr Val
195 200 205
Ser Lys Leu Gln Ala Ala Leu Ile Val Ala His Ser Phe Leu Ser Ser
210 215 220
Leu Pro Asn Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Glu
225 230 235 240
Trp Gly Phe Glu Lys Gly Trp Gly Asp Tyr Ala Glu Arg Val Gln Glu
245 250 255
Thr Ile Arg Phe Leu Leu Glu Val Leu Gln Ala Pro Asp Pro Val Asn
260 265 270
Leu Glu Ala Phe Phe Ser Arg Val Pro Asn Ile Phe Asn Ile Val Leu
275 280 285
Phe Ser Ile His Gly Tyr Phe Gly Gln Ser Asn Val Leu Gly Leu Pro
290 295 300
Asp Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Met
305 310 315 320
Glu Glu Glu Leu Leu Leu Arg Ile Lys Gln Gln Gly Leu Ser Phe Lys
325 330 335
Pro His Ile Leu Val Val Thr Arg Leu Leu Pro Asp Ala Lys Gly Thr
340 345 350
Glu Cys Ser Gln Val Leu Glu Pro Val Leu Asn Thr Lys His Ser His
355 360 365
Ile Leu Arg Val Pro Phe Arg Thr Glu Lys Gly Val Leu Arg Lys Trp
370 375 380
Val Ser Arg Phe Asp Ile Tyr Pro Tyr Leu Glu Lys Phe Thr Gln Asp
385 390 395 400
Ala Ser Ala Lys Ile Thr Glu Met Met Glu Gly Lys Pro Asp Leu Ile
405 410 415
Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Asn
420 425 430
Lys Leu Gly Ser Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr
435 440 445
Lys Tyr Glu Asp Ser Asp Met Lys Trp Lys His Leu Asp Thr Lys Tyr
450 455 460
His Phe Ser Cys Gln Phe Thr Ala Asp Met Ile Ala Met Asn Ser Ala
465 470 475 480
Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp
485 490 495
Arg Pro Gly Gln Tyr Glu Ser His Glu Ala Phe Thr Leu Pro Gly Leu
500 505 510
Tyr Arg Val Val Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile
515 520 525
Ala Ser Pro Gly Ala Asp Gln Thr Val Tyr Phe Pro Tyr Thr Glu Thr
530 535 540
Pro Lys Arg Phe Thr Thr Phe Gln Pro Ala Ile Gln Glu Leu Leu Phe
545 550 555 560
Ser Lys Val Glu Asn Asp Glu His Ile Gly Tyr Leu Glu Asp Lys Asn
565 570 575
Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp Met Val Lys Asn Ile
580 585 590
Thr Gly Leu Thr Glu Trp Phe Gly Glu Asn Lys Arg Leu Arg Ser Leu
595 600 605
Val Asn Leu Val Ile Val Ala Gly Phe Phe Asp Pro Ser Lys Ser Lys
610 615 620
Asp Arg Glu Glu Met Glu Glu Ile Lys Lys Met His Leu Leu Ile Glu
625 630 635 640
Lys Tyr Glu Leu Lys Gly Gln Ile Arg Trp Ile Val Ala Gln Thr Asp
645 650 655
Lys Asn Arg Asn Ser Glu Leu Tyr Arg Cys Ile Ala Asp Ser Lys Gly
660 665 670
Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile
675 680 685
Glu Ala Met Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly
690 695 700
Pro Ala Glu Ile Ile Val Asp Gly Val Ser Gly Phe Gln Ile Asp Pro
705 710 715 720
Asn Tyr Gly Asp Glu Ser Ser Asn Lys Ile Ala Asp Phe Phe Gln Lys
725 730 735
Cys Lys Gln Asp Pro Gly Tyr Trp Asn Arg Ile Ser Asp Gly Gly Leu
740 745 750
Met Arg Ile Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val
755 760 765
Leu Asn Met Gly Asn Ile Tyr Thr Phe Trp Lys Gln Leu Asn Lys Glu
770 775 780
Gln Lys Asp Ala Lys Gln Arg Tyr Ile Glu Leu Phe Tyr Asn Gln His
785 790 795 800
Tyr Lys Asn Leu Val Arg Thr Val Pro Ile Val Ser Asp Glu Asp Asp
805 810 815
Gln Val Thr Arg Ala Lys Pro Ala Thr Gln Pro Ser Thr Arg Arg Thr
820 825 830
Gln Ser Ala Leu Gln Arg Leu Leu Gly Ala
835 840
<210> 24
<211> 2529
<212> DNA
<213> 甜叶菊
<400> 24
atggcagctt cttcaagtcc cattatgaaa cggtctgagt cagtactcga caccatgcca 60
gaagctttga ggcaaagtcg gtatcatatg aaaaaatgct ttctaaaata tgtagggaaa 120
ggaaagcgga tggtgaaact ccaccatttg atgcaagaaa tggagaccgt cattgaggac 180
aaggacgaaa aggctcagct cttggaaggc ttacttggtt acatcttgtg caccactcag 240
gaagcagcag ttgttcctcc ttatgtcgcc tttgcaataa ggccaaaccc tggattttgg 300
gagtttgtta aagtcaactc taatgatctc tcggttaaag ggatcacttc caccgattac 360
ttgaagttca aggaaatgat cgttgacgaa acatgggcta atgatgaaaa tgcattggag 420
atcgactttg gagcaatgga ctttaacttg ccaacaatga gcttatcttc ttcaattgga 480
aatggagtta acttcacatc aaagtttatt atttctaaac tttatgctca ttctggcagc 540
caattacaat ctctagttga ttacttactt tcattaaatc atcaaggaga aaaacttatg 600
ataaatgaca aactaaacac agtttcaaaa cttcaagccg ctctaatagt agctcattct 660
ttcctttctt cattgcccaa cgacacaccg tatcaaagct ttgaacttag atttaaagag 720
tggggttttg aaaaaggatg gggagattat gcagaaaggg tgcaagaaac aattcggttt 780
ttgttggagg ttcttcaagc acccgacccc gtaaacctag aggccttttt tagcagggtt 840
ccaaacatat tcaatattgt tttattctcg attcatgggt attttggtca atccaatgtt 900
cttggcttgc ccgataccgg aggtcaggta gtttatgttt tggatcaagt tgtggcaatg 960
gaagaagaat tgctacttag gattaagcaa caaggactca gcttcaagcc tcatattctt 1020
gtggtgactc gacttcttcc cgatgccaaa gggaccgagt gtagccaagt tttggaacca 1080
gttctcaaca cgaaacactc acacattctt agagtcccat ttaggacaga aaaaggtgtt 1140
cttcgtaaat gggtgtctcg atttgatatc tatccatacc tcgaaaagtt tactcaggat 1200
gcaagtgcaa aaataactga aatgatggaa ggaaaacctg atcttatcat tggaaactac 1260
actgacggaa acttggttgc atctctcatg gctaacaaac tcggaagcac attgggaacg 1320
attgcacacg cgttagagaa gactaaatac gaagattcag acatgaaatg gaaacatttg 1380
gacacaaaat atcacttttc ttgtcaattt acagctgata tgatagcaat gaattcagca 1440
gatttcatca tcactagtac tttccaagaa attgctggaa gtaaagatag acccggtcag 1500
tatgaaagcc atgaagcatt tacactcccg ggtttatata gagttgtttc gggcatcaac 1560
gtgtttgatc ccaaattcaa cattgcatct ccgggagctg atcaaaccgt ttatttccct 1620
tacacggaaa caccaaaacg attcactact tttcaacccg ctatacaaga attactcttt 1680
agtaaagttg aaaacgacga acacattgga tatttagaag ataagaataa accaatcatc 1740
ttctcaatgg caagactcga catggttaag aacataacgg ggctaaccga atggtttggg 1800
gaaaacaagc ggttaagaag tttggttaat cttgtaattg tggcggggtt ttttgatccg 1860
tcaaaatcaa aagatagaga agaaatggaa gaaataaaga aaatgcattt gttgattgag 1920
aaatatgaac ttaaaggtca aataagatgg atagtagcac aaactgataa aaacagaaat 1980
agtgaacttt atcgttgtat cgctgactca aagggggcgt ttgtgcaacc ggctttatat 2040
gaagcgtttg ggttaaccgt tattgaggct atgaattgtg ggttaccaac ttttgcaact 2100
aaccaaggtg gtccggctga gattattgtt gatggtgttt ctgggttcca aatcgatcct 2160
aattatggcg acgagtctag caacaagatc gctgattttt ttcaaaaatg caaacaggat 2220
ccaggatact ggaataggat ttcagacggt ggtttgatgc gtatatacga atgctacaca 2280
tggaagattt atgcaaataa agtgttgaat atggggaaca tttacacatt ttggaagcag 2340
ttaaacaagg aacagaaaga tgcgaaacaa agatacattg agctattcta caatcaacat 2400
tacaagaatt tggttaggac tgtgccgatt gtaagtgatg aagatgacca agttacaagg 2460
gcaaaaccgg caacacaacc ttcaacaagg cgcacacaat ctgccttgca aaggctgctt 2520
ggagcttaa 2529
<210> 25
<211> 881
<212> PRT
<213> 甜叶菊
<400> 25
Met Asp Phe Gly Ile Ala Glu Thr Leu Ala Glu Ala Leu Lys Gln Asn
1 5 10 15
Arg Tyr His Ala Arg Arg Cys Phe Glu Arg Phe Thr Ser Arg Gly Lys
20 25 30
Arg Met Val Lys Pro Gln Glu Leu Leu His Met Ile Glu Lys Thr Ile
35 40 45
Asp Asp Lys Leu Glu Arg Thr Lys Val Leu Glu Gly Ser Met Gly Gln
50 55 60
Ile Leu Ser Ser Thr Gln Glu Ala Ile Val Ile Pro Pro Tyr Val Ile
65 70 75 80
Leu Gly Leu Arg Ala Asn Pro Gly Gln Trp Ala Tyr Val Lys Ile Asn
85 90 95
Ala Asp Asp Val Thr Val Glu Ser Leu Thr Pro Ser Gln Tyr Leu Lys
100 105 110
Phe Lys Glu Ser Ile Tyr Asp Gln Glu Trp Ala Lys Asp Glu Asn Ala
115 120 125
Leu Glu Leu Asp Phe Gly Ala Phe Asp Phe Asp Thr Pro Arg Leu Ile
130 135 140
Leu Pro Ser Ser Ile Gly Asn Gly Leu Gly Tyr Ile Ser Lys Phe Met
145 150 155 160
Thr Ser Arg Ile Gly Gly Asp Leu Glu Asn Ala Lys Pro Leu Leu Asp
165 170 175
His Leu Leu Ala Leu Lys Tyr His Gly Glu Lys Leu Met Ile Asn Glu
180 185 190
Thr Ile Asp Thr Val Ser Lys Leu Gln Lys Ala Leu Ile Val Ala Asp
195 200 205
Val Tyr Leu Ser Ala His Pro Lys Asp Glu Gln Tyr Gln Thr Leu Glu
210 215 220
Pro Lys Leu Lys Glu Trp Gly Phe Glu Lys Gly Trp Gly Asp Thr Ala
225 230 235 240
Glu Arg Val Arg Glu Thr Met Lys Met Leu Ser Glu Ile Leu Gln Ala
245 250 255
Pro Asp Pro Ile Asn Met Gln Ser Phe Phe Ser Arg Leu Pro Val Val
260 265 270
Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ser Asp
275 280 285
Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp
290 295 300
Gln Val Lys Ala Leu Glu Glu Glu Ile Leu Leu Arg Ile Lys Met Gln
305 310 315 320
Gly Leu Asn Ala Lys Pro Arg Ile Leu Val Val Ser Arg Leu Ile Pro
325 330 335
Asp Ala Gln Gly Thr Lys Cys Asn Glu Glu Met Glu Pro Ile Leu Asn
340 345 350
Thr Met His Ser His Ile Leu Arg Val Pro Phe Arg Thr Ser Lys Gly
355 360 365
Val Val Pro Gln Trp Val Ser Arg Phe Asp Ile Tyr Pro Tyr Leu Glu
370 375 380
Arg Phe Ser Gln Asp Ala Ala Ser Lys Ile Leu Glu Val Met Glu Cys
385 390 395 400
Lys Pro Asp Leu Ile Leu Gly Asn Tyr Thr Asp Gly Asn Ile Val Ala
405 410 415
Ser Leu Ile Ala Lys Lys Phe Gly Val Thr Gln Gly Thr Ile Ala His
420 425 430
Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Asn Trp Lys Asn
435 440 445
Phe Glu Lys Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu Ile
450 455 460
Ser Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu Ile
465 470 475 480
Val Gly Ser Lys Gln Arg Pro Gly Gln Tyr Glu Thr His Gly Ala Phe
485 490 495
Ser Met Pro Gly Leu Cys Arg Val Val Ser Gly Ile Asn Val Phe Asp
500 505 510
Pro Lys Phe Asn Ile Ala Ser Pro Gly Ala Glu Gln Ser Val Tyr Phe
515 520 525
Pro Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asp Phe His Pro Ala Ile
530 535 540
Lys Glu Leu Leu Phe Asn Glu Gln Asp Asn Asp Glu His Met Gly Tyr
545 550 555 560
Leu Ala Asp Val Thr Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp
565 570 575
Thr Val Lys Asn Ile Thr Gly Leu Thr Glu Trp Phe Gly Lys Asn Lys
580 585 590
Arg Leu Arg Ser Leu Val Asn Leu Val Val Val Ala Gly Phe Phe Asp
595 600 605
Pro Ser Lys Ser Lys Asp Arg Glu Glu Met Glu Glu Ile Lys Lys Met
610 615 620
His Glu Leu Ile Glu Lys Tyr Lys Leu Lys Gly Gln Met Arg Trp Ile
625 630 635 640
Ala Ala Gln Asn Asp Arg Thr Arg Asn Gly Glu Leu Tyr Arg Cys Ile
645 650 655
Ser Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala Phe
660 665 670
Gly Leu Thr Val Ile Glu Ala Met Asn Cys Gly Leu Pro Thr Phe Ala
675 680 685
Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser Gly
690 695 700
Phe His Ile Asp Pro Val Asn Gly Asp Glu Ser Ser Asn Lys Ile Ala
705 710 715 720
Asp Phe Phe Thr Lys Cys Lys Val Asp Gly Glu Tyr Trp Asp Arg Val
725 730 735
Ser Gln Ala Gly Leu Gln Arg Ile Tyr Glu Cys Tyr Thr Trp Lys Met
740 745 750
Tyr Ala Asn Lys Ala Leu Asn Met Gly Ser Met Tyr Gly Phe Trp Arg
755 760 765
Gln Leu Asn Lys Glu Thr Lys Gln Ala Lys Gln Arg Tyr Ile Asp Ile
770 775 780
Leu Tyr Asn Leu Gln Phe Lys Asn Leu Ala Lys Thr Ile Glu Ile Pro
785 790 795 800
Asp Phe Val Thr Pro Lys Leu Gln Glu Pro Val Lys Thr Glu Pro Thr
805 810 815
Lys Pro Leu Gln Glu Ala Arg Pro Arg Glu Pro Val Gln Lys Leu Val
820 825 830
Pro Glu Glu Thr Arg Leu Pro Lys Leu Glu Leu Thr Lys Leu Gly Gln
835 840 845
Pro Asn Leu Met Ser Asn Ala Arg Lys Pro Leu Ile Val Leu Val Ser
850 855 860
Val Leu Ile Val Ala Tyr Ala Ser Lys Asn Leu Tyr Arg Arg Tyr Phe
865 870 875 880
Lys
<210> 26
<211> 2646
<212> DNA
<213> 甜叶菊
<400> 26
atggatttcg gtatagcaga gactttggcc gaggcattga agcaaaaccg gtaccatgca 60
aggagatgct ttgagcgttt tacatcacgt ggaaaaagga tggtgaagcc tcaagagtta 120
ttacacatga ttgaaaaaac cattgacgac aagcttgaaa gaacgaaggt cttggagggc 180
tcaatgggac aaatcttgag ttccacacag gaggcaatcg ttattccacc atatgttatt 240
ttaggattga gagcgaatcc aggacaatgg gcatacgtta agatcaatgc tgatgacgtc 300
actgttgagt cactcacacc ttcacaatat ctaaagttca aagaatccat ctacgatcaa 360
gaatgggcaa aggacgaaaa tgcccttgaa ctagatttcg gagcgttcga ctttgatacg 420
cctcgattaa tcctcccgtc atctatcggc aacggactcg gttacatttc aaagttcatg 480
acttcaagaa ttggtggtga tctagaaaac gcgaagccgt tgcttgacca cttgcttgct 540
ctaaaatatc atggagagaa gcttatgatc aatgagacaa tagatacagt ttcaaagctc 600
cagaaagcat taattgttgc tgatgtctac ttatctgcac acccgaaaga cgaacaatat 660
caaaccttag agcccaagct taaagaatgg ggatttgaga aaggatgggg agatactgct 720
gaaagagtta gagagacaat gaaaatgctt tcggagattc ttcaagcacc cgacccgatt 780
aacatgcaat cgttctttag caggcttccg gtggtcttca atattgtcat attttctatt 840
catgggtatt ttggtcaatc agatgttctt ggattacctg ataccggagg gcaggttgtt 900
tacattcttg atcaagttaa agcattagag gaagagatat tgctaagaat aaaaatgcaa 960
ggattgaatg caaagcctcg gattcttgtg gtgagtcgac tcattcccga cgcacaagga 1020
acaaagtgta acgaggaaat ggaaccgatc ttgaacacaa tgcattcaca catccttcgg 1080
gttcctttca gaacctcaaa aggcgttgtt cctcaatggg tatcgcggtt tgacatctac 1140
ccgtatcttg aaagattctc acaggacgct gcctctaaaa tacttgaagt aatggaatgt 1200
aaaccagatc tcatacttgg aaactacaca gatggaaaca ttgttgcatc acttatagcc 1260
aaaaagtttg gagtaacaca ggggacgatt gcacacgcgt tagagaagac aaagtacgaa 1320
gattcggatg ttaactggaa aaactttgaa aaaaagtatc atttctcatg tcaatttacc 1380
gcggatttga tctcaatgaa cgctgcagat ttcataatca caagcactta tcaagaaatt 1440
gtgggaagca aacaaagacc cggacagtat gagacccacg gggcgtttag tatgcccgga 1500
ctttgtagag tcgtgtcggg catcaacgtg tttgatccta agttcaacat tgcttcaccc 1560
ggtgcggaac aatcggttta ttttccgtac accgagaagg agaaacggtt aacggatttt 1620
catcccgcaa ttaaagaact acttttcaac gaacaagaca atgacgagca tatgggatac 1680
ctcgcggatg taaccaaacc gataatattc tcaatggcga ggctcgatac ggtgaagaac 1740
ataacagggt taaccgagtg gttcggtaag aacaaacgac ttagaagtct tgtaaacttg 1800
gttgttgtcg cggggttctt cgatccatca aaatctaaag accgtgaaga gatggaggaa 1860
atcaagaaaa tgcatgaact aatagagaaa tacaaactca agggtcagat gagatggatc 1920
gcggctcaaa acgataggac ccgcaatggt gaattgtatc ggtgtatttc cgatacgaag 1980
ggagcgtttg tgcagcccgc gttgtatgag gcttttgggc tcacggttat cgaggcaatg 2040
aactgcggtc tcccgacttt tgcaaccaat caaggcgggc ccgcggagat catagttgac 2100
ggagtttcgg gatttcatat tgatcccgtt aacggagatg aatcaagcaa caagattgct 2160
gatttcttca cgaaatgcaa agtcgatggc gagtattggg accgcgtgtc gcaagcggga 2220
cttcaacgta tttacgagtg ctacacatgg aagatgtatg ctaacaaagc attgaacatg 2280
ggttcgatgt atggtttttg gaggcaatta aacaaagaaa ctaagcaagc gaagcaacga 2340
tacatcgata tcttgtataa cttacaattc aagaatttgg caaaaaccat tgaaatccct 2400
gattttgtga ctcctaaact tcaagaaccg gtcaaaaccg aaccaacaaa accattacaa 2460
gaagcaagac ctcgagaacc ggtgcaaaaa ctggtaccgg aagaaacccg actgccaaaa 2520
ctagagttga ccaagcttgg tcaaccgaat ttgatgagca atgcaagaaa accattgatt 2580
gttcttgttt ctgtgttgat agttgcatat gcatccaaga acttgtatag gaggtatttc 2640
aaatag 2646
<210> 27
<211> 458
<212> PRT
<213> 甜叶菊
<400> 27
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Val Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Val Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Thr Val Met Arg Ile Leu Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Gln Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Gly Glu Val Ser Cys Leu Ile Thr Asp Gln Ile Trp Tyr
115 120 125
Phe Thr Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Cys
180 185 190
Gly Phe Ser Met Trp Lys Gln Gly Lys Glu Ile Phe Glu Asn Ile Thr
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Pro Trp Leu Asp Gln Gln Pro
260 265 270
Ser Arg Ser Val Leu Tyr Val Ser Phe Gly Ser Ala Thr Glu Val Asp
275 280 285
Ala Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Ala Phe Ala Phe Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Gly Tyr Ile Arg Gln Asn Ala Ser Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ala Tyr Ile Ser Ser Leu
450 455
<210> 28
<211> 1377
<212> DNA
<213> 甜叶菊
<400> 28
atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60
ccagttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctccaaagga 120
ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180
ttcactttca gattcatcct cgacaacgac ccacaagacg tacgcatttc caatctaccg 240
actcatggtc cgctcactgt tatgcggatt ctgattatca acgaacacgg agctgacgaa 300
ttacaacgcg aactggaact gttgatgtta gcttctgaag aagatggaga ggtatcgtgt 360
ttaatcaccg atcagatttg gtacttcacg caatctgttg ctgacagtct taacctccga 420
cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480
tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540
gggtttccta tgctgaaagt gaaagatatc aagtgtggtt tttcgatgtg gaaacaaggc 600
aaagagatat tcgagaacat tacgaaacaa acaaaagcat cttcaggagt catctggaac 660
tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720
agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780
gatcgaaccg tttttccatg gttagaccaa caaccgtcac gttcggtact gtatgttagt 840
tttggtagtg ctactgaagt ggatgcgaaa gatttcttgg aaatagctcg tgggttggtt 900
gatagcaagc agtcgttttt atgggtggtt cgacctggtt ttgtcaaggg ttcgacgtgg 960
gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttccg 1020
cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080
tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggcttt tgcgttcgat 1140
caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200
gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260
ggatacatta gacagaatgc aagtgttttg aaacaaaagg cagatgtttc tttgatgaag 1320
ggtggttcgt cttacgaatc attagagtct ctagttgctt acatttcatc gttgtaa 1377
<210> 29
<211> 424
<212> PRT
<213> 甜叶菊
<400> 29
Met Leu Gln Leu Ala Thr Tyr Leu His Ser Gln Gly Ile Ser Ile Thr
1 5 10 15
Ile Ala Gln Tyr Pro Asn Phe Asn Ser Pro Asp Ser Ser Asn His Pro
20 25 30
Glu Leu Thr Phe Leu Pro Leu Ser Ser Gly Asn Leu Ser Val Ala Asp
35 40 45
Ile Ser Gly Gly Phe Phe Lys Phe Ile Gln Thr Leu Asn His Asn Cys
50 55 60
Lys Pro His Phe Arg Glu Tyr Leu Val Gln Asn Met Ser Ser Asp Asp
65 70 75 80
Lys Glu Ser Ile Val Ile Ile Arg Asp Asn Leu Met Phe Phe Ala Gly
85 90 95
Glu Ile Ala Gly Glu Leu Gly Leu Pro Ser Ile Ile Leu Arg Gly Ser
100 105 110
Asn Ala Val Met Leu Thr Ala Ser Asp Ile Ile Pro Gln Leu His Gln
115 120 125
Glu Gly Arg Phe Pro Pro Pro Asp Ser Leu Leu Gln Glu Thr Ile Pro
130 135 140
Glu Leu Val Pro Phe Arg Tyr Lys Asp Leu Pro Phe Ile Gly Tyr Pro
145 150 155 160
Ile His Gln Thr Leu Glu Phe Ser Ile Thr Met Met Thr Pro Lys Ser
165 170 175
Pro Ala Ser Ala Ile Leu Ile Asn Thr Leu Glu Phe Leu Glu Gln Ser
180 185 190
Ala Leu Thr Gln Ile Arg Asp His Tyr Lys Val Pro Val Phe Thr Ile
195 200 205
Gly Pro Leu His Lys Ile Val Thr Thr Arg Ser Thr Ser Ile Leu Glu
210 215 220
Glu Asp Thr Ser Cys Ile Asn Trp Leu Asp Lys Gln Ser Pro Lys Ser
225 230 235 240
Val Val Tyr Val Ser Leu Gly Ser Leu Ala Lys Leu Asp Glu Lys Val
245 250 255
Ala Ser Glu Met Ala Cys Gly Leu Ala Met Ser Asn His Lys Phe Leu
260 265 270
Trp Val Val Arg Pro Gly Met Val His Gly Phe Glu Trp Val Glu Phe
275 280 285
Leu Pro Asp Ser Leu Val Gly Glu Met Lys Ala Arg Gly Leu Ile Val
290 295 300
Lys Trp Ala Pro Gln Thr Thr Val Leu Ala His Asn Ala Val Gly Gly
305 310 315 320
Phe Trp Ser His Cys Gly Trp Asn Ser Thr Ile Glu Cys Leu Ala Glu
325 330 335
Gly Val Pro Met Met Cys Gln Pro Phe Phe Ala Asp Gln Leu Leu Asn
340 345 350
Ala Arg Tyr Val Ser Asp Val Trp Lys Thr Gly Phe Glu Ile Val Ile
355 360 365
Glu Lys Gly Glu Ile Ala Cys Ala Ile Lys Arg Val Leu Val Asp Glu
370 375 380
Glu Gly Glu Glu Met Arg Gln Arg Ala Met Glu Ile Lys Glu Lys Val
385 390 395 400
Lys Ile Ala Ile Asn Asp Gly Gly Ser Ser Tyr Asp Ser Phe Lys Asp
405 410 415
Leu Val Ala Phe Ile Ser Ser Leu
420
<210> 30
<211> 1275
<212> DNA
<213> 甜叶菊
<400> 30
atgcttcagc ttgcaactta cctccattct caagggattt caataaccat cgctcagtac 60
cccaacttca actcgccgga ttcttccaac catccagaac taaccttcct cccactatcc 120
tccggcaact tatccgtcgc cgacatctcc ggcggctttt tcaagttcat ccaaactctt 180
aaccataact gcaaacccca tttccgggaa taccttgttc agaacatgag ttctgatgat 240
aaggaatcaa tcgttatcat ccgtgataat ctcatgtttt tcgccggaga aatcgccggc 300
gagctgggtc tgccttcgat cattttacgt ggcagcaatg ctgtcatgtt gactgctagc 360
gacatcatcc ctcaacttca tcaagaaggt cgttttccgc caccagattc tttgttgcag 420
gaaacaattc cagaactggt tccattcaga tacaaagatc taccatttat tggctatcca 480
atacatcaaa cccttgaatt tagtatcacc atgatgaccc ccaaatcacc tgcttccgcc 540
attcttatca acaccctcga atttcttgaa caatcggcat taacccagat ccgtgatcat 600
tacaaagttc cagtttttac aatcggacca ttgcacaaaa tagtcacaac tcgttccact 660
agcattcttg aagaagatac aagttgcatc aattggttag ataaacaatc acccaaatca 720
gtggtttatg tgagtttagg aagcttagca aagttggatg aaaaggttgc atctgaaatg 780
gcatgtggtt tagccatgag taaccataag ttcctatggg tggttcgacc cggtatggtt 840
catgggtttg aatgggtcga gtttttgccg gatagtttgg tgggtgaaat gaaggctaga 900
ggtttgattg tgaaatgggc accccagacg acggttttgg cgcataacgc ggttggtgga 960
ttttggagtc attgcggttg gaactcgacc atagaatgct tagctgaagg ggtcccgatg 1020
atgtgtcaac cgttttttgc tgatcagttg ttgaatgcta ggtatgtgag tgatgtttgg 1080
aagacgggtt ttgagattgt tatcgagaaa ggtgagattg cgtgcgcgat taaacgagtt 1140
ttggtggatg aagaaggcga agaaatgagg cagagagcta tggagattaa agaaaaggtt 1200
aaaattgcaa tcaacgatgg tggttcttct tatgactcgt tcaaggactt ggtggcgttt 1260
atttcatcac tctaa 1275
<210> 31
<211> 485
<212> PRT
<213> 甜叶菊
<400> 31
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Gln Leu Ser Lys Leu
35 40 45
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
Thr Asp Val His Pro Glu Asp Ile Gln Tyr Leu Lys Lys Ala Val Asp
100 105 110
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
Trp Ile Ile Tyr Asp Phe Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
Ser Leu Gly Ile Ser Arg Ala Tyr Phe Cys Val Ile Thr Pro Trp Thr
145 150 155 160
Ile Ala Tyr Leu Ala Pro Ser Ser Asp Ala Met Ile Asn Asp Ser Asp
165 170 175
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Met Glu
195 200 205
Pro Tyr Glu Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Met Val
210 215 220
Phe Lys Gly Ser Asp Cys Leu Leu Phe Lys Cys Tyr His Glu Phe Gly
225 230 235 240
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
Val Val Tyr Val Ala Leu Gly Ser Glu Ala Leu Val Ser Gln Thr Glu
290 295 300
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Cys Asp Gln Pro Leu
385 390 395 400
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
Arg Ser Val Val Val Glu Asn Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
Arg Ala Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
Ile Asp His Glu Ser
485
<210> 32
<211> 1458
<212> DNA
<213> 甜叶菊
<220>
<400> 32
atgtacaacg ttacttatca tcaaaattca aaagcaatgg ctaccagtga ctccatagtt 60
gacgaccgta agcagcttca tgttgcgacg ttcccatggc ttgctttcgg tcacatcctc 120
cctttccttc agctttcgaa attgatagct gaaaagggtc acaaagtctc gtttctttct 180
accaccagaa acattcaacg tctctcttct catatctcgc cactcataaa tgttgttcaa 240
ctcacacttc cacgtgtcca agagctgccg gaggatgcag aggcgaccac tgacgtccac 300
cctgaagata ttcaatatct caagaaggct gttgatggtc ttcaaccgga ggtcacccgg 360
tttctagaac aacactctcc ggactggatt atttatgatt ttactcacta ctggttgcca 420
tccatcgcgg ctagcctcgg tatctcacga gcctacttct gcgtcatcac tccatggacc 480
attgcttatt tggcaccctc atctgacgcc atgataaatg attcagatgg tcgaaccacg 540
gttgaggatc tcacgacacc gcccaagtgg tttccctttc cgaccaaagt atgctggcgg 600
aagcatgatc ttgcccgaat ggagccttac gaagctccgg ggatatctga tggataccgt 660
atggggatgg tttttaaggg atctgattgt ttgcttttca aatgttacca tgagtttgga 720
actcaatggc tacctctttt ggagacacta caccaagtac cggtggttcc ggtgggatta 780
ctgccgccgg aaatacccgg agacgagaaa gatgaaacat gggtgtcaat caagaaatgg 840
ctcgatggta aacaaaaagg cagtgtggtg tacgttgcat taggaagcga ggctttggtg 900
agccaaaccg aggttgttga gttagcattg ggtctcgagc tttctgggtt gccatttgtt 960
tgggcttata gaaaaccaaa aggtcccgcg aagtcagact cggtggagtt gccagacggg 1020
ttcgtggaac gaactcgtga ccgtgggttg gtctggacga gttgggcacc tcagttacga 1080
atactgagcc acgagtcagt ttgtggtttc ttgactcatt gtggttctgg atcaattgtg 1140
gaagggctaa tgtttggtca ccctctaatc atgctaccga ttttttgtga ccaacctctg 1200
aatgctcgat tactggagga caaacaggtg ggaatcgaga taccaagaaa tgaggaagat 1260
ggttgcttga ccaaggagtc ggttgctaga tcactgaggt ccgttgttgt ggaaaacgaa 1320
ggggagatct acaaggcgaa cgcgagggcg ctgagtaaaa tctataacga cactaaggtg 1380
gaaaaagaat atgtaagcca attcgtagac tatttggaaa agaatgcgcg tgcggttgcc 1440
atcgatcatg agagttaa 1458
<210> 33
<211> 473
<212> PRT
<213> 甜叶菊
<400> 33
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 34
<211> 1422
<212> DNA
<213> 甜叶菊
<400> 34
atggccacat ctgactctat cgttgatgac agaaaacaat tgcatgttgc tactttccca 60
tggttggcct ttggacacat tctgccctac ttgcaattgt caaagctgat tgcagaaaaa 120
ggtcataagg tgtccttttt gtctaccaca agaaacatcc agagactaag ttctcatatt 180
tctccattga ttaatgtggt tcagttgacc ttgcctagag tccaagaact tcccgaagac 240
gcagaagcta ctactgatgt tcaccctgaa gatatcccat atctaaagaa ggcatctgat 300
ggacttcaac cagaagtaac caggtttttg gagcagcaca gtcctgactg gattatctat 360
gattatactc attactggct tccatccatc gcagctagtc taggcatttc cagagctcat 420
ttctctgtca ctaccccatg ggcaattgca tatatgggtc cttctgctga tgcaatgatc 480
aacggttctg atggtaggac cactgttgaa gatttaacta cacctccaaa gtggttccca 540
tttcctacta aagtttgttg gcgaaaacac gatctggcac gtttggtccc atataaggct 600
ccaggtatct ccgatggata tcgaatgggt ctggtgctaa agggttctga ttgtctgtta 660
tctaagtgtt accacgaatt tggaactcaa tggcttcctc tattagagac tctgcatcaa 720
gttccagttg ttcctgtcgg tctgctacca cctgaaattc ccggtgacga aaaggacgaa 780
acttgggttt ccataaaaaa atggctggat ggtaagcaga agggtagtgt tgtatatgtc 840
gctttaggct ccgaggtttt ggtatcccag actgaagttg tggaacttgc cttaggattg 900
gagttgtccg gtttgccatt cgtctgggca tatagaaagc caaagggacc agctaagtca 960
gactcagttg aattgccaga tggtttcgta gaaaggacaa gagacagagg attggtttgg 1020
acatcatggg ccccacaatt gagaattctg agtcatgaaa gtgtgtgtgg attcttgact 1080
cactgtggct ctggcagtat tgttgaagga ctgatgtttg gacacccact gataatgttg 1140
ccaatcttcg gtgaccaacc tctgaatgca agattgctgg aggataaaca agttggtatc 1200
gaaatcccaa gaaacgagga agacggctgc ctgactaagg aatcagttgc acgtagttta 1260
agatctgtag ttgttgaaaa agaaggtgaa atatataagg ctaacgctag agaactttca 1320
aagatataca atgataccaa ggtggagaaa gaatatgttt cacagtttgt ggactatttg 1380
gagaaaaacg ctagagccgt tgctatcgat cacgaatcat ag 1422