CN108136208B

CN108136208B - 大麻素糖苷前药以及合成方法

Info

Publication number: CN108136208B
Application number: CN201680060327.5A
Authority: CN
Inventors: 布兰登·J·齐普; 珍妮·M·哈德曼; 罗伯特·T·布鲁克
Original assignee: Commander In Chief Qingfengdie Bioscience Co
Current assignee: Commander In Chief Qingfengdie Bioscience Co
Priority date: 2015-09-22
Filing date: 2016-09-22
Publication date: 2022-07-15
Anticipated expiration: 2036-09-22
Also published as: US20220168428A1; CN108136208A; AU2016326518A1; EP3352855A4; EP3352855A1; US11207414B2; AU2016326518B2; JP2018528977A; NZ741487A; CA2999764A1; WO2017053574A1; BR112018005639A2; US20180264122A1

Abstract

本发明涉及适于位点特异性和组织特异性递送大麻素分子的大麻素糖苷前药。本发明还涉及通过糖基转移酶介导的大麻素分子的糖基化来制备所述大麻素糖苷前药的方法。

Description

大麻素糖苷前药以及合成方法

技术领域

本发明涉及药物开发领域，具体涉及新型大麻素(cannabinoid)糖苷前药以及通过酶介导的碳水化合物转移来制备其的方法。

背景技术

大麻(Cannabis sativa)中的植物大麻素(phytocannabinoid)长期以来一直用于改变精神状态，但最近的发现阐明了特定大麻素化合物用于治疗和维持各种疾病和病况的潜力。特别重要的是非精神分子大麻二酚(cannabidiol，CBD)，它作为抗精神病药物、神经保护剂具有的潜在的治疗应用，并且具有治疗多种其他疾病的潜力(Zuardi 2012，Iuvone2009，分别综述Mechoulam 2002)。CBD 的一个缺点是，它很容易被光、热和酸性或碱性条件氧化成THC和CBN衍生物，另一个对CBD有害的特性是其极其疏水的性质，使其难以配制和递送。另外，目前的CBD和THC药物组合物具有令人不快的感官特性，并且其疏水性会导致在上颚上挥之不去。

大麻素极其疏水的性质，使其在药物制剂中的使用复杂化。已经发现了非共价方法来改善大麻素的溶解度，通过利用载体碳水化合物如环化麦芽糖糊精 (Jarho 1998)。共价化学操作产生了溶解度有所改善的新型CBD前药 (WO2009018389，WO 2012011112)。为了使CBD功能化，甚至还通过合成化学操作创造出来了氟取代的CBD化合物(WO2014108899)。上述策略在改善 CBD溶解度方面都有一些成功，但是它们会产生改变组合物的非天然组合物，并在水解时释放非天然前药部分。

越来越多的证据表明糖苷能够作为前药起作用并且还具有直接的治疗效果。糖苷前药能够改善药物生物利用度或改善药物药代动力学，包括更多的位点特异性或组织特异性药物递送、血浆中更一致的药物水平以及药物的持续释放或延迟释放。先前已经证明了类固醇糖苷位点特异性递送至结肠的情况 (Friend 1985，Friend 1984)，并且能够治疗局部病症如炎性肠病。类固醇的糖基化使得生物活性分子能够在酸性胃环境中稳定存在并递送至大肠中，其中糖苷配基(aglycone)被结肠细菌产生的糖苷酶释放，然后被吸收至体循环中。糖苷酶还普遍存在于不同的组织中(Conchie 1959)，所以通过绕过消化道和结肠的方法递送糖苷，如静脉内递送，将能够靶向递送至糖苷酶表达增加的其他细胞和组织。此外，α-糖苷酶和β-糖苷酶在整个肠道和其他组织中的分布不同，因此不同形式的糖苷可提供独特的药代动力学特征，包括特定疾病区域的靶向递送的制剂，或在某些位置处靶向释放，这可以促进或限制本文所述的大麻素和其他化合物的全身吸收。许多生物活性化合物都是糖苷，包括多类化合物成员，例如激素、抗生素、甜味剂、生物碱和类黄酮。虽然普遍认为糖苷比糖苷配基更具水溶性，但文献综述对结构-活性关系进行了分析并确定几乎不可能为不同类别化合物的糖苷生物活性定义一个一般模式(Kren 2008)。

与合成化学一样，体内解毒策略是改善大麻素溶解度的另一模型。CBD在人体中被肝葡糖基转移酶葡糖醛酸化，但迄今为止在体外测定中证实仅UGT1A9 和UGT2B7具有较小活性(美国专利号8,410,064)。体外测定显示，大麻酚(CBN) 被人UGT1A10高效葡糖醛酸化(美国专利号8,410,064)。CBD的葡糖醛酸化是一种增加CBD溶解度和促进通过肾脏移除和排泄的机制。在寻找针对大麻素的葡糖基转移酶活性时，当大麻酚(cannabinol)与半夏(Pinellia ternata)的体外细胞培养物一起孵育时，发现大麻酚被糖基化(Tanaka 1993)。类似地，当与来自半夏和毛曼陀罗(Datura inoxia)的组织培养物一起孵育时，显示大麻二酚被糖基化，产生CBD-6′-O-β-D-吡喃葡萄糖苷和CBD-(2′,6′)-O-β-D-二吡喃葡萄糖苷(Tanaka 1996)。这些生物转化研究证明，这两种化合物的有限糖基化作用可能通过未知植物葡糖基转移酶发生，并且它们以微量生产，但迄今为止，没有鉴定出能够糖基化大麻素的具体植物葡糖基转移酶蛋白，不能大量生产纯化的大麻素糖苷，并且尚未对大麻素糖苷的生物活性或药物性质进行表征。

大麻素含有羟基化的疏水性骨架，类似于在甜叶菊(Stevia rebaudiana)植物中发现的甜菊醇糖苷(steviol glycoside)的甜菊醇骨架。UGT76G1是来自甜菊(Stevia)的葡糖基转移酶，其能够将二级葡萄糖转移至甜菊醇糖苷的C13-OH 和C19-COOH位置上的初级糖基化的3C-羟基，因此其底物包括甜菊醇单糖苷 (steviolmonoside)，甜菊糖苷(stevioside)，甜茶素(rubusoside)，RebA，RebD， RebG，RebE等(Richman等人2005，SteviaFirst Corp，未发表的研究)。UGT76G1 的底物识别位点能够结合多个甜菊醇糖苷并使其糖基化，但之前并不知道其对任意其他糖苷具有糖基化活性，并且之前根本没有确定UGT76G1对任何糖苷配基化合物有活性。由于UGT76G1能够将位于C13羟基和C19羧基上的初级糖上的甜菊醇糖苷糖基化，因此它示出了双功能糖基化作用。环糊精葡聚糖转移酶(CGTase，Toruzyme 3.0L，Novozymes Inc.)是淀粉酶家族的一个成员，并以其环化麦芽糖糊精链的能力而闻名。少为人知的CGT酶活性是歧化线性麦芽糖糊精链并转移到受体糖分子上(Li2012)。

尚未有已知的大麻素糖苷可作为大麻素前药。也没有一种已知的用于有效地区域选择性地生产大麻素糖苷的方法，这是生产大量纯化的个体糖苷并评估其制药学性质(包括评估体内药物药代动力学和药效学)所必需的。为了解决上述问题，已经从各种生物体中筛选了葡糖基转移酶以鉴定糖基化大麻素的候选物，并鉴定作为潜在大麻素前药和作为具有新性质和功能的新型大麻素组合物的大麻素糖苷。

提供此背景信息是为了揭示申请人认为可能与本发明相关的信息。不一定认可、也不应该认为任意上述信息都构成了本发明的现有技术。

发明内容

本发明涉及新型大麻素糖苷前药以及通过酶介导的碳水化合物转移来制备其的方法。

本发明的一个目的是提供一种大麻素糖苷前药。根据本发明的一个方面，提供了具有式(I)结构的大麻素糖苷前药化合物，或其药学上相容的盐：

其中R是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基； R′是H或β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；并且 A是通过大麻素化合物、内源性大麻素化合物或类香草素(vanilloid)化合物上的羟基反应而形成的糖苷配基部分。

根据本发明的另一方面，提供了一种用于将大麻素药物位点特异性递送至受试者的方法，其包括以下步骤：向需要其的受试者施用根据本发明的大麻素糖苷前药。

根据本发明的另一方面，提供了生产大麻素糖苷的方法，其包括在一种或多种糖基转移酶的存在下，将大麻素糖苷配基与一种或多种糖供体一起孵育。

本文所述技术的其他方面将在说明书的以下部分中提出，其中具体实施方式是出于充分公开本技术的优选实施方案的目的，而不对其进行限制。

附图说明

图1A示出了本发明的糖基化方法中使用的糖苷配基。图1B示出了糖苷配基上可能的糖基化点。

图2示出了大麻二酚(CBD)糖基化的可能产物。

图3示出了次大麻二酚(CBDV)糖基化的可能产物。

图4示出了大麻二酚(CBD)糖基化的可能的旋转产物。

图5示出了次大麻二酚(CBDV)糖基化的可能的旋转产物。

图6示出了所提出的底物大麻二酚(CBD)在UGT76G1的催化位点上的叠加。

图7示出了四氢大麻酚(Δ9-THC)糖基化的可能产物。

图8示出了大麻酚(CBN)糖基化的可能产物。

图9示出了花生四烯酸乙醇酰胺(AEA)糖基化的可能产物。

图10示出了2-花生四烯酸乙醇酰胺(2-AG)糖基化的可能产物。

图11示出了1-花生四烯酸乙醇酰胺(1-AG)糖基化的可能产物。

图12示出了N-二十二碳六烯酰乙醇胺(DHEA)糖基化的可能产物。

图13示出了辣椒素糖基化的可能产物。

图14示出了香草醛糖基化的可能产物。

图15A和15B示出了姜黄素糖基化的可能产物。

图16是CBD糖基化反应产物的HPLC线迹图(linetrace)。

图17是CBDV糖基化反应产物的HPLC线迹图。

图18是Δ9-THC糖基化反应产物的HPLC线迹图。

图19是CBN糖基化反应产物的HPLC线迹图。

图20是1-AG和2-AG糖基化反应产物的HPLC线迹图。

图21是synaptamide(DHEA)糖基化反应产物的HPLC线迹图。

图22是AEA糖基化反应产物的HPLC线迹图。

图23是香草醛糖基化反应产物的HPLC线迹图。

图24是辣椒素糖基化反应产物的HPLC线迹图。

图25是CBDg1(VB104)与糖基转移酶UGT76G1的糖基化反应产物的 HPLC线迹图。

图26是CBDg1(VB104)与糖基转移酶Os03g0702000的糖基化反应产物的HPLC线迹图。

图27是CBD糖基化的分离产物VB104的¹NMR谱图。

图28是CBD糖基化的分离产物VB110的¹NMR谱图。

图29是选定的大麻素和大麻素糖苷的C18保留时间对cLogP值的图。

图30中的 A是小肠提取物生物利用度测定的分析结果的图解表示。

图30中的 B是大肠提取物生物利用度测定的分析结果的图解表示。

具体实施方式

全文使用以下缩写：

CB 大麻素

CBD 大麻二酚

CBDV 次大麻二酚(Cannabidivarin)

CBG 大麻萜酚(Cannabigerol)

Δ9-THC或THC 四氢大麻酚(Tetrahydrocannabinol)

CBN 大麻酚

CBNV Cannabinavarin

CBDA 大麻二酚酸(Cannabidiolic acid)

THCV 四氢次大麻酚(Tetrahydrocannabivarin)

UGT UDPG依赖性葡糖基转移酶

UDPG 尿苷二磷酸葡萄糖

UDP 尿苷二磷酸

AEA 花生四烯酸乙醇酰胺(Arachidonoyl ethanolamide，

aka，anandamide)

2-AG 2-花生四烯酸乙醇酰胺

1-AG 1-花生四烯酸乙醇酰胺

DHEA N-二十二碳六烯酰乙醇胺(N-Docosahexaenoyl

ethanolamine，aka，synaptamide)

SUS 蔗糖合成酶。

术语“吡喃葡萄糖苷”用于命名分子并且是通过葡萄糖的1-位(异头碳)上的羟基连接至糖苷配基的β-D-葡萄糖的简写。

术语“糖苷配基”在本申请中用于指糖苷化合物的非糖苷部分。

术语“前药”是指在施用后必须通过代谢过程进行化学转化才能成为活性药理学药剂的化合物。

术语“大麻素糖苷前药”通常指大麻素化合物、内源性大麻素化合物和类香草素化合物的糖苷。大麻素糖苷前药通常通过糖苷酶的作用经历糖苷键的水解，以将活性大麻素、内源性大麻素或类香草素化合物释放至受试者体内所需部位。本发明的大麻素糖苷前药也可以用术语“大麻糖苷(cannaboside)”来指代。

术语“大麻素”在本申请中用于泛指在大麻中发现的并且作用于大麻素受体的化合物。“大麻素”化合物包括但不限于，大麻二酚(CBD)，次大麻二酚 (CBDV)，大麻萜酚(CBG)，四氢大麻酚(Δ9-THC或THC)，大麻酚(CBN)，大麻二酚酸(CBDA)和四氢次大麻酚(THCV)。特别优选的大麻素化合物是 CBD、CBDV、THC和CBN。

本申请中使用的术语“内源性大麻素”用于指以下化合物，包括花生四烯酸乙醇酰胺(AEA)，2-花生四烯酸乙醇酰胺(2-AG)，1-花生四烯酸乙醇酰胺(1-AG) 和二十二碳六烯酰乙醇胺(DHEA，synaptamide)，油酰乙醇酰胺(OEA)，二十碳五烯酸乙醇酰胺(eicsapentaenoyl ethanolamide)，前列腺素乙醇胺，二十二碳六烯酰乙醇胺，亚麻酰基乙醇酰胺，5(Z),8(Z),11(Z)-二十碳三烯酸乙醇胺(蜂蜜酸乙醇胺)，十七烷醇乙醇酰胺，硬脂酰乙醇酰胺，二十二碳烯酰乙醇酰胺 (docosaenoyl ethanolamide)，神经酰基乙醇酰胺(nervonoyl ethanolamide)，二十三烷酰乙醇酰胺，木蜡酰乙醇酰胺(lignoceroylethanolamide)，肉豆蔻酰乙醇酰胺，十五烷酰乙醇酰胺，棕榈油酰基乙醇酰胺，二十二碳六烯酸(DHA)。特别优选的内源性大麻素是AEA、2-AG、1-AG和DHEA。

术语“类香草素”在本申请中用于指这样的化合物：其包括香草基并且作用于类香草素受体，如TRPV1。“类香草素”化合物包括但不限于香草醛(vanillin)、辣椒素和姜黄素。

如本文所使用的，术语“约”是指与标称值相差+/-10％的变化。应该理解，这样的变化总是包括在本文提供的给定值中，无论是否特别提及。

如本文所用，术语“受试者”或“患者”是指需要治疗的动物。在一个实施方案中，动物是人。

除非另外定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。

根据本发明，大麻素、内源性大麻素和类香草素被用作葡萄糖基转移酶的底物，在所述大麻素、内源性大麻素和类香草素上连接一个或多个糖分子以产生新的大麻素糖苷前药。所得到的大麻素糖苷前药表现出位点特异性或组织特异性递送，水性溶解度改善以改善大麻素、内源性大麻素和类香草素类药物分子的药理学递送，和/或持续释放或延迟释放。

还根据本发明，大麻素糖苷前药在糖苷键水解后转化以提供活性大麻素、内源性大麻素和类香草素药物。因此，本发明表明，具有疏水性糖苷配基部分的糖苷在胃肠道或糖苷酶表达增加的组织中经历葡萄糖水解，在靶组织或器官中产生疏水性大麻素化合物。

糖苷的葡萄糖残基通常在胃中被酸水解或被肠道中的糖苷酶酶切，包括被肠道微生物群落在肠道不同区域表达的α-糖苷酶和β-糖苷酶酶切。因此，糖苷在被摄入后被水解以将所需化合物释放到肠道或靶组织中。

在一个实施方案中，大麻素药物的糖基化提供了这样的大麻素糖苷前药：其能够在口服给药后保持在酸性胃环境中，从而允许前药递送到大肠中，在大肠中，大麻素糖苷配基可以被结肠细菌所产生的糖苷酶释放。

在一个实施方案中，大麻素药物的糖基化提供了这样的大麻素糖苷前药：其适合靶向递送至糖苷酶表达增加的组织。在向受试者胃肠外施用大麻素糖苷前药制剂后，大麻素糖苷配基被靶组织中的糖苷酶释放。

以下内容也在本发明的范围内：大麻素糖苷前药也可用作无需葡萄糖裂解的药剂，其中它们与单独的母体化合物相比表现出新的药效学性质。本发明大麻素糖苷前药的水性溶解度增加还使得能够得到在透皮或水性制剂中递送的新制剂，如果配制疏水性大麻素、内源性大麻素和类香草素分子这是不可能实现的。

在本发明的一个实施方案中，提供了具有式(I)结构的大麻素糖苷前药化合物，或其药学上相容的盐：

其中R是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基； R′是H或β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；并且 A是通过大麻素化合物、内源性大麻素化合物或类类香草素化合物上的羟基反应而形成的糖苷配基部分。

根据本发明的一个实施方案，A为A′、A″或A″′；

其中A′为：

其中A″为：

并且其中A″′为：

其中G是H、β-D-吡喃葡萄糖基、3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基或β-D-吡喃葡萄糖基-(1→3)-β-D-吡喃葡萄糖基-(1→3)-D-吡喃葡萄糖基；或其药学上相容的盐。

根据本发明的一个实施方案，大麻素糖苷前药是大麻素的糖苷，其中前药具有式(I′)结构：

其中R为H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基； R′是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；并且其中A′为：

其中G是β-D-吡喃葡萄糖基、3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基或β-D-吡喃葡萄糖基-(1-3)-β-D-吡喃葡萄糖基-(1-3)-D-吡喃葡萄糖基。

式(I′)化合物包括表1至4中列出的化合物。

根据本发明由CBD(VB101)的糖基化作用产生的、落入式(I′)范围内的示例性大麻二酚(CBD)-糖苷包括：

根据本发明由CBDV(VB201)的糖基化作用产生的、落入式(I′)范围内的示例性次大麻二酚(CBDV)-糖苷包括：

根据本发明由Δ9-THC(VB301)的糖基化作用产生的、落入式(I′)范围内的示例性四氢大麻酚(Δ9-THC)-糖苷包括：

根据本发明由CBN(VB401)的糖基化作用产生的、落入式(I′)范围内的示例性大麻酚(CBN)-糖苷包括：

根据本发明的一个实施方案，大麻素糖苷前药是内源性大麻素的糖苷，所述前药具有式(I″)结构：

其中

R为H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；

R′为H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；并且其中，A″为：

式(I″)化合物包括表5至8中列出的化合物。

根据本发明由AEA(VB501)的糖基化作用产生的、落入式(I″)范围内的示例性花生四烯酸乙醇胺(AEA)-糖苷包括：

根据本发明由2-AG(VB601)的糖基化作用产生的、落入式(I″)范围内的示例性2-花生四烯酸乙醇胺(2-AG)-糖苷包括：

根据本发明由1-AG(VB701)的糖基化作用产生的、落入式(I″)范围内的示例性1-花生四烯酸乙醇胺(1-AG)-糖苷包括：

根据本发明由DHEA(VB801)的糖基化作用产生的、落入式(I″)范围内的示例性N-二十二碳六烯酰乙醇胺(DHEA)-糖苷包括：

根据本发明的一个实施方案，大麻素糖苷前药是类香草素的糖苷，所述前药具有式(I″′)结构：

其中

R是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；

R′是H或β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；并且其中A″′为：

式(I″′)化合物包括表9至11中列出的化合物。

根据本发明由辣椒素(VB901)的糖基化作用产生的、落入式(I″′)范围内的示例性辣椒素-糖苷包括：

根据本发明由香草醛(VB1001)的糖基化作用产生的、落入式(I″′)范围内的示例性香草醛-糖苷包括：

根据本发明由姜黄素(VB1101)的糖基化作用产生的、落入式(I″′)范围内的示例性姜黄素-糖苷包括：

在一个实施方案中，提供了一种用于将大麻素药物位点特异性递送至受试者的方法，所述方法包括以下步骤：向需要其的受试者施用一种或多种根据本发明的大麻素糖苷前药。在一个实施方案中，递送位点是大肠。在一个实施方案中，递送位点是直肠。在一个实施方案中，递送位点是肝脏。在一个实施方案中，递送位点是皮肤。

在一个实施方案中，提供了促进将大麻素药物通过鼻内、立体定向或鞘内递送或跨越受试者的血脑屏障递送运输到大脑的方法，其包括向需要其的受试者施用根据本发明的大麻素糖苷前药。

根据本发明，大麻素糖苷前药可用于治疗受益于施用大麻素药物或施用大麻素药物可改善的病况。可以通过施用本发明的大麻素糖苷前药来治疗或改善的病况包括但不限于炎症性肠病，包括诱导克罗恩病(Crohn′s disease)和结肠炎缓解和诱导溃疡性结肠炎缓解。通过施用本发明的大麻素糖苷前药可以实现的益处是：肠道和直肠的炎症减轻，肠道、直肠中的疼痛减轻，以及神经性疼痛和腹痛减轻，和结直肠癌的增殖或细胞毒性抑制。大麻素或大麻素糖苷的其他治疗适应症、作用或应用可包括但不限于厌食，恶心，呕吐，疼痛，消耗综合征，HIV消耗(HIV-wasting)，化疗引起的恶心和呕吐，癫痫，精神分裂症，肠易激综合征，抽搐，痉挛状态，惊厥病症(seizure disorder)，酒精使用病症，药物滥用病症，成瘾，癌症，肌萎缩侧索硬化，多形性成胶质细胞瘤，神经胶质瘤，眼内压升高，青光眼，大麻使用障碍，图雷特氏综合征(Tourette′s syndrome)，肌张力障碍，多发性硬化，白质病症，脱髓鞘病，慢性创伤性脑病，脑白质病，格林-巴利综合征(Guillain-Barre syndrome)，炎性肠病，胃肠病，细菌感染，MRSA，败血症，败血性休克，病毒感染，关节炎，皮炎，类风湿性关节炎，系统性红斑狼疮，抗炎，抗痉挛，抗精神病，抗氧化，神经保护，抗癌，免疫调节作用，神经性疼痛，与疱疹后神经痛相关的神经性疼痛，糖尿病性神经病，带状疱疹，烧伤，光化性角化病，口腔疮疡和溃疡，会阴切开后疼痛，银屑病，瘙痒症，痛风，软骨钙质沉着病，关节疼痛，纤维肌痛，肌肉骨骼疼痛，神经病理性手术后并发症。

在一个实施方案中，大麻素糖苷前药以药物组合物的形式被施用，所述药物组合物还包括药学上可接受的载体、稀释剂、赋形剂或佐剂。在一个实施方案中，药物组合物包括一种或多种大麻素糖苷前药和一种或多种药学上可接受的载体、稀释剂、赋形剂和/或佐剂。为了向受试者施用，可将药物组合物配制成通过多种途径施用，包括但不限于口服，局部，直肠，肠胃外和鼻内施用。

药物组合物可以包括约1％至约95％的本发明的大麻素糖苷前药。配制成以单剂量形式施用的组合物可包括，例如，约20％至约90％的本发明的大麻素糖苷前药，而非单剂量形式的组合物可包括，例如，约5％至约20％的本发明的大麻素糖苷前药。单位剂量形式的非限制性实例包括片剂，安瓿，糖衣丸，栓剂和胶囊剂。

在优选的实施方案中，药物组合物被配制成口服施用。用于口服施用的药物组合物可以配制成，例如，片剂，锭剂(troche)，糖锭剂(lozenge)，水性或油性悬浮剂，可分散的粉剂或颗粒剂，乳剂硬胶囊剂或软胶囊剂，或糖浆剂或酏剂。这种组合物可以根据本领域已知的用于制备药物组合物的标准方法来制备，并且可以含有一种或多种选自以下组的试剂：甜味剂、调味剂、着色剂和防腐剂，从而提供药学上精美可口的制剂。片剂含有与合适的无毒的药学上可接受的赋形剂混合的活性成分，所述合适的无毒的药学上可接受的赋形剂包括，例如，惰性稀释剂，如碳酸钙、碳酸钠、乳糖、磷酸钙或磷酸钠；造粒剂和崩解剂，如玉米淀粉或海藻酸；粘合剂，如淀粉、明胶或阿拉伯胶，以及润滑剂，如硬脂酸镁、硬脂酸或滑石粉。片剂可以是未包衣的，或者可以通过已知技术对其进行包衣从而延迟在胃肠道中的崩解和吸收，并由此在较长时期内提供持续作用。例如，可以使用延时材料如单硬脂酸甘油酯或二硬脂酸甘油酯来进一步促进药物化合物向消化道中所需位置的递送。

用于口服使用的药物组合物还可以呈现为硬明胶胶囊的形式，其中活性成分与惰性固体稀释剂例如碳酸钙、磷酸钙或高岭土混合，或呈现为软明胶胶囊的形式，其中活性成分与水或油性介质如花生油、液体石蜡或橄榄油混合。

配制为水性悬浮剂的药物组合物含有与一种或多种合适的赋形剂混合的 (多种)活性化合物，所述合适的赋形剂例如悬浮剂，如羧甲基纤维素钠、甲基纤维素、羟丙基甲基纤维素、海藻酸钠、聚乙烯吡咯烷酮、羟丙基-β-环糊精、黄蓍胶和阿拉伯胶；分散剂或润湿剂，如天然存在的磷脂例如卵磷脂或环氧烷与脂肪酸的缩合产物，例如聚氧乙烯硬脂酸酯，或环氧乙烷与长链脂肪醇的缩合产物，例如七-十乙烯氧基鲸蜡醇(hepta-decaethyleneoxycetanol)，或者环氧乙烷与衍生自脂肪酸和己糖醇的偏酯的缩合产物，例如聚氧乙烯山梨糖醇单油酸酯，或环氧乙烷与衍生自脂肪酸和己糖醇酐的偏酯的缩合产物，例如聚乙烯山梨醇酐单油酸酯。水性悬浮剂还可以含有一种或多种防腐剂，例如对羟基苯甲酸乙酯或正丙酯，一种或多种着色剂，一种或多种调味剂或一种或多种甜味剂，如蔗糖、甜菊糖或糖精。

可以通过将(多种)活性化合物悬浮于植物油(例如花生油、橄榄油、芝麻油或椰子油)或矿物油(例如液体石蜡)中而将药物组合物配制成油性悬浮剂。油性悬浮剂可以含有增稠剂，例如蜂蜡、硬石蜡或鲸蜡醇。可加入如上所述的甜味剂和/或调味剂来提供可口的口服制剂。可以通过加入抗氧化剂如抗坏血酸来保存这些组合物。

药物组合物可以配制成可分散的粉末剂或颗粒剂，其随后可以通过加入水用于制备水性悬浮剂。这种可分散的粉末剂或颗粒剂提供了与一种或多种分散剂或润湿剂、悬浮剂和/或防腐剂混合的活性成分。合适的分散剂或润湿剂和悬浮剂以上面已经提到的那些为例。这些组合物还可以包括另外的赋形剂，例如甜味剂、调味剂和着色剂。

本发明的药物组合物还可以配制成水包油乳剂。油相可以是植物油，例如橄榄油或花生油，或矿物油，例如液体石蜡，或者可以是这些油的混合物。包括在这些组合物中的合适的乳化剂包括天然存在的树胶，例如阿拉伯胶或黄蓍胶；天然存在的磷脂，例如大豆、卵磷脂；或衍生自脂肪酸和己糖醇、酐类的酯或偏酯，如脱水山梨糖醇单油酸酯，以及所述偏酯与环氧乙烷的缩合产物，例如聚氧乙烯山梨糖醇单油酸酯。乳剂还可以任选地含有甜味剂和调味剂。

可以通过将(多种)活性成分与一种或多种甜味剂(例如甘油、丙二醇、山梨糖醇或蔗糖)混合而将药物组合物配制成糖浆剂或酏剂。这样的制剂还可以任选地含有一种或多种缓和剂(demulcent)、防腐剂、调味剂和/或着色剂。如果需要，组合物中可以包括其它活性成分。在一个实施方案中，糖苷前药可以与其他成分或物质组合，所述其他成分或物质具有糖苷酶活性，或以其他方式改变多种化合物的体内药物代谢和药代动力学特征，包括纯化形式的那些成分或物质以及在食品、饮料和其他产品中发现的此类化合物。在一个实施方案中，大麻素糖苷前药与具有直接的糖苷酶活性或者有助于修饰肠道微生物群落 (这将改变肠道的一个或多个区域中的糖苷酶活性)的物质组合施用或一起配制。这种组合物的实例包括但不限于酸奶、益生元、益生菌或粪便移植物。

在进一步优选的实施方案中，药物组合物被配制成肠胃外施用。如本文所用，术语“肠胃外”包括皮下注射，静脉内、肌内、鞘内、胸骨内注射或输注技术。

可根据本领域已知的方法并使用一种或多种如上提及的合适的分散剂或润湿剂和/或悬浮剂，将胃肠外药物组合物配制成无菌可注射水性或油性悬浮剂。无菌可注射制剂可以是无毒的肠胃外可接受的稀释剂或溶剂中的无菌可注射溶液或混悬液，例如1,3-丁二醇溶液。可使用的可接受媒介和溶剂包括但不限于水、林格氏液、乳酸林格氏液和等渗氯化钠溶液。其他实例包括常规用作溶剂或悬浮介质的无菌固定油和各种温和固定油，包括例如合成甘油单酯或甘油二酯。脂肪酸如油酸也可用于制备注射剂。

由于大麻素的高亲脂性，这些分子通常很难通过膜如哺乳动物(包括人) 的皮肤吸收，并且大大地限制了在合理的时间范围内在合适的表面积上向需要其的受试者成功透皮施用治疗有效量的大麻素。因此提出，本发明的大麻素糖苷前药通过将疏水性大麻素糖苷配基与亲水糖苷部分缀合，提供了有利于被动扩散的两亲特性的分子，其更容易通过皮肤被吸收。

因此，在一个实施方案中，药物组合物被配制成局部施用。这种局部用制剂可以呈现为例如气溶胶喷雾剂，粉剂，棒剂，颗粒剂，乳膏剂，液体乳膏剂，糊剂，凝胶剂，洗剂，软膏剂，在海绵或棉花涂药器上，或作为水性液体、非水液体、水包油乳液或油包水液体乳液中的溶液剂或悬浮剂。

局部用药物组合物可以用增稠剂(胶凝剂)配制。本文使用的增稠剂可以包括阴离子聚合物，例如聚丙烯酸(Noveon，Inc.，Cleveland，Ohio的

)，羧基聚亚甲基(carboxypolymethylene)，羧甲基纤维素等，包括

聚合物的衍生物，例如

Ultrez 10，

940，

941，

954，

980，

981，

ETD 2001，

EZ-2和

EZ-3以及其他聚合物如

聚合乳化剂和

聚卡波非。增稠剂或胶凝剂的存在量足以提供组合物所需的流变性能。

局部用药物组合物可以用渗透促进剂配制。渗透促进剂的非限制性实例包括C8-C22脂肪酸，如异硬脂酸、辛酸和油酸；C8-C22脂肪醇，如油醇和月桂醇；C8-C22脂肪酸的低级烷基酯，如油酸乙酯、肉豆蔻酸异丙酯、硬脂酸丁酯和月桂酸甲酯；C6-C22二酸的二(低级)烷基酯，如己二酸二异丙酯；C8-C22 脂肪酸的甘油单酯，如甘油单月桂酸酯；四氢糠醇聚乙二醇醚；聚乙二醇、丙二醇；2-(2-乙氧基乙氧基)乙醇；二甘醇单甲醚；聚氧乙烯的烷基芳基醚；聚氧乙烯单甲醚；聚氧乙烯二甲醚；二甲基亚砜；甘油；乙酸乙酯；乙酰乙酸酯； N-烷基吡咯烷酮；和萜烯。

局部用药物组合物可以进一步包括如药物形成领域已知的润湿剂(表面活性剂)、润滑剂、润肤剂、抗微生物防腐剂和乳化剂。

通过使用微针阵列药物递送系统可以进一步促进大麻素糖苷前药的透皮递送。

制备药物组合物的其他药物组合物和方法是本领域已知的，并且描述于例如“Remington:The Science and Practice of Pharmacy”(以前称为“RemingtonsPharmaceutical Sciences”)；Gennaro，A.，Lippincott，Williams&Wilkins，Philadelphia，PA(2000)中。

上述本发明的药物组合物包括能有效达到预期目的的量的一种或多种本发明的大麻素糖苷前药。因此，术语“治疗有效剂量”是指例如通过改善待治疗的疾病或病症的症状、预防该疾病或病症或改变疾病的病理来改善要治疗的受试者的状态的大麻素糖苷前药的量。确定化合物的治疗有效剂量完全在本领域技术人员的能力范围之内。在一个实施方案中，可以组合多种大麻素糖苷以使得能够以位点特异性的方式同时递送多种大麻素，包括THC和CBD，其在某些方面的影响可能是协同的(Russo 2006)。因此，在一个实施方案中，药物组合物包括一起配制成单一剂型的一种或多种CBD-糖苷和一种或多种THC-糖苷。

可以由医师根据与需要治疗的受试者相关的因素来确定要向受试者施用的确切剂量。调整剂量和施用以提供所需水平的大麻素糖苷前药和/或在前药水解后获得的大麻素药物化合物。在确定合适的剂量时可考虑的因素包括疾病状态的严重程度，受试者的一般健康状况，受试者的年龄、体重和性别，饮食，施用的时间和频率，(多种)药物组合，反应敏感性和对治疗的耐受/反应。可以由专业人员根据上述因素以及例如具体制剂的半衰期和清除率等因素来设计给药方案。

根据本发明，提供了一种生产大麻素糖苷的方法，所述方法包括在一种或多种糖基转移酶的存在下，将大麻素糖苷配基与一种或多种糖供体一起孵育。

在一个实施方案中，所述一种或多种糖基转移酶是UGT76G1或UGT76G1 样葡糖基转移酶。在一个实施方案中，所述一种或多种糖基转移酶包括UGT76G1 或UGT76G1样葡糖基转移酶和Os03g0702000或Os03g0702000样葡糖基转移酶。

在一个实施方案中，所述一种或多种糖供体选自由以下组成的组：UDP-葡萄糖，UDP-葡萄糖醛酸，UDP-甘露糖，UDP-果糖，UDP-木糖，UDP-鼠李糖， UDP-氟代脱氧葡萄糖及其组合。在一个优选的实施方案中，糖供体是UDP-葡萄糖。

根据本发明，大麻素糖苷配基是大麻素、内生大麻素或类香草素。在一个优选的实施方案中，通过本发明的方法产生的大麻素糖苷前药是式(I)的化合物。

在一个实施方案中，产生大麻素糖苷的方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶的存在下，将大麻素糖苷配基与UDP- 葡萄糖一起孵育。

在一个实施方案中，产生大麻素糖苷的方法包括在允许糖基化的条件下，在第一糖基转移酶和第二糖基转移酶的存在下，将大麻素糖苷配基与一种或多种糖供体一起孵育。在一个实施方案中，糖供体是UDP-葡萄糖，第一糖基转移酶是UGT76G1或UGT76G1-样葡糖基转移酶，第二糖基转移酶是Os03g0702000 或Os03g0702000-样葡糖基转移酶。

在一个实施方案中，产生大麻素糖苷的方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶和Os03g0702000或Os03g0702000样葡糖基转移酶的存在下，将大麻素糖苷配基与UDP-葡萄糖一起孵育。

在一个实施方案中，产生大麻素糖苷的方法包括在允许糖基化的条件下，在环糊精葡聚糖转移酶的存在下，将大麻素糖苷配基与麦芽糖糊精一起孵育。

在一个实施方案中，产生大麻素糖苷的方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶和环糊精葡聚糖转移酶的存在下，将大麻素糖苷配基与UDP-葡萄糖和麦芽糖糊精一起孵育。

在一个优选的实施方案中，在产生大麻素糖苷的方法中使用的糖基转移酶是UGT76G1或UGT76G1样葡糖基转移酶。在一个实施方案中，UGT76G1或 UGT76G1-样葡糖基转移酶包括如SEQ ID NO：1、3、5或7中所示的序列。

在一个实施方案中，在产生大麻素糖苷的方法中使用的糖基转移酶是Os03g0702000或Os03g0702000样葡糖基转移酶。在一个实施方案中， Os03g0702000或Os03g0702000样葡糖基转移酶包括如SEQ ID NO：9所示的序列。

在一个实施方案中，产生大麻素糖苷的方法进一步包括与蔗糖合成酶一起孵育。在一个实施方案中，蔗糖合成酶包括如SEQ ID NO：15、17、19、21、 23或25所示的序列。

在一个实施方案中，用于产生大麻素糖苷前药的方法包括在产生大麻素糖苷配基的细胞或植物中表达一种或多种糖基转移酶，并分离大麻素糖苷前药。

正如从C18分析型HPLC色谱柱加速洗脱所证明的，大麻素的糖基化改善了在水溶液中的溶解度，表明新型大麻素糖苷需要很少的有机溶剂来从疏水性色谱柱中洗脱。通过检验纯化的固体大麻糖苷的水性溶解度进一步证实了这种改善的溶解度，其中溶液成功制备成高达500mg/ml(50％质量/体积)，具有大麻糖苷的高级(higher)糖苷形式的混合物。考虑到溶解度的显著改善和大麻素上的新型二级和三级糖基化作用，糖基化的大麻素可以作为有效的前药用于将大麻素选择性递送至所需组织，其中葡萄糖分子可以被水解从而释放糖苷配基大麻素。此外，糖基化作用通过保护CBD和CBDV使其免于氧化和C6′-羟基的闭环作用而促进了CBD和CBDV的稳定性，这分别防止其分解为Δ9-THC或Δ9-THCV，随后分别分解为大麻酚(CBN)或Cannabinavarin(CBNV)。

增加大麻素上糖类附着物的多样性和复杂性，以及施用糖苷混合物将改变前药的递送动力学，从而提供缓释制剂药物。大麻素在人类中的主要解毒机制是CYP450介导的CBD和CBDV的C7甲基的羟基化，或THC和CBN的C11 甲基的羟基化；由于空间位阻防止了大麻素-糖苷结合在CYP450活性位点，大麻素间苯二酚环的受体羟基的糖基化可以提供免受C7/C11羟基化并随后从体内消除的保护。事实上，CBD的羟基被认为有助于与小肠上皮中的解毒细胞色素 P450 CYP3A4的结合(Yamaori 2011)。由于这些作用导致的胃和小肠中的降解或代谢降低还可导致任意糖基化的产物在口服递送时总生物利用度更高。

在一些情况下，为了使化合物发挥其主要生物活性，可能需要在体内从糖苷中去除糖。因此，由于其主要生物学作用可能仅在口服摄入后发生，糖苷前药可以实现抵抗滥用的稳定药物制剂。由于大多数滥用抑制(abuse-deterrent) 化合物都是基于简单混合或配制的抑制物(deterrent)，因此仍然可以通过简单的物理和化学方法来破坏它们。作为一个实例，本文所述的β-糖苷在β-糖苷酶的作用下将仅仅释放糖苷配基。已知β-糖苷酶由占据哺乳动物大肠的微生物分泌，因此在口服摄入后，糖苷前药将保持糖基化直至其到达大肠。类似的方法可用于通过糖基化的其它化合物的滥用抵抗，滥用抑制和位点特异性递送。已经发现，甜叶菊中的UGT76G1酶(SEQ ID NO.1)将糖供体UDP-葡萄糖(UDPG) 的葡萄糖分子转移到CBD的羟基上以产生新的CBD-O-糖苷(表1，图2和4)。 UDPG被UGT76G1反转化以产生β-D-葡萄糖残基，所述β-D-葡萄糖残基共价连接到CBD上的羟基受体位点。为了提高催化效率，进行了UGT76G1开放阅读框(ORF)密码子优化(SEQ ID NO.4和6)以在毕赤酵母(Pichiapastoris) 中表达。与其对甜菊醇糖苷的活性类似，UGT76G1具有高生产力且对于CBD 的平衡常数(Keq)为～24。通过实验和分析确定，UGT76G1具有将多个葡萄糖部分应用于CBD分子的独特能力。在CBD与UGT76G1和UDPG长时间一起孵育后，反应混合物的HPLC分析产生8种糖苷产物流动性基团，表明UGT76G1 能够糖基化CBD上的C2′和C6′羟基，以及糖基化具有二级和三级葡萄糖部分的初级葡萄糖残基。UGT76G1的二级和三级糖基化发生在受体糖的C3羟基上 (3→1连接性)，正如其在甜叶菊中的活性所表明的那样，产生O-(3-1)-糖苷和后续产物。CBD-糖苷产物流动性基团还表明，CBD可以在UGT76G1活性位点上向前和向后对接，为糖基化形成相对于大麻素骨架而言顺式样构象(机制描绘在图3中)，或者可能C1′(C6由Mazur2009描述)处的键的旋转自由度允许羟基在糖基化后旋转，将UDPG附近的另一个羟基置于活性位点中，在大麻素骨架上为糖基化形成反式样构象(机制描绘在图4中)。图6中描绘了对接在 UGT76G1的活性位点中的可能的CBD分子，其中CBD叠加在UGT76G1， RebaudiosideE(RebE)的双功能底物上(图6)。

由于CBD成功地被UGT76G1糖基化，将CBDV与UGT76G1和UDPG一起孵育以检验糖基化活性。在HPLC分析中观察到CBDV耗尽，此外还出现了另外四个产品峰移动性基团，这依赖于UGT76G1和UDPG的添加。所形成的四种新产物表现出与CDBV相同的吸光度特征，并且被确定为初级糖苷 CBDV-2′-O-吡喃葡萄糖苷、CBDV-6′-O-吡喃葡萄糖苷和二级糖苷 CBDV-2′-O-(3-1)-二吡喃葡萄糖苷和CBDV-6′-O-(3-1)-二吡喃葡萄糖苷(分别为化合物VB202、VB206、VB204和VB208，表2)。经过额外的反应时间，确定还形成了高级(higher order)糖苷产物。CBDV-糖苷生产与由UGT76G1生产 CBD-糖苷类似(表2)，并且完成的Keq为～24。鉴于CBDV-糖苷产物的数目， UGT76G1将多个葡萄糖分子转移到CBDV上的C2′和C6′羟基上，并且转移到初级和二级糖基化上。

当大麻素Δ9-THC与UGT76G1和UDPG一起孵育时，反应混合物的HPLC 分析显示有三个主要产物峰流动性基团。这三种产物被鉴定为Δ9-THC-1-O-吡喃葡萄糖苷、Δ9-THC-1-O-(3-1)-二吡喃葡萄糖苷和Δ9-THC-1-O-(3-1,3-1)三吡喃葡萄糖苷(正式的吡喃编号，表3，图7)。鉴于Δ9-THC的刚性结构在C1′间苯二酚环附着物周围没有与CBD相同的旋转自由度，大麻素骨架在UGT76G1的活性位点被位于UDPG糖供体的Δ9-THC C1羟基识别(吡喃编号，图1B)。

由于UGT76G1对所有所分析的其他植物大麻素都展现出糖基化活性，因此还检验了其对大麻酚(CBN)的糖基化活性。观察到UGT76G1对CBN的有效糖基化，与Δ9-THC模式类似，两者在间苯二酚环的C1位都共享单个羟基受体基团。用UGT76G1观察到的活性与酶活性位点对大麻素的广泛识别是一致的。

因为它们在大麻素骨架上的相似位置上具有羟基，可以将其他大麻素底物插入到UGT76G1糖基化反应基础结构中以产生新的大麻素糖苷。理想的候选物是大麻萜酚(CBG)、大麻色原烯(cannabichromene)(CBC)、大麻二酚羟基醌 (cannabidiol hydroxyquinone)(CBDHQ)，HU-331，Δ9-THC的其他异构体如Δ8-THC等，以及Δ9-THC的合成类似物如HU-210。

类似于UGT76G1的二级3→1次糖基化活性，确定在经UGT76G1初级糖基化后，稻的UGT酶Os03g0702000(SEQ ID NO.9)也能够将UDP-葡萄糖的其他葡萄糖部分转移到初级糖的C2-羟基上(表1-11，图7-图9和图12-14)。该糖基化活性与在已存在的初级葡萄糖残基上建立C2-羟基二级糖基化(2→1 连接性)中UGT Os03g0702000对甜菊醇糖苷的活性一致。用CBDV(表2，图 3)和THC(表2，图7)观察到了这种二级糖基化，分别产生新的CBDV和Δ9THC-1-O-(2-1)-二吡喃葡萄糖苷物质。与广泛的底物识别和反应性一致， Os03g0702000的这种活性进一步证明了图1A 中鉴定的剩余底物。

除了UDPG依赖性葡糖基转移酶活性外，环糊精-葡聚糖转移酶(CGTase， Toruzyme3.0L，Novozymes公司的招牌产品)能够将短的α-(1-4)-麦芽糖糊精链转移到大麻素的羟基上。CGTase还能够糖基化由UGT76G1和Os03g0702000 建立的初级和二级糖基化，导致以β-D-葡萄糖分子开始但终止于α-D-葡萄糖分子的碳水化合物附着物，称为β-引发的-α-葡糖基(β-primed-α-glucosyl)(表1-11)。经环糊精葡聚糖转移酶的α-糖基化介导的麦芽糖糊精转移可以发生在与大麻素共价连接的初级或二级糖的任意羟基上。本领域技术人员将会理解，这使得可能有任意数目的α-糖基链构象与表1-11中列出的糖苷连接。

与UGT76G1和Os03g0702000具有同源性的其他酶可用于产生相同的大麻素糖基化。用于建立初级糖基化的类似于UGT76G1的合适酶是UGT76进化枝的其他成员，如UGT76G2或UGT76H1。用UGT76G1蛋白质序列BLAST的结果产生49％一致性的最大同源性，多达66％阳性(相似一致性)。理想的候选物可能具有低的总肽一致性或相似性，但在UDPG催化位点附近的开口处可能具有保守的氨基酸。该序列以379位亮氨酸和一个更宽的肽序列SDFGLDQ(UGT76G1的375至381AA’s)为例。用于产生Os03g0702000的二级糖基化的合适的酶是UGT91进化枝的成员，包括UGT91D1和UGT91D2。

本文进行的糖基化反应包括以UDP-葡萄糖作为核苷酸糖供体，然而在UGT 之间存在一些交叉反应性，这允许使用其他核苷酸糖，如UDP-葡萄糖醛酸等。葡萄糖醛酸是肝脏中II相解毒UGT所使用的主要核苷酸糖，大麻素-葡萄糖醛酸苷是常见的解毒产物。可以用来提供碳水化合物部分以产生具有相似性质的新型糖苷的其他核苷酸糖包括UDP-葡萄糖醛酸、UDP-甘露糖、UDP-果糖、UDP- 木糖、UDP-鼠李糖、UDP-氟脱氧葡萄糖等。另外，核苷酸糖也可以组合使用以产生在同一糖苷配基骨架上含有多种类型的残基的糖苷。进一步改善本文所述的大麻素和其它化合物的溶解性和递送的其他策略包括将其糖基化，然后用其他配体或修饰使糖部分功能化。这样的实例包括硫酸化、肉豆蔻酰化、磷酸化、乙酰化等。

最近，因其在广泛的临床病理学中的作用和影响，内源性大麻素系统成为了研究热点。由于UGT76G1已被确定识别广泛类别的植物大麻素，因此假设相同的酶也会识别并糖基化内源性大麻素，内源性大麻素是被人类大麻素受体识别的内源性信号分子。在检验包括花生四烯乙醇胺(anandamide，AEA)、2-花生四烯酰乙醇酰胺(2-AG)、1-花生四烯酰乙醇酰胺(1-AG)和二十二碳六烯酰乙醇酰胺(DHEA，synaptamide)的四种原型内源性大麻素的样品时，发现 UGT76G1有效地糖基化每种内源性大麻素(表5-8，图9-12)。内源性大麻素的糖基化使得能够产生内源性大麻素-糖苷和其他脂肪酸神经递质-糖苷，代表了一种靶向递送内源性大麻素的新方法。

由于内源性大麻素如AEA、2-AG、1-AG和synaptamide被UGT76G1糖基化，因此假设相似的内源性大麻素也将是UGT76G1糖基化的合适底物。可能被 UGT76G1糖基化的其他内源性大麻素候选物包括油酰乙醇酰胺(OEA)，二十碳五烯酸乙醇酰胺，前列腺素乙醇胺，二十二碳六烯酰乙醇胺，亚麻油酰基乙醇酰胺，5(Z),8(Z),11(Z)-二十碳三烯酸乙醇胺(蜂蜜酸乙醇胺)，十七烷醇乙醇酰胺，硬脂酰乙醇酰胺，二十二碳烯酰乙醇酰胺，神经酰胺乙醇酰胺，二十三烷酰乙醇酰胺，木脂酰乙醇酰胺，肉豆蔻酰乙醇酰胺，十五烷酰乙醇酰胺，棕榈酰基乙醇酰胺，二十二碳六烯酸(DHA)和类似化合物。这些糖脂可能具有广泛的商业用途，范围从用作具有改善的溶解性和药代动力学性质的新型内源性大麻素药物的药物，至用作抗细菌剂，至用作与其他糖脂相似的洗涤剂，等等。

已经表征，AEA和CBD是1型toll样类香草素受体(toll-like vanilloid receptortype 1,TRPV1)的完全激动剂，所述1型toll样类香草素受体是辣椒素的受体。另外，已经证明其他大麻素和植物提取物(包括但不限于CBD、CBN、大麻萜酚(CBG)、和CBG的多种丙基同系物、THC和CBG)结合瞬时受体电位通道 (transient receptor potential channel,TRP)并对其具有活性(De Petrocellis 2011)。这包括刺激和脱敏TRPV1、TRPA1、TRPV2，以及TRPM8的拮抗作用。虽然刺激TRPV1会导致血管舒张和炎症，但辣椒素及其类似物可使受体对兴奋剂脱敏，并提供有效的抗炎作用(Bisogno 2001)。除了其他TRP之外，TRPA1可能会出现类似的作用。对于CBD，这可能在低于结合大麻素受体所需的浓度下，以及在人体临床试验和使用中通常达到的浓度范围内发生。除了作为TRPV1受体的直接激动剂之外，CBD还显示出抑制脂肪酸酰胺羟化酶(FAAH)，该酶负责促进内源性大麻素花生四烯酸乙醇胺的代谢(Watanabe，1998；DE e Petrocellis 2010)。鉴于这些植物大麻素作为不同TRP的配体，因此假定UGT76G1能够糖基化相同TRP的多种不同配体，包括TRPM8、TRPV2、TRPA1和TRPV1。辣椒素能够旋转成CBD样结构(Bisogno 2001)，因此推测辣椒素可能是UGT76G1 糖基化的合适底物。为此，据显示，UGT76G1能够以与美国商陆(Phytolacca americana)的PaGT3结构相同的方式糖基化辣椒素的类香草素部分 (Noguchi2009)。由于辣椒素的糖基化结构是类香草素头，进一步推测UGT76G1 能够糖基化最小的类香草素，即香草醛以及许多类似物。与此假设一致，通过 HPLC分析确定UGT76G1产生多种香草醛的糖苷产物(图14，表10)。为了更广泛地检验UGT76G1糖基化类香草素的能力，将姜黄素应用于糖基化反应作为底物，所述姜黄素是在姜黄香料中发现的良好表征的类香草素，从姜黄(Curcuma longa)中分离出来。与糖基化香草醛，UGT76G1能有效地糖基化姜黄素，产生多个糖苷产物峰，表明类似于用CBD和甜菊糖苷观察到的经UGT76G1产生的双功能识别和糖基化(图15A和15B，表11)。

大麻素糖苷也可以具有直接的生物活性和治疗效果，超过其糖苷配基形式的前药效用。槲皮素是一种抗氧化黄酮类化合物，在蔬菜中无处不在的，通常以其糖苷配基(aglyone)和糖基化形式存在。已经通过体外研究证明，槲皮素糖苷酸作为生物活性剂以及糖苷配基槲皮素的前体分子起作用(Terao 2011)。在许多情况下，包括发挥抗细菌和抗肿瘤作用的糖苷，糖苷残基对活性至关重要(Kren&Rezanka 2008)。

糖苷也被证明可以通过葡萄糖转运蛋白GLUT1来促进跨血脑屏障(BBB) 的转运。一个典型的实例是布洛芬的糖苷，能够显著增加大脑中布洛芬糖苷配基的浓度(Chen，2009)。与这些糖苷类似，本文所述的大麻素和其他化合物的糖苷可受益于跨BBB或其他屏障的增强的促进性转运。葡萄糖转运蛋白是一大组由人类基因组编码的膜蛋白，不仅在BBB中有发现，而且在许多不同的细胞和组织中有发现，包括脑、红细胞、脂肪、肌肉、肾脏、肝脏、肠和胰腺，因此专门定制糖基化以提供向任意这些组织的位点特异性递送。因此，在一个实施方案中，提供了促进大麻素药物跨越受试者的血脑屏障的转运的方法，所述方法包括向受试者施用根据本发明的大麻素糖苷前药。

由于少突胶质细胞保护性(少突保护性(oligoprotective))和一般神经保护作用，将大麻素和大麻二酚递送至大脑可能是特别有用的。已经证明，大麻素信号传递与少突胶质细胞分化(Gomez 2010)和大麻素促进少突胶质细胞祖细胞存活(Molina-Holgado2002)有关。包括大麻二酚作为主要成分的药物制剂已被批准用于治疗多发性硬化症(一种导致髓磷脂和少突胶质细胞祖细胞损失的神经退行性疾病)的肌肉痉挛和疼痛。已经证明，大麻二酚的作用通过减弱内质网应激途径来介导寡聚保护效应(Mecha 2012)。大麻二酚也因其抗精神病作用而被广泛研究，然而尚未描述其在保护少突胶质细胞和促进髓鞘再生方面的确切作用(Zuardi 2012)。尽管精神病的临床症状与表示髓鞘形成障碍的神经病理学分析之间存在相关性，但作为精神分裂症和其他精神病的驱动因素或原因的髓鞘形成障碍的作用仍然存在争议(Mighdoll 2015)。髓鞘再生也被认为可能有助于治疗阿尔茨海默病和其他形式的痴呆(Bartzokis 2004)。因此，对于其已建立的神经保护和少突保护效应，向大脑递送大麻素可能是特别有用的。大麻素糖苷药物制剂与影响其他方面的修复或再生(例如少突胶质细胞祖细胞分化或髓鞘再生)的其他试剂联合施用，也被证明是有益的。这包括例如抗LINGO-1 单克隆抗体、胍那苄(guanabenz)，sephin1，苯扎托品，氯马斯汀，多不饱和脂肪酸等的化合物。

在本工作中，发现UGT76G1、Os03g0702000和环糊精葡聚糖转移酶 (CGTase)对不同化学结构的甜菊醇糖苷和糖苷配基产物进行初级、二级和三级糖基化，所述不同化学结构的甜菊醇糖苷和糖苷配基产物包括大麻素、内源性大麻素、香草醛、姜黄素和辣椒素。

在Dewitte 2016所描述的筛选和分析方法中，使用50mm HPLC分离柱结合高溶剂流动速率，限制了糖苷产物的分离和总体检测。因此，对于许多化合物的糖基化反应产物的解释是推测性的，但仍然强化了UGT76G1具有广泛底物特异性的现有发现的意义。显然，本文描述的工作证明UGT76G1不仅可以糖基化甜菊醇糖苷，而且还可以糖基化其它形式的糖苷，以及新的糖苷配基化合物如大麻二酚。内部研究使用改进的分离方法，包括150mm长的C18色谱柱和低溶剂流速，还可以清楚地检测二级和三级糖苷。这些化合物无法通过Dewitte 2016 中描述的方法检测到，并且为以下内容提供了额外的证明：UGT76G1不仅能糖基化具有不同化学结构的化合物的能力，而且还能对这些相同化合物的糖苷进行多个更高级的糖基化作用。

本文所述的反应在体外使用重组酶和所有必需的辅因子进行，并且在从植物组织中提取大麻素之前，大麻植物细胞中UGT76G1酶的表达可能用于大麻素的体内生物转化。由于UGT76G1是来自植物甜叶菊的酶，它将在大麻属中兼容表达。在大麻植物中表达UGT76G1的理想策略是对UGT76G1开放阅读框进行基因工程改造，使其处于生产大麻素的相同组织(即植物的分泌毛状体)特异性的启动子元件下。合适的启动子元件包括拟南芥的胞质O-乙酰丝氨酸(硫醇) 裂解酶(OASA1)的启动子(Gutierrez-Alcala 2005)。用UGT76G1转化的候选物包括栽培大麻(Cannabis sativa)、印度大麻(Cannabis indica)和莠草大麻(Cannabis ruderalis)。类似的方法可以使用UGT76G1和类似的酶用于在许多其他不同的植物物种中植物生产糖基化的二级代谢产物，并且当植物物种已经产生大量所需糖苷配基产物或已知酶底物时可能是特别有用的。

在进行植物大麻素糖基化反应的过程中，CBD和THC显示出显著的抗微生物活性，甚至在无菌过滤装置失效后能防止大规模反应混合物被污染。在缺乏严格卫生技术的情况下，在酶促加工期间利用甜菊醇糖苷作为底物的在先中试规模糖基化反应非常容易受到感染。在维护或保养非常有限的条件下，CBD和 THC中试规模反应在相同反应器中能保持无菌状态持续一周以上。为此，提出使用糖苷配基大麻素及其各自的糖苷作为有效的抗微生物剂。因此，在一个实施方案中，提供了一种抗微生物剂，其包括有效量的根据本发明的大麻素糖苷前药。

类似地，在大量生产大麻素糖苷和水溶液制剂后，观察到水中的多种大麻素-糖苷具有类似于洗涤剂的发泡性质。这与其他糖苷洗涤剂如8-辛基糖苷、8- 辛基硫糖苷和类似物质类似，并且为大麻素-糖苷用作洗涤剂提供了潜在用途。因此，在一个实施方案中，提供了一种去污剂，其包括有效量的本发明的大麻素糖苷前药。

核酸

本发明提供了包括编码糖基转移酶的核苷酸序列在内的核酸。本发明的糖基转移酶能够进行初级、二级、三级糖基化作用或其组合。在某些实施方案中，糖基转移酶能够进行初级、二级、三级糖基化作用。在其他实施方案中，糖基转移酶能够进行二级和三级糖基化。在某些实施方案中，核酸编码葡糖基转移酶，包括但不限于UDP-葡糖基转移酶。葡糖基转移酶包括但不限于甜叶菊UDP- 葡糖基转移酶，如UGT76G1或UGT74G1或稻(Oryzasativa)葡糖基转移酶，如Os03g0702000。在其他实施方案中，本发明提供了包括编码环糊精葡聚糖转移酶的核苷酸序列在内的核酸。还提供了包括编码蔗糖合成酶的核苷酸序列在内的核酸。

核酸包括但不限于基因组DNA、cDNA、RNA、片段和修饰版本，包括但不限于其密码子优化版本。例如，为了在毕赤酵母或大肠杆菌(E.coli)中表达，可以对核苷酸序列进行密码子优化。核酸可以包括单独的糖基转移酶或蔗糖合成酶的编码序列，或其与另外的编码序列(例如，包括但不限于纯化标签)的组合。

在某些实施方案中，核酸包括编码UGT76G1或UGT76G1样葡糖基转移酶的序列。UGT76G1样葡糖基转移酶包括，例如，UGT76G1进化枝的其他成员，如UGT76G2或UGT76H1。在某些实施方案中，核酸包括编码UGT76G1葡糖基转移酶的序列，其具有如下列出的SEQ IDNO：1、3、5和7中任意一个所示的氨基酸序列或其片段和变体。

SEQ ID NO：1(UGT76G1(天然蛋白质序列))

MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKP KTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRREL ELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAH VSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILG KMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLD HDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWV VRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSG WNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEI ANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISS L

SEQ ID NO：3(在N-末端具有6×组氨酸标签的UGT76G1)

MHHHHHHGSGENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSI TIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEH GADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMT SSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSN WQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKH LTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLV DSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGA IGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYL ENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYES LESLVSYISSL

SEQ ID NO：5(在N-末端具有6×组氨酸-谷氨酰胺标签的UGT76G1)

MHQHQHQSGSMENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGF SITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINE HGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLM TSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYS NWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPK HLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGL VDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHG AIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVY LENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYE SLESLVSYISSL

SEQ ID NO：7

MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKP KTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRREL ELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAH VSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILG KMIKQTRASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLD HDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWV VRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSG WNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEI ANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISS LGSHHHHHH

在某些实施方案中，核酸包括编码UGT76G1的序列，其具有如AAR06912.1 中所示的氨基酸序列。在某些实施方案中，核酸分子包括编码UGT76G1葡糖基转移酶的序列并且包括如下列出的SEQ ID NO：2、4、6和8中任意一个所示的核苷酸序列或其片段和变体。

SEQ ID NO：2(UGT76G1天然核酸序列)

ATGGAAAATAAAACGGAGACCACCGTTCGCCGGCGCCGGAGAATAATATTA TTCCCGGTACCATTTCAAGGCCACATTAACCCAATTCTTCAGCTAGCCAATG TGTTGTACTCTAAAGGATTCAGTATCACCATCTTTCACACCAACTTCAACA AACCCAAAACATCTAATTACCCTCACTTCACTTTCAGATTCATCCTCGACAA CGACCCACAAGACGAACGCATTTCCAATCTACCGACTCATGGTCCGCTCGC TGGTATGCGGATTCCGATTATCAACGAACACGGAGCTGACGAATTACGACG CGAACTGGAACTGTTGATGTTAGCTTCTGAAGAAGATGAAGAGGTATCGT GTTTAATCACGGATGCTCTTTGGTACTTCGCGCAATCTGTTGCTGACAGTCT TAACCTCCGACGGCTTGTTTTGATGACAAGCAGCTTGTTTAATTTTCATGCA CATGTTTCACTTCCTCAGTTTGATGAGCTTGGTTACCTCGATCCTGATGACAAAACCCGTTTGGAAGAACAAGCGAGTGGGTTTCCTATGCTAAAAGTGAAA GACATCAAGTCTGCGTATTCGAACTGGCAAATACTCAAAGAGATATTAGGG AAGATGATAAAACAAACAAGAGCATCTTCAGGAGTCATCTGGAACTCATTT AAGGAACTCGAAGAGTCTGAGCTCGAAACTGTTATCCGTGAGATCCCGGC TCCAAGTTTCTTGATACCACTCCCCAAGCATTTGACAGCCTCTTCCAGCAG CTTACTAGACCACGATCGAACCGTTTTTCAATGGTTAGACCAACAACCGCC AAGTTCGGTACTGTATGTTAGTTTTGGTAGTACTAGTGAAGTGGATGAGAA AGATTTCTTGGAAATAGCTCGTGGGTTGGTTGATAGCAAGCAGTCGTTTTT ATGGGTGGTTCGACCTGGGTTTGTCAAGGGTTCGACGTGGGTCGAACCGT TGCCAGATGGGTTCTTGGGTGAAAGAGGACGTATTGTGAAATGGGTTCCA CAGCAAGAAGTGCTAGCTCATGGAGCAATAGGCGCATTCTGGACTCATAGC GGATGGAACTCTACGTTGGAAAGCGTTTGTGAAGGTGTTCCTATGATTTTC TCGGATTTTGGGCTCGATCAACCGTTGAATGCTAGATACATGAGTGATGTTT TGAAGGTAGGGGTGTATTTGGAAAATGGGTGGGAAAGAGGAGAGATAGCA AATGCAATAAGAAGAGTTATGGTGGATGAAGAAGGAGAATACATTAGACA GAATGCAAGAGTTTTGAAACAAAAGGCAGATGTTTCTTTGATGAAGGGTG GTTCGTCTTACGAATCATTAGAGTCTCTAGTTTCTTACATTTCATCGTTGTAA

SEQ ID NO：4(为在毕赤酵母中表达而优化的编码SEQ ID NO：3的密码子的序列)

ATGCACCACCATCACCACCATGGTTCTGGTGAAAACAAAACTGAAACTAC TGTTAGAAGAAGAAGAAGAATCATTTTGTTTCCAGTACCATTTCAAGGCCA TATCAATCCAATTCTTCAATTGGCCAATGTTTTGTACTCCAAAGGATTCTCC ATCACCATTTTTCACACCAATTTCAACAAACCAAAGACTTCCAACTATCCT CACTTCACTTTCAGATTTATTTTGGATAATGATCCTCAAGATGAAAGAATTT CCAATCTTCCGACTCATGGTCCTTTGGCTGGTATGAGAATTCCAATCATCAA TGAACATGGTGCTGATGAATTAAGAAGAGAATTGGAACTTTTGATGTTGGC TTCTGAAGAAGATGAAGAAGTTTCATGTTTAATCACTGATGCTTTATGGTAT TTTGCTCAATCTGTTGCTGATTCTTTGAATTTGCGACGGTTGGTTTTGATGA CTTCTTCTTTGTTCAACTTTCATGCTCATGTTTCTTTACCTCAGTTTGATGAACTTGGATATTTGGATCCAGATGACAAAACTAGATTGGAAGAACAAGCTAGT GGGTTTCCTATGTTGAAAGTCAAAGATATCAAATCTGCTTACTCCAACTGG CAAATTCTCAAAGAAATTTTGGGAAAAATGATCAAACAAACAAAAGCTTC TTCTGGAGTCATTTGGAACTCATTCAAAGAATTGGAAGAATCTGAATTGGA AACTGTTATTAGAGAAATTCCTGCTCCAAGTTTTTTGATTCCTTTGCCAAAA CATTTGACTGCTTCTTCTTCTTCTTTATTGGATCACGATAGAACTGTTTTTCA ATGGTTAGATCAACAACCTCCATCTTCTGTTTTGTATGTTAGTTTTGGATCTA CTTCTGAAGTTGATGAAAAAGATTTTTTGGAAATTGCTAGAGGTTTGGTTG ATTCCAAACAAAGTTTTTTATGGGTTGTTAGACCAGGATTTGTCAAAGGAT CTACTTGGGTCGAACCTTTGCCAGATGGATTTTTGGGAGAAAGAGGAAGA ATTGTCAAATGGGTTCCACAGCAAGAAGTTTTGGCTCATGGTGCTATTGGT GCTTTTTGGACTCATTCTGGATGGAACTCTACTTTGGAATCTGTTTGTGAAG GTGTTCCAATGATTTTTTCTGATTTTGGTTTGGATCAACCATTGAATGCTAG ATACATGTCTGATGTTTTGAAAGTTGGTGTTTATTTGGAAAATGGGTGGGA AAGAGGTGAAATTGCCAATGCTATTAGAAGAGTCATGGTTGATGAAGAAG GAGAATACATTAGACAAAATGCTAGAGTTTTGAAACAAAAAGCTGATGTTTCTTTGATGAAGGGTGGATCTTCTTATGAATCTTTGGAATCTTTGGTTTCTTA CATTTCTTCTCTTTAA

SEQ ID NO：6(为在毕赤酵母中表达而优化的编码SEQ ID NO：5的密码子的序列)

ATGCATCAACATCAACACCAATCTGGATCTATGGAGAACAAGACCGAGACT ACAGTTAGAAGAAGAAGAAGAATAATCCTGTTTCCAGTACCATTCCAAGG ACACATCAACCCAATCTTGCAGTTAGCAAATGTACTTTATTCTAAAGGCTTT AGTATTACGATTTTTCACACTAATTTTAATAAGCCAAAAACATCCAATTACC CTCACTTCACATTCAGATTTATCTTGGATAACGATCCTCAAGATGAACGTAT CTCCAACCTGCCAACACATGGACCATTGGCCGGTATGCGTATTCCTATAATC AACGAGCATGGTGCTGATGAGCTTAGACGTGAACTGGAACTGTTGATGCT GGCATCGGAGGAAGATGAAGAGGTTAGTTGCTTGATAACGGATGCCCTCT GGTATTTCGCACAATCAGTCGCTGACTCCTTGAACCTTAGGAGATTGGTATT GATGACTAGTTCGTTGTTCAACTTCCATGCCCATGTTTCTTTGCCTCAATTT GATGAGCTGGGTTATTTGGATCCTGACGATAAGACTCGTTTAGAAGAACAG GCGTCAGGCTTCCCCATGTTAAAGGTTAAAGATATTAAGTCCGCCTATTCTA ACTGGCAAATTCTCAAAGAGATTCTAGGGAAAATGATTAAACAAACCAAG GCCTCTTCAGGAGTAATCTGGAACAGTTTCAAAGAACTAGAAGAATCCGA GTTGGAAACTGTTATTCGTGAAATCCCTGCTCCATCTTTCCTTATCCCATTA CCAAAGCACCTCACTGCCTCCTCTAGTTCTCTTCTGGACCATGATAGAACA GTCTTTCAGTGGCTCGATCAGCAACCTCCATCTTCTGTCTTGTACGTTAGTT TTGGTTCCACCTCGGAAGTAGATGAAAAAGACTTTCTGGAAATTGCTCGA GGACTAGTTGACTCCAAGCAATCCTTTCTGTGGGTTGTTAGACCTGGATTC GTAAAAGGATCCACCTGGGTAGAACCCCTCCCAGATGGATTTTTGGGCGA AAGGGGAAGAATTGTTAAATGGGTGCCTCAACAAGAAGTTTTAGCTCATG GGGCCATTGGAGCTTTTTGGACTCATAGTGGATGGAATTCTACCTTAGAATC TGTTTGTGAAGGAGTTCCAATGATTTTTTCTGATTTTGGATTGGATCAGCCT CTTAATGCCAGATATATGTCCGATGTCCTCAAGGTCGGAGTGTACCTGGAA AATGGTTGGGAGAGAGGTGAGATTGCAAATGCTATACGTAGAGTCATGGTT GATGAAGAGGGCGAGTATATTAGACAAAACGCTAGAGTGCTAAAGCAGAA GGCCGATGTTTCCCTTATGAAGGGGGGAAGTTCATATGAGAGTTTGGAATC CCTAGTGTCCTACATTTCTTCGCTATAA

SEQ ID NO：8(为在大肠杆菌中表达而优化的编码SEQ ID NO：7的密码子的序列)

ATGGAAAATAAAACCGAAACCACCGTCCGTCGCCGTCGTCGTATCATTCTG TTCCCGGTCCCGTTCCAAGGTCACATCAACCCGATTCTGCAGCTGGCCAAC GTGCTGTATAGCAAAGGTTTCTCTATCACCATCTTCCATACGAACTTCAACA AACCGAAAACCTCTAACTACCCGCACTTTACGTTCCGTTTTATTCTGGATAA CGACCCGCAGGATGAACGCATCAGTAATCTGCCGACCCATGGTCCGCTGG CGGGTATGCGTATTCCGATTATCAACGAACACGGCGCAGATGAACTGCGTC GCGAACTGGAACTGCTGATGCTGGCCTCTGAAGAAGATGAAGAAGTTAGT TGCCTGATCACCGACGCACTGTGGTATTTTGCCCAGAGTGTTGCAGATTCC CTGAACCTGCGTCGCCTGGTCCTGATGACGAGCTCTCTGTTCAATTTTCAT GCCCACGTTTCCCTGCCGCAGTTCGATGAACTGGGTTATCTGGACCCGGAT GACAAAACCCGCCTGGAAGAACAAGCTTCAGGCTTTCCGATGCTGAAAGT CAAAGATATTAAAAGTGCGTACTCCAACTGGCAGATTCTGAAAGAAATCCT GGGTAAAATGATCAAACAAACCCGTGCAAGTTCCGGCGTCATCTGGAATT CCTTCAAAGAACTGGAAGAATCAGAACTGGAAACGGTGATTCGCGAAATC CCGGCTCCGTCTTTTCTGATTCCGCTGCCGAAACATCTGACCGCGTCATCG AGCTCTCTGCTGGATCACGACCGTACGGTGTTTCAGTGGCTGGATCAGCAACCGCCGAGTTCCGTGCTGTACGTTAGCTTCGGTAGCACCTCTGAAGTGGAT GAAAAAGACTTTCTGGAAATCGCTCGTGGCCTGGTTGATTCAAAACAATC GTTCCTGTGGGTGGTTCGCCCGGGTTTTGTGAAAGGCAGCACGTGGGTTGAACCGCTGCCGGATGGCTTCCTGGGTGAACGTGGTCGCATTGTCAAATGG GTGCCGCAGCAAGAAGTGCTGGCACATGGTGCTATCGGCGCGTTTTGGAC CCACTCAGGTTGGAACTCGACGCTGGAAAGCGTTTGTGAAGGTGTCCCGATGATTTTCTCGGATTTTGGCCTGGACCAGCCGCTGAATGCACGTTATATGAG CGATGTTCTGAAAGTCGGTGTGTACCTGGAAAACGGTTGGGAACGCGGCG AAATTGCGAATGCCATCCGTCGCGTTATGGTCGATGAAGAAGGCGAATATA TCCGTCAGAATGCTCGCGTCCTGAAACAAAAAGCGGACGTTAGTCTGATG AAAGGCGGTTCATCGTACGAATCCCTGGAATCACTGGTCTCCTACATTTCTT CTCTGGGCTCGCATCATCATCATCATCATTAA

在某些实施方案中，核酸分子编码UGT76G1葡糖并且包括GenBank登录号AY345974.1所示的核苷酸序列或其变体或片段。

在某些实施方案中，核酸包括编码UGT76G2葡糖基转移酶的序列。在具体的实施方案中，核酸包括编码UGT76G2葡糖基转移酶的序列，UGT76G2葡糖基转移酶具有如下列出的SEQ ID NO：27所示的氨基酸序列或其变体和片段。

SEQ ID NO：27

MENKTETTVRRRRRIILFPVPVQGHINPILQLANVLYSKGFSITIFHTNFNKPKT SNYPHFTFRFILDNDPQDVRISNLPTHGPLTVMRILIINEHGADELQRELELLM LASEEDGEVSCLITDQIWYFTQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFD ELGYLDPDDKTRLEEQASGFPMLKVKDIKCGFSMWKQGKEIFENITKQTKAS SGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFPWLDQ QPSRSVLYVSFGSATEVDAKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVE PLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIF SAFAFDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGGYIRQ NASVLKQKADVSLMKGGSSYESLESLVAYISSL

在具体的实施方案中，核酸包括编码UGT76G2葡糖基转移酶的序列并且具有如下列出的SEQ ID NO：28所示的核酸序列或其变体和片段。

SEQ ID NO：28

ATGGAAAATAAAACGGAGACCACCGTTCGCCGGCGCCGGAGAATAATATTA TTCCCGGTACCAGTTCAAGGCCACATTAACCCAATTCTTCAGCTAGCCAAT GTGTTGTACTCCAAAGGATTCAGTATCACCATCTTTCACACCAACTTCAAC AAACCCAAAACATCTAATTACCCTCACTTCACTTTCAGATTCATCCTCGACA ACGACCCACAAGACGTACGCATTTCCAATCTACCGACTCATGGTCCGCTCA CTGTTATGCGGATTCTGATTATCAACGAACACGGAGCTGACGAATTACAAC GCGAACTGGAACTGTTGATGTTAGCTTCTGAAGAAGATGGAGAGGTATCG TGTTTAATCACCGATCAGATTTGGTACTTCACGCAATCTGTTGCTGACAGTC TTAACCTCCGACGGCTTGTTTTGATGACAAGCAGCTTGTTTAATTTTCATGC ACATGTTTCACTTCCTCAGTTTGATGAGCTTGGTTACCTCGATCCTGATGAC AAAACCCGTTTGGAAGAACAAGCGAGTGGGTTTCCTATGCTGAAAGTGAA AGATATCAAGTGTGGTTTTTCGATGTGGAAACAAGGCAAAGAGATATTCGA GAACATTACGAAACAAACAAAAGCATCTTCAGGAGTCATCTGGAACTCATTTAAGGAACTCGAAGAGTCTGAGCTCGAAACTGTTATCCGTGAGATCCCG GCTCCAAGTTTCTTGATACCACTCCCCAAGCATTTGACAGCCTCTTCCAGC AGCTTACTAGACCACGATCGAACCGTTTTTCCATGGTTAGACCAACAACCG TCACGTTCGGTACTGTATGTTAGTTTTGGTAGTGCTACTGAAGTGGATGCG AAAGATTTCTTGGAAATAGCTCGTGGGTTGGTTGATAGCAAGCAGTCGTTT TTATGGGTGGTTCGACCTGGTTTTGTCAAGGGTTCGACGTGGGTCGAACCG TTGCCAGATGGGTTCTTGGGTGAAAGAGGACGTATTGTGAAATGGGTTCCG CAGCAAGAAGTGCTAGCTCATGGAGCAATAGGCGCATTCTGGACTCATAGC GGATGGAACTCTACGTTGGAAAGCGTTTGTGAAGGTGTTCCTATGATTTTC TCGGCTTTTGCGTTCGATCAACCGTTGAATGCTAGATACATGAGTGATGTTT TGAAGGTAGGGGTGTATTTGGAAAATGGGTGGGAAAGAGGAGAGATAGCA AATGCAATAAGAAGAGTTATGGTGGATGAAGAAGGAGGATACATTAGACA GAATGCAAGTGTTTTGAAACAAAAGGCAGATGTTTCTTTGATGAAGGGTG GTTCGTCTTACGAATCATTAGAGTCTCTAGTTGCTTACATTTCATCGTTGTA A

在某些实施方案中，核酸包括编码UGT76H1葡糖基转移酶的序列。在具体的实施方案中，核酸包括编码UGT76H1葡糖基转移酶的序列，UGT76H1葡糖基转移酶具有如下列出的SEQ ID NO：29所示的氨基酸序列或其变体和片段。

SEQ ID NO：29

MLQLATYLHSQGISITIAQYPNFNSPDSSNHPELTFLPLSSGNLSVADISGGFFK FIQTLNHNCKPHFREYLVQNMSSDDKESIVIIRDNLMFFAGEIAGELGLPSIILR GSNAVMLTASDIIPQLHQEGRFPPPDSLLQETIPELVPFRYKDLPFIGYPIHQTLE FSITMMTPKSPASAILINTLEFLEQSALTQIRDHYKVPVFTIGPLHKIVTTRSTSI LEEDTSCINWLDKQSPKSVVYVSLGSLAKLDEKVASEMACGLAMSNHKFLW VVRPGMVHGFEWVEFLPDSLVGEMKARGLIVKWAPQTTVLAHNAVGGFWS HCGWNSTIECLAEGVPMMCQPFFADQLLNARYVSDVWKTGFEIVIEKGEIAC AIKRVLVDEEGEEMRQRAMEIKEKVKIAINDGGSSYDSFKDLVAFISSL

在具体的实施方案中，核酸包括编码UGT76H1葡糖的序列并具有如下列出的SEQID NO：30所示的核酸序列或其变体和片段。

ATGCTTCAGCTTGCAACTTACCTCCATTCTCAAGGGATTTCAATAACCATCG CTCAGTACCCCAACTTCAACTCGCCGGATTCTTCCAACCATCCAGAACTAA CCTTCCTCCCACTATCCTCCGGCAACTTATCCGTCGCCGACATCTCCGGCGG CTTTTTCAAGTTCATCCAAACTCTTAACCATAACTGCAAACCCCATTTCCGG GAATACCTTGTTCAGAACATGAGTTCTGATGATAAGGAATCAATCGTTATCA TCCGTGATAATCTCATGTTTTTCGCCGGAGAAATCGCCGGCGAGCTGGGTC TGCCTTCGATCATTTTACGTGGCAGCAATGCTGTCATGTTGACTGCTAGCGA CATCATCCCTCAACTTCATCAAGAAGGTCGTTTTCCGCCACCAGATTCTTTG TTGCAGGAAACAATTCCAGAACTGGTTCCATTCAGATACAAAGATCTACCA TTTATTGGCTATCCAATACATCAAACCCTTGAATTTAGTATCACCATGATGAC CCCCAAATCACCTGCTTCCGCCATTCTTATCAACACCCTCGAATTTCTTGAA CAATCGGCATTAACCCAGATCCGTGATCATTACAAAGTTCCAGTTTTTACAA TCGGACCATTGCACAAAATAGTCACAACTCGTTCCACTAGCATTCTTGAAG AAGATACAAGTTGCATCAATTGGTTAGATAAACAATCACCCAAATCAGTGG TTTATGTGAGTTTAGGAAGCTTAGCAAAGTTGGATGAAAAGGTTGCATCTG AAATGGCATGTGGTTTAGCCATGAGTAACCATAAGTTCCTATGGGTGGTTC GACCCGGTATGGTTCATGGGTTTGAATGGGTCGAGTTTTTGCCGGATAGTT TGGTGGGTGAAATGAAGGCTAGAGGTTTGATTGTGAAATGGGCACCCCAG ACGACGGTTTTGGCGCATAACGCGGTTGGTGGATTTTGGAGTCATTGCGGT TGGAACTCGACCATAGAATGCTTAGCTGAAGGGGTCCCGATGATGTGTCAA CCGTTTTTTGCTGATCAGTTGTTGAATGCTAGGTATGTGAGTGATGTTTGGA AGACGGGTTTTGAGATTGTTATCGAGAAAGGTGAGATTGCGTGCGCGATTA AACGAGTTTTGGTGGATGAAGAAGGCGAAGAAATGAGGCAGAGAGCTAT GGAGATTAAAGAAAAGGTTAAAATTGCAATCAACGATGGTGGTTCTTCTTA TGACTCGTTCAAGGACTTGGTGGCGTTTATTTCATCACTCTAA

在某些实施方案中，核酸包括编码稻(Oryza sativa)Os03g0702000或Os03g0702000样葡糖基转移酶的序列。Os03g0702000样葡糖基转移酶包括例如，UGT91进化枝的其他成员，如UGT91D1或UGT91D2。在某些实施方案中，核酸包括编码Os03g0702000葡糖基转移酶的序列，Os03g0702000葡糖基转移酶具有如下列出的SEQ ID NO：9所示的氨基酸序列或其变体和片段。

SEQ ID NO：9

MHQHQHQSGSMDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLAS RGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHD RPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPC AMMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTK GSSGMSLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLH EGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGT RFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSF DREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSY KD

在某些实施方案中，核酸分子编码Os03g0702000葡糖基转移酶并且包括如下详述的SEQ ID NO：10所示的核苷酸序列或其变体和片段。

SEQ ID NO：10

ATGCATCAGCACCAACATCAGAGCGGTTCTATGGACTCCGGCTACTCCTCC TCCTACGCCGCCGCCGCCGGGATGCACGTCGTGATCTGCCCGTGGCTCGCC TTCGGCCACCTGCTCCCGTGCCTCGACCTCGCCCAGCGCCTCGCGTCGCG GGGCCACCGCGTGTCGTTCGTCTCCACGCCGCGGAACATATCCCGCCTCCC GCCGGTGCGCCCCGCGCTCGCGCCGCTCGTCGCCTTCGTGGCGCTGCCGC TCCCGCGCGTCGAGGGGCTCCCCGACGGCGCCGAGTCCACCAACGACGTC CCCCACGACAGGCCGGACATGGTCGAGCTCCACCGGAGGGCCTTCGACGG GCTCGCCGCGCCCTTCTCGGAGTTCTTGGGCACCGCGTGCGCCGACTGGG TCATCGTCGACGTCTTCCACCACTGGGCCGCAGCCGCCGCTCTCGAGCAC AAGGTGCCATGTGCAATGATGTTGTTGGGCTCTGCACATATGATCGCTTCCA TAGCAGACAGACGGCTCGAGCGCGCGGAGACAGAGTCGCCTGCGGCTGC CGGGCAGGGACGCCCAGCGGCGGCGCCAACGTTCGAGGTGGCGAGGATG AAGTTGATACGAACCAAAGGCTCATCGGGAATGTCCCTCGCCGAGCGCTT CTCCTTGACGCTCTCGAGGAGCAGCCTCGTCGTCGGGCGGAGCTGCGTGG AGTTCGAGCCGGAGACCGTCCCGCTCCTGTCGACGCTCCGCGGTAAGCCT ATTACCTTCCTTGGCCTTATGCCGCCGTTGCATGAAGGCCGCCGCGAGGAC GGCGAGGATGCCACCGTCCGCTGGCTCGACGCGCAGCCGGCCAAGTCCGT CGTGTACGTCGCGCTAGGCAGCGAGGTGCCACTGGGAGTGGAGAAGGTCC ACGAGCTCGCGCTCGGGCTGGAGCTCGCCGGGACGCGCTTCCTCTGGGCT CTTAGGAAGCCCACTGGCGTCTCCGACGCCGACCTCCTCCCCGCCGGCTT CGAGGAGCGCACGCGCGGCCGCGGCGTCGTGGCGACGAGATGGGTTCCT CAGATGAGCATACTGGCGCACGCCGCCGTGGGCGCGTTCCTGACCCACTG CGGCTGGAACTCGACCATCGAGGGGCTCATGTTCGGCCACCCGCTTATCAT GCTGCCGATCTTCGGCGACCAGGGACCGAACGCGCGGCTAATCGAGGCGA AGAACGCCGGATTGCAGGTGGCAAGAAACGACGGCGATGGATCGTTCGAC CGAGAAGGCGTCGCGGCGGCGATTCGTGCAGTCGCGGTGGAGGAAGAAA GCAGCAAAGTGTTTCAAGCCAAAGCCAAGAAGCTGCAGGAGATCGTCGC GGACATGGCCTGCCATGAGAGGTACATCGACGGATTCATTCAGCAATTGAGATCTTACAAGGATTGA

在某些实施方案中，核酸分子编码Os03g0702000葡糖基转移酶并且包括如GenBank登录号XM_015773655所示的序列或其变体或片段。

在某些实施方案中，核酸包括编码UGT91D1葡糖基转移酶的序列。在某些实施方案中，核酸包括编码UGT91D1葡糖基转移酶的序列，UGT91D1葡糖基转移酶具有如下列出的SEQID NO：31所示的氨基酸序列或其变体和片段。

SEQ ID NO：31

MYNVTYHQNSKAMATSDSIVDDRKQLHVATFPWLAFGHILPFLQLSKLIAEK GHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIQYL KKAVDGLQPEVTRFLEQHSPDWIIYDFTHYWLPSIAASLGISRAYFCVITPWTI AYLAPSSDAMINDSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARMEPYEAP GISDGYRMGMVFKGSDCLLFKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEI PGDEKDETWVSIKKWLDGKQKGSVVYVALGSEALVSQTEVVELALGLELSG LPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVC GFLTHCGSGSIVEGLMFGHPLIMLPIFCDQPLNARLLEDKQVGIEIPRNEEDGC LTKESVARSLRSVVVENEGEIYKANARALSKIYNDTKVEKEYVSQFVDYLEK NARAVAIDHES

在某些实施方案中，核酸分子编码UGT91D1葡糖基转移酶并且包括如下详述的SEQID NO：32所示的核苷酸序列或其变体和片段。

SEQ ID NO：32

ATGTACAACGTTACTTATCATCAAAATTCAAAAGCAATGGCTACCAGTGAC TCCATAGTTGACGACCGTAAGCAGCTTCATGTTGCGACGTTCCCATGGCTT GCTTTCGGTCACATCCTCCCTTTCCTTCAGCTTTCGAAATTGATAGCTGAAA AGGGTCACAAAGTCTCGTTTCTTTCTACCACCAGAAACATTCAACGTCTCT CTTCTCATATCTCGCCACTCATAAATGTTGTTCAACTCACACTTCCACGTGT CCAAGAGCTGCCGGAGGATGCAGAGGCGACCACTGACGTCCACCCTGAA GATATTCAATATCTCAAGAAGGCTGTTGATGGTCTTCAACCGGAGGTCACC CGGTTTCTAGAACAACACTCTCCGGACTGGATTATTTATGATTTTACTCACT ACTGGTTGCCATCCATCGCGGCTAGCCTCGGTATCTCACGAGCCTACTTCT GCGTCATCACTCCATGGACCATTGCTTATTTGGCACCCTCATCTGACGCCAT GATAAATGATTCAGATGGTCGAACCACGGTTGAGGATCTCACGACACCGCC CAAGTGGTTTCCCTTTCCGACCAAAGTATGCTGGCGGAAGCATGATCTTGC CCGAATGGAGCCTTACGAAGCTCCGGGGATATCTGATGGATACCGTATGGGGATGGTTTTTAAGGGATCTGATTGTTTGCTTTTCAAATGTTACCATGAGTTT GGAACTCAATGGCTACCTCTTTTGGAGACACTACACCAAGTACCGGTGGTT CCGGTGGGATTACTGCCGCCGGAAATACCCGGAGACGAGAAAGATGAAAC ATGGGTGTCAATCAAGAAATGGCTCGATGGTAAACAAAAAGGCAGTGTGG TGTACGTTGCATTAGGAAGCGAGGCTTTGGTGAGCCAAACCGAGGTTGTT GAGTTAGCATTGGGTCTCGAGCTTTCTGGGTTGCCATTTGTTTGGGCTTATA GAAAACCAAAAGGTCCCGCGAAGTCAGACTCGGTGGAGTTGCCAGACGG GTTCGTGGAACGAACTCGTGACCGTGGGTTGGTCTGGACGAGTTGGGCAC CTCAGTTACGAATACTGAGCCACGAGTCAGTTTGTGGTTTCTTGACTCATT GTGGTTCTGGATCAATTGTGGAAGGGCTAATGTTTGGTCACCCTCTAATCAT GCTACCGATTTTTTGTGACCAACCTCTGAATGCTCGATTACTGGAGGACAA ACAGGTGGGAATCGAGATACCAAGAAATGAGGAAGATGGTTGCTTGACCA AGGAGTCGGTTGCTAGATCACTGAGGTCCGTTGTTGTGGAAAACGAAGGG GAGATCTACAAGGCGAACGCGAGGGCGCTGAGTAAAATCTATAACGACAC TAAGGTGGAAAAAGAATATGTAAGCCAATTCGTAGACTATTTGGAAAAGAA TGCGCGTGCGGTTGCCATCGATCATGAGAGTTAA

在某些实施方案中，核酸包括编码UGT91D2葡糖基转移酶的序列。在某些实施方案中，核酸包括编码UGT91D2葡糖基转移酶的序列，UGT91D2葡糖基转移酶具有如下列出的SEQID NO：33所示的氨基酸序列或其变体和片段。

SEQ ID NO：33

MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQ RLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTR FLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMIN GSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVL KGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIK KWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGP AKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEG LMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVV VEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES

在某些实施方案中，核酸分子编码UGT91D2葡糖基转移酶并且包括如下详述的SEQID NO：34所示的核苷酸序列或其变体和片段。

SEQ ID NO：34

ATGGCCACATCTGACTCTATCGTTGATGACAGAAAACAATTGCATGTTGCT ACTTTCCCATGGTTGGCCTTTGGACACATTCTGCCCTACTTGCAATTGTCAA AGCTGATTGCAGAAAAAGGTCATAAGGTGTCCTTTTTGTCTACCACAAGAA ACATCCAGAGACTAAGTTCTCATATTTCTCCATTGATTAATGTGGTTCAGTT GACCTTGCCTAGAGTCCAAGAACTTCCCGAAGACGCAGAAGCTACTACTG ATGTTCACCCTGAAGATATCCCATATCTAAAGAAGGCATCTGATGGACTTCA ACCAGAAGTAACCAGGTTTTTGGAGCAGCACAGTCCTGACTGGATTATCTA TGATTATACTCATTACTGGCTTCCATCCATCGCAGCTAGTCTAGGCATTTCCA GAGCTCATTTCTCTGTCACTACCCCATGGGCAATTGCATATATGGGTCCTTC TGCTGATGCAATGATCAACGGTTCTGATGGTAGGACCACTGTTGAAGATTTAACTACACCTCCAAAGTGGTTCCCATTTCCTACTAAAGTTTGTTGGCGAAA ACACGATCTGGCACGTTTGGTCCCATATAAGGCTCCAGGTATCTCCGATGG ATATCGAATGGGTCTGGTGCTAAAGGGTTCTGATTGTCTGTTATCTAAGTGT TACCACGAATTTGGAACTCAATGGCTTCCTCTATTAGAGACTCTGCATCAA GTTCCAGTTGTTCCTGTCGGTCTGCTACCACCTGAAATTCCCGGTGACGAA AAGGACGAAACTTGGGTTTCCATAAAAAAATGGCTGGATGGTAAGCAGAA GGGTAGTGTTGTATATGTCGCTTTAGGCTCCGAGGTTTTGGTATCCCAGACT GAAGTTGTGGAACTTGCCTTAGGATTGGAGTTGTCCGGTTTGCCATTCGTC TGGGCATATAGAAAGCCAAAGGGACCAGCTAAGTCAGACTCAGTTGAATT GCCAGATGGTTTCGTAGAAAGGACAAGAGACAGAGGATTGGTTTGGACAT CATGGGCCCCACAATTGAGAATTCTGAGTCATGAAAGTGTGTGTGGATTCT TGACTCACTGTGGCTCTGGCAGTATTGTTGAAGGACTGATGTTTGGACACC CACTGATAATGTTGCCAATCTTCGGTGACCAACCTCTGAATGCAAGATTGC TGGAGGATAAACAAGTTGGTATCGAAATCCCAAGAAACGAGGAAGACGGC TGCCTGACTAAGGAATCAGTTGCACGTAGTTTAAGATCTGTAGTTGTTGAA AAAGAAGGTGAAATATATAAGGCTAACGCTAGAGAACTTTCAAAGATATAC AATGATACCAAGGTGGAGAAAGAATATGTTTCACAGTTTGTGGACTATTTG GAGAAAAACGCTAGAGCCGTTGCTATCGATCACGAATCATAG

在某些实施方案中，核酸包括编码甜叶菊UDP-糖基转移酶74G1的序列。在某些实施方案中，核酸包括编码甜叶菊UDP-糖基转移酶74G1的序列，甜叶菊UDP-糖基转移酶74G1包括如下列出的SEQ ID NO：13所示的氨基酸序列或其变体或片段。

SEQ ID NO：13

MAEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLN HSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGT TIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGET VSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYK LEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHHECMN WLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKL PENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVV AMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGV IIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKA

在某些实施方案中，核酸分子编码甜叶菊UDP-糖基转移酶74G1并且包括如下列出的SEQ ID NO：14所示的核苷酸序列或其变体或片段。

SEQ ID NO：14

ATGGCGGAACAACAAAAGATCAAGAAATCACCACACGTTCTACTCATCCC ATTCCCTTTACAAGGCCATATAAACCCTTTCATCCAGTTTGGCAAACGATTA ATCTCCAAAGGTGTCAAAACAACACTTGTTACCACCATCCACACCTTAAAC TCAACCCTAAACCACAGTAACACCACCACCACCTCCATCGAAATCCAAGC AATTTCCGATGGTTGTGATGAAGGCGGTTTTATGAGTGCAGGAGAATCATA TTTGGAAACATTCAAACAAGTTGGGTCTAAATCACTAGCTGACTTAATCAA GAAGCTTCAAAGTGAAGGAACCACAATTGATGCAATCATTTATGATTCTAT GACTGAATGGGTTTTAGATGTTGCAATTGAGTTTGGAATCGATGGTGGTTC GTTTTTCACTCAAGCTTGTGTTGTAAACAGCTTATATTATCATGTTCATAAG GGTTTGATTTCTTTGCCATTGGGTGAAACTGTTTCGGTTCCTGGATTTCCAG TGCTTCAACGGTGGGAGACACCGTTAATTTTGCAGAATCATGAGCAAATAC AGAGCCCTTGGTCTCAGATGTTGTTTGGTCAGTTTGCTAATATTGATCAAGC ACGTTGGGTCTTCACAAATAGTTTTTACAAGCTCGAGGAAGAGGTAATAGAGTGGACGAGAAAGATATGGAACTTGAAGGTAATCGGGCCAACACTTCCAT CCATGTACCTTGACAAACGACTTGATGATGATAAAGATAACGGATTTAATCT CTACAAAGCAAACCATCATGAGTGCATGAACTGGTTAGACGATAAGCCAA AGGAATCAGTTGTTTACGTAGCATTTGGTAGCCTGGTGAAACATGGACCCG AACAAGTGGAAGAAATCACACGGGCTTTAATAGATAGTGATGTCAACTTCT TGTGGGTTATCAAACATAAAGAAGAGGGAAAGCTCCCAGAAAATCTTTCG GAAGTAATAAAAACCGGAAAGGGTTTGATTGTAGCATGGTGCAAACAATT GGATGTGTTAGCACACGAATCAGTAGGATGCTTTGTTACACATTGTGGGTT CAACTCAACTCTTGAAGCAATAAGTCTTGGAGTCCCCGTTGTTGCAATGCC TCAATTTTCGGATCAAACTACAAATGCCAAGCTTCTAGATGAAATTTTGGG TGTTGGAGTTAGAGTTAAGGCTGATGAGAATGGGATAGTGAGAAGAGGAA ATCTTGCGTCATGTATTAAGATGATTATGGAGGAGGAAAGAGGAGTAATAA TCCGAAAGAATGCGGTAAAATGGAAGGATTTGGCTAAAGTAGCCGTTCAT GAAGGTGGTAGCTCAGACAATGATATTGTCGAATTTGTAAGTGAGCTAATT AAGGCTTAA

在某些实施方案中，核酸分子编码甜叶菊UDP-糖基转移酶74G1并且包括 GenBank登录号AY345982所示的序列或其变体或片段。

在其他实施方案中，本发明提供了包括编码环糊精葡聚糖转移酶的核苷酸序列(WO1996033267；US6271010)的核酸。

还提供了包括编码蔗糖合成酶的核苷酸序列的核酸。因此，在某些实施方案中，核酸包括编码蔗糖合成酶的序列，蔗糖合成酶包括如下列出的SEQ ID NO：15、17、19、21、23或25所示的氨基酸序列或其变体或片段。

SEQ ID NO：15(甜叶菊SUS1同种型)

MAERVLTRVHSLRERLDSTLATHRNEILLFLSRIESHGKGILKPHQVMTEFEAI CKEDQSKLSDGAFYEVLKCTQEAIVQPPWVALAIRLRPGVWEYVRVNVNVL VVEELSVPEYLHFKEELVNGTSNGNFVLELDFEPFTASFPRPTLTKSIGNGVEF LNRHLSAKMFHDKDSMHPLLDFLRTHHYKGKTMMLNDRIQNLNALQSVLR KASEYLSTLDAATPYSEFEHKFQEIGLERGWGDKAEVVMEMIHMLLDLLEAP DACTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPAL EREMLKRIKEQGLDIIPRILIVTRLLPDAVGTTCGQRLEKVFGAEHSHILRVPFR TEKGILRKWISRFEVWPYIETFTEDVAKEVTAELQAKPDLIIGNYSEGNLVASL LAHKLGVTQCTIAHALEKTKYPDSDIYWKNFEEKYHFSSQFTADLIAMNHTD FIITSTFQEIAGSKDTVGQYESHTAFTMPGLYRVVHGIDVFDPKFNIVSPGADM GIYYSYTEKEKRLTALHPEIDELLFSSVENEEHLCVLKDKSKPILFTMARLDNV KNLTGLVEWYAKNDRLRELVNLVVVGGDRRKESKDLEEQAQMQKMHELIET YKLNGQFRWISSQMNRVRNGELYRVIADTRGAFIQPAFYEAFGLTVVEAMTC GLPTFATLHGGPAEIIVHGKSGFHIDPYHGDQVTELLVNFFEKTKQDPGHWEAISKGGLQRIQEKYTWQIYSDRLLTLAGVYGFWKHVSKLDRLEIRRYLEMFYA LKYRKLAESVPLAVDE

SEQ ID NO：17(甜叶菊SUS2同种型)

MATSKLSRTHSMRERVEETLSAHRNEIVSLLSRYVAQGKAILQPHQILHELENI IGDVTSRQKLTDGPFGDALKTAQECIVLPPFVALAVRPRPGVWEYVRVDAYQL SVEQLTVSEYLTFKEELVGESNSSLMLELDFEPFNASFPRPTRSSSIGNGVQFLN RHLSSSMFRSKDCLEPLLDFLRTHRHNGHVMMLNDRITSMTRLQSSLVKAEE YLSKLPSDTDYSEFQYELQGMGFERGWGNNAERIIEMMHLLSDILQAPDPSIL ESFLARIPMVFNVVILSIHGYFGQANVLGLPDTGGQIVYILDQVRALENEMLL KLKHQGLDIKPRILIVTRLIPDAKGTSCNQRLERVSGTEHTHILRVPFRTEKGIL RKWISRFDVWPFLEKFTQDAASEISAELHGTPDLIIGNYSDGNLVASLLSYKM GVTQCNIAHALEKTKYPDSDLYWKKFDEKYHFSCQFTADLLAMNNADFIITS TYQEIAGTKNTVGQYESHSSFTLPGLYRVVHGIDVFDPKFNIVSPGADMSIYFS YTEKEKRLTSLHTTIEKLLFDPTQTEDYIGNLSDKSKPIIFSMARLDHVKNITGLVEWYAKNEKLRGLANLVVVAGYNNVKRSSDREEIAEIEKMHQLIKKYKLDG QMRWISAQTNRAQNGELYRYIADGRGIFVQPAIYEAFGLTVVEAMTCGLPTFA TCHGGPGEIIENGVSGFHIDPYHPDTASATMADFFQKCKEDPSYWFKISEAGL KRIYERYTWKIYSERLMTLAGVYSFWKYVSKLERRETRRYLEMFYILKFRDL VKSVPVATDDEA

SEQ ID NO：19(甜叶菊SUS3同种型)

MATPKLTRTPSMRERLEETLSAHRNDIVSLLSRYVDQGKAILQPHHLLDEIDN FIGDQNCRQKLADSLFGEILKSAQEGIILPPYVTLAVRPRPGVWDFLRVNVDE LSVEQLTVSEYLSFKEELVDGQSRNPFVLELDLEPFNATFPRMSRSSSIGNGVQ FLNRHLSSIMFRNKDCMDPFLDFLRAHKHKGYAMMLNDRIQTMSRLESSLA KAEDHLSKLPPETPYSEFEYVLQGMGFERGWGDNCERVLGMMHLLSDILQA PDPSILEKFLGKMPMIFNVVVLSIHGYFGQANVLGLPDTGGQVVYILDQVRSL ENEMLLKLRHQGLDIKPKILIVTRLIPNAKGTSCNQRLEKVSGTEYTYILRVPF RTEKGILGKWLSRFDIWPYLEAFTTDAASEIAAELHGVPDLLIGNYSDGNLVA SLLSNKLGVTQCNIAHALEKTKYPDSDLYWKKFEDKYHFSCQFTADLLAMN NADFIITSTYQEIAGTKNTVGQYENHSSFTLPGLYRVVHGIDVFDPKFNIVSPG ADMAIYFSYADKERRLTSLHPTIEKLLFDTEQNDVHIGNINDPSKPMIFTMARL DHVKNITGFVECYAKNNKLREHANLVVIAGYNDAKKSSDREEIAEIEKMHNL IKQYKLDGQMRWISAQTNRARNGEFYRYIADGRGVFVQPAFYEAFGLTVVE AMTCGLPTFATCHGGPAEIIEDGVSGFHIDPYHPDKMSTTLADFFQKCKEEPS YWGKISDGGLKRISERYTWKIYSERLMTLAGVYSFWKYVSKLERRETRRYLE MFYILKFRQLVKSVPLAVDEEP

SEQ ID NO：21(甜叶菊SUS4同种型)

MASASSSIMKRSESIVDTMPEALKQSRYHMKKCFLKYVEKGIRMMKRHHLIQ EMETAIEDKDEKAQLLDGLLGYILCTTQEAAVVPPCVAFAIRPNPGFWEFVKV NSNDLSVDGITATDYLKFKEMIVDETWAKDENALEIDFGSMDFNLPNMSLSC SIGNGVNFTSKFITCKLYAQSSCQQLLVDYLLSLNHQGENLMINDALNSVSKL RAALIVAHASLSSLPNDTPYQSFELRFKEWGFEKGWGDNAERARETIRFLLEV LQAPDPINLEALFSRIPNIFNVVLFSIHGYFGQSNVLGLPDTGGQVVYVLDQV VAMEEELLMRIKQQGLNFKPQILVVTRLLPDAKGTKCNQVLEPVLNTKHSHI LRVPFRTDKGVLRKWVSRFDIYPYLENFTQDASAKIIEMMEGKPDLIIGNYTD GNLVASLMANKLGTTLGTIAHALEKTKYEDSDMNWKQFDPKYHFSCQFTAD MIAMNSADFIITSTFQEIAGSKDRPGQYESHEAFTLPGLYRVVSGINVFDPKFNI ASPGADQTVYFPYTETKKRFTAFQPAIEELLFSKVENEEHIGYLEDKTKPIIFS MARLDTVKNITGLTEWFGENKRLRSLVNLVIVAGFFDPSKSKDREEMAEIKK MHLLIEKYQLKGQIRWIAAQTDKNRNSELYRFIADSKGAFVQPALYEAFGLTV IEAMNCGLPTFATNQGGPAEIIVDGVSGFQIDPNFGDQSSNKIADFFQKCKEDPGYWNNISEGGLKRIYECYTWKIYANKVLNMGNIYSFWKRLNKEQKEAKQRY IELFYNLHYKNLVRTVPIASDEAQPAPVSRAKLATQPTRRTQSRLQRLFGA

SEQ ID NO：23(甜叶菊SUS5同种型)

MAASSSPIMKRSESVLDTMPEALRQSRYHMKKCFLKYVGKGKRMVKLHHL MQEMETVIEDKDEKAQLLEGLLGYILCTTQEAAVVPPYVAFAIRPNPGFWEFV KVNSNDLSVKGITSTDYLKFKEMIVDETWANDENALEIDFGAMDFNLPTMSL SSSIGNGVNFTSKFIISKLYAHSGSQLQSLVDYLLSLNHQGEKLMINDKLNTVS KLQAALIVAHSFLSSLPNDTPYQSFELRFKEWGFEKGWGDYAERVQETIRFLL EVLQAPDPVNLEAFFSRVPNIFNIVLFSIHGYFGQSNVLGLPDTGGQVVYVLD QVVAMEEELLLRIKQQGLSFKPHILVVTRLLPDAKGTECSQVLEPVLNTKHSH ILRVPFRTEKGVLRKWVSRFDIYPYLEKFTQDASAKITEMMEGKPDLIIGNYT DGNLVASLMANKLGSTLGTIAHALEKTKYEDSDMKWKHLDTKYHFSCQFTA DMIAMNSADFIITSTFQEIAGSKDRPGQYESHEAFTLPGLYRVVSGINVFDPKF NIASPGADQTVYFPYTETPKRFTTFQPAIQELLFSKVENDEHIGYLEDKNKPIIF SMARLDMVKNITGLTEWFGENKRLRSLVNLVIVAGFFDPSKSKDREEMEEIK KMHLLIEKYELKGQIRWIVAQTDKNRNSELYRCIADSKGAFVQPALYEAFGLT VIEAMNCGLPTFATNQGGPAEIIVDGVSGFQIDPNYGDESSNKIADFFQKCKQDPGYWNRISDGGLMRIYECYTWKIYANKVLNMGNIYTFWKQLNKEQKDAK QRYIELFYNQHYKNLVRTVPIVSDEDDQVTRAKPATQPSTRRTQSALQRLLGA

SEQ ID NO：25(甜叶菊SUS6同种型)

MDFGIAETLAEALKQNRYHARRCFERFTSRGKRMVKPQELLHMIEKTIDDKL ERTKVLEGSMGQILSSTQEAIVIPPYVILGLRANPGQWAYVKINADDVTVESLT PSQYLKFKESIYDQEWAKDENALELDFGAFDFDTPRLILPSSIGNGLGYISKFM TSRIGGDLENAKPLLDHLLALKYHGEKLMINETIDTVSKLQKALIVADVYLSA HPKDEQYQTLEPKLKEWGFEKGWGDTAERVRETMKMLSEILQAPDPINMQS FFSRLPVVFNIVIFSIHGYFGQSDVLGLPDTGGQVVYILDQVKALEEEILLRIK MQGLNAKPRILVVSRLIPDAQGTKCNEEMEPILNTMHSHILRVPFRTSKGVVP QWVSRFDIYPYLERFSQDAASKILEVMECKPDLILGNYTDGNIVASLIAKKFG VTQGTIAHALEKTKYEDSDVNWKNFEKKYHFSCQFTADLISMNAADFIITST YQEIVGSKQRPGQYETHGAFSMPGLCRVVSGINVFDPKFNIASPGAEQSVYFP YTEKEKRLTDFHPAIKELLFNEQDNDEHMGYLADVTKPIIFSMARLDTVKNIT GLTEWFGKNKRLRSLVNLVVVAGFFDPSKSKDREEMEEIKKMHELIEKYKLK GQMRWIAAQNDRTRNGELYRCISDTKGAFVQPALYEAFGLTVIEAMNCGLPT FATNQGGPAEIIVDGVSGFHIDPVNGDESSNKIADFFTKCKVDGEYWDRVSQAGLQRIYECYTWKMYANKALNMGSMYGFWRQLNKETKQAKQRYIDILYNLQ FKNLAKTIEIPDFVTPKLQEPVKTEPTKPLQEARPREPVQKLVPEETRLPKLEL TKLGQPNLMSNARKPLIVLVSVLIVAYASKNLYRRYFK

在某些实施方案中，核酸分子编码蔗糖合成酶并且包括如下列出的SEQ ID NO：16、18、20、22、24或26所示的核苷酸序列或其片段或变体。

SEQ ID NO：16(编码SUS1同种型)

ATGGCGGAACGTGTACTCACTCGTGTTCACAGTCTTCGTGAGCGTCTCGAT TCAACTCTCGCAACTCATCGTAATGAAATCCTCTTGTTTCTTTCAAGGATTG AAAGCCATGGAAAAGGAATATTGAAGCCTCATCAAGTTATGACTGAATTTG AAGCTATCTGCAAAGAAGATCAGAGCAAACTCTCTGATGGTGCTTTTTATG AAGTTCTTAAATGCACACAGGAAGCAATAGTGCAACCTCCATGGGTTGCA CTCGCGATCCGTCTTCGACCCGGTGTTTGGGAATATGTTAGAGTCAATGTTA ATGTTTTGGTGGTTGAAGAATTAAGTGTTCCTGAATATCTTCACTTCAAAGA AGAATTGGTTAATGGAACATCGAATGGCAACTTCGTGTTGGAACTGGATTT TGAACCTTTTACCGCATCGTTTCCTCGACCAACTTTAACCAAGTCTATTGGT AATGGTGTTGAGTTTCTAAACAGACATTTATCTGCTAAAATGTTTCATGATAAGGATAGCATGCACCCTCTTCTTGATTTCCTACGGACTCACCACTATAAGGG AAAGACAATGATGTTGAATGATAGAATCCAAAACCTCAATGCTCTACAATC GGTGTTGCGAAAGGCGTCAGAGTACTTATCAACACTCGACGCAGCAACAC CGTACTCTGAGTTTGAACATAAGTTTCAAGAAATCGGGTTGGAGAGAGGT TGGGGTGATAAAGCGGAGGTCGTAATGGAGATGATCCACATGCTTCTAGAC CTTCTAGAAGCACCCGACGCATGCACACTCGAGAAGTTTCTCGGAAGAAT CCCAATGGTTTTCAATGTTGTCATTCTTTCGCCTCACGGCTACTTCGCCCAA GAAAATGTGTTGGGATATCCCGACACTGGCGGTCAGGTTGTTTACATCTTG GATCAAGTTCCCGCTCTGGAACGCGAGATGCTCAAAAGGATTAAGGAGCA AGGACTCGATATCATTCCTCGTATATTGATTGTTACGAGGCTTCTTCCCGAC GCGGTTGGGACCACATGCGGGCAACGTTTAGAGAAAGTGTTTGGAGCCGA ACACTCGCATATTCTTCGGGTCCCGTTTAGAACCGAAAAGGGTATTCTTCGT AAATGGATCTCTCGTTTTGAGGTGTGGCCTTACATCGAGACTTTCACCGAG GATGTTGCTAAAGAAGTTACAGCAGAGTTGCAAGCAAAACCAGATTTGAT CATTGGAAACTATAGTGAAGGAAATTTGGTTGCATCTTTGCTAGCTCACAA GTTGGGTGTCACTCAGTGTACCATTGCTCATGCTTTGGAGAAAACTAAATA CCCGGATTCTGATATCTACTGGAAGAACTTTGAGGAGAAATATCATTTCTCT TCGCAGTTTACCGCTGATCTTATCGCTATGAACCATACCGACTTCATCATCA CCAGTACTTTCCAAGAAATTGCTGGAAGTAAGGACACGGTTGGACAGTAC GAGAGTCATACCGCGTTCACAATGCCGGGATTGTATCGGGTGGTTCACGGG ATCGATGTTTTTGACCCCAAATTCAATATTGTTTCACCCGGGGCCGATATGG GAATTTACTACTCGTATACCGAGAAAGAAAAGAGGCTCACTGCGCTTCACC CTGAAATCGATGAACTTCTCTTTAGTTCCGTCGAAAACGAAGAACACTTAT GTGTGTTGAAGGATAAGAGTAAACCAATCTTGTTCACAATGGCGCGATTGG ATAATGTGAAGAATTTAACCGGACTGGTTGAATGGTACGCTAAAAACGACC GCCTTCGTGAGCTCGTGAACCTCGTGGTCGTCGGTGGTGACCGAAGGAAA GAGTCGAAAGATCTTGAAGAACAAGCTCAGATGCAGAAGATGCATGAACT TATCGAAACCTACAAACTCAACGGTCAGTTCAGGTGGATATCCTCACAAAT GAACCGCGTGAGGAACGGTGAGTTGTATCGCGTTATTGCTGACACACGAG GTGCGTTTATCCAGCCTGCGTTTTACGAGGCGTTTGGGTTGACGGTTGTGG AGGCCATGACTTGTGGCCTGCCGACATTCGCGACACTTCATGGTGGGCCCG CTGAGATTATTGTTCACGGGAAATCCGGGTTCCATATTGACCCGTATCACGG TGACCAGGTCACCGAGTTGCTGGTCAATTTCTTTGAGAAAACTAAACAAG ACCCGGGTCATTGGGAGGCCATTTCCAAGGGTGGTCTGCAACGTATTCAG GAGAAATACACGTGGCAGATTTATTCAGATAGGTTGTTGACGCTTGCCGGA GTTTATGGATTCTGGAAGCATGTGTCGAAGCTTGACAGGCTCGAGATCCGT CGTTATCTTGAAATGTTTTACGCGCTCAAGTATCGCAAACTGGCTGAATCTG TTCCATTGGCTGTTGATGAGTGA

SEQ ID NO：18(编码SUS2同种型)

ATGGCGACAAGTAAGTTGAGCAGAACGCATAGTATGCGTGAGCGTGTTGA AGAAACTCTTTCCGCTCATCGCAACGAAATCGTTTCTCTTCTTTCTAGGTAT GTGGCTCAGGGGAAGGCGATATTGCAGCCGCATCAGATACTCCATGAACTT GAGAATATCATCGGTGATGTTACTTCGCGCCAAAAGCTTACAGATGGTCCG TTTGGAGATGCGTTGAAGACAGCACAGGAATGTATAGTTCTACCTCCATTT GTAGCTTTAGCAGTTCGTCCAAGACCTGGTGTTTGGGAATACGTGCGCGTG GATGCATATCAACTAAGTGTGGAACAACTAACTGTTTCAGAGTATCTTACCT TCAAAGAAGAACTTGTTGGAGAGTCTAATAGTTCTTTAATGCTCGAGTTGG ATTTTGAGCCATTTAATGCTTCGTTTCCTAGACCAACCCGTTCTTCATCCATT GGCAATGGAGTTCAGTTCCTGAATCGCCACCTGTCGTCAAGCATGTTTCGC AGCAAAGATTGTTTAGAACCGCTTCTGGATTTCCTACGCACACACAGACAT AATGGACATGTAATGATGTTAAATGACCGCATAACAAGCATGACTAGACTT CAATCTTCTTTGGTCAAAGCAGAGGAATATCTTTCTAAACTACCATCTGATA CAGACTACTCTGAGTTTCAATATGAATTGCAAGGAATGGGTTTTGAAAGAG GATGGGGAAACAATGCTGAAAGAATCATTGAGATGATGCATCTTCTCTCAG ACATTCTACAAGCTCCAGATCCTTCCATTTTGGAATCTTTTCTTGCTAGAAT ACCTATGGTGTTTAATGTTGTTATATTATCAATACATGGCTACTTTGGGCAAG CAAATGTTTTGGGTTTGCCAGATACTGGTGGCCAGATTGTATATATATTGGA TCAAGTCCGTGCATTGGAAAATGAGATGCTTCTTAAATTAAAGCACCAAGG ACTGGATATCAAACCTAGGATTCTGATTGTGACTCGGTTAATACCTGATGCA AAAGGTACTTCATGTAACCAACGACTGGAAAGAGTCAGTGGAACTGAACA CACACATATACTTCGTGTTCCTTTTAGAACCGAGAAAGGAATTCTTCGTAAA TGGATCTCAAGGTTTGATGTATGGCCTTTTTTGGAGAAATTTACACAGGATG CAGCAAGTGAAATTTCTGCTGAGTTGCATGGTACTCCAGATCTTATAATTGG AAATTATAGTGATGGCAATCTTGTTGCCTCTTTATTATCTTACAAAATGGGA GTAACCCAGTGTAACATTGCTCATGCTTTAGAGAAAACAAAGTATCCAGAT TCTGATTTATATTGGAAGAAATTTGATGAGAAATATCACTTTTCTTGTCAATT TACTGCTGATCTTTTAGCCATGAACAATGCAGATTTTATCATCACCAGCACA TACCAAGAAATCGCGGGAACGAAAAATACTGTCGGACAATACGAGAGTCA TTCGTCTTTCACTCTCCCGGGGCTCTACAGGGTTGTTCATGGTATTGACGTT TTTGACCCTAAGTTCAACATTGTGTCTCCAGGGGCAGATATGTCTATATACT TCTCATACACCGAGAAGGAAAAAAGACTTACATCTCTTCATACTACAATTG AGAAGTTATTGTTTGACCCTACACAAACTGAAGATTACATTGGAAATCTGA GTGATAAATCAAAACCGATAATTTTTTCAATGGCAAGACTTGATCATGTGA AGAACATTACGGGTCTGGTTGAGTGGTACGCTAAGAATGAGAAGCTTAGA GGACTAGCAAACCTTGTTGTGGTTGCTGGTTATAATAATGTGAAGAGGTCT AGTGACAGAGAAGAAATTGCAGAAATTGAAAAAATGCATCAACTTATTAA GAAATACAAATTAGATGGTCAGATGAGATGGATTTCAGCACAAACAAACC GCGCACAAAATGGTGAACTTTATCGCTATATTGCTGATGGAAGGGGAATCT TTGTACAGCCCGCTATTTATGAAGCTTTTGGGCTGACAGTGGTGGAGGCCA TGACTTGTGGGCTTCCAACATTTGCAACTTGCCATGGTGGGCCAGGAGAG ATAATTGAAAATGGTGTTTCGGGCTTCCATATCGACCCGTATCATCCGGATACTGCATCAGCCACAATGGCTGATTTTTTTCAGAAATGCAAGGAGGACCCGA GTTATTGGTTCAAGATATCTGAAGCAGGGCTTAAAAGAATATATGAAAGGT ACACATGGAAAATTTACTCTGAACGGTTGATGACATTAGCTGGAGTTTATA GCTTCTGGAAGTATGTCTCGAAACTTGAGAGACGTGAAACAAGACGATAT CTTGAGATGTTTTATATTCTTAAGTTCCGTGATCTGGTAAAATCTGTTCCAGT GGCTACTGATGATGAGGCTTAG

SEQ ID NO：20(编码SUS3同种型)

ATGGCGACACCTAAGCTTACGCGAACACCAAGCATGCGAGAGCGTCTTGA AGAAACTTTATCAGCTCATCGCAACGATATCGTCTCTCTTCTTTCCAGGTAT GTAGATCAAGGTAAGGCCATATTGCAGCCCCACCACCTACTTGACGAAATC GATAACTTCATCGGAGATCAAAATTGCCGCCAAAAGCTTGCTGATAGTCTA TTCGGTGAAATCCTCAAGTCCGCACAGGAAGGTATAATTCTTCCTCCATATG TAACGCTTGCTGTTCGTCCAAGACCTGGTGTTTGGGACTTTTTGCGTGTGA ATGTCGATGAATTGAGTGTCGAGCAACTTACTGTTTCTGAGTATTTAAGCTT CAAGGAGGAGCTTGTAGATGGCCAGAGTAGGAACCCGTTTGTGTTGGAAC TGGATCTGGAACCGTTTAATGCAACATTTCCCCGGATGTCACGATCTTCATC CATCGGCAATGGAGTTCAGTTTCTCAACCGTCATCTCTCGTCAATTATGTTT CGCAACAAAGATTGTATGGATCCGTTTCTTGATTTCCTTCGTGCTCATAAAC ATAAAGGATACGCGATGATGTTGAATGATCGGATACAAACAATGTCTAGAC TTGAATCTTCTTTAGCAAAAGCGGAGGATCATCTCTCTAAACTACCACCCG AAACACCGTACTCCGAATTCGAATACGTATTGCAAGGAATGGGGTTTGAAA GAGGTTGGGGGGATAATTGTGAAAGAGTTCTTGGTATGATGCATCTTCTTT CTGACATTCTTCAAGCTCCAGATCCTTCGATTCTTGAAAAGTTTCTTGGAA AGATGCCGATGATCTTCAATGTTGTTGTGTTATCGATTCATGGTTACTTTGGT CAGGCTAATGTTTTGGGTTTGCCGGATACCGGTGGTCAGGTTGTATATATAT TGGATCAAGTACGTTCTTTGGAGAATGAAATGTTACTTAAATTAAGGCATC AAGGACTTGATATCAAACCCAAGATTCTAATTGTAACTCGATTGATACCAAA TGCCAAAGGTACTTCATGCAACCAACGATTGGAGAAAGTAAGTGGAACCG AATACACGTATATATTACGTGTCCCTTTTAGGACAGAGAAAGGGATTCTTGG TAAATGGTTATCAAGGTTTGATATATGGCCTTATTTGGAGGCGTTTACAACG GATGCAGCAAGTGAAATTGCTGCTGAGTTACACGGTGTTCCGGATCTTTTA ATAGGAAACTACAGTGATGGGAATCTCGTTGCCTCCTTGCTATCTAACAAAT TGGGCGTAACCCAGTGCAACATTGCACACGCGTTAGAGAAAACAAAGTATCCAGATTCCGACTTATATTGGAAGAAATTTGAGGACAAATATCACTTTTCAT GTCAATTTACCGCCGACCTTCTAGCAATGAACAATGCAGATTTTATCATCAC TAGCACATACCAAGAGATTGCAGGAACGAAAAACACCGTTGGACAATACG AGAATCATTCATCGTTCACTCTTCCGGGTCTATACAGGGTTGTTCACGGTAT CGATGTCTTTGACCCGAAGTTCAACATCGTGTCACCAGGGGCAGATATGGC AATTTACTTCTCATATGCCGATAAAGAGAGACGACTTACATCTCTACATCCC ACAATTGAGAAGCTATTGTTCGACACTGAGCAGAACGATGTACACATTGGA AATATAAATGACCCGTCTAAACCCATGATTTTCACAATGGCGAGGCTTGATC ATGTGAAGAATATAACTGGATTCGTCGAGTGTTATGCTAAAAATAATAAGTT GAGGGAACACGCAAATCTTGTGGTTATTGCTGGTTATAATGACGCGAAGAA ATCAAGTGATCGAGAAGAAATTGCGGAAATTGAAAAGATGCATAATCTTAT CAAGCAATACAAACTTGATGGTCAGATGAGATGGATATCAGCCCAAACAA ACCGGGCCCGAAATGGGGAATTTTATCGGTATATCGCTGATGGTAGGGGCG TTTTCGTCCAGCCCGCTTTCTATGAAGCATTTGGGCTTACGGTTGTGGAGG CGATGACATGTGGGCTCCCAACATTTGCCACGTGTCATGGTGGGCCTGCTG AGATCATTGAGGATGGTGTGTCGGGGTTCCATATTGATCCATATCATCCTGATAAGATGTCGACTACGTTAGCTGATTTTTTTCAAAAGTGCAAAGAGGAACC TAGTTACTGGGGTAAAATATCCGATGGCGGGCTGAAAAGAATAAGTGAAA GGTACACATGGAAGATATATTCGGAACGGTTGATGACGTTGGCGGGCGTAT ATAGCTTTTGGAAATATGTGTCAAAACTCGAGAGGCGTGAAACCCGTCGAT ACCTTGAGATGTTCTACATTTTAAAGTTTCGTCAACTGGTGAAGTCGGTTC CGCTAGCTGTTGATGAGGAGCCGTAA

SEQ ID NO：22(编码SUS4同种型)

ATGGCATCTGCTTCAAGTTCTATCATGAAACGGTCTGAATCAATAGTTGACA CCATGCCAGAAGCCTTAAAGCAGAGCCGCTATCATATGAAAAAATGTTTTC TAAAATATGTAGAAAAAGGAATTCGCATGATGAAAAGACATCATTTGATAC AAGAAATGGAGACCGCAATTGAAGACAAGGATGAAAAGGCTCAGCTTCTA GATGGCTTACTTGGCTACATCTTGTGCACAACTCAGGAAGCAGCCGTTGTT CCTCCTTGTGTTGCATTTGCTATAAGACCGAATCCTGGATTCTGGGAGTTTG TTAAAGTCAACTCTAATGATCTATCGGTTGATGGGATAACTGCCACAGATTA CTTGAAGTTCAAGGAAATGATCGTAGATGAGACATGGGCTAAAGATGAAA ATGCATTGGAGATTGACTTTGGATCGATGGACTTTAACCTACCAAACATGA GTTTATCTTGTTCGATTGGAAATGGTGTTAACTTCACATCAAAATTCATTAC TTGTAAACTTTACGCACAATCTAGTTGCCAACAACTGCTTGTTGATTACTTG CTCTCATTGAATCATCAAGGAGAAAATCTTATGATCAATGATGCATTAAACT CAGTCTCAAAACTTCGAGCGGCTTTAATTGTAGCTCATGCGTCGCTATCTTC GTTGCCCAACGATACTCCATATCAAAGCTTCGAGCTTAGATTCAAAGAATG GGGATTTGAGAAGGGATGGGGAGATAACGCGGAACGCGCGAGGGAAACA ATTCGGTTTCTTTTGGAGGTTCTTCAAGCACCCGATCCGATAAACCTCGAG GCTTTATTCAGCAGGATTCCAAACATATTCAACGTTGTTTTATTCTCGATTCA TGGGTATTTTGGTCAATCCAATGTTCTTGGATTGCCCGATACTGGTGGCCAA GTGGTTTATGTTTTGGATCAAGTGGTAGCTATGGAAGAAGAACTACTCATG AGGATCAAACAACAAGGACTCAACTTCAAGCCTCAAATTCTTGTGGTGAC CCGACTTCTTCCTGATGCTAAAGGGACCAAGTGTAATCAGGTGTTGGAACC AGTTCTGAACACGAAACATTCGCATATTCTTAGGGTTCCATTCAGGACTGAT AAAGGTGTTCTTCGTAAATGGGTATCTCGATTTGATATCTATCCATATCTCGA AAACTTCACTCAGGATGCAAGTGCGAAAATCATTGAAATGATGGAAGGGA AACCGGATCTTATCATCGGAAACTATACCGATGGAAACCTTGTTGCATCACT CATGGCTAACAAACTCGGAACGACATTGGGAACAATTGCACATGCTTTGG AGAAAACCAAATACGAAGATTCAGACATGAATTGGAAGCAATTCGACCCA AAATATCACTTCTCCTGCCAATTTACAGCCGATATGATTGCAATGAACTCAG CTGATTTCATCATCACAAGTACTTTCCAAGAAATCGCTGGAAGTAAAGATA GACCCGGACAATATGAAAGCCATGAAGCATTTACACTTCCAGGATTATACA GAGTTGTTTCAGGCATCAACGTGTTCGATCCCAAATTCAATATCGCGTCTCC AGGAGCCGATCAAACCGTTTATTTCCCGTACACCGAAACAAAGAAACGAT TCACTGCATTTCAACCCGCCATAGAGGAATTACTCTTCAGTAAAGTTGAAA ACGAAGAACACATTGGATACTTAGAAGACAAAACCAAACCGATCATATTCT CAATGGCGCGTCTCGACACAGTTAAGAACATAACAGGACTAACCGAATGG TTTGGAGAGAACAAACGGCTCCGAAGCTTGGTTAATCTTGTAATCGTGGCG GGTTTCTTTGACCCGTCAAAGTCAAAAGACAGAGAAGAAATGGCGGAAAT AAAGAAAATGCATTTATTGATTGAAAAATATCAGCTTAAAGGTCAAATAAG ATGGATTGCTGCACAAACTGATAAGAACCGAAACAGTGAGCTTTACCGGT TTATTGCTGACTCAAAAGGCGCGTTTGTGCAGCCCGCTTTGTATGAGGCGT TTGGGCTCACGGTTATTGAGGCGATGAACTGTGGTTTACCGACTTTTGCAA CTAATCAAGGTGGTCCAGCTGAGATTATCGTTGATGGTGTTTCTGGGTTCC AGATTGATCCTAATTTTGGTGATCAGTCTAGTAATAAGATTGCTGATTTCTTC CAGAAGTGTAAGGAAGATCCTGGTTATTGGAATAATATTTCAGAAGGCGGT TTGAAGCGTATATACGAATGTTATACTTGGAAGATTTATGCGAATAAAGTGT TGAATATGGGGAACATATACTCGTTTTGGAAGCGGTTAAACAAGGAACAAA AAGAAGCAAAACAAAGATACATTGAACTATTCTACAATCTACACTACAAGA ACTTGGTTAGGACTGTACCAATTGCTAGTGATGAAGCTCAACCTGCACCAG TGTCAAGGGCAAAACTTGCAACACAACCCACAAGACGTACGCAATCCAGGTTGCAAAGGCTGTTTGGAGCTTAA

SEQ ID NO：24(编码SUS5同种型)

ATGGCAGCTTCTTCAAGTCCCATTATGAAACGGTCTGAGTCAGTACTCGAC ACCATGCCAGAAGCTTTGAGGCAAAGTCGGTATCATATGAAAAAATGCTTT CTAAAATATGTAGGGAAAGGAAAGCGGATGGTGAAACTCCACCATTTGAT GCAAGAAATGGAGACCGTCATTGAGGACAAGGACGAAAAGGCTCAGCTC TTGGAAGGCTTACTTGGTTACATCTTGTGCACCACTCAGGAAGCAGCAGTT GTTCCTCCTTATGTCGCCTTTGCAATAAGGCCAAACCCTGGATTTTGGGAG TTTGTTAAAGTCAACTCTAATGATCTCTCGGTTAAAGGGATCACTTCCACC GATTACTTGAAGTTCAAGGAAATGATCGTTGACGAAACATGGGCTAATGAT GAAAATGCATTGGAGATCGACTTTGGAGCAATGGACTTTAACTTGCCAACA ATGAGCTTATCTTCTTCAATTGGAAATGGAGTTAACTTCACATCAAAGTTTA TTATTTCTAAACTTTATGCTCATTCTGGCAGCCAATTACAATCTCTAGTTGAT TACTTACTTTCATTAAATCATCAAGGAGAAAAACTTATGATAAATGACAAAC TAAACACAGTTTCAAAACTTCAAGCCGCTCTAATAGTAGCTCATTCTTTCCTTTCTTCATTGCCCAACGACACACCGTATCAAAGCTTTGAACTTAGATTTAA AGAGTGGGGTTTTGAAAAAGGATGGGGAGATTATGCAGAAAGGGTGCAA GAAACAATTCGGTTTTTGTTGGAGGTTCTTCAAGCACCCGACCCCGTAAACCTAGAGGCCTTTTTTAGCAGGGTTCCAAACATATTCAATATTGTTTTATTCTC GATTCATGGGTATTTTGGTCAATCCAATGTTCTTGGCTTGCCCGATACCGGA GGTCAGGTAGTTTATGTTTTGGATCAAGTTGTGGCAATGGAAGAAGAATTG CTACTTAGGATTAAGCAACAAGGACTCAGCTTCAAGCCTCATATTCTTGTG GTGACTCGACTTCTTCCCGATGCCAAAGGGACCGAGTGTAGCCAAGTTTT GGAACCAGTTCTCAACACGAAACACTCACACATTCTTAGAGTCCCATTTAG GACAGAAAAAGGTGTTCTTCGTAAATGGGTGTCTCGATTTGATATCTATCCA TACCTCGAAAAGTTTACTCAGGATGCAAGTGCAAAAATAACTGAAATGATG GAAGGAAAACCTGATCTTATCATTGGAAACTACACTGACGGAAACTTGGTT GCATCTCTCATGGCTAACAAACTCGGAAGCACATTGGGAACGATTGCACA CGCGTTAGAGAAGACTAAATACGAAGATTCAGACATGAAATGGAAACATT TGGACACAAAATATCACTTTTCTTGTCAATTTACAGCTGATATGATAGCAAT GAATTCAGCAGATTTCATCATCACTAGTACTTTCCAAGAAATTGCTGGAAG TAAAGATAGACCCGGTCAGTATGAAAGCCATGAAGCATTTACACTCCCGGG TTTATATAGAGTTGTTTCGGGCATCAACGTGTTTGATCCCAAATTCAACATT GCATCTCCGGGAGCTGATCAAACCGTTTATTTCCCTTACACGGAAACACCA AAACGATTCACTACTTTTCAACCCGCTATACAAGAATTACTCTTTAGTAAAG TTGAAAACGACGAACACATTGGATATTTAGAAGATAAGAATAAACCAATCA TCTTCTCAATGGCAAGACTCGACATGGTTAAGAACATAACGGGGCTAACCG AATGGTTTGGGGAAAACAAGCGGTTAAGAAGTTTGGTTAATCTTGTAATTG TGGCGGGGTTTTTTGATCCGTCAAAATCAAAAGATAGAGAAGAAATGGAA GAAATAAAGAAAATGCATTTGTTGATTGAGAAATATGAACTTAAAGGTCAA ATAAGATGGATAGTAGCACAAACTGATAAAAACAGAAATAGTGAACTTTAT CGTTGTATCGCTGACTCAAAGGGGGCGTTTGTGCAACCGGCTTTATATGAA GCGTTTGGGTTAACCGTTATTGAGGCTATGAATTGTGGGTTACCAACTTTTG CAACTAACCAAGGTGGTCCGGCTGAGATTATTGTTGATGGTGTTTCTGGGT TCCAAATCGATCCTAATTATGGCGACGAGTCTAGCAACAAGATCGCTGATT TTTTTCAAAAATGCAAACAGGATCCAGGATACTGGAATAGGATTTCAGACG GTGGTTTGATGCGTATATACGAATGCTACACATGGAAGATTTATGCAAATAA AGTGTTGAATATGGGGAACATTTACACATTTTGGAAGCAGTTAAACAAGGA ACAGAAAGATGCGAAACAAAGATACATTGAGCTATTCTACAATCAACATTA CAAGAATTTGGTTAGGACTGTGCCGATTGTAAGTGATGAAGATGACCAAGT TACAAGGGCAAAACCGGCAACACAACCTTCAACAAGGCGCACACAATCT GCCTTGCAAAGGCTGCTTGGAGCTTAA

SEQ ID NO：26(编码SUS6同种型)

ATGGATTTCGGTATAGCAGAGACTTTGGCCGAGGCATTGAAGCAAAACCG GTACCATGCAAGGAGATGCTTTGAGCGTTTTACATCACGTGGAAAAAGGAT GGTGAAGCCTCAAGAGTTATTACACATGATTGAAAAAACCATTGACGACA AGCTTGAAAGAACGAAGGTCTTGGAGGGCTCAATGGGACAAATCTTGAGT TCCACACAGGAGGCAATCGTTATTCCACCATATGTTATTTTAGGATTGAGAG CGAATCCAGGACAATGGGCATACGTTAAGATCAATGCTGATGACGTCACTG TTGAGTCACTCACACCTTCACAATATCTAAAGTTCAAAGAATCCATCTACG ATCAAGAATGGGCAAAGGACGAAAATGCCCTTGAACTAGATTTCGGAGCG TTCGACTTTGATACGCCTCGATTAATCCTCCCGTCATCTATCGGCAACGGAC TCGGTTACATTTCAAAGTTCATGACTTCAAGAATTGGTGGTGATCTAGAAA ACGCGAAGCCGTTGCTTGACCACTTGCTTGCTCTAAAATATCATGGAGAGA AGCTTATGATCAATGAGACAATAGATACAGTTTCAAAGCTCCAGAAAGCAT TAATTGTTGCTGATGTCTACTTATCTGCACACCCGAAAGACGAACAATATCA AACCTTAGAGCCCAAGCTTAAAGAATGGGGATTTGAGAAAGGATGGGGAG ATACTGCTGAAAGAGTTAGAGAGACAATGAAAATGCTTTCGGAGATTCTTC AAGCACCCGACCCGATTAACATGCAATCGTTCTTTAGCAGGCTTCCGGTGGTCTTCAATATTGTCATATTTTCTATTCATGGGTATTTTGGTCAATCAGATGTTC TTGGATTACCTGATACCGGAGGGCAGGTTGTTTACATTCTTGATCAAGTTAA AGCATTAGAGGAAGAGATATTGCTAAGAATAAAAATGCAAGGATTGAATGC AAAGCCTCGGATTCTTGTGGTGAGTCGACTCATTCCCGACGCACAAGGAA CAAAGTGTAACGAGGAAATGGAACCGATCTTGAACACAATGCATTCACAC ATCCTTCGGGTTCCTTTCAGAACCTCAAAAGGCGTTGTTCCTCAATGGGTA TCGCGGTTTGACATCTACCCGTATCTTGAAAGATTCTCACAGGACGCTGCC TCTAAAATACTTGAAGTAATGGAATGTAAACCAGATCTCATACTTGGAAACT ACACAGATGGAAACATTGTTGCATCACTTATAGCCAAAAAGTTTGGAGTAA CACAGGGGACGATTGCACACGCGTTAGAGAAGACAAAGTACGAAGATTCG GATGTTAACTGGAAAAACTTTGAAAAAAAGTATCATTTCTCATGTCAATTT ACCGCGGATTTGATCTCAATGAACGCTGCAGATTTCATAATCACAAGCACT TATCAAGAAATTGTGGGAAGCAAACAAAGACCCGGACAGTATGAGACCCA CGGGGCGTTTAGTATGCCCGGACTTTGTAGAGTCGTGTCGGGCATCAACGT GTTTGATCCTAAGTTCAACATTGCTTCACCCGGTGCGGAACAATCGGTTTAT TTTCCGTACACCGAGAAGGAGAAACGGTTAACGGATTTTCATCCCGCAATT AAAGAACTACTTTTCAACGAACAAGACAATGACGAGCATATGGGATACCT CGCGGATGTAACCAAACCGATAATATTCTCAATGGCGAGGCTCGATACGGT GAAGAACATAACAGGGTTAACCGAGTGGTTCGGTAAGAACAAACGACTTAGAAGTCTTGTAAACTTGGTTGTTGTCGCGGGGTTCTTCGATCCATCAAAAT CTAAAGACCGTGAAGAGATGGAGGAAATCAAGAAAATGCATGAACTAATA GAGAAATACAAACTCAAGGGTCAGATGAGATGGATCGCGGCTCAAAACGATAGGACCCGCAATGGTGAATTGTATCGGTGTATTTCCGATACGAAGGGAGC GTTTGTGCAGCCCGCGTTGTATGAGGCTTTTGGGCTCACGGTTATCGAGGC AATGAACTGCGGTCTCCCGACTTTTGCAACCAATCAAGGCGGGCCCGCGG AGATCATAGTTGACGGAGTTTCGGGATTTCATATTGATCCCGTTAACGGAGA TGAATCAAGCAACAAGATTGCTGATTTCTTCACGAAATGCAAAGTCGATGG CGAGTATTGGGACCGCGTGTCGCAAGCGGGACTTCAACGTATTTACGAGT GCTACACATGGAAGATGTATGCTAACAAAGCATTGAACATGGGTTCGATGT ATGGTTTTTGGAGGCAATTAAACAAAGAAACTAAGCAAGCGAAGCAACGA TACATCGATATCTTGTATAACTTACAATTCAAGAATTTGGCAAAAACCATTG AAATCCCTGATTTTGTGACTCCTAAACTTCAAGAACCGGTCAAAACCGAA CCAACAAAACCATTACAAGAAGCAAGACCTCGAGAACCGGTGCAAAAAC TGGTACCGGAAGAAACCCGACTGCCAAAACTAGAGTTGACCAAGCTTGGT CAACCGAATTTGATGAGCAATGCAAGAAAACCATTGATTGTTCTTGTTTCT GTGTTGATAGTTGCATATGCATCCAAGAACTTGTATAGGAGGTATTTCAAAT AG

在其他实施方案中，提供了包括如下序列的核酸：所述序列与SEQ ID NO： 2、4、6、8、10、14、16、18、20、22、24、26、28、30、32和34中所示序列及其片段或其互补序列中的任意一个具有至少50％，55％，60％，65％，70％， 75％，80％，85％，90％，95％，96％，97％，98％，99％或100％同一性。

在其他实施方案中，提供了编码包括如下序列的多肽的核酸，所述序列与 SEQ IDNO：1、3、5、7、9、13、15、17、19、21、23、25、27、29、30、31 和33中所示序列及其片段中的任意一个具有至少50％，55％，60％，65％，70％， 75％，80％，85％，90％，95％，96％，97％，98％，99％或100％同一性的序列。本领域技术人员将容易理解，总体序列同一性或相似性可能小于50％，而酶的区域(例如催化位点或邻近催化位点的区域)可具有保守的氨基酸。例如，在邻近UDPG催化位点的开口处有保守的氨基酸。特别是，UGT76G1的379位亮氨酸是保守的。在某些实施方案中，核酸编码这样的UDP-葡糖基转移酶：其在SEQ ID NO：1所示的UGT76G1的375至381位氨基酸残基的相应位置处具有序列SDFGLDQ。

在某些实施方案中，片段的长度为至少10个，至少20个，至少50个核苷酸。片段可以用作例如引物或探针。

还提供了与本发明的核酸或其互补序列杂交的核酸。在某些实施方案中，提供了与SEQ ID NO：2、4、6、8、10、14、16、18、20、22、24、26、28、 30、32和34所示序列或其互补序列中的任意一个在低、中或高严格条件下进行杂交的核酸。本领域技术人员容易理解，杂交和杂交强度(即，核酸之间的缔合强度)受例如核酸之间的互补程度、所涉及的条件的严格性、形成的杂交体的Tm和核酸内的G：C比等因素影响。这样的技术人员可以容易地确定适当的严格条件(参见，例如，Sambrook，等人，Molecular Cloning:A Laboratory Manual, 2^nded.,Cold Spring Harbor Laboratory Press,New York(1989)pp.9.50-51,11.48-49 and11.2-11.3)。

通常在高严格条件下，只有高度相似的序列才会在这些条件下杂交(通常>95％的同一性)。通常在中严格条件下，具有大于80％同一性的那些序列会杂交，在低严格条件下，具有大于50％同一性的那些序列会杂交。

当用于核酸杂交时，“高严格条件”的非限制性实例包括相当于以下的条件：当使用长度约500个核苷酸的探针时，在由5×SSPE(43.8g/l NaCl，6.9g/l NaH₂PO₄H₂O和1.85g/l EDTA，用NaOH调节至pH 7.4)、0.5％SDS、5×Denhardt 试剂和100μg/ml变性鲑鱼精子DNA组成的溶液中在42℃下结合或杂交，随后在42℃下在含有0.1×SSPE、1.0％SDS的溶液中洗涤。当用于核酸杂交时，“中严格条件”的非限制性实例包括相当于以下的条件：当使用长度约500个核苷酸的探针时，在由5×SSPE(43.8g/l NaCl，6.9g/l NaH₂PO₄H₂O和1.85g/lEDTA，用NaOH调节至pH 7.4)、0.5％SDS、5×Denhardt试剂和100μg/ml变性鲑鱼精子DNA组成的溶液中在42℃下结合或杂交，随后在42℃下在含有1.0×SSPE、 1.0％SDS的溶液中洗涤。当用于核酸杂交时，“低严格条件”的非限制性实例包括相当于以下的条件：当使用长度约500个核苷酸的探针时，在由5×SSPE(43.8 g/l NaCl，6.9g/l NaH₂PO₄H₂O和1.85g/lEDTA，用NaOH调节至pH 7.4)、0.5％ SDS、5×Denhardt试剂和100μg/ml变性鲑鱼精子DNA组成的溶液中在42℃下结合或杂交，随后在42℃下在含有5×SSPE、0.1％SDS的溶液中洗涤。

多核苷酸包括单独的编码序列多肽，与其他编码序列(例如纯化标签、定位信号、作为融合蛋白、作为前体蛋白等)组合的编码序列多肽，与非编码序列(例如，内含子或内含肽(intein)、调控元件如启动子(包括诱导型启动子、组织特异性启动子(如根特异性或叶特异性启动子)、增强子、终止子等)组合的编码序列多肽，和/或载体或宿主环境中的编码序列多肽，其中编码转录因子或转录因子同系物多肽的多核苷酸是内源性或外源性基因。

适当的其他编码序列(例如纯化标签、定位信号、作为融合蛋白、作为前体蛋白等)，非编码序列(例如，调控元件如启动子(包括诱导型启动子、组织特异性启动子(如根特异性或叶特异性启动子)、增强子，终止子等)以及用于原核生物(如大肠杆菌)和真核细胞(包括但不限于酵母和植物细胞)的载体是本领域已知的。

多肽

本发明提供了糖基转移酶。本发明的糖基转移酶能够进行初级、二级和/或三级糖基化作用。在某些实施方案中，糖基转移酶能够进行初级、二级和三级糖基化作用。在其他实施方案中，糖基转移酶能够进行二级和/或三级糖基化。在某些实施方案中，糖基转移酶是葡糖基转移酶，其包括但不限于UDP-糖基转移酶。葡糖基转移酶包括但不限于甜叶菊UDP-葡糖基转移酶，如UGT76G1或 UGT74G1或稻(Oryza sativa)葡糖基转移酶，如Os03g0702000。在其他实施方案中，本发明提供了环糊精葡聚糖转移酶。还提供了蔗糖合成酶。

在某些实施方案中，提供了UGT76G1或UGT76G1样葡糖基转移酶。 UGT76G1样葡糖基转移酶包括，例如，UGT76G1进化枝的其他成员，如 UGT76G2或UGT76H1。因此，在某些实施方案中，提供了UGT76G1，其包括 SEQ ID NO：1、3、5和7中任意一个所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的UGT76G1，所述核酸分子包括SEQ ID NO：2、4、6和8中任意一个所示的序列。

在某些实施方案中，提供了UGT76G2，其包括SEQ ID NO：27所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的 UGT76G1，所述核酸分子包括SEQ ID NO：28所示的序列。

在某些实施方案中，提供了UGT76H1，其包括SEQ ID NO：29所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的 UGT76G1，所述核酸分子包括SEQ ID NO：30所示的序列。

在某些实施方案中，提供了Os03g0702000或Os03g0702000样葡糖基转移酶。Os03g0702000样葡糖基转移酶包括例如，UGT91进化枝的其他成员，如 UGT91D1或UGT91D2。因此，在某些实施方案中，提供了Os03g0702000，其包括SEQ ID NO：9所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的Os03g0702000，所述核酸分子包括SEQ ID NO：10 所示的序列。

在某些实施方案中，提供了UGT91D1，其包括SEQ ID NO：31所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的 UGT91D1，所述核酸分子包括SEQ ID NO：32所示的序列

在某些实施方案中，提供了UGT91D2，其包括SEQ ID NO：33所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的 UGT76G1，所述核酸分子包括SEQ ID NO：34所示的序列

在某些实施方案中，提供了甜叶菊UGT74G1。因此，在某些实施方案中，提供了UGT74G1，其包括SEQ ID NO：13所示的氨基酸序列或其片段和变体。在某些实施方案中，提供了由如下核酸分子编码的UGT74G1，所述核酸分子包括SEQ ID NO：14所示的序列。

在其他实施方案中，本发明提供了环糊精葡聚糖转移酶。环糊精-葡聚糖转移酶可商购获得(CGTase，Toruzyme 3.0L，Novozymes公司的商标)。

在某些实施方案中，提供了蔗糖合成酶。因此，在某些实施方案中，蔗糖合成酶包括SEQ ID NO：15、17、19、21、23或25所示的氨基酸序列或其片段和变体。在某些实施方案中，多肽包括由如下核酸分子编码的氨基酸序列，所述核酸分子包括SEQ ID NO：16、18、20、22、24或26所示的序列。

在其他实施方案中，提供了一种多肽，其包括与SEQ ID NO：1、3、5、7、 9、13、15、17、19、21、23、25、27、29、31和33中所示序列及其片段中的任意一个具有至少50％，55％，60％，65％，70％，75％，80％，85％，90％， 95％，96％，97％，98％，99％或100％同一性的序列。本领域技术人员将容易理解，相关酶的总体序列同一性或相似性可能小于50％，而酶的区域(例如催化位点或邻近催化位点的区域)可具有保守的氨基酸，因此相关酶具有相似的活性。例如，在邻近UDPG催化位点的开口处有保守的氨基酸。特别是，UGT76G1 的379位亮氨酸是保守的。在某些实施方案中，核酸编码这样的UDP-葡糖基转移酶，其在位置处具有序列SDFGLDQ。在某些实施方案中，片段的长度为至少 10个，至少20个，至少50个氨基酸。在某些实施方案中，多肽序列含有异源序列，包括但不限于纯化标签，如HIS标签。在某些实施方案中，提供了在N- 末端包括6×HIS标签的多肽。在其他实施方案中，提供了在C-末端包括6×HIS 标签的多肽。

用于筛选糖基转移酶(包括葡糖基转移酶和环糊精葡聚糖转移酶)的活性的方法是本领域已知的。如此，本领域技术人员可以容易地确定糖基转移酶是否能够进行初级、二级和/或三级糖基化作用(参见，例如Dewitte等人，J Biotechnol.2016Sep 10；233:49-55.doi:10.1016/j.jbiotec.2016.06.034；Grubb等人， Plant J.(2014)79,92-105；Richman等人，Plant J.(2005)41,56-67；Tanaka等人， Plant Cell Rep.(1996)15,819-823；Tanaka等人，J.Nat.Prod(1993)56(12), 2068-2072.)。此外，用于筛选蔗糖合成酶的活性的方法也是本领域已知的 (Baroja-Fernandez等人，PNAS.(2012)109(1),321-326.doi: 10.1073/pnas.1117099109；Barratt等人，Plant Physiol.(2001)127,655-664；Huber and Akazawa,Plant Physiol.(1986)81,1008-1013)。

细胞和植物

本发明进一步提供了表达一种或多种本发明的多肽的细胞和植物。细胞和植物可以天然表达一种或多种本发明的多肽或已被修饰来表达一种或多种本发明的多肽。细胞可以是原核或真核细胞，包括但不限于大肠杆菌，酵母例如毕赤酵母，甜叶菊，美洲商陆(Phytolacca Americana)，大麻属(Cannabis)包括但不限于栽培大麻、印度大麻和莠草大麻。

在某些实施方案中，提供了表达UGT76G1或UGT76G1样葡糖基转移酶(如 UGT76G2和UGT76H1)的细胞。因此，在某些实施方案中，提供了表达UGT76G1 葡糖基转移酶的细胞，所述UGT76G1葡糖基转移酶包括编码如SEQ ID NO：1、 3、5和7中任一个所示的氨基酸序列的序列。在某些实施方案中，提供了表达 UGT76G1样葡糖基转移酶的细胞，所述UGT76G1样葡糖基转移酶包括编码如 SEQ ID NO：27或29所示的氨基酸序列的序列。该细胞可进一步表达另外的葡糖基转移酶，如Os03g0702000或Os03g0702000样葡糖基转移酶(如UGT91D1和UGT91D2)和/或蔗糖合成酶，如包括SEQ ID NO：15、17、19、21、23或 25中所示序列的蔗糖合成酶。

因此，在某些实施方案中，提供了表达UGT76G1葡糖基转移酶和 Os03g0702000葡糖基转移酶的细胞，所述UGT76G1葡糖基转移酶包括编码如 SEQ ID NO：1、3、5和7中任一个所示的氨基酸序列的序列，所述Os03g0702000 葡糖基转移酶包括如SEQ ID NO：10中所示的序列。该细胞可以进一步表达包括SEQ ID NO：15、17、19、21、23或25中所示序列的蔗糖合成酶。

在某些实施方案中，提供了表达Os03g0702000或Os03g0702000样葡糖基转移酶的细胞。因此，在某些实施方案中，提供了表达Os03g0702000葡糖基转移酶的细胞，所述Os03g0702000葡糖基转移酶包括编码SEQ ID NO：10所示氨基酸序列的序列。该细胞可以进一步表达蔗糖合成酶，如包括SEQ ID NO： 15、17、19、21、23或25中所示序列的蔗糖合成酶。

转基因细胞和植物(包括植物细胞或植物外植体或植物组织)可以通过多种已建立的技术来生产。在构建包括本发明的多核苷酸的载体，最典型的是表达框后，可以使用标准技术将多核苷酸引入至细胞或植物中。任选地，植物细胞、外植体或组织可以被再生以产生转基因植物。

在某些实施方案中，提供了基因工程化以表达一种或多种本发明的蛋白质的大麻属植物。本领域技术人员将容易地理解用于基因工程化大麻属植物的合适载体和启动子。例如，可以使用组织特异性启动子，如分泌毛状体特异性启动子，使得本发明的蛋白质能在产生大麻素的相同组织(即植物的分泌毛状体) 中表达。合适的启动子元件包括来自拟南芥(Arabidopsis thaliana)的胞质O- 乙酰丝氨酸(硫醇)裂解酶(OASA1)的启动子(Gutierrez-Alcala 2005)。

现在，植物细胞的转化和再生是常规的，并且最适合的转化技术的选择将由从业人员确定。合适的方法可以包括但不限于：植物原生质体电穿孔；脂质体介导的转化；聚乙二醇(PEG)介导的转化；使用病毒转化；微注射植物细胞；微粒子轰击植物细胞；真空渗透；和根癌农杆菌(Agrobacterium tumeficiens)介导的转化。转化意指以引起序列稳定或瞬时表达的方式将核苷酸序列引入至植物中。

用克隆序列转化来修饰植物特征的成功例子包括：美国专利号5,571,706； 5,677,175；5,510,471；5,750,386；5,597,945；5,589,615；5,750,871；5,268,526； 5,780,708；5,538,880；5,773,269；5,736,369和5,610,042，其用于说明本技术领域的当前知识，并且其通过引用并入本文。

转化后，可以使用掺入转化载体中的显性选择标记来选择植物。通常，这样的标记将赋予已转化的植物以抗生素或除草剂抗性，可以通过将植物暴露于适当浓度的抗生素或除草剂中来完成转化体的选择。

方法

本发明进一步提供了用于生产大麻素糖苷前药的方法和通过该方法产生的大麻素糖苷前药。该方法可以在体外或体内(在细胞系统或植物体中(in planta)) 进行。在某些实施方案中，提供了生产大麻素糖苷前药的方法，所述方法包括在一种或多种糖基转移酶的存在下，将大麻素糖苷配基与一种或多种糖供体一起孵育。

糖苷配基包括但不限于：大麻素类，其包括但不限于大麻二酚、次大麻二酚、大麻萜酚、四氢大麻酚、大麻酚和大麻二酚酸，内源性大麻素类，其包括但不限于花生四烯酸乙醇酰胺(花生四烯酰乙醇胺，AEA)、2-花生四烯酸乙醇酰胺(2-AG)、1-花生四烯酸乙醇酰胺(1-AG)和二十二碳六烯酰乙醇酰胺 (DHEA，synaptamide)；和类香草素，包括但不限于香草醛、姜黄素和辣椒素。

本领域技术人员将容易理解，所述一种或多种糖供体将取决于所述方法中使用的一种或多种糖基转移酶和/或所需终产物。例如，对于UDP-葡糖基转移酶，糖供体包括但不限于UDP-葡萄糖，UDP-葡萄糖醛酸，UDP-甘露糖，UDP-果糖， UDP-木糖，UDP-氟脱氧葡萄糖和UDP-鼠李糖。对于环糊精葡聚糖转移酶，糖供体包括麦芽糖糊精。

在某些实施方案中，提供了生产大麻素糖苷的方法，所述方法包括在糖基转移酶的存在下，将糖苷配基与糖供体一起孵育。还提供了通过上述方法产生的大麻素糖苷。在具体的实施方案中，提供了生产大麻素糖苷的方法，所述方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶的存在下，将糖苷配基与UDP-葡萄糖一起孵育。在其他具体的实施方案中，提供了生产糖苷前药的方法，所述方法包括在允许糖基化的条件下，在环糊精葡聚糖转移酶的存在下，将糖苷配基与麦芽糖糊精一起孵育。

产生大麻素糖苷的示例性方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶的存在下，将大麻素与UDP-葡萄糖一起孵育。还提供了通过上述方法产生的大麻素糖苷。

产生大麻素糖苷的另一个示例性方法包括在允许糖基化的条件下，在环糊精葡聚糖转移酶的存在下，将大麻素与麦芽糖糊精一起孵育。还提供了通过上述方法产生的大麻素糖苷。

在某些实施方案中，提供了生产大麻素糖苷的方法，所述方法包括在允许糖基化的条件下，在第一糖基转移酶和第二糖基转移酶的存在下，将糖苷配基与一种或多种糖供体一起孵育。还提供了通过上述方法产生的大麻素糖苷。

本领域技术人员将容易理解，第一糖基转移酶和第二糖基转移酶可同时提供或顺次添加。另外，如果使用多于一种糖供体，则糖供体可以同时提供或顺次添加。这样的技术人员会进一步意识到，所得大麻素糖苷的结构可能取决于糖基转移酶的提供顺序。另外，第一与第二糖基转移酶的比例可能影响所得产物。本领域技术人员将进一步认识到，糖基转移酶的活性水平可决定该比例，并且该比例可由本领域技术人员容易地确定。例如，第一与第二糖基转移酶的比例包括但不限于1：1、1：2、1：10、1：50，反之亦然。

在具体的实施方案中，提供了生产大麻素糖苷的方法，所述方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶和Os03g0702000 或Os03g0702000样葡糖基转移酶存在下，将糖苷配基与UDP-葡萄糖一起孵育。在可选的具体实施方案中，提供了生产大麻素糖苷的方法，所述方法包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶和环糊精葡聚糖转移酶存在下，将糖苷配基与UDP-葡萄糖和麦芽糖糊精一起孵育。还提供了通过上述方法产生的大麻素糖苷。

产生大麻素-糖苷的示例性方法包括在允许糖基化的条件下，在UGT76G1 或UGT76G1样葡糖基转移酶和Os03g0702000或Os03g0702000样葡糖基转移酶的存在下，将大麻素(包括但不限于大麻二酚，次大麻二酚，大麻萜酚，四氢大麻酚，大麻酚和大麻二酚酸)与UDP-葡萄糖一起孵育。还提供了通过上述方法产生的大麻素糖苷。

生产大麻素糖苷的另一示例性方法包括在允许糖基化的条件下，在 UGT76G1或UGT76G1样葡糖基转移酶和环糊精葡聚糖转移酶的存在下，将大麻素类与UDP-葡萄糖和麦芽糖糊精一起孵育。还提供了通过上述方法产生的大麻素糖苷。

以下内容在本发明的范围内：上述糖基化方法中的每一种均可以应用于低级大麻素糖苷以形成高级大麻素糖苷。例如，使用本发明的任意糖基化方法可将大麻素单糖苷糖基化以形成二糖苷，或可将大麻素二糖苷糖基化以形成三糖苷等。

纯化大麻素糖苷的方法是本领域已知的，并且包括例如固相萃取法，如柱纯化。

本发明还提供了用于生产大麻素糖苷的细胞培养方法和在植物体中的方法。所述方法包括在产生糖苷配基的细胞或植物中表达一种或多种糖基转移酶，并分离大麻素糖苷。在某些实施方案中，还表达了一种或多种蔗糖合成酶。适合的载体和基因工程方法是本领域已知的。

本发明还提供了利用本发明的蔗糖合成酶将UDP转化为UDPG的方法。因此，在某些利用UDP-葡萄糖作为糖供体生产大麻素糖苷的方法的实施方案中，所述方法进一步包括使用蔗糖合成酶来回收利用UDP。在某些实施方案中，提供了生产大麻素糖苷的方法，所述方法包括在允许糖基化的条件下，在UGT76G1 葡糖基转移酶和蔗糖合成酶的存在下，将糖苷配基与UDP-葡萄糖一起孵育。

现在将参考具体实施例来描述本发明。将理解的是，以下实施例旨在描述本发明的实施方式，而不意图以任何方式限制本发明。

实施例

实施例1：将大麻素转化为大麻素糖苷前药

糖基化反应由50mM KPO₄ pH 7.2、3mM MgCl₂、0.005％CBD、2.5％ UGT76G1纯化酶制剂和2.5mM UDP-葡萄糖组成。将缓冲液脱气并用氮气吹扫管，将反应保护避光，并在28℃下以180rpm搅拌孵育18小时。然后用等体积的乙酸乙酯萃取反应物3次，蒸发至干，并溶于半体积的HPLC级甲醇中。将 50微升注射到反相C18柱上并用从10％开始并增加到99％的乙腈梯度洗脱。通过在毕赤酵母中表达产生UGT76G1并通过标准分子生物学技术纯化。发现UGT76G1酶以UDP-葡萄糖依赖性方式糖基化CBD。该活性也与UDP-葡萄糖的存在量成比例。孵育温度为28℃，可接受的范围为20℃至30℃，因为高温会导致CBD显著降解。反应在黑暗中进行以防止底物的光降解。使用120至 200rpm的温和搅拌在惰性气氛中混合反应物。

用Δ9THC和CBDV代替反应中的底物CBD，并以相同的方式进行，得到相似的结果。对于CBD-糖苷，产生各种产物所需的酶组合列于表4中，对于 CBDV-糖苷，列于表5中，，对于Δ9THC-糖苷，列于表6中。

针对CBD活性筛选的其他酶是甜叶菊UGT74G1、UGT85C2、UGPase，大肠杆菌麦芽糖糊精磷酸转移酶(MalP)和欧洲玉米(O.sativa)Os03g0702000(SEQ ID NO.9)。除UGT76G1以外，用任何其他测试酶均未观察到初级糖基化活性。

实施例2：CBD-单糖苷的2-O糖基化

如实施例1中所述进行酶促反应，但包含相对于UGT76G1而言1:2比例的重组Os03g0702000酶。如实施例1中那样萃取和分析样品。优化重组 Os03g0702000酶密码子并在大肠杆菌BL21-DE3细胞中表达并通过固定化金属离子色谱法纯化。

实施例3：CBD转化成α-糖苷连接的CBD化合物。

如实施例1所示，将重组环糊精葡聚糖转移酶(CGTase，Toruzyme 3.0L商品名，Novozymes Inc.)加入到反应中，但没有UDPG或UGT76G1。麦芽糖糊精以0.05％终浓度使用，Toruzyme 3.0L以0.1％使用。如实施例1中那样萃取和分析样品。此外，进行实施例1的反应以将大麻素转化成大麻素-糖苷，然后加入CGTase和麦芽糖糊精，并给予足够的时间与大麻素糖-糖苷孵育。所得产物在大麻素骨架上含有β-糖基化，和由初级糖释放的α-糖基化。这种额外的处理产生了一类称为β-引发的、α-糖基化的大麻素的新化合物。

实施例4：大麻素糖苷的纯化

通过上述生物催化反应产生糖苷产物并通过C18固相提取纯化至均质。将 100mgHypersep C18柱(Thermo)在甲醇中水合，用50％甲醇水溶液冲洗，用水冲洗，糖基化反应过柱，用水洗涤，用10％、20％和30％甲醇洗涤，并用45 和60％甲醇水溶液洗脱糖苷产物。将洗脱液干燥并用乙酸乙酯萃取，并干燥至完全产生>95％纯的大麻素-糖苷，用于进一步分析和测试。

实施例5：大麻素糖苷前药的HPLC分析

图16至24分别提供了大麻素糖苷配基CBD、CBDV、Δ9-THC、CBN、1-AG 和2-AG、DHEA、AEA、辣椒素和香草醛的糖基化反应的反应产物的HPLC线图。如实施例1所述进行酶促反应。实线表示起始糖苷配基的洗脱曲线，虚线表示糖基化反应产物混合物的洗脱曲线。

在图16中，CBD糖苷配基保留时间为13.65min，在8.87、9.02、9.97、10.33 和10.37min处观察到产物峰。

在图17中，CBDV糖苷配基保留时间为12.75min，在8.53、9.70和10.01min 处观察到产物峰。

在图18中，THC糖苷配基保留时间为14.45min，在9.46、10.67、10.97、 11.28、11.67和12.49min处观察到产物峰。

在图19中，CBN糖苷配基保留时间为14.32min，在10.87、11.50和12.25min 处观察到产物峰。

在图20中，1-AG糖苷配基保留时间为14.18min并且2-AG糖苷配基保留时间为14.32min，在11.40、11.78、11.83、11.97、12.53、12.92、13.07和13.35 min处观察到产物峰。

在图21中，DHEA糖苷配基保留时间为13.78min，在10.09和12.43min 处观察到产物峰。

在图22中，AEA糖苷配基保留时间为13.87min，在12.47min处观察到产物峰。

在图23中，香草醛糖苷配基保留时间为1.95min，在1.25至1.35min处观察到产物峰。

在图24中，辣椒素糖苷配基保留时间为11.73min，在10.23min处观察到产物峰。

实施例6A：CBD糖苷的LCMS分析

如图16的HPLC线图所示，在+65小时的孵育时间后，输入的CBD糖苷配基(VB101，13.65′)已经耗尽至原始量的5％。CBD-糖苷在8.87、9.02、9.97、 10.33和10.37min时洗脱出HPLC柱。通过LCMS分析鉴定糖基化产物。糖基化产物“g1”是单糖苷，“g2”是二糖苷，“g3”是三糖苷，“g4″是四糖苷。在Shimadzu LC-MS 2010EV仪器上进行LC-LRMS。所用的LC柱是Silia Chrom XDB C18 5um，150A，4.6X50mm。该方法是12分钟5:95H2O:ACN梯度。对于LRMS，以正模式进行电喷雾电离(ESI)。

VB101(CBD糖苷配基)MS数据:LC/ESI-LRMS。[M+H]⁺(C₂₁H₃₁O₂)计算值：m/z＝315。实测值：m/z＝315。

(CBDg1)MS数据:LC/ESI-LRMS。[M+H]⁺(C₂₇H₄₁O₇)计算值：m/z＝477。实测值：m/z＝477。

VB104(CBDg2)MS数据:LC/ESI-LRMS。[M+H]⁺(C₃₃H₅₁O₁₂)计算值：m/z ＝639。实测值：m/z＝639。

VB110(CBDg2)MS数据:LC/ESI-LRMS。[M+H]⁺(C₃₃H₅₁O₁₂)计算值：m/z ＝639。实测值：m/z＝639。

(CBDg3)MS数据:LC/ESI-LRMS。[M+H]+(C₃₉H₆₁O₁₇)计算值：m/z＝801。实测值：m/z＝801。[M+K+H]⁺(C₃₉H₆₁O₁₇K)计算值：m/z＝420。实测值： m/z＝420。[M+ACN+H₂O+H]⁺(C₄₁H₆₃NO₁₇)计算值：m/z＝860。实测值：m/z ＝860。

(CBDg4)MS数据:LC/ESI-LRMS。[M+H]+(C₄₅H₇₁O₂₂)计算值：m/z＝964。实测值：m/z＝964。[M+H₂O+H]⁺(C₄₅H₇₃O₁₈)计算值：m/z＝983。实测值：m/z ＝983。

(CBDg3)MS数据:LC/ESI-LRMS。[M+H]⁺(C₃₉H₆₁O₁₇)计算值：m/z＝801。实测值：m/z＝801。[M+Na]⁺(C₃₉H₆₀O₁₇Na)计算值：m/z＝823。实测值：m/z＝ 823。[M+K+H]²⁺(C₃₉H₆₁O₁₇K)计算值：m/z＝420。实测值：m/z＝420。

实施例6B：Δ9-THC糖苷的LCMS分析

以类似于实施例6A中进行的方式，通过LCMS分析鉴定Δ9-THC的糖基化反应产物(示于图18的HPLC线图中)。

VB301(THC糖苷配基)MS数据:LC/ESI-LRMS。[M+H]⁺(C₂₁H₃₁O₂)计算值：m/z＝315。实测值：m/z＝315.[M+3ACN+2H]²⁺(C₂₇H₄₁N₃O₂)计算值：m/z ＝314。实测值：m/z＝314。

VB304(THCg2)MS数据:LC/ESI-LRMS。[M+H]⁺(C₃₃H₅₁O₁₂)计算值：m/z ＝639。实测值：m/z＝639。

VB308(THCg3)MS数据:LC/ESI-LRMS。[M+H]⁺(C₃₉H₆₁O₁₇)计算值：m/z ＝801。实测值：m/z＝801。[M+Na]⁺(C₃₉H₆₀O₁₇Na)计算值：m/z＝823。实测值： m/z＝823。[M+K+H]⁺(C₃₉H₆₁O₁₇K)计算值：m/z＝420。实测值：m/z＝420。

实施例7：大麻素糖苷的NMR分析

图27描绘了分离的VB104的¹NMR光谱，图28描绘了分离的VB110的¹HMR光谱。这些产物中的每一种都是从CBD的糖基化反应产生的反应混合物中分离出来的。使用TopSpin采集和处理软件在Bruker Avance II 400MHz仪器上获得在CD3OD中制备的每种化合物的10mg/ml溶液的¹H NMR光谱。

实施例8：溶解度分析

在Phenomenex Kinetex 2.6u 100A C18柱上，在配备有二极管阵列检测器的Dionex HPLC上，在增加乙腈的线性斜率上凭经验确定C18保留时间。表A中的CLogP值由ChemDraw(CambridgeSoft)预测。通过HPLC和建立的logP值分析参比大麻素(http://pubchem.ncbi.nlm.nih.gov/)并用于创建校准线，如图29 所示。预测的cLogP值与参比校准线相关联。如图29所示，将C18反相HPLC 保留时间与表A中呈现的cLogP值作图。数据点编号与表编号相关联。开放的钻石形表示新型大麻素糖苷，实心钻石形表示参比大麻素和衍生物。通过 ChemDraw(CambridgeSoft)预测ClogP值。对所有数据点进行线性回归 (R2＝0.9455)。

表A：选择的大麻素糖苷和参比大麻素的CLogP值

#	化合物	保留时间	ClogP
				1	VB110	8.967	3.4
2	11-COOH-四氢大麻酚葡糖苷酸	9.347	3.7
				3	VB104	10.720	4.3
4	VB304	11.250	4.7
				5	VB302	11.688	5.7
6	11-COOH-四氢大麻酚	12.910	5.7
				7	次大麻二酚	13.017	5.6
8	11-OH-四氢大麻酚	13.037	5.9
				9	大麻二酚	13.647	6.6
10	大麻酚	14.178	7.3
				11	四氢大麻酚	14.487	7.2

实施例9：生物利用度分析

为了研究糖基化作用影响位点特异性药物递送的效果，通过口服灌胃向三只小鼠施用VB110，并且在30、60和90分钟时处死动物。在施用10％乙醇US、 10％丙二醇USP、0.05％脱氧胆酸钠USP、79.95％盐水USP中的120mg/kg VB110 之前，八周大的雄性瑞士小鼠禁食12小时。终止和组织收获后，然后提取肠内容物并通过C18反相HPLC分析。如图30中的 A所示，小肠内容物显示完整的VB110，但没有解耦联的CBD。如图30中的 B所示，在60分钟和90分钟时间点，大肠内容物含有VB110和CBD。VB1l0的这种解偶联与番泻苷(sennoside)β-葡糖苷的大肠解偶联是一致的，并且是大肠微生物群分泌的β-糖苷酶的结果。

实施例10：施用CBD和CBD糖苷后大肠内容物的分析

为了研究CBD-糖苷在大肠中的代谢和解偶联，通过口服灌胃向小鼠施用 CBD-糖苷混合物的水溶液。作为对照，向第二只小鼠施用CBD的克列莫佛 (cremophor)、乙醇和盐水溶液。在2小时时将动物各自处死。终止和组织收获后，然后提取肠内容物并通过C18反相HPLC分析。在该实施例中使用的小鼠是在施用溶液前禁食12小时的八周大的雄性瑞士小鼠。

通过使用Shimadzu LC-MS 2010 EV进行的LCMS分析所得提取物。使用 SiliaChrom XDB C18 5um，150A，4.6X50mm进行LC分离。该方法是12分钟， 5：95的H2O：ACN梯度洗脱。通过电喷雾电离(ESI)以负模式进行低分辨率 MS。在分析过程中使用乙酸和甲酸作为样品添加剂，并且注射体积为20μl。

对施用口服CBD-糖苷混合物的动物的大肠内容物的分析表明存在糖苷配基和糖苷以及各自的羟基代谢物：

[CBD–H]、[2CBD-H]和[CBD*2OH+甲酸–H]MS数据:LC/ESI-LRMS。[M –H]^-(C₂₁H₂₉O₂)计算值：m/z＝313。实测值：m/z＝313。[2M–H]^-(C₄₂H₅₉O₄) 计算值：m/z＝627。实测值：m/z＝627.[M_*2OH+甲酸–H]^-(C₂₂H₃₁O₆ ^-)计算值： m/z＝391。实测值：m/z＝391。

[CBDg1–H]、[CBDg1+Cl]和[2CBDg1–H]MS数据:LC/ESI-LRMS。[M_g1– H]^-(C₂₇H₃₉O₇)计算值：m/z＝475。实测值：m/z＝475.[M_g1+Cl]^-(C₂₇H₄₀O₇Cl) 计算值：m/z＝511。实测值：m/z＝511。[2M_g1–H]^-(C₅₄H₇₉O₁₄)计算值：m/z＝951。实测值：m/z＝951。

[CBDg2-H]和[CBDg2+乙酸–H]MS数据:LC/ESI-LRMS.[M_g2–H]^- (C₃₃H₄₉O₁₂)计算值：m/z＝637。实测值：m/z＝637.[M_g2+乙酸–H]^-(C₃₅H₅₃O₁₄ ^-) 计算值：m/z＝697。实测值：m/z＝697。

[CBDg3–H]、[CBDg3*OH–H]和[CBDg3*OH-2H]MS数据:LC/ESI-LRMS。 [M_g3–H]^-(C₃₉H₅₉O₁₇)计算值：m/z＝799。实测值：m/z＝799。[M_g3*OH–H]^- (C₃₉H₅₉O₁₈)计算值：m/z＝815。实测值：m/z＝815.[M_g3*OH–2H]^-2(C₃₉H₅₈O₁₈) 计算值：m/z＝407。实测值：m/z＝407。

分析口服CBD施用的动物的大肠内容物表明存在CBD的羟基代谢物：

[CBD*2OH+甲酸–H]和[2CBD*3OH+乙酸–H]MS数据:LC/ESI-LRMS. [M_*2OH+甲酸–H]^-(C₂₂H₃₁O₆ ^-)计算值：m/z＝391。实测值：m/z＝391。[2M_*3OH +乙酸–H]^-(C₄₄H₆₃O₁₂ ^-)计算值：m/z＝783.9。实测值：m/z＝784。

还提取来自相同动物的血浆和脑并通过HPLC分析CBD-糖苷和CBD的存在。CBD仅存在于接受CBD糖苷配基的对照动物中(数据未显示)。还提取了来自相同动物的小肠内容物并通过HPLC分析了CBD-糖苷和CBD的存在，但在小肠中不存在CBD糖苷配基(数据未显示，与实施例11中所示的THC解耦数据一致)。大肠内容物中CBD糖苷配基的存在表明成功递送了CBD-糖苷，并且随后通过仅存在于大肠中的β-糖苷酶来水解糖苷。大肠中存在解偶联的CBD，但小肠中不存在，表明仅在转运至大肠时才发生糖苷解偶联。CBD解毒代谢物 CBD-2OH的存在也与CBD的递送和吸收进入CBD开始代谢的肠上皮相一致。该实施例说明了施用CBD-糖苷的潜力，安全地将CBD-糖苷无吸收地转移通过小肠，转移到大肠，糖可以在大肠中解耦联以在局部释放CBD，避免了全身吸收并将CBD递送到其他组织，在其他组织中它可能会有不良影响。

实施例11：施用THC-糖苷时大肠内容物的分析

为了研究THC-糖苷在大肠中的代谢和解偶联，通过口服灌胃向两只小鼠使用呢THC-糖苷混合物的水溶液。第一只动物在2小时处死，第二只动物在4小时处死。终止和组织收获后，然后提取肠内容物并通过C18反相HPLC分析。在该实施例中使用的小鼠是在施用溶液前禁食12小时的八周大的雄性瑞士小鼠。

在与实施例10中使用的相同条件下，通过LCMS分析所得提取物。

在2小时后分析来自施用THC糖苷的小鼠的大肠内容物，结果表明THC 糖苷配基和THC糖苷都与各自的羟基代谢物一起存在：

[THC–H]、[THC*OH–H],[2THC*3OH+乙酸-H]和[THC*2OH+甲酸– H]MS数据:LC/ESI-LRMS.[M–H]^-(C₂₁H₂₉O₂)计算值：m/z＝313。实测值： m/z＝313。[M_*OH–H]^-(C₂₁H₂₉O₃)计算值：m/z＝329。实测值：m/z＝329。[2M_*3OH +乙酸–H]^-(C₄₄H₆₃O₁₂ ^-)计算值：m/z＝783.9。实测值：m/z＝783。[M_*2OH+甲酸–H]^-(C₂₂H₃₁O₆ ^-)计算值：m/z＝391。实测值：m/z＝391。

[THCg1+Cl]、[THCg1+乙酸–H],[2THCg1–H]和[2THCg1+乙酸-H] MS数据:LC/ESI-LRMS。[M_g1+Cl]^-(C₂₇H₄₀O₇Cl^-)计算值：m/z＝511。实测值： m/z＝511。[M_g1+乙酸-H]^-(C₂₉H₄₃O₉ ^-)计算值：m/z＝535。实测值：m/z＝535. [2M_g1–H]^-(C₅₄H₇₉O₁₄)计算值：m/z＝951。实测值：m/z＝951.[2M_g1+乙酸–H]^- (C₅₆H₈₃O₁₆ ^-)计算值：m/z＝1011。实测值：m/z＝1011。

[THCg2–H]、[THCg2+乙酸–H]和[THCg2*OH+甲酸-H]MS数据: LC/ESI-LRMS。[M_g2–H]^-(C₃₃H₄₉O₁₂)计算值：m/z＝637。实测值：m/z＝637。 [M_g2+乙酸–H]^-(C₃₅H₅₃O₁₄ ^-)计算值：m/z＝697。实测值：m/z＝697。[M_g2*OH+ 乙酸–H]^-(C₃₄H₅₁O₁₅ ^-)计算值：m/z＝699。实测值：m/z＝699。

[THCg3–H]、[THCg3+乙酸–H],[CBDg3*OH–H]和[CBDg3*OH–2H] MS数据:LC/ESI-LRMS。[M_g3–H]^-(C₃₉H₅₉O₁₇)计算值：m/z＝799。实测值：m/z ＝799。[M_g3+乙酸–H]^-(C₄₁H₆₃O₁₉ ^-)计算值：m/z＝859。实测值：m/z＝859. [M_g3*OH–H]^-(C₃₉H₅₉O₁₈ ^-)计算值：m/z＝815。实测值：m/z＝815.[M_g3*OH– 2H]^-2(C₃₉H₅₈O₁₈ ^2-)计算值：m/z＝407。实测值：m/z＝407。

4小时后对THC糖苷混合物提取物的分析表明THC糖苷配基和THC糖苷都与各自的羟基代谢物一起被证实：

[THC–H]、[THC*OH+乙酸–H]、[2THC*3OH+乙酸-H]和[THC*2OH+ 甲酸–H]MS数据:LC/ESI-LRMS。[M–H]^-(C₂₁H₂₉O₂)计算值：m/z＝313。实测值：m/z＝313。[M_*OH+乙酸–H]^-(C₂₃H₃₃O₅ ^-)计算值：m/z＝389。实测值： m/z＝389。[2M_*3OH+乙酸–H]^-(C₄₄H₆₃O₁₂ ^-)计算值：m/z＝783.9。实测值：m/z ＝784。[M_*2OH+甲酸–H]^-(C₂₂H₃₁O₆ ^-)计算值：m/z＝391。实测值：m/z＝391。 [THCg1+Cl]、[THCg1+乙酸–H]、[2THCg1–H]和[2THCg1+乙酸-H] MS数据:LC/ESI-LRMS.[M_g1+Cl]^-(C₂₇H₄₀O₇Cl^-)计算值：m/z＝511。实测值： m/z＝511。[M_g1+乙酸-H]^-(C₂₉H₄₃O₉ ^-)计算值：m/z＝535。实测值：m/z＝535。 [2M_g1–H]^-(C₅₄H₇₉O₁₄)计算值：m/z＝951。实测值：m/z＝951.[2M_g1+乙酸–H]^- (C₅₆H₈₃O₁₆ ^-)计算值：m/z＝1011。实测值：m/z＝1011。

[THCg2-H]和[THCg2+乙酸–H]MS数据:LC/ESI-LRMS。[M_g2–H]^- (C₃₃H₄₉O₁₂)计算值：m/z＝637。实测值：m/z＝637.。[M_g2+乙酸–H]^-(C₃₅H₅₃O₁₄ ^-) 计算值：m/z＝697。实测值：m/z＝697。

[THCg3–H]、[THCg3+乙酸–H]、[CBDg3*OH–H]、[CBDg3*OH–2H] 和[CBDg3*OH+乙酸–2H]MS数据:LC/ESI-LRMS。[M_g3–H]^-(C₃₉H₅₉O₁₇)计算值：m/z＝799。实测值：m/z＝799。[M_g3+乙酸–H]^-(C₄₁H₆₃O₁₉ ^-)计算值： m/z＝859。实测值：m/z＝859.[M_g3*OH–H]^-(C₃₉H₅₉O₁₈ ^-)计算值：m/z＝815。实测值：m/z＝815。[M_g3*OH–2H]^-2(C₃₉H₅₈O₁₈ ^2-)计算值：m/z＝407。实测值： m/z＝407.[M_g3*OH+乙酸–2H]^-2(C₄₁H₆₂O₂₀ ^2-)计算值：m/z＝467。实测值： m/z＝467。

还提取来自相同动物的血浆和脑并通过HPLC分析THC-糖苷和THC的存在，但在这些组织中未见到化合物(数据未显示)。还提取了来自相同动物的小肠内容物并通过HPLC分析THC-糖苷和THC的存在，但未观察到THC糖苷配基(数据未显示，与实施例10中所示的CBD脱偶联数据一致)。在2小时和4 小时时THC糖苷配基在大肠内容物中的存在表明THC糖苷的成功递送以及其随后在大肠中通过β-糖苷酶将糖苷水解。在大肠中存在解偶联的THC，但小肠中不存在，表明糖苷解耦联仅在转运至大肠时发生。THC解毒代谢物在大肠中的存在进一步证明了THC糖苷配基存在并被开始代谢的肠上皮吸收。该实施例说明了口服施用THC-糖苷的潜力，将THC-糖苷无吸收地转移通过小肠，转运到大肠，糖可以在大肠中解耦联以在局部释放THC，避免了全身性吸收，并将 THC递送至其他组织，在其他组织中它可能有不必要的精神作用。

实施例12：从甜叶菊中发现新的蔗糖合成酶同种型

许多研究小组已经利用简单的UDP至UDPG回收系统来减少产品形成所需的UDPG的量(Hardin 2004，Bungarang 2013)。这些研究已经表征了在叶组织中发现的初级蔗糖合成酶的同种型，其可能通过使果糖与UDPG反应，产生蔗糖和消耗的UDP来进行蔗糖的合成。

由于已知植物含有许多蔗糖合成酶的同种型，因此从甜叶菊植物中鉴定具有增强的对UDP+蔗糖→UDPG+果糖的反向反应的活性的替代SUS酶。由于甜叶菊糖苷在甜叶菊叶中以高水平出现，因此假定来自甜叶菊叶的蔗糖合成酶将具有提高的能够催化将UDP再循环至UDPG的反向反应的能力。在甜叶菊转录组内鉴定了六种蔗糖合成酶同种型，均与拟南芥中发现并与其同源物一起命名的6种同种型具有类似的同源性。如材料和方法中所述用这里列出的相应序列 ID信息克隆这些转录物。

测试了酶活性并分析了它们在UDPG输入减少的情况下增加UGT反应的能力。最佳同种型SrSUS4能够将UDP再循环至含有蔗糖的UDPG，与甜菊醇19-O- 葡糖基转移酶SrUGT74G1介导的甜菊醇生物糖苷向甜菊糖苷的糖基化一致。

进行靶向诱变以突变N末端的丝氨酸残基，其通常在植物中被磷酸化以防止二聚化(Hardin 2004)。SrSUS1-S13D突变体通过将13位的丝氨酸突变为天冬氨酸残基(S13D)而形成，从而形成磷酸模拟蛋白。此外，创建了 SrSus1-S13R,L14I，以用精氨酸(一种大的带电残基)取代丝氨酸，还防止酶的二聚化和失活。与其天然对应物相比，蔗糖合成酶突变体显示出改善的UDPG 生产活性。在甜菊转录组和设计的引物(SEQ ID NO.67和68)中鉴定了SrSUS5 (SEQ ID NO.19和20)，但不能从cDNA扩增。SrSus4显示出一个令人印象深刻的UDPG回收活动，比SrSus1中看到的活性提高了20％。提出SrSus4是在蔗糖存在下进行将UDP转化为UDPG的反向反应的理想同种型。为了大规模纯化大麻素糖苷，使用C18快速色谱柱。洗涤带有33g树脂的Biotage快速C18 柱，上样，洗涤并使用蠕动泵洗脱，以达到与先前列出的与重力进料Hypersep 柱相似的分离和纯化。

用SUS同种型产生UDPG的相对活性如下：

SrSus4>SrSus1-未带标签>SrSus6>SrSus2>SrSus1>6xHis-SrSus1>SrSus3

实施例13：大麻素-糖苷的改善的体外催化性

由于通过UGT酶形成大麻素糖苷需要化学计量的核苷酸糖供体UDPG，因此在糖基化反应后再循环或重新夺回用过的UDP是有利的。利用来自甜叶菊的 SUS4亚型，仅使用UMP作为输入核苷酸成功生产了大麻素糖苷。

发生两步反应，首先从UMP产生UDP，然后与UGT反应一起从UDP产生UDPG。首先，制备含有50mM KPO4pH7.2、200mM UMP二钠盐、200mM ATP 二钠盐、1M MgCl2、10％UMPK重组酶在50％甘油中的5L反应物。将反应物在28℃下搅拌孵育>24小时。将5L反应物1用0.45微米过滤以去除沉淀物，然后施加到含有50mM KPO4pH7.2、50mM MgCl2、300mM蔗糖、在200mlDMSO中的200mg CBD、在50％甘油中的5L UGT76G1、在50％甘油中的2.5L SrSUS4的50L反应物中。然后将主要的50L反应物混合并使其反应。反应完成后，再加入在200ml DMSO中的200mg CBD，并在相同条件下继续孵育。在剩余的CBD被反应消耗之后，通过使用5kDa的超滤膜的切向流过滤来过滤混合物以除去酶和颗粒物，然后使用500Da的纳滤膜进行浓缩。然后将含有大麻糖苷的纳滤渗余物施加到水合的C18闪蒸柱，用10-30％甲醇洗涤，并用40-65％甲醇洗脱。然后通过旋转蒸发浓缩洗脱液以除去所有溶剂，在真空烧杯中壳冷冻并冻干至干燥。然后收集所产生的粉末状大麻糖苷并在-20℃密封小瓶中储存。蔗糖应无菌过滤，以避免焦糖化或糖分解，因为高压灭菌蔗糖储备溶液大大降低了反应活性。

显而易见的是，本发明的前述实施方案是示例并且可以以多种方式变化。这样的现在或将来的变化不被认为是脱离本发明的精神和范围，并且对于本领域技术人员而言显而易见的所有这样的修改意图被包括在以下权利要求的范围内。

参考文献

Bartzokis G.(2004).Age-related myelin breakdown:a developmental modelof cognitive decline and Alzheimer′s disease.Neurobiology of Aging.25:5-18.

Bisogno T,et al.(2001)Molecular targets for cannabidiol and itssynthetic analogues: effect on vanilloid VR1receptors and on the cellularuptake and enzymatic hydrolysis of anandamide.British Journal ofPharmacology.134,845-852.

Chen Q,et al.(2009).Synthesis,in vitro and in vivo characterizationof glycosyl derivatives of ibuprofen as novel prodrugs for brain drugdelivery.J Drug Targeting. 17(4):318-328.

Conchie J.,Findlay J.,Levvy GA.(1958).Mammalian Glycosidases,Distribution in the body.Biochem J.71(2):318-325.

De Petrocellis L,et al.(2011)Effects of cannabinoids and cannabinoid-enriched Cannabis extracts on TRP channels and endocannabinoid metabolicenzymes.British Journal of Pharmacology.163,1479-1494.

Dewitte G,et al.(2016)Screening of Recombinant GlycosyltransferasesReveals the Broad acceptor Specificity of Stevia UGT-76G1.Journal ofBiotechnology.Accepted Manuscript,DOI:http://dx.doi.org/doi:10.1016/j.jbiotec.2016.06.034.

Friend DR.,Chang GW.(1984).A Colon-Specific Drug-Delivery SystemBased on Drug Glycosides and the Glycosidases of the Colonic Bacteria.J MedChem. 27:261-266.

Friend DR.,Chang GW.(1985).Drug Glycosides:Potential Prodrugs forColon-Specific Drug Delivery.J Med Chem.28:51-57.

Gomez O.,Arevalo-Martin A.,Garcia-Ovejero D.,Ortega-Gutierrez S.,Cisneros JA., Almazan G,Sanchez-Rodriguez MA.,Molina-Holgado F.,Molina-Holgado E.(2010). The Constitutive Production of the Endocannabinoid 2-Arachidonoylglycerol Participates in Oligodendrocyte Differentiation.Glia.58:1913-1927.

Iuvone T.,Esposito G.,De Filippis D.,Scuderi C.,Steardo L.(2009).Cannabidiol:a promising drug for neurodegenerative disorders？CNS NeurosciTher.15(1):65-75.

Jarh,P.,Pate DW.,Brenneisen R.,Jarvinen T.(1998). Hydroxypropyl-beta-cyclodextrin and its combination with hydroxypropyl-methylcellulose increasesaqueous solubility of delta9-tetrahydrocannabinol.Life Sci.63(26):PL381-384.

Jiang R,et al.(2011)Identification of cytochrome P450 enzymesresponsible for metabolism of cannabidiol by human liver microsomes.LifeSciences.89,165-170. Kren V(2008)Glycoside vs.Aglycon:The Role of GlycosidicResidue in Biologic Activity.Glycoscience.pp2589-2644.

Kren V,Rezanka T(2008)Sweet antibiotics–the role of glycosidicresidues in antibiotic and antitumor activity and their randomization.FEMSMicrobiol Rev.32, 858-889.

Li S.,Li W.,Xiao Q.,Xia Y.(2012).Transglycosylation of stevioside toimprove the edulcorant quality by lower substitution using cornstarchhydrolyzate and CGTase.J Food Chem.138(2013):2064-2069.

Mazur A.,et al.(2009).Characterization of Human Hepatic andExtrahepatic UDP-Glucuronosyltransferase Enzymes Involved in the Metabolismof Classic Cannabinoids.Drug Metabolism and Disposition.37(7):1496-1504.

Mecha M.,Torrao AS.,Mestre L.,Carrillo-Salinas FJ.,Mechoulam R.,GuazaC. (2012).Cannabidiol protects oligodendrocyte progenitor cells frominflammation-induced apoptosis by attenuating endoplasmic reticulumstress.Cell Death and Disease.3(e331).

Mechoulam R.,Parker LA.,Gallily R.(2002).Cannabidiol:An Overview ofSome Pharmacological Aspects.42(S1):11S-19S.

Mighdoll MI.,Tao R.,Kleinman JE.,Hyde TM.(2015).Myelin,myelin-relateddisorders,and psychosis.Schizophr Res.161(1):85-93.

Molina-Holgado E.,Vela JM.,Arevalo-Martin A.,Almazan G.,Molina-Holgado F., Borrell J.,Guaza C.(2002).Cannabinoids Promote OligodendrocyteProgenitor Survival:Involvement of Cannavinoid Receptors andPhosphatidylinositol-3-Kinase/Akt Signaling.J.Neurosci.22(22):9742-9753.

Noguchi A,et al.(2009).Identification of an inducibleglucosyltransferase from Phytolacca americana L.cells that are capable ofglucosylating capsiacin.Plant Biotechnology.26,285-292.

Pacher P,et al.(2006)The endocannabinoid system as an emerging targetof pharmacotherapy.Pharmacology Review.58(3),389-462.

Richman A.,Swanso,A.,Humphrey T.,Chapman R.,McGarvey B.,Pocs R.,Brandle J.(2005).Functional genomics uncovers three glucosyltransferasesinvolved in the synthesis of the major sweet glucosides of Steviarebaudiana.Plant J.41(1):56-67.

Russo E.,Guy,GW.(2006)A tale of two cannabinoids:the therapeuticrationale for combining tetrahydrocannabinol and cannabidiol.MedicalHypotheses.66(2):234-46.

Tanaka H.,et al.(1993).Cannabis,21.1 Biotransformation of cannabinolto its glycosides by in vitro plant tissue.Journal of Natural Products.56(12):2068-2072.

Tanaka H.,et al.(1996).Cannabis 25,biotransformation of cannabidioland cannabidiolic acid by Pinellia ternata tissue segments.Plant CellReports. 15:819-823.

Terao J.,Murota K.,Kawai Y.(2011).Conjugated quercetin glucuronidesas bioactive metabolites and precursors of aglycone in vivo.Food Function.2:11-17.

Thomas A.,et al.(2007)Cannabidiol displays unexpectedly high potencyas an antagonist of CB1 and CB2 receptor agonists in vitro.British Journal ofPharmacology.150,613-623.

US Patent 8,410,064 B2.2013.Classical cannabinoid metabolites andmethods of use thereof.

US Patent 8,227,627 B2.2012.Prodrugs of tetrahydrocannabinol,compositions comprising prodrugs of tetrahyrocannabinol and methods of usingthe same.

Watanabe K,et al.(1998)Distribution and characterization ofanandamide amidohydrolase in mouse brain and liver.Life Sciences.62(14),1223-1229.

WO2009018389 A4.2009.Prodrugs of cannabidiol,compositions comprisingprodrugs of cannabidiol and methods of using the same.

WO2012011112 A1.2011.Non psychoactive cannabinoids and uses thereof.

WO 2014108899 A1.2014.Fluorinated CBD compounds,compositions and usesthereof.

Yamaori S,et al.(2011)Potent inhibition of human cytochrome P450 3Aisoforms by cannabidiol:Role of phenolic hydroxyl groups in the resorcinolmoiety.Life Sciences, 88,730-736.

Zuardi AW,et al.(2012).A Critical Review of the Antipyschotic Effectsof Cannabidiol:30 Years of a Translational Investigation.CurrentPharmaceutical Design,18,5131-5140。

序列表

<110> 活力生物制药有限公司

Vitality Biopharma, Inc.

<120> TBD

<130> 3334-103DR

<160> 34

<170> PatentIn版本3.5

<210> 1

<211> 458

<212> PRT

<213> 甜叶菊

<400> 1

Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile

1 5 10 15

Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu

20 25 30

Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr

35 40 45

Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg

50 55 60

Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro

65 70 75 80

Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His

85 90 95

Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser

100 105 110

Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr

115 120 125

Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu

130 135 140

Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln

145 150 155 160

Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu

165 170 175

Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser

180 185 190

Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile

195 200 205

Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu

210 215 220

Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro

225 230 235 240

Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser

245 250 255

Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro

260 265 270

Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp

275 280 285

Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln

290 295 300

Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp

305 310 315 320

Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val

325 330 335

Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala

340 345 350

Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu

355 360 365

Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn

370 375 380

Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn

385 390 395 400

Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val

405 410 415

Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln

420 425 430

Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu

435 440 445

Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu

450 455

<210> 2

<211> 1377

<212> DNA

<213> 甜叶菊

<400> 2

atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60

ccatttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctctaaagga 120

ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180

ttcactttca gattcatcct cgacaacgac ccacaagacg aacgcatttc caatctaccg 240

actcatggtc cgctcgctgg tatgcggatt ccgattatca acgaacacgg agctgacgaa 300

ttacgacgcg aactggaact gttgatgtta gcttctgaag aagatgaaga ggtatcgtgt 360

ttaatcacgg atgctctttg gtacttcgcg caatctgttg ctgacagtct taacctccga 420

cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480

tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540

gggtttccta tgctaaaagt gaaagacatc aagtctgcgt attcgaactg gcaaatactc 600

aaagagatat tagggaagat gataaaacaa acaagagcat cttcaggagt catctggaac 660

tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720

agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780

gatcgaaccg tttttcaatg gttagaccaa caaccgccaa gttcggtact gtatgttagt 840

tttggtagta ctagtgaagt ggatgagaaa gatttcttgg aaatagctcg tgggttggtt 900

gatagcaagc agtcgttttt atgggtggtt cgacctgggt ttgtcaaggg ttcgacgtgg 960

gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttcca 1020

cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080

tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggattt tgggctcgat 1140

caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200

gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260

gaatacatta gacagaatgc aagagttttg aaacaaaagg cagatgtttc tttgatgaag 1320

ggtggttcgt cttacgaatc attagagtct ctagtttctt acatttcatc gttgtaa 1377

<210> 3

<211> 467

<212> PRT

<213> 人工序列

<220>

<223> 在N末端具有6x组氨酸标签的UGT76G1

<400> 3

Met His His His His His His Gly Ser Gly Glu Asn Lys Thr Glu Thr

1 5 10 15

Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln

20 25 30

Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys

35 40 45

Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr

50 55 60

Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro

65 70 75 80

Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly

85 90 95

Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg

100 105 110

Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser

115 120 125

Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp

130 135 140

Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn

145 150 155 160

Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu

165 170 175

Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro

180 185 190

Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln Ile

195 200 205

Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser Ser

210 215 220

Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu Glu

225 230 235 240

Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu Pro

245 250 255

Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg Thr

260 265 270

Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr Val

275 280 285

Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu Ile

290 295 300

Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe Leu Trp Val Val Arg

305 310 315 320

Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu Pro Leu Pro Asp Gly

325 330 335

Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp Val Pro Gln Gln Glu

340 345 350

Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp Thr His Ser Gly Trp

355 360 365

Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val Pro Met Ile Phe Ser

370 375 380

Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp Val

385 390 395 400

Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu Ile

405 410 415

Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu Glu Gly Glu Tyr Ile

420 425 430

Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala Asp Val Ser Leu Met

435 440 445

Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr Ile

450 455 460

Ser Ser Leu

465

<210> 4

<211> 1404

<212> DNA

<213> 人工序列

<220>

<223> 为在毕赤酵母中表达而优化的编码SEQ ID NO:3密码子的序列

<400> 4

atgcaccacc atcaccacca tggttctggt gaaaacaaaa ctgaaactac tgttagaaga 60

agaagaagaa tcattttgtt tccagtacca tttcaaggcc atatcaatcc aattcttcaa 120

ttggccaatg ttttgtactc caaaggattc tccatcacca tttttcacac caatttcaac 180

aaaccaaaga cttccaacta tcctcacttc actttcagat ttattttgga taatgatcct 240

caagatgaaa gaatttccaa tcttccgact catggtcctt tggctggtat gagaattcca 300

atcatcaatg aacatggtgc tgatgaatta agaagagaat tggaactttt gatgttggct 360

tctgaagaag atgaagaagt ttcatgttta atcactgatg ctttatggta ttttgctcaa 420

tctgttgctg attctttgaa tttgcgacgg ttggttttga tgacttcttc tttgttcaac 480

tttcatgctc atgtttcttt acctcagttt gatgaacttg gatatttgga tccagatgac 540

aaaactagat tggaagaaca agctagtggg tttcctatgt tgaaagtcaa agatatcaaa 600

tctgcttact ccaactggca aattctcaaa gaaattttgg gaaaaatgat caaacaaaca 660

aaagcttctt ctggagtcat ttggaactca ttcaaagaat tggaagaatc tgaattggaa 720

actgttatta gagaaattcc tgctccaagt tttttgattc ctttgccaaa acatttgact 780

gcttcttctt cttctttatt ggatcacgat agaactgttt ttcaatggtt agatcaacaa 840

cctccatctt ctgttttgta tgttagtttt ggatctactt ctgaagttga tgaaaaagat 900

tttttggaaa ttgctagagg tttggttgat tccaaacaaa gttttttatg ggttgttaga 960

ccaggatttg tcaaaggatc tacttgggtc gaacctttgc cagatggatt tttgggagaa 1020

agaggaagaa ttgtcaaatg ggttccacag caagaagttt tggctcatgg tgctattggt 1080

gctttttgga ctcattctgg atggaactct actttggaat ctgtttgtga aggtgttcca 1140

atgatttttt ctgattttgg tttggatcaa ccattgaatg ctagatacat gtctgatgtt 1200

ttgaaagttg gtgtttattt ggaaaatggg tgggaaagag gtgaaattgc caatgctatt 1260

agaagagtca tggttgatga agaaggagaa tacattagac aaaatgctag agttttgaaa 1320

caaaaagctg atgtttcttt gatgaagggt ggatcttctt atgaatcttt ggaatctttg 1380

gtttcttaca tttcttctct ttaa 1404

<210> 5

<211> 468

<212> PRT

<213> 人工序列

<220>

<223> 在N末端具有6x组氨酸-谷氨酰胺标签的UGT76G1

<400> 5

Met His Gln His Gln His Gln Ser Gly Ser Met Glu Asn Lys Thr Glu

1 5 10 15

Thr Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe

20 25 30

Gln Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser

35 40 45

Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys

50 55 60

Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp

65 70 75 80

Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala

85 90 95

Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg

100 105 110

Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val

115 120 125

Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala

130 135 140

Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe

145 150 155 160

Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr

165 170 175

Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe

180 185 190

Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln

195 200 205

Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser

210 215 220

Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu

225 230 235 240

Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu

245 250 255

Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg

260 265 270

Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr

275 280 285

Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu

290 295 300

Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe Leu Trp Val Val

305 310 315 320

Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu Pro Leu Pro Asp

325 330 335

Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp Val Pro Gln Gln

340 345 350

Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp Thr His Ser Gly

355 360 365

Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val Pro Met Ile Phe

370 375 380

Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp

385 390 395 400

Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu

405 410 415

Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu Glu Gly Glu Tyr

420 425 430

Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala Asp Val Ser Leu

435 440 445

Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr

450 455 460

Ile Ser Ser Leu

465

<210> 6

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 为在毕赤酵母中表达而优化的编码SEQ ID NO:5密码子的序列

<400> 6

atgcatcaac atcaacacca atctggatct atggagaaca agaccgagac tacagttaga 60

agaagaagaa gaataatcct gtttccagta ccattccaag gacacatcaa cccaatcttg 120

cagttagcaa atgtacttta ttctaaaggc tttagtatta cgatttttca cactaatttt 180

aataagccaa aaacatccaa ttaccctcac ttcacattca gatttatctt ggataacgat 240

cctcaagatg aacgtatctc caacctgcca acacatggac cattggccgg tatgcgtatt 300

cctataatca acgagcatgg tgctgatgag cttagacgtg aactggaact gttgatgctg 360

gcatcggagg aagatgaaga ggttagttgc ttgataacgg atgccctctg gtatttcgca 420

caatcagtcg ctgactcctt gaaccttagg agattggtat tgatgactag ttcgttgttc 480

aacttccatg cccatgtttc tttgcctcaa tttgatgagc tgggttattt ggatcctgac 540

gataagactc gtttagaaga acaggcgtca ggcttcccca tgttaaaggt taaagatatt 600

aagtccgcct attctaactg gcaaattctc aaagagattc tagggaaaat gattaaacaa 660

accaaggcct cttcaggagt aatctggaac agtttcaaag aactagaaga atccgagttg 720

gaaactgtta ttcgtgaaat ccctgctcca tctttcctta tcccattacc aaagcacctc 780

actgcctcct ctagttctct tctggaccat gatagaacag tctttcagtg gctcgatcag 840

caacctccat cttctgtctt gtacgttagt tttggttcca cctcggaagt agatgaaaaa 900

gactttctgg aaattgctcg aggactagtt gactccaagc aatcctttct gtgggttgtt 960

agacctggat tcgtaaaagg atccacctgg gtagaacccc tcccagatgg atttttgggc 1020

gaaaggggaa gaattgttaa atgggtgcct caacaagaag ttttagctca tggggccatt 1080

ggagcttttt ggactcatag tggatggaat tctaccttag aatctgtttg tgaaggagtt 1140

ccaatgattt tttctgattt tggattggat cagcctctta atgccagata tatgtccgat 1200

gtcctcaagg tcggagtgta cctggaaaat ggttgggaga gaggtgagat tgcaaatgct 1260

atacgtagag tcatggttga tgaagagggc gagtatatta gacaaaacgc tagagtgcta 1320

aagcagaagg ccgatgtttc ccttatgaag gggggaagtt catatgagag tttggaatcc 1380

ctagtgtcct acatttcttc gctataa 1407

<210> 7

<211> 466

<212> PRT

<213> 人工序列

<220>

<223> 在C末端具有6x组氨酸标签的UGT76G1

<400> 7

Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile

1 5 10 15

Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu

20 25 30

Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr

35 40 45

Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg

50 55 60

Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro

65 70 75 80

Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His

85 90 95

Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser

100 105 110

Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr

115 120 125

Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu

130 135 140

Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln

145 150 155 160

Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu

165 170 175

Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser

180 185 190

Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile

195 200 205

Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu

210 215 220

Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro

225 230 235 240

Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser

245 250 255

Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro

260 265 270

Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp

275 280 285

Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln

290 295 300

Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp

305 310 315 320

Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val

325 330 335

Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala

340 345 350

Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu

355 360 365

Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn

370 375 380

Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn

385 390 395 400

Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val

405 410 415

Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln

420 425 430

Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu

435 440 445

Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser His His His His

450 455 460

His His

465

<210> 8

<211> 1401

<212> DNA

<213> 人工序列

<220>

<223> 为在大肠杆菌（Escherichia coli）中表达而优化的编码SEQ ID NO:7密码子的序列

<400> 8

atggaaaata aaaccgaaac caccgtccgt cgccgtcgtc gtatcattct gttcccggtc 60

ccgttccaag gtcacatcaa cccgattctg cagctggcca acgtgctgta tagcaaaggt 120

ttctctatca ccatcttcca tacgaacttc aacaaaccga aaacctctaa ctacccgcac 180

tttacgttcc gttttattct ggataacgac ccgcaggatg aacgcatcag taatctgccg 240

acccatggtc cgctggcggg tatgcgtatt ccgattatca acgaacacgg cgcagatgaa 300

ctgcgtcgcg aactggaact gctgatgctg gcctctgaag aagatgaaga agttagttgc 360

ctgatcaccg acgcactgtg gtattttgcc cagagtgttg cagattccct gaacctgcgt 420

cgcctggtcc tgatgacgag ctctctgttc aattttcatg cccacgtttc cctgccgcag 480

ttcgatgaac tgggttatct ggacccggat gacaaaaccc gcctggaaga acaagcttca 540

ggctttccga tgctgaaagt caaagatatt aaaagtgcgt actccaactg gcagattctg 600

aaagaaatcc tgggtaaaat gatcaaacaa acccgtgcaa gttccggcgt catctggaat 660

tccttcaaag aactggaaga atcagaactg gaaacggtga ttcgcgaaat cccggctccg 720

tcttttctga ttccgctgcc gaaacatctg accgcgtcat cgagctctct gctggatcac 780

gaccgtacgg tgtttcagtg gctggatcag caaccgccga gttccgtgct gtacgttagc 840

ttcggtagca cctctgaagt ggatgaaaaa gactttctgg aaatcgctcg tggcctggtt 900

gattcaaaac aatcgttcct gtgggtggtt cgcccgggtt ttgtgaaagg cagcacgtgg 960

gttgaaccgc tgccggatgg cttcctgggt gaacgtggtc gcattgtcaa atgggtgccg 1020

cagcaagaag tgctggcaca tggtgctatc ggcgcgtttt ggacccactc aggttggaac 1080

tcgacgctgg aaagcgtttg tgaaggtgtc ccgatgattt tctcggattt tggcctggac 1140

cagccgctga atgcacgtta tatgagcgat gttctgaaag tcggtgtgta cctggaaaac 1200

ggttgggaac gcggcgaaat tgcgaatgcc atccgtcgcg ttatggtcga tgaagaaggc 1260

gaatatatcc gtcagaatgc tcgcgtcctg aaacaaaaag cggacgttag tctgatgaaa 1320

ggcggttcat cgtacgaatc cctggaatca ctggtctcct acatttcttc tctgggctcg 1380

catcatcatc atcatcatta a 1401

<210> 9

<211> 472

<212> PRT

<213> 稻（Oryza sativa）

<400> 9

Met His Gln His Gln His Gln Ser Gly Ser Met Asp Ser Gly Tyr Ser

1 5 10 15

Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val Ile Cys Pro Trp

20 25 30

Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu Ala Gln Arg Leu

35 40 45

Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile

50 55 60

Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro Leu Val Ala Phe

65 70 75 80

Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro Asp Gly Ala Glu

85 90 95

Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met Val Glu Leu His

100 105 110

Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe Leu Gly

115 120 125

Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val Phe His His Trp Ala

130 135 140

Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala Met Met Leu Leu

145 150 155 160

Gly Ser Ala His Met Ile Ala Ser Ile Ala Asp Arg Arg Leu Glu Arg

165 170 175

Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly Arg Pro Ala Ala

180 185 190

Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile Arg Thr Lys Gly

195 200 205

Ser Ser Gly Met Ser Leu Ala Glu Arg Phe Ser Leu Thr Leu Ser Arg

210 215 220

Ser Ser Leu Val Val Gly Arg Ser Cys Val Glu Phe Glu Pro Glu Thr

225 230 235 240

Val Pro Leu Leu Ser Thr Leu Arg Gly Lys Pro Ile Thr Phe Leu Gly

245 250 255

Leu Met Pro Pro Leu His Glu Gly Arg Arg Glu Asp Gly Glu Asp Ala

260 265 270

Thr Val Arg Trp Leu Asp Ala Gln Pro Ala Lys Ser Val Val Tyr Val

275 280 285

Ala Leu Gly Ser Glu Val Pro Leu Gly Val Glu Lys Val His Glu Leu

290 295 300

Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe Leu Trp Ala Leu Arg

305 310 315 320

Lys Pro Thr Gly Val Ser Asp Ala Asp Leu Leu Pro Ala Gly Phe Glu

325 330 335

Glu Arg Thr Arg Gly Arg Gly Val Val Ala Thr Arg Trp Val Pro Gln

340 345 350

Met Ser Ile Leu Ala His Ala Ala Val Gly Ala Phe Leu Thr His Cys

355 360 365

Gly Trp Asn Ser Thr Ile Glu Gly Leu Met Phe Gly His Pro Leu Ile

370 375 380

Met Leu Pro Ile Phe Gly Asp Gln Gly Pro Asn Ala Arg Leu Ile Glu

385 390 395 400

Ala Lys Asn Ala Gly Leu Gln Val Ala Arg Asn Asp Gly Asp Gly Ser

405 410 415

Phe Asp Arg Glu Gly Val Ala Ala Ala Ile Arg Ala Val Ala Val Glu

420 425 430

Glu Glu Ser Ser Lys Val Phe Gln Ala Lys Ala Lys Lys Leu Gln Glu

435 440 445

Ile Val Ala Asp Met Ala Cys His Glu Arg Tyr Ile Asp Gly Phe Ile

450 455 460

Gln Gln Leu Arg Ser Tyr Lys Asp

465 470

<210> 10

<211> 1419

<212> DNA

<213> 稻

<400> 10

atgcatcagc accaacatca gagcggttct atggactccg gctactcctc ctcctacgcc 60

gccgccgccg ggatgcacgt cgtgatctgc ccgtggctcg ccttcggcca cctgctcccg 120

tgcctcgacc tcgcccagcg cctcgcgtcg cggggccacc gcgtgtcgtt cgtctccacg 180

ccgcggaaca tatcccgcct cccgccggtg cgccccgcgc tcgcgccgct cgtcgccttc 240

gtggcgctgc cgctcccgcg cgtcgagggg ctccccgacg gcgccgagtc caccaacgac 300

gtcccccacg acaggccgga catggtcgag ctccaccgga gggccttcga cgggctcgcc 360

gcgcccttct cggagttctt gggcaccgcg tgcgccgact gggtcatcgt cgacgtcttc 420

caccactggg ccgcagccgc cgctctcgag cacaaggtgc catgtgcaat gatgttgttg 480

ggctctgcac atatgatcgc ttccatagca gacagacggc tcgagcgcgc ggagacagag 540

tcgcctgcgg ctgccgggca gggacgccca gcggcggcgc caacgttcga ggtggcgagg 600

atgaagttga tacgaaccaa aggctcatcg ggaatgtccc tcgccgagcg cttctccttg 660

acgctctcga ggagcagcct cgtcgtcggg cggagctgcg tggagttcga gccggagacc 720

gtcccgctcc tgtcgacgct ccgcggtaag cctattacct tccttggcct tatgccgccg 780

ttgcatgaag gccgccgcga ggacggcgag gatgccaccg tccgctggct cgacgcgcag 840

ccggccaagt ccgtcgtgta cgtcgcgcta ggcagcgagg tgccactggg agtggagaag 900

gtccacgagc tcgcgctcgg gctggagctc gccgggacgc gcttcctctg ggctcttagg 960

aagcccactg gcgtctccga cgccgacctc ctccccgccg gcttcgagga gcgcacgcgc 1020

ggccgcggcg tcgtggcgac gagatgggtt cctcagatga gcatactggc gcacgccgcc 1080

gtgggcgcgt tcctgaccca ctgcggctgg aactcgacca tcgaggggct catgttcggc 1140

cacccgctta tcatgctgcc gatcttcggc gaccagggac cgaacgcgcg gctaatcgag 1200

gcgaagaacg ccggattgca ggtggcaaga aacgacggcg atggatcgtt cgaccgagaa 1260

ggcgtcgcgg cggcgattcg tgcagtcgcg gtggaggaag aaagcagcaa agtgtttcaa 1320

gccaaagcca agaagctgca ggagatcgtc gcggacatgg cctgccatga gaggtacatc 1380

gacggattca ttcagcaatt gagatcttac aaggattga 1419

<210> 11

<400> 11

000

<210> 12

<400> 12

000

<210> 13

<211> 460

<212> PRT

<213> 甜叶菊

<400> 13

Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile

1 5 10 15

Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys

20 25 30

Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His

35 40 45

Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile

50 55 60

Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser

65 70 75 80

Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser

85 90 95

Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp

100 105 110

Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile

115 120 125

Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val

130 135 140

Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu

145 150 155 160

Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu

165 170 175

Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser

180 185 190

Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val

195 200 205

Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr

210 215 220

Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met

225 230 235 240

Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu

245 250 255

Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro

260 265 270

Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly

275 280 285

Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val

290 295 300

Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu

305 310 315 320

Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp

325 330 335

Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val

340 345 350

Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val

355 360 365

Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys

370 375 380

Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu

385 390 395 400

Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile

405 410 415

Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp

420 425 430

Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn

435 440 445

Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala

450 455 460

<210> 14

<211> 1383

<212> DNA

<213> 甜叶菊

<400> 14

atggcggaac aacaaaagat caagaaatca ccacacgttc tactcatccc attcccttta 60

caaggccata taaacccttt catccagttt ggcaaacgat taatctccaa aggtgtcaaa 120

acaacacttg ttaccaccat ccacacctta aactcaaccc taaaccacag taacaccacc 180

accacctcca tcgaaatcca agcaatttcc gatggttgtg atgaaggcgg ttttatgagt 240

gcaggagaat catatttgga aacattcaaa caagttgggt ctaaatcact agctgactta 300

atcaagaagc ttcaaagtga aggaaccaca attgatgcaa tcatttatga ttctatgact 360

gaatgggttt tagatgttgc aattgagttt ggaatcgatg gtggttcgtt tttcactcaa 420

gcttgtgttg taaacagctt atattatcat gttcataagg gtttgatttc tttgccattg 480

ggtgaaactg tttcggttcc tggatttcca gtgcttcaac ggtgggagac accgttaatt 540

ttgcagaatc atgagcaaat acagagccct tggtctcaga tgttgtttgg tcagtttgct 600

aatattgatc aagcacgttg ggtcttcaca aatagttttt acaagctcga ggaagaggta 660

atagagtgga cgagaaagat atggaacttg aaggtaatcg ggccaacact tccatccatg 720

taccttgaca aacgacttga tgatgataaa gataacggat ttaatctcta caaagcaaac 780

catcatgagt gcatgaactg gttagacgat aagccaaagg aatcagttgt ttacgtagca 840

tttggtagcc tggtgaaaca tggacccgaa caagtggaag aaatcacacg ggctttaata 900

gatagtgatg tcaacttctt gtgggttatc aaacataaag aagagggaaa gctcccagaa 960

aatctttcgg aagtaataaa aaccggaaag ggtttgattg tagcatggtg caaacaattg 1020

gatgtgttag cacacgaatc agtaggatgc tttgttacac attgtgggtt caactcaact 1080

cttgaagcaa taagtcttgg agtccccgtt gttgcaatgc ctcaattttc ggatcaaact 1140

acaaatgcca agcttctaga tgaaattttg ggtgttggag ttagagttaa ggctgatgag 1200

aatgggatag tgagaagagg aaatcttgcg tcatgtatta agatgattat ggaggaggaa 1260

agaggagtaa taatccgaaa gaatgcggta aaatggaagg atttggctaa agtagccgtt 1320

catgaaggtg gtagctcaga caatgatatt gtcgaatttg taagtgagct aattaaggct 1380

taa 1383

<210> 15

<211> 806

<212> PRT

<213> 甜叶菊

<400> 15

Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu

1 5 10 15

Asp Ser Thr Leu Ala Thr His Arg Asn Glu Ile Leu Leu Phe Leu Ser

20 25 30

Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Val Met

35 40 45

Thr Glu Phe Glu Ala Ile Cys Lys Glu Asp Gln Ser Lys Leu Ser Asp

50 55 60

Gly Ala Phe Tyr Glu Val Leu Lys Cys Thr Gln Glu Ala Ile Val Gln

65 70 75 80

Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu

85 90 95

Tyr Val Arg Val Asn Val Asn Val Leu Val Val Glu Glu Leu Ser Val

100 105 110

Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn

115 120 125

Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe

130 135 140

Pro Arg Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu

145 150 155 160

Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Asp Ser Met His

165 170 175

Pro Leu Leu Asp Phe Leu Arg Thr His His Tyr Lys Gly Lys Thr Met

180 185 190

Met Leu Asn Asp Arg Ile Gln Asn Leu Asn Ala Leu Gln Ser Val Leu

195 200 205

Arg Lys Ala Ser Glu Tyr Leu Ser Thr Leu Asp Ala Ala Thr Pro Tyr

210 215 220

Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp

225 230 235 240

Gly Asp Lys Ala Glu Val Val Met Glu Met Ile His Met Leu Leu Asp

245 250 255

Leu Leu Glu Ala Pro Asp Ala Cys Thr Leu Glu Lys Phe Leu Gly Arg

260 265 270

Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe

275 280 285

Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val

290 295 300

Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg

305 310 315 320

Ile Lys Glu Gln Gly Leu Asp Ile Ile Pro Arg Ile Leu Ile Val Thr

325 330 335

Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu

340 345 350

Lys Val Phe Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg

355 360 365

Thr Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp

370 375 380

Pro Tyr Ile Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Val Thr Ala

385 390 395 400

Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly

405 410 415

Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys

420 425 430

Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile

435 440 445

Tyr Trp Lys Asn Phe Glu Glu Lys Tyr His Phe Ser Ser Gln Phe Thr

450 455 460

Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr

465 470 475 480

Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser

485 490 495

His Thr Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile

500 505 510

Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met

515 520 525

Gly Ile Tyr Tyr Ser Tyr Thr Glu Lys Glu Lys Arg Leu Thr Ala Leu

530 535 540

His Pro Glu Ile Asp Glu Leu Leu Phe Ser Ser Val Glu Asn Glu Glu

545 550 555 560

His Leu Cys Val Leu Lys Asp Lys Ser Lys Pro Ile Leu Phe Thr Met

565 570 575

Ala Arg Leu Asp Asn Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr

580 585 590

Ala Lys Asn Asp Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly

595 600 605

Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Gln Met

610 615 620

Gln Lys Met His Glu Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe

625 630 635 640

Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr

645 650 655

Arg Val Ile Ala Asp Thr Arg Gly Ala Phe Ile Gln Pro Ala Phe Tyr

660 665 670

Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro

675 680 685

Thr Phe Ala Thr Leu His Gly Gly Pro Ala Glu Ile Ile Val His Gly

690 695 700

Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Val Thr Glu

705 710 715 720

Leu Leu Val Asn Phe Phe Glu Lys Thr Lys Gln Asp Pro Gly His Trp

725 730 735

Glu Ala Ile Ser Lys Gly Gly Leu Gln Arg Ile Gln Glu Lys Tyr Thr

740 745 750

Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Gly Val Tyr Gly

755 760 765

Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr

770 775 780

Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val

785 790 795 800

Pro Leu Ala Val Asp Glu

805

<210> 16

<211> 2421

<212> DNA

<213> 甜叶菊

<400> 16

atggcggaac gtgtactcac tcgtgttcac agtcttcgtg agcgtctcga ttcaactctc 60

gcaactcatc gtaatgaaat cctcttgttt ctttcaagga ttgaaagcca tggaaaagga 120

atattgaagc ctcatcaagt tatgactgaa tttgaagcta tctgcaaaga agatcagagc 180

aaactctctg atggtgcttt ttatgaagtt cttaaatgca cacaggaagc aatagtgcaa 240

cctccatggg ttgcactcgc gatccgtctt cgacccggtg tttgggaata tgttagagtc 300

aatgttaatg ttttggtggt tgaagaatta agtgttcctg aatatcttca cttcaaagaa 360

gaattggtta atggaacatc gaatggcaac ttcgtgttgg aactggattt tgaacctttt 420

accgcatcgt ttcctcgacc aactttaacc aagtctattg gtaatggtgt tgagtttcta 480

aacagacatt tatctgctaa aatgtttcat gataaggata gcatgcaccc tcttcttgat 540

ttcctacgga ctcaccacta taagggaaag acaatgatgt tgaatgatag aatccaaaac 600

ctcaatgctc tacaatcggt gttgcgaaag gcgtcagagt acttatcaac actcgacgca 660

gcaacaccgt actctgagtt tgaacataag tttcaagaaa tcgggttgga gagaggttgg 720

ggtgataaag cggaggtcgt aatggagatg atccacatgc ttctagacct tctagaagca 780

cccgacgcat gcacactcga gaagtttctc ggaagaatcc caatggtttt caatgttgtc 840

attctttcgc ctcacggcta cttcgcccaa gaaaatgtgt tgggatatcc cgacactggc 900

ggtcaggttg tttacatctt ggatcaagtt cccgctctgg aacgcgagat gctcaaaagg 960

attaaggagc aaggactcga tatcattcct cgtatattga ttgttacgag gcttcttccc 1020

gacgcggttg ggaccacatg cgggcaacgt ttagagaaag tgtttggagc cgaacactcg 1080

catattcttc gggtcccgtt tagaaccgaa aagggtattc ttcgtaaatg gatctctcgt 1140

tttgaggtgt ggccttacat cgagactttc accgaggatg ttgctaaaga agttacagca 1200

gagttgcaag caaaaccaga tttgatcatt ggaaactata gtgaaggaaa tttggttgca 1260

tctttgctag ctcacaagtt gggtgtcact cagtgtacca ttgctcatgc tttggagaaa 1320

actaaatacc cggattctga tatctactgg aagaactttg aggagaaata tcatttctct 1380

tcgcagttta ccgctgatct tatcgctatg aaccataccg acttcatcat caccagtact 1440

ttccaagaaa ttgctggaag taaggacacg gttggacagt acgagagtca taccgcgttc 1500

acaatgccgg gattgtatcg ggtggttcac gggatcgatg tttttgaccc caaattcaat 1560

attgtttcac ccggggccga tatgggaatt tactactcgt ataccgagaa agaaaagagg 1620

ctcactgcgc ttcaccctga aatcgatgaa cttctcttta gttccgtcga aaacgaagaa 1680

cacttatgtg tgttgaagga taagagtaaa ccaatcttgt tcacaatggc gcgattggat 1740

aatgtgaaga atttaaccgg actggttgaa tggtacgcta aaaacgaccg ccttcgtgag 1800

ctcgtgaacc tcgtggtcgt cggtggtgac cgaaggaaag agtcgaaaga tcttgaagaa 1860

caagctcaga tgcagaagat gcatgaactt atcgaaacct acaaactcaa cggtcagttc 1920

aggtggatat cctcacaaat gaaccgcgtg aggaacggtg agttgtatcg cgttattgct 1980

gacacacgag gtgcgtttat ccagcctgcg ttttacgagg cgtttgggtt gacggttgtg 2040

gaggccatga cttgtggcct gccgacattc gcgacacttc atggtgggcc cgctgagatt 2100

attgttcacg ggaaatccgg gttccatatt gacccgtatc acggtgacca ggtcaccgag 2160

ttgctggtca atttctttga gaaaactaaa caagacccgg gtcattggga ggccatttcc 2220

aagggtggtc tgcaacgtat tcaggagaaa tacacgtggc agatttattc agataggttg 2280

ttgacgcttg ccggagttta tggattctgg aagcatgtgt cgaagcttga caggctcgag 2340

atccgtcgtt atcttgaaat gttttacgcg ctcaagtatc gcaaactggc tgaatctgtt 2400

ccattggctg ttgatgagtg a 2421

<210> 17

<211> 810

<212> PRT

<213> 甜叶菊

<400> 17

Met Ala Thr Ser Lys Leu Ser Arg Thr His Ser Met Arg Glu Arg Val

1 5 10 15

Glu Glu Thr Leu Ser Ala His Arg Asn Glu Ile Val Ser Leu Leu Ser

20 25 30

Arg Tyr Val Ala Gln Gly Lys Ala Ile Leu Gln Pro His Gln Ile Leu

35 40 45

His Glu Leu Glu Asn Ile Ile Gly Asp Val Thr Ser Arg Gln Lys Leu

50 55 60

Thr Asp Gly Pro Phe Gly Asp Ala Leu Lys Thr Ala Gln Glu Cys Ile

65 70 75 80

Val Leu Pro Pro Phe Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val

85 90 95

Trp Glu Tyr Val Arg Val Asp Ala Tyr Gln Leu Ser Val Glu Gln Leu

100 105 110

Thr Val Ser Glu Tyr Leu Thr Phe Lys Glu Glu Leu Val Gly Glu Ser

115 120 125

Asn Ser Ser Leu Met Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ser

130 135 140

Phe Pro Arg Pro Thr Arg Ser Ser Ser Ile Gly Asn Gly Val Gln Phe

145 150 155 160

Leu Asn Arg His Leu Ser Ser Ser Met Phe Arg Ser Lys Asp Cys Leu

165 170 175

Glu Pro Leu Leu Asp Phe Leu Arg Thr His Arg His Asn Gly His Val

180 185 190

Met Met Leu Asn Asp Arg Ile Thr Ser Met Thr Arg Leu Gln Ser Ser

195 200 205

Leu Val Lys Ala Glu Glu Tyr Leu Ser Lys Leu Pro Ser Asp Thr Asp

210 215 220

Tyr Ser Glu Phe Gln Tyr Glu Leu Gln Gly Met Gly Phe Glu Arg Gly

225 230 235 240

Trp Gly Asn Asn Ala Glu Arg Ile Ile Glu Met Met His Leu Leu Ser

245 250 255

Asp Ile Leu Gln Ala Pro Asp Pro Ser Ile Leu Glu Ser Phe Leu Ala

260 265 270

Arg Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Ile His Gly Tyr

275 280 285

Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Ile

290 295 300

Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu Leu

305 310 315 320

Lys Leu Lys His Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val

325 330 335

Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Ser Cys Asn Gln Arg Leu

340 345 350

Glu Arg Val Ser Gly Thr Glu His Thr His Ile Leu Arg Val Pro Phe

355 360 365

Arg Thr Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Asp Val

370 375 380

Trp Pro Phe Leu Glu Lys Phe Thr Gln Asp Ala Ala Ser Glu Ile Ser

385 390 395 400

Ala Glu Leu His Gly Thr Pro Asp Leu Ile Ile Gly Asn Tyr Ser Asp

405 410 415

Gly Asn Leu Val Ala Ser Leu Leu Ser Tyr Lys Met Gly Val Thr Gln

420 425 430

Cys Asn Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp

435 440 445

Leu Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Cys Gln Phe

450 455 460

Thr Ala Asp Leu Leu Ala Met Asn Asn Ala Asp Phe Ile Ile Thr Ser

465 470 475 480

Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr Glu

485 490 495

Ser His Ser Ser Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly

500 505 510

Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp

515 520 525

Met Ser Ile Tyr Phe Ser Tyr Thr Glu Lys Glu Lys Arg Leu Thr Ser

530 535 540

Leu His Thr Thr Ile Glu Lys Leu Leu Phe Asp Pro Thr Gln Thr Glu

545 550 555 560

Asp Tyr Ile Gly Asn Leu Ser Asp Lys Ser Lys Pro Ile Ile Phe Ser

565 570 575

Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Leu Val Glu Trp

580 585 590

Tyr Ala Lys Asn Glu Lys Leu Arg Gly Leu Ala Asn Leu Val Val Val

595 600 605

Ala Gly Tyr Asn Asn Val Lys Arg Ser Ser Asp Arg Glu Glu Ile Ala

610 615 620

Glu Ile Glu Lys Met His Gln Leu Ile Lys Lys Tyr Lys Leu Asp Gly

625 630 635 640

Gln Met Arg Trp Ile Ser Ala Gln Thr Asn Arg Ala Gln Asn Gly Glu

645 650 655

Leu Tyr Arg Tyr Ile Ala Asp Gly Arg Gly Ile Phe Val Gln Pro Ala

660 665 670

Ile Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly

675 680 685

Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Gly Glu Ile Ile Glu

690 695 700

Asn Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Thr Ala

705 710 715 720

Ser Ala Thr Met Ala Asp Phe Phe Gln Lys Cys Lys Glu Asp Pro Ser

725 730 735

Tyr Trp Phe Lys Ile Ser Glu Ala Gly Leu Lys Arg Ile Tyr Glu Arg

740 745 750

Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly Val

755 760 765

Tyr Ser Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr Arg

770 775 780

Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Asp Leu Val Lys

785 790 795 800

Ser Val Pro Val Ala Thr Asp Asp Glu Ala

805 810

<210> 18

<211> 2433

<212> DNA

<213> 甜叶菊

<400> 18

atggcgacaa gtaagttgag cagaacgcat agtatgcgtg agcgtgttga agaaactctt 60

tccgctcatc gcaacgaaat cgtttctctt ctttctaggt atgtggctca ggggaaggcg 120

atattgcagc cgcatcagat actccatgaa cttgagaata tcatcggtga tgttacttcg 180

cgccaaaagc ttacagatgg tccgtttgga gatgcgttga agacagcaca ggaatgtata 240

gttctacctc catttgtagc tttagcagtt cgtccaagac ctggtgtttg ggaatacgtg 300

cgcgtggatg catatcaact aagtgtggaa caactaactg tttcagagta tcttaccttc 360

aaagaagaac ttgttggaga gtctaatagt tctttaatgc tcgagttgga ttttgagcca 420

tttaatgctt cgtttcctag accaacccgt tcttcatcca ttggcaatgg agttcagttc 480

ctgaatcgcc acctgtcgtc aagcatgttt cgcagcaaag attgtttaga accgcttctg 540

gatttcctac gcacacacag acataatgga catgtaatga tgttaaatga ccgcataaca 600

agcatgacta gacttcaatc ttctttggtc aaagcagagg aatatctttc taaactacca 660

tctgatacag actactctga gtttcaatat gaattgcaag gaatgggttt tgaaagagga 720

tggggaaaca atgctgaaag aatcattgag atgatgcatc ttctctcaga cattctacaa 780

gctccagatc cttccatttt ggaatctttt cttgctagaa tacctatggt gtttaatgtt 840

gttatattat caatacatgg ctactttggg caagcaaatg ttttgggttt gccagatact 900

ggtggccaga ttgtatatat attggatcaa gtccgtgcat tggaaaatga gatgcttctt 960

aaattaaagc accaaggact ggatatcaaa cctaggattc tgattgtgac tcggttaata 1020

cctgatgcaa aaggtacttc atgtaaccaa cgactggaaa gagtcagtgg aactgaacac 1080

acacatatac ttcgtgttcc ttttagaacc gagaaaggaa ttcttcgtaa atggatctca 1140

aggtttgatg tatggccttt tttggagaaa tttacacagg atgcagcaag tgaaatttct 1200

gctgagttgc atggtactcc agatcttata attggaaatt atagtgatgg caatcttgtt 1260

gcctctttat tatcttacaa aatgggagta acccagtgta acattgctca tgctttagag 1320

aaaacaaagt atccagattc tgatttatat tggaagaaat ttgatgagaa atatcacttt 1380

tcttgtcaat ttactgctga tcttttagcc atgaacaatg cagattttat catcaccagc 1440

acataccaag aaatcgcggg aacgaaaaat actgtcggac aatacgagag tcattcgtct 1500

ttcactctcc cggggctcta cagggttgtt catggtattg acgtttttga ccctaagttc 1560

aacattgtgt ctccaggggc agatatgtct atatacttct catacaccga gaaggaaaaa 1620

agacttacat ctcttcatac tacaattgag aagttattgt ttgaccctac acaaactgaa 1680

gattacattg gaaatctgag tgataaatca aaaccgataa ttttttcaat ggcaagactt 1740

gatcatgtga agaacattac gggtctggtt gagtggtacg ctaagaatga gaagcttaga 1800

ggactagcaa accttgttgt ggttgctggt tataataatg tgaagaggtc tagtgacaga 1860

gaagaaattg cagaaattga aaaaatgcat caacttatta agaaatacaa attagatggt 1920

cagatgagat ggatttcagc acaaacaaac cgcgcacaaa atggtgaact ttatcgctat 1980

attgctgatg gaaggggaat ctttgtacag cccgctattt atgaagcttt tgggctgaca 2040

gtggtggagg ccatgacttg tgggcttcca acatttgcaa cttgccatgg tgggccagga 2100

gagataattg aaaatggtgt ttcgggcttc catatcgacc cgtatcatcc ggatactgca 2160

tcagccacaa tggctgattt ttttcagaaa tgcaaggagg acccgagtta ttggttcaag 2220

atatctgaag cagggcttaa aagaatatat gaaaggtaca catggaaaat ttactctgaa 2280

cggttgatga cattagctgg agtttatagc ttctggaagt atgtctcgaa acttgagaga 2340

cgtgaaacaa gacgatatct tgagatgttt tatattctta agttccgtga tctggtaaaa 2400

tctgttccag tggctactga tgatgaggct tag 2433

<210> 19

<211> 811

<212> PRT

<213> 甜叶菊

<400> 19

Met Ala Thr Pro Lys Leu Thr Arg Thr Pro Ser Met Arg Glu Arg Leu

1 5 10 15

Glu Glu Thr Leu Ser Ala His Arg Asn Asp Ile Val Ser Leu Leu Ser

20 25 30

Arg Tyr Val Asp Gln Gly Lys Ala Ile Leu Gln Pro His His Leu Leu

35 40 45

Asp Glu Ile Asp Asn Phe Ile Gly Asp Gln Asn Cys Arg Gln Lys Leu

50 55 60

Ala Asp Ser Leu Phe Gly Glu Ile Leu Lys Ser Ala Gln Glu Gly Ile

65 70 75 80

Ile Leu Pro Pro Tyr Val Thr Leu Ala Val Arg Pro Arg Pro Gly Val

85 90 95

Trp Asp Phe Leu Arg Val Asn Val Asp Glu Leu Ser Val Glu Gln Leu

100 105 110

Thr Val Ser Glu Tyr Leu Ser Phe Lys Glu Glu Leu Val Asp Gly Gln

115 120 125

Ser Arg Asn Pro Phe Val Leu Glu Leu Asp Leu Glu Pro Phe Asn Ala

130 135 140

Thr Phe Pro Arg Met Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln

145 150 155 160

Phe Leu Asn Arg His Leu Ser Ser Ile Met Phe Arg Asn Lys Asp Cys

165 170 175

Met Asp Pro Phe Leu Asp Phe Leu Arg Ala His Lys His Lys Gly Tyr

180 185 190

Ala Met Met Leu Asn Asp Arg Ile Gln Thr Met Ser Arg Leu Glu Ser

195 200 205

Ser Leu Ala Lys Ala Glu Asp His Leu Ser Lys Leu Pro Pro Glu Thr

210 215 220

Pro Tyr Ser Glu Phe Glu Tyr Val Leu Gln Gly Met Gly Phe Glu Arg

225 230 235 240

Gly Trp Gly Asp Asn Cys Glu Arg Val Leu Gly Met Met His Leu Leu

245 250 255

Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Ile Leu Glu Lys Phe Leu

260 265 270

Gly Lys Met Pro Met Ile Phe Asn Val Val Val Leu Ser Ile His Gly

275 280 285

Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln

290 295 300

Val Val Tyr Ile Leu Asp Gln Val Arg Ser Leu Glu Asn Glu Met Leu

305 310 315 320

Leu Lys Leu Arg His Gln Gly Leu Asp Ile Lys Pro Lys Ile Leu Ile

325 330 335

Val Thr Arg Leu Ile Pro Asn Ala Lys Gly Thr Ser Cys Asn Gln Arg

340 345 350

Leu Glu Lys Val Ser Gly Thr Glu Tyr Thr Tyr Ile Leu Arg Val Pro

355 360 365

Phe Arg Thr Glu Lys Gly Ile Leu Gly Lys Trp Leu Ser Arg Phe Asp

370 375 380

Ile Trp Pro Tyr Leu Glu Ala Phe Thr Thr Asp Ala Ala Ser Glu Ile

385 390 395 400

Ala Ala Glu Leu His Gly Val Pro Asp Leu Leu Ile Gly Asn Tyr Ser

405 410 415

Asp Gly Asn Leu Val Ala Ser Leu Leu Ser Asn Lys Leu Gly Val Thr

420 425 430

Gln Cys Asn Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser

435 440 445

Asp Leu Tyr Trp Lys Lys Phe Glu Asp Lys Tyr His Phe Ser Cys Gln

450 455 460

Phe Thr Ala Asp Leu Leu Ala Met Asn Asn Ala Asp Phe Ile Ile Thr

465 470 475 480

Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr

485 490 495

Glu Asn His Ser Ser Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His

500 505 510

Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala

515 520 525

Asp Met Ala Ile Tyr Phe Ser Tyr Ala Asp Lys Glu Arg Arg Leu Thr

530 535 540

Ser Leu His Pro Thr Ile Glu Lys Leu Leu Phe Asp Thr Glu Gln Asn

545 550 555 560

Asp Val His Ile Gly Asn Ile Asn Asp Pro Ser Lys Pro Met Ile Phe

565 570 575

Thr Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Phe Val Glu

580 585 590

Cys Tyr Ala Lys Asn Asn Lys Leu Arg Glu His Ala Asn Leu Val Val

595 600 605

Ile Ala Gly Tyr Asn Asp Ala Lys Lys Ser Ser Asp Arg Glu Glu Ile

610 615 620

Ala Glu Ile Glu Lys Met His Asn Leu Ile Lys Gln Tyr Lys Leu Asp

625 630 635 640

Gly Gln Met Arg Trp Ile Ser Ala Gln Thr Asn Arg Ala Arg Asn Gly

645 650 655

Glu Phe Tyr Arg Tyr Ile Ala Asp Gly Arg Gly Val Phe Val Gln Pro

660 665 670

Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys

675 680 685

Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Ala Glu Ile Ile

690 695 700

Glu Asp Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Lys

705 710 715 720

Met Ser Thr Thr Leu Ala Asp Phe Phe Gln Lys Cys Lys Glu Glu Pro

725 730 735

Ser Tyr Trp Gly Lys Ile Ser Asp Gly Gly Leu Lys Arg Ile Ser Glu

740 745 750

Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly

755 760 765

Val Tyr Ser Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr

770 775 780

Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Gln Leu Val

785 790 795 800

Lys Ser Val Pro Leu Ala Val Asp Glu Glu Pro

805 810

<210> 20

<211> 2436

<212> DNA

<213> 甜叶菊

<400> 20

atggcgacac ctaagcttac gcgaacacca agcatgcgag agcgtcttga agaaacttta 60

tcagctcatc gcaacgatat cgtctctctt ctttccaggt atgtagatca aggtaaggcc 120

atattgcagc cccaccacct acttgacgaa atcgataact tcatcggaga tcaaaattgc 180

cgccaaaagc ttgctgatag tctattcggt gaaatcctca agtccgcaca ggaaggtata 240

attcttcctc catatgtaac gcttgctgtt cgtccaagac ctggtgtttg ggactttttg 300

cgtgtgaatg tcgatgaatt gagtgtcgag caacttactg tttctgagta tttaagcttc 360

aaggaggagc ttgtagatgg ccagagtagg aacccgtttg tgttggaact ggatctggaa 420

ccgtttaatg caacatttcc ccggatgtca cgatcttcat ccatcggcaa tggagttcag 480

tttctcaacc gtcatctctc gtcaattatg tttcgcaaca aagattgtat ggatccgttt 540

cttgatttcc ttcgtgctca taaacataaa ggatacgcga tgatgttgaa tgatcggata 600

caaacaatgt ctagacttga atcttcttta gcaaaagcgg aggatcatct ctctaaacta 660

ccacccgaaa caccgtactc cgaattcgaa tacgtattgc aaggaatggg gtttgaaaga 720

ggttgggggg ataattgtga aagagttctt ggtatgatgc atcttctttc tgacattctt 780

caagctccag atccttcgat tcttgaaaag tttcttggaa agatgccgat gatcttcaat 840

gttgttgtgt tatcgattca tggttacttt ggtcaggcta atgttttggg tttgccggat 900

accggtggtc aggttgtata tatattggat caagtacgtt ctttggagaa tgaaatgtta 960

cttaaattaa ggcatcaagg acttgatatc aaacccaaga ttctaattgt aactcgattg 1020

ataccaaatg ccaaaggtac ttcatgcaac caacgattgg agaaagtaag tggaaccgaa 1080

tacacgtata tattacgtgt cccttttagg acagagaaag ggattcttgg taaatggtta 1140

tcaaggtttg atatatggcc ttatttggag gcgtttacaa cggatgcagc aagtgaaatt 1200

gctgctgagt tacacggtgt tccggatctt ttaataggaa actacagtga tgggaatctc 1260

gttgcctcct tgctatctaa caaattgggc gtaacccagt gcaacattgc acacgcgtta 1320

gagaaaacaa agtatccaga ttccgactta tattggaaga aatttgagga caaatatcac 1380

ttttcatgtc aatttaccgc cgaccttcta gcaatgaaca atgcagattt tatcatcact 1440

agcacatacc aagagattgc aggaacgaaa aacaccgttg gacaatacga gaatcattca 1500

tcgttcactc ttccgggtct atacagggtt gttcacggta tcgatgtctt tgacccgaag 1560

ttcaacatcg tgtcaccagg ggcagatatg gcaatttact tctcatatgc cgataaagag 1620

agacgactta catctctaca tcccacaatt gagaagctat tgttcgacac tgagcagaac 1680

gatgtacaca ttggaaatat aaatgacccg tctaaaccca tgattttcac aatggcgagg 1740

cttgatcatg tgaagaatat aactggattc gtcgagtgtt atgctaaaaa taataagttg 1800

agggaacacg caaatcttgt ggttattgct ggttataatg acgcgaagaa atcaagtgat 1860

cgagaagaaa ttgcggaaat tgaaaagatg cataatctta tcaagcaata caaacttgat 1920

ggtcagatga gatggatatc agcccaaaca aaccgggccc gaaatgggga attttatcgg 1980

tatatcgctg atggtagggg cgttttcgtc cagcccgctt tctatgaagc atttgggctt 2040

acggttgtgg aggcgatgac atgtgggctc ccaacatttg ccacgtgtca tggtgggcct 2100

gctgagatca ttgaggatgg tgtgtcgggg ttccatattg atccatatca tcctgataag 2160

atgtcgacta cgttagctga tttttttcaa aagtgcaaag aggaacctag ttactggggt 2220

aaaatatccg atggcgggct gaaaagaata agtgaaaggt acacatggaa gatatattcg 2280

gaacggttga tgacgttggc gggcgtatat agcttttgga aatatgtgtc aaaactcgag 2340

aggcgtgaaa cccgtcgata ccttgagatg ttctacattt taaagtttcg tcaactggtg 2400

aagtcggttc cgctagctgt tgatgaggag ccgtaa 2436

<210> 21

<211> 842

<212> PRT

<213> 甜叶菊

<400> 21

Met Ala Ser Ala Ser Ser Ser Ile Met Lys Arg Ser Glu Ser Ile Val

1 5 10 15

Asp Thr Met Pro Glu Ala Leu Lys Gln Ser Arg Tyr His Met Lys Lys

20 25 30

Cys Phe Leu Lys Tyr Val Glu Lys Gly Ile Arg Met Met Lys Arg His

35 40 45

His Leu Ile Gln Glu Met Glu Thr Ala Ile Glu Asp Lys Asp Glu Lys

50 55 60

Ala Gln Leu Leu Asp Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Gln

65 70 75 80

Glu Ala Ala Val Val Pro Pro Cys Val Ala Phe Ala Ile Arg Pro Asn

85 90 95

Pro Gly Phe Trp Glu Phe Val Lys Val Asn Ser Asn Asp Leu Ser Val

100 105 110

Asp Gly Ile Thr Ala Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val

115 120 125

Asp Glu Thr Trp Ala Lys Asp Glu Asn Ala Leu Glu Ile Asp Phe Gly

130 135 140

Ser Met Asp Phe Asn Leu Pro Asn Met Ser Leu Ser Cys Ser Ile Gly

145 150 155 160

Asn Gly Val Asn Phe Thr Ser Lys Phe Ile Thr Cys Lys Leu Tyr Ala

165 170 175

Gln Ser Ser Cys Gln Gln Leu Leu Val Asp Tyr Leu Leu Ser Leu Asn

180 185 190

His Gln Gly Glu Asn Leu Met Ile Asn Asp Ala Leu Asn Ser Val Ser

195 200 205

Lys Leu Arg Ala Ala Leu Ile Val Ala His Ala Ser Leu Ser Ser Leu

210 215 220

Pro Asn Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Glu Trp

225 230 235 240

Gly Phe Glu Lys Gly Trp Gly Asp Asn Ala Glu Arg Ala Arg Glu Thr

245 250 255

Ile Arg Phe Leu Leu Glu Val Leu Gln Ala Pro Asp Pro Ile Asn Leu

260 265 270

Glu Ala Leu Phe Ser Arg Ile Pro Asn Ile Phe Asn Val Val Leu Phe

275 280 285

Ser Ile His Gly Tyr Phe Gly Gln Ser Asn Val Leu Gly Leu Pro Asp

290 295 300

Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Met Glu

305 310 315 320

Glu Glu Leu Leu Met Arg Ile Lys Gln Gln Gly Leu Asn Phe Lys Pro

325 330 335

Gln Ile Leu Val Val Thr Arg Leu Leu Pro Asp Ala Lys Gly Thr Lys

340 345 350

Cys Asn Gln Val Leu Glu Pro Val Leu Asn Thr Lys His Ser His Ile

355 360 365

Leu Arg Val Pro Phe Arg Thr Asp Lys Gly Val Leu Arg Lys Trp Val

370 375 380

Ser Arg Phe Asp Ile Tyr Pro Tyr Leu Glu Asn Phe Thr Gln Asp Ala

385 390 395 400

Ser Ala Lys Ile Ile Glu Met Met Glu Gly Lys Pro Asp Leu Ile Ile

405 410 415

Gly Asn Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Asn Lys

420 425 430

Leu Gly Thr Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys

435 440 445

Tyr Glu Asp Ser Asp Met Asn Trp Lys Gln Phe Asp Pro Lys Tyr His

450 455 460

Phe Ser Cys Gln Phe Thr Ala Asp Met Ile Ala Met Asn Ser Ala Asp

465 470 475 480

Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp Arg

485 490 495

Pro Gly Gln Tyr Glu Ser His Glu Ala Phe Thr Leu Pro Gly Leu Tyr

500 505 510

Arg Val Val Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala

515 520 525

Ser Pro Gly Ala Asp Gln Thr Val Tyr Phe Pro Tyr Thr Glu Thr Lys

530 535 540

Lys Arg Phe Thr Ala Phe Gln Pro Ala Ile Glu Glu Leu Leu Phe Ser

545 550 555 560

Lys Val Glu Asn Glu Glu His Ile Gly Tyr Leu Glu Asp Lys Thr Lys

565 570 575

Pro Ile Ile Phe Ser Met Ala Arg Leu Asp Thr Val Lys Asn Ile Thr

580 585 590

Gly Leu Thr Glu Trp Phe Gly Glu Asn Lys Arg Leu Arg Ser Leu Val

595 600 605

Asn Leu Val Ile Val Ala Gly Phe Phe Asp Pro Ser Lys Ser Lys Asp

610 615 620

Arg Glu Glu Met Ala Glu Ile Lys Lys Met His Leu Leu Ile Glu Lys

625 630 635 640

Tyr Gln Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Lys

645 650 655

Asn Arg Asn Ser Glu Leu Tyr Arg Phe Ile Ala Asp Ser Lys Gly Ala

660 665 670

Phe Val Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu

675 680 685

Ala Met Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro

690 695 700

Ala Glu Ile Ile Val Asp Gly Val Ser Gly Phe Gln Ile Asp Pro Asn

705 710 715 720

Phe Gly Asp Gln Ser Ser Asn Lys Ile Ala Asp Phe Phe Gln Lys Cys

725 730 735

Lys Glu Asp Pro Gly Tyr Trp Asn Asn Ile Ser Glu Gly Gly Leu Lys

740 745 750

Arg Ile Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu

755 760 765

Asn Met Gly Asn Ile Tyr Ser Phe Trp Lys Arg Leu Asn Lys Glu Gln

770 775 780

Lys Glu Ala Lys Gln Arg Tyr Ile Glu Leu Phe Tyr Asn Leu His Tyr

785 790 795 800

Lys Asn Leu Val Arg Thr Val Pro Ile Ala Ser Asp Glu Ala Gln Pro

805 810 815

Ala Pro Val Ser Arg Ala Lys Leu Ala Thr Gln Pro Thr Arg Arg Thr

820 825 830

Gln Ser Arg Leu Gln Arg Leu Phe Gly Ala

835 840

<210> 22

<211> 2529

<212> DNA

<213> 甜叶菊

<400> 22

atggcatctg cttcaagttc tatcatgaaa cggtctgaat caatagttga caccatgcca 60

gaagccttaa agcagagccg ctatcatatg aaaaaatgtt ttctaaaata tgtagaaaaa 120

ggaattcgca tgatgaaaag acatcatttg atacaagaaa tggagaccgc aattgaagac 180

aaggatgaaa aggctcagct tctagatggc ttacttggct acatcttgtg cacaactcag 240

gaagcagccg ttgttcctcc ttgtgttgca tttgctataa gaccgaatcc tggattctgg 300

gagtttgtta aagtcaactc taatgatcta tcggttgatg ggataactgc cacagattac 360

ttgaagttca aggaaatgat cgtagatgag acatgggcta aagatgaaaa tgcattggag 420

attgactttg gatcgatgga ctttaaccta ccaaacatga gtttatcttg ttcgattgga 480

aatggtgtta acttcacatc aaaattcatt acttgtaaac tttacgcaca atctagttgc 540

caacaactgc ttgttgatta cttgctctca ttgaatcatc aaggagaaaa tcttatgatc 600

aatgatgcat taaactcagt ctcaaaactt cgagcggctt taattgtagc tcatgcgtcg 660

ctatcttcgt tgcccaacga tactccatat caaagcttcg agcttagatt caaagaatgg 720

ggatttgaga agggatgggg agataacgcg gaacgcgcga gggaaacaat tcggtttctt 780

ttggaggttc ttcaagcacc cgatccgata aacctcgagg ctttattcag caggattcca 840

aacatattca acgttgtttt attctcgatt catgggtatt ttggtcaatc caatgttctt 900

ggattgcccg atactggtgg ccaagtggtt tatgttttgg atcaagtggt agctatggaa 960

gaagaactac tcatgaggat caaacaacaa ggactcaact tcaagcctca aattcttgtg 1020

gtgacccgac ttcttcctga tgctaaaggg accaagtgta atcaggtgtt ggaaccagtt 1080

ctgaacacga aacattcgca tattcttagg gttccattca ggactgataa aggtgttctt 1140

cgtaaatggg tatctcgatt tgatatctat ccatatctcg aaaacttcac tcaggatgca 1200

agtgcgaaaa tcattgaaat gatggaaggg aaaccggatc ttatcatcgg aaactatacc 1260

gatggaaacc ttgttgcatc actcatggct aacaaactcg gaacgacatt gggaacaatt 1320

gcacatgctt tggagaaaac caaatacgaa gattcagaca tgaattggaa gcaattcgac 1380

ccaaaatatc acttctcctg ccaatttaca gccgatatga ttgcaatgaa ctcagctgat 1440

ttcatcatca caagtacttt ccaagaaatc gctggaagta aagatagacc cggacaatat 1500

gaaagccatg aagcatttac acttccagga ttatacagag ttgtttcagg catcaacgtg 1560

ttcgatccca aattcaatat cgcgtctcca ggagccgatc aaaccgttta tttcccgtac 1620

accgaaacaa agaaacgatt cactgcattt caacccgcca tagaggaatt actcttcagt 1680

aaagttgaaa acgaagaaca cattggatac ttagaagaca aaaccaaacc gatcatattc 1740

tcaatggcgc gtctcgacac agttaagaac ataacaggac taaccgaatg gtttggagag 1800

aacaaacggc tccgaagctt ggttaatctt gtaatcgtgg cgggtttctt tgacccgtca 1860

aagtcaaaag acagagaaga aatggcggaa ataaagaaaa tgcatttatt gattgaaaaa 1920

tatcagctta aaggtcaaat aagatggatt gctgcacaaa ctgataagaa ccgaaacagt 1980

gagctttacc ggtttattgc tgactcaaaa ggcgcgtttg tgcagcccgc tttgtatgag 2040

gcgtttgggc tcacggttat tgaggcgatg aactgtggtt taccgacttt tgcaactaat 2100

caaggtggtc cagctgagat tatcgttgat ggtgtttctg ggttccagat tgatcctaat 2160

tttggtgatc agtctagtaa taagattgct gatttcttcc agaagtgtaa ggaagatcct 2220

ggttattgga ataatatttc agaaggcggt ttgaagcgta tatacgaatg ttatacttgg 2280

aagatttatg cgaataaagt gttgaatatg gggaacatat actcgttttg gaagcggtta 2340

aacaaggaac aaaaagaagc aaaacaaaga tacattgaac tattctacaa tctacactac 2400

aagaacttgg ttaggactgt accaattgct agtgatgaag ctcaacctgc accagtgtca 2460

agggcaaaac ttgcaacaca acccacaaga cgtacgcaat ccaggttgca aaggctgttt 2520

ggagcttaa 2529

<210> 23

<211> 842

<212> PRT

<213> 甜叶菊

<400> 23

Met Ala Ala Ser Ser Ser Pro Ile Met Lys Arg Ser Glu Ser Val Leu

1 5 10 15

Asp Thr Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys

20 25 30

Cys Phe Leu Lys Tyr Val Gly Lys Gly Lys Arg Met Val Lys Leu His

35 40 45

His Leu Met Gln Glu Met Glu Thr Val Ile Glu Asp Lys Asp Glu Lys

50 55 60

Ala Gln Leu Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Gln

65 70 75 80

Glu Ala Ala Val Val Pro Pro Tyr Val Ala Phe Ala Ile Arg Pro Asn

85 90 95

Pro Gly Phe Trp Glu Phe Val Lys Val Asn Ser Asn Asp Leu Ser Val

100 105 110

Lys Gly Ile Thr Ser Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val

115 120 125

Asp Glu Thr Trp Ala Asn Asp Glu Asn Ala Leu Glu Ile Asp Phe Gly

130 135 140

Ala Met Asp Phe Asn Leu Pro Thr Met Ser Leu Ser Ser Ser Ile Gly

145 150 155 160

Asn Gly Val Asn Phe Thr Ser Lys Phe Ile Ile Ser Lys Leu Tyr Ala

165 170 175

His Ser Gly Ser Gln Leu Gln Ser Leu Val Asp Tyr Leu Leu Ser Leu

180 185 190

Asn His Gln Gly Glu Lys Leu Met Ile Asn Asp Lys Leu Asn Thr Val

195 200 205

Ser Lys Leu Gln Ala Ala Leu Ile Val Ala His Ser Phe Leu Ser Ser

210 215 220

Leu Pro Asn Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Glu

225 230 235 240

Trp Gly Phe Glu Lys Gly Trp Gly Asp Tyr Ala Glu Arg Val Gln Glu

245 250 255

Thr Ile Arg Phe Leu Leu Glu Val Leu Gln Ala Pro Asp Pro Val Asn

260 265 270

Leu Glu Ala Phe Phe Ser Arg Val Pro Asn Ile Phe Asn Ile Val Leu

275 280 285

Phe Ser Ile His Gly Tyr Phe Gly Gln Ser Asn Val Leu Gly Leu Pro

290 295 300

Asp Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Met

305 310 315 320

Glu Glu Glu Leu Leu Leu Arg Ile Lys Gln Gln Gly Leu Ser Phe Lys

325 330 335

Pro His Ile Leu Val Val Thr Arg Leu Leu Pro Asp Ala Lys Gly Thr

340 345 350

Glu Cys Ser Gln Val Leu Glu Pro Val Leu Asn Thr Lys His Ser His

355 360 365

Ile Leu Arg Val Pro Phe Arg Thr Glu Lys Gly Val Leu Arg Lys Trp

370 375 380

Val Ser Arg Phe Asp Ile Tyr Pro Tyr Leu Glu Lys Phe Thr Gln Asp

385 390 395 400

Ala Ser Ala Lys Ile Thr Glu Met Met Glu Gly Lys Pro Asp Leu Ile

405 410 415

Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Asn

420 425 430

Lys Leu Gly Ser Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr

435 440 445

Lys Tyr Glu Asp Ser Asp Met Lys Trp Lys His Leu Asp Thr Lys Tyr

450 455 460

His Phe Ser Cys Gln Phe Thr Ala Asp Met Ile Ala Met Asn Ser Ala

465 470 475 480

Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp

485 490 495

Arg Pro Gly Gln Tyr Glu Ser His Glu Ala Phe Thr Leu Pro Gly Leu

500 505 510

Tyr Arg Val Val Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile

515 520 525

Ala Ser Pro Gly Ala Asp Gln Thr Val Tyr Phe Pro Tyr Thr Glu Thr

530 535 540

Pro Lys Arg Phe Thr Thr Phe Gln Pro Ala Ile Gln Glu Leu Leu Phe

545 550 555 560

Ser Lys Val Glu Asn Asp Glu His Ile Gly Tyr Leu Glu Asp Lys Asn

565 570 575

Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp Met Val Lys Asn Ile

580 585 590

Thr Gly Leu Thr Glu Trp Phe Gly Glu Asn Lys Arg Leu Arg Ser Leu

595 600 605

Val Asn Leu Val Ile Val Ala Gly Phe Phe Asp Pro Ser Lys Ser Lys

610 615 620

Asp Arg Glu Glu Met Glu Glu Ile Lys Lys Met His Leu Leu Ile Glu

625 630 635 640

Lys Tyr Glu Leu Lys Gly Gln Ile Arg Trp Ile Val Ala Gln Thr Asp

645 650 655

Lys Asn Arg Asn Ser Glu Leu Tyr Arg Cys Ile Ala Asp Ser Lys Gly

660 665 670

Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile

675 680 685

Glu Ala Met Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly

690 695 700

Pro Ala Glu Ile Ile Val Asp Gly Val Ser Gly Phe Gln Ile Asp Pro

705 710 715 720

Asn Tyr Gly Asp Glu Ser Ser Asn Lys Ile Ala Asp Phe Phe Gln Lys

725 730 735

Cys Lys Gln Asp Pro Gly Tyr Trp Asn Arg Ile Ser Asp Gly Gly Leu

740 745 750

Met Arg Ile Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val

755 760 765

Leu Asn Met Gly Asn Ile Tyr Thr Phe Trp Lys Gln Leu Asn Lys Glu

770 775 780

Gln Lys Asp Ala Lys Gln Arg Tyr Ile Glu Leu Phe Tyr Asn Gln His

785 790 795 800

Tyr Lys Asn Leu Val Arg Thr Val Pro Ile Val Ser Asp Glu Asp Asp

805 810 815

Gln Val Thr Arg Ala Lys Pro Ala Thr Gln Pro Ser Thr Arg Arg Thr

820 825 830

Gln Ser Ala Leu Gln Arg Leu Leu Gly Ala

835 840

<210> 24

<211> 2529

<212> DNA

<213> 甜叶菊

<400> 24

atggcagctt cttcaagtcc cattatgaaa cggtctgagt cagtactcga caccatgcca 60

gaagctttga ggcaaagtcg gtatcatatg aaaaaatgct ttctaaaata tgtagggaaa 120

ggaaagcgga tggtgaaact ccaccatttg atgcaagaaa tggagaccgt cattgaggac 180

aaggacgaaa aggctcagct cttggaaggc ttacttggtt acatcttgtg caccactcag 240

gaagcagcag ttgttcctcc ttatgtcgcc tttgcaataa ggccaaaccc tggattttgg 300

gagtttgtta aagtcaactc taatgatctc tcggttaaag ggatcacttc caccgattac 360

ttgaagttca aggaaatgat cgttgacgaa acatgggcta atgatgaaaa tgcattggag 420

atcgactttg gagcaatgga ctttaacttg ccaacaatga gcttatcttc ttcaattgga 480

aatggagtta acttcacatc aaagtttatt atttctaaac tttatgctca ttctggcagc 540

caattacaat ctctagttga ttacttactt tcattaaatc atcaaggaga aaaacttatg 600

ataaatgaca aactaaacac agtttcaaaa cttcaagccg ctctaatagt agctcattct 660

ttcctttctt cattgcccaa cgacacaccg tatcaaagct ttgaacttag atttaaagag 720

tggggttttg aaaaaggatg gggagattat gcagaaaggg tgcaagaaac aattcggttt 780

ttgttggagg ttcttcaagc acccgacccc gtaaacctag aggccttttt tagcagggtt 840

ccaaacatat tcaatattgt tttattctcg attcatgggt attttggtca atccaatgtt 900

cttggcttgc ccgataccgg aggtcaggta gtttatgttt tggatcaagt tgtggcaatg 960

gaagaagaat tgctacttag gattaagcaa caaggactca gcttcaagcc tcatattctt 1020

gtggtgactc gacttcttcc cgatgccaaa gggaccgagt gtagccaagt tttggaacca 1080

gttctcaaca cgaaacactc acacattctt agagtcccat ttaggacaga aaaaggtgtt 1140

cttcgtaaat gggtgtctcg atttgatatc tatccatacc tcgaaaagtt tactcaggat 1200

gcaagtgcaa aaataactga aatgatggaa ggaaaacctg atcttatcat tggaaactac 1260

actgacggaa acttggttgc atctctcatg gctaacaaac tcggaagcac attgggaacg 1320

attgcacacg cgttagagaa gactaaatac gaagattcag acatgaaatg gaaacatttg 1380

gacacaaaat atcacttttc ttgtcaattt acagctgata tgatagcaat gaattcagca 1440

gatttcatca tcactagtac tttccaagaa attgctggaa gtaaagatag acccggtcag 1500

tatgaaagcc atgaagcatt tacactcccg ggtttatata gagttgtttc gggcatcaac 1560

gtgtttgatc ccaaattcaa cattgcatct ccgggagctg atcaaaccgt ttatttccct 1620

tacacggaaa caccaaaacg attcactact tttcaacccg ctatacaaga attactcttt 1680

agtaaagttg aaaacgacga acacattgga tatttagaag ataagaataa accaatcatc 1740

ttctcaatgg caagactcga catggttaag aacataacgg ggctaaccga atggtttggg 1800

gaaaacaagc ggttaagaag tttggttaat cttgtaattg tggcggggtt ttttgatccg 1860

tcaaaatcaa aagatagaga agaaatggaa gaaataaaga aaatgcattt gttgattgag 1920

aaatatgaac ttaaaggtca aataagatgg atagtagcac aaactgataa aaacagaaat 1980

agtgaacttt atcgttgtat cgctgactca aagggggcgt ttgtgcaacc ggctttatat 2040

gaagcgtttg ggttaaccgt tattgaggct atgaattgtg ggttaccaac ttttgcaact 2100

aaccaaggtg gtccggctga gattattgtt gatggtgttt ctgggttcca aatcgatcct 2160

aattatggcg acgagtctag caacaagatc gctgattttt ttcaaaaatg caaacaggat 2220

ccaggatact ggaataggat ttcagacggt ggtttgatgc gtatatacga atgctacaca 2280

tggaagattt atgcaaataa agtgttgaat atggggaaca tttacacatt ttggaagcag 2340

ttaaacaagg aacagaaaga tgcgaaacaa agatacattg agctattcta caatcaacat 2400

tacaagaatt tggttaggac tgtgccgatt gtaagtgatg aagatgacca agttacaagg 2460

gcaaaaccgg caacacaacc ttcaacaagg cgcacacaat ctgccttgca aaggctgctt 2520

ggagcttaa 2529

<210> 25

<211> 881

<212> PRT

<213> 甜叶菊

<400> 25

Met Asp Phe Gly Ile Ala Glu Thr Leu Ala Glu Ala Leu Lys Gln Asn

1 5 10 15

Arg Tyr His Ala Arg Arg Cys Phe Glu Arg Phe Thr Ser Arg Gly Lys

20 25 30

Arg Met Val Lys Pro Gln Glu Leu Leu His Met Ile Glu Lys Thr Ile

35 40 45

Asp Asp Lys Leu Glu Arg Thr Lys Val Leu Glu Gly Ser Met Gly Gln

50 55 60

Ile Leu Ser Ser Thr Gln Glu Ala Ile Val Ile Pro Pro Tyr Val Ile

65 70 75 80

Leu Gly Leu Arg Ala Asn Pro Gly Gln Trp Ala Tyr Val Lys Ile Asn

85 90 95

Ala Asp Asp Val Thr Val Glu Ser Leu Thr Pro Ser Gln Tyr Leu Lys

100 105 110

Phe Lys Glu Ser Ile Tyr Asp Gln Glu Trp Ala Lys Asp Glu Asn Ala

115 120 125

Leu Glu Leu Asp Phe Gly Ala Phe Asp Phe Asp Thr Pro Arg Leu Ile

130 135 140

Leu Pro Ser Ser Ile Gly Asn Gly Leu Gly Tyr Ile Ser Lys Phe Met

145 150 155 160

Thr Ser Arg Ile Gly Gly Asp Leu Glu Asn Ala Lys Pro Leu Leu Asp

165 170 175

His Leu Leu Ala Leu Lys Tyr His Gly Glu Lys Leu Met Ile Asn Glu

180 185 190

Thr Ile Asp Thr Val Ser Lys Leu Gln Lys Ala Leu Ile Val Ala Asp

195 200 205

Val Tyr Leu Ser Ala His Pro Lys Asp Glu Gln Tyr Gln Thr Leu Glu

210 215 220

Pro Lys Leu Lys Glu Trp Gly Phe Glu Lys Gly Trp Gly Asp Thr Ala

225 230 235 240

Glu Arg Val Arg Glu Thr Met Lys Met Leu Ser Glu Ile Leu Gln Ala

245 250 255

Pro Asp Pro Ile Asn Met Gln Ser Phe Phe Ser Arg Leu Pro Val Val

260 265 270

Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ser Asp

275 280 285

Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp

290 295 300

Gln Val Lys Ala Leu Glu Glu Glu Ile Leu Leu Arg Ile Lys Met Gln

305 310 315 320

Gly Leu Asn Ala Lys Pro Arg Ile Leu Val Val Ser Arg Leu Ile Pro

325 330 335

Asp Ala Gln Gly Thr Lys Cys Asn Glu Glu Met Glu Pro Ile Leu Asn

340 345 350

Thr Met His Ser His Ile Leu Arg Val Pro Phe Arg Thr Ser Lys Gly

355 360 365

Val Val Pro Gln Trp Val Ser Arg Phe Asp Ile Tyr Pro Tyr Leu Glu

370 375 380

Arg Phe Ser Gln Asp Ala Ala Ser Lys Ile Leu Glu Val Met Glu Cys

385 390 395 400

Lys Pro Asp Leu Ile Leu Gly Asn Tyr Thr Asp Gly Asn Ile Val Ala

405 410 415

Ser Leu Ile Ala Lys Lys Phe Gly Val Thr Gln Gly Thr Ile Ala His

420 425 430

Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Asn Trp Lys Asn

435 440 445

Phe Glu Lys Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu Ile

450 455 460

Ser Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu Ile

465 470 475 480

Val Gly Ser Lys Gln Arg Pro Gly Gln Tyr Glu Thr His Gly Ala Phe

485 490 495

Ser Met Pro Gly Leu Cys Arg Val Val Ser Gly Ile Asn Val Phe Asp

500 505 510

Pro Lys Phe Asn Ile Ala Ser Pro Gly Ala Glu Gln Ser Val Tyr Phe

515 520 525

Pro Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asp Phe His Pro Ala Ile

530 535 540

Lys Glu Leu Leu Phe Asn Glu Gln Asp Asn Asp Glu His Met Gly Tyr

545 550 555 560

Leu Ala Asp Val Thr Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp

565 570 575

Thr Val Lys Asn Ile Thr Gly Leu Thr Glu Trp Phe Gly Lys Asn Lys

580 585 590

Arg Leu Arg Ser Leu Val Asn Leu Val Val Val Ala Gly Phe Phe Asp

595 600 605

Pro Ser Lys Ser Lys Asp Arg Glu Glu Met Glu Glu Ile Lys Lys Met

610 615 620

His Glu Leu Ile Glu Lys Tyr Lys Leu Lys Gly Gln Met Arg Trp Ile

625 630 635 640

Ala Ala Gln Asn Asp Arg Thr Arg Asn Gly Glu Leu Tyr Arg Cys Ile

645 650 655

Ser Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala Phe

660 665 670

Gly Leu Thr Val Ile Glu Ala Met Asn Cys Gly Leu Pro Thr Phe Ala

675 680 685

Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser Gly

690 695 700

Phe His Ile Asp Pro Val Asn Gly Asp Glu Ser Ser Asn Lys Ile Ala

705 710 715 720

Asp Phe Phe Thr Lys Cys Lys Val Asp Gly Glu Tyr Trp Asp Arg Val

725 730 735

Ser Gln Ala Gly Leu Gln Arg Ile Tyr Glu Cys Tyr Thr Trp Lys Met

740 745 750

Tyr Ala Asn Lys Ala Leu Asn Met Gly Ser Met Tyr Gly Phe Trp Arg

755 760 765

Gln Leu Asn Lys Glu Thr Lys Gln Ala Lys Gln Arg Tyr Ile Asp Ile

770 775 780

Leu Tyr Asn Leu Gln Phe Lys Asn Leu Ala Lys Thr Ile Glu Ile Pro

785 790 795 800

Asp Phe Val Thr Pro Lys Leu Gln Glu Pro Val Lys Thr Glu Pro Thr

805 810 815

Lys Pro Leu Gln Glu Ala Arg Pro Arg Glu Pro Val Gln Lys Leu Val

820 825 830

Pro Glu Glu Thr Arg Leu Pro Lys Leu Glu Leu Thr Lys Leu Gly Gln

835 840 845

Pro Asn Leu Met Ser Asn Ala Arg Lys Pro Leu Ile Val Leu Val Ser

850 855 860

Val Leu Ile Val Ala Tyr Ala Ser Lys Asn Leu Tyr Arg Arg Tyr Phe

865 870 875 880

Lys

<210> 26

<211> 2646

<212> DNA

<213> 甜叶菊

<400> 26

atggatttcg gtatagcaga gactttggcc gaggcattga agcaaaaccg gtaccatgca 60

aggagatgct ttgagcgttt tacatcacgt ggaaaaagga tggtgaagcc tcaagagtta 120

ttacacatga ttgaaaaaac cattgacgac aagcttgaaa gaacgaaggt cttggagggc 180

tcaatgggac aaatcttgag ttccacacag gaggcaatcg ttattccacc atatgttatt 240

ttaggattga gagcgaatcc aggacaatgg gcatacgtta agatcaatgc tgatgacgtc 300

actgttgagt cactcacacc ttcacaatat ctaaagttca aagaatccat ctacgatcaa 360

gaatgggcaa aggacgaaaa tgcccttgaa ctagatttcg gagcgttcga ctttgatacg 420

cctcgattaa tcctcccgtc atctatcggc aacggactcg gttacatttc aaagttcatg 480

acttcaagaa ttggtggtga tctagaaaac gcgaagccgt tgcttgacca cttgcttgct 540

ctaaaatatc atggagagaa gcttatgatc aatgagacaa tagatacagt ttcaaagctc 600

cagaaagcat taattgttgc tgatgtctac ttatctgcac acccgaaaga cgaacaatat 660

caaaccttag agcccaagct taaagaatgg ggatttgaga aaggatgggg agatactgct 720

gaaagagtta gagagacaat gaaaatgctt tcggagattc ttcaagcacc cgacccgatt 780

aacatgcaat cgttctttag caggcttccg gtggtcttca atattgtcat attttctatt 840

catgggtatt ttggtcaatc agatgttctt ggattacctg ataccggagg gcaggttgtt 900

tacattcttg atcaagttaa agcattagag gaagagatat tgctaagaat aaaaatgcaa 960

ggattgaatg caaagcctcg gattcttgtg gtgagtcgac tcattcccga cgcacaagga 1020

acaaagtgta acgaggaaat ggaaccgatc ttgaacacaa tgcattcaca catccttcgg 1080

gttcctttca gaacctcaaa aggcgttgtt cctcaatggg tatcgcggtt tgacatctac 1140

ccgtatcttg aaagattctc acaggacgct gcctctaaaa tacttgaagt aatggaatgt 1200

aaaccagatc tcatacttgg aaactacaca gatggaaaca ttgttgcatc acttatagcc 1260

aaaaagtttg gagtaacaca ggggacgatt gcacacgcgt tagagaagac aaagtacgaa 1320

gattcggatg ttaactggaa aaactttgaa aaaaagtatc atttctcatg tcaatttacc 1380

gcggatttga tctcaatgaa cgctgcagat ttcataatca caagcactta tcaagaaatt 1440

gtgggaagca aacaaagacc cggacagtat gagacccacg gggcgtttag tatgcccgga 1500

ctttgtagag tcgtgtcggg catcaacgtg tttgatccta agttcaacat tgcttcaccc 1560

ggtgcggaac aatcggttta ttttccgtac accgagaagg agaaacggtt aacggatttt 1620

catcccgcaa ttaaagaact acttttcaac gaacaagaca atgacgagca tatgggatac 1680

ctcgcggatg taaccaaacc gataatattc tcaatggcga ggctcgatac ggtgaagaac 1740

ataacagggt taaccgagtg gttcggtaag aacaaacgac ttagaagtct tgtaaacttg 1800

gttgttgtcg cggggttctt cgatccatca aaatctaaag accgtgaaga gatggaggaa 1860

atcaagaaaa tgcatgaact aatagagaaa tacaaactca agggtcagat gagatggatc 1920

gcggctcaaa acgataggac ccgcaatggt gaattgtatc ggtgtatttc cgatacgaag 1980

ggagcgtttg tgcagcccgc gttgtatgag gcttttgggc tcacggttat cgaggcaatg 2040

aactgcggtc tcccgacttt tgcaaccaat caaggcgggc ccgcggagat catagttgac 2100

ggagtttcgg gatttcatat tgatcccgtt aacggagatg aatcaagcaa caagattgct 2160

gatttcttca cgaaatgcaa agtcgatggc gagtattggg accgcgtgtc gcaagcggga 2220

cttcaacgta tttacgagtg ctacacatgg aagatgtatg ctaacaaagc attgaacatg 2280

ggttcgatgt atggtttttg gaggcaatta aacaaagaaa ctaagcaagc gaagcaacga 2340

tacatcgata tcttgtataa cttacaattc aagaatttgg caaaaaccat tgaaatccct 2400

gattttgtga ctcctaaact tcaagaaccg gtcaaaaccg aaccaacaaa accattacaa 2460

gaagcaagac ctcgagaacc ggtgcaaaaa ctggtaccgg aagaaacccg actgccaaaa 2520

ctagagttga ccaagcttgg tcaaccgaat ttgatgagca atgcaagaaa accattgatt 2580

gttcttgttt ctgtgttgat agttgcatat gcatccaaga acttgtatag gaggtatttc 2640

aaatag 2646

<210> 27

<211> 458

<212> PRT

<213> 甜叶菊

<400> 27

Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile

1 5 10 15

Leu Phe Pro Val Pro Val Gln Gly His Ile Asn Pro Ile Leu Gln Leu

20 25 30

Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr

35 40 45

Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg

50 55 60

Phe Ile Leu Asp Asn Asp Pro Gln Asp Val Arg Ile Ser Asn Leu Pro

65 70 75 80

Thr His Gly Pro Leu Thr Val Met Arg Ile Leu Ile Ile Asn Glu His

85 90 95

Gly Ala Asp Glu Leu Gln Arg Glu Leu Glu Leu Leu Met Leu Ala Ser

100 105 110

Glu Glu Asp Gly Glu Val Ser Cys Leu Ile Thr Asp Gln Ile Trp Tyr

115 120 125

Phe Thr Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu

130 135 140

Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln

145 150 155 160

Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu

165 170 175

Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Cys

180 185 190

Gly Phe Ser Met Trp Lys Gln Gly Lys Glu Ile Phe Glu Asn Ile Thr

195 200 205

Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu

210 215 220

Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro

225 230 235 240

Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser

245 250 255

Leu Leu Asp His Asp Arg Thr Val Phe Pro Trp Leu Asp Gln Gln Pro

260 265 270

Ser Arg Ser Val Leu Tyr Val Ser Phe Gly Ser Ala Thr Glu Val Asp

275 280 285

Ala Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln

290 295 300

Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp

305 310 315 320

Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val

325 330 335

Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala

340 345 350

Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu

355 360 365

Gly Val Pro Met Ile Phe Ser Ala Phe Ala Phe Asp Gln Pro Leu Asn

370 375 380

Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn

385 390 395 400

Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val

405 410 415

Asp Glu Glu Gly Gly Tyr Ile Arg Gln Asn Ala Ser Val Leu Lys Gln

420 425 430

Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu

435 440 445

Glu Ser Leu Val Ala Tyr Ile Ser Ser Leu

450 455

<210> 28

<211> 1377

<212> DNA

<213> 甜叶菊

<400> 28

atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60

ccagttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctccaaagga 120

ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180

ttcactttca gattcatcct cgacaacgac ccacaagacg tacgcatttc caatctaccg 240

actcatggtc cgctcactgt tatgcggatt ctgattatca acgaacacgg agctgacgaa 300

ttacaacgcg aactggaact gttgatgtta gcttctgaag aagatggaga ggtatcgtgt 360

ttaatcaccg atcagatttg gtacttcacg caatctgttg ctgacagtct taacctccga 420

cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480

tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540

gggtttccta tgctgaaagt gaaagatatc aagtgtggtt tttcgatgtg gaaacaaggc 600

aaagagatat tcgagaacat tacgaaacaa acaaaagcat cttcaggagt catctggaac 660

tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720

agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780

gatcgaaccg tttttccatg gttagaccaa caaccgtcac gttcggtact gtatgttagt 840

tttggtagtg ctactgaagt ggatgcgaaa gatttcttgg aaatagctcg tgggttggtt 900

gatagcaagc agtcgttttt atgggtggtt cgacctggtt ttgtcaaggg ttcgacgtgg 960

gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttccg 1020

cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080

tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggcttt tgcgttcgat 1140

caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200

gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260

ggatacatta gacagaatgc aagtgttttg aaacaaaagg cagatgtttc tttgatgaag 1320

ggtggttcgt cttacgaatc attagagtct ctagttgctt acatttcatc gttgtaa 1377

<210> 29

<211> 424

<212> PRT

<213> 甜叶菊

<400> 29

Met Leu Gln Leu Ala Thr Tyr Leu His Ser Gln Gly Ile Ser Ile Thr

1 5 10 15

Ile Ala Gln Tyr Pro Asn Phe Asn Ser Pro Asp Ser Ser Asn His Pro

20 25 30

Glu Leu Thr Phe Leu Pro Leu Ser Ser Gly Asn Leu Ser Val Ala Asp

35 40 45

Ile Ser Gly Gly Phe Phe Lys Phe Ile Gln Thr Leu Asn His Asn Cys

50 55 60

Lys Pro His Phe Arg Glu Tyr Leu Val Gln Asn Met Ser Ser Asp Asp

65 70 75 80

Lys Glu Ser Ile Val Ile Ile Arg Asp Asn Leu Met Phe Phe Ala Gly

85 90 95

Glu Ile Ala Gly Glu Leu Gly Leu Pro Ser Ile Ile Leu Arg Gly Ser

100 105 110

Asn Ala Val Met Leu Thr Ala Ser Asp Ile Ile Pro Gln Leu His Gln

115 120 125

Glu Gly Arg Phe Pro Pro Pro Asp Ser Leu Leu Gln Glu Thr Ile Pro

130 135 140

Glu Leu Val Pro Phe Arg Tyr Lys Asp Leu Pro Phe Ile Gly Tyr Pro

145 150 155 160

Ile His Gln Thr Leu Glu Phe Ser Ile Thr Met Met Thr Pro Lys Ser

165 170 175

Pro Ala Ser Ala Ile Leu Ile Asn Thr Leu Glu Phe Leu Glu Gln Ser

180 185 190

Ala Leu Thr Gln Ile Arg Asp His Tyr Lys Val Pro Val Phe Thr Ile

195 200 205

Gly Pro Leu His Lys Ile Val Thr Thr Arg Ser Thr Ser Ile Leu Glu

210 215 220

Glu Asp Thr Ser Cys Ile Asn Trp Leu Asp Lys Gln Ser Pro Lys Ser

225 230 235 240

Val Val Tyr Val Ser Leu Gly Ser Leu Ala Lys Leu Asp Glu Lys Val

245 250 255

Ala Ser Glu Met Ala Cys Gly Leu Ala Met Ser Asn His Lys Phe Leu

260 265 270

Trp Val Val Arg Pro Gly Met Val His Gly Phe Glu Trp Val Glu Phe

275 280 285

Leu Pro Asp Ser Leu Val Gly Glu Met Lys Ala Arg Gly Leu Ile Val

290 295 300

Lys Trp Ala Pro Gln Thr Thr Val Leu Ala His Asn Ala Val Gly Gly

305 310 315 320

Phe Trp Ser His Cys Gly Trp Asn Ser Thr Ile Glu Cys Leu Ala Glu

325 330 335

Gly Val Pro Met Met Cys Gln Pro Phe Phe Ala Asp Gln Leu Leu Asn

340 345 350

Ala Arg Tyr Val Ser Asp Val Trp Lys Thr Gly Phe Glu Ile Val Ile

355 360 365

Glu Lys Gly Glu Ile Ala Cys Ala Ile Lys Arg Val Leu Val Asp Glu

370 375 380

Glu Gly Glu Glu Met Arg Gln Arg Ala Met Glu Ile Lys Glu Lys Val

385 390 395 400

Lys Ile Ala Ile Asn Asp Gly Gly Ser Ser Tyr Asp Ser Phe Lys Asp

405 410 415

Leu Val Ala Phe Ile Ser Ser Leu

420

<210> 30

<211> 1275

<212> DNA

<213> 甜叶菊

<400> 30

atgcttcagc ttgcaactta cctccattct caagggattt caataaccat cgctcagtac 60

cccaacttca actcgccgga ttcttccaac catccagaac taaccttcct cccactatcc 120

tccggcaact tatccgtcgc cgacatctcc ggcggctttt tcaagttcat ccaaactctt 180

aaccataact gcaaacccca tttccgggaa taccttgttc agaacatgag ttctgatgat 240

aaggaatcaa tcgttatcat ccgtgataat ctcatgtttt tcgccggaga aatcgccggc 300

gagctgggtc tgccttcgat cattttacgt ggcagcaatg ctgtcatgtt gactgctagc 360

gacatcatcc ctcaacttca tcaagaaggt cgttttccgc caccagattc tttgttgcag 420

gaaacaattc cagaactggt tccattcaga tacaaagatc taccatttat tggctatcca 480

atacatcaaa cccttgaatt tagtatcacc atgatgaccc ccaaatcacc tgcttccgcc 540

attcttatca acaccctcga atttcttgaa caatcggcat taacccagat ccgtgatcat 600

tacaaagttc cagtttttac aatcggacca ttgcacaaaa tagtcacaac tcgttccact 660

agcattcttg aagaagatac aagttgcatc aattggttag ataaacaatc acccaaatca 720

gtggtttatg tgagtttagg aagcttagca aagttggatg aaaaggttgc atctgaaatg 780

gcatgtggtt tagccatgag taaccataag ttcctatggg tggttcgacc cggtatggtt 840

catgggtttg aatgggtcga gtttttgccg gatagtttgg tgggtgaaat gaaggctaga 900

ggtttgattg tgaaatgggc accccagacg acggttttgg cgcataacgc ggttggtgga 960

ttttggagtc attgcggttg gaactcgacc atagaatgct tagctgaagg ggtcccgatg 1020

atgtgtcaac cgttttttgc tgatcagttg ttgaatgcta ggtatgtgag tgatgtttgg 1080

aagacgggtt ttgagattgt tatcgagaaa ggtgagattg cgtgcgcgat taaacgagtt 1140

ttggtggatg aagaaggcga agaaatgagg cagagagcta tggagattaa agaaaaggtt 1200

aaaattgcaa tcaacgatgg tggttcttct tatgactcgt tcaaggactt ggtggcgttt 1260

atttcatcac tctaa 1275

<210> 31

<211> 485

<212> PRT

<213> 甜叶菊

<400> 31

Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser

1 5 10 15

Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro

20 25 30

Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Gln Leu Ser Lys Leu

35 40 45

Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn

50 55 60

Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln

65 70 75 80

Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr

85 90 95

Thr Asp Val His Pro Glu Asp Ile Gln Tyr Leu Lys Lys Ala Val Asp

100 105 110

Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp

115 120 125

Trp Ile Ile Tyr Asp Phe Thr His Tyr Trp Leu Pro Ser Ile Ala Ala

130 135 140

Ser Leu Gly Ile Ser Arg Ala Tyr Phe Cys Val Ile Thr Pro Trp Thr

145 150 155 160

Ile Ala Tyr Leu Ala Pro Ser Ser Asp Ala Met Ile Asn Asp Ser Asp

165 170 175

Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro

180 185 190

Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Met Glu

195 200 205

Pro Tyr Glu Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Met Val

210 215 220

Phe Lys Gly Ser Asp Cys Leu Leu Phe Lys Cys Tyr His Glu Phe Gly

225 230 235 240

Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val

245 250 255

Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu

260 265 270

Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser

275 280 285

Val Val Tyr Val Ala Leu Gly Ser Glu Ala Leu Val Ser Gln Thr Glu

290 295 300

Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val

305 310 315 320

Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu

325 330 335

Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp

340 345 350

Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys

355 360 365

Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met

370 375 380

Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Cys Asp Gln Pro Leu

385 390 395 400

Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg

405 410 415

Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu

420 425 430

Arg Ser Val Val Val Glu Asn Glu Gly Glu Ile Tyr Lys Ala Asn Ala

435 440 445

Arg Ala Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr

450 455 460

Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala

465 470 475 480

Ile Asp His Glu Ser

485

<210> 32

<211> 1458

<212> DNA

<213> 甜叶菊

<220>

<400> 32

atgtacaacg ttacttatca tcaaaattca aaagcaatgg ctaccagtga ctccatagtt 60

gacgaccgta agcagcttca tgttgcgacg ttcccatggc ttgctttcgg tcacatcctc 120

cctttccttc agctttcgaa attgatagct gaaaagggtc acaaagtctc gtttctttct 180

accaccagaa acattcaacg tctctcttct catatctcgc cactcataaa tgttgttcaa 240

ctcacacttc cacgtgtcca agagctgccg gaggatgcag aggcgaccac tgacgtccac 300

cctgaagata ttcaatatct caagaaggct gttgatggtc ttcaaccgga ggtcacccgg 360

tttctagaac aacactctcc ggactggatt atttatgatt ttactcacta ctggttgcca 420

tccatcgcgg ctagcctcgg tatctcacga gcctacttct gcgtcatcac tccatggacc 480

attgcttatt tggcaccctc atctgacgcc atgataaatg attcagatgg tcgaaccacg 540

gttgaggatc tcacgacacc gcccaagtgg tttccctttc cgaccaaagt atgctggcgg 600

aagcatgatc ttgcccgaat ggagccttac gaagctccgg ggatatctga tggataccgt 660

atggggatgg tttttaaggg atctgattgt ttgcttttca aatgttacca tgagtttgga 720

actcaatggc tacctctttt ggagacacta caccaagtac cggtggttcc ggtgggatta 780

ctgccgccgg aaatacccgg agacgagaaa gatgaaacat gggtgtcaat caagaaatgg 840

ctcgatggta aacaaaaagg cagtgtggtg tacgttgcat taggaagcga ggctttggtg 900

agccaaaccg aggttgttga gttagcattg ggtctcgagc tttctgggtt gccatttgtt 960

tgggcttata gaaaaccaaa aggtcccgcg aagtcagact cggtggagtt gccagacggg 1020

ttcgtggaac gaactcgtga ccgtgggttg gtctggacga gttgggcacc tcagttacga 1080

atactgagcc acgagtcagt ttgtggtttc ttgactcatt gtggttctgg atcaattgtg 1140

gaagggctaa tgtttggtca ccctctaatc atgctaccga ttttttgtga ccaacctctg 1200

aatgctcgat tactggagga caaacaggtg ggaatcgaga taccaagaaa tgaggaagat 1260

ggttgcttga ccaaggagtc ggttgctaga tcactgaggt ccgttgttgt ggaaaacgaa 1320

ggggagatct acaaggcgaa cgcgagggcg ctgagtaaaa tctataacga cactaaggtg 1380

gaaaaagaat atgtaagcca attcgtagac tatttggaaa agaatgcgcg tgcggttgcc 1440

atcgatcatg agagttaa 1458

<210> 33

<211> 473

<212> PRT

<213> 甜叶菊

<400> 33

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val

1 5 10 15

Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln

20 25 30

Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp

245 250 255

Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys

260 265 270

Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val

435 440 445

Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 34

<211> 1422

<212> DNA

<213> 甜叶菊

<400> 34

atggccacat ctgactctat cgttgatgac agaaaacaat tgcatgttgc tactttccca 60

tggttggcct ttggacacat tctgccctac ttgcaattgt caaagctgat tgcagaaaaa 120

ggtcataagg tgtccttttt gtctaccaca agaaacatcc agagactaag ttctcatatt 180

tctccattga ttaatgtggt tcagttgacc ttgcctagag tccaagaact tcccgaagac 240

gcagaagcta ctactgatgt tcaccctgaa gatatcccat atctaaagaa ggcatctgat 300

ggacttcaac cagaagtaac caggtttttg gagcagcaca gtcctgactg gattatctat 360

gattatactc attactggct tccatccatc gcagctagtc taggcatttc cagagctcat 420

ttctctgtca ctaccccatg ggcaattgca tatatgggtc cttctgctga tgcaatgatc 480

aacggttctg atggtaggac cactgttgaa gatttaacta cacctccaaa gtggttccca 540

tttcctacta aagtttgttg gcgaaaacac gatctggcac gtttggtccc atataaggct 600

ccaggtatct ccgatggata tcgaatgggt ctggtgctaa agggttctga ttgtctgtta 660

tctaagtgtt accacgaatt tggaactcaa tggcttcctc tattagagac tctgcatcaa 720

gttccagttg ttcctgtcgg tctgctacca cctgaaattc ccggtgacga aaaggacgaa 780

acttgggttt ccataaaaaa atggctggat ggtaagcaga agggtagtgt tgtatatgtc 840

gctttaggct ccgaggtttt ggtatcccag actgaagttg tggaacttgc cttaggattg 900

gagttgtccg gtttgccatt cgtctgggca tatagaaagc caaagggacc agctaagtca 960

gactcagttg aattgccaga tggtttcgta gaaaggacaa gagacagagg attggtttgg 1020

acatcatggg ccccacaatt gagaattctg agtcatgaaa gtgtgtgtgg attcttgact 1080

cactgtggct ctggcagtat tgttgaagga ctgatgtttg gacacccact gataatgttg 1140

ccaatcttcg gtgaccaacc tctgaatgca agattgctgg aggataaaca agttggtatc 1200

gaaatcccaa gaaacgagga agacggctgc ctgactaagg aatcagttgc acgtagttta 1260

agatctgtag ttgttgaaaa agaaggtgaa atatataagg ctaacgctag agaactttca 1320

aagatataca atgataccaa ggtggagaaa gaatatgttt cacagtttgt ggactatttg 1380

gagaaaaacg ctagagccgt tgctatcgat cacgaatcat ag 1422

Claims

1.一种生产大麻素糖苷的方法，其包括在一种或多种UGT76G1或UGT76G1样葡糖基转移酶的存在下，将大麻素糖苷配基受体与一种或多种糖供体一起孵育，其中所述大麻素糖苷配基受体选自：

并且其中大麻素糖苷具有式(I)或为VB104：

其中

R'是H、β-D-吡喃葡萄糖基或3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基；并且

A为：

其中G是H、β-D-吡喃葡萄糖基、3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基或β-D-吡喃葡萄糖基-(1→3)-β-D-吡喃葡萄糖基-(1→3)-D-吡喃葡萄糖基；

其中当A为

时，

所述大麻素糖苷选自:

并且其中当A为

时，

所述大麻素糖苷选自:

2.根据权利要求1所述的方法，其中所述一种或多种糖基转移酶还包含Os03g0702000或Os03g0702000样葡糖基转移酶。

3.根据权利要求1至2中任一项所述的方法，其中所述一种或多种糖供体选自由以下组成的组：UDP-葡萄糖、UDP-葡萄糖醛酸、UDP-甘露糖、UDP-果糖、UDP-木糖、UDP-鼠李糖、UDP-氟代脱氧葡萄糖及其组合。

4.根据权利要求3所述的方法，其中所述糖供体是UDP-葡萄糖。

5.一种生产大麻素糖苷的方法，其包括在允许糖基化的条件下，在UGT76G1或UGT76G1样葡糖基转移酶的存在下，将大麻素糖苷配基受体与UDP-葡萄糖一起孵育，其中所述大麻素糖苷配基受体选自：

并且其中大麻素糖苷具有式(I)或为VB104：

其中

A为：

其中当A为

时，

所述大麻素糖苷选自:

并且其中当A为

时，

所述大麻素糖苷选自: