[go: up one dir, main page]

CN105008528A - 用于合成手性胺的工程化的生物催化剂和方法 - Google Patents

用于合成手性胺的工程化的生物催化剂和方法 Download PDF

Info

Publication number
CN105008528A
CN105008528A CN201380073649.XA CN201380073649A CN105008528A CN 105008528 A CN105008528 A CN 105008528A CN 201380073649 A CN201380073649 A CN 201380073649A CN 105008528 A CN105008528 A CN 105008528A
Authority
CN
China
Prior art keywords
optionally substituted
alkyl
polypeptide
engineered
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380073649.XA
Other languages
English (en)
Inventor
邓永琳
海伦·谢
范森
德里克·史密斯
史蒂文·J·科利尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Priority to CN202511020229.6A priority Critical patent/CN120829884A/zh
Publication of CN105008528A publication Critical patent/CN105008528A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P15/00Preparation of compounds containing at least three condensed carbocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/188Heterocyclic compound containing in the condensed system at least one hetero ring having nitrogen atoms and oxygen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Nitrogen Condensed Heterocyclic Rings (AREA)
  • Low-Molecular Organic Synthesis Reactions Using Catalysts (AREA)

Abstract

本公开内容提供了用于生成胺的工程化的转氨酶多肽、编码工程化的转氨酶的多核苷酸、能够表达工程化的转氨酶的宿主细胞、和使用工程化的转氨酶来制备可用于生产活性药剂的化合物的方法。

Description

用于合成手性胺的工程化的生物催化剂和方法
本申请要求于2012年12月21日提交的共同待审的美国临时申请系列号61/745,219的优先权,为了所有的目的将其全文并入本文。
1.技术领域
本公开内容涉及转氨酶生物催化剂和使用该生物催化剂用于制备手性胺的方法。
2.对序列表、表格或计算机程序的引用
序列表的正式复本作为ASCII格式化文本文件与说明书经EFS-Web同时被提交,具有文件名“CX2-126USP1_ST25.txt”,创建日期2012年12月21日,且大小为606,099千字节。经EFS-Web提交的序列表是说明书的一部分且通过引用全部并入本文。
3.背景
转氨酶(E.C.2.6.1)催化来自氨基供体底物的伯胺的氨基、一对电子和质子向氨基受体分子的羰基转移,如在方案1中显示的。
方案1
将氨基受体化合物(I)(其是期望的手性胺产物(III)的前体)与氨基供体化合物(II)反应。转氨酶催化氨基供体(II)的氨基转移至氨基受体(I)的酮基团。反应产生期望的手性胺产物化合物(III)和作为副产物的具有酮基的新的氨基受体化合物(IV)。
具有催化方案1的反应的能力的野生型转氨酶已从多种微生物分离,所述微生物包括但不局限于反消化产碱菌(Alcaligenes denitrificans)、支气管炎博德特菌(Bordetella bronchiseptica)、副百日咳博多氏杆菌(Bordetellaparapertussis)、羊布鲁氏杆菌(Brucella melitensis)、鼻疽伯克霍尔德氏菌(Burkholderia malle)、类鼻疽伯克霍尔德氏菌(Burkholderia pseudomallei)、青紫色素杆菌(Chromobacterium violaceum)、Oceanicola granulosusHTCC2516、海洋杆菌属(Oceanobacter sp.)RED65、海洋螺菌属(Oceanospirillum sp.)MED92、恶臭假单胞菌(Pseudomonas putida)、青枯雷尔氏菌(Ralstonia solanacearum)、苜蓿根瘤菌(Rhizobium meliloti)、根瘤菌属(Rhizobium sp.)(菌株NGR234)、苏云金芽孢杆菌(Bacillus thuringensis)、肺炎克雷伯菌(Klebsiella pneumonia)和河流弧菌(Vibrio fluvialis)(参见例如Shin等人,2001,Biosci.Biotechnol,Biochem.65:1782-1788)。这些野生型转氨酶基因中的几个以及编码的多肽已被测序,包括例如青枯雷尔氏菌(Genbank登录号YP_002257813.1、GI:207739420)、类鼻疽伯克霍尔德氏菌1710b(Genbank登录号ABA47738.1、GI:76578263)、百日咳博多氏杆菌(Bordetella petrii)(Genbank登录号AM902716.1、GI:163258032)和河流弧菌(Genbank登录号AEA39183.1、GI:327207066)。EC 2.6.1.18和EC 2.6.1-19类的两种野生型转氨酶已经被结晶和结构地表征(参见例如Yonaha等人,1983,Agric.Biol.Chem.47(10):2257-2265)。
来自河流弧菌JS17的野生型转氨酶是ω-氨基酸:丙酮酸转氨酶(E.C.2.6.1.18),其使用5'-磷酸吡哆醛作为辅因子来催化方案2的反应。
方案2
还已经报道来自河流弧菌的这种野生型转氨酶显示针对不具有羧基的脂肪族氨基供体的催化活性。
手性胺化合物作为中间体或合成子常被用在制药、农业化学和化学工业中,用于制备多种药物,诸如头孢菌素或吡咯烷衍生物。手性胺化合物的这些工业应用的许多涉及仅利用一种特定的光学活性形式,例如只有(R)或(S)对映异构体是生理学活性的。转氨酶具有潜在的工业用途,用于立体选择性合成光学纯的手性胺化合物,诸如在氨基酸的对映异构体富集中(参见,例如Shin等人,2001,Biosci.Biotechnol.Biochem.65:1782-1788;Iwasaki等人,2003,Biotech.Lett.25:1843-1846;Iwasaki等人,2004,Appl.Microb.Biotech.69:499-505;Yun等人,2004,Appl.Environ.Microbiol.70:2529-2534;和Hwang等人,2004,Enzyme Microbiol.Technol.34:429-426)。使用转氨酶的其他实例包括制备普瑞巴林的中间体和前体(例如,WO2008/127646);环巴胺类似物的酶促转氨作用(例如,WO 2011/017551);β-氨基酸的立体定向合成和对映异构体富集(例如,WO 2005/005633);胺的对映异构体富集(例如美国专利号US 4,950,606;美国专利号5,300,437;和美国专利号5,169,780);以及氨基酸和衍生物的生成(例如美国专利号5,316,943;美国专利号4,518,692;美国专利号4,826,766;美国专利号6,197,558;和美国专利号4,600,692)。
但是,用来催化用于制备手性胺化合物的反应的转氨酶可具有不宜于商业应用的性质,诸如对工业上有用的工艺条件(例如,溶剂、温度)的不稳定性和有限的底物识别。因此,对可在用于制备光学活性形式的手性胺化合物的工业方法中使用的其他类型的转氨酶生物催化剂存在需求。
4.概述
本公开内容提供了具有转氨酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法和使用该多肽用于酮底物向胺产物的生物催化转化的方法。具有本公开内容的转氨酶活性的多肽已被工程化为与之前工程化的转氨酶多肽(氨基酸序列SEQ ID NO:2)相比具有一个或更多个残基差异,与河流弧菌的野生型转氨酶相比具有增强的溶剂和热稳定性。氨基酸残基差异位于影响多种酶性质的残基位置,所述酶性质除了其他以外,包括活性、立体选择性、稳定性、表达和产物耐受性。特别地,本公开内容的工程化的转氨酶多肽已被工程化用于化合物(2)的示例性大环巴胺类似物酮化合物向其对应的化合物(1)的手性胺产物化合物的高效转化,如在方案3中显示的。
方案3
本公开内容的工程化的转氨酶多肽的演化的结构特征还允许一些大的酮底物化合物(除了化合物(2)之外)诸如式(II)的环巴胺类似物、藜芦胺类似物和类固醇类似物向其相应的式(I)的手性胺产物化合物的转化,如在方案4中显示的。
方案4
其中化合物的环A-D可如以下被取代:
环A为6元碳环,任选地在位置2和3之间和/或在位置5和6之间包含不饱和C-C键,和/或任选地用选自卤素、羟基和甲基的基团独立地取代位置2、3、4、5和6;
环B为6元碳环,任选地在位置5和10之间包含不饱和C-C键,和/或任选地在位置9和10中的一个或更多个处用选自卤素、羟基和甲基的基团独立地取代;
环C为5-或6-元碳环(即,m=0或1),任选地在位置10处用选自卤素、羟基、甲基、乙基和羰基的基团取代;环D为5-、6-或7-元碳环(即n=0、1或2),任选地包含1、2或3个不饱和C-C键,和/或任选地如以下被独立地取代:
在位置14处用选自卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、直链或支链的(C1-C3)烷基氨基和桥接至位置12的环丙基的基团独立地取代;
在位置15或位置16处用选自以下的基团独立地取代:卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳基氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基。
因此,本文公开的工程化的多肽除了其他以外展示了在式(II)的大的前手性酮底物化合物向相应的式(I)的手性胺产物化合物的转化中的增加的活性、高的立体选择性、增加的溶剂和热稳定性、以及增加的产物耐受性。
相应地,在一方面,本公开内容提供了一种工程化的肽,所述工程化的肽具有转氨酶活性,其中工程化的多肽包含与SEQ ID NO:2具有至少80%同一性、并且与SEQ ID NO:2相比具有在选自X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450的残基位置处的一个或更多个残基差异的氨基酸序列,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。在一些实施方案中,在残基位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的残基差异选自X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。
在具有转氨酶活性的工程化的多肽的一些实施方案中,氨基酸序列包含与SEQ ID NO:2相比选自X34A、X56A、X88H、X107G、X113L、X147H、X153C、X155V、X233V、X315G、X316N、X383I和X450S的至少一个或更多个残基差异。在一些实施方案中,氨基酸序列还包含选自X31M、X57F/L、X86N/S、X153A、X233T、X323T、X383V和X417T的一个或更多个残基差异。
在具有转氨酶活性的工程化的多肽的一些实施方案中,氨基酸序列包含至少一个与SEQ ID NO:2相比的包含以下的残基差异的组合:X34A、X56A、X57L、X86S、X88A;X153C、X155V、X163F、X315G和X417T。在一些实施方案中,氨基酸序列还包含残基差异X316N。在一些实施方案中,氨基酸序列还包含残基差异X316N和选自X31M、X57F、X323T、X383I/T、X415H和X450S的一个或更多个残基差异。
在具有转氨酶活性的工程化的多肽的一些实施方案中,氨基酸序列包含与SEQ ID NO:2相比的残基差异X34A、X56A、X57L、X86S、X88A;X153C、X155V、X163F、X315G、X316N和X417T,并且还包含选自以下的残基差异的组合:(a)X31M、X57F、X323T和X383V;(b)X31M、X57F、X107G、X113L、X233T、X415H和X450S;(c)X31M、X57F、X233V、X323T、X383I、X415H和X450S;以及(d)X31M、X57F、X147H、X323T、X383I、X415H和X450S。
在具有转氨酶活性的工程化的多肽的一些实施方案中,工程化的多肽与SEQ ID NO:4的多肽相比具有至少1.2倍增加的稳定性,其中氨基酸序列包含与SEQ ID NO:2相比选自以下的一个或更多个残基差异:X34T、X107G、X113L、X147H、X155V、X233T/V、X323T、X383I/V和X450S。
在具有转氨酶活性的工程化的多肽的一些实施方案中,工程化的多肽与SEQ ID NO:4的多肽相比在将化合物(2)转化成化合物(1)方面具有至少1.2倍增加的活性,其中氨基酸序列包含与SEQ ID NO:2相比选自以下的一个或更多个残基差异:X56A、X86S、X88H、X153C、X415H和X417T。
在具有转氨酶活性的工程化的多肽的一些实施方案中,工程化的多肽与SEQ ID NO:4的多肽相比在将化合物(2)转化成化合物(1)方面具有增加的对映体选择性,其中氨基酸序列包含与SEQ ID NO:2相比选自以下的一个或更多个残基差异:X57F、X153C和X316N。
在具有转氨酶活性的工程化的多肽的一些实施方案中,氨基酸序列还包含与SEQ ID NO:2相比选自以下的残基差异:X18A、X19W、X21H、X31M、X34A、X53M、X56A/C、X57C/F/L、X73R、X86C/N/S/Y、X88H/Y、X107G、X113C/L/P、X146L、X147H/K/V、X153A/C/V、X155A/V、X163L、X165F、X171Q、X178W、X190K、X206K、X228G、X233T/V、X235P、X244T、X251V、X259V、X268A、X277A、X286C/H、X312N、X314N、X315G、X316A/C/F/N/S/T、X317L、X319N、X323T、X358K、X366H、X383C/F/I/L/M/T/V、X395P、X399A、X414I、X415A/G/H/L/V、X417T/V、X424A、X426R、X427Y、X434T和X450S。
在具有转氨酶活性的工程化的多肽的一些实施方案中,氨基酸序列不包含与SEQ ID NO:2相比在位置X9、X45、X177、X211、X294、X324和X391处的残基差异。
在一些实施方案中,工程化的转氨酶多肽可在其他残基位置处具有另外的残基差异。在一些实施方案中,工程化的转氨酶可具有与SEQ ID NO:2相比的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45或1-50个另外的残基差异。在一些实施方案中,工程化的转氨酶可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45或50个另外的残基差异。在一些实施方案中,氨基酸序列另外地具有与SEQ ID NO:2相比的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24或25个残基差异。
在表2A和2B以及实施例中公开了掺入有残基差异、包含其多种组合并且具有改进的性能(例如,在合适的反应条件下在至少90%非对映异构体过量下能将化合物(2)转化成化合物(1))的示例性工程化的多肽。氨基酸序列在序列表中提供并且包括SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。
在另一个方面,本公开内容提供了编码具有转氨酶活性的工程化的多肽的多核苷酸,以及包含该多核苷酸的表达载体,以及能够表达编码工程化的多肽的多核苷酸的宿主细胞。示例性多核苷酸序列在通过引用并入本文的序列表中提供并且包括SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201和203。
在一些实施方案中,本公开内容还提供了制备工程化的转氨酶多肽的方法,其中该方法可包括在适于该多肽的表达的条件下培养能够表达编码工程化的转氨酶多肽的多核苷酸的宿主细胞。在一些实施方案中,用于制备工程化的转氨酶多肽的方法还可包括:(a)合成编码包含选自SEQ IDNO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204的氨基酸序列、并且与SEQ ID NO:2相比具有在选自X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450的残基位置处的一个或更多个残基差异的多肽的多核苷酸,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T;以及(b)表达由该多核苷酸编码的转氨酶多肽。如以上所述,在残基位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的残基差异可选自X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。如在详细描述中另外提供的,在多核苷酸的合成期间可掺入另外的变异以制备在表达的氨基酸序列中具有相应的差异的工程化的转氨酶。
工程化的转氨酶多肽的结构特征允许除了化合物(2)之外的大的前手性酮底物化合物向其相应的胺产物化合物的转化,任选地在一种手性胺产物超过另一种手性胺产物的立体异构体过量下。因此,本公开内容的另一个方面是使用工程化的转氨酶多肽以催化其中来自氨基供体的氨基被转移至氨基受体的反应的方法,其中该方法包括在适于将氨基受体转化成胺化合物的反应条件下在氨基供体(例如,异丙胺)存在下使本公开内容的工程化的转氨酶多肽与氨基受体(例如,酮底物化合物)接触。
因此,在一些实施方案中,本公开内容提供了用于制备式(I)的胺化合物的方法
其中环A、B、C和D为如以上限定的,
条件是式(I)的化合物不是化合物(1)
其中该方法包括在合适的反应条件下在氨基供体存在下使式(II)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D为如以上限定的。
在用于制备式(I)的胺化合物的方法的一些实施方案中,本公开内容提供了用于制备式(Ia)的化合物的方法
其中环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氧基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IIa)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ia)的化合物限定的。
在用于制备式(I)的胺化合物的方法的一些实施方案中,本公开内容提供了用于制备式(Ib)的化合物的方法
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键,或在位置12和14之间包含桥接的环丙基;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IIb)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ib)的化合物限定的。
在用于制备式(I)的胺化合物的方法的一些实施方案中,本公开内容提供了用于制备式(Ic)的化合物的方法
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D是芳香族的;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IIc)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ic)的化合物限定的。
在用于制备式(I)的胺化合物的方法的一些实施方案中,本公开内容提供了用于制备式(Id)的化合物的方法
其中
环A包含在位置2和3之间或在位置5和6之间的不饱和C-C键;
R1和R2独立地选自以下基团:氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳基氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基。
R3、R4和R5独立地选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基和直链或支链的(C1-C3)烷基氨基;并且
R6、R7和R8独立地选自氢、卤素、羟基和甲基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IId)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中R1、R2、R3、R4、R5、R6、R7和R8为如以上对式(Id)的化合物限定的。
在本公开内容的用于制备胺化合物的方法的一些实施方案中,转氨酶的立体选择性提供在非对映异构体过量下制备式(I)、式(Ia)、式(Ib)、式(Ic)和式(Id)的手性胺化合物。在一些实施方案中,该方法导致在至少90%、95%、96%、97%、98%、99%或更大的非对映异构体过量下形成式(I)、式(Ia)、式(Ib)、式(Ic)和式(Id)的手性胺化合物。
如本文提供的,可在一系列合适的反应条件下进行使用工程化的转氨酶的方法,所述合适的反应条件除了其他以外包括以下的范围:胺供体、pH、温度、缓冲液、溶剂系统、底物载量、多肽载量、辅因子载量、压力和反应时间。
在一些实施方案中,用于转氨过程的合适的反应条件可包括:(a)约5g/L至200g/L的底物载量;(b)约0.1g/L至50g/L的工程化的转氨酶多肽;(c)约0.1M至4M的异丙胺(IPM);(d)约0.1g/L至10g/L的磷酸吡哆醛(PLP)辅因子;(e)约6至9的pH;和(f)约30℃至60℃的温度。
在一些实施方案中,用于转氨过程的合适的反应条件可包括:(a)约10g/L至150g/L的底物载量;(b)约0.5g/L至20g/L的工程化的转氨酶多肽;(c)约0.1M至3M的异丙胺(IPM);(d)约0.1g/L至10g/L的磷酸吡哆醛(PLP)辅因子;(e)约0.05M至0.20M的TEA缓冲液;(f)约1%至约45%的DMSO;(g)约6至9的pH;和(h)约30℃至65℃的温度。
在一些实施方案中,用于转氨过程的合适的反应条件可包括:(a)约20g/L至100g/L的底物载量;(b)约1g/L至5g/L的工程化的转氨酶多肽;(c)约0.5M至2M的异丙胺(IPM);(d)约0.2g/L至2g/L的磷酸吡哆醛(PLP)辅因子;(e)约0.1M的TEA缓冲液;(f)约25%的DMSO;(e)约8的pH;和(f)约45℃至60℃的温度。
在以下的详细描述中进一步描述了关于工程化的转氨酶的选择、生物催化剂的制备、酶底物的选择、和用于执行方法的参数的指导。
5.详细描述
除非上下文明确另外指明,否则本说明书和所附权利要求书中使用单数形式“一个(a)”、“一种(an)”和“该(the)”包括复数指代物。因此,例如,提及“一种(a)多肽”包括多于一种的多肽。
类似地,“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”可互换使用,并且不意图是限制性的。
还要理解,当各种实施方案的描述使用术语“包含(comprising)”时,本领域技术人员将理解,在一些具体情况下,可选地,可以使用语言“基本由...组成”或“由...组成”来描述实施方案。
要理解,前述一般描述,包括附图和随后的详细描述,都仅是示例性和解释性的,并且不是本公开内容的限制。
本文使用的章节标题仅出于组织目的,而不被解释为限制所描述的主题。
5.1缩写
用于遗传地编码的氨基酸的缩写是常规的并如以下:
使用三字母缩写时,除非前面明确加有“L”或“D”,或从使用缩写的上下文明显,否则氨基酸可为关于α-碳(Cα)的L-构型或D-构型。例如,“Ala”表示丙氨酸而没有规定α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。使用一字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列作为一串一字母或三字母缩写(或其混合物)呈现时,序列根据常规约定以氨基(N)向羧基(C)的方向呈现。
用于遗传编码核苷的缩写是常规的且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非特定地描述,缩写的核苷酸可以是核糖核苷或2’-脱氧核糖核苷。核苷可以在个体基础上或在聚集体基础上被指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列作为一串一字母缩写呈现时,序列根据常规约定以5’向3’的方向呈现,且不显示磷酸。
5.2定义
关于本公开内容,除非另外明确定义,否则本文说明书中使用的技术术语和科学术语将具有本领域普通技术人员通常理解的含义。相应地,以下术语意图具有以下含义。
“蛋白”、“多肽”和“肽”在本文可互换使用,来表示由酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如,糖基化、磷酸化、脂质化、豆蔻酰化、泛素化等)。该定义包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物。
“多核苷酸”或“核酸”指被共价地连接在一起的两个或更多个核苷。多核苷酸可以完全地包含核糖核苷(即,RNA)、完全地包含2'-脱氧核糖核苷酸(即,DNA)或为核糖核苷和2'-脱氧核糖核苷的混合物。尽管核苷会通常地经由标准的磷酸二酯键连接在一起,多核苷酸可包含一个或更多个不标准的键合。多核苷酸可以是单链的或双链的,或可包含单链区域和双链区域两者。而且,虽然多核苷酸会通常地含有天然地存在的编码核糖碱基(即,腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),但是其可包含一种或更多种修饰的和/或合成的核糖碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。优选地,此类修饰的或合成的核糖碱基将是编码核糖碱基。
“氨基转移酶”和“转氨酶”在本文被可互换地使用来指具有将氨基(NH2)从伯胺转移至受体分子的羰基(C=O)的酶能力的多肽。如本文使用的转氨酶包括天然地存在的(野生型)转氨酶以及由人处理生成的非天然地存在的工程化的多肽。
“氨基受体”和“胺受体”、“酮底物”、“酮(keto)”和“酮(ketone)”在本文可互换地使用,来指从供体胺接收氨基的羰基(酮(keto)或酮(ketone))化合物。在一些实施方案中,氨基受体为以下通式的分子,
其中当Rα和Rβ中的每一个独立地使用时,其为烷基、环烷基、杂环烷基、芳基或杂芳基,其可以是未经取代的,或被一个或更多个酶促地可接受的基团取代的。Rα在结构或手性上可与Rβ相同或不同。在一些实施方案中,Rα和Rβ可一起形成环,该环是未经取代的、取代的,或与其他环稠合。氨基受体包括酮基羧酸和烷酮(酮)。典型的酮基羧酸是α-酮基羧酸如乙醛酸、丙酮酸、草酰乙酸等,以及这些酸的盐。氨基受体还包括通过其他酶或完整的细胞过程被转化成氨基受体的底物,如富马酸(其可被转化成草酰乙酸)、葡萄糖(其可被转化成丙酮酸)、乳酸盐、马来酸和其他。可使用的氨基受体包括,举例且不限于:3,4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、乙酰苯、3'-羟基乙酰苯、2-甲氧基-5-氟乙酰苯、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、1-(4-硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、1-(3-三氟甲基苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮(methoxyoxypropanone)、1-苯基丁-1-酮、1-(2,5-二甲氧基-4-甲基苯基)丁-2-酮、1-(4-羟基苯基)丁-3-酮、2-乙酰基萘、苯基丙酮酸、2-酮戊二酸和2-酮丁二酸,在可能的情况下包含(R)和(S)单一异构体两者。
“氨基供体”或“胺供体”是指向氨基受体提供氨基,因此变成羰基物质的氨基化合物。在一些实施方案中,氨基供体为以下通式的分子,
其中当Rε和Rδ中的每一个独立地使用时,其为烷基、环烷基、杂环烷基、芳基或杂芳基,其是未经取代的,或被一个或更多个酶促地非抑制的基团取代的。Rε在结构或手性上可与Rδ相同或不同。在一些实施方案中,Rε和Rδ可一起形成未取代的、取代的,或与其他环稠合的环。可以被使用的典型的氨基供体包括手性的和非手性的氨基酸,以及手性的和非手性的胺。可被使用的氨基供体,举例且不限于:异丙胺(也被称作2-氨基丙烷)、α-苯乙胺(也称作1-苯基乙胺)和其对映异构体(S)-1-苯基乙胺和(R)-1-苯基乙胺、2-氨基-4-苯基丁烷、甘氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸一钠、L-丙氨酸、D-丙氨酸、D,L-丙氨酸、L-天冬氨酸、L-赖氨酸、D,L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺(也被称作腐胺)、1,6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、l-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、l-苯基-2-氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、l-氨基-l-苯基丁烷、l-苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、l-苯基-3-氨基丁烷、1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、l-氨基-3-甲基环戊烷、l-氨基-2-甲基环己烷、l-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢萘、2-氨基四氢萘、2-氨基-5-甲氧基四氢萘和1-氨基茚满,在可能的情况下包括(R)和(S)单一异构体两者且包括胺的所有可能的盐。
“手性胺”指通式Rα-CH(NH2)-Rβ的胺且以其最广泛的意义在本文使用,包括多种不同和混合的官能类型的脂肪族和脂环化合物,特征在于与仲碳原子结合的伯氨基的存在,该仲碳原子除了氢原子之外,携带(i)形成手性环状结构的二价基团,或(ii)在结构或手性上互相不同的两种取代基(除了氢之外)。形成手性环状结构的二价基团包括,例如,2-甲基丁烷-1,4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。仲碳原子(以上的和Rβ)上的两个不同取代基还可非常广泛地变化,并包括烷基、芳烷基、芳基、卤素、羟基、低级烷基、低级烷氧基、低级烷基硫基、环烷基、羧基、烷氧羰基、氨基甲酰基、单-和二-(低级烷基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单-和二-(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰胺基、芳基甲酰胺基等,以及被以上取代的烷基、芳烷基或芳基。
“磷酸吡哆醛”、“PLP”、“5’-磷酸吡哆醛”、“PYP”和“P5P”在本文可互换地使用,来指在转氨酶反应中用作辅酶的化合物。在一些实施方案中,磷酸吡哆醛由结构1-(4'-甲酰基-3'-羟基-2'-甲基-5'-吡啶基)甲氧基膦酸定义,CAS编号是[54-47-7]。吡哆醛5’-磷酸可在体内由吡哆醇(也称为维生素B6)的磷酸化和氧化生成。在使用转氨酶的转氨反应中,氨基供体的胺基团被转移到辅酶以生成酮副产物,同时5’-磷酸吡哆醛被转化成磷酸吡哆胺。5’-磷酸吡哆醛通过与不同的酮化合物(氨基受体)反应而再生。胺基团从磷酸吡哆胺转移到氨基受体生成胺并再生辅酶。在一些实施方案中,5’-磷酸吡哆醛可以由维生素B6家族的其他成员代替,包括吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM),及其磷酸化对应物;磷酸吡哆醇(PNP)和磷酸吡哆胺(PMP)。
“编码序列”指编码蛋白的氨基酸序列的核酸的那部分(例如,基因)。
“天然地存在”或“野生型”指自然界中发现的形式。例如,天然地存在的或野生型的多肽或多核苷酸序列是可从自然界中的来源分离的、生物体中存在的且未通过人工操作有意地修饰的序列。
当提及例如细胞、核酸或多肽时使用的“重组的”或“工程化的”或“非天然存在的”指已以自然界中不存在的其他方式被修饰,或与其相同但由合成的材料和/或通过使用重组技术处理生成或衍生来的材料或与材料的天然或固有形式相对应的材料。非限制性实例包括,除了其他以外,表达在细胞的固有形式(非重组的)中未发现的基因或表达以不同的水平另外表达的固有基因的重组细胞。
“序列同一性百分比”和“同源性百分比”在本文被可互换地使用来指多核苷酸之间和多肽之间的对比,且通过在比较窗口上比较两个最佳地比对的序列来确定,其中多核苷酸或多肽序列在比较窗口中的部分与用于两个序列的最佳比对的参考序列相比可包含添加或缺失(即,空位)。百分比可通过以下来计算:确定在两序列中都存在的相同的核酸碱基或氨基酸残基的位置的数目来得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中的位置的总数,并将结果乘以100以得到序列同一性百分比。可选地,百分比可通过以下计算:确定在两序列中都存在的相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目来得到匹配的位置的数目,将匹配的位置数目除以比较窗口中位置的总数,并将该结果乘以100以得到序列同一性百分比。本领域技术人员领会,有许多可用的已确立的算法来比对两个序列。例如可通过Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法,通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444的搜索相似性方法,通过这些算法的计算机实现(GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)或通过直观检查(一般参见,Current Protocols in Molecular Biology,F.M.Ausubel等编著,Current Protocols,Greene Publishing Associates Inc.和JohnWiley&Sons,Inc.之间的合资企业,(1995年增刊)(Ausubel))来进行用于比较的最佳序列比对。适于确定序列同一性和序列相似性百分比的算法的实例是BLAST和BLAST 2.0算法,其分别地被描述于Altschul等人,1990,J.Mol.Biol.215:403-410和Altschul等人,1977,Nucleic Acids Res.3389-3402中。用于执行BLAST分析的软件是通过美国国家生物技术信息中心(National Center for Biotechnology Information)网站公开地可得的。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高得分序列对(HSP),所述短字当与数据库序列中相同长度的字比对时匹配或满足一些正值的阀值得分T。T被称作邻近字得分阈值(Altschul等人,同上)。这些最初的相邻字击中(hit)充当用于启动搜索的种子以寻找包含其的更长的HSP。然后使字击中沿着每个序列的两个方向延伸,直到可增加累积比对得分。对于核苷酸序列,使用参数M(对于匹配残基对的奖励得分;永远>0)和N(对于错配残基的惩罚得分;永远<0)来计算累积得分。对于氨基酸序列,得分矩阵被用来计算累积得分。当发生以下情况时在每个方向上的字击中的延伸停止:累积比对得分从其所达到的最大值下降了量X;由于一个或更多个负得分残基比对的累积,所以累积得分达到零或零以下;或者到达任一条序列的末端。BLAST算法参数W、T和X确定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字长(W)11、期望值(E)10、M=5、N=-4以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)3、期望值(E)10和BLOSUM62得分矩阵作为默认值(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA 89:10915)。序列比对和序列同一性%的示例性确定可使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用所提供的默认参数。
“参考序列”指用作序列比较的基础的限定的序列。参考序列可以是较大序列的子集,例如,全长基因或多肽序列的区段。一般而言,参考序列长度为至少20个核苷酸或氨基酸残基,长度至少25个残基,长度至少50个残基,或者核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包含在两种序列之间相似的序列(即,完整序列的一部分),且(2)可进一步包含在两种序列之间不同的序列,两种(或更多种)多核苷酸或多肽之间的序列比较通常地通过在“比较窗口”内比较两种多核苷酸或多肽的序列来进行,以鉴定和比较序列相似性的局部区域。在一些实施方案中,“参考序列”可基于一级氨基酸序列,其中参考序列是可在一级序列中具有一个或更多个变化的序列。例如,“在对应于X34的残基处具有丙氨酸的基于SEQ IDNO:2的参考序列”或X34A指其中在SEQ ID NO:2的X34处的相应残基(其是苏氨酸)已经被改变成丙氨酸的参考序列。
“比较窗口”指至少约20个连续核苷酸位置或者氨基酸残基的概念性片段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列相比较,并且其中比较窗口中的序列的部分可包含与参考序列相比20%或更少的添加或缺失(即,空位),用于两个序列的最佳比对。比较窗口可以比20个连续的残基更长,并且包括任选地30、40、50、100或更长的窗口。
“基本同一性”指跨至少20个残基位置的比较窗口、经常地跨至少30-50个残基的窗口,与参考序列相比具有至少80%序列同一性、至少85%同一性和89%至95%序列同一性、更通常地至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性百分比通过在比较窗口中将参考序列与包括参考序列的总计20%或更少的缺失或添加的序列进行比较来计算。在应用于多肽的特定实施方案中,术语“基本同一性”指两个多肽序列当诸如通过程序GAP或BESTFIT使用默认空位权重进行最优比对时共有至少80%的序列同一性、优选地至少89%序列同一性、至少95%序列同一性或更大(例如,99%序列同一性)。优选地,不相同的残基位置通过保守的氨基酸取代而不同。
当在给定的氨基酸或多核苷酸序列编号的上下文中使用时,“对应于”、“关于”或“相对于”指当给定的氨基酸或多核苷酸序列与参考序列相比时,指定的参考序列的残基编号。换言之,给定的聚合物的残基编号或残基位置是对于参考序列而不是通过给定的氨基酸或多核苷酸序列内的残基的实际编号位置来指定的。例如,可通过引入空位以优化两序列之间的残基匹配来使给定的氨基酸序列诸如工程化转氨酶的氨基酸序列与参考序列比对。在这些情况下,虽然存在空位,但是给定的氨基酸或多核苷酸序列中的残基编号是相对于已与其比对的参考序列做出的。
“氨基酸差异”或“残基差异”指在多肽序列的位置处的氨基酸残基相对于参考序列中的对应位置处的氨基酸残基的改变。在本文中氨基酸差异的位置通常地被称作“Xn”,其中n指在残基差异基于其的参考序列中的对应位置。例如,“与SEQ ID NO:2相比位置X34处的残基差异”指在对应于SEQ ID NO:2的位置34的多肽位置处氨基酸残基的改变。因此,如果SEQID NO:2的参考多肽在位置34处具有苏氨酸,那么“与SEQ ID NO:2相比在位置X34处的残基差异”是在对应于SEQ ID NO:2的位置34的多肽位置处的除了苏氨酸之外的任何残基的氨基酸取代。在本文的大多数实例中,在一位置处的特定的氨基酸残基差异被表示为“XnY”,其中如以上描述的“Xn”指定相对应的位置,并且“Y”为在工程化的多肽中发现的氨基酸的单字母标识符(即,与在参考多肽中的不同的残基)。在一些实施方案中,在于指定的残基位置中可出现多于一个氨基酸的情况中,可选的氨基酸可被列于XnY/Z形式中,其中Y和Z表示供选择的氨基酸残基。在一些实例中(例如,在表2A和2B中),本公开内容还提供了由惯例符号“AnB”表示的特定氨基酸差异,其中A为参考序列中残基的单字母标识符,“n”为参考序列中残基位置的编号,并B为工程化的多肽序列中残基取代的单字母标识符。另外,在一些实例中,本公开内容的多肽可包括相对于参考序列的一个或更多个氨基酸残基差异,其由相对于参考序列进行变化的特定位置的列表表示。
“保守氨基酸取代”指用具有相似侧链的不同的残基取代残基,并因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于,具有脂肪族侧链的氨基酸可用另一种脂肪族氨基酸例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸取代;具有羟基侧链的氨基酸用另一种具有羟基侧链的氨基酸例如丝氨酸和苏氨酸取代;具有芳香族侧链的氨基酸用另一种具有芳香族侧链的氨基酸例如苯丙氨酸、酪氨酸、色氨酸和组氨酸取代;具有碱性侧链的氨基酸用另一种具有碱性侧链的氨基酸例如赖氨酸和精氨酸取代;具有酸性侧链的氨基酸用另一种具有酸性侧链的氨基酸例如天冬氨酸或谷氨酸取代;并且疏水性氨基酸或亲水性氨基酸分别地用另一种疏水性氨基酸或亲水性氨基酸取代。在以下表1中提供了示例性的保守取代:
表1
“非保守取代”指用具有显著地不同的侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可利用限定的组之间而不是其之内的氨基酸,并且影响(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小的氨基酸取代芳香族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
“缺失”指通过从参考多肽移除一个或更多个氨基酸来修饰多肽。缺失可以包括移除1个或更多个氨基酸、2个或更多个氨基酸,5个或更多个氨基酸,10个或更多个氨基酸,15个或更多个氨基酸,或20个或更多个氨基酸,多达组成参考酶的氨基酸总数的10%,或多达组成参考酶的氨基酸总数的20%,同时保留工程化的转氨酶的酶活性和/或保留工程化的转氨酶的改进的性质。缺失可以针对多肽的内部部分和/或末端部分。在多种实施方案中,缺失可包括连续的区段或者可以是不连续的。
“插入”指通过从参考多肽添加一个或更多个氨基酸来修饰多肽。在一些实施方案中,改进的工程化的转氨酶包含一个或更多个氨基酸插入天然地存在的转氨酶多肽,以及一个或更多个氨基酸插入其他改进的转氨酶多肽。插入可在多肽的内部部分中,或插入到羧基或氨基末端。如本文所用的,插入包括本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或者被参考多肽中的一个或更多个氨基酸分隔。
如本文所用的“片段”指具有氨基-末端和/或羧基-末端缺失但其中剩余的氨基酸序列与序列中的相应位置相同的多肽。片段可以为至少14个氨基酸长、至少20个氨基酸长,至少50个氨基酸长或更长,以及多达全长转氨酶多肽、例如SEQ ID NO:2的参考工程化的转氨酶多肽的70%、80%、90%、95%、98%和99%。
“分离的多肽”指从天然地伴随的其他污染物例如蛋白、脂质和多核苷酸基本上分离的多肽。该术语包括已从其天然地存在的环境或表达系统(例如,宿主细胞或体外合成)移除或纯化的多肽。改进的转氨酶可以存在于细胞内、存在于细胞培养基中或者以诸如裂解物或分离的制品的多种形式制备。像这样,在一些实施方案中,改进的转氨酶可以是分离的多肽。
“基本上纯的多肽”指以下的组合物,其中多肽物类是存在的优势物类(即,在摩尔或重量基础上其比组合物中的任何其他个体大分子物类更丰富),并且当按摩尔或%重量计目标物类构成存在的大分子物类的至少约50%时通常地是基本上纯化的组合物。通常,基本上纯的转氨酶组合物将包括该组合物中存在的所有大分子物类的按摩尔或重量%计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,目标物类被纯化至基本上同质(即,污染物物类通过常规检测方法不能在组合物中被检测到),其中组合物基本上由单一的大分子物类组成。溶剂物类、小分子(<500道尔顿)和元素的离子物质不被认为是大分子物类。在一些实施方案中,分离的改进的转氨酶多肽是基本上纯的多肽组合物。
“立体选择性”指在化学或酶反应中一种立体异构体相对于另一种的优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种,或可以是完全的,其中仅形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映体选择性,一种对映异构体在两种对映异构体的和中的分数(通常被报告为百分比)。其通常可选地在本领域被报道为(通常作为百分比)根据式[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]计算的对映异构体过量(e.e.)。当立体异构体是非对映异构体时,立体选择性被称为非对映体选择性,一种非对映异构体在两种非对映异构体的混合物中的分数(通常被报告为百分比),通常被可选地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。
“高立体选择性”指能够以至少约85%立体异构体过量将底物例如化合物(2)转化成其对应的手性胺产物例如化合物(1)的化学或酶促反应。
“改进的酶性质”指与参考转氨酶相比显示任何酶性质的改进的转氨酶多肽。对于本文描述的工程化的转氨酶多肽,该比较一般是对野生型转氨酶作出的,虽然在一些实施方案中,参考转氨酶可以是另一种工程化的转氨酶。期望改进的酶性质包括,但不限于,酶活性(其可以底物的转化百分比的方式被表示)、热稳定性、溶剂稳定性、pH活性特征、辅因子需求、对抑制剂的耐受性(例如,底物或产物抑制)、和立体选择性(包括对映体选择性)。
“增强的酶活性”指工程化的转氨酶多肽的改进的性质,其可以被表示为与参考转氨酶相比,增强的比活性(例如生成的产物/时间/重量蛋白)或增加的底物向产物的转化百分比(例如在指定的时间段中使用指定的量的转氨酶,起始量的底物向产物的转化百分比)。确定酶活性的示例性方法在实施例中被提供。与酶活性相关的任何性质可以被影响,包括经典的酶性质Km、Vmax或kcat,其改变可导致增强的酶活性。酶活性的改进可以是相应的野生型转氨酶的酶活性的从约1.2倍,至多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更多倍于天然地存在的转氨酶或从其衍生所述转氨酶多肽的另外的工程化的转氨酶的酶活性。转氨酶活性可以通过标准测定的任何一种来测量,诸如通过监测反应物或产物的光谱光度测量性质的变化。在一些实施方案中,生成的产物的量可以通过高效液相色谱法(HPLC)分离结合UV吸光度或诸如用o-酞二醛(OPA)的衍生化后的荧光检测来测量。使用确定的酶制品、在设定条件下的确定的测定、和一种或更多种确定的底物进行酶活性的比较,如本文进一步详细地描述的。通常,当比较裂解物时,确定细胞数目和测定的蛋白的量,并使用相同的表达系统和相同的宿主细胞以使宿主细胞生成的和裂解物中存在的酶的量的变化最小化。
“转化”指底物向相应的产物的酶转化。“转化百分比”指在指定条件下在一段时间内被转化为产物的底物的百分比。因此,转氨酶多肽的“酶活性”或“活性”可被表示为底物向产物的“转化百分比”。
“热稳定的”指与野生型酶相比转氨酶多肽在暴露至升高的温度(例如40-80℃)之后保持相似的活性(例如多于60%至80%)持续一段时间(例如0.5-24小时)。
“溶剂稳定的”指与野生型酶相比转氨酶多肽在暴露于不同的浓度(例如5-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)之后保持相似的活性(多于例如60%至80%)持续一段时间(例如0.5-24小时)。
“热且溶剂稳定的”指热稳定的且溶剂稳定的转氨酶多肽。
本文使用的“严格杂交”指如下条件:在所述条件下核酸杂交体是稳定的。如本领域技术人员已知的,杂交体的稳定性反映在杂交体的解链温度(Tm)上。大体上,杂交体的稳定性是离子强度、温度、G/C含量和离液剂存在的函数。可使用预测解链温度的已知方法来计算多核苷酸的Tm值(参见例如Baldino等人,Methods Enzymology 168:761-777;Bolton等人,1962,Proc.Natl.Acad.Sci.USA 48:1390;Bresslauer等人,1986,Proc.Natl.Acad.Sci USA 83:8893-8897;Freier等人,1986,Proc.Natl.Acad.Sci USA83:9373-9377;Kierzek等人,Biochemistry 25:7840-7846;Rychlik等人,1990,Nucleic Acids Res 18:6409-6412(勘误,1991,Nucleic Acids Res 19:698);Sambrook等人,同上);Suggs等人,1981,In Developmental Biology UsingPurified Genes(Brown等人,编著),683-693页,Academic Press;和Wetmur,1991,Crit Rev Biochem Mol Biol 26:227-259。通过引用将所有的出版物并入本文)。在一些实施方案中,多核苷酸编码本文公开的多肽并且在限定条件下诸如在中度严格或高度严格条件下与编码本公开内容的工程化的转氨酶的序列的互补序列杂交。
“杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常地,杂交反应在较低严格性的条件下进行,随后是变化的但较高的严格性的洗涤。术语“中度严格杂交”指允许靶-DNA与互补的核酸结合的条件,所述互补的核酸具有与靶DNA约60%的同一性、优选地约75%的同一性、约85%的同一性,与靶-多核苷酸具有大于约90%的同一性。示例性中度严格条件是等同于在42℃下于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,接着在42℃下于0.2×SSPE、0.2%SDS中洗涤的条件。“高严格度杂交”通常指比对确定的多核苷酸序列的溶液条件下确定的热解链温度Tm低约10℃或更少的条件。在一些实施方案中,高严格度条件指允许仅那些在65℃下于0.018M NaCl中形成稳定的杂交体的核酸序列杂交的条件(即,如果杂交体在65℃下于0.018M NaCl中不稳定,其在如本文考虑的高严格度条件下将是不稳定的)。高严格度条件可被提供,例如通过在等同于在42℃下50%甲酰胺、5x Denhart溶液、5x SSPE、0.2%SDS中杂交,之后在65℃下0.1x SSPE和0.1%SDS中清洗的条件中杂交。另一高严格度的条件是在等同于以下的条件中杂交:在65℃下于包含0.1%(w:v)SDS的5X SSC中杂交并在65℃下于包含0.1%SDS的0.1x SSC中洗涤。其它高严格度杂交条件,以及中度严格条件是以上引用的参考文献中描述的。
“异源”多核苷酸指通过实验室技术引入宿主细胞的任何多核苷酸,并且包括从宿主细胞中移出、经历实验室操作、以及然后重新引入宿主细胞中的多核苷酸。
“密码子优化的”指将编码蛋白的多核苷酸的密码子改变为特定生物体中优先地使用的那些密码子,以使得所编码的蛋白在感兴趣的生物体中被有效地表达。尽管由于大多数氨基酸由称为“同义”密码子或“同义的”密码子的数个密码子代表而使遗传密码是简并的,但熟知的是特定生物体的密码子使用是非随机的且偏好特定的密码子三联体。对于给定的基因、共同功能或祖先来源的基因、高表达的蛋白对比低拷贝数的蛋白和生物体基因组的聚集蛋白编码区,该密码子使用偏好可能更高。在一些实施方案中,可对编码转氨酶的多核苷酸进行密码子优化,用于从为了表达而选择的宿主生物体优化生产。
“优选的、最佳的、高度密码子使用偏好密码子”可互换地指在蛋白编码区中比编码相同氨基酸的其他密码子以更高的频率使用的密码子。优选的密码子可根据在单基因、一组具有共同功能或起源的基因、高表达基因中的密码子使用,在整个生物体的聚集蛋白编码区中的密码子频率,在相关生物体中的聚集蛋白编码区中的密码子频率或其组合来确定。其频率随着基因表达的水平增加的密码子通常是用于表达的最佳密码子。已知多种方法用于确定具体生物体中的密码子频率(例如,密码子使用,相对同义的密码子使用)和密码子偏好,包括多变量分析,例如使用聚类分析或对应分析,以及基因中使用的密码子的有效数目(参见GCG CodonPreference,遗传学计算机工作组Wisconsin软件包(Genetics Computer Group WisconsinPackage);CodonW,John Peden,University of Nottingham;McInerney,J.O,1998,Bioinformatics 14:372-73;Stenico等人,1994,Nucleic Acids Res.222437-46;Wright,F.,1990,Gene 87:23-29)。对于越来越多的生物体,密码子使用表是可得的(参见例如Wada等人,1992,Nucleic Acids Res.20:2111-2118;Nakamura等人,2000,Nucl.Acids Res.28:292;Duret等人,同上;Henaut和Danchin,“Escherichia coli and Salmonella,”1996;Neidhardt等人编著,ASM Press,Washington D.C.,2047-2066页)。用于获得密码子使用的数据来源可以依赖于能够编码蛋白的任何可得的核苷酸序列。这些数据集包括事实上已知编码表达的蛋白(例如,编码序列-CDS的完全蛋白)、表达的序列标签(ESTS)、或基因组序列的预测的编码区域(参见例如,Mount,D.,Bioinformatics:Sequence and Genome Analysis,第8章,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E.C.,1996,Methods Enzymol.266:259-281;Tiwari等人,1997,Comput.Appl.Biosci.13:263-270)的核酸序列。
本文定义“控制序列”包括对于本公开内容的多核苷酸和/或多肽的表达必要或有利的所有组分。每个控制序列可以对于编码多肽的核酸序列是天然的或外来的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子、以及转录终止信号和翻译终止信号。控制序列可与接头一起被提供,以为了引入促进控制序列与编码多肽的核酸序列的编码区的连接的特定限制位点的目的。
“可操作地连接”在本文定义为以下的配置:其中控制序列被适当地置于(即,处于功能性关系)与感兴趣的多核苷酸有关的位置以使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码细胞外多肽或细胞内多肽的、与该宿主细胞同源或异源的基因获得。
“合适的反应条件”指生物催化反应溶液中的那些条件(例如,以下的范围:酶载量、底物载量、辅因子载量、温度、pH、缓冲液、共溶剂等):在该条件下本公开内容的转氨酶多肽能将底物化合物转化成产物化合物(例如,将化合物(2)转化成化合物(1))。示例性“合适的反应条件”在详细描述中被提供并且通过实施例被说明。
诸如在“化合物载量”或“酶载量”或“辅因子载量”中的“载量”指在反应开始时反应混合物中的化合物的浓度或量。
在生物催化剂介导的方法上下文中的“底物”指通过生物催化剂起作用的化合物或分子。例如,本文公开的方法中的工程化的转氨酶生物催化剂的示例性底物为化合物(2)。
在生物催化剂介导的方法上下文中的“产物”指生物催化剂作用所得的化合物或分子。例如,本文公开的方法中的工程化的转氨酶生物催化剂的示例性产物为化合物(1)。
“杂烷基”、“杂烯基”和“杂炔基”指如本文定义的其中碳原子中的一个或更多个各自独立地被相同或不同的杂原子或杂原子的基团替代的烷基、烯基和炔基。可替代碳原子的杂原子和/或杂原子的基团包括但不限于-O-、-S-、-S-O-、-NR-、-PH-、-S(O)-、-S(O)2-、-S(O)NR-、-S(O)2NR-等,包括其组合,其中每个R.独立选自氢、烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基和其他合适的取代基。
“芳基”指包含性地具有单个环(例如苯环)或多元的稠环(例如,萘基或蒽基)的从6至12个碳原子的不饱和芳香碳环基团。示例性芳基包括苯基、吡啶基、萘基等。
“芳基烷基”指用芳基取代的烷基,即,芳基-烷基-基团,优选地在烷基部分包含性地具有从1至6个碳原子以及在芳基部分包含性地具有从6至12个碳原子。此类芳基烷基通过苯基、萘基等来例证。
“芳烯基”指用芳基取代的烯基,即,芳基-烯基-基团,优选地在烯基部分包含性地具有从2至6个碳原子以及在芳基部分包含性地具有从6至12个碳原子。
“芳炔基”指用芳基取代的炔基,即,芳基-炔基-基团,优选地在炔基部分包含性地具有从2至6个碳原子以及在芳基部分包含性地具有从6至12个碳原子。
“环烷基”指包含性地具有单个环或多元的稠合环的从3至12个碳原子的环状的烷基,所述单个环或多元的稠合环可用从1至3个烷基任选地取代。示例性环烷基包括但不限于单个环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基等,或包括桥环系统的多元环结构,诸如金刚烷基等。
“环烷基烷基”指用环烷基取代的烷基,即,环烷基-烷基-基团,优选地在烷基部分包含性地具有从1至6个碳原子以及在环烷基部分包含性地具有从3至12个碳原子。此类环烷基烷基通过环丙基甲基、环己基乙基等来例证。
“环烷基烯基”指用环烷基取代的烯基,即,环烷基-烯基-基团,优选地在烯基部分包含性地具有从2至6个碳原子以及在环烷基部分包含性地具有从3至12个碳原子。
“环烷基炔基”指用环烷基取代的炔基,即,环烷基-炔基-基团,优选地在炔基部分包含性地具有从2至6个碳原子以及在环烷基部分包含性地具有从3至12个碳原子。
“氨基”指基团-NH2。取代的氨基指基团–NHRη、NRηRη和NRηRηRη,其中每个Rη独立地选自取代的或未取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚硫酰基、磺酰基等。典型的氨基包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“烷基氨基”指–NHRξ基团,其中Rξ为烷基、N-氧化物衍生物或其经保护的衍生物,例如,甲氨基、乙氨基、正-丙氨基、异-丙氨基、正-丁氨基、异-丁氨基、叔-丁氨基或甲氨基-N-氧化物等。
“芳基氨基”指-NHRλ,其中Rλ为芳基,其可被任选地取代。
“杂芳基氨基”指-NHRσ,其中Rσ为杂芳基,其可被任选地取代。
“氨基烷基”指其中用氨基替代氢原子中的一个或更多个的烷基,所述氨基包括取代的氨基。
“氧代”是指=O。
“氧基”指二价基团-O-,其可具有各种取代基以形成不同的氧基,包括醚和酯。
“烷氧基(alkoxy)”或“烷基氧基(alkyloxy)”在本文可互换地被使用来指基团–ORξ,其中Rξ为烷基,包括如本文也定义的任选地取代的烷基。
“芳基氧基”指–ORλ基团,其中Rλ为芳基,其可被任选地取代。
“杂芳基氧基”指其中Rσ为杂芳基,其可被任选地取代。
“羧基”指-COOH。
“羧烷基”指用羧基取代的烷基。
“羰基”指-C(O)-,其可具有多个取代基以形成不同的羰基,包括酸、酰基卤、醛、酰胺、酯和酮。
“烷基羰基”指–C(O)Rξ,其中Rξ为烷基,其可被任选地取代。
“芳基羰基”指–C(O)Rλ,其中Rλ为芳基,其可被任选地取代。
“杂芳基羰基”指其中Rσ为杂芳基,其可被任选地取代。
“烷基氧基羰基”指-C(O)ORξ,其中Rξ为烷基,其可被任选地取代。
“芳基氧基羰基”指-C(O)ORλ,其中Rλ为芳基,其可被任选地取代。
“杂芳基氧基羰基”指-C(O)ORσ,其中Rσ为杂芳基,其可被任选地取代。
“芳基烷氧基羰基”指-C(O)ORρ,其中Rρ为芳基-烷基-基团,其可被任选地取代。
“烷基羰基氧基”指–OC(O)-Rξ,其中R为烷基,其可被任选地取代。
“芳基羰基氧基”指–OC(O)Rλ,其中R为芳基,其可被任选地取代。
“杂芳基烷基氧基羰基”指-C(O)ORω,其中Rω为杂芳基烷基,其可被任选地取代。
“杂芳基羰基氧基”指–OC(O)Rσ,其中Rσ为杂芳基,其可被任选地取代。
“氨基羰基”指-C(O)NH2。取代的氨基羰基指–C(O)NRηRη,其中氨基NRηRη为如本文定义的。
“氨基羰基烷基”指用氨基羰基取代的烷基。
“卤素(halogen)”或“卤素(halo)”指氟代、氯代、溴代和碘代。
“卤代烷基”指用一个或更多个卤素取代的烷基。因此,术语“卤代烷基”意图包括单卤代烷基、二卤代烷基、三卤代烷基等,直至全卤代烷基。例如,表述“(C1-C2)卤代烷基”包括1-氟代甲基、二氟代甲基、三氟代甲基、1-氟代乙基、1,1-二氟代乙基、1,2-二氟代乙基、1,1,1-三氟代乙基、全氟代乙基等。
“羟基”指-OH。
“羟基烷基”指用一个或更多个羟基取代的烷基。
“氰基”指-CN。
“硝基”指–NO2
“硫基”或“硫烷基”指-SH。取代的硫基或硫烷基指–S-Rη,其中Rη为烷基、芳基或其它合适的取代基。
“烷基硫基”指–SRξ,其中Rξ为烷基,其可被任选地取代。典型的烷基硫基包括但不限于,甲基硫基、乙基硫基、正丙基硫基等。
“芳基硫基”指–SRλ,其中Rλ为烷基,其可被任选地取代。典型的芳基硫基包括但不限于苯硫基、(4-甲苯基)硫基、吡啶基硫基等。
“杂芳基硫基”指-SRσ,其中Rσ为杂芳基,其可被任选地取代。
“磺酰基”指–SO2。取代的磺酰基指–SO2-Rη,其中Rη为烷基、芳基或其它合适的取代基。
“烷基磺酰基”指–SO2-Rξ,其中Rξ为烷基,其可被任选地取代。典型的烷基磺酰基包括但不限于,甲基磺酰基、乙基磺酰基、正丙基磺酰基等。
“芳基磺酰基”指–SO2-Rλ,其中Rλ为芳基,其可被任选地取代。典型的芳基磺酰基包括但不限于苯基磺酰基、(4-甲苯基)磺酰基、吡啶基磺酰基等。
“杂芳基磺酰基”指-SO2-Rσ,其中Rσ为杂芳基,其可被任选地取代。
“亚磺酰基”指–SO-。取代的亚磺酰基指–SO-Rη,其中Rη为烷基、芳基或其它合适的取代基。
“烷基亚磺酰基”指–SO-Rξ,其中Rξ为烷基,其可被任选地取代。典型的烷基亚磺酰基包括但不限于,甲基亚磺酰基、乙基亚磺酰基、正丙基亚磺酰基等。
“芳基亚磺酰基”指–SO-Rλ,其中Rλ为芳基,其可被任选地取代。典型的芳基亚磺酰基包括但不限于苯基亚磺酰基、(4-甲苯基)亚磺酰基、吡啶基亚磺酰基等。
“杂芳基亚磺酰基”指其中Rσ为杂芳基,其可被任选地取代。
“烷基氨基磺酰基烷基”指用烷基-NH-SO2-基团取代的烷基。
“芳基磺酰基烷基”指用芳基-SO2-基团取代的烷基。
“杂芳基磺酰基烷基”指用杂芳基-SO2-基团取代的烷基。
“氨基磺酰基”指-SO2NH2。取代的氨基磺酰基指-SO2NRδRδ,其中氨基-NRηRη为如本文定义的。
“杂芳基”指包含性地在环内的1至10个碳原子以及包含性地选自氧、氮和硫的1至4个杂原子的芳香族杂环基团。此类杂芳基可具有单个环(例如吡啶基或呋喃基)或多元的稠环(例如吲哚嗪基或苯并噻吩基)。
“杂芳基烷基”指用杂芳基取代的烷基,即,杂芳基-烷基-基团,优选地在烷基部分包含性地具有从1至6个碳原子并且在杂芳基部分包含性地具有从5至12个环原子。此类杂芳基烷基通过吡啶基甲基等来例证。
“杂芳基烯基”指用杂芳基取代的烯基,即,杂芳基-烯基-基团,优选地在烯基部分包含性地具有从2至6个碳原子并且在杂芳基部分包含性地具有从5至12个环原子。
“杂芳基炔基”指用杂芳基取代的炔基,即,杂芳基-炔基-基团,优选地在炔基部分包含性地具有从2至6个碳原子并且在杂芳基部分包含性地具有从5至12个环原子。
“杂环”、“杂环的”和可互换的“杂环烷基”指具有单个环或多元的稠环的饱和或不饱和的基团,环内包含性地具有2至10个碳环原子以及包含性地选自氮、硫或氧的1至4个杂环原子。此类杂环基团可具有单个环(例如哌啶基或四氢呋喃基)或多元的稠环(例如二氢吲哚基、二氢苯并呋喃或哌嗪基或奎宁环基)。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲哚嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪、异喹啉、喹啉、酞嗪、萘基吡啶、喹喔啉、喹唑啉、噌啉、喋啶、咔唑、咔啉、菲啶、吖啶、菲咯啉、异噻唑、吩嗪、异噁唑、吩噁嗪、吩噻嗪、咪唑啉啶、咪唑啉、哌啶、哌嗪、吡咯烷、吲哚啉等。
“杂环烷基烷基”指用杂环烷基取代的烷基,即,杂环烷基-烷基-基团,优选地在烷基部分包含性地具有1至6个碳原子并且在杂环烷基部分包含性地具有3至12个环原子。
“杂环烷基烯基”指用杂环烷基取代的烯基,即,杂环烷基-烯基-基团,优选地在烯基部分包含性地具有2至6个碳原子并且在杂环烷基部分包含性地具有3至12个环原子。
“杂环烷基炔基”指用杂环烷基取代的炔基,即,杂环烷基-炔基-基团,优选地在炔基部分包含性地具有2至6个碳原子并且在杂环烷基部分包含性地具有3至12个环原子。
“离去基团”通常指在化学反应中能被另一个原子或部分替代的任何原子或部分。更具体地,离去基团指被亲核体(例如,胺、硫醇、醇或氰化物)容易地替代和取代的原子或部分。此类离去基团是被熟知的并且包括羧酸盐、N-羟基丁二酰亚胺(“NHS”)、N-羟基苯并三唑、卤素(氟、氯、溴或碘)和烷氧基。离去基团的非限制性特征和实例例如在Organic Chemistry,第二版,Francis Carey(1992),328-331页;Introduction to Organic Chemistry,第二版,Andrew Streitwieser and Clayton Heathcock(1981),169-171页;和Organic Chemistry,第五版,John McMurry,Brooks/Cole Publishing(2000),398和408页中可发现;通过引用将其所有并入本文。
除非另外规定,在前述基团中被氢占据的位置可用以下基团进一步取代,例如但不限于:羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、取代的烷氧基、三氟甲氧基、卤代烷氧基、氟代、氯代、溴代、碘代、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、取代的烷基、三氟甲基、卤代烷基、羟烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、羧基酰氨基(carboxamido)、取代的羧基氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰基酰氨基、取代的磺酰基酰氨基、氰基、氨基、取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰氨基、脒基、酰氨基脒基、羟基酰胺基(hydroxamoyl)、苯基、芳基、取代的芳基、芳基氧基、芳基烷基、芳烯基、芳炔基、吡啶基、咪唑基、杂芳基、取代的杂芳基、杂芳基氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环基、(杂环基)氧基和(杂环基)烷基;并且优选的杂原子为氧、氮和硫。要理解,当开放(open)的价存在于这些取代基上时,其可用烷基、环烷基、芳基、杂芳基和/或杂环基进一步取代,当这些开放的价存在于碳上时,其可被卤素以及被结合氧、氮、或硫的取代基进一步取代,并且当多个此类开放的价存在时,这些基团可通过直接形成键或通过与新杂原子形成键而被连接形成环,所述新杂原子优选地为氧、氮或硫。还要理解,可进行以上取代的条件是,用取代基替代氢不向本公开内容的分子引入不可接受的不稳定性,并且在其他方面是化学上合理的。
“任选的”或“任选地”意思是,随后地描述的事件或情况可发生或可不发生,并且该描述包括其中该事件或情况发生的实例和其中该事件或情况不发生的实例。本领域普通技术人员会理解,对于被描述为包含一个或更多个任选的取代基的任何分子,只有空间上实用的和/或合成上可行的化合物意图被包括。“任选地取代的”指在化学基团的术语或系列中所有随后的修饰语。例如,在术语“任选地取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可被或可不被取代,并且对于系列“任选地取代的烷基、环烷基、芳基和杂芳基”,该烷基、环烷基、芳基和杂芳基彼此独立地可被或可不被取代。
“保护基团”指当附接至分子中的反应性的官能团时掩蔽、降低或阻止官能团的反应性的一组原子。通常,保护基团可被选择性地移除,如在合成过程期间所期望的。保护基团的实例在Wuts和Greene,“Greene’sProtective Groups in Organic Synthesis”,第四版,Wiley Interscience(2006),和Harrison等人,Compendium of Synthetic Organic Methods,1-8卷,1971-1996,John Wiley&Sons,NY中可找到。可具有保护基团的官能团包括但不限于羟基、氨基和羧基。代表性的氨基保护基团包括但不限于甲酰基、乙酰基、三氟乙酰基、苄基、苄基氧基羰基(“CBZ”)、叔丁氧基羰基(“Boc”)、三甲基甲硅烷基(“TMS”)、2-三甲基甲硅烷基-乙烷磺酰基(“SES”)、三苯甲基和取代的三苯甲基、烯丙基氧基羰基、9-芴基甲氧基羰基(“FMOC”)、硝基-藜芦基氧基羰基(“NVOC”)等。
如本文使用的“多元醇”指含有多个羟基的化合物。对于聚合物,多元醇包括具有羟基官能团的聚合物。示例性聚合多元醇包括例如但不限于聚醚和聚酯,例如聚乙二醇、聚丙二醇、聚(四亚甲基)二醇和聚四氢呋喃.
5.3工程化的转氨酶多肽
本公开内容提供了具有转氨酶活性的工程化的多肽、编码所述多肽的多核苷酸、和使用所述多肽的方法。当前述说明涉及多肽时,要理解其还描述了编码所述多肽的多核苷酸.
转氨酶,也被称为氨基转移酶,催化氨基从氨基供体底物的伯胺转移至氨基受体分子的羰基(例如,酮基或醛基)。已从多种微生物鉴定出转氨酶,所述微生物包括但不局限于反消化产碱菌、支气管炎博德特菌、副百日咳博多氏杆菌、羊布鲁氏杆菌、鼻疽伯克霍尔德氏菌、类鼻疽伯克霍尔德氏菌、青紫色素杆菌、Oceanicola granulosus HTCC2516、海洋杆菌属RED65、海洋螺菌属MED92、恶臭假单胞菌、青枯雷尔氏菌、苜蓿根瘤菌、根瘤菌属(菌株NGR234)、苏云金芽孢杆菌、肺炎克雷伯菌和河流弧菌(参见例如Shin等人,2001,Biosci.Biotechnol,Biochem.65:1782-1788)。
通过利用转氨酶以立体定向的方式进行反应的能力,即,优先将一种对映异构体转化成对应的酮,从而生成富含另一种对映异构体的混合物,转氨酶可用于外消旋胺的手性拆分(参见例如Koselewski等人,2009,OrgLett.11(21):4810-2)。在酮向对应的胺的转化中转氨酶的立体选择性还使这些酶在从对应的酮化合物不对称合成光学上纯的胺中是有用的(参见例如等人,“Biocatalytic Routes to Optically Active Amines,”Chem CatChem 1(1):42–51;Zua和Hua,2009,Biotechnol J.4(10):1420-31)。
来自河流弧菌的野生型ω-转氨酶ω-VfT对于某些手性胺的(S)-对映异构体表现出高的对映体选择性并且对手性芳香族胺具有底物特异性(参见例如Shin和Kim,2002,J.Org.Chem.67:2848-2853)。ω-VfT的高对映体选择性已经被应用到胺的手性拆分(参见例如Yun,等人,2004,Biotechnol.Bioeng.87:772–778;Shin和Kim,1997,Biotechnol.Bioeng.55:348–358;M.等人,2008,Adv.Synth.Catal.350:802–807)。ω-VfT转氨酶还已被用在使用前手性的酮底物不对称合成光学上纯的胺中。但是,在手性胺的不对称合成中这种转氨酶的使用被以下限制:逆反应的不利平衡(参见例如Shin和Kim,1999,Biotechnol.Bioeng.65,206–211);手性胺产物的抑制(参见例如Shin等人,2001,Biotechnol Bioeng 73:179–187;Yun和Kim,2008,Biosci.Biotechnol.Biochem.72(11):3030-3033);对具有大侧链的胺受体的低活性,所述大侧链诸如芳香族基团(参见例如Shin和Kim,2002,J.Org.Chem.67:2848-2853);和低的酶稳定性(参见例如Yun和Kim,同上)。
从河流弧菌的ω-VfT转氨酶衍生的变体转氨酶已被报道对脂肪族酮具有增加的耐受(参见例如Yun等人,2005,Appl Environ Micriobiol.71(8):4220–4224)以及扩大的氨基供体底物特异性(参见例如,Cho等人,2008,Biotechnol Bioeng.99(2):275-84)。专利公布WO2010081053和US20100209981(通过引用将其每个在此并入本文)描述了对于在手性胺化合物的合成中使用来讲具有改进的性质的衍生自ω-VfT的工程化的转氨酶,所述改进的性质包括增加的对温度和/或有机溶剂的稳定性,和增加的对结构上不同的氨基受体分子的酶活性。专利公布WO2011159910(通过引用将其在此并入本文)描述了为了将底物3'-羟基乙酰苯对映体选择性地转化成产物(S)-3-(1-氨乙基)-苯酚优化的衍生自ω-VfT的工程化的转氨酶。
本公开内容涉及衍生自在专利公布WO2010081053中公开的先前工程化的转氨酶的工程化的转氨酶多肽。本公开内容的工程化的转氨酶已用氨基酸残基取代工程化,其允许特别大的氨基受体化合物底物转化成相应的手性胺化合物产物。
显著地,本公开内容以这些特别大的氨基受体底物鉴定了工程化的转氨酶多肽中能增加酶活性、立体异构选择性、稳定性、和对产物抑制的不应性的氨基酸残基位置和对应的氨基酸残基取代。
通过使定向进化方法来工程化本公开内容的工程化的转氨酶多肽中的特定残基位置和取代的鉴定,所述定向进化方法使用基于结构的理性序列文库设计和使用基于化合物的示例性大的底物胺受体的前手性酮基团转化为其相应的手性胺产物的活性测定来筛选改进的功能性质。特别地,化合物(2)的环巴胺类似物化合物的酮转化成相应的化合物(1)的手性胺化合物,如在方案3中显示的。
方案3
在合适的反应条件下,在氨基供体的存在下,并且在非对映异构体过量下(即,在手性胺中心具有相反的对映异构体的其它非对映异构体过量下),本公开内容的工程化的转氨酶多肽进化为将示例性底物化合物(2)的酮有效地转化成示例性产物化合物(1)的相应手性胺。
本公开内容的工程化的转氨酶多肽的特定结构特征和结构-功能相关信息还允许工程化的转氨酶多肽进行将除了化合物(2)之外的大的前手性酮底物化合物转化成除了化合物(1)之外的手性胺化合物。在一些实施方案中,本公开内容的工程化的转氨酶多肽能将为化合物(2)的结构类似物的大的前手性酮底物化合物转化成为化合物(1)的结构类似物的相应的手性胺产物化合物。能使用由本公开内容提供的工程化的转氨酶多肽经受催化转化的大的酮底物结构类似物化合物的范围通过方案4中所显示的式(II)的化合物转化为式(I)的化合物来说明。
方案4
如在方案4中显示的,式(II)的大的底物酮化合物具有如下结构:所述结构包含四个环,在环A的位置1处具有被转化成手性胺的前手性酮基。环A和B为6元碳环,在位置2-10中的一处或更多处被任选地独立地取代;环C为5-或6-元碳环(即,m=0或1),在位置11处被任选地取代;并且环D为5-、6-或7-元碳环(即,n=0、1或2),在位置14、15和16处被任选地独立地取代。本公开内容的工程化的转氨酶多肽的结构特征能适应在环D的位置14、15和16处具有取代的大的基团的式(II)的底物化合物,同时保持将式(II)的化合物在环A的位置1处的酮立体选择性的转化成手性胺的活性。不被理论束缚,本公开内容的工程化的转氨酶多肽的结构允许在环D的位置14、15和16处的大的基团被取代以延伸至酶周围的溶剂,同时使环A的位置1处的酮保持在活性位点的适当位置,以用于立体选择性的转氨基作用。另外,本公开内容的工程化的转氨酶多肽的结合袋(binding pocket)允许在环A、B和C上的某些位置处(如以下进一步描述的)的较小的基团的取代,同时保持将式(II)的化合物的环A的位置1处的酮立体选择性的转化成手性胺的活性。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能将式(II)的酮底物化合物转化成式(I)的相应的手性胺化合物,其中化合物的环A-D可如以下被取代:
环A为6元碳环,任选地在位置2和3之间和/或在位置5和6之间的包含不饱和C-C键,和/或任选地用选自卤素、羟基和甲基的基团独立地取代的位置2、3、4、5和6;
环B为6元碳环,任选地在位置5和10之间包含不饱和C-C键,和/或任选地在位置9和10中的一个或更多个处用选自卤素、羟基和甲基的基团独立地取代;
环C为5-或6-元碳环(即,m=0或1),任选地在位置10处用选自卤素、羟基、甲基、乙基和羰基的基团取代;
环D为5-、6-或7-元碳环(即n=0、1或2),任选地包含1、2或3个不饱和C-C键,和/或任选地如以下被独立地取代:
在位置14处用选自卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、直链或支链的(C1-C3)烷基氨基和桥接至位置12的环丙基的基团独立地取代;
在位置15或位置16处用选自以下的基团独立地取代:卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳基氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能转化为环巴胺类似物化合物的式(II)的酮底物化合物,所述环巴胺类似物化合物诸如式(IIa)的化合物,其中环C为5-元碳环,在位置11处被任选地取代,并且环D为7-元碳环,在位置16处被取代,其可被转化成式(Ia)的手性胺产物,如在方案5中显示的:
方案5
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能转化为环巴胺类似物化合物的式(II)的酮底物化合物,所述环巴胺类似物化合物诸如式(IIb)的化合物,其中环C为5-元碳环并且环D为6-元碳环,其可被转化成式(Ib)的手性胺产物,如在方案6中显示的:
方案6
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键,或在位置12和14之间包含桥接的环丙基;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能转化为藜芦胺类似物化合物的式(II)的酮底物化合物,所述藜芦胺类似物化合物诸如式(IIc)的化合物,其中环C为5-元碳环并且环D为6-元碳环,其可被转化成式(Ic)的手性胺产物,如在方案7中显示的:
方案7
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D是芳香族的;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基。
在一些实施方案中,在一些实施方案中,本公开内容的工程化的转氨酶多肽能转化为类固醇类似物化合物的式(II)的酮底物化合物,所述类固醇类似物化合物诸如式(IId)的化合物,其中环C为6-元碳环并且环D为5-元碳环,其可被转化成式(Id)的手性胺产物,如在方案8中显示的:
方案8
其中
环A在位置2和3之间或在位置5和6之间包含不饱和C-C键;
R1和R2独立地选自以下基团:氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基;
R3、R4和R5独立地选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基和直链或支链的(C1-C3)烷基氨基;并且
R6、R7和R8独立地选自氢、卤素、羟基和甲基。
适于将式(II)的大的酮底物化合物有效地转化成式(I)的手性胺产物化合物的工程化的转氨酶多肽与SEQ ID NO:2的参考工程化的转氨酶多肽的氨基酸序列相比具有一个或更多个残基差异。残基差异与酶特性的增强有关,所述酶特性包括酶促活性、酶稳定性和对产物胺抑制的耐受。
在一些实施方案中,与野生型或SEQ ID NO:4的参考工程化的转氨酶相比,工程化的转氨酶多肽显示出用相同量的酶在限定的时间内在非对映异构体过量下增强的将式(II)的底物化合物(例如,化合物(2))转化成式(I)的氨基产物化合物(例如,化合物(1))的活性。在一些实施方案中,在合适的反应条件下工程化的转氨酶多肽与由SEQ ID NO:4表示的参考工程化的多肽相比具有至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍或50倍或更多的活性。
在一些实施方案中,工程化的转氨酶多肽与野生型或参考工程化的酶相比具有对转化反应中使用的温度和/或溶剂增加的稳定性。在一些实施方案中,在合适的反应条件下工程化的转氨酶多肽与SEQ ID NO:4的参考多肽相比具有至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多的稳定性。
在一些实施方案中,工程化的转氨酶多肽与野生型或参考工程化的酶相比具有增加的对被化合物(1)的产物手性胺抑制的不应性或耐受性。在一些实施方案中,在合适的反应条件下工程化的转氨酶多肽与由SEQ IDNO:4表示的多肽相比具有至少1.2倍、1.5倍、2倍、3倍、4倍、5倍或更多倍增加的对化合物(1)的产物抑制的耐受性,如以下进一步描述的。
在一些实施方案中,在合适的反应条件下,工程化的转氨酶多肽能够以大于90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更大的非对映异构体过量下(即,超过在手性胺中心处具有相反的对映异构体的其他非对映异构体产物化合物)将化合物(2)的底物转化成化合物(1)。
在一些实施方案中,在合适的反应条件下,相对于SEQ ID NO:4的参考多肽,工程化的转氨酶多肽能够以增加的对底物的存在的耐受性将底物化合物(2)转化成产物化合物(1)。因此,在一些实施方案中,在合适的反应条件下,以至少约1g/L、约5g/L、约10g/L、约20g/L、约30g/L、约40g/L、约50g/L、约70g/L、约100g/L、约125g/L、约150g/L、约175g/L或约200g/L或更多的底物载量浓度,在约72h或更少、约48h或更少、约36h或更少或约24h或更少的反应时间内,工程化的转氨酶多肽能够以至少约至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约98%或至少约99%的转化百分比将底物化合物(2)转化成产物化合物(1)。
工程化的多肽的以上描述的改进的特性在其下执行转化的合适的反应条件,可关于多肽的浓度或量、底物、辅因子、缓冲液、共溶剂、pH和/或包括温度和反应时间的条件来确定,如在以下和在实施例中进一步描述的。
本公开内容提供了具有能将为化合物(2)的结构类似物的式(II)的大的前手性酮底物化合物转化成为化合物(1)的结构类似物的式(I)的相应的手性胺产物化合物的结构特征的200种示例性工程化的转氨酶多肽。本公开内容提供了200种示例性工程化的转氨酶多肽的序列结构,为附于该公开内容的电子序列表文件中的SEQ ID NO:5-204,通过引用在此将其并入本文。奇数序列标识(即SEQ ID NO)指编码由偶数SEQ ID NO提供的氨基酸序列的核苷酸序列。本公开内容还在表2A和2B中提供了将特定的氨基酸序列特征与工程化的转氨酶多肽的功能活性关联的序列结构信息。该结构-功能关联信息以相对于SEQ ID NO:2的参考工程化的多肽的特定氨基酸残基差异和SEQ ID NO:5-204的200种示例性工程化的转氨酶的相关的实验确定的活性数据的形式提供。氨基酸残基差异是基于与SEQ ID NO:2的参考序列的比较,其相对于野生型ω-VfT多肽(登录号:gi|327207066|gb|AEA39183.1|)的序列具有以下10个氨基酸残基差异:A9T;N45H;W57L;F86S;V153A;V177L;R211K;M294V;S324G和T391A。每种示例性工程化的转氨酶多肽的相对转氨酶活性被确定为在被用作初级筛选的高通量(HTP)测定中在一组时间段和温度下与SEQ ID NO:4的工程化的转氨酶多肽的转氨酶活性相比将化合物(2)的原型大的底物酮向化合物(1)的手性胺产物的转化。被用作活性参考的SEQ ID NO:4的工程化的转氨酶多肽相对于SEQ ID NO:2的参考序列具有以下8个氨基酸残基差异:T34A;L56A;R88H;A153C;A155V;K163F;E315G和L417T。按照如在表和实施例中记录的测定反应条件,使用每孔~200μL体积的96孔板中的大肠杆菌(E.coli.)透明细胞裂解物来确定表2A中的HTP活性测定值。
表2A:使用HTP制品的工程化的多肽和相对酶改进
在一些情形中,摇瓶粉末(SFP)和/或下游加工(DSP)粉末测定被用作第二筛选以评价示例性工程化的转氨酶多肽的特性,其结果提供于表2B中。SFP和DSP形式提供工程化的多肽的更纯的粉末制品。例如,SFP制品中的工程化的转氨酶为制品中总蛋白的大约30%,而DSP制品中的工程化的转氨酶为总蛋白的大约80%。通过比较两个不同温度55℃和60℃下的活性来进行稳定性的评价。
表2B:转氨酶多肽和使用摇瓶和DSP酶制品的工程化的相对改进
从氨基酸序列的检查,以及表2A和2B的200种示例性工程化的多肽的结果,增加的活性、对映体选择性和/或稳定性的改进的特性与和SEQ IDNO:4相比在以下残基位置处的一个或更多个残基差异有关:X18、X19、X21、X31、X34、X53、X56、X57、X73、X86、X88、X107、X113、X133、X147、X155、X163、X165、X171、X178、X190、X206、X228、X233、X235、X244、X251、X259、X268、X277、X286、X312、X314、X316、X317、X319、X323、X358、X366、X383、X395、X399、X414、X415、X417、X424、X426、X427、X434和X450。与改进的特性有关的这些位置中的每处的特定的氨基酸差异包括:X18A、X19W、X21H、X31M、X53M、X56A/C、X57C/F、X73R、X86C/N、X88H/Y、X107G、X113C/L/P、X146L、X147H/K/V、X153V、X155A、X163L、X165F、X171Q、X178W、X190K、X206K、X228G、X233T/V、X235P、X244T、X251V、X259V、X268A、X277A、X286C/H、X312N、X314N、X316A/C/F/N/S/T、X317L、X319N、X323T、X358K、X366H、X383C/F/I/L/M/T/V、X395P、X399A、X414I、X415A/G/H/L/V、X417V、X424A、X426R、X427Y、X434T和X450S。
在一些实施方案中,本公开内容的工程化的转氨酶多肽包含与SEQ IDNO:4表示的工程化的转氨酶相比具有在选自以下的残基位置处的残基差异的氨基酸序列:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。
在一些实施方案中,本公开内容的工程化的转氨酶多肽包含与SEQ IDNO:4表示的工程化的转氨酶相比具有在选自以下的残基位置处的残基差异的氨基酸序列:X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450。在一些实施方案中,在位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的特定氨基酸差异选自:X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。
与和SEQ ID NO:4相比在以上残基位置处的残基差异有关的特定的酶特性包括除了其他以外,酶活性和稳定性。与增加的酶稳定性有关的残基差异与残基位置X34、X107、X113、X147、X155、X233、X323、X383和X450处的残基差异,包括特定的残基差异X34T、X107G、X113L、X147H、X155V、X233T/V、X323T、X383I/V和X450S有关。与将式(II)的大的酮底物转化成相应的式(I)的手性胺化合物的增加的活性有关的残基差异与残基位置X56、X57、X86、X88、X153、X316、X415和X417处的残基差异,包括特定的残基差异X56A、X57F、X88H、X153C、X316N、X415H和X417T有关。特别地与对于式(II)的化合物诸如化合物(2)转化成式(I)的化合物诸如化合物(1)的增加的%ee有关的残基差异,包括X57F、X153C和X316N。
如熟练的技术人员将领会的,表2A和2B中公开的残基差异对工程化的转氨酶多肽的活性和/或对映体选择性无显著的有害影响,工程化的转氨酶多肽保持将化合物(2)转化成化合物(1)的转氨酶活性和对映体选择性(85%d.e.或更大)。几乎所有的多肽具有等于或大于95%de的对映体选择性。相应地,熟练技术人员将理解,在本文公开的残基位置的残基差异可单独地或以多种组合被使用来生成具有期望的功能特性的工程化的转氨酶多肽,所述期望的功能特性包括除了其他以外,在将式(II)的大的酮底物化合物转化成式(I)的手性胺化合物中的转氨酶活性、立体选择性和稳定性。
根据本文提供的指导,还预期,以下任何的示例性工程化的多肽可被用作起始氨基酸序列用于合成其他的工程化的转氨酶多肽:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204,例如通过随后的进化轮,所述进化轮通过添加来自表2A和2B中的其他多肽的多种氨基酸差异和本文描述的其他残基位置的新组合。另外的改进可通过在贯穿进化的前几轮已保持不改变的残基位置处包含氨基酸差异来生成。
相应地,在一些实施方案中,本公开内容提供了具有转氨酶活性,以及与SEQ ID NO:4的参考多肽相比在将酮底物化合物(2)转化成手性胺产物化合物(1)方面任选地改进的特性的工程化的多肽,其中所述多肽包含与参考序列SEQ ID NO:2具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性并且与SEQ ID NO:2相比具有在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。在一些实施方案中,在位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的特定氨基酸差异选自:X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。在一些实施方案中,工程化的转氨酶多肽能够以本文描述的改进的对映体选择性例如≥90%de将底物化合物(2)转化成产物化合物(1)。
在一些实施方案中,本公开内容的具有转氨酶活性的工程化的多肽包含与选自以下的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204、并且与SEQ ID NO:2相比具有在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。在一些实施方案中,在位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的特定氨基酸差异选自:X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。在一些实施方式中,参考序列选自SEQID NO:4、8、26、36、40、78、100、102、148、156、160、170、172、180和198。在一些实施方式中,参考序列为SEQ ID NO:4。在一些实施方式中,参考序列为SEQ ID NO:100。在一些实施方式中,参考序列为SEQID NO:148。在一些实施方式中,参考序列为SEQ ID NO:156。在一些实施方式中,参考序列为SEQ ID NO:160。在一些实施方式中,参考序列为SEQID NO:180。
在一些实施方案中,本公开内容的具有转氨酶活性的工程化的多肽包含与选自以下的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204、并且与SEQ ID NO:2相比具有至少以下的残基差异的组合的氨基酸序列:X34A、X56A、X57L、X86S、X88A;X153C、X155V、X163F、X315G和X417T。在一些实施方案中,具有转氨酶活性的工程化的多肽还包含选自以下的残基差异的组合:(a)X31M、X57F、X316N、X323T和X383V;(b)X31M、X57F、X107G、X113L、X233T、X316N、X415H和X450S;(c)X31M、X57F、X233V、X316N、X323T、X383I、X415H和X450S;以及(d)X31M、X57F、X147H、X316N、X323T、X383I、X415H和X450S。
如熟练的技术人员将领会的,在一些实施方案中,所选择的以上残基差异中的一个或其组合可被保留于工程化的转氨酶中作为核心序列(或特征),并且在其他的残基位置的另外的残基差异并入所述核心序列以生成具有改进的特性的另外的工程化的转氨酶多肽。因此要理解,对于包含以上的一个或一组残基差异的任何工程化的转氨酶,本公开内容涵盖包含一个或一组残基差异,以及在本文公开的其他残基位置处另外地包含一个或更多个残基差异的其他的工程化的转氨酶。例如但不限于,包含在残基位置X316处的残基差异的工程化的转氨酶还可以并入在其他残基位置处的一个或更多个残基差异,所述其他残基位置例如X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450。另一个实例是包含在残基位置X56处的残基差异的工程化的转氨酶,其还可包含在其他残基位置处的一个或更多个残基差异,所述其他残基位置例如X19、X21、X34、X53、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450。对于前述实施方案中的每一个,工程化的转氨酶还可包含选自以下的另外的残基差异:X18A、X19W、X21H、X31M、X53M、X56A/C、X57C/F、X73R、X86C/N、X88H/Y、X107G、X113C/L/P、X146L、X147H/K/V、X153V、X155A、X163L、X165F、X171Q、X178W、X190K、X206K、X228G、X233T/V、X235P、X244T、X251V、X259V、X268A、X277A、X286C/H、X312N、X314N、X316A/C/F/N/S/T、X317L、X319N、X323T、X358K、X366H、X383C/F/I/L/M/T/V、X395P、X399A、X414I、X415A/G/H/L/V、X417V、X424A、X426R、X427Y、X434T和X450S。
在一些实施方案中,工程化的转氨酶多肽能够以相对于SEQ ID NO:4的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的活性将底物化合物(2)转化成产物化合物(1)。在一些实施方案中,能够以相对于SEQ ID NO:4的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的活性将底物化合物(2)转化成产物化合物(1)的工程化的转氨酶多肽包含与SEQ ID NO:4相比具有选自以下的一个或更多个残基差异的氨基酸序列:X34T、X107G、X113L、X147H、X155V、X233T/V、X323T、X383I/V和X450S。
在一些实施方案中,能够以相对于SEQ ID NO:4的至少1.2倍的活性将底物化合物(2)转化成产物化合物(1)的工程化的转氨酶包含选自以下的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、78、82、84、86、88、92、94、96、98、100、102、104、106、108、110、112、114、116、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。
在一些实施方案中,工程化的转氨酶多肽与SEQ ID NO:4的参考工程化的转氨酶相比具有对转化反应中使用的温度和/或溶剂增加的稳定性。在一些实施方案中,工程化的转氨酶多肽具有至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍于SEQ ID NO:4的参考多肽的稳定性,如通过在相同的测定条件下在60℃下的相对活性相比于55℃下的活性来测量的。在一些实施方案中,与SEQ ID NO:4的多肽相比具有至少1.2倍增加的稳定性的工程化的转氨酶多肽包含与SEQ ID NO:2相比具有选自以下的一个或更多个残基差异的氨基酸序列:X34T、X107G、X113L、X147H、X155V、X233T/V、X323T、X383I/V和X450S。
在一些实施方案中,在表2B的反应条件B、C或D下在至少约20g/L的底物载量下在24h或更少的时间内,工程化的转氨酶多肽能将至少90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、或95%或更多的化合物(2)转化成化合物(1)。在一些实施方案中,在55℃下在至少约20g/L的底物载量下在24h或更少的时间内,工程化的转氨酶多肽能将至少90%或更多的化合物(2)转化成化合物(1)。在一些实施方案中,在55℃下在至少约20g/L的底物载量下在24h或更少的时间内,能够将至少90%或更多的化合物(2)转化成化合物(1)的工程化的转氨酶多肽包含选自以下的氨基酸序列:SEQ ID NO:8、26、40、148、156、160、170、172和180。
在一些实施方案中,具有转氨酶活性例如将底物化合物(2)转化成产物化合物(1)的本公开内容的工程化的转氨酶多肽具有包含选自以下的序列的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。
在一些实施方案中,具有转氨酶活性的工程化的转氨酶多肽包含与以下的一种具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204、并且与SEQ ID NO:2相比具有存在于以下的任何一种中的氨基酸残基差异的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204,如表2A和2B中提供的。
除了以上指定的残基位置之外,本文公开的任何的工程化的转氨酶多肽还可包含在其他残基位置处的相对于SEQ ID NO:2的其他残基差异,即除了X18、X19、X21、X31、X34、X53、X56、X57、X73、X86、X88、X107、X113、X133、X147、X155、X163、X165、X171、X178、X190、X206、X228、X233、X235、X244、X251、X259、X268、X277、X286、X312、X314、X316、X317、X319、X323、X358、X366、X383、X395、X399、X414、X415、X417、X424、X426、X427、X434和X450之外的残基位置。在这些其他的残基位置处的残基差异提供了氨基酸序列中的另外的变化,而不负面影响多肽进行转氨酶反应诸如将化合物(2)转化成化合物(1)的能力。相应地,在一些实施方案中,除了选自以下的工程化的转氨酶多肽中的任一种的氨基酸残基差异之外:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204,与SEQ ID NO:2相比序列还可在其他的氨基酸残基位置处包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45或1-50个残基差异。在一些实施方案中,与参考序列相比氨基酸残基差异的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45或50个残基位置。在这些其他位置的残基差异可包括保守变化或非保守变化。在一些实施方案中,与河流弧菌的野生型转氨酶多肽或SEQ ID NO:2的工程化的转氨酶多肽相比,残基差异可包含保守取代和非保守取代。
在专利公布WO2010081053、US20100209981和WO2011159910;Yun等人,2005,Appl Environ Micriobiol.,71(8):4220–4224);和Cho等人,2008,Biotechnol Bioeng.99(2):275-84中,对其他工程化的转氨酶多肽描述了相对于野生型河流弧菌或SEQ ID NO:2的参考序列在其他位置处的氨基酸残基差异以及这些差异对酶功能的影响;通过引用将其所有并入本文。相应地,在一些实施方案中,与SEQ ID NO:2的序列相比氨基酸差异中的一种或更多种还可在选自以下的残基位置处被引入本公开内容的工程化的转氨酶多肽中:X4、X6、X12、X18、X30、X44、X56、X81、X82、X85、X95、X112、X122、X127、X130、X157、X164、X166、X167、X174、X181、X208、X228、X253、X256、X272、X285、X286、X293、X297、X302、X311、X312、X316、X317、X319、X320、X321、X332、X385、X407、X408、X409、X415、X418、X431、X434、X438、X444和X446。具体地,前述位置处的氨基酸残基可选自以下:X4R/Q/L、X6R/I/N、X12A/G/K、X18A/V/L/I、X30A、X44A、X56V、X81D、X82H、X85A/S/V/T/N/C/G、X95T、X112I、X122E、X127L、X130G/M/A/V/L/I、X157T、X164N/Q/S/T/G/M/A/V/L/I、X166S、X167K/R、X174E/D、X181R、X208I、X228G/T、X253M、X256A、X272A、X285H、X286N/Q/S/T、X293N/Q/S/T、X297A、X302K、X311V、X312D/E、X316K/H/P、X317L/M/Y、X319Q/G/M/N/V、X320A/K、X321L/M/I、X332N/Q/S/T、X385R、X407S、X408A、X409G、X415M/L、X418V/N/Q/S/T、X431D、X434V、X438L、X444V和X446V。在引用的参考文献中可找到关于在这些残基位置处氨基酸残基的选择及其对期望的酶特性的影响的指导。
在一些实施方案中,本公开内容还提供了包含本文描述的任何工程化的多肽的片段的工程化的转氨酶多肽,所述工程化的多肽的片段保持工程化的转氨酶的功能活性和/或改进的特性。相应地,在一些实施方案中,本公开内容提供了具有转氨酶活性的多肽片段,所述转氨酶活性诸如在合适的反应条件下将化合物(2)转化成化合物(1),其中所述片段包含本公开内容的工程化的转氨酶多肽的全长氨基酸序列的至少约80%、90%、95%、96%、97%、98%或99%,所述本公开内容的工程化的转氨酶多肽诸如选自以下的示例性工程化的转氨酶多肽:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。
在一些实施方案中,工程化的转氨酶多肽可具有包含本文描述的工程化的转氨酶多肽中的任一种的缺失的氨基酸序列,所述本文描述的工程化的转氨酶多肽诸如以下的示例性工程化的多肽:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。因此,对于本公开内容的工程化的转氨酶多肽的各实施方案和每一个实施方案,氨基酸序列可包含一个或更多个氨基酸、2个或更多个氨基酸,3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达转氨酶多肽的氨基酸总数的10%、多达转氨酶多肽的氨基酸总数的10%、多达转氨酶多肽的氨基酸总数的20%、或多达转氨酶多肽的氨基酸总数的30%的缺失,其中本文描述的工程化的转氨酶的相关功能活性和/或改进的特性被保持。在一些实施方案中,缺失片段可包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45或1-50个氨基酸残基。在一些实施方案中,缺失片段的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45或50个氨基酸残基。在一些实施方案中,缺失片段可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24或25个氨基酸残基的缺失片段。
在一些实施方案中,本文的工程化的转氨酶多肽可具有包含与本文描述的工程化的转氨酶多肽中的任一种相比的插入片段的氨基酸序列,所述本文描述的工程化的转氨酶多肽诸如以下的示例性工程化的多肽:SEQ IDNO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。因此,对于本公开内容的转氨酶多肽的各实施方案和每个实施方案,插入片段可包含一个或更多个氨基酸、2个或更多个氨基酸,3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸、或50个或更多个氨基酸,其中本文描述的工程化的转氨酶的相关功能活性和/或改进的特性被保持。插入片段可以插入至转氨酶多肽的氨基末端或羧基末端、或中间部分。
在一些实施方案中,本文的工程化的转氨酶多肽可具有包含选自以下的序列以及任选地一个或几个(例如,多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。在一些实施方案中,氨基酸序列任选地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在一些实施方案中,本公开内容提供了具有转氨酶活性的工程化的转氨酶多肽,该多肽包含与选自以下的序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204,条件是氨基酸序列不同于(即,其排除)专利申请公布WO2010081053、US20100209981和WO2011159910;Yun等人,2005,Appl Environ Micriobiol.,71(8):4220–4224);和Cho等人,2008,Biotechnol Bioeng.99(2):275-84中公开的任何的示例性工程化的转氨酶多肽氨基酸序列;通过引用将其所有并入本文。
在以上实施方案中,工程化的多肽的合适的反应条件可以是在表2A和2B、实施例和本文的其他处描述的那些。
在一些实施方案中,本公开内容的多肽可以是融合多肽的形式,其中工程化的多肽诸如通过例如但不限于抗体标签(例如,myc表位)、纯化序列(例如,用于结合金属的His标签)和细胞定位信号(例如,分泌信号)的方式被融合至其他多肽。因此,本文描述的工程化的多肽可与其他多肽融合或不融合而使用。
要理解本文所述的多肽不局限于遗传编码的氨基酸。除了遗传编码的氨基酸之外,本文所述的多肽可以整体或部分包含自然存在的和/或合成的非编码氨基酸。本文描述的多肽可包含的某些通常遇见的非编码氨基酸包括但不局限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氯苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(InAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯丙氨酸(styrylkalanine)(sAla);蒽基丙氨酸(authrylalanine,aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);l,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌啶酸(PA),氮杂环丁基-3-羧酸(ACA);1-氨基环戊基-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu),高缬氨酸(hVal);高异亮氨酸(homoisolencine,hIle);高精氨酸(hArg);N-乙酰基赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。可被本文描述的多肽包括的另外的非编码氨基酸对本领域技术人员将是明显的(参见,例如在Fasman,1989,CRC PracticalHandbook of Biochemistry and Molecular Biology,CRC Press,Boca Raton,FL,pp.3-70和本文引用的参考文献中提供的多种氨基酸,通过引用将其所有并入)。这些氨基酸可为L-或D-构型。
本领域技术人员将理解,包含侧链保护基团的氨基酸或残基也可构成本文所述的多肽。在这一情形中属于芳香类的此类受保护氨基酸的非限制性实例包括(保护基团在括号中列出)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶氧硫基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可包含于本文描述的多肽中的构象受限的非编码氨基酸包括但不局限于N-甲基氨基酸(L-构型)、1-氨基环戊-(2或3)-烯-4-羧酸、哌可酸、吖丁啶-3-羧酸、高脯氨酸(hPro)和1-氨基环戊烷-3-羧酸。
在一些实施方案中,可在固体支持体上提供工程化的转氨酶多肽,所述固体支持体诸如膜、树脂、固体载体或其他固相材料。固体支持体可包括有机聚合物,诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧和聚丙烯酰胺,及其共聚物和接枝物。固体支持体还可以是无机的,诸如玻璃、二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或金属,所述金属诸如金或铂。固体支持体的构造可以是珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平的、大体上平的或不平的。固体支持体可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持体可以被配置为孔、凹陷或其他器皿、容器、特征或位置的形式。
在一些实施方案中,具有本公开内容的转氨酶活性的工程化的多肽可被固定在固体支持体上,以使得所述工程化的多肽保持其相对于SEQ IDNO:4的参考多肽的改进的活性、立体选择性和/或其他改进的特性。在此类实施方案中,固定的多肽可利于式(II)的底物化合物或其他合适的底物向式(I)的产物化合物或相应的产物(例如,在本文描述的方案4-8中显示的)的生物催化转化,并且在反应完成之后被容易地保留(例如通过保留多肽被固定于其上的珠)并且然后在随后的反应中被容易地再利用或再循环。此类固定的酶方法允许更进一步的效率和成本降低。相应地,还涵盖使用本公开内容的工程化的转氨酶多肽的任何方法可使用结合或固定于固体支持体上的相同的工程化的转氨酶多肽来进行。
酶固定的方法是本领域所熟知的。工程化的转氨酶多肽可被非共价地或共价地结合。用于将酶缀合和固定至固体支持体(例如,树脂、膜、珠、玻璃等)的多种方法是本领域所熟知的并且被描述于例如Yi等人,“Covalent immobilization ofω-transaminase from Vibrio fluvialis JS17 onchitosan beads,”Process Biochemistry 42(5):895-898(2007年5月);Martin等人,“Characterization of free and immobilized(S)-aminotransferase foracetophenone production,”Applied Microbiology and Biotechnology 76(4):843-851(2007年9月);Koszelewski等人,“Immobilization of ω-transaminasesby encapsulation in a sol-gel/celite matrix,”Journal of Molecular Catalysis B:Enzymatic,63:39-44(2010年5月);Truppo等人,“Development of anImproved Immobilized CAL-B for the Enzymatic Resolution of a KeyIntermediate to Odanacatib,”Organic Process Research&Development,在线发表:
dx.doi.org/10.1021/op200157c;Hermanson,G.T.,Bioconjugate Techniques,第二版,Academic Press(2008);Mateo等人,“Epoxy sepabeads:a novel epoxysupport for stabilization of industrial enzymes via very intense multipointcovalent attachment,”Biotechnology Progress 18(3):629-34(2002);和Bioconjugation Protocols:Strategies and Methods,In Methods in MolecularBiology,C.M.Niemeyer编著,Humana Press(2004);通过引用将其每个的公开内容并入本文。可用于固定本公开内容的工程化的转氨酶的固体支持体包括但不限于珠或树脂,所述珠或树脂包含具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。可用于固定本公开内容的工程化的转氨酶的示例性固体支持体包括但不限于壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),所述SEPABEAD包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,工程化的多肽可以是多种形式,例如,诸如分离的制品,诸如基本上纯化的酶、用编码酶的基因转化的完整细胞,和/或诸如此类细胞的提取物和/或裂解物。酶可以是冻干的、喷雾干燥的、沉淀的或是粗糊状物的形式,如以下进一步讨论的。
在一些实施方案中,本文描述的多肽可以试剂盒的形式被提供。试剂盒中的酶可单独存在或作为多种酶存在。试剂盒还可包括用于进行酶反应的试剂、用于评价酶活性的底物、以及用于检测产物的试剂。试剂盒还可包括用于试剂盒的使用的试剂分配器和说明。
在一些实施方案中,多肽可以以阵列的形式于固体支持体上提供,在所述阵列中多肽被排列于定位不同的位置中。阵列可被用来测试用于被多肽转化的多种底物化合物。多个支持体可以被配置在对于机器人递送试剂或检测方法和/或仪器可寻址的多个位置的阵列上。用于缀合至基底例如膜、珠、玻璃等的多种方法被描述于除了其他以外,Hermanson,G.T.,Bioconjugate Techniques,第二版,Academic Press;(2008),以及Bioconjugation Protocols:Strategies and Methods,In Methods in MolecularBiology,C.M.Niemeyer编著,Humana Press(2004)中;通过引用将其公开内容并入本文。
在一些实施方案中,本公开内容的试剂盒包括阵列,所述阵列在不同的可寻址的位置包含本文公开的多个不同的工程化的酮还原酶多肽,其中所述不同的多肽为参考序列的不同变体,每个变体具有至少一种不同的改进的酶特性。在WO2009008908中描述了此类包含多个工程化的多肽的阵列及其使用的方法。
5.4编码工程化的多肽的多核苷酸、表达载体和宿主细胞
在另一方面,本公开内容提供了编码本文描述的工程化的转氨酶多肽的多核苷酸。多核苷酸可被可操作地连接至控制基因表达的一种或多种异源调控序列以生成能够表达多肽的重组多核苷酸。包含编码工程化的转氨酶的异源多核苷酸的表达构建体可被引入合适的宿主细胞以表达相应的转氨酶多肽。
如对本领域技术人员将明显的,蛋白序列的可用性以及相应于多种氨基酸的密码子的知识提供了能编码主题多肽的所有多核苷酸的描述。其中相同氨基酸由可选择的或同义密码子编码的遗传密码的简并性允许产生极大数目的核酸,所有这些核酸编码改进的转氨酶。因此,知道特定的氨基酸序列后,本领域的技术人员可以通过以不改变蛋白质的氨基酸序列的方式简单地修饰一个或更多个密码子的序列来产生任何数目的不同核酸。在这方面,本公开特别涵盖了多核苷酸的各种和每个可能的变体,可通过基于可能的密码子选择挑选组合来制备编码本文描述的多肽的所述变体,并且所有这些变体被认为是为本文描述的任何多肽所特别公开的,包括表2A和表2B中呈现并且在序列表中公开为以下的氨基酸序列,所述序列表通过引用被并入本文:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。
在多种实施方案中,密码子被优选地选择以适应在其中产生蛋白的宿主细胞。例如,细菌中使用的优选密码子被用于在细菌中表达基因;酵母中使用的优选密码子被用于在酵母中的表达;且哺乳动物中使用的优选密码子被用于在哺乳动物细胞中的表达。在一些实施方案中,不是所有的密码子需要被取代来优化转氨酶的密码子使用,因为天然序列将包括优选的密码子并且由于优选的密码子的使用可能不是所有氨基酸残基所需要的。因此,编码转氨酶的密码子优化的多核苷酸可包含全长编码区的约40%、50%、60%、70%、80%或高于90%的密码子位置的优选的密码子。
在一些实施方案中,如以上描述的,多核苷酸编码具有本文公开的特性的具有转氨酶活性的工程化的多肽,所述本文公开的特性诸如将底物化合物(2)转化成产物化合物(1)的能力,其中所述多肽包含与选自以下的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204、并且与SEQ ID NO:2的参考多肽相比具有在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。在一些实施方案中,在位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的特定氨基酸差异选自:X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。在一些实施方案中,参考序列选自SEQ ID NO:4、8、26、36、40、78、100、102、148、156、160、170、172、180和198。在一些实施方式中,参考序列为SEQ ID NO:4。在一些实施方式中,参考序列为SEQ IDNO:100。在一些实施方式中,参考序列为SEQ ID NO:148。在一些实施方式中,参考序列为SEQ ID NO:156。在一些实施方式中,参考序列为SEQID NO:160。在一些实施方式中,参考序列为SEQ ID NO:180。
在一些实施方案中,多核苷酸编码具有本文公开的特性的具有转氨酶活性的工程化的多肽,其中所述多肽包含与参考序列SEQ ID NO:2具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性、并且与SEQ ID NO:2相比具有在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。
在一些实施方案中,多核苷酸编码具有转氨酶活性的工程化的多肽,其中所述多肽包含与参考序列SEQ ID NO:2具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性、以及具有至少与SEQ ID NO:2相比的以下残基差异的组合的氨基酸序列:X34A、X56A、X57L、X86S、X88A;X153C、X155V、X163F、X315G和X417T。在一些实施方案中,多核苷酸编码还包含与SEQ ID NO:2相比残基差异的选自以下的组合的多肽:(a)X31M、X57F、X316N、X323T和X383V;(b)X31M、X57F、X107G、X113L、X233T、X316N、X415H和X450S;(c)X31M、X57F、X233V、X316N、X323T、X383I、X415H和X450S;以及(d)X31M、X57F、X147H、X316N、X323T、X383I、X415H和X450S。
在一些实施方案中,多核苷酸编码具有转氨酶活性的工程化的多肽,其中多肽包含与选自以下的任何一种的参考多肽具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204,条件是氨基酸序列包含与SEQ ID NO:2相比在以下多肽序列中的任何一种中包含的残基差异的组中的任何一个:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204,如表2A和2B中列出的。
在一些实施方案中,编码工程化的转氨酶的多核苷酸包含选自以下的多核苷酸序列:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201和203。
在一些实施方案中,多核苷酸能在高严格条件下与选自以下的参考多核苷酸序列杂交:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201和203或其互补物,并且编码具有有本文描述的一种或更多种改进的特性的转氨酶活性的多肽。在一些实施方案中,能在高严格条件下杂交的多核苷酸编码包含这样的氨基酸序列的转氨酶多肽,所述氨基酸序列与SEQ ID NO:2相比在选自以下的残基位置处具有一个或更多个残基差异:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。
在一些实施方案中,所述多核苷酸编码本文描述的多肽,但是在核苷酸水平上与编码工程化的转氨酶的参考多核苷酸具有约80%或更高的序列同一性,约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201和203。
编码本文的任何工程化的转氨酶多肽的分离的多核苷酸可以多种方式处理以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸可以作为表达载体而提供,其中存在一个或更多个控制序列来调节多核苷酸和/或多肽的表达。取决于表达载体,在分离的多核苷酸插入载体之前对分离的多核苷酸的操作可以是期望的或必需的。利用重组DNA方法修饰多核苷酸和核酸序列的技术在本领域中是被熟知的。在Sambrook等人,2001,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring HarborLaboratory Press;and Current Protocols in Molecular Biology,Ausubel.F.编著,Greene Pub.Associates,1998,2006年更新中提供了指导。
在一些实施方案中,控制序列包括除了其他以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。可基于使用的宿主细胞来选择合适的启动子。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的合适启动子包括从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因及原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl Acad.Sci.USA 75:3727-3731),以及tac启动子(DeBoer et al.,1983,Proc.Natl Acad.Sci.USA 80:21-25)。用于丝状真菌宿主细胞的示例性启动子包括获取自以下的基因的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰孢菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变启动子、截短启动子和杂合启动子。示例性酵母细胞启动子可来自可来自酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶的基因。用于酵母宿主细胞的其它有用的启动子由Romanos等人,1992,Yeast 8:423-488描述。
控制序列也可以是合适的转录终止子序列,转录终止子序列是被宿主细胞识别以终止转录的序列。终止子序列被可操作地连接到编码多肽的核酸序列的3'末端。在所选的宿主细胞中是功能性的任何终止子可用于本发明中。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶的基因获得。用于酵母宿主细胞的示例性终止子可以从酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得。用于酵母宿主细胞的其它有用的终止子由Romanos等人,1992,同上描述。
控制序列也可以是适合的前导序列,前导序列是对宿主细胞的翻译重要的mRNA的非翻译区。前导序列被可操作地连接到编码多肽的核酸序列的5'末端。可以使用在所选择的宿主细胞中是功能性的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得。用于酵母宿主细胞的适合的前导序列从酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得。
控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是可操作地连接到核酸序列的3'末端的序列,并且其在转录时,作为向转录的mRNA添加多腺苷残基的信号由宿主细胞识别。在所选的宿主细胞中是功能性的任何多腺苷酸化序列可用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列可来自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶的基因。对酵母宿主细胞有用的聚腺苷酸化序列被Guo和Sherman,1995,MolCell Bio 15:5983-5990描述。
控制序列还可以是信号肽编码区,其编码连接到多肽的氨基末端的氨基酸序列并引导编码的多肽到细胞的分泌途径中。核酸序列的编码序列的5'末端可以固有地包含信号肽编码区,其在翻译阅读框中与编码分泌的多肽的编码区片段天然地连接。可选地,编码序列的5'末端可以包含对编码序列而言外来的信号肽编码区。将表达的多肽引导至选择的宿主细胞的分泌途径的任何信号肽编码区可用于工程化的多肽的表达。细菌宿主细胞的有效的信号肽编码区是从芽孢杆菌NClB 11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)α-淀粉酶、地衣芽孢杆菌(Bacilluslicheniformis)枯草杆菌蛋白酶、地衣芽孢杆菌(Bacillus licheniformis)β-内酰胺酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA的基因获得的信号肽编码区。另外的信号肽被Simonen和Palva,1993,Microbiol Rev 57:109-137描述。丝状真菌宿主细胞的有效的信号肽编码区可以是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和绵毛状腐质菌(Humicola lanuginosa)脂肪酶的基因获得的信号肽编码区。酵母宿主细胞的有用的信号肽可以来自酿酒酵母α-因子和酿酒酵母转化酶的基因。
控制序列还可以是编码位于多肽的氨基末端的氨基酸序列的前肽编码区。产生的多肽被称为原酶或者多肽原(或在一些情况下称为酶原)。多肽原可以通过催化裂解或自动催化裂解来自多肽原的前肽而被转化为成熟的活性多肽。前肽编码区可从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(WO 95/33836)的基因获得。在多肽的氨基末端存在信号肽和前肽区两者的情况下,前肽区位于多肽的氨基末端旁边且信号肽区位于前肽区的氨基末端旁边。
可能还期望添加调控序列,其允许相对于宿主细胞的生长来调控多肽的表达。调节系统的实例是导致基因的表达被开启或关闭以响应于化学或物理刺激的那些,所述化学或物理刺激包括调节性化合物的存在。在原核宿主细胞中,合适的调节序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调节系统包括作为实例的ADH2系统或GAL1系统。在丝状真菌中,合适的调节序列包括TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子。
在另一个方面,本公开内容还涉及重组表达载体,根据其要被导入的宿主的类型,其包括编码工程化的转氨酶多肽的多核苷酸,和一个或更多个表达调节区诸如启动子和终止子、复制起点等。以上描述的多种核酸和控制序列可被连接在一起以生成重组表达载体,该表达载体可包含一个或更多个方便的限制性位点以允许编码多肽的氨基酸序列在此位点的插入或取代。可选地,本公开内容的核酸序列可通过使核酸序列或包括该序列的核酸构建体插入到适当的表达载体中来表达。在产生表达载体时,编码序列位于载体中以使得编码序列与用于表达的合适的控制序列可操作地连接。
重组表达载体可为任何载体(例如,质粒或病毒),其可方便地经受重组DNA程序并且可带来多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状的质粒。
表达载体可以是自主复制的载体,即作为染色体外的实体而存在的载体,其复制独立于染色体的复制,例如质粒、染色体外的元件、微小染色体、或人工染色体。载体可以包含用于保证自我复制的任何工具(means)。可选地,载体可以是在被引入到宿主细胞中时整合到基因组中并且与其所整合到的染色体一起复制的载体。而且,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两个或更多个载体或质粒,或者转座子。
表达载体优选地包含一个或更多个可选择的标志物,其允许容易地选择转化的细胞。可选择的标志物为其产物提供杀虫剂耐受性或病毒耐受性、重金属耐受性、营养缺陷型的原养型等的基因。细菌可选择的标志物的实例为来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予诸如氨苄西林、卡那霉素、氯霉素(实施例1)或四环素耐受性的抗生素耐受性的标志物。用于酵母宿主细胞的合适的标志物为ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。在丝状真菌的宿主细胞中使用的可选择的标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨基甲酰转移酶)、bar(草胺磷乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷转移酶)、和trpC(邻氨基苯甲酸合酶)、以及其等同物。在曲霉细胞中使用的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
在另一方面,本公开内容提供包含编码本公开内容的工程化的转氨酶多肽的多核苷酸的宿主细胞,所述多核苷酸被可操作地连接至在宿主细胞中用于转氨酶的表达的一个或更多个控制序列。用于表达由本发明的表达载体编码的多肽的宿主细胞在本领域中是被熟知的,并包括但不限于细菌细胞诸如大肠杆菌、河流弧菌、链霉菌(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如酿酒酵母或毕赤酵母(Pichia pastoris)(ATCC登录号201178));昆虫细胞诸如果蝇(Drosophila)S2和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞为大肠杆菌W3110(ΔfhuA)和BL21。
相应地,在另一方面,本公开内容提供了制备工程化的转氨酶多肽的方法,其中该方法可包括在适于该多肽的表达的条件下培养能够表达编码工程化的转氨酶多肽的多核苷酸的宿主细胞。该方法还可包括分离或纯化表达的转氨酶多肽,如本文描述的。
以上描述的宿主细胞的合适的培养基和生长条件在本领域内是被熟知的。用于表达转氨酶的多核苷酸可通过本领域已知的多种方法被引入至细胞。技术包括,除了其他以外,电穿孔法、生物溶解颗粒轰击法、脂质体介导的转染、氯化钙转染、和原生质体融合。
对于本文的实施方案,工程化的多肽和相应的多核苷酸可利用本领域技术人员使用的方法来获得。编码河流弧菌的野生型多肽的亲本多核苷酸序列被描述于Shin等人,2003,Appl.Microbiol.Biotechnol.61(5-6):463-471中,并且生成具有改进的稳定性和底物识别特性的工程化的转氨酶多肽的方法被公开于专利申请公布WO2010081053和US20100209981中,通过引用将其并入本文。
具有本文公开的特性的工程化的转氨酶可通过使编码天然地存在的或工程化的转氨酶的多核苷酸经受诱变和/或定向进化方法来获得,如以上讨论的。示例性的定向进化技术为诱变和/或DNA改组,如在Stemmer,1994,Proc Natl Acad Sci USA 91:10747-10751;WO 95/22625;WO 97/0078;WO97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746中所描述。可以使用的其它定向进化过程包括,除了其他以外,交错延伸过程(StEP)、体外重组(Zhao等人,1998,Nat.16:258–261)、诱变PCR(Caldwell等人,1994,PCR Methods Appl.3:S136-S140)和盒式诱变(Black等人,1996,Proc Natl Acad Sci USA 93:3525-3529)。在以下参考文献中也描述了对本文的目的有用的诱变和定向进化技术:Ling,等人,1997,Anal.Biochem.254(2):157-78;Dale等人,1996,“Oligonucleotide-directedrandom mutagenesis using the phosphorothioate method,”In MethodsMol.Biol.57:369-74;Smith,1985,Ann.Rev.Genet.19:423-462;Botstein等人,1985,Science 229:1193-1201;Carter,1986,Biochem.J.237:1-7;Kramer等人,1984,Cell,38:879-887;Wells等人,1985,Gene 34:315-323;Minshull等人,1999,Curr Opin Chem Biol 3:284-290;Christians等人,1999,NatureBiotech 17:259-264;Crameri等人,1998,Nature 391:288-291;Crameri等人,1997,Nature Biotech 15:436-438;Zhang等人,1997,Proc Natl Acad Sci USA94:45-4-4509;Crameri等人,1996,Nature Biotech 14:315-319;Stemmer,1994,Nature 370:389-391;Stemmer,1994,Proc Natl Acad Sci USA91:10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746。所有出版物通过引用并入本文。
从诱变处理后获得的克隆中可筛选具有期望的改进的酶特性的工程化的转氨酶。例如,在期望的改进的酶特性为热稳定性的情况下,酶活性可在将酶制品经受确定的温度之后被测量,并测量在热处理后余下的酶促活性的量。然后包含编码转氨酶的多核苷酸的克隆被分离、被测序以鉴定核苷酸序列改变(如果有),并且被用于在宿主细胞中表达酶。可利用标准生化技术进行从表达文库测量酶活性,所述标准生化技术诸如产物胺例如用OPA衍生化后的HPLC分析。
当工程化的多肽的序列为已知时,编码酶的多核苷酸可根据已知的合成方法通过标准的固相方法来制备。在一些实施方案中,多达约100个碱基的片段可单独地合成,然后连接(例如,通过酶促或化学的连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,本文公开的多核苷酸和寡聚核苷酸可利用例如由Beaucage等人,1981,Tet Lett 22:1859-69描述的经典的亚磷酰胺方法,或由Matthes等人,1984,EMBO J.3:801-05描述的方法通过化学合成来制备,例如,如在自动化合成方法中典型地实践的。根据亚磷酰胺方法,寡核苷酸在例如在自动化DNA合成仪中合成、纯化、退火、连接和在合适的载体中克隆。
相应地,在一些实施方案中,用于制备工程化的转氨酶多肽的方法可包括:(a)合成编码包含选自SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204、并且与SEQ ID NO:2相比具有在选自以下的残基位置处的一个或更多个残基差异的多肽的氨基酸序列的多核苷酸:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T;以及(b)表达由该多核苷酸编码的转氨酶多肽。在该方法的一些实施方案中,在残基位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的残基差异选自X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。
在该方法的一些实施方案中,由多核苷酸编码的氨基酸序列可任选地具有一个或几个(例如,多达3个、4个、5个,或多达10个)氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
表达的工程化的转氨酶可被测量在通过本文描述的任何测定条件将化合物(2)转化成化合物(1)中的期望的改进的特性,例如,活性、对映体选择性、稳定性和产物耐受性。
在一些实施方案中,在宿主细胞中表达的任何工程化的转氨酶可利用蛋白质纯化的公知技术中的任一种或更多种从细胞或培养基中回收,所述蛋白纯化的公知技术包括,除了其他以外,溶菌酶处理、超声、过滤、盐析、超速离心和色谱。用于从细菌诸如大肠杆菌中裂解和高效提取蛋白质的合适溶液在表2A和实施例中被提供,并且还是商业地可得的,例如来自St.Louis MO的Sigma-Aldrich的CelLytic BTM
用于分离转氨酶多肽的色谱技术包括,除了其他以外,反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定的酶的条件将部分依赖于诸如净电荷、疏水性、亲水性、分子量、分子形状等的因素,并且对本领域的技术人员将是明显的。
在一些实施方式中,亲和技术可被用于分离改进的转氨酶。对于亲和色谱纯化,可利用特异性结合转氨酶多肽的任何抗体。对于抗体的产生,包括但不局限于兔、小鼠、大鼠等的多种宿主动物可通过用转氨酶多肽或其片段注射来免疫。可通过侧链官能团或附接至侧链官能团的接头的方法来使转氨酶多肽或片段附接至合适的载体诸如BSA上。
5.7使用工程化的转氨酶多肽的方法
如以上描述的,本公开内容的工程化的转氨酶多肽被进化为在合适的反应条件下在氨基供体存在下非对映异构过量下有效地将示例性底物化合物(2)的酮转化成相应的示例性产物化合物(1)的手性胺。工程化的转氨酶多肽的结构特征还允许在立体异构过量下将除了化合物(2)之外的大的前手性酮底物化合物转化成其相应的胺化合物。相应地,在另一方面,本公开内容提供了使用工程化的转氨酶多肽进行转氨反应的方法,其中来自氨基供体的氨基被转移至氨基受体例如酮底物化合物,以产生胺化合物。通常地,用于进行转氨反应的方法包括在适于将氨基受体转化成胺化合物的反应条件下使本公开内容的工程化的转氨酶多肽与氨基受体(例如,酮底物化合物)和氨基供体(例如,异丙胺)接触或一起孵育。
在一些实施方案中,本公开内容提供了用于制备式(I)的胺化合物的方法
其中
环A为6元碳环,任选地在位置2和3之间和/或位置5和6之间包含不饱和C-C键,和/或任选地用选自卤素、羟基和甲基的基团独立地取代的位置2、3、4、5和6;
环B为6元碳环,任选地在位置5和10之间包含不饱和C-C键,和/或在位置9和10中的一个或更多个处用选自卤素、羟基和甲基的基团独立地取代;
环C为5-或6-元碳环(即,m=0或1),任选地在位置10处用选自卤素、羟基、甲基、乙基和羰基的基团取代;
环D为5-、6-或7-元碳环(即n=0、1或2),任选地包含1、2或3个不饱和C-C键,和/或任选地如以下被独立地取代:
在位置14处用选自卤基、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、直链或支链的(C1-C3)烷基氨基和桥接至位置12的环丙基的基团独立地取代;
在位置15或位置16处用选自以下的基团独立地取代:卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳基氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基;
条件是式(I)的化合物不是化合物(1)
其中该方法包括在合适的反应条件下在氨基供体存在下使式(II)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D为如以上对式(I)的化合物限定的。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能转化式(IIa)的环巴胺类似物化合物,其中环C为5-元碳环,在位置11处被任选地取代,并且环D为7-元碳环,在位置16处被取代,其可被转化成式(Ia)的胺产物化合物,如在方案5中的。
方案5
相应地,在一些实施方案中,本公开内容提供了用于制备式(Ia)的胺化合物的方法
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
条件是式(I)的化合物不是化合物(1)
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IIa)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ia)的化合物限定的。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能将其中环C为5-元碳环且环D为6-元碳环的式(IIb)的环巴胺类似物化合物转化成式(Ib)的手性胺产物化合物,如在方案6中显示的:
方案6
相应地,在一些实施方案中,本公开内容提供了用于制备式(Ib)的胺化合物的方法
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键,或在位置12和14之间包含桥接的环丙基;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IIb)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ib)的化合物限定的。
在一些实施方案中,工程化的转氨酶多肽可被用来制备于2011年2月10日公布的WO 2011017551A1中公开的任何环巴胺类似物化合物,通过引用在此将其并入本文。
很多其他的环巴胺类似物化合物(除了被式(Ia)和(Ib)包括的那些)是本领域所熟知的。在一些实施方案中,预期本公开内容的工程化的转氨酶多肽可被用于生物催化方法以制备任何已知的藜芦胺类似物化合物。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能将其中环C为5-元碳环且环D为6-元碳环的式(IIc)的藜芦胺类似物化合物转化成式(Ic)的手性胺产物化合物,如在方案7中显示的:
方案7
相应地,在一些实施方案中,本公开内容提供了用于制备式(Ic)的胺化合物的方法
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D是芳香族的;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IIc)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ic)的化合物限定的。
很多其他的藜芦胺类似物化合物(除了被式(Ic)包括的那些)是本领域所熟知的。在一些实施方案中,预期本公开内容的工程化的转氨酶多肽可被用于生物催化方法以制备任何已知的藜芦胺类似物化合物。
在一些实施方案中,本公开内容的工程化的转氨酶多肽能将其中环C为6-元碳环且环D为5-元碳环的式(IId)的类固醇类似物化合物转化成式(Id)的手性胺产物,如在方案8中显示的:
方案8
相应地,在一些实施方案中,本公开内容提供了用于制备式(Id)的胺化合物的方法
其中
环A在位置2和3之间或在位置5和6之间包含不饱和C-C键;
R1和R2独立地选自以下基团:氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基;
R3、R4和R5独立地选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基和直链或支链的(C1-C3)烷基氨基;并且
R6、R7和R8独立地选自氢、卤素、羟基和甲基;
其中该方法包括在合适的反应条件下在氨基供体存在下使式(IId)的酮底物化合物与本公开内容的工程化的转氨酶多肽接触,
其中R1、R2、R3、R4、R5、R6、R7和R8为如以上对式(Id)的化合物限定的。
在用于制备式(Id)的胺化合物的方法的一些实施方案中,可使用选自表3中显示的那些的式(IId)的酮底物化合物来执行该方法。
表3
除了包括表3中显示的那些的式(IId)的化合物之外,本领域已知大量类固醇类似物化合物。本公开内容涵盖,在环A的位置1处具有酮基的任何类固醇类似物化合物可被用作酮底物,在方法中与本公开内容的工程化的转氨酶多肽一起来制备其相应的在位置1处具有手性胺基团的类固醇类似物化合物。
考虑到本公开内容的工程化的转氨酶多肽的立体选择性,在一些实施方案中,该方法导致在非对映异构体过量下式(I)、式(Ia)、式(Ib)、式(Ic)和式(Id)的手性胺化合物的形成。在一些实施方案中,该方法导致在至少90%、95%、96%、97%、98%、99%或更大的非对映异构体过量下式(I)、式(Ia)、式(Ib)、式(Ic)和式(Id)的手性胺化合物的形成。
对于前述方法,可使用本文描述的任何工程化的转氨酶多肽。例如但不限于,在一些实施方案中,方法可使用本公开内容的具有转氨酶活性的工程化的多肽,所述工程化的多肽包含与选自以下的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204、并且与SEQ ID NO:2相比具有在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X133、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X323、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X323、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X133A、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X323A、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。在一些实施方案中,在位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的特定氨基酸差异选自:X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。在一些实施方案中,参考序列选自SEQ ID NO:4、8、26、36、40、78、100、102、148、156、160、170、172、180和198。在一些实施方式中,参考序列为SEQ IDNO:4。在一些实施方式中,参考序列为SEQ ID NO:100。在一些实施方式中,参考序列为SEQ ID NO:148。在一些实施方式中,参考序列为SEQ IDNO:156。在一些实施方式中,参考序列为SEQ ID NO:160。在一些实施方式中,参考序列为SEQ ID NO:180。
在一些实施方案中,能够进行本文的方法的示例性转氨酶多肽可以是包含选自以下的氨基酸序列的多肽:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。本文的说明中提供了关于选择和使用工程化的转氨酶多肽的指导,例如表2A和2B以及实施例。
在本文的一些实施方案中并且在实施例中表明,可使用多种范围的合适的反应条件,包括但不局限于以下的范围:氨基供体、pH、温度、缓冲液、溶剂系统、底物载量、多肽载量、辅因子载量、压力和反应时间。鉴于本文提供的指导,用于执行使用本文描述的工程化的转氨酶多肽将底物化合物生物催化地转化成产物化合物的方法的另外的合适的反应条件可被容易地通过常规实验优化,包括但不限于在浓度、pH、温度、溶剂条件的实验反应条件下使工程化的转氨酶多肽与底物化合物接触,并检测产物化合物。
在本文的一些实施方案中,转氨酶多肽使用氨基供体来形成产物化合物。在一些实施方案中,反应条件中的氨基供体可选自异丙胺(本文也被称为“IPM”)、腐胺、L-赖氨酸、α-苯丙胺、D-丙氨酸、L-丙氨酸或D,L-丙氨酸或D,L-鸟氨酸。在一些实施方案中,氨基供体选自IPM、腐胺、L-赖氨酸、D-或L-丙氨酸。在一些实施方案中,氨基供体是IPM。在一些实施方案中,合适的反应条件包括以至少约0.1M至约3M、0.2至约2.5M、约0.5至约2M或约1至约2M的浓度存在的氨基供体,特别是IPM。在一些实施方案中,氨基供体以约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、1、1.5、2、2.5或3M的浓度存在。氨基供体例如IPM的较高的浓度可被用来使平衡转向胺产物形成。
使用工程化的转氨酶多肽的合适的反应条件还通常地包括辅因子。对本文转氨酶有用的辅因子包括但不限于5'-磷酸吡哆醛(也被称为磷酸吡哆醛、PLP、P5P)、吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM),及其磷酸化对应物磷酸吡哆醇(PNP)和磷酸吡哆胺(PMP)。在一些实施方案中,辅因子PLP天然地存在于细胞提取物中并且不需要补充。在方法的一些实施方案中,合适的反应条件包括被添加至酶反应混合物的外源辅因子,例如,当使用部分地纯化的或纯化的转氨酶时。在一些实施方案中,合适的反应条件可包括选自PLP、PN、PL、PM、PNP和PMP的辅因子以约0.1g/L至约10g/L、约0.2g/L至约5g/L、约0.5g/L至约2.5g/L的浓度存在。在一些实施方案中,反应条件包括约0.1g/L或更少、0.2g/L或更少、0.5g/L或更少、1g/L或更少、2.5g/L或更少、5g/L或更少、或10g/L或更小的PLP浓度。在一些实施方案中,辅因子可在反应开始时添加和/或另外的辅因子在反应期间被添加。
考虑到,例如,产物化合物的期望的量、底物浓度对酶活性的影响、在反应条件下酶的稳定性、以及底物到产物的转化百分比,反应混合物中的底物化合物可以变化。在一些实施方案中,合适的反应条件包括至少约0.5至约200g/L、1至约200g/L、约5至约150g/L、约10至约100g/L、约20至约100g/L、或约50至约100g/L的底物化合物载量。在一些实施方案中,合适的反应条件包括至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L或至少约200g/L、或甚至更大的底物化合物载量。本文提供的底物载量的值是基于化合物(2)的分子量,但是也预期,化合物(2)的等价摩尔量的多种水合物和盐也可被用于方法。另外,包括式(IIa)、(IIb)、(IIc)和(IId)的化合物的式(II)的酮底物化合物也可根据化合物(2)使用的量以适当的量使用。
在进行本文描述的反应时,工程化的转氨酶多肽可以纯化的酶、用编码酶的基因转化的完整细胞、和/或此类细胞的细胞提取物和/或裂解物的形式加入至反应混合物中。用编码工程化的转氨酶的基因转化的完整细胞,或其细胞提取物、其裂解物,以及分离的酶可以多种不同的形式使用,包括固体(例如,冻干的、喷雾干燥的等)或半固体(例如,粗糊状物)。细胞提取物或细胞裂解物可通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)部分纯化,之后在冻干之前进行除盐程序(例如,超滤、透析等)。任何细胞制品可通过使用已知的交联剂诸如例如戊二醛交联或固定到固相(例如,Eupergit C等)而被稳定。
编码工程化的转氨酶多肽的基因可分别转化入宿主细胞或一起转化入相同的宿主细胞。例如,在一些实施方案中,可用编码一种工程化的转氨酶多肽的基因转化一组宿主细胞,并且可用编码另一种工程化的转氨酶多肽的基因转化另一组宿主细胞。两组转化的细胞可以完整细胞的形式,或从其衍生的裂解物或提取物的形式一起用于反应混合物。在其他的实施方案中,宿主细胞可用编码多种工程化的转氨酶多肽的基因转化。在一些实施方案中,工程化的多肽可以分泌多肽的形式被表达并且含有该分泌多肽的培养基可被用于转氨酶反应。
本文公开的工程化的转氨酶多肽的活性和/或立体选择性的增强提供了了这样的方法,其中能够以较低的工程化的多肽的浓度达到较高的转化百分比。在方法的一些实施方案中,合适的反应条件包括约0.01至约50g/L、约0.05至约50g/L、约0.1至约40g/L、约1至约40g/L、约2至约40g/L、约5至约40g/L、约5至约30g/L、约0.1至约10g/L、约0.5至约10g/L、约1至约10g/L、约0.1至约5g/L、约0.5至约5g/L、或约0.1至约2g/L的工程化的多肽浓度。在一些实施方案中,转氨酶多肽为约0.01、0.05、0.1、0.2、0.5、1、2、5、10、15、20、25、30、35、40或50g/L的浓度。
在转氨反应的过程中,反应混合物的pH可改变。反应混合物的pH可保持在期望的pH或期望的pH范围内。这可通过在反应的过程之前和/或期间添加酸或碱来进行。可选择地,pH可通过使用缓冲液来控制。可选择地,在一些实施方案中,反应条件包括缓冲液。保持期望的pH范围的合适的缓冲剂在本领域内是被是熟知的,包括例如但不限于硼酸盐、碳酸盐、磷酸盐、三乙醇胺(TEA)等。在一些实施方案中,缓冲剂是硼酸盐。在方法的一些实施方案中,合适的反应条件包括TEA的缓冲溶液,其中TEA浓度为从约0.01至约0.4M、0.05至约0.4M、0.1至约0.3M或约0.1至约0.2M。在一些实施方案中,反应条件包括约0.01、0.02、0.03、0.04、0.05、0.07、0.1、0.12、0.14、0.16、0.18、0.2、0.3或0.4M的TEA浓度。在一些实施方案中,反应条件包括水作为合适的溶剂而无缓冲液存在。
在方法的实施方案中,反应条件可包括合适的pH。期望的pH或期望的pH范围可通过使用酸或碱、适当的缓冲液、或缓冲液和酸或碱添加的组合来保持。反应混合物的pH可在反应过程之前和/或期间控制。在一些实施方案中,合适的反应条件包括从约6至约12的pH、从约6至约10的pH、从约6至约8的pH、从约7至约10的pH、从约7至约9的pH、或从约7至约8的pH的溶液pH。在一些实施方案中,反应条件包括约6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5或12的溶液pH。
在本文的方法的实施方案中,合适的温度可被用于反应条件,例如,考虑在较高温度下增加的反应速率,和在反应时间段期间酶的活性。例如,本公开内容的工程化的多肽相对于天然地存在的转氨酶多肽例如SEQ IDNO:2的野生型多肽具有增加的稳定性,其允许工程化的多肽在较高温度下用于增加转化速率并提高底物的溶解性特征。相应地,在一些实施方案中,合适的反应条件包括约10℃至约70℃、约10℃至约65℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约30℃至约55℃、或约40℃至约50℃的温度。在一些实施方案中,合适的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃或70℃的温度。在一些实施方案中,在酶促反应期间温度可贯穿反应的过程保持一个温度或在反应过程期间按温度曲线调整。
本文的方法通常地在溶剂中进行。合适的溶剂包括水、水性缓冲溶液、有机溶剂、多聚物溶剂、和/或共溶剂系统,其通常地包括水性溶剂、有机溶剂和/或聚合物溶剂。水性溶剂(水或水性共溶剂系统)可为pH-缓冲的或非缓冲的。在一些实施方案中,方法通常地于包含以下的水性共溶剂系统中进行:有机溶剂(例如,乙醇、异丙醇(IPA))、二甲基亚砜(DMSO)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等)、离子或极性溶剂(例如,四氟硼酸1乙基4甲基咪唑、四氟硼酸1丁基3甲基咪唑、六氟磷酸1丁基3甲基咪唑、甘油、聚乙二醇等)。在一些实施方案中,共溶剂可以是极性溶剂,诸如多元醇、二甲基亚砜、DMSO或低级醇。水性共溶剂系统中的非水性共溶剂组分可与水性组分混溶,提供单一的液相,或可与水性组分部分混溶或不混溶,提供双液相。示例性水性共溶剂系统可包括水和选自有机溶剂、极性溶剂和多元醇溶剂的一种或更多种的共溶剂。通常,选择水性共溶剂系统的共溶剂组分以使在反应条件下不会不利地使转氨酶失活。通过用候选溶剂系统中的感兴趣的确定的底物并利用诸如本文描述的酶活性测定而测量特定的工程化的转氨酶的酶活性,合适的共溶剂系统可被容易地鉴定。
在方法的一些实施方案中,合适的反应条件包括水性共溶剂,其中共溶剂包括约1%至约80%(v/v)、约1至约70%(v/v)、约2%至约60%(v/v)、约5%至约40%(v/v)、10%至约40%(v/v)、10%至约30%(v/v)、或约10%至约20%(v/v)的DMSO。在方法的一些实施方案中,合适的反应条件包括含有至少约1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%或80%(v/v)的DMSO的水性共溶剂。在方法的一些实施方案中,合适的反应条件包括包含从约15%(v/v)至约45%(v/v)、从约20%(v/v)至约30%(v/v)DMSO的水性共溶剂,并且在一些实施方案中约25%(v/v)的DMSO浓度。
在方法的一些实施方案中,合适的反应条件包括水性共溶剂,其中共溶剂可包括聚合物多元醇溶剂。合适的多元醇溶剂的实例包括例如但不限于聚乙二醇、聚乙二醇甲基醚、二乙二醇二甲醚、三乙二醇二甲醚、和聚丙二醇。在一些实施方案中,水性共溶剂包括聚乙二醇,不同分子量的聚乙二醇是可得的。特别地有用的是较低分子量的聚乙二醇,诸如PEG200至PEG600。相应地,在一些实施方案中,水性共溶剂可包括约1%至约40%v/v、约1%至约40%v/v、约2%至约40%v/v、约5%至约40%v/v、2%至约30%v/v、5%至约30%v/v、1至约20%v/v、约2%至约20%v/v、约5%至约20%v/v、约1%至约10%v/v、约2%至约10%v/v的PEG200。在一些实施方案中,合适的反应条件包括包含约1%、2%、5%、10%、15%、20%、25%、30%、35%、35%或约40%v/v的PEG200的水性共溶剂。
用于转氨反应的反应物的量通常将根据期望的产物的量以及伴随地所使用的转氨酶底物的量而改变。本领域的普通技术人员将容易地理解如何改变这些量以使其适用于所期望的产率水平和生产规模。
在一些实施方案中,加入反应物的顺序不是严格的。反应物可同时一起加入至溶剂中(例如,单相溶剂、双相水性共溶剂系统等),或者可选择地,一些反应物可分别加入,以及在不同的时间点将一些反应物一起加入。例如,辅因子、转氨酶和转氨酶底物可首先加入至溶剂中。
固体反应物(例如,酶、盐、底物化合物等)可以多种不同的形式提供给反应,包括粉末(例如,冻干的、喷雾干燥的等)、溶液、乳剂、悬浮液等。反应物可使用被本领域普通技术人员所熟知的方法和仪器来容易地冻干或喷雾干燥。例如,蛋白质溶液可以小的等份在-80℃下冷冻,然后加入至预冷却的冻干室内,之后应用真空。
为了当使用水性共溶剂系统时的改进的混合效率,转氨酶和辅因子可首先加入和混合入水相中。然后可加入和混合有机相,然后添加转氨酶底物。可选择地,转氨酶底物可在添加至水相之前在有机相中预混合。
转氨反应通常地被允许进行,直至随着反应时间酮底物到胺产物的另外的转化不显著地改变,例如少于10%的底物被转化,或少于5%的底物被转化。在一些实施方案中,反应将被允许进行,直至有底物酮至产物胺的完全或接近完全的转化。底物至产物的转化可使用已知的方法通过检测底物和/或产物监测。合适的方法包括气相色谱、HPLC等。反应混合物中生成的手性胺产物的转化产率通常大于约50%,也可大于约60%,也可大于约70%,也可大于约80%,也可大于约90%,以及可大于约97%。在一些实施方案中,用于在合适的反应条件下使用工程化的转氨酶多肽制备式(I)的化合物的方法导致在约48h或更少、约36h或更少、约24h或更少、或甚至更少的时间内至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的酮底物例如式(II)的化合物至胺产物化合物例如式(I)的化合物的转化。
在方法的一些实施方案中,合适的反应条件包括至少约20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、100g/L或更多的底物载量,并且其中方法导致在约48h或更少、约36h或更少、或约24h或更少的时间内至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的底物化合物至产物化合物的转化。
本公开内容的工程化的转氨酶多肽当在用于在合适的反应条件下制备式(I)的手性胺化合物的方法中使用时,导致至少90%、91%、92%、93%、94%、95%、97%、98、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%d.e的手性胺的非对映异构体过量。
在方法的另外的实施方案中,合适的反应条件可包括装载至反应溶液的初始底物,然后将初始底物与多肽接触。然后该反应溶液用另外的底物化合物进一步补充,作为以至少约1g/L/h、至少约2g/L/h、至少约4g/L/h、至少约6g/L/h、或更高的速率的连续添加。因此,根据这些合适的反应条件,多肽被添加至具有至少约20g/L、30g/L或40g/L初始底物载量的溶液。多肽的这种添加,然后之后是另外的底物以约2g/L/h、4g/L/h或6g/L/h的速率连续添加至溶液,直到达到至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L、150g/L、200g/L或更多的高的多的最终底物载量。相应地,在方法的一些实施方案中,合适的反应条件包括将多肽添加至含有至少约20g/L、30g/L或40g/L的初始底物载量的溶液,之后以约2g/L/h、4g/L/h或6g/L/h的速率将另外的底物添加至溶液,直至达到至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L或更多的最终底物载量。这种底物补充的反应条件允许达到较高的底物载量,同时保持至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的高的酮底物向胺产物的转化速率。在该方法的一些实施方案中,添加的另外的底物是以含有至少约0.5M、至少约1.0M、至少约2.5M、至少约5.0M、至少约7.5M、至少约10.0M浓度的异丙胺或异丙胺乙酯(isopropylamine acetate)的溶液。
在方法的一些实施方案中,转氨反应可包括以下合适的反应条件(a)约5g/L至200g/L的底物载量;(b)约0.1g/L至50g/L的工程化的转氨酶多肽;(c)约0.1M至4M的异丙胺(IPM);(d)约0.1g/L至10g/L的磷酸吡哆醛(PLP)辅因子;(e)约6至9的pH;和(f)约30℃至60℃的温度。
在方法的一些实施方案中,转氨反应可包括以下合适的反应条件:(a)约10g/L至150g/L的底物载量;(b)约0.5g/L至20g/L的工程化的转氨酶多肽;(c)约0.1M至3M的异丙胺(IPM);(d)约0.1g/L至10g/L的磷酸吡哆醛(PLP)辅因子;(e)约0.05M至0.20M的TEA缓冲液;(f)约1%至约45%的DMSO;(g)约6至9的pH;和(h)约30℃至65℃的温度。
在方法的一些实施方案中,转氨反应可包括以下合适的反应条件:(a)约20g/L至100g/L的底物载量;(b)约1g/L至5g/L的工程化的转氨酶多肽;(c)约0.5M至2M的异丙胺(IPM);(d)约0.2g/L至2g/L的磷酸吡哆醛(PLP)辅因子;(e)约0.1M的TEA缓冲液;(f)约25%的DMSO;(e)约8的pH;和(f)约45℃至60℃的温度。
在一些实施方案中,执行另外的反应组分或另外的技术以增补反应条件。这些可包括采取措施来稳定酶或阻止酶的失活、降低产物抑制和/或将反应平衡转向产物胺形成。
相应地,在用于制备胺诸如手性胺的方法的一些实施方案中,氨基受体的另外的量可被添加(直至饱和)和/或形成的氨基受体(酮)可被连续地从反应混合物移除。例如,溶剂桥(solvent bridge)或两相共溶剂系统可被用来将胺产物移至提取溶液,并且由此降低胺产物抑制并且还将平衡转向产物形成(参见例如,Yun和Kim,2008,Biosci.Biotechnol.Biochem.72(11):3030-3033)。
在方法的一些实施方案中,合适的反应条件包括还原型辅因子、烟酰胺腺嘌呤二核苷酸(NADH)的存在,其可起作用限制转氨酶的失活(参见例如,van Ophem等人,1998,Biochemistry 37(9):2879-88)。在其中存在NADH的此类实施方案中,辅因子再生系统诸如葡萄糖脱氢酶(GDH)和葡萄糖或甲酸脱氢酶和甲酸可被用来再生反应介质中的NADH。
在一些实施方案中,该方法还可包括去除当氨基被转移到氨基受体时从氨基供体形成的羰基副产物。这种原位去除可减少副反应率,以使得正向反应占主导,并且然后更多底物被转化为产物。羰基副产物的去除可以许多方式进行。当氨基供体是氨基酸诸如丙氨酸时,羰基副产物酮酸可通过与过氧化物反应来去除(参见例如,US 2008/0213845,通过引用并入本文)。可使用的过氧化物包括,除了其他以外,过氧化氢;过氧酸类(过酸)诸如过乙酸(CH3CO3H)、三氟过乙酸和间氯过氧苯甲酸;有机过氧化物诸如叔丁基过氧化物((CH3)3COOH)或其他选择性氧化剂诸如四丙基高钌酸铵、MnO2、KMnO4、四氧化钌和相关化合物。可选地,丙酮酸的去除可通过利用乳酸脱氢酶将其还原为乳酸来实现,以将平衡转向产物胺(参见如,Koszelewski等,2008,Adv.Syn.Catal.350:2761-2766)。丙酮酸的去除还可经由通过使用丙酮酸脱羧酶(参见例如等人,2008,ChemBioChem9:363-365)或乙酰乳酸合成酶(参见例如Yun和Kim,同上)的其脱羧基作用来完成。
可选地,在其中氨基酸被用作氨基供体的实施方案中,酮酸羰基副产物可通过在氨基供体诸如氨存在下利用适当的脱氢酶例如氨基酸脱氢酶与氨和NADH反应来再循环为氨基酸,从而补充氨基供体。
在一些实施方案中,当选择的氨基供体产生的羰基副产物比水的蒸气压高时(例如,低沸点副产品诸如挥发性有机羰基化合物),羰基副产物可通过向反应溶液充入非反应性气体,或通过施加真空来降低反应压力,并去除气相中存在的羰基副产物来去除。非反应性气体是不与反应组分起反应的任何气体。各种非反应性气体包括氮气和稀有气体(例如,惰性气体)。在一些实施方案中,非反应性气体是氮气。在一些实施方案中,该方法中使用的氨基供体是异丙胺(IPM),其在向氨基受体转移氨基后形成羰基副产物丙酮。丙酮可通过向反应溶液充入氮气或施加真空,并通过丙酮捕集器,诸如冷凝器或其他冷捕集器从气相去除丙酮来去除。可选地,丙酮可通过利用转氨酶还原为异丙醇来去除。
在其中去除羰基副产物的以上方法的一些实施方案中,在转氨基反应期间可加入相应氨基供体以补充氨基供体和/或维持反应的pH。补充氨基供体还使平衡转向产物形成,从而增加底物向产物的转化。因此,在其中氨基供体是异丙胺并且丙酮产物被原位去除的一些实施方案中,可向溶液加入异丙胺以补充丙酮去除期间失去的氨基供体并维持反应的pH。
在另外的实施方案中,以上描述的用于将底物化合物转化成产物化合物的任何方法还可包括选自以下的一个或更多个步骤:产物化合物的提取、分离、纯化和结晶。用于从通过以上公开的方法生成的生物催化的反应混合物提取、分离、纯化和/或结晶产物化合物的方法、技术和方案是本领域技术人员已知的和/或通过常规实验获取。另外,示例性方法在以下实施例中提供。
本公开内容的多种特征和实施方案示例于以下有代表性的实施例中,其意图例证性的而不是限制性的。
6.实施例
实施例1:合成、优化并筛选工程化的转氨酶多肽
基因合成和优化:编码来自河流弧菌JS17(Genbank登录号AEA39183.1,GI:327207066)的453氨基酸野生型ω-转氨酶多肽的多核苷酸序列先前被密码子优化并合成。密码子优化的河流弧菌野生型转氨酶基因的序列在于2011年12月22日公布的WO2011159910A2中被公开为SEQID NO:1,通过引用将其并入本文。将该密码子优化的基因克隆入pCK110900载体系统(参见例如美国专利申请公布20060195947,通过引用将其并入本文)并且随后在大肠杆菌W3110fhuA中表达。大肠杆菌W3110在lac启动子的控制下将转氨酶多肽表达为细胞内蛋白。本公开内容的具有SEQ ID NO:1的序列的多核苷酸编码SEQ ID NO:2的工程化的转氨酶多肽并且通过WO2011159910A2的密码子优化的河流弧菌野生型转氨酶基因的定向进化来获得。SEQ ID NO:2的工程化的转氨酶多肽与Genbank登录号AEA39183.1,GI:27207066的野生型河流弧菌转氨酶多肽序列相比具有10个氨基酸差异(A9T、N45H、W57L、F86S、V153A、V177L、R211K、M294V、S324G和T391A)。本公开内容的具有SEQ ID NO:1(编码SEQ IDNO:2的工程化的多肽)的序列的多核苷酸被进一步优化以提供SEQ ID NO3,其编码SEQ ID NO:4的工程化的转氨酶多肽。SEQ ID NO:4的工程化的转氨酶多肽相对于SEQ ID NO:2具有以下8个氨基酸残基差异:T34A;L56A;R88H;A153C;A155V;K163F;E315G和L417T。本公开内容的具有SEQ ID NO:3(编码SEQ ID NO:4的工程化的转氨酶多肽)的序列的多核苷酸被用作使用定向进化的标准方法的进一步优化的起始骨架,所述定向进化的标准方法经由通过基因合成的迭代变体(iterative variant)文库生成、然后为筛选并测序击中以生成编码能够以相对于多肽SEQ ID NO:4增强的酶特性将化合物(2)转化成化合物(1)的工程化的转氨酶的基因。得到的工程化的转氨酶多肽序列和特定的突变体和相对活性被列于表2A和序列表中。
实施例2:工程化的转氨酶的生成
工程化的转氨酶多肽在宿主大肠杆菌W3110中在lac启动子的控制下作为细胞内表达蛋白生成。多肽主要作为可溶解的细胞溶质活性酶积累。摇瓶过程被用来生成可被用于本文公开的活性测定或生物催化方法的工程化的多肽粉末。
高通量生长和表达。挑取细胞并在30℃、200rpm、和85%湿度的培养条件下在含有1%葡萄糖和30μg/mL氯霉素(CAM)的LB培养基中过夜生长。过夜生长的20μL等份被转移至含有380μL包含30μg/mL CAM、1mM IPTG的2xYT生长培养基的深孔平板,并在30℃、200rpm、和85%湿度下孵育~18h。继代TB培养基由TB培养基(380μL/孔)、30μg/mL CAM和1mM IPTG组成。在4000rpm、4℃下将细胞培养物离心10分钟,并且弃去培养基。在250或400μL裂解缓冲液(0.1M三乙醇胺(TEA)缓冲液、pH 9.0、含有400μg/mL PMBS和500μg/mL溶菌酶)中重悬细胞块并且如以下所描述的裂解物被用于HTP测定。
摇瓶粉末(SFP)的生成。摇瓶过程被用来生成用于本文公开的二次筛选测定或生物催化方法的工程化的转氨酶多肽粉末。摇瓶粉末(SFP)包括大约30%的总蛋白并且相应地提供与HTP测定中使用的细胞裂解物相比更纯的工程化的酶制品。将包含编码感兴趣的工程化的转氨酶的质粒的大肠杆菌的单个菌落接种于含有30μg/ml氯霉素和1%葡萄糖的50ml Luria Bertani肉汤。在250rpm下,使细胞在30℃培养箱中生长过夜(至少16小时)。在1升烧瓶中的含有30μg/ml氯霉素的250mL极品肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾、pH 7.0、1mMMgSO4)中将培养物稀释至0.2的600nm(OD600)光密度,并允许在30℃下生长。当培养物的OD600为0.6至0.8时,转氨酶基因的表达通过添加异丙基-β-D-硫代半乳糖苷(“IPTG”)至1mM的终浓度诱导。然后孵育继续过夜(至少16小时)。通过离心(5000rpm,15min,4℃)收获细胞,并弃去上清液。细胞块用相等体积的冷的(4℃)100mM pH 7.0三乙醇胺(氯化物)缓冲液重悬,并如上通过离心收集。将洗涤的细胞在两体积的冷三乙醇胺(氯化物)缓冲液中重悬,并在12000psi下穿过弗氏压碎器(French Press)2次,同时保持在4℃。通过离心(9000rpm,45min,4℃)除去细胞碎片。收集清澈的裂解物上清液并贮存于-20℃。冷冻的清澈裂解物的冻干提供粗转氨酶多肽的干燥摇瓶粉末。可选择地,细胞团(洗涤之前或之后)被可贮存于4℃或-80℃。
下游加工(DSP)粉末的生成:DSP粉末包括大约80%的总蛋白并且相应地提供与高通量测定中使用的细胞裂解物相比更纯的工程化的转氨酶制品。用于生成DSP粉末的工程化的转氨酶的大规模(~100–120g)发酵可作为短的批次进行,之后根据标准生物处理方法进料批处理。简而言之,转氨酶表达通过添加IPTG至1mM的终浓度来诱导。发酵之后,收获细胞并在100mM三乙醇胺-H2SO4缓冲液中重悬,并通过均化被机械地破坏。细胞碎片和核酸用聚乙烯亚胺(PEI)絮凝并且将悬浮液通过离心澄清。得到的清澈的上清液利用切向错流超滤膜浓缩以去除盐和水。然后浓缩且部分纯化的酶浓缩物可在冻干仪中被干燥并被包装(例如,被包装在聚乙烯容器中)。
实施例3:用于将式(II)的大的酮底物化合物转化成式(I)的手性胺化合物的转氨酶的高通量(HTP)筛选
细胞裂解物的HTP筛选被用来指导具有改进的将大的酮底物(例如,化合物(2))转化成手性胺产物(例如,化合物(1))的特性的工程化的转氨酶多肽的初级选择。
为了制备裂解物,细胞如以上描述的在96孔平板中生长,并通过将200μL(对于SEQ ID NO:4-144的HTP测定)或250μL(对于SEQ IDNO:146-204的HTP测定)裂解缓冲液(1mg/mL溶菌酶、0.5mg/mL多粘菌素B硫酸盐、1mM PLP、0.1M三乙醇胺(TEA)、pH 7.0)分配至每个孔来制备裂解物。密封平板,震荡2h,并且然后在4,000rpm,4℃下离心10min以使细胞碎片成块。
SEQ ID NO:4-144的肽活性的HTP测定:将50μL等份的底物贮存溶液(溶于DMSO中的80g/L化合物(2))连同60μL预混的异丙胺(IPM)/磷酸吡哆醛(PLP)贮存溶液(3.33M IPM和1.67g/L PLP于100mM TEA中,pH 9)和35μL pH 9.0的0.1M TEA缓冲液一起添加至96孔平板的每个孔。通过添加55μL细胞裂解物/孔来启动反应。密封平板并在60℃下孵育并震荡24h。24h后,在18℃、4000rpm下将平板离心3min。用400μL乙腈猝灭反应并如在实施例4中描述的通过HPLC检查样品。
SEQ ID NO:146-204的肽活性的HTP测定:将50μL等份的底物贮存溶液(溶于DMSO中的80g/L化合物(2))连同60μL预混的异丙胺(IPM)/磷酸吡哆醛(PLP)贮存溶液(3.33M IPM和1.67g/L PLP于100mM TEA中,pH9)和60μL pH 9.0的0.1M TEA缓冲液一起添加至96孔平板的每个孔。通过添加30μL细胞裂解物/孔来启动反应。密封平板并在60℃下孵育并震荡24h。24h后,在18℃、4000rpm下将平板离心3min。用400μL乙腈猝灭反应。在室温下继续震荡平板5min并且然后在18℃、4000rpm下继续离心15min以使所有碎片沉淀。如在实施例4中描述的通过HPLC检查样品。
通过SEQ ID NO:146-204的多肽生成的化合物(1)的%de的HTP测定:将50μL等份的底物贮存溶液(溶于DMSO中的40g/L化合物(2))连同60μL预混的异丙胺(IPM)/磷酸吡哆醛(PLP)贮存溶液(3.33M IPM和1.67g/LPLP于100mM TEA中,pH 9)一起添加至96孔平板的每个孔。通过添加90μL细胞裂解物/孔来启动反应。密封平板并在60℃、250rpm下孵育并震荡48h。48h后,在18℃、4000rpm下将平板离心3min。用400μL乙腈猝灭反应。在室温下将平板继续震荡5min以保证所有的底物和产物被溶解。在18℃、4000rpm下将平板离心15min以使所有碎片沉淀。如在实施例4中描述的通过HPLC检查样品。
实施例4:分析步骤
HTP反应活性的HPLC分析:通过取20μL等份的如在实施例3中的猝灭的HTP反应物并添加至含1:1乙腈:水和0.37%(v/v)浓HCl的180μL稀释剂溶液来制备用于活性的HPLC分析的样品。在以下条件下对样品进行HPLC分析。
如以下从得到的色谱图确定化合物(2)至化合物(1)的转化:
转化(%)=产物面积/(产物面积+底物面积)x100%
产物手性纯度(%de)的HPLC分析:通过取40μL等份的如在实施例3中的猝灭的HTP反应物并添加至含1:1乙腈:水和0.84%(v/v)浓HCl的160μL稀释剂溶液来制备用于化合物(1)的手性纯度或非对映异构体过量的HPLC分析的样品。在以下条件下对样品进行HPLC分析。
实施例5:用于以10mL规模将式(II)的大的酮底物化合物转化成式(I)的手性胺化合物的方法
SEQ ID NO:4、8、26、36、40、78、100、102、148、156、160、170、172、180和198的工程化的转氨酶多肽的SFP制品被用于将化合物(2)的大的酮底物转化成手性胺化合物(1)的10mL规模反应。这些反应说明了这些生物催化剂可如何被用于式(I)的化合物的制备。如下进行10mL规模的反应。将4mL 100mM TEA缓冲液(pH 8.0)添加至安装有十字形磁性搅拌棒的20mL玻璃瓶。将2mL 5M IPM·HCl贮存溶液添加至所述瓶,之后是1mL 5mM PLP贮存溶液。溶液的pH为~8.0。以500rpm(磁性搅拌)搅拌混合物。将200mg化合物(2)的酮底物溶解于2.5mL DMSO并且然后添加至所述瓶。使用1.0M NaOH溶液将混合物的pH调整至8.0。最后,添加0.5mL等份的40g/L的工程化的转氨酶多肽的DSP制品的贮存溶液以启动反应。组分的终浓度为:20g/L化合物(2);0.5g/L PLP;1M IPM;25%v/v DMSO;2g/L转氨酶多肽制品;和100mM TEA,pH 7.0。然后在55℃下在热的平板上搅拌混合物。
在不同的时间点取10μL样品并且用200μL乙腈:水(1:1)稀释。将1μL浓HCL添加至样品并且在20,000rpm下将其离心5min。通过HPLC分析这些样品以监测反应的时间进程。24h后,用10mL乙腈猝灭反应混合物并通过HPLC分析混合物以得到化合物(2)至产物化合物(1)的最终转化%。表2B中显示了24h后化合物(2)至产物化合物(1)的转化%的结果。
本申请中提及的所有出版物、专利、专利申请和其他文件为了所有目的在此处通过引用其全部并入,如同单独指明为了所有目的通过引用并入每个单独的出版物、专利、专利申请和其他文件。
虽然已说明和描述了多种具体实施方案,将领会可作出多种改变而不偏离本发明的精神和范围。

Claims (55)

1.一种工程化的多肽,所述工程化的多肽具有转氨酶活性,所述工程化的多肽包含与SEQ ID NO:2具有至少80%同一性,并且与SEQ IDNO:2相比具有在选自X19、X21、X34、X53、X56、X73、X86、X88、X107、X113、X147、X155、X165、X171、X178、X233、X251、X259、X268、X277、X286、X312、X316、X317、X358、X366、X383、X399、X414、X415、X417、X426、X434和X450的残基位置处的一个或更多个残基差异的氨基酸序列,其中在残基位置X21、X56、X86、X88、X107、X113、X133、X147、X233、X286、X312、X316、X383、X415、X417和X434处的残基差异选自:X21H、X56A/C、X86C、X88H/Y、X107G、X113L/P、X147H/V、X233V、X286C/H、X312N、X316C/F/G/N/S/T、X383C/F/I/M/T、X415A/G/H/L/V、X417V和X434T。
2.根据权利要求1所述的工程化的多肽,其中在残基位置X19、X34、X53、X73、X155、X165、X171、X178、X251、X259、X268、X277、X317、X358、X366、X399、X414、X426和X450处的残基差异选自X19W、X34A、X53M、X73R、X155V、X165F、X171Q、X178W、X251V、X259V、X268A、X277A、X317L、X358K、X366H、X399A、X414I、X426R和X450S。
3.根据权利要求1或2所述的工程化的多肽,其中所述氨基酸序列包含与SEQ ID NO:2相比选自X34A、X56A、X88H、X107G、X113L、X147H、X153C、X155V、X233V、X315G、X316N、X383I和X450S的至少一个或更多个残基差异。
4.根据权利要求1、2或3所述的工程化的多肽,其中所述氨基酸序列还包含与SEQ ID NO:2相比选自X31M、X57F/L、X86N/S、X153A、X233T、X323T、X383V和X417T的一个或更多个残基差异。
5.根据权利要求4所述的工程化的多肽,其中所述氨基酸序列包含至少与SEQ ID NO:2相比的包含以下的残基差异的组合:X34A、X56A、X57L、X86S、X88A;X153C、X155V、X163F、X315G、和X417T。
6.根据权利要求5所述的工程化的多肽,其中所述氨基酸序列还包含与SEQ ID NO:2相比的残基差异X316N。
7.根据权利要求6所述的工程化的多肽,其中所述氨基酸序列还包含与SEQ ID NO:2相比选自X31M、X57F、X323T、X383I/T、X415H和X450S的残基差异。
8.根据权利要求7所述的工程化的多肽,其中所述氨基酸序列还包含与SEQ ID NO:2相比选自以下的残基差异的组合:
X31M、X57F、X323T和X383V;
X31M、X57F、X107G、X113L、X233T、X415H和X450S;
X31M、X57F、X233V、X323T、X383I、X415H和X450S;以及
X31M、X57F、X147H、X323T、X383I、X415H和X450S。
9.根据权利要求1所述的工程化的多肽,其中所述转氨酶与SEQ IDNO:4的多肽相比具有至少1.2倍增加的稳定性,其中所述氨基酸序列包含与SEQ ID NO:2相比选自以下的一个或更多个残基差异:X34T、X107G、X113L、X147H、X155V、X233T/V、X323T、X383I/V和X450S。
10.根据权利要求1所述的工程化的多肽,其中所述转氨酶与SEQ IDNO:4的多肽相比在将化合物(2)转化成化合物(1)方面具有至少1.2倍增加的活性,其中所述氨基酸序列包含与SEQ ID NO:2相比选自以下的一个或更多个残基差异:X56A、X86S、X88H、X153C、X415H和X417T。
11.根据权利要求1所述的工程化的多肽,其中所述转氨酶与SEQ IDNO:4的多肽相比在将化合物(2)转化成化合物(1)方面具有增加的对映体选择性,其中所述氨基酸序列包含与SEQ ID NO:2相比选自以下的一个或更多个残基差异:X57F、X153C和X316N。
12.根据权利要求1至11中任一项所述的工程化的多肽,其中所述氨基酸序列还包含与SEQ ID NO:2相比选自以下的残基差异:X18A、X19W、X21H、X31M、X34A、X53M、X56A/C、X57C/F/L、X73R、X86C/N/S/Y、X88H/Y、X107G、X113C/L/P、X146L、X147H/K/V、X153A/C/V、X155A/V、X163L、X165F、X171Q、X178W、X190K、X206K、X228G、X233T/V、X235P、X244T、X251V、X259V、X268A、X277A、X286C/H、X312N、X314N、X315G、X316A/C/F/N/S/T、X317L、X319N、X323T、X358K、X366H、X383C/F/I/L/M/T/V、X395P、X399A、X414I、X415A/G/H/L/V、X417T/V、X424A、X426R、X427Y、X434T和X450S。
13.根据权利要求1至12中任一项所述的工程化的多肽,其中所述氨基酸序列不包含与SEQ ID NO:2相比在位置X9、X45、X177、X211、X294、X324和X391处的残基差异。
14.根据权利要求1所述的工程化的多肽,其中所述氨基酸序列包含选自以下的序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202和204。
15.根据权利要求1至14中任一项所述的工程化的多肽,其中所述多肽被固定在固体支持体上。
16.根据权利要求15所述的工程化的多肽,其中所述固体支持体为珠或树脂,所述珠或树脂包含具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。
17.一种多核苷酸,所述多核苷酸编码权利要求1至14中任一项所述的工程化的转氨酶多肽。
18.一种多核苷酸,所述多核苷酸编码权利要求1所述的工程化的转氨酶多肽,所述多核苷酸包含选自以下的核苷酸序列:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201和203。
19.一种表达载体,所述表达载体包含权利要求17或18所述的多核苷酸。
20.根据权利要求19所述的表达载体,所述表达载体包含控制序列。
21.一种宿主细胞,所述宿主细胞包含权利要求17或18所述的多核苷酸或权利要求19或20所述的表达载体。
22.一种制备权利要求1至14中任一项所述的工程化的多肽的方法,所述方法包括在适于表达所述多肽的条件下培养权利要求21所述的宿主细胞。
23.根据权利要求22所述的方法,所述方法还包括分离所述工程化的多肽。
24.一种用于制备式(I)的胺化合物的方法:
其中
环A为6元碳环,任选地在位置2和3之间和/或位置5和6之间包含不饱和C-C键,和/或任选地用选自卤素、羟基和甲基的基团独立地取代位置2、3、4、5和6;
环B为6元碳环,任选地在位置5和10之间包含不饱和C-C键,和/或任选地在位置9和10中的一个或更多个处用选自卤素、羟基和甲基的基团独立地取代;
环C为5-或6-元碳环(即,m=0或1),任选地在位置10处用选自卤素、羟基、甲基、乙基和羰基的基团取代;
环D为5-、6-或7-元碳环(即n=0、1或2),任选地包含1、2或3个不饱和C-C键,和/或任选地如以下被独立地取代:
在位置14处用选自卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、直链或支链的(C1-C3)烷基氨基和桥接至位置12的环丙基的基团独立地取代;
在位置15或位置16处用选自以下的基团独立地取代:卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳基氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基;
条件是式(I)的化合物不是化合物(1)
其中所述方法包括在合适的反应条件下在氨基供体的存在下使式(II)的酮底物化合物与权利要求1至16中任一项所述的工程化的转氨酶多肽接触,
其中环A、B、C和D为如以上对式(I)的化合物限定的。
25.根据权利要求24所述的方法,其中式(I)的胺化合物为式(Ia)的化合物
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
并且其中所述方法包括在合适的反应条件下在氨基供体的存在下使式(IIa)的酮底物化合物与权利要求1至16中任一项所述的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ia)的化合物限定的。
26.根据权利要求24所述的方法,其中式(I)的胺化合物为式(Ib)的化合物
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D在位置12和14之间包含不饱和C-C键,或在位置12和14之间包含桥接的环丙基;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
并且其中所述方法包括在合适的反应条件下在氨基供体的存在下使式(IIb)的酮底物化合物与权利要求1至16中任一项所述的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ib)的化合物限定的。
27.根据权利要求24所述的方法,其中式(I)的胺化合物为式(Ic)的化合物
其中
环A和B包含以下的一种:
(a)在位置5和6之间的不饱和C-C键;
(b)在位置5和10之间的不饱和C-C键;
(c)与位置4处的甲基基团成顺式的位置5处的氢;或
(d)与位置4处的甲基基团成反式的位置5处的氢;
环D是芳香族的;
R1选自氢、卤素、羟基、甲基、乙基和羰基;
R2选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基、和直链或支链的(C1-C3)烷基氨基;并且
R3选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基和氨基羰基(C1-C6)烷基;
其中所述方法包括在合适的反应条件下在氨基供体的存在下使式(IIc)的酮底物化合物与权利要求1至16中任一项所述的工程化的转氨酶多肽接触,
其中环A、B、C和D,以及R1、R2和R3为如以上对式(Ic)的化合物限定的。
28.根据权利要求24所述的方法,其中式(I)的胺化合物为式(Id)的化合物
其中
环A在位置2和3之间或在位置5和6之间包含不饱和C-C键;
R1和R2独立地选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷基氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫基、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷基氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳基氧基、任选地取代的芳基氨基、任选地取代的芳基硫基、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫基、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基和杂芳基磺酰基(C1-C6)烷基;
R3、R4和R5独立地选自氢、卤素、羟基、氨基、羧基、氰基、硝基、硫基、直链或支链的(C1-C4)烷基、直链或支链的(C1-C4)烯基和直链或支链的(C1-C3)烷基氨基;并且
R6、R7和R8独立地选自氢、卤素、羟基和甲基;
其中所述方法包括在合适的反应条件下在氨基供体的存在下使式(IId)的酮底物化合物与权利要求1至16中任一项所述的工程化的转氨酶多肽接触,
其中R1、R2、R3、R4、R5、R6、R7和R8为如以上对式(Id)的化合物限定的。
29.根据权利要求24至28中任一项所述的方法,其中式(II)的底物化合物载量约0.5至约200g/L、1至约200g/L、5至约150g/L、约10至约100g/L、或约20至约100g/L。
30.根据权利要求29所述的方法,其中式(II)的底物化合物载量至少约0.5g/L、1g/L、5g/L、10g/L、20g/L、30g/L、40g/L、50g/L、100g/L、150g/L或200g/L。
31.根据权利要求24至30中任一项所述的方法,其中所述氨基供体选自由以下组成的组:异丙胺、L-赖氨酸、α-苯乙胺、D-丙氨酸、L-丙氨酸、或D,L-丙氨酸、或D,L-鸟氨酸。
32.根据权利要求31所述的方法,其中所述氨基供体为异丙胺(IPM)。
33.根据权利要求32所述的方法,其中所述异丙胺浓度为约0.1至约3M、0.2至约2.5M、约0.5至约2M、或约1至约2M。
34.根据权利要求33所述的方法,其中所述异丙胺浓度为约0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、1M、1.5M、2M、2.5M或3M。
35.根据权利要求24至34中任一项所述的方法,其中所述合适的反应条件包括缓冲液。
36.根据权利要求35所述的方法,其中所述缓冲液选自硼酸盐、磷酸盐、碳酸盐、三乙醇胺(TEA)和Tris。
37.根据权利要求36所述的方法,其中所述缓冲液包括TEA,其中所述TEA的浓度为约0.01至约0.4M、约0.05至约0.4M、约0.1至约0.3M、或约0.1至约0.2M。
38.根据权利要求37所述的方法,其中所述TEA的浓度为约0.01M、0.02M、0.03M、0.04M、0.05M、0.07M、0.1M、0.12M、0.14M、0.16M、0.18M、0.2M、0.3M或0.4M。
39.根据权利要求24至38中任一项所述的方法,其中所述合适的反应条件包括从约6至约12的pH、从约6至约10的pH、从约6至约8的pH、从约7至约10的pH、从约7至约9的pH、或从约7至约8的pH。
40.根据权利要求39所述的方法,其中所述合适的反应条件包括约6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5或12的pH。
41.根据权利要求24至40中任一项所述的方法,其中所述合适的反应条件包括约10℃至约70℃、约10℃至约65℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约30℃至约55℃、或约50℃至约60℃的温度。
42.根据权利要求41所述的方法,其中所述合适的反应条件包括至少约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃或70℃的温度。
43.根据权利要求24至42中任一项所述的方法,其中所述合适的反应条件包括从约0.1g/L至约10g/L、约0.2g/L至约5g/L、或约0.5g/L至约2.5g/L浓度的吡哆醛辅因子5'-磷酸吡哆醛(PLP)。
44.根据权利要求43所述的方法,其中所述合适的反应条件包括约0.1g/L、0.2g/L、0.5g/L、1g/L、2.5g/L、5g/L或10g/L的PLP浓度。
45.根据权利要求24至44中任一项所述的方法,其中所述合适的反应条件包括共溶剂。
46.根据权利要求45所述的方法,其中所述共溶剂包括极性共溶剂。
47.根据权利要求46所述的方法,其中所述共溶剂选自多元醇、DMSO、或低级醇。
48.根据权利要求47所述的方法,其中所述共溶剂为DMSO。
49.根据权利要求44所述的方法,其中所述DMSO以从约1%至约40%v/v、约2%至约30%v/v、或约5%至约25%v/v的浓度存在。
50.根据权利要求49所述的方法,其中所述DMSO以约1%v/v、2%v/v、5%v/v、10%v/v、15%v/v、20%v/v、25%v/v、30%v/v、35%v/v、35%v/v或40%v/v的浓度存在。
51.根据权利要求24至50所述的方法,其中所述转氨酶多肽浓度为约0.01至约50g/L、约0.05至约50g/L、约0.1至约40g/L、约1至约40g/L、约2至约40g/L、约5至约40g/L、约5至约30g/L、约0.1至约10g/L、约0.5至约10g/L、约1至约10g/L、约0.1至约5g/L、约0.5至约5g/L、或约0.1至约2g/L。
52.根据权利要求51所述的方法,其中所述转氨酶多肽的浓度为约0.01g/L、0.05g/L、0.1g/L、0.2g/L、0.5g/L、1g/L、2g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L或50g/L。
53.根据权利要求24至28中任一项所述的方法,其中所述合适的反应条件包括:
(a)约5g/L至200g/L的底物载量;
(b)约0.1g/L至50g/L的工程化的转氨酶多肽;
(c)约0.1M至4M的异丙胺(IPM);
(d)约0.1g/L至10g/L的磷酸吡哆醛(PLP)辅因子;
(e)约6至9的pH;和
(f)约30℃至65℃的温度。
54.根据权利要求24至28中任一项所述的方法,其中所述合适的反应条件包括:
(a)约10g/L至150g/L的底物载量;
(b)约0.5g/L至20g/L的工程化的转氨酶多肽;
(c)约0.1M至3M的异丙胺(IPM);
(d)约0.1g/L至10g/L的磷酸吡哆醛(PLP)辅因子;
(e)约0.05M至0.20M的三乙醇胺(TEA)缓冲液;
(f)约1%至约45%的DMSO;
(g)约6至9的pH;和
(h)约30℃至65℃的温度。
55.根据权利要求24至28中任一项所述的方法,其中所述合适的反应条件包括:
(a)约20g/L至100g/L的底物载量;
(b)约1g/L至5g/L的工程化的转氨酶多肽;
(c)约0.5M至2M的异丙胺(IPM);
(d)约0.2g/L至2g/L的磷酸吡哆醛(PLP)辅因子;
(e)约0.1M的TEA缓冲液;
(f)约25%的DMSO;
(e)约8的pH;和
(f)约45℃至60℃的温度。
CN201380073649.XA 2012-12-21 2013-12-16 用于合成手性胺的工程化的生物催化剂和方法 Pending CN105008528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202511020229.6A CN120829884A (zh) 2012-12-21 2013-12-16 用于合成手性胺的工程化的生物催化剂和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261745219P 2012-12-21 2012-12-21
US61/745,219 2012-12-21
PCT/US2013/075294 WO2014099730A1 (en) 2012-12-21 2013-12-16 Engineered biocatalysts and methods for synthesizing chiral amines

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202511020229.6A Division CN120829884A (zh) 2012-12-21 2013-12-16 用于合成手性胺的工程化的生物催化剂和方法

Publications (1)

Publication Number Publication Date
CN105008528A true CN105008528A (zh) 2015-10-28

Family

ID=50979069

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380073649.XA Pending CN105008528A (zh) 2012-12-21 2013-12-16 用于合成手性胺的工程化的生物催化剂和方法
CN202511020229.6A Pending CN120829884A (zh) 2012-12-21 2013-12-16 用于合成手性胺的工程化的生物催化剂和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202511020229.6A Pending CN120829884A (zh) 2012-12-21 2013-12-16 用于合成手性胺的工程化的生物催化剂和方法

Country Status (10)

Country Link
US (6) US9902943B2 (zh)
EP (1) EP2935572B1 (zh)
JP (2) JP6618180B2 (zh)
CN (2) CN105008528A (zh)
CA (1) CA2895752C (zh)
DK (1) DK2935572T3 (zh)
HU (1) HUE051359T2 (zh)
IL (1) IL239346B (zh)
SG (1) SG11201504752YA (zh)
WO (1) WO2014099730A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109503403A (zh) * 2018-12-21 2019-03-22 江苏卓和药业有限公司 一种普瑞巴林的拆分方法
CN109957554A (zh) * 2017-12-26 2019-07-02 宁波酶赛生物工程有限公司 工程化转氨酶多肽及其应用
CN111032682A (zh) * 2017-06-14 2020-04-17 科德克希思公司 用于工业生物催化的工程化转氨酶多肽
CN111065744A (zh) * 2017-09-01 2020-04-24 威妥有限公司 用于生产手性胺的方法
CN113396218A (zh) * 2019-01-15 2021-09-14 科德克希思公司 工程化转氨酶多肽
CN113929614A (zh) * 2020-06-29 2022-01-14 上海医药工业研究院 一种藜芦胺类化合物、其制备方法及其应用
CN115427557A (zh) * 2020-04-10 2022-12-02 科德克希思公司 工程化转氨酶多肽

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2828385T3 (en) * 2012-03-23 2018-03-12 Codexis Inc BIOCATALIZATORS AND METHODS FOR SYNTHETIZING DERIVATIVES AND TRYPTAMIN AND TRYPTAMINE ANALOGS
CN105008528A (zh) 2012-12-21 2015-10-28 科德克希思公司 用于合成手性胺的工程化的生物催化剂和方法
WO2016166120A1 (en) * 2015-04-16 2016-10-20 F. Hoffmann-La Roche Ag Mutant transaminases as well as methods and uses relating thereto
CN109777813B (zh) * 2019-01-25 2021-05-07 浙江工业大学 一种转氨酶-plp共固定化酶及其制备与应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011159910A2 (en) * 2010-06-17 2011-12-22 Codexis, Inc. Biocatalysts and methods for the synthesis of (s)-3-(1-aminoethyl)-phenol
CN102341494A (zh) * 2009-01-08 2012-02-01 科德克希思公司 转氨酶多肽
CN102574791A (zh) * 2009-08-05 2012-07-11 无限药品股份有限公司 环杷明类似物的酶促转氨基反应

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4600692A (en) 1983-02-10 1986-07-15 Purification Engineering, Inc. Immobilized cells for preparing phenylalanine
US4518692A (en) 1983-09-01 1985-05-21 Genetics Institute, Inc. Production of L-amino acids by transamination
US4826766A (en) 1985-09-23 1989-05-02 Genetics Institute, Inc. Production of amino acids using coupled aminotransferases
US5316943A (en) 1988-06-14 1994-05-31 Kidman Gene E Racemic conversion of using a transaminase
US4950606A (en) 1989-06-22 1990-08-21 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5169780A (en) 1989-06-22 1992-12-08 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5300437A (en) 1989-06-22 1994-04-05 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
DK0765394T3 (da) 1994-06-03 2001-12-10 Novozymes As Oprensede Myceliopthora-laccaser og nukleinsyrer der koder for disse
DE69534185T2 (de) 1994-06-30 2006-02-23 Novozymes Biotech, Inc., Davis Nicht-toxisches, nicht-toxigenes, nicht-pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
AU2986295A (en) 1995-07-19 1997-02-18 British Biotech Pharmaceuticals Limited N-(amino acid) substituted succinic acid amide derivatives as metalloproteinase inhibitors
US6197558B1 (en) 1997-05-19 2001-03-06 Nsc Technologies Transaminase biotransformation process
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US20050009151A1 (en) 2003-07-10 2005-01-13 Pharmacia Corporation Methods for the stereospecific and enantiomeric enrichment of beta-amino acids
CA2533838A1 (en) 2003-08-11 2005-02-24 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
SG178753A1 (en) 2007-02-12 2012-03-29 Codexis Inc Structure-activity relationships
US7588923B2 (en) 2007-03-02 2009-09-15 Richmond Chemical Corporation Method to increase the yield and improve purification of products from transaminase reactions
WO2008127646A2 (en) 2007-04-11 2008-10-23 Dsm Ip Assets B.V. Transaminase-based processes for preparation of pregabalin
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
DE102009000592A1 (de) 2009-02-04 2010-08-05 Evonik Degussa Gmbh Verfahren zur Herstellung von Aminogruppen tragenden, multizyklischen Ringsystemen
JP5707344B2 (ja) * 2009-02-26 2015-04-30 コデクシス, インコーポレイテッド トランスアミナーゼ生体触媒
DK2828385T3 (en) 2012-03-23 2018-03-12 Codexis Inc BIOCATALIZATORS AND METHODS FOR SYNTHETIZING DERIVATIVES AND TRYPTAMIN AND TRYPTAMINE ANALOGS
CN105008528A (zh) 2012-12-21 2015-10-28 科德克希思公司 用于合成手性胺的工程化的生物催化剂和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102341494A (zh) * 2009-01-08 2012-02-01 科德克希思公司 转氨酶多肽
CN102574791A (zh) * 2009-08-05 2012-07-11 无限药品股份有限公司 环杷明类似物的酶促转氨基反应
WO2011159910A2 (en) * 2010-06-17 2011-12-22 Codexis, Inc. Biocatalysts and methods for the synthesis of (s)-3-(1-aminoethyl)-phenol

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KATARINA S.M.等: "Redesigning and characterizing the substrate specificity andactivity of Vibrio fluvialis aminotransferase for the synthesis of imagabalin", 《PROTEIN ENGINEERING》 *
NONE: "enzymatic synthesis of chiral amines with omega-transaminase", 《IP.COM》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111032682A (zh) * 2017-06-14 2020-04-17 科德克希思公司 用于工业生物催化的工程化转氨酶多肽
CN111032682B (zh) * 2017-06-14 2024-04-12 科德克希思公司 用于工业生物催化的工程化转氨酶多肽
CN111065744A (zh) * 2017-09-01 2020-04-24 威妥有限公司 用于生产手性胺的方法
CN111065744B (zh) * 2017-09-01 2024-05-03 威妥有限公司 用于生产手性胺的方法
CN109957554A (zh) * 2017-12-26 2019-07-02 宁波酶赛生物工程有限公司 工程化转氨酶多肽及其应用
CN109503403A (zh) * 2018-12-21 2019-03-22 江苏卓和药业有限公司 一种普瑞巴林的拆分方法
CN113396218A (zh) * 2019-01-15 2021-09-14 科德克希思公司 工程化转氨酶多肽
CN115427557A (zh) * 2020-04-10 2022-12-02 科德克希思公司 工程化转氨酶多肽
CN113929614A (zh) * 2020-06-29 2022-01-14 上海医药工业研究院 一种藜芦胺类化合物、其制备方法及其应用
CN113929614B (zh) * 2020-06-29 2023-09-12 上海医药工业研究院有限公司 一种藜芦胺类化合物、其制备方法及其应用

Also Published As

Publication number Publication date
SG11201504752YA (en) 2015-07-30
US20170022484A1 (en) 2017-01-26
US9902943B2 (en) 2018-02-27
US20180148698A1 (en) 2018-05-31
US20150329837A1 (en) 2015-11-19
CN120829884A (zh) 2025-10-24
US10435674B2 (en) 2019-10-08
EP2935572B1 (en) 2020-09-30
HUE051359T2 (hu) 2021-03-01
IL239346B (en) 2019-02-28
EP2935572A4 (en) 2016-09-28
JP2020005650A (ja) 2020-01-16
US20200109379A1 (en) 2020-04-09
US11732248B2 (en) 2023-08-22
CA2895752A1 (en) 2014-06-26
US11034939B2 (en) 2021-06-15
US12305201B2 (en) 2025-05-20
JP6618180B2 (ja) 2019-12-11
US20210269777A1 (en) 2021-09-02
US10526587B2 (en) 2020-01-07
US20230332115A1 (en) 2023-10-19
DK2935572T3 (da) 2020-11-16
WO2014099730A1 (en) 2014-06-26
IL239346A0 (en) 2015-07-30
CA2895752C (en) 2021-09-21
EP2935572A1 (en) 2015-10-28
JP2016501544A (ja) 2016-01-21

Similar Documents

Publication Publication Date Title
US12371678B2 (en) Engineered transaminase polypeptides for industrial biocatalysis
US12378537B2 (en) Biocatalysts and methods for synthesizing derivatives of tryptamine and tryptamine analogs
US12305201B2 (en) Engineered biocatalysts and methods for synthesizing chiral amines
WO2022066534A1 (en) Engineered biocatalysts and methods for synthesizing chiral amines

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151028