[go: up one dir, main page]

CN116829946A - 涉及glp1r变体的方法和组合物 - Google Patents

涉及glp1r变体的方法和组合物 Download PDF

Info

Publication number
CN116829946A
CN116829946A CN202180073480.2A CN202180073480A CN116829946A CN 116829946 A CN116829946 A CN 116829946A CN 202180073480 A CN202180073480 A CN 202180073480A CN 116829946 A CN116829946 A CN 116829946A
Authority
CN
China
Prior art keywords
antibody
cases
seq
nos
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180073480.2A
Other languages
English (en)
Inventor
亚伦·萨托
潘卡杰·加格
刘强
福米可·阿克塞尔罗德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Twist Bioscience Corp
Original Assignee
Twist Bioscience Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Twist Bioscience Corp filed Critical Twist Bioscience Corp
Priority claimed from PCT/US2021/047616 external-priority patent/WO2022046944A2/en
Publication of CN116829946A publication Critical patent/CN116829946A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本文提供了涉及胰高血糖素样肽‑1受体(GLP1R)文库的方法和组合物,该文库具有编码结合至GLP1R的免疫球蛋白的核酸。本文所述的文库包括包含核酸的多样化文库,每个核酸编码至少一个预定参考核酸序列的预定变体。本文还描述了在翻译核酸文库时生成的蛋白质文库。本文还描述了表达本文所述的多样化核酸文库的细胞文库。

Description

涉及GLP1R变体的方法和组合物
交叉引用
本申请要求于2020年8月26日提交的美国临时专利申请第63/070,734号和2020年9月22日提交的美国临时专利申请第63/081,801号的权益,这些申请中的每一个通过引用整体并入本文。
背景技术
G蛋白偶联受体(GPCR)涉及多种疾病。由于在获得合适的抗原方面存在问题,因此产生针对GPCR的抗体一直是困难的,因为GPCR在细胞中通常以低水平表达,并且在纯化时非常不稳定。因此,需要改进的药剂进行靶向GPCR的治疗性干预。
援引并入
本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被明确且单独地表明通过引用并入。
发明内容
本文提供了结合GLP1R的抗体或抗体片段,所述抗体或抗体片段包含免疫球蛋白重链和免疫球蛋白轻链:(a)其中免疫球蛋白重链包含与表9中所示的氨基酸序列至少约90%相同的氨基酸序列;并且(b)其中免疫球蛋白轻链包含与表10中所示的氨基酸序列至少约90%相同的氨基酸序列。本文还提供了抗体或抗体片段,其中抗体是单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)、单链抗体、Fab片段、F(ab’)2片段、Fd片段、Fv片段、单结构域抗体、分离的互补决定区(CDR)、双抗体、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体(intrabody)、抗独特型(抗Id)抗体或其ab抗原结合片段。本文还提供了抗体或抗体片段,其中抗体或其抗体片段是嵌合的或人源化的。本文还提供了抗体或抗体片段,其中抗体或抗体片段在cAMP测定中的EC50小于约25纳摩尔。本文还提供了抗体或抗体片段,其中抗体或抗体片段在cAMP测定中的EC50小于约20纳摩尔。本文还提供了抗体或抗体片段,其中抗体或抗体片段在cAMP测定中的EC50小于约10纳摩尔。本文还提供了抗体或抗体片段,其中抗体或抗体片段是GLP1R的激动剂。本文还提供了抗体或抗体片段,其中抗体或抗体片段是GLP1R的拮抗剂。本文还提供了抗体或抗体片段,其中抗体或抗体片段是GLP1R的别构调节剂。本文还提供了抗体或抗体片段,其中GLP1R的别构调节剂是负性别构调节剂。
本文提供了治疗代谢疾病或病症的方法,所述方法包括施用结合GLP1R的抗体或抗体片段,其中抗体或抗体片段包含表7-13中所示的序列。本文还提供了方法,其中抗体是单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)、单链抗体、Fab片段、F(ab’)2片段、Fd片段、Fv片段、单结构域抗体、分离的互补决定区(CDR)、双抗体、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体或其ab抗原结合片段。本文还提供了方法,其中抗体或其抗体片段是嵌合的或人源化的。本文还提供了方法,其中抗体或抗体片段在cAMP测定中的EC50小于约25纳摩尔。本文还提供了方法,其中抗体或抗体片段在cAMP测定中的EC50小于约20纳摩尔。本文还提供了方法,其中抗体或抗体片段在cAMP测定中的EC50小于约10纳摩尔。本文还提供了方法,其中抗体或抗体片段是GLP1R的激动剂。本文还提供了方法,其中抗体或抗体片段是GLP1R的拮抗剂。本文还提供了方法,其中抗体或抗体片段是GLP1R的别构调节剂。本文还提供了方法,其中GLP1R的别构调节剂是负性别构调节剂。本文还提供了方法,其中抗体或抗体片段是别构调节剂。本文还提供了方法,其中抗体或抗体片段是负性别构调节剂。本文还提供了方法,其中代谢疾病或病症是II型糖尿病或肥胖症。
本文提供了抗体或抗体片段,其包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(b)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(c)CDRH3的氨基酸序列如SEQ IDNO:799-977中的任一者所示;(d)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(e)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(f)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。本文还提供了抗体或抗体片段,其中抗体是单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)、单链抗体、Fab片段、F(ab’)2片段、Fd片段、Fv片段、单结构域抗体、分离的互补决定区(CDR)、双抗体、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体或其ab抗原结合片段。本文还提供了抗体或抗体片段,其中抗体或其抗体片段是嵌合的或人源化的。本文还提供了抗体或抗体片段,其中抗体或抗体片段在cAMP测定中的EC50小于约25纳摩尔。本文还提供了抗体或抗体片段,其中抗体或抗体片段在cAMP测定中的EC50小于约20纳摩尔。本文还提供了抗体或抗体片段,其中抗体或抗体片段在cAMP测定中的EC50小于约10纳摩尔。本文还提供了抗体或抗体片段,其中抗体或抗体片段是GLP1R的激动剂。本文还提供了抗体或抗体片段,其中抗体或抗体片段是GLP1R的拮抗剂。本文还提供了抗体或抗体片段,其中抗体或抗体片段是GLP1R的别构调节剂。本文还提供了抗体或抗体片段,其中GLP1R的别构调节剂是负性别构调节剂。本文还提供了抗体或抗体片段,其中VH包含与SEQ ID NO:58-77中的任一者至少约90%相同的序列。本文还提供了抗体或抗体片段,其中VH包含SEQ ID NO:58-77中的任一者的序列。本文还提供了抗体或抗体片段,其中VL包含与SEQ ID NO:92-111中的任一者至少约90%相同的序列。本文还提供了抗体或抗体片段,其中VL包含SEQ ID NO:92-111中的任一者的序列。
本文提供了治疗代谢疾病或病症的方法,所述方法包括施用结合GLP1R的抗体或抗体片段,该抗体或抗体片段包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(b)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(c)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;(d)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(e)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(f)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。本文还提供了方法,其中抗体是单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)、单链抗体、Fab片段、F(ab’)2片段、Fd片段、Fv片段、单结构域抗体、分离的互补决定区(CDR)、双抗体、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体或其ab抗原结合片段。本文还提供了方法,其中抗体或其抗体片段是嵌合的或人源化的。本文还提供了方法,其中抗体或抗体片段在cAMP测定中的EC50小于约25纳摩尔。本文还提供了方法,其中抗体或抗体片段在cAMP测定中的EC50小于约20纳摩尔。本文还提供了方法,其中抗体或抗体片段在cAMP测定中的EC50小于约10纳摩尔。本文还提供了方法,其中抗体或抗体片段是GLP1R的激动剂。本文还提供了方法,其中抗体或抗体片段是GLP1R的拮抗剂。本文还提供了方法,其中抗体或抗体片段是GLP1R的别构调节剂。本文还提供了方法,其中GLP1R的别构调节剂是负性别构调节剂。本文还提供了方法,其中抗体或抗体片段是别构调节剂。本文还提供了方法,其中抗体或抗体片段是负性别构调节剂。本文还提供了方法,其中VH包含与SEQ ID NO:58-77中的任一者至少约90%相同的序列。本文还提供了方法,其中VH包含SEQ ID NO:58-77中的任一者的序列。本文还提供了方法,其中VL包含与SEQ ID NO:92-111中的任一者至少约90%相同的序列。本文还提供了方法,其中VL包含SEQ ID NO:92-111中的任一者的序列。本文还提供了方法,其中代谢疾病或病症是II型糖尿病或肥胖症。
本文提供了核酸组合物,其包含:a)编码可变结构域重链区(VH)的第一核酸,该可变结构域重链区(VH)包含互补决定区CDRH1、CDRH2和CDRH3,并且其中(i)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(ii)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(iii)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;b)编码可变结构域轻链区(VL)的第二核酸,该可变结构域轻链区(VL)包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(i)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(ii)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(iii)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。
本文提供了核酸组合物,其包含:a)编码可变结构域重链区(VH)的第一核酸,该可变结构域重链区(VH)包含与如SEQ ID NO:58-77中的任一者所示的序列至少约90%相同的氨基酸序列;b)编码可变结构域轻链区(VL)的第二核酸,该可变结构域轻链区(VL)包含与如SEQ ID NO:92-111中的任一者所示的序列至少约90%相同的氨基酸序列;以及赋形剂。本文还提供了核酸组合物,其中VH包含如SEQ ID NO:58-77中的任一者所示的氨基酸序列。本文还提供了核酸组合物,其中VL包含如SEQ ID NO:92-111中的任一者所示的氨基酸序列。本文还提供了核酸组合物,其中VH包含如SEQ ID NO:58-77中的任一者所示的氨基酸序列,并且其中VL包含如SEQ ID NO:92-111中的任一者所示的氨基酸序列。
附图说明
图1A描绘了免疫球蛋白的第一示意图。
图1B描绘了免疫球蛋白的第二示意图。
图2描绘了置于免疫球蛋白中的基序的示意图。
图3呈现了说明如本文公开的基因合成的示例性过程工作流程的步骤图。
图4示出了计算机系统的实例。
图5是示出计算机系统的体系结构的框图。
图6是说明配置为合并多个计算机系统、多个移动电话和个人数据助理以及网络附加存储(NAS)的网络的图。
图7是使用共享虚拟地址内存空间的多处理器计算机系统的框图。
图8A描绘了包含使用接头与VL结构域附接的VH结构域的免疫球蛋白的示意图。
图8B描绘了包含使用接头与VL结构域附接的VH结构域、前导序列和pIII序列的免疫球蛋白全结构域体系结构的示意图。
图8C描绘了VL或VH结构域的4个框架元件(FW1、FW2、FW3、FW4)和3个可变CDR(L1、L2、L3)元件的示意图。
图9A描绘了与GLP-1受体(GLP-1R,灰色)复合的胰高血糖素样肽1(GLP-1,青色)的结构,PDB条目5VAI。
图9B描绘了与环肽拮抗剂CVX15(蓝色)复合的CXCR4趋化因子受体(灰色)的晶体结构,PDB条目3OR0。
图9C描绘了含跨膜结构域(灰色)和胞外结构域(ECD)(橙色)的人平滑(smoothened)受体的晶体结构,PDB条目5L7D。ECD通过胞外环3(ECL3)与TMD接触。
图9D描绘了与Fab(洋红色)复合的GLP-1R(灰色)的结构,PDB条目6LN2。
图9E描绘了与病毒趋化因子拮抗剂病毒巨噬细胞炎性蛋白2(vMIP-II,绿色)复合的CXCR4(灰色)的晶体结构,PDB条目4RWS。
图10描绘了GPCR聚焦型文库设计的示意图。2个种系重链VH1-69和VH3-30;4个种系轻链IGKV1-39和IGKV3-15以及IGLV1-51和IGLV2-14。
图11描绘了与来自3个健康成人供体的B细胞群体中的HCDR3长度分布相比,GPCR聚焦型文库中的HCDR3长度分布图。总共分析了来自GPCR文库的2,444,718个独特VH序列和来自人B细胞组库(repertoire)的2,481,511个独特VH序列,以生成长度分布图。
图12A描绘了用于噬菌体抗体文库选择的过表达GLP-1R的CHO细胞的设计。通过双重检测GFP绿色荧光和细胞表面Flag标签的表面表达的门控来证实GLP-1R表达。
图12B描绘了基于细胞的淘选过程。
图13描绘了五轮GLP-1R淘选的输出池中独特HCDR3百分比的图。
图14描绘了与亲代CHO细胞结合相比,13个独特GLP-1R命中物(Hit)的结合图。
图15描绘了13个独特GLP1R结合剂的HCDR3环序列。克隆中的6个具有GLP-1基序,克隆中的4个具有GLP-2基序,并且3个克隆不具有GLP-1或GLP-2基序。对于具有GLP-1或GLP-2基序的克隆,与GLP-1序列或GLP-2序列相似的残基用黑色着色,而不同的残基用红色着色。cAMP测定中的功能性拮抗剂用黄色突出显示。
图16A描绘了在不存在和存在GLP-1(7-36)的情况下GLP1R-3结合的正位抑制图。
图16B描绘了在cAMP测定中GLP1R-3对GLP-1活化的作用的图。
图16C描绘了GLP1R-3对GLP-1诱导的β-抑制蛋白募集的作用的图。
图17描绘了GLP1R-59-2的设计。GLP1(7-36)肽与功能失活的GLP-1R结合抗体GLP1R-2的轻链N-末端连接。
图18A描绘了GLP-1R-59-2与GLP-1R特异性结合的图,EC50为15.5nM。
图18B描绘了cAMP测定中的GLP1R-59-2的图,EC50与GLP-17-36肽相似。
图18C描绘了GLP-1R-59-2在GLP-1R表达细胞中诱导β-抑制蛋白募集的图。
图19A-19B描绘了GLP1R-3和GLP1R-59-2的体内药代动力学(PK)和药效学(PD)作用。基于β相计算,GLP1R-3在大鼠中的半衰期为1周(图19A)。GLP1R-59-2在大鼠中的半衰期为2天(图19B)。
图20A描绘了葡萄糖攻击后GLP1R-59-2对葡萄糖的图。
图20B描绘了葡萄糖耐量试验(GTT)中曲线下面积(AUC)的图。
图21A描绘了GLP1R-3和GLP-1肽毒蜥外泌肽9-39治疗、19+2小时给药方案的图。
图21B描绘了胰岛素耐量试验(ITT)中曲线下面积(AUC)的图。
图22A描绘了与GLP-1肽毒蜥外泌肽9-39(1.0或0.23mg/kg剂量)或对照相比,胰岛素攻击后GLP1R-3治疗、单次6小时给药方案的图。
图22B描绘了ITT中6小时GLP1R-3(20mg/kg)治疗的曲线下面积(AUC)的图。
图23A描绘了与GLP1R-226-1、GLP1R-226-2或对照相比,胰岛素攻击后GLP1R-3治疗、单次6小时给药方案的图。
图23B描绘了与GLP1R-226-1、GLP1R-226-2或对照相比,胰岛素攻击后GLP1R-3治疗、单次6小时给药方案的曲线下面积(AUC)。
图24A-24B是GLP1R-221和GLP1R-222变体的淘选策略的示意图。
图25A-25B是GLP1R-221和GLP1R-222变体的竞争数据的图。
图26是cAMP测定中GLP1R-221和GLP1R-222变体的图。
具体实施方式
除非另有说明,否则本发明采用本领域技术范围内的常规分子生物学技术。除非另有定义,否则本文所用的所有技术和科学术语具有与本领域的普通技术人员通常理解的相同的含义。
定义
在整个本发明中,各种实施方案以范围格式呈现。应理解,范围格式的描述仅仅是为了方便和简洁,而不应被解释为对任何实施方案的范围的硬性限制。因此,除非上下文另有明确规定,否则范围的描述应被认为已经具体公开了所有可能的子范围以及在该范围内至下限单位的十分之一的单个数值。例如,范围的描述(例如1至6)应被认为具有具体公开的子范围(例如1至3、1至4、1至5、2至4、2至6、3至6等),以及该范围内的单个值(例如1.1、2、2.3、5和5.9)。无论范围的宽度如何,这都适用。这些中间范围的上限和下限可以独立地包括在较小范围内,并且也涵盖在本发明内,在所述范围中受到任何明确排除的限制。除非上下文另外明确规定,否则在所述范围包括限制中的一个或两个的情况下,排除那些包括的限制中的任一个或两个的范围也包括在本发明中。
本文所用的术语仅仅是为了描述特定实施方案,而不旨在限制任何实施方案。如本文所用,除非上下文另有明确指示,否则单数形式“一种(a)”、“一个(an)”和“所述(the)”也旨在包括复数形式。还应理解,术语“包括”和/或“包含”在本说明书中使用时指定所述特征、整数、步骤、操作、元件、组分和/或群组的存在,但不排除一个或多个其他特征、整数、步骤、操作、元件、组分和/或其群组的存在或添加。如本文所用,术语“和/或”包括相关所列项目中的一个或多个的任何和所有组合。
除非特别说明或从上下文显而易见,否则如本文所用,关于数量或数量范围的术语“约”应理解为是指所述数量及数量+/-10%,或者对于范围所列的值低于所列下限的10%和高于所列上限的10%。
除非特别说明,否则如本文所用,术语“核酸”涵盖双链或三链核酸以及单链分子。在双链或三链核酸中,核酸链不必共同延伸(即,双链核酸不必沿两条链的全长都是双链的)。当提供时,除非另有说明,否则核酸序列以5’至3’方向列出。本文所述的方法提供了分离的核酸的生成。本文所述的方法另外提供了分离并纯化的核酸的生成。如本文提及的“核酸”的长度可以包含至少5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000或更多个碱基。此外,本文提供了用于合成任意数目的编码多肽区段的核苷酸序列的方法,该核苷酸序列包括编码非核糖体肽(NRP)的序列、编码非核糖体肽合成酶(NRPS)模块和合成变体的序列、其他模块蛋白(例如抗体)的多肽区段、来自其他蛋白家族的多肽区段,包括非编码DNA或RNA,例如调节序列,例如启动子、转录因子、增强子、siRNA、shRNA、RNAi、miRNA、衍生自微小RNA的小核仁RNA,或任何功能性或结构性目的DNA或RNA单元。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、基因间DNA、由连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、小核仁RNA、核酶、互补DNA(cDNA)(其是mRNA的DNA呈现形式,通常通过信使RNA(mRNA)的逆转录或通过扩增来获得);合成或通过扩增产生的DNA分子、基因组DNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。编码本文提及的基因或基因片段的cDNA可包含至少一个编码外显子序列的区域,在基因组等同序列中没有插入内含子序列。
GLP1受体的GPCR文库
本文提供了涉及胰高血糖素样肽-1受体(GLP1R)的G蛋白偶联受体(GPCR)结合文库的方法和组合物,其包含编码免疫球蛋白的核酸,该免疫球蛋白包含GPCR结合结构域。如本文所述的免疫球蛋白可以稳定地支持GPCR结合结构域。GPCR结合结构域可基于GLP1R配体和GLP1R的表面相互作用来设计。如本文所述的文库可进一步多样化以提供包含核酸的变体文库,每个核酸编码至少一个预定参考核酸序列的预定变体。本文还描述了可在翻译核酸文库时生成的蛋白质文库。在一些情况下,如本文所述的核酸文库被转移至细胞中以生成细胞文库。本文还提供了使用本文所述方法合成的文库的下游应用。下游应用包括鉴定生物学相关功能增强(例如,改善的稳定性、亲和力、结合、功能活性)和用于治疗或预防与GPCR信号传导相关的疾病状态的变体核酸或蛋白质序列。
本文提供了包含编码免疫球蛋白的核酸的文库。在一些情况下,免疫球蛋白是抗体。如本文所用,术语抗体应理解为包括具有典型抗体分子的特征性两臂Y形的蛋白质以及保留特异性结合至抗原的能力的抗体的一个或多个片段。示例性抗体包括但不限于单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)(包括其中VL和VH使用重组方法通过合成或天然接头连接的片段、该接头使得它们能够被制成其中VL和VH区配对以形成单价分子的单蛋白链,包括单链Fab和scFab)、单链抗体、Fab片段(包括包含VL、VH、CL和CH1结构域的单价片段)、F(ab’)2片段(包括包含通过铰链区二硫键连接的两个Fab片段的二价片段)、Fd片段(包括包含VH和CH1片段的片段)、Fv片段(包括包含抗体单臂的VL和VH结构域的片段)、单结构域抗体(dAb或sdAb)(包括包含VH结构域的片段)、分离的互补决定区(CDR)、双抗体(包括包含二价二聚体(例如彼此结合并识别两种不同抗原的两个VL和VH结构域)的片段)、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体或其ab抗原结合片段。在一些情况下,本文公开的文库包含编码免疫球蛋白的核酸,其中免疫球蛋白是Fv抗体,包括由含有完整抗原识别和抗原结合位点的最小抗体片段组成的Fv抗体。在一些实施方案中,Fv抗体由紧密非共价缔合的一个重链和一个轻链可变结构域的二聚体组成,并且每个可变结构域的三个高变区相互作用,以在VH-VL二聚体的表面上限定抗原结合位点。在一些实施方案中,六个高变区赋予抗体抗原结合特异性。在一些实施方案中,单可变结构域(或仅包含三个抗原特异性高变区的Fv的一半,包括分离自骆驼科动物的包含一个重链可变结构域的单结构域抗体,例如VHH抗体或纳米抗体)具有识别和结合抗原的能力。在一些情况下,本文公开的文库包含编码免疫球蛋白的核酸,其中免疫球蛋白是单链Fv或scFv,包括包含VH、VL或VH和VL结构域的抗体片段,其中这两个结构域存在于单一多肽链中。在一些实施方案中,Fv多肽还包含VH和VL结构域之间的多肽接头,从而允许scFv形成抗原结合所需的结构。在一些情况下,scFv与Fc片段连接,或VHH与Fc片段(包括微抗体)连接。在一些情况下,抗体包含免疫球蛋白分子和免疫球蛋白分子的免疫活性片段,例如,含有抗原结合位点的分子。免疫球蛋白分子是任何类型(例如,IgG、IgE、IgM、IgD、IgA和IgY)、类别(例如,IgG 1、IgG 2、IgG 3、IgG 4、IgA 1和IgA 2)或亚类的。
在一些实施方案中,文库包含适于预期治疗性靶的物种的免疫球蛋白。通常,这些方法包括“哺乳动物化”,并且包括将供体抗原结合信息转移至免疫原性较低的哺乳动物抗体受体以生成有用的治疗性处理的方法。在一些情况下,哺乳动物是小鼠、大鼠、马、绵羊、牛、灵长类动物(例如,黑猩猩、狒狒、大猩猩、红毛猩猩、猴)、狗、猫、猪、驴、兔或人。在一些情况下,本文提供了用于抗体猫源化和犬源化的文库和方法。
非人抗体的“人源化”形式可以是含有衍生自非人抗体的最小序列的嵌合抗体。人源化抗体通常是人抗体(受体抗体),其中来自一个或多个CDR的残基被来自非人抗体(供体抗体)的一个或多个CDR的残基取代。供体抗体可以是任何合适的非人抗体,例如具有所需特异性、亲和力或生物学效应的小鼠、大鼠、兔、鸡或非人灵长类动物抗体。在一些情况下,受体抗体的选定框架区残基被来自供体抗体的相应框架区残基取代。人源化抗体还可包含不存在于受体抗体或供体抗体中的残基。在一些情况下,进行这些修饰以进一步改进抗体性能。
“犬源化”可以包括将非犬抗原结合信息从供体抗体转移至免疫原性较低的犬抗体受体以生成可用作狗治疗剂的治疗的方法。在一些情况下,本文提供的非犬抗体的犬源化形式是含有衍生自非犬抗体的最小序列的嵌合抗体。在一些情况下,犬源化抗体是犬抗体序列(“受体”或“接受体”抗体),其中受体的高变区残基被来自非犬物种(“供体”抗体)的高变区残基取代,该非犬物种例如小鼠、大鼠、兔、猫、狗、山羊、鸡、牛、马、美洲驼、骆驼、单峰驼、鲨鱼、非人灵长类动物、人、人源化、重组序列或具有所需特性的工程化序列。在一些情况下,犬抗体的框架区(FR)残基被相应的非犬FR残基取代。在一些情况下,犬源化抗体包括不存在于受体抗体或供体抗体中的残基。在一些情况下,进行这些修饰以进一步改进抗体性能。犬源化抗体还可包含犬抗体免疫球蛋白恒定区(Fc)的至少一部分。
“猫源化”可以包括将非猫抗原结合信息从供体抗体转移至免疫原性较低的猫抗体受体以生成可用作猫治疗剂的治疗的方法。在一些情况下,本文提供的非猫抗体的猫源化形式是含有衍生自非猫抗体的最小序列的嵌合抗体。在一些情况下,猫源化抗体是猫抗体序列(“受体”或“接受体”抗体),其中受体的高变区残基被来自非猫物种(“供体”抗体)的高变区残基取代,该非猫物种例如小鼠、大鼠、兔、猫、狗、山羊、鸡、牛、马、美洲驼、骆驼、单峰驼、鲨鱼、非人灵长类动物、人、人源化、重组序列或具有所需特性的工程化序列。在一些情况下,猫抗体的框架区(FR)残基被相应的非猫FR残基取代。在一些情况下,猫源化抗体包括不存在于受体抗体或供体抗体中的残基。在一些情况下,进行这些修饰以进一步改进抗体性能。猫源化抗体还可包含猫抗体免疫球蛋白恒定区(Fc)的至少一部分。
本文提供了包含编码非免疫球蛋白的核酸的文库。例如,非免疫球蛋白是抗体模拟物。示例性抗体模拟物包括但不限于anticalins、affilins、亲和体(affibody)分子、affimers、affitins、alphabodies、avimers、atrimers、DARPins、fynomers、基于Kunitz结构域的蛋白、单抗体(monobodies)、anticalins、knottins、基于犰狳重复蛋白的蛋白和双环肽。
本文所述的文库包含编码免疫球蛋白的核酸,该免疫球蛋白在其至少一个区域中包含变异。抗体变异的示例性区域包括但不限于互补决定区(CDR)、可变结构域或恒定结构域。在一些情况下,CDR是CDR1、CDR2或CDR3。在一些情况下,CDR是重结构域,包括但不限于CDRH1、CDRH2和CDRH3。在一些情况下,CDR是轻结构域,包括但不限于CDRL1、CDRL2和CDRL3。在一些情况下,可变结构域是可变结构域轻链(VL)或可变结构域重链(VH)。在一些情况下,VL结构域包含κ或λ链。在一些实例中,恒定结构域是恒定结构域轻链(CL)或恒定结构域重链(CH)。
本文所述的方法提供了包含编码免疫球蛋白的核酸的文库的合成,其中每个核酸编码至少一个预定参考核酸序列的预定变体。在一些情况下,预定参考序列是编码蛋白质的核酸序列,并且变体文库包含编码至少单个密码子的变异的序列,使得由合成核酸编码的后续蛋白质中单个残基的多个不同变体通过标准翻译过程生成。在一些情况下,变体文库包含在多个位置处共同编码变异的不同核酸。在一些情况下,变体文库包含编码CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL或VH结构域的至少单个密码子的变异的序列。在一些情况下,变体文库包含编码CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL或VH结构域的多个密码子的变异的序列。在一些情况下,变体文库包含编码框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)的多个密码子的变异的序列。用于变异的密码子的示例性数目包括但不限于至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、225、250、275、300或多于300个密码子。
在一些情况下,免疫球蛋白变异的至少一个区域来自重链V基因家族、重链D基因家族、重链J基因家族、轻链V基因家族或轻链J基因家族。在一些情况下,轻链V基因家族包含免疫球蛋白κ(IGK)基因或免疫球蛋白λ(IGL)。示例性基因包括但不限于IGHV1-18、IGHV1-69、IGHV1-8、IGHV3-21、IGHV3-23、IGHV3-30/33rn、IGHV3-28、IGHV1-69、IGHV3-74、IGHV4-39、IGHV4-59/61、IGKV1-39、IGKV1-9、IGKV2-28、IGKV3-11、IGKV3-15、IGKV3-20、IGKV4-1、IGLV1-51、IGLV2-14、IGLV1-40和IGLV3-1。在一些情况下,基因是IGHV1-69、IGHV3-30、IGHV3-23、IGHV3、IGHV1-46、IGHV3-7、IGHV1或IGHV1-8。在一些情况下,基因是IGHV1-69和IGHV3-30。在一些情况下,基因是IGHJ3、IGHJ6、IGHJ、IGHJ4、IGHJ5、IGHJ2或IGH1。在一些情况下,基因是IGHJ3、IGHJ6、IGHJ或IGHJ4。
本文提供了包含编码免疫球蛋白的核酸的文库,其中文库用不同数目的片段合成。在一些情况下,片段包含CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL或VH结构域。在一些情况下,片段包含框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)。在一些情况下,免疫球蛋白文库用至少或约2个片段、3个片段、4个片段、5个片段或多于5个片段合成。核酸片段中每一个的长度或合成的核酸的平均长度可以为至少或约50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600或多于600个碱基对。在一些情况下,长度为约50至600、75至575、100至550、125至525、150至500、175至475、200至450、225至425、250至400、275至375或300至350个碱基对。
当被翻译时,如本文所述的包含编码免疫球蛋白的核酸的文库包含各种长度的氨基酸。在一些情况下,氨基酸片段中每一个的长度或合成的氨基酸的平均长度可以为至少或约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150或多于150个氨基酸。在一些情况下,氨基酸的长度为约15至150、20至145、25至140、30至135、35至130、40至125、45至120、50至115、55至110、60至110、65至105、70至100或75至95个氨基酸。在一些情况下,氨基酸的长度为约22个氨基酸至约75个氨基酸。在一些情况下,免疫球蛋白包含至少或约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000或多于5000个氨基酸。
使用如本文所述的方法从头合成免疫球蛋白变异的至少一个区域的许多变体序列。在一些情况下,从头合成CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL、VH或其组合的许多变体序列。在一些情况下,从头合成框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)的许多变体序列。变体序列的数目可以为至少或约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500或多于500个序列。在一些情况下,变体序列的数目为至少或约500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000或多于8000个序列。在一些情况下,变体序列的数目为约10至500、25至475、50至450、75至425、100至400、125至375、150至350、175至325、200至300、225至375、250至350或275至325个序列。
在一些情况下,免疫球蛋白至少一个区域的变体序列在长度或序列上不同。在一些情况下,从头合成的至少一个区域是针对CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL、VH或其组合。在一些情况下,从头合成的至少一个区域是针对框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)。在一些情况下,与野生型相比,变体序列包含至少或约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或多于50个变体核苷酸或氨基酸。在一些情况下,与野生型相比,变体序列包含至少或约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个另外的核苷酸或氨基酸。在一些情况下,与野生型相比,变体序列包含少至少或约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个核苷酸或氨基酸。在一些情况下,文库包含至少或约101、102、103、104、105、106、107、108、109、1010或多于1010个变体。
在合成本文所述的文库后,文库可用于筛选和分析。例如,测定文库的文库可展示性和淘选。在一些情况下,使用可选择的标签测定可展示性。示例性标签包括但不限于放射性标记、荧光标记、酶、化学发光标签、比色标签、亲和标签或本领域已知的其他标记或标签。在一些情况下,标签是组氨酸、多组氨酸、myc、血凝素(HA)或FLAG。在一些情况下,使用各种方法通过测序测定文库,包括但不限于单分子实时(SMRT)测序、聚合酶克隆(Polony)测序、连接测序、可逆终止子测序、质子检测测序、离子半导体测序、纳米孔测序、电子测序、焦磷酸测序、Maxam-Gilbert测序、链终止(例如,Sanger)测序、+S测序或合成测序。
在一些情况下,测定文库的功能活性、结构稳定性(例如,热稳定或pH稳定)、表达、特异性或其组合。在一些情况下,测定文库中能够折叠的免疫球蛋白(例如,抗体)。在一些情况下,测定抗体区域的功能活性、结构稳定性、表达、特异性、折叠或其组合。例如,测定VH区或VL区的功能活性、结构稳定性、表达、特异性、折叠或其组合。
GLP1R文库
本文提供了GLP1R结合文库,其包含编码结合至GLP1R的免疫球蛋白(例如,抗体)的核酸。在一些情况下,GLP1R结合结构域的免疫球蛋白序列通过GLP1R结合结构域和GLP1R之间的相互作用来确定。
本文提供了包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的文库,其中GLP1R结合结构域是基于GLP1R上的表面相互作用设计的。在一些情况下,GLP1R包含如SEQID NO:1定义的序列。在一些情况下,GLP1R结合结构域与GLP1R的氨基或羧基末端相互作用。在一些情况下,GLP1R结合结构域与至少一个跨膜结构域相互作用,包括但不限于跨膜结构域1(TM1)、跨膜结构域2(TM2)、跨膜结构域3(TM3)、跨膜结构域4(TM4)、跨膜结构域5(TM5)、跨膜结构域6(TM6)和跨膜结构域7(TM7)。在一些情况下,GLP1R结合结构域与GLP1R的胞内表面相互作用。例如,GLP1R结合结构域与至少一个胞内环相互作用,包括但不限于胞内环1(ICL1)、胞内环2(ICL2)和胞内环3(ICL3)。在一些情况下,GLP1R结合结构域与GLP1R的胞外表面相互作用。例如,GLP1R结合结构域与GLP1R的至少一个胞外结构域(ECD)或胞外环(ECL)相互作用。胞外环包括但不限于胞外环1(ECL1)、胞外环2(ECL2)和胞外环3(ECL3)。
本文描述了GLP1R结合结构域,其中GLP1R结合结构域是基于GLP1R配体和GLP1R之间的表面相互作用设计的。在一些情况下,配体是肽。在一些情况下,配体是胰高血糖素、胰高血糖素样肽1-(7-36)酰胺、胰高血糖素样肽1-(7-37)、利拉鲁肽、毒蜥外泌肽-4、利西拉肽、T-0632、GLP1R0017或BETP。在一些情况下,配体是GLP1R激动剂。在一些情况下,配体是GLP1R拮抗剂。在一些情况下,配体是GLP1R别构调节剂。在一些情况下,别构调节剂是负性别构调节剂。在一些情况下,别构调节剂是正性别构调节剂。
使用各种方法分析基于GLP1R配体和GLP1R之间的表面相互作用的GLP1R结合结构域的序列。例如,进行多物种计算分析。在一些情况下,进行结构分析。在一些情况下,进行序列分析。可以使用本领域已知的数据库进行序列分析。数据库的非限制性实例包括但不限于NCBI BLAST(blast.ncbi.nlm.nih.gov/Blast.cgi)、UCSC Genome Browser(genome.ucsc.edu/)、UniProt(www.uniprot.org/)和IUPHAR/BPS药理学指南(guidetopharmacology.org/)。
本文描述了基于各种生物体之间的序列分析设计的GLP1R结合结构域。例如,进行序列分析以鉴定不同生物体中的同源序列。示例性生物体包括但不限于小鼠、大鼠、马、羊、牛、灵长类动物(例如,黑猩猩、狒狒、大猩猩、红毛猩猩、猴)、狗、猫、猪、驴、兔、鱼、苍蝇和人。
在鉴定GLP1R结合结构域后,可生成包含编码GLP1R结合结构域的核酸的文库。在一些情况下,GLP1R结合结构域的文库包含基于构象配体相互作用、肽配体相互作用、小分子配体相互作用、GLP1R的胞外结构域或靶向GLP1R的抗体设计的GLP1R结合结构域的序列。在一些情况下,GLP1R结合结构域的文库包含基于肽配体相互作用设计的GLP1R结合结构域的序列。GLP1R结合结构域的文库可被翻译以生成蛋白质文库。在一些情况下,GLP1R结合结构域的文库被翻译以生成肽文库、免疫球蛋白文库、其衍生物或其组合。在一些情况下,GLP1R结合结构域的文库被翻译以生成蛋白质文库,该蛋白质文库被进一步修饰以生成肽模拟物文库。在一些情况下,GLP1R结合结构域的文库被翻译以生成蛋白质文库,该蛋白质文库用于生成小分子。
本文所述的方法提供了包含核酸的GLP1R结合结构域的文库的合成,每个核酸编码至少一个预定参考核酸序列的预定变体。在一些情况下,预定参考序列是编码蛋白质的核酸序列,并且变体文库包含编码至少单个密码子的变异的序列,使得由合成核酸编码的后续蛋白质中单个残基的多个不同变体通过标准翻译过程生成。在一些情况下,GLP1R结合结构域的文库包含在多个位置处共同编码变异的不同核酸。在一些情况下,变体文库包含编码GLP1R结合结构域中至少单个密码子的变异的序列。在一些情况下,变体文库包含编码GLP1R结合结构域中多个密码子的变异的序列。用于变异的密码子的示例性数目包括但不限于至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、225、250、275、300或多于300个密码子。
本文所述的方法提供了包含编码GLP1R结合结构域的核酸的文库的合成,其中文库包含编码GLP1R结合结构域长度变化的序列。在一些情况下,与预定参考序列相比,文库包含编码长度变化少至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、225、250、275、300或多于300个密码子的序列。在一些情况下,与预定参考序列相比,文库包含编码长度变化多至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300或多于300个密码子的序列。
在鉴定GLP1R结合结构域后,可将GLP1R结合结构域置于如本文所述的免疫球蛋白中。在一些情况下,将GLP1R结合结构域置于CDRH3区域中。可置于免疫球蛋白中的GPCR结合结构域也可以称为基序。包含GLP1R结合结构域的免疫球蛋白可基于结合、特异性、稳定性、表达、折叠或下游活性来设计。在一些情况下,包含GLP1R结合结构域的免疫球蛋白能够与GLP1R接触。在一些情况下,包含GLP1R结合结构域的免疫球蛋白能够与GLP1R高亲和力结合。表1中描述了GLP1R结合结构域的示例性氨基酸序列。
表1.GLP1R氨基酸序列
本文提供了包含GLP1R结合结构域的免疫球蛋白,其中GLP1R结合结构域的序列支持与GLP1R的相互作用。该序列可与GLP1R配体的序列同源或相同。在一些情况下,GLP1R结合结构域序列与SEQ ID NO:1包含至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在一些情况下,GLP1R结合结构域序列与SEQ ID NO:1包含至少或约95%同源性。在一些情况下,GLP1R结合结构域序列与SEQ IDNO:1包含至少或约97%同源性。在一些情况下,GLP1R结合结构域序列与SEQ ID NO:1包含至少或约99%同源性。在一些情况下,GLP1R结合结构域序列与SEQ ID NO:1包含至少或约100%同源性。在一些情况下,GLP1R结合结构域序列包含具有SEQ ID NO:1的至少或约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400或多于400个氨基酸的至少一部分。
术语“序列同一性”是指两个多核苷酸序列在比较窗口上是相同的(即,在逐个核苷酸的基础上)。术语“序列同一性百分比”通过在比较窗口上比较两个最佳比对的序列,确定这两个序列中出现相同核酸碱基(例如,A、T、C、G、U或I)的位置数目以得到匹配位置的数目,将匹配位置的数目除以比较窗口中位置的总数(即,窗口大小),并将结果乘以100以得到序列同一性百分比来计算。用于确定氨基酸序列同一性百分比的比对可以以本领域技术范围内的各种方式实现,例如,使用可公开获得的计算机软件,例如EMBOSS MATCHER、EMBOSS WATER、EMBOSS STRETCHER、EMBOSS NEEDLE、EMBOSS LALIGN、BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以确定用于测量比对的适当参数,包括在被比较的序列全长上实现最大比对所需的任何算法。
在采用ALIGN-2进行氨基酸序列比较的情况下,给定氨基酸序列A与给定氨基酸序列B的氨基酸序列同一性%(其可以替代地表述为与给定氨基酸序列B具有或包含特定氨基酸序列同一性%的给定氨基酸序列A)计算如下:100乘以分数X/Y,其中X是在A和B的程序比对中通过序列比对程序ALIGN-2评分为相同匹配的氨基酸残基的数目,并且其中Y是B中氨基酸残基的总数。应理解,当氨基酸序列A的长度不等于氨基酸序列B的长度时,A与B的氨基酸序列同一性%将不等于B与A的氨基酸序列同一性%。除非另有特别说明,否则本文所用的所有氨基酸序列同一性%值如前一段所述使用ALIGN-2计算机程序获得。
两个蛋白质之间的术语“同源性”或“相似性”是通过将一个蛋白质序列的氨基酸序列及其保守氨基酸取代物与第二个蛋白质序列进行比较来确定的。相似性可通过本领域公知的方法来确定,例如,BLAST程序(国家生物信息中心的基本局部比对搜索工具)。
与“高变区”或“HVR”同义的术语“互补决定区”和“CDR”在本领域中已知是指抗体可变区内的氨基酸非连续序列,其赋予抗原特异性和/或结合亲和力。通常,在每个重链可变区中存在三个CDR(CDRH1、CDRH2、CDRH3),并且在每个轻链可变区中存在三个CDR(CDRL1、CDRL2、CDRL3)。“框架区”和“FR”在本领域中已知是指重链和轻链可变区的非CDR部分。通常,在每个全长重链可变区中存在四个FR(FR-H1、FR-H2、FR-H3和FR-H4),并且在每个全长轻链可变区中存在四个FR(FR-L1、FR-L2、FR-L3和FR-L4)。给定CDR或FR的精确氨基酸序列边界可以使用许多公知方案中的任一种容易地确定,包括Kabat等,(1991),“Sequences ofProteins of Immunological Interest,”第5版.公共卫生署,国立卫生研究院,Bethesda,MD(“Kabat”编号方案)、Al-Lazikani等,(1997)JMB 273,927-948(“Chothia”编号方案);MacCallum等,J.Mol.Biol.262:732-745(1996),“Antibody-antigen interactions:Contact analysis and binding site topography,”J.Mol.Biol.262,732-745.”(“Contact”编号方案);Lefranc MP等,“IMGT unique numbering for immunoglobulinand T cell receptor variable domains and Ig superfamily V-like domains,”DevComp Immunol,2003年1月;27(1):55-77(“IMGT”编号方案);Honegger A和Plückthun A,“Yet another numbering scheme for immunoglobulin variable domains:anautomatic modeling and analysis tool,”J Mol Biol,2001年6月8日;309(3):657-70,(“Aho”编号方案);以及Whitelegg NR和Rees AR,“WAM:an improved algorithm formodelling antibodies on the WEB,”Protein Eng.2000年12月;13(12):819-24(“AbM”编号方案)中描述的那些。在某些实施方案中,本文所述抗体的CDR可以通过选自Kabat、Chothia、IMGT、Aho、AbM或其组合的方法定义。
给定CDR或FR的边界可根据用于鉴定的方案而变化。例如,Kabat方案基于结构比对,而Chothia方案基于结构信息。Kabat和Chothia方案的编号都基于最常见的抗体区域序列长度,其中通过插入字母(例如,“30a”)提供插入,并且在一些抗体中出现缺失。这两种方案将某些插入和缺失(“indels”)置于不同的位置,从而导致不同的编号。Contact方案基于复杂晶体结构的分析,并且在许多方面与Chothia编号方案相似。
本文提供了包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的GLP1R结合文库,其包含结构域类型、结构域长度或残基变异的变化。在一些情况下,结构域是包含GLP1R结合结构域的免疫球蛋白中的区域。例如,该区域是VH、CDRH3或VL结构域。在一些情况下,结构域是GLP1R结合结构域。
本文所述的方法提供了核酸的GLP1R结合文库的合成,每个核酸编码至少一个预定参考核酸序列的预定变体。在一些情况下,预定参考序列是编码蛋白质的核酸序列,并且变体文库包含编码至少单个密码子的变异的序列,使得由合成核酸编码的后续蛋白质中单个残基的多个不同变体通过标准翻译过程生成。在一些情况下,GLP1R结合文库包含在多个位置处共同编码变异的不同核酸。在一些情况下,变体文库包含编码VH、CDRH3或VL结构域的至少单个密码子的变异的序列。在一些情况下,变体文库包含编码GLP1R结合结构域中至少单个密码子的变异的序列。例如,如表1中所列的GLP1R结合结构域的至少一个单个密码子是变化的。在一些情况下,变体文库包含编码VH、CDRH3或VL结构域的多个密码子的变异的序列。在一些情况下,变体文库包含编码GLP1R结合结构域中多个密码子的变异的序列。用于变异的密码子的示例性数目包括但不限于至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、225、250、275、300或多于300个密码子。
本文所述的方法提供了核酸的GLP1R结合文库的合成,每个核酸编码至少一个预定参考核酸序列的预定变体,其中GLP1R结合文库包含编码结构域长度变化的序列。在一些情况下,结构域是VH、CDRH3或VL结构域。在一些情况下,结构域是GLP1R结合结构域。在一些情况下,与预定参考序列相比,文库包含编码长度变化少至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、225、250、275、300或多于300个密码子的序列。在一些情况下,与预定参考序列相比,文库包含编码长度变化多至少或约1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300或多于300个密码子的序列。
本文提供了包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的GLP1R结合文库,其中GLP1R结合文库用不同数目的片段合成。在一些情况下,片段包含VH、CDRH3或VL结构域。在一些情况下,GLP1R结合文库用至少或约2个片段、3个片段、4个片段、5个片段或多于5个片段合成。核酸片段中每一个的长度或合成的核酸的平均长度可以为至少或约50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600或多于600个碱基对。在一些情况下,长度为约50至600、75至575、100至550、125至525、150至500、175至475、200至450、225至425、250至400、275至375或300至350个碱基对。
当被翻译时,如本文所述的包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的GLP1R结合文库包含各种长度的氨基酸。在一些情况下,氨基酸片段中每一个的长度或合成的氨基酸的平均长度可以为至少或约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150或多于150个氨基酸。在一些情况下,氨基酸的长度为约15至150、20至145、25至140、30至135、35至130、40至125、45至120、50至115、55至110、60至110、65至105、70至100或75至95个氨基酸。在一些情况下,氨基酸的长度为约22至约75个氨基酸。
包含编码包含GLP1R结合结构域的免疫球蛋白的从头合成的变体序列的GLP1R结合文库包含许多变体序列。在一些情况下,从头合成CDRH1、CDRH2、CDRH3、CDRL1、CDRL2、CDRL3、VL、VH或其组合的许多变体序列。在一些情况下,从头合成框架元件1(FW1)、框架元件2(FW2)、框架元件3(FW3)或框架元件4(FW4)的许多变体序列。在一些情况下,从头合成GPCR结合结构域的许多变体序列。例如,变体序列的数目是VH结构域的约1至约10个序列、GLP1R结合结构域的约108个序列,以及VK结构域的约1至约44个序列。变体序列的数目可以为至少或约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500或多于500个序列。在一些情况下,变体序列的数目为约10至300、25至275、50至250、75至225、100至200或125至150个序列。
本文描述了结合GLP1R的抗体或其抗体片段。在一些实施方案中,抗体或其抗体片段包含如表7-13中所示的序列。在一些实施方案中,抗体或其抗体片段包含与如表7-13中所示的序列具有至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些情况下,本文所述的抗体或抗体片段包含SEQ ID NO:441-619中任一者的CDRH1序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少80%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少85%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少90%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少95%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含SEQ ID NO:620-798中任一者的CDRH2序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少80%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少85%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少90%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少95%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含SEQID NO:799-977中任一者的CDRH3序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少80%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少85%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少90%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少95%相同的序列。
在一些情况下,本文所述的抗体或抗体片段包含SEQ ID NO:978-1156中任一者的CDRL1序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少80%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少85%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少90%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少95%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含SEQ IDNO:1157-1168中任一者的CDRL2序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1157-1168中任一者的CDRL2序列至少80%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1157-1168中任一者的CDRL2序列至少85%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1157-1168中任一者的CDRL2序列至少90%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ IDNO:1157-1168中任一者的CDRL2序列至少95%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含SEQ ID NO:1169-1347中任一者的CDRL3序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少80%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少85%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少90%相同的序列。在一些情况下,本文所述的抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少95%相同的序列。
在一些实施方案中,抗体或抗体片段包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(b)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(c)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;(d)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(e)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(f)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。在一些实施方案中,抗体或抗体片段包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列与SEQ ID NO:441-619中的任一者至少或约80%、85%、90%或95%相同;(b)CDRH2的氨基酸序列与SEQ ID NO:620-798中的任一者至少或约80%、85%、90%或95%相同;(c)CDRH3的氨基酸序列与SEQ ID NO:799-977中的任一者至少或约80%、85%、90%或95%相同;(d)CDRL1的氨基酸序列与SEQ ID NO:978-1156中的任一者至少或约80%、85%、90%或95%相同;(e)CDRL2的氨基酸序列与SEQ ID NO:1157-1168中的任一者至少或约80%、85%、90%或95%相同;以及(f)CDRL3的氨基酸序列与SEQ ID NO:1169-1347中的任一者至少或约80%、85%、90%或95%相同。
在一些实施方案中,本文描述了包含可变结构域重链区(VH)和可变结构域轻链区(VL)的抗体或抗体片段,其中VH包含与如SEQ ID NO:58-77中任一者所示的序列至少约90%相同的氨基酸序列,并且其中VL包含与如SEQ ID NO:92-111中任一者所示的序列至少约90%相同的氨基酸序列。在一些情况下,抗体或抗体片段包含VH和VL,该VH与SEQ ID NO:58-77中的任一者包含至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,该VL与SEQ ID NO:92-111中的任一者包含至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
术语“序列同一性”是指两个多核苷酸序列在比较窗口上是相同的(即,在逐个核苷酸的基础上)。术语“序列同一性百分比”通过在比较窗口上比较两个最佳比对的序列,确定这两个序列中出现相同核酸碱基(例如,A、T、C、G、U或I)的位置数目以得到匹配位置的数目,将匹配位置的数目除以比较窗口中位置的总数(即,窗口大小),并将结果乘以100以得到序列同一性百分比来计算。通常,确定序列同一性的技术包括比较两个核苷酸或氨基酸序列并确定它们的同一性百分比。序列比较,例如为了评估同一性,可通过任何合适的比对算法进行,包括但不限于Needleman-Wunsch算法(参见例如,可在www.ebi.ac.uk/Tools/psa/emboss_needle/上获得的EMBOSS Needle比对器,任选地具有默认设置)、BLAST算法(参见例如,可在blast.ncbi.nlm.nih.gov/Blast.cgi上获得的BLAST比对工具,任选地具有默认设置)和Smith-Waterman算法(参见例如,可在www.ebi.ac.uk/Tools/psa/emboss_water/上获得的EMBOSS Water比对器,任选地具有默认设置)。可使用所选算法的任何合适参数(包括默认参数)来评估最佳比对。两个序列之间的“同一性百分比”,也称为“同源性百分比”,可计算为两个最佳比对序列之间的准确匹配数目除以参考序列的长度,并乘以100。同一性百分比也可例如通过使用高级BLAST计算机程序(包括2.2.9版,可从国立卫生研究院获得)比较序列信息来确定。BLAST程序基于Karlin和Altschul,Proc.Natl.Acad.Sci.USA 87:2264-2268(1990)的比对方法,并且如Altschul等,J.Mol.Biol.215:403-410(1990);Karlin和Altschul,Proc.Natl.Acad.Sci.USA 90:5873-5877(1993);和Altschul等,Nucleic Acids Res.25:3389-3402(1997)中所讨论的。简言之,BLAST程序将同一性定义为相同比对符号(即,核苷酸或氨基酸)的数目除以两个序列中较短序列中的符号的总数。该程序可用于确定被比较序列全长的同一性百分比。提供默认参数以优化用短查询序列(例如,用blastp程序)的搜索。该程序还允许使用SEG过滤器来屏蔽由Wootton和Federhen,Computers and Chemistry 17:149-163(1993)的SEG程序确定的查询序列的区段。高序列同一性通常包括大约80%至100%的序列同一性范围和其间的整数值。
包含从头合成的编码包含GLP1R结合结构域的免疫球蛋白的变体序列的GLP1R结合文库包含改善的多样性。例如,通过将GLP1R结合结构域变体置于包含N-末端CDRH3变异和C-末端CDRH3变异的免疫球蛋白中来生成变体。在一些情况下,变体包括亲和力成熟变体。可替代地或组合地,变体包括免疫球蛋白其他区域(包括但不限于CDRH1、CDRH2、CDRL1、CDRL2和CDRL3)中的变体。在一些情况下,GLP1R结合文库的变体数目为至少或约104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020或多于1020个不相同的序列。例如,包含约10个VH区变体序列、约237个CDRH3区变体序列以及约43个VL和CDRL3区变体序列的文库包含105个不相同的序列(10×237×43)。
在一些情况下,抗体变异的至少一个区域来自重链V基因家族、重链D基因家族、重链J基因家族、轻链V基因家族或轻链J基因家族。在一些情况下,轻链V基因家族包含免疫球蛋白κ(IGK)基因或免疫球蛋白λ(IGL)。抗体变异的示例性区域包括但不限于IGHV1-18、IGHV1-69、IGHV1-8、IGHV3-21、IGHV3-23、IGHV3-30/33rn、IGHV3-28、IGHV1-69、IGHV3-74、IGHV4-39、IGHV4-59/61、IGKV1-39、IGKV1-9、IGKV2-28、IGKV3-11、IGKV3-15、IGKV3-20、IGKV4-1、IGLV1-51、IGLV2-14、IGLV1-40和IGLV3-1。在一些情况下,基因是IGHV1-69、IGHV3-30、IGHV3-23、IGHV3、IGHV1-46、IGHV3-7、IGHV1或IGHV1-8。在一些情况下,基因是IGHV1-69和IGHV3-30。在一些情况下,抗体变异的区域是IGHJ3、IGHJ6、IGHJ、IGHJ4、IGHJ5、IGHJ2或IGH1。在一些情况下,抗体变异的区域是IGHJ3、IGHJ6、IGHJ或IGHJ4。在一些情况下,抗体变异的至少一个区域是IGHV1-69、IGHV3-23、IGKV3-20、IGKV1-39或其组合。在一些情况下,抗体变异的至少一个区域是IGHV1-69和IGKV3-20。在一些情况下,抗体变异的至少一个区域是IGHV1-69和IGKV1-39。在一些情况下,抗体变异的至少一个区域是IGHV3-23和IGKV3-20。在一些情况下,抗体变异的至少一个区域是IGHV3-23和IGKV1-39。
本文提供了包含编码GLP1R抗体的核酸的文库,该GLP1R抗体在抗体的至少一个区域中包含变异,其中该区域是CDR区。在一些情况下,GLP1R抗体是包含一个重链可变结构域的单结构域抗体,例如VHH抗体。在一些情况下,VHH抗体在一个或多个CDR区中包含变异。在一些情况下,本文所述的文库包含至少或约1、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2400、2600、2800、3000或多于3000个CDR1、CDR2或CDR3序列。在一些情况下,本文所述的文库包含至少或约104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020或多于1020个CDR1、CDR2或CDR3序列。例如,文库包含至少2000个CDR1序列、至少1200个CDR2序列和至少1600个CDR3序列。在一些情况下,每个序列是不相同的。
在一些情况下,CDR1、CDR2或CDR3属于可变结构域轻链(VL)。可变结构域轻链(VL)的CDR1、CDR2或CDR3可以分别称为CDRL1、CDRL2或CDRL3。在一些情况下,本文所述的文库包含至少或约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2400、2600、2800、3000或多于3000个VL的CDR1、CDR2或CDR3序列。在一些情况下,本文所述的文库包含至少或约104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020或多于1020个VL的CDR1、CDR2或CDR3序列。例如,文库包含至少20个VL的CDR1序列、至少4个VL的CDR2序列和至少140个VL的CDR3序列。在一些情况下,文库包含至少2个VL的CDR1序列、至少1个VL的CDR2序列和至少3000个VL的CDR3序列。在一些情况下,VL是IGKV1-39、IGKV1-9、IGKV2-28、IGKV3-11、IGKV3-15、IGKV3-20、IGKV4-1、IGLV1-51、IGLV2-14、IGLV1-40或IGLV3-1。在一些情况下,VL是IGKV2-28。在一些情况下,VL是IGLV1-51。
在一些情况下,CDR1、CDR2或CDR3属于可变结构域重链(VH)。可变结构域重链(VH)的CDR1、CDR2或CDR3可以分别称为CDRH1、CDRH2或CDRH3。在一些情况下,本文所述的文库包含至少或约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1200、1400、1600、1800、2000、2400、2600、2800、3000或多于3000个VH的CDR1、CDR2或CDR3序列。在一些情况下,本文所述的文库包含至少或约104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020或多于1020个VH的CDR1、CDR2或CDR3序列。例如,文库包含至少30个VH的CDR1序列、至少570个VH的CDR2序列和至少108个VH的CDR3序列。在一些情况下,文库包含至少30个VH的CDR1序列、至少860个VH的CDR2序列和至少107个VH的CDR3序列。在一些情况下,VH是IGHV1-18、IGHV1-69、IGHV1-8、IGHV3-21、IGHV3-23、IGHV3-30/33rn、IGHV3-28、IGHV3-74、IGHV4-39或IGHV4-59/61。在一些情况下,VH是IGHV1-69、IGHV3-30、IGHV3-23、IGHV3、IGHV1-46、IGHV3-7、IGHV1或IGHV1-8。在一些情况下,VH是IGHV1-69或IGHV3-30。在一些情况下,VH是IGHV3-23。
在一些实施方案中,如本文所述的文库包含不同长度的CDRL1、CDRL2、CDRL3、CDRH1、CDRH2或CDRH3。在一些情况下,CDRL1、CDRL2、CDRL3、CDRH1、CDRH2或CDRH3的长度包含至少或约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90或多于90个氨基酸。例如,CDRH3的长度包含至少或约12、15、16、17、20、21或23个氨基酸。在一些情况下,CDRL1、CDRL2、CDRL3、CDRH1、CDRH2或CDRH3的长度包含约1至约10、约5至约15、约10至约20或约15至约30个氨基酸范围。
当被翻译时,如本文所述的包含编码具有变体CDR序列的抗体的核酸的文库包含各种长度的氨基酸。在一些情况下,氨基酸片段中每一个的长度或合成的氨基酸的平均长度可以为至少或约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150或多于150个氨基酸。在一些情况下,氨基酸的长度为约15至150、20至145、25至140、30至135、35至130、40至125、45至120、50至115、55至110、60至110、65至105、70至100或75至95个氨基酸。在一些情况下,氨基酸的长度为约22个氨基酸至约75个氨基酸。在一些情况下,抗体包含至少或约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000或多于5000个氨基酸。
在本文所述的文库中,CDRL1、CDRL2、CDRL3、CDRH1、CDRH2或CDRH3的长度比率可变化。在一些情况下,长度包含至少或约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90或多于90个氨基酸的CDRL1、CDRL2、CDRL3、CDRH1、CDRH2或CDRH3构成文库的约10%、20%、30%、40%、50%、60%、70%、80%、90%或多于90%。例如,长度包含约23个氨基酸的CDRH3以40%存在于文库中,长度包含约21个氨基酸的CDRH3以30%存在于文库中,长度包含约17个氨基酸的CDRH3以20%存在于文库中,并且长度包含约12个氨基酸的CDRH3以10%存在于文库中。在一些情况下,长度包含约20个氨基酸的CDRH3以40%存在于文库中,长度包含约16个氨基酸的CDRH3以30%存在于文库中,长度包含约15个氨基酸的CDRH3以20%存在于文库中,并且长度包含约12个氨基酸的CDRH3以10%存在于文库中。
如本文所述的编码VHH抗体的文库包含变体CDR序列,其经改组以生成具有至少或约107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020或多于1020个序列的理论多样性的文库。在一些情况下,该文库的最终文库多样性为至少或约107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020或多于1020序列。
本文提供了编码免疫球蛋白的GLP1R结合文库。在一些情况下,GLP1R免疫球蛋白是抗体。在一些情况下,GLP1R免疫球蛋白是VHH抗体。在一些情况下,GLP1R免疫球蛋白包含小于1nM、小于1.2nM、小于2nM、小于5nM、小于10nM、小于11nM、小于13.5nM、小于15nM、小于20nM、小于25nM或小于30nM的与GLP1R的结合亲和力(例如,kD)。在一些情况下,GLP1R免疫球蛋白包含小于1nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于1.2nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于2nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于5nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于10nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于13.5nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于15nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于20nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于25nM的kD。在一些情况下,GLP1R免疫球蛋白包含小于30nM的kD。
在一些情况下,GLP1R免疫球蛋白是GLP1R激动剂。在一些情况下,GLP1R免疫球蛋白是GLP1R拮抗剂。在一些情况下,GLP1R免疫球蛋白是GLP1R别构调节剂。在一些情况下,别构调节剂是负性别构调节剂。在一些情况下,别构调节剂是正性别构调节剂。在一些情况下,GLP1R免疫球蛋白在至少或约1nM、2nM、4nM、6nM、8nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、120nM、140nM、160nM、180nM、200nM、300nM、400nM、500nM、600nM、700nM、800nM、900nM、1000nM或多于1000nM的浓度下导致激动、拮抗或变构效应。在一些情况下,GLP1R免疫球蛋白是负性别构调节剂。在一些情况下,GLP1R免疫球蛋白在至少或约0.001、0.005、0.01、0.05、0.1、0.5、1nM、2nM、4nM、6nM、8nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM或多于100nM的浓度下是负性别构调节剂。在一些情况下,GLP1R免疫球蛋白在约0.001至约100、0.01至约90、约0.1至约80、1至约50、约10至约40nM或约1至约10nM范围的浓度下是负性别构调节剂。在一些情况下,GLP1R免疫球蛋白包含至少或约0.001、0.0025、0.005、0.01、0.025、0.05、0.06、0.07、0.08、0.9、0.1、0.5、1、2、3、4、5、6或多于6nM的EC50或IC50。在一些情况下,GLP1R免疫球蛋白包含至少或约1nM、2nM、4nM、6nM、8nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM或多于100nM的EC50或IC50。
本文提供了编码免疫球蛋白的GLP1R结合文库,其中免疫球蛋白包含长的半衰期。在一些情况下,GLP1R免疫球蛋白的半衰期为至少或约12小时、24小时、36小时、48小时、60小时、72小时、84小时、96小时、108小时、120小时、140小时、160小时、180小时、200小时或多于200小时。在一些情况下,GLP1R免疫球蛋白的半衰期在约12小时至约300小时、约20小时至约280小时、约40小时至约240小时或约60小时至约200小时范围内。
如本文所述的GLP1R免疫球蛋白可包含改善的特性。在一些情况下,GLP1R免疫球蛋白是单体的。在一些情况下,GLP1R免疫球蛋白不易聚集。在一些情况下,至少或约70%、75%、80%、85%、90%、95%或99%的GLP1R免疫球蛋白是单体的。在一些情况下,GLP1R免疫球蛋白是热稳定的。在一些情况下,GLP1R免疫球蛋白导致非特异性结合减少。
在合成包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的GLP1R结合文库后,文库可用于筛选和分析。例如,测定文库的文库可展示性和淘选。在一些情况下,使用可选择的标签测定可展示性。示例性标签包括但不限于放射性标记、荧光标记、酶、化学发光标签、比色标签、亲和标签或本领域已知的其他标记或标签。在一些情况下,标签是组氨酸、多组氨酸、myc、血凝素(HA)或FLAG。在一些情况下,GLP1R结合文库包含编码免疫球蛋白的核酸,该免疫球蛋白包含具有多个标签(例如GFP、FLAG和Lucy)的GPCR结合结构域以及DNA条形码。在一些情况下,使用各种方法通过测序测定文库,包括但不限于单分子实时(SMRT)测序、聚合酶克隆(Polony)测序、连接测序、可逆终止子测序、质子检测测序、离子半导体测序、纳米孔测序、电子测序、焦磷酸测序、Maxam-Gilbert测序、链终止(例如,Sanger)测序、+S测序或合成测序。
表达系统
本文提供了包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的文库,其中该文库具有改善的特异性、稳定性、表达、折叠或下游活性。在一些情况下,本文所述的文库用于筛选和分析。
本文提供了包含编码包含GLP1R结合结构域的免疫球蛋白的核酸的文库,其中该核酸文库用于筛选和分析。在一些情况下,筛选和分析包括体外、体内或离体测定。用于筛选的细胞包括取自活体对象或细胞系的原代细胞。细胞可以来自原核生物(例如,细菌和真菌)或真核生物(例如,动物和植物)。示例性动物细胞包括但不限于来自小鼠、兔、灵长类动物和昆虫的那些。在一些情况下,用于筛选的细胞包括细胞系,包括但不限于中国仓鼠卵巢(CHO)细胞系、人胚肾(HEK)细胞系或幼仓鼠肾(BHK)细胞系。在一些情况下,本文所述的核酸文库也可被递送至多细胞生物。示例性多细胞生物包括但不限于植物、小鼠、兔、灵长类动物和昆虫。
可针对各种药理学或药代动力学特性筛选本文所述的核酸文库或其编码的蛋白质文库。在一些情况下,使用体外测定、体内测定或离体测定来筛选文库。例如,所筛选的体外药理学或药代动力学特性包括但不限于结合亲和力、结合特异性和结合亲合性。所筛选的本文所述文库的示例性体内药理学或药代动力学特性包括但不限于治疗功效、活性、临床前毒性特性、临床功效特性、临床毒性特性、免疫原性、效力和临床安全特性。
可筛选的药理学或药代动力学特性包括但不限于细胞结合亲和力和细胞活性。例如,进行细胞结合亲和力测定或细胞活性测定以确定本文所述文库的激动、拮抗或别构效应。在一些情况下,细胞活性测定是cAMP测定。在一些情况下,将如本文所述的文库与GLP1R配体的细胞结合或细胞活性进行比较。
如本文所述的文库可在基于细胞的测定或非基于细胞的测定中进行筛选。非基于细胞的测定的实例包括但不限于使用病毒颗粒、使用体外翻译蛋白和使用具有GLP1R的蛋白脂质体。
如本文所述的核酸文库可通过测序进行筛选。在一些情况下,下一代测序用于确定GLP1R结合变体的序列富集。在一些情况下,确定V基因分布、J基因分布、V基因家族、每长度的CDR3计数或其组合。在一些情况下,确定克隆频率、克隆累积、谱系累积或其组合。在一些情况下,确定序列、具有VH克隆的序列、克隆、大于1的克隆、克隆型、大于1的克隆型、谱系、simpsons或其组合的数目。在一些情况下,确定不相同的CDR3的百分比。例如,不相同的CDR3的百分比计算为样品中不相同的CDR3数目除以样品中具有CDR3的序列的总数。
本文提供了核酸文库,其中该核酸文库可在载体中表达。用于插入本文公开的核酸文库的表达载体可包含真核或原核表达载体。示例性表达载体包括但不限于哺乳动物表达载体:pSF-CMV-NEO-NH2-PPT-3XFLAG、pSF-CMV-NEO-COOH-3XFLAG、pSF-CMV-PURO-NH2-GST-TEV、pSF-OXB20-COOH-TEV-FLAG(R)-6His、pCEP4 pDEST27、pSF-CMV-Ub-KrYFP、pSF-CMV-FMDV-daGFP、pEF1a-mCherry-N1载体、pEF1a-tdTomato载体、pSF-CMV-FMDV-Hygro、pSF-CMV-PGK-Puro、pMCP-tag(m)和pSF-CMV-PURO-NH2-CMYC;细菌表达载体:pSF-OXB20-βGal、pSF-OXB20-Fluc、pSF-OXB20和pSF-Tac;植物表达载体:pRI 101-AN DNA和pCambia2301;酵母表达载体:pTYB21和pKLAC2,以及昆虫载体:pAc5.1/V5-His A和pDEST8。在一些情况下,载体是pcDNA3或pcDNA3.1。
本文描述了在载体中表达以生成包含免疫球蛋白的构建体的核酸文库,该免疫球蛋白包含GLP1R结合结构域的序列。在一些情况下,构建体的大小不同。在一些情况下,构建体包含至少或约500、600、700、800、900、1000、1100、1300、1400、1500、1600、1700、1800、2000、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、5000、6000、7000、8000、9000、10000或多于10000个碱基。在一些情况下,构建体包含约300至1,000、300至2,000、300至3,000、300至4,000、300至5,000、300至6,000、300至7,000、300至8,000、300至9,000、300至10,000、1,000至2,000、1,000至3,000、1,000至4,000、1,000至5,000、1,000至6,000、1,000至7,000、1,000至8,000、1,000至9,000、1,000至10,000、2,000至3,000、2,000至4,000、2,000至5,000、2,000至6,000、2,000至7,000、2,000至8,000、2,000至9,000、2,000至10,000、3,000至4,000、3,000至5,000、3,000至6,000、3,000至7,000、3,000至8,000、3,000至9,000、3,000至10,000、4,000至5,000、4,000至6,000、4,000至7,000、4,000至8,000、4,000至9,000、4,000至10,000、5,000至6,000、5,000至7,000、5,000至8,000、5,000至9,000、5,000至10,000、6,000至7,000、6,000至8,000、6,000至9,000、6,000至10,000、7,000至8,000、7,000至9,000、7,000至10,000、8,000至9,000、8,000至10,000或9,000至10,000个碱基的范围。
本文提供了包含编码包含GPCR结合结构域的免疫球蛋白的核酸的文库,其中该核酸文库在细胞中表达。在一些情况下,合成文库以表达报告基因。示例性报告基因包括但不限于乙酰羟酸合酶(AHAS)、碱性磷酸酶(AP)、β半乳糖苷酶(LacZ)、β葡糖苷酸酶(GUS)、氯霉素乙酰转移酶(CAT)、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、天蓝色荧光蛋白、柠檬色荧光蛋白、橙色荧光蛋白、樱桃色荧光蛋白、蓝绿色荧光蛋白、蓝色荧光蛋白、辣根过氧化物酶(HRP)、萤光素酶(Luc)、胭脂碱合酶(NOS)、章鱼碱合酶(OCS)、萤光素酶及其衍生物。确定报告基因调节的方法是本领域公知的,包括但不限于荧光测定法(例如,荧光光谱、荧光活化细胞分选术(FACS)、荧光显微术)和抗生素耐药性测定。
疾病和病症
本文提供了包含编码免疫球蛋白(例如,抗体)的核酸的GLP1R结合文库,该免疫球蛋白包含可具有治疗效果的GLP1R结合结构域。在一些情况下,GLP1R结合文库在被翻译时产生用于治疗疾病或病症的蛋白质。在一些情况下,蛋白质是免疫球蛋白。在一些情况下,蛋白质是肽模拟物。
如本文所述的GLP1R文库可包含GLP1R的调节剂。在一些情况下,GLP1R的调节剂是抑制剂。在一些情况下,GLP1R的调节剂是活化剂。在一些情况下,GLP1R抑制剂是GLP1R拮抗剂。在一些情况下,GLP1R拮抗剂是GLP1R-3。在一些情况下,GLP1R的调节剂用于治疗各种疾病或病症。
示例性疾病包括但不限于癌症、炎性疾病或病症、代谢疾病或病症、心血管疾病或病症、呼吸系统疾病或病症、疼痛、消化系统疾病或病症、生殖疾病或病症、内分泌疾病或病症,或神经疾病或病症。在一些情况下,癌症是实体癌或血液癌症。在一些情况下,如本文所述的GLP1R的调节剂用于治疗体重增加(或用于诱导体重减轻)、治疗肥胖症或治疗II型糖尿病。在一些情况下,GLP1R调节剂用于治疗低血糖症。在一些情况下,GLP1R调节剂用于治疗减肥后低血糖症。在一些情况下,GLP1R调节剂用于治疗严重低血糖症。在一些情况下,GLP1R调节剂用于治疗胰岛素过多症。在一些情况下,GLP1R调节剂用于治疗先天性胰岛素过多症。
在一些情况下,对象是哺乳动物。在一些情况下,对象是小鼠、兔、狗或人。通过本文所述方法治疗的对象可以是婴儿、成人或儿童。包含如本文所述的抗体或抗体片段的药物组合物可静脉内或皮下施用。
本文描述了包含结合GLP1R的抗体或其抗体片段的药物组合物。在一些实施方案中,抗体或其抗体片段包含如表7-13中所示的序列。在一些实施方案中,抗体或其抗体片段包含与如表7-13中所示的序列具有至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含SEQ ID NO:441-619中任一者的CDRH1序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少80%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少85%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少90%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:441-619中任一者的CDRH1序列至少95%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含SEQ ID NO:620-798中任一者的CDRH2序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少80%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少85%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少90%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:620-798中任一者的CDRH2序列至少95%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含SEQ ID NO:799-977中任一者的CDRH3序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少80%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少85%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:799-977中任一者的CDRH3序列至少90%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ IDNO:799-977中任一者的CDRH3序列至少95%相同的序列。
在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含SEQ ID NO:978-1156中任一者的CDRL1序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少80%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少85%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ IDNO:978-1156中任一者的CDRL1序列至少90%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:978-1156中任一者的CDRL1序列至少95%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含SEQ ID NO:1157-1168中任一者的CDRL2序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1157-1168中任一者的CDRL2序列至少80%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1157-1168中任一者的CDRL2序列至少85%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1157-1168中任一者的CDRL2序列至少90%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ IDNO:1157-1168中任一者的CDRL2序列至少95%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含SEQ ID NO:1169-1347中任一者的CDRL3序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少80%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少85%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少90%相同的序列。在一些情况下,药物组合物包含本文所述的抗体或抗体片段,该抗体或抗体片段包含与SEQ ID NO:1169-1347中任一者的CDRL3序列至少95%相同的序列。
在一些实施方案中,抗体或抗体片段包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(b)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(c)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;(d)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(e)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(f)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。在一些实施方案中,抗体或抗体片段包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列与SEQ ID NO:441-619中的任一者至少或约80%、85%、90%或95%相同;(b)CDRH2的氨基酸序列与SEQ ID NO:620-798中的任一者至少或约80%、85%、90%或95%相同;(c)CDRH3的氨基酸序列与SEQ ID NO:799-977中的任一者至少或约80%、85%、90%或95%相同;(d)CDRL1的氨基酸序列与SEQ ID NO:978-1156中的任一者至少或约80%、85%、90%或95%相同;(e)CDRL2的氨基酸序列与SEQ ID NO:1157-1168中的任一者至少或约80%、85%、90%或95%相同;以及(f)CDRL3的氨基酸序列与SEQ ID NO:1169-1347中的任一者至少或约80%、85%、90%或95%相同。
在一些实施方案中,本文描述了包含可变结构域重链区(VH)和可变结构域轻链区(VL)的抗体或抗体片段,其中VH包含与如SEQ ID NO:58-77中任一者所示的序列至少约90%相同的氨基酸序列,并且其中VL包含与如SEQ ID NO:92-111中任一者所示的序列至少约90%相同的氨基酸序列。在一些情况下,抗体或抗体片段包含VH和VL,该VH与SEQ ID NO:58-77中的任一者包含至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,该VL与SEQ ID NO:92-111中的任一者包含至少或约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
本文描述了包含结合GLP1R的抗体或其抗体片段的药物组合物,其包含各种剂量的抗体或抗体片段。在一些情况下,剂量在约1至80mg/kg、约1至约100mg/kg、约5至约100mg/kg、约5至约80mg/kg、约5至约60mg/kg、约5至约50mg/kg或约5至约500mg/kg范围内,其可以单剂量或多剂量施用。在一些情况下,剂量以约0.01mg/kg、约0.05mg/kg、约0.10mg/kg、约0.25mg/kg、约0.5mg/kg、约1mg/kg、约5mg/kg、约10mg/kg、约15mg/kg、约20mg/kg、约25mg/kg、约30mg/kg、约35mg/kg、约40mg/kg、约45mg/kg、约50mg/kg、约55mg/kg、约60mg/kg、约65mg/kg、约70mg/kg、约75mg/kg、约80mg/kg、约85mg/kg、约90mg/kg、约95mg/kg、约100mg/kg、约105mg/kg、约110mg/kg、约115mg/kg、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195、约200、约205、约210、约215、约220、约225、约230、约240、约250、约260、约270、约275、约280、约290、约300、约310、约320、约330、约340、约350、约360mg/kg、约370mg/kg、约380mg/kg、约390mg/kg、约400mg/kg、410mg/kg、约420mg/kg、约430mg/kg、约440mg/kg、约450mg/kg、约460mg/kg、约470mg/kg、约480mg/kg、约490mg/kg或约500mg/kg的量施用。
变体文库
密码子变异
本文所述的变体核酸文库可包含多个核酸,其中与参考核酸序列相比,每个核酸编码变体密码子序列。在一些情况下,第一核酸群体的每个核酸在单个变体位点处含有变体。在一些情况下,第一核酸群体在单个变体位点处含有多个变体,使得第一核酸群体在相同变体位点处含有多于一个的变体。第一核酸群体可包含在相同变体位点处共同编码多个密码子变体的核酸。第一核酸群体可包含在相同位置处共同编码多达19或更多个密码子的核酸。第一核酸群体可包含在相同位置处共同编码多达60个变体三联体的核酸,或者第一核酸群体可包含在相同位置处共同编码多达61个不同密码子三联体的核酸。在翻译期间,每个变体可编码产生不同氨基酸的密码子。表2提供了变体位点每个可能的密码子(和代表性氨基酸)的列表。
表2.密码子和氨基酸列表
核酸群体可包含在多个位置处共同编码多达20个密码子变异的不同核酸。在这种情况下,群体中的每个核酸包含在相同核酸中多于一个位置处的密码子变异。在一些情况下,群体中的每个核酸包含在单个核酸中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个密码子处的密码子变异。在一些情况下,每个变体长核酸包含在单个长核酸中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个密码子处的密码子变异。在一些情况下,变体核酸群体包含在单个核酸中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个密码子处的密码子变异。在一些情况下,变体核酸群体包含在单个长核酸中至少约10、20、30、40、50、60、70、80、90、100或更多个密码子处的密码子变异。
高度并行的核酸合成
本文提供了一种平台方法,其利用在硅上的纳米孔内从多核苷酸合成到基因组装的端到端过程的小型化、并行化和垂直整合以产生革命性的合成平台。本文所述的装置提供了与96孔板具有相同足迹的硅合成平台,与传统的合成方法相比,其能够将通量提高高达1,000倍或更多,在单次高度并行化运行中产生高达约1,000,000或更多个多核苷酸或10,000或更多个基因。
随着下一代测序的出现,高分辨率基因组数据已成为深入研究各种基因在正常生物学和疾病发病机理中的生物学作用的研究的重要因素。本研究的核心是分子生物学的中心法则和“连续信息的逐残基转移”的概念。DNA中编码的基因组信息被转录成信息,然后将其翻译成作为给定生物学途径内的活性产物的蛋白质。
另一个令人兴奋的研究领域是集中于高度特异性细胞靶的治疗性分子的发现、开发和制造。高多样性DNA序列文库是靶向治疗剂的开发流水线的核心。基因突变体用于在设计、构建和测试蛋白质工程循环中表达蛋白质,在理想情况下产生高表达对其治疗性靶具有高亲和力的蛋白质的优化基因。作为实例,考虑受体的结合口袋。同时测试结合口袋内所有残基的所有序列排列的能力将允许进行彻底探索,从而增加成功的机会。饱和诱变(其中研究人员试图在受体内的特定位点处生成所有可能的突变)代表了应对这种开发挑战的一种方法。虽然其成本高、耗时且耗力,但它能够将每个变体引入至每个位置。相反,组合诱变(其中一些选定位置或短DNA片段可被广泛修饰)生成具有偏向代表的不完整变体组库。
为了加速药物开发流水线,在可用于测试的正确位置处以预期频率可获得的所需变体文库(换言之,精确文库)能够减少成本以及筛选的周转时间。本文提供了用于合成核酸合成变体文库的方法,其提供了以所需频率精确引入每个预期变体。对于终端用户来说,这意味着不仅能够彻底对序列空间进行采样,而且能够以有效的方式查询这些假设,从而减少成本和筛选时间。全基因组编辑可以阐明重要的途径、文库,其中可以测试每个变体和序列排列的最佳功能性,并且可以使用数千个基因来重构整个途径和基因组,以重新设计生物系统用于药物发现。
在第一个实例中,可以使用本文所述的方法优化药物本身。例如,为了改善抗体的特定功能,设计并合成编码抗体一部分的变体多核苷酸文库。然后可以通过本文所述的过程(例如,PCR诱变,随后插入载体中)生成抗体的变体核酸文库。然后在生产细胞系中表达抗体,并针对增强的活性进行筛选。示例筛选包括检查对抗原的结合亲和力、稳定性或效应物功能(例如,ADCC、补体或凋亡)的调节。优化抗体的示例性区域包括但不限于Fc区、Fab区、Fab区的可变区、Fab区的恒定区、重链或轻链的可变结构域(VH或VL),以及VH或VL的特定互补决定区(CDR)。
通过本文所述方法合成的核酸文库可在与疾病状态相关的各种细胞中表达。与疾病状态相关的细胞包括细胞系、组织样品、来自对象的原代细胞、从对象扩增的培养细胞或模型系统中的细胞。示例性模型系统包括但不限于疾病状态的植物和动物模型。
为了鉴定与疾病状态的预防、减轻或治疗相关的变体分子,本文所述的变体核酸文库在与疾病状态相关的细胞中表达,或在可诱导疾病状态的细胞中表达。在一些情况下,药剂用于在细胞中诱导疾病状态。用于诱导疾病状态的示例性工具包括但不限于Cre/Lox重组系统、LPS炎症诱导和诱导低血糖症的链脲霉素。与疾病状态相关的细胞可以是来自模型系统或培养细胞的细胞,以及来自患有特定疾病病况的对象的细胞。示例性疾病病况包括细菌、真菌、病毒、自身免疫性或增生性病症(例如,癌症)。在一些情况下,变体核酸文库在模型系统、细胞系或来源于对象的原代细胞中表达,并针对至少一种细胞活性的变化进行筛选。示例性细胞活性包括但不限于增殖、周期进程、细胞死亡、粘附、迁移、复制、细胞信号传导、能量产生、氧利用、代谢活性和衰老、对自由基损伤的反应或其任何组合。
基底
用作多核苷酸合成表面的装置可以是基底的形式,其包括但不限于均质阵列表面、图案化阵列表面、通道、珠、凝胶等。本文提供了包含多个簇的基底,其中每个簇包含支持多核苷酸的附接和合成的多个座位。在一些情况下,基底包含均质阵列表面。例如,均质阵列表面是均质板。如本文所用的术语“座位”是指结构上的离散区域,其为编码单个预定序列的多核苷酸从表面延伸提供支持。在一些情况下,座位在二维表面上,例如,基本上平坦的表面。在一些情况下,座位在三维表面上,例如,孔、微孔、通道或柱。在一些情况下,座位的表面包含被活化官能化以附接至用于多核苷酸合成的至少一个核苷酸或优选地用于合成多核苷酸群体的相同核苷酸群体的材料。在一些情况下,多核苷酸是指编码相同核酸序列的多核苷酸群体。在一些情况下,基底的表面包括基底的一个或多个表面。使用所提供的系统和方法在本文所述文库内合成的多核苷酸的平均错误率通常小于1/1000、小于约1/2000、小于约1/3000或更小,通常无错误校正。
本文提供了支持在共同支持物上的可寻址位置处并行合成具有不同预定序列的多个多核苷酸的表面。在一些情况下,基底为合成多于50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000或更多个不相同的多核苷酸提供支持。在一些情况下,表面为合成多于50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000或更多个编码不同序列的多核苷酸提供支持。在一些情况下,多核苷酸的至少一部分具有相同序列或配置为用相同序列合成。在一些情况下,基底为具有至少80、90、100、120、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个碱基或更多的多核苷酸的增长提供表面环境。
本文提供了在基底的不同座位上合成多核苷酸的方法,其中每个座位支持多核苷酸群体的合成。在一些情况下,每个座位支持具有与在另一座位上增长的多核苷酸群体不同的序列的多核苷酸群体的合成。在一些情况下,每个多核苷酸序列被合成为在用于多核苷酸合成的表面上座位的相同簇内不同座位上具有1、2、3、4、5、6、7、8、9或更多冗余。在一些情况下,基底的座位位于多个簇内。在一些情况下,基底包含至少10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000或更多个簇。在一些情况下,基底包含超过2,000、5,000、10,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,100,000、1,200,000、1,300,000、1,400,000、1,500,000、1,600,000、1,700,000、1,800,000、1,900,000、2,000,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000或10,000,000或更多个不同的座位。在一些情况下,基底包含约10,000个不同的座位。单个簇内的座位数量在不同情况下是不同的。在一些情况下,每个簇包括1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500或更多个座位。在一些情况下,每个簇包括约50-500个座位。在一些情况下,每个簇包括约100-200个座位。在一些情况下,每个簇包括约100-150个座位。在一些情况下,每个簇包括约109、121、130或137个座位。在一些情况下,每个簇包括约19、20、61、64或更多个座位。可替代地或组合地,多核苷酸合成发生在均质阵列表面上。
在一些情况下,在基底上合成的不同多核苷酸的数目取决于基底中可用的不同座位的数目。在一些情况下,基底的簇或表面内的座位密度为至少或约1、10、25、50、65、75、100、130、150、175、200、300、400、500、1,000或更多个座位/mm2。在一些情况下,基底包含10-500、25-400、50-500、100-500、150-500、10-250、50-250、10-200或50-200mm2。在一些情况下,簇或表面内两个相邻座位的中心之间的距离为约10-500、约10-200或约10-100um。在一些情况下,相邻座位的两个中心之间的距离大于约10、20、30、40、50、60、70、80、90或100um。在一些情况下,两个相邻座位的中心之间的距离小于约200、150、100、80、70、60、50、40、30、20或10um。在一些情况下,每个座位的宽度为约0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100um。在一些情况下,每个座位的宽度为约0.5-100、0.5-50、10-75或0.5-50um。
在一些情况下,基底内的簇的密度为至少或约1个簇/100mm2、1个簇/10mm2、1个簇/5mm2、1个簇/4mm2、1个簇/3mm2、1个簇/2mm2、1个簇/1mm2、2个簇/1mm2、3个簇/1mm2、4个簇/1mm2、5个簇/1mm2、10个簇/1mm2、50个簇/1mm2或更多。在一些情况下,基底包含约1个簇/10mm2至约10个簇/1mm2。在一些情况下,两个相邻簇的中心之间的距离为至少或约50、100、200、500、1000、2000或5000um。在一些情况下,两个相邻簇的中心之间的距离为约50-100、50-200、50-300、50-500和100-2000um。在一些情况下,两个相邻簇的中心之间的距离为约0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5或0.5-2mm。在一些情况下,每个簇的横截面为约0.5至约2、约0.5至约1或约1至约2mm。在一些情况下,每个簇的横截面为约0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mm。在一些情况下,每个簇的内部横截面为约0.5、0.6、0.7、0.8、0.9、1、1.1、1.15、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mm。
在一些情况下,基底约为标准96孔板的尺寸,例如约100至约200mm×约50至约150mm。在一些情况下,基底的直径小于或等于约1000、500、450、400、300、250、200、150、100或50mm。在一些情况下,基底的直径为约25-1000、25-800、25-600、25-500、25-400、25-300或25-200mm。在一些情况下,基底的平坦表面积为至少约100、200、500、1,000、2,000、5,000、10,000、12,000、15,000、20,000、30,000、40,000、50,000mm2或更多。在一些情况下,基底的厚度为约50-2000、50-1000、100-1000、200-1000或250-1000mm。
表面材料
本文提供的基底、装置和反应器由适于本文所述的方法、组合物和系统的任何种类的材料制成。在某些情况下,制造基底材料以表现出低水平的核苷酸结合。在一些情况下,修饰基底材料以生成表现出高水平的核苷酸结合的不同表面。在一些情况下,基底材料对可见光和/或UV光是透明的。在一些情况下,基底材料具有足够的导电性,例如,能够在基底的全部或一部分上形成均匀电场。在一些情况下,导电材料与电接地连接。在一些情况下,基底是导热的或隔热的。在一些情况下,材料是耐化学的和耐热的,以支持化学或生化反应,例如多核苷酸合成反应过程。在一些情况下,基底包含柔性材料。对于柔性材料,材料可以包括但不限于:改性和未改性的尼龙、硝酸纤维素、聚丙烯等。在一些情况下,基底包含刚性材料。对于刚性材料,材料可以包括但不限于:玻璃;熔融石英;硅、塑料(例如聚四氟乙烯、聚丙烯、聚苯乙烯、聚碳酸脂及其混合物等);和金属(例如,金、铂等)。基底、固体支持物或反应器可以由选自硅、聚苯乙烯、琼脂糖、葡聚糖、纤维素聚合物、聚丙烯酰胺、聚二甲基硅氧烷(PDMS)和玻璃的材料制成。基底/固体支持物或其中的微结构/反应器可用本文列出的材料的组合或本领域中已知的任何其他合适材料制造。
表面体系结构
本文提供了用于本文所述的方法、组合物和系统的基底,其中该基底具有适于本文所述的方法、组合物和系统的表面体系结构。在一些情况下,基底包含凸起和/或凹陷特征。具有这种特征的一个益处是支持多核苷酸合成的表面积增大。在一些情况下,具有凸起和/或凹陷特征的基底称为三维基底。在一些情况下,三维基底包含一个或多个通道。在一些情况下,一个或多个座位包含通道。在一些情况下,通道可经由沉积装置(例如材料沉积装置)进行试剂沉积。在一些情况下,试剂和/或流体收集在与一个或多个通道流体连通的较大孔中。例如,基底包含对应于簇内多个座位的多个通道,并且该多个通道与簇的一个孔流体连通。在一些方法中,在簇的多个座位中合成多核苷酸文库。
本文提供了用于本文描述的方法、组合物和系统的基底,其中该基底配置用于多核苷酸合成。在一些情况下,结构配制为允许用于表面上多核苷酸合成的受控流动和质量传递路径。在一些情况下,基底的构造允许在多核苷酸合成期间质量传递路径、化学暴露时间和/或洗涤功效的受控且均匀分布。在一些情况下,基底的构造允许提高清扫效率,例如通过为增长的多核苷酸提供足够的体积,使得由增长的多核苷酸排除的体积不占可用于或适于增长多核苷酸的初始可用体积的多于50%、45%、40%、35%、30%、25%、20%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更少。在一些情况下,三维结构允许流体的受管控的流动,从而允许化学暴露的快速交换。
本文提供了用于本文所述的方法、组合物和系统的基底,其中该基底包含适于本文所述的方法、组合物和系统的结构。在一些情况下,隔离通过物理结构来实现。在一些情况下,隔离通过生成用于多核苷酸合成的活化和钝化区域的表面差异官能化来实现。在一些情况下,差异官能化通过在基底表面上交替疏水性来实现,从而产生引起沉积的试剂结珠或润湿的水接触角效应。采用较大的结构可以减少不同多核苷酸合成位置与相邻点的试剂的飞溅和交叉污染。在一些情况下,使用装置(例如材料沉积装置)将试剂沉积至不同的多核苷酸合成位置处。具有三维特征的基底以允许以低错误率(例如,小于约1∶500、1∶1000、1∶1500、1∶2,000、1∶3,000、1∶5,000或1∶10,000)合成大量多核苷酸(例如,多于约10,000个)的方式配置。在一些情况下,基底包含密度为约或大于约1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400或500个特征/mm2的特征。
基底的孔可具有与基底的另一个孔相同或不同的宽度、高度和/或体积。基底的通道可具有与基底的另一个通道相同或不同的宽度、高度和/或体积。在一些情况下,簇的直径或包含簇的孔的直径或两者为约0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.05-1、0.05-0.5、0.05-0.1、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5或0.5-2mm。在一些情况下,簇或孔或两者的直径小于或约为5、4、3、2、1、0.5、0.1、0.09、0.08、0.07、0.06或0.05mm。在一些情况下,簇或孔或两者的直径为约1.0至1.3mm。在一些情况下,簇或孔或两者的直径为约1.150mm。在一些情况下,簇或孔或两者的直径为约0.08mm。簇的直径是指二维或三维基底内的簇。
在一些情况下,孔的高度为约20-1000、50-1000、100-1000、200-1000、300-1000、400-1000或500-1000um。在一些情况下,孔的高度小于约1000、900、800、700或600um。
在一些情况下,基底包含对应于簇内多个座位的多个通道,其中通道的高度或深度为5-500、5-400、5-300、5-200、5-100、5-50或10-50um。在一些情况下,通道的高度小于100、80、60、40或20um。
在一些情况下,通道、座位(例如,在基本上平坦的基底中)或通道和座位两者(例如,在其中座位对应于通道的三维基底中)的直径为约1-1000、1-500、1-200、1-100、5-100或10-100um,例如,约90、80、70、60、50、40、30、20或10um。在一些情况下,通道、座位或通道和座位两者的直径小于约100、90、80、70、60、50、40、30、20或10um。在一些情况下,两个相邻通道、座位或通道和座位的中心之间的距离为约1-500、1-200、1-100、5-200、5-100、5-50或5-30,例如,约20um。
表面修饰
本文提供了用于在表面上合成多核苷酸的方法,其中该表面包含各种表面修饰。在一些情况下,采用表面修饰通过加成过程或减成过程化学地和/或物理地改变表面,以改变基底表面或基底表面选定位点或区域的一个或多个化学和/或物理特性。例如,表面修饰包括但不限于(1)改变表面的润湿特性,(2)使表面官能化,即,提供、修饰或取代表面官能团,(3)使表面去官能化,即,去除表面官能团,(4)以其他方式(例如,通过蚀刻)改变表面的化学组成,(5)增加或降低表面粗糙度,(6)在表面上提供涂层,例如,表现出不同于表面润湿特性的润湿特性的涂层,和/或(7)在表面上沉积颗粒。
在一些情况下,在表面顶部添加化学层(称为粘附促进剂)有利于基底表面上座位的结构图案化。用于施加粘附促进的示例性表面包括但不限于玻璃、硅、二氧化硅和氮化硅。在一些情况下,粘附促进剂是具有高表面能的化学品。在一些情况下,在基底的表面上沉积第二化学层。在一些情况下,第二化学层具有低表面能。在一些情况下,表面上涂覆的化学层的表面能支持液滴定位在表面上。根据选定的图案布置,座位的接近度和/或在座位处的流体接触面积是可改变的。
在一些情况下,其上沉积有(例如,用于多核苷酸合成的)核酸或其他部分的基底表面或分辨座位是平滑的或基本上平坦的(例如,二维的)或具有不规则性,例如凸起或凹陷特征(例如,三维特征)。在一些情况下,基底表面用一个或多个不同的化合物层修饰。这种目的修饰层包括但不限于无机和有机层,例如金属、金属氧化物、聚合物、有机小分子等。
在一些情况下,用增加和/或降低表面能的一个或多个部分使基底的分辨座位官能化。在一些情况下,部分是化学惰性的。在一些情况下,部分配置为支持所需化学反应,例如,多核苷酸合成反应中的一个或多个过程。表面的表面能或疏水性是决定核苷酸附接至表面上的亲和力的因素。在一些情况下,用于基底官能化的方法包括:(a)提供具有包含二氧化硅的表面的基底;以及(b)使用本文所述或本领域已知的合适的硅烷化试剂(例如,有机官能化烷氧基硅烷分子)使表面硅烷化。方法和官能化试剂描述于美国专利第5474796号中,其通过引用整体并入本文。
在一些情况下,在有效地将硅烷偶联至基底表面的反应条件下,通常经由存在于基底表面上的反应性亲水性部分,通过与含有硅烷混合物的衍生化组合物接触,使基底表面官能化。硅烷化通常通过与有机官能化烷氧基硅烷分子自组装来覆盖表面。如本领域目前已知的,还可以使用多种硅氧烷官能化试剂,例如,用于降低或增加表面能。有机官能化烷氧基硅烷根据其有机官能团进行分类。
多核苷酸合成
本发明用于多核苷酸合成的方法可包括涉及亚磷酰胺化学的过程。在一些情况下,多核苷酸合成包括将碱基与亚磷酰胺偶联。多核苷酸合成可包括通过在偶联条件下沉积亚磷酰胺来偶联碱基,其中相同的碱基任选地与亚磷酰胺沉积多于一次,即,双重偶联。多核苷酸合成可包括未反应位点的加帽。在一些情况下,加帽是任选的。多核苷酸合成也可包括氧化或氧化步骤。多核苷酸合成可包括去封闭、脱三苯甲基化和硫化。在一些情况下,多核苷酸合成包括氧化或硫化。在一些情况下,在多核苷酸合成反应期间的一个步骤或每个步骤之间,例如使用四唑或乙腈洗涤装置。亚磷酰胺合成方法中任一步骤的时间范围可小于约2min、1min、50sec、40sec、30sec、20sec和10sec。
使用亚磷酰胺方法的多核苷酸合成可包括随后将亚磷酰胺结构单元(例如,核苷亚磷酰胺)添加至增长的多核苷酸链以形成亚磷酸三酯键。亚磷酰胺多核苷酸合成以3’至5’方向进行。亚磷酰胺多核苷酸合成允许在每个合成循环中将一个核苷酸受控添加至增长的核酸链。在一些情况下,每个合成循环包括偶联步骤。亚磷酰胺偶联涉及在活化的核苷亚磷酰胺和例如经由接头与基底结合的核苷之间形成亚磷酸三酯键。在一些情况下,将核苷亚磷酰胺提供至活化的装置。在一些情况下,将核苷亚磷酰胺与活化剂一起提供至装置。在一些情况下,将核苷亚磷酰胺以超过基底结合的核苷1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍或更多的量提供至装置。在一些情况下,核苷亚磷酰胺的添加在无水环境中进行,例如,在无水乙腈中进行。在添加核苷亚磷酰胺后,任选地洗涤装置。在一些情况下,偶联步骤另外重复一次或多次,任选地在核苷亚磷酰胺添加至基底之间进行洗涤步骤。在一些情况下,本文所用的多核苷酸合成方法包括1、2、3或更多个连续偶联步骤。在许多情况下,在偶联之前,通过去除保护基团使与装置结合的核苷脱保护,其中保护基团起到防止聚合的作用。常见的保护基团是4,4’-二甲氧基三苯甲基(DMT)。
在偶联后,亚磷酰胺多核苷酸合成方法任选地包括加帽步骤。在加帽步骤中,用加帽试剂处理增长的多核苷酸。加帽步骤可用于在偶联后封闭未反应的与基底结合的5’-OH基团以免进一步链延伸,从而防止形成具有内部碱基缺失的多核苷酸。此外,用1H-四唑活化的亚磷酰胺可在很小程度上与鸟苷的O6位反应。不受理论束缚,在用I2/水氧化后,该副产物(可能经由O6-N7迁移)可经历脱嘌呤。无嘌呤位点可终止在多核苷酸的最终脱保护过程中被切割,从而降低全长产物的产率。O6修饰可通过在用I2/水氧化之前用加帽试剂处理而去除。在一些情况下,与未加帽的合成相比,在多核苷酸合成期间包括加帽步骤降低了错误率。作为实例,加帽步骤包括用乙酸酐和1-甲基咪唑的混合物处理与基底结合的多核苷酸。在加帽步骤后,任选地洗涤装置。
在一些情况下,在添加核苷亚磷酰胺后,并且任选地在加帽和一个或多个洗涤步骤之后,对与装置结合的增长的核酸进行氧化。氧化步骤包括将亚磷酸三酯氧化为四配位的磷酸三酯,其是天然存在的磷酸二酯核苷间键的受保护前体。在一些情况下,增长的多核苷酸的氧化通过任选地在弱碱(例如,吡啶、二甲基吡啶、可力丁)的存在下用碘和水处理来实现。氧化可在无水条件下使用例如叔丁基过氧化氢或(1S)-(+)-(10-樟脑磺酰基)-氧杂吖丙啶(CSO)进行。在一些方法中,在氧化后进行加帽步骤。第二加帽步骤允许装置干燥,因为可能持续存在的氧化残留水可以抑制随后的偶联。在氧化后,任选地洗涤装置和增长的多核苷酸。在一些情况下,氧化步骤被硫化步骤取代,以得到多核苷酸硫代磷酸酯,其中任何加帽步骤可在硫化之后进行。许多试剂能够进行有效硫转移,包括但不限于3-(二甲氨基亚甲基)氨基)-3H-1,2,4-二噻唑-3-硫酮、DDTT、3H-1,2-苯并二硫醇-3-酮1,1-二氧化物(也称为Beaucage试剂)和二硫化N,N,N’N’-四乙基秋兰姆(TETD)。
为了通过偶联进行核苷掺入的后续循环,去除与装置结合的增长的多核苷酸的受保护5’端,使得伯羟基与下一个核苷亚磷酰胺反应。在一些情况下,保护基团为DMT,并且用在二氯甲烷中的三氯乙酸进行去封闭。延长时间或用比推荐的酸溶液更强的酸溶液进行脱三苯甲基化可导致与固体支持物结合的多核苷酸的脱嘌呤增加,并因此降低所需全长产物的产率。本文所述的本发明的方法和组合物提供了限制不期望的脱嘌呤反应的受控去封闭条件。在一些情况下,在去封闭之后洗涤与装置结合的多核苷酸。在一些情况下,去封闭之后的有效洗涤有助于合成错误率低的多核苷酸。
合成多核苷酸的方法通常涉及以下步骤的迭代顺序:将受保护的单体施加至活化官能化的表面(例如,座位),以与活化的表面、接头或与先前脱保护的单体连接;使施加的单体脱保护,使得其可与随后施加的受保护单体反应;以及施加另一种受保护的单体用于连接。一个或多个中间步骤包括氧化或硫化。在一些情况下,一个或多个洗涤步骤在步骤中的一个或全部之前或之后。
基于亚磷酰胺的多核苷酸合成的方法包括一系列化学步骤。在一些情况下,合成方法的一个或多个步骤涉及试剂循环,其中该方法的一个或多个步骤包括向装置施加可用于该步骤的试剂。例如,通过一系列液体沉积和真空干燥步骤循环试剂。对于包含三维特征(例如孔、微孔、通道等)的基底,试剂任选地经由孔和/或通道穿过装置的一个或多个区域。
本文所述的方法和系统涉及用于合成多核苷酸的多核苷酸合成装置。合成可以是并行的。例如,可以并行合成至少或约至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、10000、50000、75000、100000或更多个多核苷酸。可并行合成的多核苷酸总数可以为2-100000、3-50000、4-10000、5-1000、6-900、7-850、8-800、9-750、10-700、11-650、12-600、13-550、14-500、15-450、16-400、17-350、18-300、19-250、20-200、21-150、22-100、23-50、24-45、25-40、30-35个。本领域技术人员理解,并行合成的多核苷酸总数可落入由这些值中任一个限定的任何范围内,例如25-100。并行合成的多核苷酸总数可落入由充当范围端点的值中任一个限定的任何范围内。在装置内合成的多核苷酸的总摩尔质量或多核苷酸中每一个的摩尔质量可以为至少或至少约10、20、30、40、50、100、250、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、25000、50000、75000、100000皮摩尔或更多。装置内多核苷酸中每一个的长度或多核苷酸的平均长度可以为至少或约至少10、15、20、25、30、35、40、45、50、100、150、200、300、400、500个核苷酸或更多。装置内多核苷酸中每一个的长度或多核苷酸的平均长度可以为至多或约至多500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10个核苷酸或更少。装置内多核苷酸中每一个的长度或多核苷酸的平均长度可以落入10-500、9-400、11-300、12-200、13-150、14-100、15-50、16-45、17-40、18-35、19-25个。本领域技术人员理解,装置内多核苷酸中每一个的长度或多核苷酸的平均长度可落入由这些值中任一个限定的任何范围内,例如100-300。装置内多核苷酸中每一个的长度或多核苷酸的平均长度可落入由充当范围端点的值中任一个限定的任何范围内。
本文提供的在表面上合成多核苷酸的方法允许快速合成。作为实例,每小时合成至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、70、80、90、100、125、150、175、200个核苷酸或更多。核苷酸包括腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶、尿苷结构单元或其类似物/修饰形式。在一些情况下,多核苷酸的文库在基底上并行合成。例如,包含约或至少约100、1,000、10,000、30,000、75,000、100,000、1,000,000、2,000,000、3,000,000、4,000,000或5,000,000个分辨座位的装置能够支持至少相同数目的不同多核苷酸的合成,其中编码不同序列的多核苷酸在分辨座位上合成。在一些情况下,在少于约三个月、两个月、一个月、三周、15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天、24小时或更短的时间内,以本文所述的低错误率在装置上合成多核苷酸的文库。在一些情况下,在少于约三个月、两个月、一个月、三周,15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天、24小时或更短的时间内,制备使用本文所述的基底和方法从以低错误率合成的多核苷酸文库组装的较大核酸。
在一些情况下,本文所述的方法提供了核酸文库的生成,该核酸文库包含在多个密码子位点处不同的变体核酸。在一些情况下,核酸可具有1个位点、2个位点、3个位点、4个位点、5个位点、6个位点、7个位点、8个位点、9个位点、10个位点、11个位点、12个位点、13个位点、14个位点、15个位点、16个位点、17个位点、18个位点、19个位点、20个位点、30个位点、40个位点、50个位点或更多个变体密码子位点。
在一些情况下,变体密码子位点的一个或多个位点可以相邻。在一些情况下,变体密码子位点的一个或多个位点可以不相邻,而是由1、2、3、4、5、6、7、8、9、10或更多个密码子隔开。
在一些情况下,核酸可包含变体密码子位点的多个位点,其中所有变体密码子位点彼此相邻,形成一段变体密码子位点。在一些情况下,核酸可包含变体密码子位点的多个位点,其中变体密码子位点彼此均不相邻。在一些情况下,核酸可包含变体密码子位点的多个位点,其中一些变体密码子位点彼此相邻,形成一段变体密码子位点,而变体密码子位点中的一些彼此不相邻。
参考附图,图3示出了用于从较短核酸合成核酸(例如,基因)的示例性过程工作流程。工作流程通常分为以下阶段:(1)单链核酸文库的从头合成,(2)连接核酸以形成更大的片段,(3)错误校正,(4)质量控制,以及(5)运输。在从头合成之前,预先选择预期的核酸序列或核酸序列组。例如,预先选择一组基因用于生成。
一旦选择了用于生成的大核酸,就设计预定的核酸文库用于从头合成。用于生成高密度多核苷酸阵列的各种合适的方法是已知的。在工作流程实例中,提供了装置表面层。在该实例中,改变表面化学,以改善多核苷酸合成过程。生成低表面能区域以排斥液体,同时生成高表面能区域以吸引液体。表面本身可以是平坦表面的形式或含有形状上的变化,例如增加表面积的突起或微孔。在工作流程实例中,如在国际专利申请公开WO/2015/021080中公开的,选定的高表面能分子发挥支持DNA化学的双重功能,其通过引用整体并入本文。
多核苷酸阵列的原位制备在固体支持物上进行,并利用单核苷酸延伸过程并行延伸多个寡聚物。沉积装置(例如材料沉积装置)设计为以逐步方式释放试剂,使得多个多核苷酸并行地一次延伸一个残基,以生成具有预定核酸序列的寡聚物302。在一些情况下,在该阶段,多核苷酸从表面被切割。切割包括例如用氨或甲胺进行气体切割。
将生成的多核苷酸文库置于反应室中。在该示例性工作流程中,反应室(也称为“纳米反应器”)是硅包被的孔,其含有PCR试剂并降低至多核苷酸文库上303。在多核苷酸密封304之前或之后,添加试剂以从基底释放多核苷酸。在示例性工作流程中,密封纳米反应器305之后释放多核苷酸。一旦释放,单链多核苷酸的片段就杂交以跨越DNA的整个长程序列。部分杂交305是可能的,因为每个合成的多核苷酸设计为与池中的至少一个其他多核苷酸具有小部分重叠。
在杂交之后,开始PCA反应。在聚合酶循环期间,多核苷酸与互补片段退火,并且用聚合酶补平空位。每个循环随机增加各个片段的长度,这取决于哪些多核苷酸找到彼此。片段之间的互补性允许形成完整大跨度的双链DNA 306。
在PCA完成之后,将纳米反应器与装置分离307,并定位以与具有PCR引物的装置相互作用308。密封后,纳米反应器进行PCR 309,并扩增较大的核酸。在PCR之后310,打开纳米室311,添加错误校正试剂312,将室密封313并进行错误校正反应,以从双链PCR扩增产物中去除具有较差互补性的错配碱基对和/或链314。打开并分离纳米反应器315。接着,错误校正的产品进行另外的处理步骤,例如PCR和分子条形码化,然后包装322用于运输323。
在一些情况下,采取质量控制措施。在错误校正之后,质量控制步骤包括例如与具有用于扩增错误校正产物的测序引物的晶片相互作用316,将晶片密封至含有错误校正扩增产物的室中317,并进行另一轮扩增318。打开纳米反应器319,合并产物320并进行测序321。在得到可接受的质量控制结果之后,批准包装的产物322用于运输323。
在一些情况下,通过例如图3中的工作流程生成的核酸使用本文公开的重叠引物进行诱变。在一些情况下,通过在固体支持物上原位制备来生成引物文库,并利用单核苷酸延伸过程并行延伸多个寡聚物。沉积装置(例如材料沉积装置)设计为以逐步方式释放试剂,使得多个多核苷酸并行地一次延伸一个残基,以生成具有预定核酸序列的寡聚物302。
计算机系统
本文所述系统中的任一种可操作地连接至计算机,并且可通过计算机本地或远程地自动化。在各种情况下,本发明的方法和系统还可包括计算机系统上的软件程序及其使用。因此,用于同步分配/真空/再填充功能(例如协调和同步材料沉积装置运动、分配行动和真空致动)的计算机控制在本发明的范围内。计算机系统可编程为在用户指定的碱基序列和材料沉积装置的位置之间进行连接,以将正确的试剂递送至基底的指定区域。
图4中所示的计算机系统400可被理解为能够从媒介411和/或网络端口405读取指令的逻辑设备,其可任选地连接至具有固定媒介412的服务器409。例如图4中所示的系统可以包括CPU 401、磁盘驱动器403、任选的输入装置(例如键盘415和/或鼠标416)以及任选的显示器407。可以通过所示的通信媒介实现与本地或远程位置服务器的数据通信。通信媒介可以包括传输和/或接收数据的任何手段。例如,通信媒介可以是网络连接、无线连接或互联网连接。这种连接可以提供万维网上的通信。预期与本发明相关的数据可以在这种网络或连接上传输,以便由图4所示的一方422接收和/或检查。
图5是示出可以结合本发明的示例情况使用的计算机系统500的第一示例体系结构的框图。如图5所示,示例计算机系统可以包括用于处理指令的处理器502。处理器的非限制性实例包括:Intel XeonTM处理器、AMD OpteronTM处理器、Samsung 32-bit RISC ARM1176JZ(F)-S v1.0TM处理器、ARM Cortex-A8 Samsung S5PC100TM处理器、ARM Cortex-A8Apple A4TM处理器、Marvell PXA 930TM处理器或功能等效处理器。多个执行线程可以用于并行处理。在一些情况下,也可以使用多个处理器或具有多个核的处理器,无论是在单个计算机系统中、在簇中,还是在包括多个计算机、移动电话和/或个人数据助理装置的网络上的系统上分布。
如图5所示,高速缓存器504可以连接至或并入处理器502,以为处理器502最近或频繁使用的指令或数据提供高速内存。处理器502通过处理器总线508连接至北桥506。北桥506通过内存总线512连接至随机存取内存(RAM)510,并管理处理器502对RAM 510的访问。北桥506还通过芯片组总线516连接至南桥514。南桥514又连接至外围总线518。外围总线可以是例如PCI、PCI-X、PCI Express或其他外围总线。北桥和南桥通常被称为处理器芯片组,并且管理处理器、RAM和外围总线518上的外围组件之间的数据传递。在一些替代体系结构中,北桥的功能可以并入处理器中,而不是使用单独的北桥芯片。在一些情况下,系统500可以包括与外围总线518附接的加速器卡522。加速器可以包括现场可编程门阵列(FPGA)或用于加速某些处理的其他硬件。例如,加速器可以用于自适应数据重组或评估扩展组处理中使用的代数表达式。
软件和数据存储在外部存储器524中,并且可以加载至RAM 510和/或缓存器504中,以供处理器使用。系统500包括用于管理系统资源的操作系统;操作系统的非限制性实例包括:Linux、WindowsTM、MACOSTM、BlackBerry OSTM、iOSTM和其他功能等效的操作系统,以及根据本发明的示例情况在操作系统上运行的用于管理数据存储和优化的应用软件。在该实例中,系统500还包括用于向外部存储器提供网络接口的与外围总线连接的网络接口卡(NIC)520和521,例如网络附加存储(NAS)和可用于分布式并行处理的其他计算机系统。
图6是示出具有多个计算机系统602a和602b、多个移动电话和个人数据助理602c以及网络附加存储(NAS)604a和604b的网络600的图。在示例情况下,系统602a、602b和602c可以管理数据存储,并优化对存储在网络附加存储(NAS)604a和604b中的数据的数据访问。数学模型可以用于该数据,并使用计算机系统602a和602b以及移动电话和个人数据助理系统602c上的分布式并行处理进行评估。计算机系统602a和602b以及移动电话和个人数据助理系统602c还可以为存储在网络附加存储(NAS)604a和604b中的数据的自适应数据重组提供并行处理。图6仅示出了实例,可以结合本发明的各种情况使用多种其他计算机体系结构和系统。例如,刀片式服务器可以用于提供并行处理。处理器刀片可以通过背板连接,以提供并行处理。存储器还可以通过单独的网络接口与背板连接或作为网络附加存储(NAS)。在一些示例情况下,处理器可以维持单独的内存空间,并且通过网络接口、背板或其他连接器来传输数据,以供其他处理器并行处理。在其他情况下,处理器中的一些或全部可以使用共享虚拟地址内存空间。
图7是根据示例情况使用共享虚拟地址内存空间的多处理器计算机系统700的框图。该系统包括可访问共享内存子系统704的多个处理器702a-f。该系统在内存子系统704中合并了多个可编程硬件内存算法处理器(MAP)706a-f。每个MAP 706a-f可以包含内存708a-f和一个或多个现场可编程门阵列(FPGA)710a-f。MAP提供了可配置的功能单元,并且可以向FPGA 710a-f提供特定算法或算法的一部分,用于与相应的处理器紧密协调地进行处理。例如,在示例情况下,MAP可以用于评估关于数据模型的代数表达式,并进行自适应数据重组。在该实例中,为了这些目的,处理器中的全部可全球访问每个MAP。在一种配置中,每个MAP可以使用直接内存访问(DMA)来访问相关内存708a-f,从而允许其独立于相应微处理器702a-f且与其异步地执行任务。在该配置中,MAP可将结果直接反馈至另一MAP,用于流水线和并行执行算法。
上述计算机体系结构和系统仅是实例,并且可以结合示例情况使用多种其他计算机、移动电话以及个人数据助理体系结构和系统,包括使用通用处理器、协同处理器、FPGA和其他可编程逻辑装置、芯片上系统(SOC)、专用集成电路(ASIC)以及其他处理和逻辑元件的任何组合的系统。在一些情况下,计算机系统的全部或一部分可以用软件或硬件来实现。可以结合示例情况使用任何种类的数据存储媒介,包括随机存取内存、硬盘驱动器、闪存、磁带驱动器、磁盘阵列、网络附加存储(NAS)以及其他本地或分布式数据存储装置和系统。
在示例情况下,计算机系统可以使用在上述中任一种或其他计算机体系结构和系统上执行的软件模块来实现。在其他情况下,系统的功能可部分或完全在固件、可编程逻辑装置(例如图5中提及的现场可编程门阵列(FPGA))、芯片上系统(SOC)、专用集成电路(ASIC)或其他处理和逻辑元件中实现。例如,组处理器和优化器可以通过使用硬件加速器卡(例如图5中所示的加速器卡522)用硬件加速来实现。
阐述以下实施例,以向本领域技术人员更清楚地说明本文公开的实施方案的原理和实践,并且以下实施例不应解释为限制任何要求保护的实施方案的范围。除非另有说明,否则所有份数和百分比均基于重量。
实施例
给出以下实施例是为了说明本发明的各种实施方案,而并不意味着以任何方式限制本发明。本发明的实施例以及本文所述的方法目前是优选实施方案的代表,是示例性的,并且不旨在限制本发明的范围。本领域技术人员将想到包含在由权利要求书的范围限定的本发明精神内的其中的改变和其他用途。
实施例1:装置表面的官能化
将装置官能化,以支持多核苷酸文库的附接和合成。首先使用包含90% H2SO4和10% H2O2的食人鱼溶液(piranha solution)将装置表面润湿清洁20分钟。将该装置在几个烧杯中用DI水冲洗,在DI水鹅颈龙头下保持5min,并用N2干燥。随后装置在NH4OH(1∶100;3mL∶300mL)中浸泡5min,使用手持式喷枪(handgun)用DI水冲洗,在三个连续烧杯中各用DI水浸泡1min,然后再次使用手持式喷枪用DI水冲洗。然后通过将装置表面暴露于O2来对装置进行等离子体清洁。使用SAMCO PC-300仪器在下游模式中以250瓦进行O2等离子体蚀刻1min。
使用具有以下参数的YES-1224P气相沉积烘箱系统,用包含N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺的溶液对清洁的装置表面进行活化官能化:0.5至1托,60min,70℃,135℃汽化器。使用Brewer Science 200X旋涂仪对装置表面进行抗蚀剂涂覆。将SPRTM3612光致抗蚀剂在装置上以2500rpm旋涂40sec。该装置在Brewer热板上以90℃预烘烤30min。使用Karl Suss MA6掩模对准仪对装置进行光刻。将装置暴露2.2sec并在MSF 26A中显影1min。用手持式喷枪冲洗剩余的显影剂,并将装置在水中浸泡5min。装置在烘箱中以100℃烘烤30min,随后使用Nikon L200目视检查光刻缺陷。使用SAMCO PC-300仪器以250瓦进行O2等离子体蚀刻1min,使用预清除(descum)过程来去除残留的抗蚀剂。
用与10μL轻质矿物油混合的100μL全氟辛基三氯硅烷溶液对装置表面进行钝化官能化。将装置置于室中,泵送10min,然后关闭泵的阀门并静置10min。将该室排气。通过在70℃下在500mL NMP中进行两次5min的浸泡并在最大功率(Crest系统上的9)下进行超声处理来剥离装置的抗蚀剂。然后在室温下,将该装置在500mL异丙醇中浸泡5min,并在最大功率下进行超声处理。将该装置浸入300mL的200标准酒精度的乙醇中,并用N2吹干。活化该官能化表面以用作多核苷酸合成的支持物。
实施例2:在寡核苷酸合成装置上合成50聚体序列
将二维寡核苷酸合成装置组装至流动池中,将其连接至流动池(AppliedBiosystems(ABI394 DNA合成仪))。用N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺(Gelest)将二维寡核苷酸合成装置均匀地官能化,其用于使用本文所述的多核苷酸合成方法合成50bp的示例性多核苷酸(“50聚体多核苷酸”)。
50聚体的序列如SEQ ID NO:1348中所述。5’AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGAC TTCGGCAT##TTTTTTTTTT3’(SEQ ID NO:1348),其中#表示胸苷-琥珀酰己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244),其是能够在脱保护期间从表面释放寡核苷酸的可切割接头。
根据表3中的方案和ABI合成仪,使用标准DNA合成化学(偶联、加帽、氧化和去封闭)进行合成。
表3:合成方案
亚磷酰胺/活化剂组合以与通过流动池递送主体试剂相似的方式进行递送。当环境在全部时间内保持被试剂“润湿”时,不进行干燥步骤。
将限流器从ABI 394合成器中移除,以使得能够更快速流动。在没有限流器的情况下,酰胺类(amidites)(在ACN中0.1M)、活化剂(0.25M苯甲酰基硫基四唑(“BTT”;来自GlenResearch的30-3070-xx)的ACN溶液)和Ox(0.02M I2的20%吡啶、10%水和70% THF溶液)的流速大致为~100uL/sec,乙腈(“ACN”)和加帽试剂(帽A和帽B的1∶1混合物,其中帽A是乙酸酐的THF/吡啶溶液,并且帽B是16%1-甲基咪唑的THF溶液)的流速大致为~200uL/sec,并且去封闭剂(3%二氯乙酸的甲苯溶液)的流速大致为~300uL/sec(与具有限流器情况下所有试剂的~50uL/sec相比)。观察到完全排出氧化剂的时间,相应地调整化学品流动时间的时机,并在不同化学品之间引入额外的ACN洗涤。在多核苷酸合成之后,将芯片在75psi下在气态氨中过夜脱保护。向表面施加五滴水以回收多核苷酸。然后在BioAnalyzer小RNA芯片上分析回收的多核苷酸。
实施例3:在寡核苷酸合成装置上合成100聚体序列
使用与实施例2中所述的合成50聚体序列相同的过程,在两个不同的硅芯片上合成100聚体多核苷酸(“100聚体多核苷酸”;5’CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3’,其中#表示胸苷-琥珀酰己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244);SEQ ID NO:1349),第一个芯片用N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺均匀地官能化,第二个芯片用11-乙酰氧基十一烷基三乙氧基硅烷和正癸基三乙氧基硅烷的5/95混合物官能化,并在BioAnalyzer仪器上分析从表面提取的多核苷酸。
使用以下热循环程序,在50uL PCR混合物(25uL NEB Q5预混物,2.5uL 10uM正向引物,2.5uL 10uM反向引物,1uL从表面提取的多核苷酸,水补足至50uL)中使用正向引物(5’ATGCGGGGTTCTCATCATC3’;SEQ ID NO:1350)和反向引物(5’CGGGATCCTTATCGTCATCG3’;SEQ ID NO:1351)进一步PCR扩增来自两个芯片的全部十个样品:
98℃,30sec
98℃,10sec;63℃,10sec;72℃,10sec;重复12个循环
72℃,2min
PCR产物还在BioAnalyzer上运行,在100聚体位置处显示出在尖峰。接着,克隆PCR扩增的样品,并进行Sanger测序。表4总结了从芯片1的点1-5采集的样品和从芯片2的点6-10采集的样品的Sanger测序结果。
表4:测序结果
错误率 循环效率
1 1/763bp 99.87%
2 1/824bp 99.88%
3 1/780bp 99.87%
4 1/429bp 99.77%
5 1/1525bp 99.93%
6 1/1615bp 99.94%
7 1/531bp 99.81%
8 1/1769bp 99.94%
9 1/854bp 99.88%
10 1/1451bp 99.93%
因此,在具有不同表面化学的两个芯片上重复合成的多核苷酸的高质量和均匀性。总体上,所测序的100聚体中89%是没有错误的完美序列,对应于262个中的233个。
表5总结了从来自点1-10的多核苷酸样品获得的序列的错误特征。
表5:错误特征
实施例4:从合成的GPCR聚焦型文库中鉴定的功能性GLP-1R抗体显示出强效的血糖控制。
本实施例描述了具有体外和体内功能活性的拮抗性和激动性GLP-1R抗体的鉴定。
材料和方法
稳定细胞系和噬菌体文库生成
将克隆至pCDNA3.1(+)载体(ThermoFisher)中的具有N-末端FLAG标签和C-末端GFP标签的全长人GLP-1R基因(UniProt-P43220)转染至悬浮中国仓鼠卵巢(CHO)细胞中,以生成表达GLP-1R的稳定细胞系。通过FACS证实了靶表达。然后将通过GFP表达>80%GLP-1R的细胞直接用于基于细胞的选择。
在GPCR聚焦型噬菌体展示文库中使用了种系重链IGHV1-69、IGHV3-30和种系轻链IGKV1-39、IGKV3-15、IGLV1-51、IGLV2-14框架组合,并且所有六个CDR多样性由类似于上述实施例1-3合成的寡核苷酸池编码。还筛选CDR以确保它们不含有可制造性倾向、隐蔽剪接位点或常用的核苷酸限制性位点。重链可变区(VH)和轻链可变区(VL)通过(G4S)3接头连接。通过NotI限制性消化将所得scFv(VH-接头-VL)基因文库克隆至pADL 22-2c(AntibodyDesign Labs)噬菌体展示载体中,并电穿孔至TG1电感受态大肠杆菌细胞(Lucigen)中。最终文库具有经NGS验证的1.1×1010大小的多样性。
用于分离激动剂GLP-1R scFv克隆的淘选和筛选策略
在淘选表达GLP-1R的CHO细胞之前,用5% BSA/PBS封闭噬菌体颗粒,并耗尽CHO亲代细胞上的非特异性结合剂。为了CHO亲代细胞耗尽,在室温(RT)下,将输入噬菌体等分试样与1×108个CHO亲代细胞一起以14rpm/min旋转1小时。然后通过在台式Eppendorf离心机5920RS/4×1000转子中以1,200rpm离心10min使细胞沉淀,以耗尽非特异性CHO细胞结合剂。然后将耗尽CHO细胞结合剂的噬菌体上清液转移至1×108个表达GLP-1R的CHO细胞中。在RT下,将噬菌体上清液和表达GLP-1R的CHO细胞以14rpm/min旋转1小时,以选择GLP-1R结合剂。在孵育之后,用1×PBS/0.5%Tween洗涤细胞几次,以去除未结合的克隆。为了洗脱与GLP-1R细胞结合的噬菌体,将细胞与胰蛋白酶在PBS缓冲液中于37℃孵育30分钟。通过以1,200rpm离心10min使细胞沉淀。在TG1大肠杆菌细胞中扩增富含GLP-1R结合克隆的输出上清液,以用作下一轮选择的输入噬菌体。该选择策略重复五轮。每一轮都针对CHO亲代背景进行耗尽。将一轮扩增的输出噬菌体用作下一轮的输入噬菌体,并且洗涤的严格性在随后每一轮的选择中随着洗涤次数增加而增加。在五轮选择之后,对来自第4轮和第5轮中每一轮的500个克隆进行Sanger测序,以鉴定独特的克隆。
下一代测序分析
噬菌粒DNA是从所有淘选轮次的输出细菌原液中小量制备的。使用正向引物ACAGAATTCATTAAAGAGGAGAAATTAACC和反向引物TGAACCGCCTCCACCGCTAG从噬菌粒DNA中PCR扩增可变重链(VH)。使用KAPA HyperPlus文库制备试剂盒(Kapa Biosystems,产品#KK8514)将PCR产物直接用于文库制备。为了增加文库中的多样性,样品掺有购自Illumina,Inc.(产品#FC-110-3001)的15% PhiX对照。然后将文库上样至Illumina 600循环MiSeq试剂盒v3(Illumina,产品#MS-102-3003)上,并在MiSeq仪器上运行。
重新格式化和高通量(HT)IgG纯化
使用Expifectamine(ThermoFisher,A14524)用2∶1比率的重链和轻链DNA转染Expi293细胞,并在转染后第4天在细胞活力降至低于80%之前收获上清液。使用带有蛋白A磁珠的King Fisher(ThermoFisher)或Phynexus蛋白A柱尖端(Hamilton)进行纯化。为了大规模生产在体内小鼠研究中评估的IgG克隆,使用Akta HPLC纯化系统(GE)。
IgG表征和质量控制。通过LabChip GXII Touch HT蛋白表达高灵敏度测定对阳性GLP-1R结合剂(命中物)的纯化的IgG进行纯度表征。使用二硫苏糖醇(DTT)来将IgG还原为VH和VL。使用Lunatic(UnChain)测量IgG浓度。通过HPLC进一步表征用于体内小鼠研究的IgG,并测试内毒素水平(nexgen-PTSTM内毒素测试,Charles River),每kg给药小于5EU。
结合测定和流式细胞术
在结合流式细胞术分析的结合测定中测试了GLP-1R IgG克隆,如下:将表达FLAG-GLP-1R-GFP的CHO细胞(CHO-GLP-1R)和CHO亲代细胞与100nM IgG在冰上一起孵育1h,洗涤三次,并与Alexa 647缀合的山羊抗人抗体(1∶200)(Jackson ImmunoResearchLaboratories,109-605-044)在冰上一起孵育30min,随后洗涤三次,在各洗涤步骤之间离心以沉淀细胞。所有孵育和洗涤都在含有PBS+1% BSA的缓冲液中进行。对于滴定,将IgG从100nM开始1∶3连续稀释至0.046nM。通过流式细胞术分析细胞,并通过测量针对Alexa 647信号的GFP信号来鉴定命中物(命中物是特异性结合至CHO-GLP-1R的IgG)。用100nM IgG进行的结合测定的流式细胞术数据表示为点图。用IgG滴定进行的结合测定分析表示为绘制IgG浓度针对MFI(平均荧光强度)的结合曲线。
配体竞争测定
配体竞争测定涉及将一级IgG与1μM GLP-1(7-36)共孵育。对于每个数据点,在流动缓冲液(PBS+1% BSA)中制备IgG(600nM),并以1∶3稀释8个滴定点。用流动缓冲液(PBS+1% BSA)类似地制备肽GLP-1 7-36(2μM)。每个孔含有100,000个细胞,向其中添加50μL的IgG和50μL的肽(=加号)或不含肽的单独缓冲液(=减号)。将细胞和IgG/肽混合物在冰上孵育1hr,洗涤后,添加PBS+1%BSA 1∶200稀释的二抗(山羊抗人APC,JacksonImmunoResearch Laboratories,产品#109-605-044)。将其在冰上孵育30min(每孔50μL),然后洗涤并再悬浮于60μL缓冲液中。最后,在IQue3筛选器上以每孔4秒的速率测量测定读数。
基于细胞的功能测定
cAMP测定。通过进行获自Eurofins DiscoverX的cAMP测定来测试GLP-1R IgG克隆对GLP-1R信号传导的潜在作用。涉及检测cAMP水平的技术是基于酶片段互补技术的无洗涤信号增益竞争性免疫测定。设计实验来测试IgG克隆的激动剂或拮抗剂活性。为了测试IgG的激动剂活性,将细胞用IgG 37℃孵育30min(从100nM开始1∶3滴定,并用PBS稀释至0.046nM)或用已知激动剂GLP-1 7-36肽(MedChemExpress,货号:HY-P005)(从12.5nM开始1∶6滴定,并用PBS稀释至0.003nM)来刺激。为了测试拮抗剂活性,在室温下,将细胞与100nM固定浓度的IgG一起孵育1h以允许结合,随后在37℃下用GLP1 7-36肽(从12.5nM开始1∶6滴定,并在PBS中降至0.003nM)刺激30min。按照测定试剂盒说明书检测胞内cAMP水平。
β抑制蛋白募集测定。β-抑制蛋白募集测定获自Eurofins DiscoverX(Cat#93-0300E2),其利用未加标签的GLP-1R过表达CHO-K1细胞。该实验是为了测试GLP1R-3在GLP-1R活化后是否对GLP-1 7-36激动剂诱导的β-抑制蛋白募集有作用。将扩增的细胞以5,000个细胞/孔接种至96孔板中,并在细胞铺板48小时后进行实验。将100nM IgG与50ul体积的铺板细胞在室温下预孵育1小时,然后添加5ul的配体GLP-1 7-36,37℃下进一步孵育30min。向每孔中添加22.5uL检测溶液,轻轻敲打并短暂离心。然后将板在RT下在黑暗中孵育1小时。然后通过化学发光读板器、Molecular Devices SpectraMax M5进行读板,并使用GraphPad Prism分析输出相对光单位(RLU)数据。
体内研究
动物。所有动物程序均由加利福尼亚大学旧金山分校的动物管理委员会(IACUC)批准,并根据国立卫生研究院实验室动物护理和使用指南来执行。在所述的所有研究中,使用了8-10周龄的C57BL/6NHsd(Envigo RMS,LLC)雄性同窝仔,体重~20-28克。将小鼠圈养在温度(22-25℃)和光控(12h:从7AM开始的12h光/暗循环)的房间中。在UCSF动物护理设施圈养期间,用含9%脂肪的饲料(PicoLab小鼠饲料20(#5058),实验室供应,FortworthTexas,USA)喂养小鼠。
单克隆抗体和试剂。在这些研究中测试PBS缓冲液中的抗GLP-1单克隆抗体(mAb):激动剂mAb GLP1R-59-2和拮抗剂mAb GLP1R-3。在葡萄糖耐量试验(GTT)或胰岛素耐量试验(ITT)之前使用以下方案对小鼠进行给药:在进行GTT之前在三个不同的施用方案组和在胰岛素耐量试验(ITT)中用四个不同的施用方案组以5或10mg/kg给药激动剂GTT-59-2mAb。1.在GTT之前15小时和ITT之前21小时以单剂量施用mAb。2.在GTT之前15小时和ITT之前21小时以双倍剂量,并且在GTT和ITT之前2小时以第二mAb剂量施用mAb。3.在GTT和ITT之前2小时mAb单剂量。4.仅在ITT之前6小时mAb单剂量。
在四个不同的施用方案组以20mg/kg给药拮抗剂GLP1R-3mAb。1.在GTT之前15小时和ITT之前21小时以单剂量施用mAb。2.在GTT之前15小时和ITT之前21小时以双倍剂量,并且在GTT和ITT之前2小时以第二mAb剂量施用mAb。3.在GTT和ITT之前6小时以单剂量施用mAb。4.在GTT和ITT之前2小时mAb单剂量。
在三个不同的施用方案组以1.0或0.23mg/kg给药Extendin9-39肽(MedChemExpress,货号:HY-P0264)。1.在ITT之前21小时,以单剂量施用Extendin。2.在ITT之前21小时以双倍剂量,并且在ITT之前2小时以第二Extendin剂量施用Extendin。3.在ITT之前6小时以单剂量施用mAb。
葡萄糖耐量试验
使用葡萄糖耐量试验(GTT)来评估两种不同的抗GLP1 mAb(激动剂和拮抗剂)在急性葡萄糖施用后对葡萄糖耐量的作用。在8或10周龄的雄性小鼠中进行腹膜内葡萄糖耐量试验(IP-GTT)以评估葡萄糖注射后的葡萄糖利用,并在小鼠过夜(14-16小时)禁食之后测量血糖水平。为了避免小鼠血糖水平的昼夜节律变化,在固定的时间进行该测试。在过夜禁食后对小鼠进行称重,并测量基线血糖水平(葡萄糖注射前;时间0分钟)。小鼠以单次推注(10ul/克体重)腹腔内注射30%右旋糖溶液(Hospira,Illinois),并在葡萄糖施用后15、30、60、120和180分钟测量血糖水平。通过尾部切口获得血液样品,并使用OneTouch Ultra2葡萄糖监测器(LifeScan,Inc.)监测血糖水平。
胰岛素耐量试验
进行胰岛素耐量试验(ITT)以评估两种不同的抗GLP1 mAb(激动剂和拮抗剂)在急性胰岛素施用后对胰岛素敏感性的作用。将8或10周龄雄性小鼠禁食6小时,并记录禁食前后的体重。为了避免小鼠血糖水平的昼夜节律变化,在固定的时间进行该测试。通过尾部切口收集血液样品,并在胰岛素注射之前测量基线葡萄糖。小鼠以单次推注(0.75U/Kg体重)腹腔内注射人胰岛素(诺和灵,Novo Nordisk),并在胰岛素注射后15、30、45、60和120分钟测量血糖水平。使用OneTouch Ultra 2葡萄糖监测器(LifeScan,Inc.)监测血糖水平。
用于药代动力学(PK)研究的ELISA。
大鼠PK研究在Charles River Laboratories,One Innovation Dr,3Biotech,马萨诸塞州伍斯特市,邮编01605进行。在给药之前,每组5只雄性Sprague-Dawley大鼠在测试设施接受至少3天后适应环境。在100mM Hepes、100mM NaCl、50mM NaAc、pH 6.0的媒介物中以10mg/kg静脉内(IV)给药GLP1R-3和GLP1R59-2。在每个时间点(给药前、给药后0.0833、0.25、0.5、1、2、4、8、24、48、72、96、168、240和336小时)经由颈静脉插管收集~250ul体积的连续血液样品。将血液样品收集至K2EDTA管中并储存在湿冰上,直到在收集后30分钟内通过离心(3500rpm,5℃下10分钟)加工成血浆。然后将血浆样品转移至含有DPP-4的适当管中(对于100μL血浆为3.3μL),并在干冰上冷冻。为了测量大鼠血浆样品中的人IgG,在ELISA测定中使用绵羊抗人IgG(1mg/mL)作为包被试剂(结合位点,批号AU003.M),并使用山羊抗人IgG,HRP(H&L)(1mg/mL)作为检测试剂(Bethyl,cat#A80-319P)。通过将人IgG掺入大鼠血浆中制备人IgG标准品和QC的储备溶液。使用至少两个孔来分析每个研究样品、QC、标准品和空白。使用4-参数逻辑(4PL)模型来拟合S形校正曲线。通过绘制吸光度反应针对浓度的图来获得半对数S形校正曲线。通过计算机内插法从校正曲线的图中确定测试样品中分析物的浓度。
结果
GPCR聚焦型抗体文库的设计基于GPCR结合基序和GPCR抗体
分析所有已知的GPCR相互作用,包括GPCR与配体、肽、抗体、内源性胞外环和小分子的相互作用,以绘制GPCR结合分子决定簇。使用与约50个GPCR(http://www.gpcrdb.org)的ECD结合的近150个肽、配体或抗体的晶体结构来鉴定GPCR结合基序。从该分析中提取超过1000个GPCR结合基序。此外,通过分析所有已解析的GPCR结构(zhanglab.ccmb.med.umich.edu/GPCR-EXP/),鉴定了来自GPCR内源性胞外环的超过2000个结合基序。最后,通过分析与GPCR结合的超过100个小分子配体的结构,鉴定了5个氨基酸(Tyr、Phe、His、Pro和Gly)的简化氨基酸文库,其可能能够概括这些配体的许多结构接触。具有这种降低的氨基酸多样性的子文库位于CxxxxxC基序内。总共鉴定了超过5000个GPCR结合基序(图9A-9E)。这些结合基序位于五个不同茎区中的一个中:CARDLRELECEEWTxxxxxSRGPCVDPRGVAGSFDVW 、CARDMYYDFxxxxxEVVPADDAFDIW 、CARDGRGSLPRPKGGPxxxxxYDSSEDSGGAFDIW 、CARANQHFxxxxxGYHYYGMDVW 、CAKHMSMQxxxxxRADLVGDAFDVW。
这些茎区选自具有超长HCDR3的结构抗体。特异性选择抗体种系,以包容这些超长HCDR3。长于21个氨基酸的人抗体的结构和序列分析揭示了具有长CDR3的抗体中的V基因偏向。最后,基于该分析选择种系IGHV(IGHV1-69和IGHV3-30)、IGKV(IGKV1-39和IGKV3-15)和IGLV(IGLV1-51和IGLV2-14)基因。
除了HCDR3多样性之外,其他5个CDR中也引入了有限的多样性。IGHV1-69结构域中有416个HCDR1变体和258个HCDR2变体;IGHV3-30结构域中的535个HCDR1变体和416个HCDR2变体;IGKV1-39结构域中有490个LCDR1变体、420个LCDR2变体和824个LCDR3变体;IGKV3-15结构域中有490个LCDR1变体、265个LCDR2变体和907个LCDR3变体;IGLV1-51结构域中有184个LCDR1变体、151个LCDR2变体和824个LCDR3变体;IGLV2-14结构域中有967个LCDR1变体、535个LCDR2变体和922个LCDR3变体(图10)。通过将种系CDR与在12个人供体中至少两个的V基因组库内的CDR中观察到的单、双和三突变的近种系空间进行比较来选择这些CDR变体。对所有CDR进行预筛选以去除可制造性倾向、隐蔽剪接位点或核苷酸限制性位点。CDR合成为寡核苷酸池,并掺入至选定的抗体支架中。重链(VH)和轻链(VL)基因通过(G4S)3接头连接。将所得scFv(VH-接头-VL)基因池克隆至噬菌粒展示载体的M13基因-3次要外壳蛋白的N-末端处。GPCR文库的最终大小是scFv形式的1×1010。对最终噬菌体文库进行下一代测序(NGS),以分析文库中的HCDR3长度分布,用于与来自三个健康成人供体的B细胞群体中的HCDR3长度分布进行比较。所用的来自三个健康供体的HCDR3序列来源于具有超过3700万个B细胞受体序列的公开可用的数据库31。GPCR文库中的HCDR3长度比在B细胞组库序列中观察到的HCDR3长度长得多。平均而言,GPCR文库中的HCDR3中值长度(其显示出双相分布模式)比天然B细胞组库序列中观察到的中值长度(15至17个氨基酸)长两倍或三倍(33至44个氨基酸)(图11)。GPCR文库中HCDR3的双相长度分布主要由用于呈递HCDR3内基序的两组茎(8aa,9aaxxxxx10aa,12aa)和(14aa,16aaxxxxx18aa,14aa)引起。
针对GLP-1R过表达细胞系的噬菌体淘选导致克隆富集
产生GLP-1R过表达CHO稳定细胞系,其中FLAG标签存在于受体的N-末端以检测细胞表面表达,并且EGFP标签存在于C-末端以追踪总受体表达。这些细胞的流式细胞术分析证实了大部分受体(>80%)在细胞表面表达(图12A)。这些表达GLP-1R的CHO细胞用于五轮针对GPCR聚焦型文库的噬菌体淘选。选择方案如图12B所示。对每轮淘选输出的可变重链(VH)进行PCR扩增,并通过MiSeq进行测序。随着每轮输出池NGS测序中独特HCDR3的百分比降低,从第1轮至第5轮观察到显著的克隆富集(图13),这表明淘选过程中的靶特异性克隆选择。挑选总共约1000个克隆(来自第4轮和第5轮)用于单克隆NGS测序,并且选择~100个独特的VH-VL对进行重新格式化并以1ml规模表达为全长人IgG2。
针对GLP-1R的IgG结合剂含有GLP-1、GLP-2或鉴定的独特HCDR3基序。
测试纯化的IgG克隆与表达GLP-1R的CHO细胞的特异性结合。使用100nM IgG浓度进行的单点流式细胞术分析揭示了在测试的100个IgG独特克隆中,13个IgG克隆与GLP-1R阳性细胞(GFP+)而非亲代CHO细胞(GFP-)特异性结合。然后通过每个IgG克隆从200nM(30μg/mL)开始的8点滴定进一步评估这13个命中物的结合,并确定细胞结合亲和力在两位数nM范围内。所有13个IgG克隆的平均CHO亲代细胞背景结合以黑线表示,并且与GLP-1R表达细胞的特异性结合相比是最小的(图14)。未观察到完全饱和,在实验中使用的最高浓度200nM下结合曲线处于平台期。图15示出了这13个IgG克隆的HCDR3氨基酸序列。经发现,其中6个包括GLP-1基序,4个包括GLP-2基序,3个具有未知基序。
13个结合剂中8个IgG是GLP-1R介导的cAMP信号传导中的负性拮抗剂。
接着,通过使用购自DiscoverX的GLP-1R过表达CHO-K1细胞来评估13个IgG结合剂在cAMP信号传导途径中的功能活性,该细胞经设计和验证用于评估GLP-1R诱导的cAMP信号传导。首先,在剂量滴定中测试IgG克隆与肽激动剂GLP-1 7-36相比的激动剂活性。虽然GLP-1 7-36刺激产生cAMP信号,但未观察到IgG克隆的cAMP信号,这表明它们未活化。随后,通过与固定浓度的IgG一起预孵育表达GLP-1R的细胞以允许发生结合,然后以剂量依赖性方式用GLP-1 7-36刺激细胞,测试了一组IgG克隆的拮抗剂活性。这允许检查IgG的存在对GLP-1 7-36诱导的GLP-1R cAMP信号传导的影响,从而潜在地揭示IgG的任何潜在竞争性作用。观察到,在13个IgG克隆中有8个克隆存在的情况下,GLP-1 7-36剂量反应曲线向右移动,这表明它们用作GLP-1 7-36反应的负性拮抗剂(数据未显示)。关于13个IgG克隆对毒蜥外泌肽-4诱导的GLP-1R cAMP信号传导反应的作用进行了相似的观察(数据未显示)。剩余的5个IgG克隆似乎对GLP-1R cAMP信号传导无显著作用(数据未显示)。
拮抗剂IgG GLP1R-3的作用机制表征
为了确定这些所得功能性命中物的作用机制,随后的研究集中于显示高结合亲和力以及功能性的含GLP-1基序的IgG克隆中的一个:GLP1R-3。进行配体竞争结合测定、IgG在cAMP信号传导中对GLP-1剂量反应的作用以及β-抑制蛋白募集测定,得到GLP1R-3的表征如下:
在GLP-1R结合测定中与内源性配体竞争。为了确定GLP1R-3是否与受体上的正构位点(orthosteric site)结合,在存在或不存在固定浓度的肽激动剂GLP-1 7-36(1μM)的情况下,将N-末端FLAG标记的和C-末端GFP标记的GLP-1R过表达CHO细胞与从100nM开始的剂量滴定的GLP1R-3一起孵育。流式细胞术分析揭示了在GLP-1 7-36存在的情况下,GLP1R-3与GLP-1R(GFP+)的结合显著降低。虽然GLP-1 7-36肽的存在不完全消除GLP1R-3结合,但该观察结果表明抗体可结合至重叠表位,或GLP1R-3对GLP-1 7-36具有更强的结合亲和力以竞争结合。(图16A)。
GLP1R-3拮抗GLP-1活化的cAMP信号传导。下一步是确定GLP1R-3是否以剂量依赖性方式对GLP-1R表现出竞争性拮抗作用。在存在恒定浓度(100nM)的GLP1R-3的情况下,用从20nM开始3倍下降滴定的剂量滴定的GLP-1 7-36检查GLP-1 7-36诱导的cAMP信号传导,观察到cAMP信号明显的剂量依赖性抑制。GLP-1 7-36肽的EC50在不存在GLP1R-3的情况下为0.025nM,在存在100nM GLP1R-3的情况下为0.11nM(图16B),这支持GLP1R-3是竞争性拮抗剂。
GLP1R-3在GLP-1R活化后减少β-抑制蛋白募集。当GPCR被激动剂活化时,β-抑制蛋白从胞质溶胶被募集至GPCR,从而将受体从进一步的G蛋白相互作用中排除,并导致信号阻滞,因此称为“抑制蛋白”。为了确定GLP1R-3是否对活化的GLP-1R募集β-抑制蛋白有任何作用,以以下方式采用专门设计并验证用于评估GLP-1Rβ-抑制蛋白募集的GLP-1R过表达CHO-K1细胞(DiscoverX)。在室温下,将细胞与固定浓度的GLP1R-3(100nM)一起预孵育1hr,以使结合发生,然后用GLP-1 7-36刺激。GLP1R-3显示出对GLP-1 7-36肽诱导的β-抑制蛋白募集至GLP-1R的抑制,如通过β-抑制蛋白募集的GLP-1 7-36剂量反应曲线的右移所证明(图16C)。这表明GLP1R-3减少β-抑制蛋白募集至GLP-1R,其与观察到的受体活化减少一致。因此,这些基于细胞的测定表明GLP1R-3是GLP-1 7-36对GLP-1R的竞争性拮抗剂。
GLP-1R激动剂IgG GLP1R-59-2的设计和表征
由于13个IgG命中物中没有一个显示出任何激动剂活性,因此通过将天然GLP-17-36肽连接至功能失活但GLP-1R特异性结合剂GLP1R-2的轻链N-末端(图17)来工程化GLP-1R激动剂抗体(GLP1R-59-2)。进行GLP-1R结合测定、cAMP测定和β-抑制蛋白募集测定,得到如本文所述的GLP1R-59-2的表征:
GLP1R-59-2特异性结合至表达GLP-1R的CHO细胞。流式细胞术分析揭示了GLP1R-59-2与GLP-1R阳性细胞(GFP+)而非亲代CHO细胞(GFP-)特异性结合,特异性结合也通过GLP1R-59-2剂量滴定来证实,产生15.5nM的表观结合EC50(图18A)。
GLP1R-59-2诱导与GLP-1 7-36相似的GLP-1R cAMP反应。测试GLP1R-59-2与GLP-17-36相比刺激GLP-1R过表达CHO-K1细胞(DiscoverX)的激动剂活性,对配体和抗体进行单独的剂量滴定分析。经发现,这两种诱导的cAMP信号传导谱相似,它们的剂量反应曲线具有几乎重叠的EC50值,对于GLP1R-59-2为0.042nM,对于GLP-1 7-36为0.085nM(图18B),这支持GLP-1R-59-2可以用作GLP-1R的有效激动剂的假设。
GLP1R-59-2比GLP-1 7-36对β-抑制蛋白募集至GLP-1R的有效性更低。为了确定GLP1R-59-2是否能够诱导与GLP-1 7-36相似水平的β-抑制蛋白募集至GLP-1R,用各剂量滴定刺激GLP-1R过表达CHO-K1细胞(DiscoverX)。经发现,用GLP1R-59-2刺激比用GLP-17-36刺激发生更少的β-抑制蛋白募集(图18C)。虽然GLP1R-59-2比GLP-1 7-36对最大β-抑制蛋白募集的有效性更低,但似乎激动剂IgG略微更有效,EC50为0.042nM,而GLP-1 7-36的EC50为0.085nM。
GLP1R-3和GLP1R-59-2的体内PK和PD测试
内源性GLP-1肽具有非常短的仅几分钟的血清半衰期,然而GLP-1R抗体可以具有显著更长的半衰期。这与目前的GLP-1肽类似物治疗剂相比具有相当大的优势。进行体内PK大鼠研究,以评估IgG形式的拮抗剂GLP1R-3和激动剂GLP1R-59-2的半衰期。在2周PK研究中,GLP1R-3在大鼠中表现出~1周的抗体样体内半衰期,而激动剂GLP-1肽-抗体融合体GLP1R-59-2在大鼠中表现出>2天的半衰期(图19A-19B)。用于治疗II型糖尿病的已获批准的GLP-1R激动剂利拉鲁肽的半衰期为13小时。
与媒介物对照相比,使用野生型C57BL/6NHsd小鼠模型在葡萄糖耐量试验(GTT)中测试激动剂GLP1R-59-2的体内药效学(PD)作用。激动剂mAb GLP1R-59-2的治疗剂量(5mg/kg和10mg/kg)或给药方案(在葡萄糖攻击之前2hrs、13+2hrs和15hrs)甚至在葡萄糖攻击之后显著稳定血糖(图20A)。与对照小鼠相比,GLP1R-59-2治疗在减少GTT曲线下面积(AUC)方面均显著(p<0.001)(图20B)。然而,在每个单独的治疗时间或剂量之间无显著差异。
拮抗剂GLP1R-3mAb和GLP-1肽毒蜥外泌肽9-39治疗,以及在胰岛素攻击之前19+2小时给药方案,显著稳定野生型C57BL/6NHsd小鼠中较高的血糖(图21A)。与对照小鼠相比,GLP1R-3mAb(20mg/kg)和毒蜥外泌肽(1mg/kg)治疗在稳定ITT曲线下面积(AUC)方面均显著(p<0.0001)(图21B)。然而,GLP1R-3和对照与毒蜥外泌肽(0.23mg/kg)之间在19+2小时治疗下无显著差异。
与GLP-1肽毒蜥外泌肽9-39(1.0或0.23mg/kg剂量)或对照相比,使用单一6小时给药方案、拮抗剂GLP1R-3mAb治疗的另一个实验在胰岛素攻击之后也显著稳定较高的血糖(图22A)。与对照小鼠相比,GLP1R-3mAb(20mg/kg)治疗6小时,显著(p<0.05)稳定ITT曲线下面积(AUC)。然而,对照与毒蜥外泌肽(1.0和0.23mg/kg)之间在单一6小时治疗下无显著差异(图22B)。
GLP1R-3mAb治疗也与比较抗体GLP1R-226-1和GLP1R-226-2进行比较。与GLP1R-226-1(20mg/kg)或对照相比,单一6小时给药方案中的GLP1R-3mAb治疗在胰岛素攻击(在时间0)之后显著稳定较高的血糖(图23A-23B)。与对照小鼠相比,GLP1R-3mAb(20mg/kg)治疗6小时,显著(p<0.05)稳定ITT曲线下面积(AUC)。对照与GLP1R-226-1或GLP1R-226-2之间在单一6小时治疗下无显著差异(p<0.05)。
实施例5:GLP1R变体
优化GLP1R-3以生成另外的GLP1R变体。
GLP1R-221和GLP1R-222变体的淘选策略见图24A-24B。挑选第4轮和第5轮的768个克隆,并在Miseq上测序。将95个独特的克隆重新格式化。GLP1R-221和GLP1R-222变体的数据见表6A-6H。GLP1R-221和GLP1R-222变体的序列见表9-13。
表6A.
IgG MFI比率 减法
GLP1R-3 993.31197 232201
GLP1R-221-065 914.54027 272235
GLP1R-221-075 1174.8495 241813
GLP1R-221-017 1484.8457 240383
GLP1R-221-033 1015.9153 239520
GLP1R-221-076 746.61867 235615.5
GLP1R-221-092 711.73926 231701
GLP1R-221-034 711.15764 222989.5
GLP1R-221-066 927.53542 222368.5
GLP1R-221-084 1067.8986 220848
GLP1R-221-009 1119.868 220417
表6B.
表6C.
表6D.
表6E.
表6F.
表6G.
表6H.
在竞争测定中测定GLP1R-221和GLP1R-222变体。数据见图25A-25B。还在cAMP测定中测定了变体。简言之,将细胞与100nM的抗GLP1R抗体一起预孵育,随后从12.5nM开始3X滴定激动剂刺激。数据见图26,改进的变体以绿色突出显示。
实施例6:序列
表7.嵌入CDRH3中的GLP1序列
表8.GLP1R变体CDRH3序列
*粗体对应于GLP1或GLP2基序
表9.可变重链序列
表10.可变轻链序列
表11.GLP1R序列
表12.可变重链CDR
表13.可变轻链CDR
尽管本文已示出并描述了本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅作为示例提供。在不背离本发明的情况下,本领域技术人员现在将想到许多变化、改变和替换。应理解,在实践本发明时,可以采用本文所述的本发明实施方案的各种替代方案。以下权利要求旨在限定本发明的范围,并且因此涵盖这些权利要求范围内的方法和结构及其等同项。

Claims (36)

1.一种抗体或抗体片段,其包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(b)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(c)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;(d)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(e)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(f)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。
2.根据权利要求1所述的抗体或抗体片段,其中所述抗体是单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)、单链抗体、Fab片段、F(ab’)2片段、Fd片段、Fv片段、单结构域抗体、分离的互补决定区(CDR)、双抗体、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体或其ab抗原结合片段。
3.根据权利要求1所述的抗体或抗体片段,其中所述抗体或其抗体片段是嵌合的或人源化的。
4.根据权利要求1所述的抗体或抗体片段,其中所述抗体或抗体片段在cAMP测定中的EC50小于约25纳摩尔。
5.根据权利要求1所述的抗体或抗体片段,其中所述抗体或抗体片段在cAMP测定中的EC50小于约20纳摩尔。
6.根据权利要求1所述的抗体或抗体片段,其中所述抗体或抗体片段在cAMP测定中的EC50小于约10纳摩尔。
7.根据权利要求1所述的抗体或抗体片段,其中所述抗体或抗体片段是GLP1R的激动剂。
8.根据权利要求1所述的抗体或抗体片段,其中所述抗体或抗体片段是GLP1R的拮抗剂。
9.根据权利要求1所述的抗体或抗体片段,其中所述抗体或抗体片段是GLP1R的别构调节剂。
10.根据权利要求9所述的抗体或抗体片段,其中所述GLP1R的别构调节剂是负性别构调节剂。
11.根据权利要求1所述的抗体或抗体片段,其中所述VH包含与SEQ ID NO:58-77中的任一者至少约90%相同的序列。
12.根据权利要求1所述的抗体或抗体片段,其中所述VH包含SEQ ID NO:58-77中的任一者的序列。
13.根据权利要求1所述的抗体或抗体片段,其中所述VL包含与SEQ ID NO:92-111中的任一者至少约90%相同的序列。
14.根据权利要求1所述的抗体或抗体片段,其中所述VL包含SEQ ID NO:92-111中的任一者的序列。
15.一种治疗代谢疾病或病症的方法,所述方法包括施用结合GLP1R的抗体或抗体片段,所述抗体或抗体片段包含可变结构域重链区(VH)和可变结构域轻链区(VL),其中VH包含互补决定区CDRH1、CDRH2和CDRH3,其中VL包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(a)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(b)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(c)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;(d)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(e)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(f)CDRL3的氨基酸序列如SEQID NO:1169-1347中的任一者所示。
16.根据权利要求15所述的方法,其中所述抗体是单克隆抗体、多克隆抗体、双特异性抗体、多特异性抗体、移植抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、骆驼化抗体、单链Fv(scFv)、单链抗体、Fab片段、F(ab’)2片段、Fd片段、Fv片段、单结构域抗体、分离的互补决定区(CDR)、双抗体、仅由单个单体可变结构域组成的片段、二硫键连接的Fv(sdFv)、胞内抗体、抗独特型(抗Id)抗体或其ab抗原结合片段。
17.根据权利要求15所述的方法,其中所述抗体或其抗体片段是嵌合的或人源化的。
18.根据权利要求15所述的方法,其中所述抗体或抗体片段在cAMP测定中的EC50小于约25纳摩尔。
19.根据权利要求15所述的方法,其中所述抗体或抗体片段在cAMP测定中的EC50小于约20纳摩尔。
20.根据权利要求15所述的方法,其中所述抗体或抗体片段在cAMP测定中的EC50小于约10纳摩尔。
21.根据权利要求15所述的方法,其中所述抗体或抗体片段是GLP1R的激动剂。
22.根据权利要求15所述的方法,其中所述抗体或抗体片段是GLP1R的拮抗剂。
23.根据权利要求15所述的方法,其中所述抗体或抗体片段是GLP1R的别构调节剂。
24.根据权利要求23所述的方法,其中所述GLP1R的别构调节剂是负性别构调节剂。
25.根据权利要求15所述的方法,其中所述抗体或抗体片段是别构调节剂。
26.根据权利要求15所述的方法,其中所述抗体或抗体片段是负性别构调节剂。
27.根据权利要求15所述的方法,其中所述VH包含与SEQ ID NO:58-77中的任一者至少约90%相同的序列。
28.根据权利要求15所述的方法,其中所述VH包含SEQ ID NO:58-77中的任一者的序列。
29.根据权利要求15所述的方法,其中所述VL包含与SEQ ID NO:92-111中的任一者至少约90%相同的序列。
30.根据权利要求15所述的方法,其中所述VL包含SEQ ID NO:92-111中的任一者的序列。
31.根据权利要求15所述的方法,其中所述代谢疾病或病症是II型糖尿病或肥胖症。
32.一种核酸组合物,其包含:
a)编码可变结构域重链区(VH)的第一核酸,所述可变结构域重链区(VH)包含互补决定区CDRH1、CDRH2和CDRH3,并且其中(i)CDRH1的氨基酸序列如SEQ ID NO:441-619中的任一者所示;(ii)CDRH2的氨基酸序列如SEQ ID NO:620-798中的任一者所示;(iii)CDRH3的氨基酸序列如SEQ ID NO:799-977中的任一者所示;
b)编码可变结构域轻链区(VL)的第二核酸,所述可变结构域轻链区(VL)包含互补决定区CDRL1、CDRL2和CDRL3,并且其中(i)CDRL1的氨基酸序列如SEQ ID NO:978-1156中的任一者所示;(ii)CDRL2的氨基酸序列如SEQ ID NO:1157-1168中的任一者所示;以及(iii)CDRL3的氨基酸序列如SEQ ID NO:1169-1347中的任一者所示。
33.一种核酸组合物,其包含:a)编码可变结构域重链区(VH)的第一核酸,所述可变结构域重链区(VH)包含与如SEQ ID NO:58-77中的任一者所示的序列至少约90%相同的氨基酸序列;b)编码可变结构域轻链区(VL)的第二核酸,所述可变结构域轻链区(VL)包含与如SEQ ID NO:92-111中的任一者所示的序列至少约90%相同的氨基酸序列;以及赋形剂。
34.根据权利要求33所述的核酸组合物,其中所述VH包含如SEQ ID NO:58-77中的任一者所示的氨基酸序列。
35.根据权利要求33所述的核酸组合物,其中所述VL包含如SEQ ID NO:92-111中的任一者所示的氨基酸序列。
36.根据权利要求33所述的核酸组合物,其中所述VH包含如SEQ ID NO:58-77中的任一者所示的氨基酸序列,并且其中所述VL包含如SEQ ID NO:92-111中的任一者所示的氨基酸序列。
CN202180073480.2A 2020-08-26 2021-08-25 涉及glp1r变体的方法和组合物 Pending CN116829946A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/070,734 2020-08-26
US202063081801P 2020-09-22 2020-09-22
US63/081,801 2020-09-22
PCT/US2021/047616 WO2022046944A2 (en) 2020-08-26 2021-08-25 Methods and compositions relating to glp1r variants

Publications (1)

Publication Number Publication Date
CN116829946A true CN116829946A (zh) 2023-09-29

Family

ID=88117086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180073480.2A Pending CN116829946A (zh) 2020-08-26 2021-08-25 涉及glp1r变体的方法和组合物

Country Status (1)

Country Link
CN (1) CN116829946A (zh)

Similar Documents

Publication Publication Date Title
US12331427B2 (en) Antibodies that bind GLP1R
US12391762B2 (en) Methods and compositions relating to GLP1R variants
US12202905B2 (en) Methods and compositions relating to adenosine receptors
US12091777B2 (en) Variant nucleic acid libraries for CRTH2
US20220135690A1 (en) Methods and compositions relating to chemokine receptor variants
US20210179724A1 (en) Variant nucleic acid libraries for adenosine receptors
CN116829946A (zh) 涉及glp1r变体的方法和组合物
HK40100779A (zh) 涉及glp1r变体的方法和组合物
HK40080611A (zh) 针对腺苷受体的变体核酸文库
CN117729937A (zh) 涉及腺苷受体的方法和组合物
HK40064749A (zh) Glp1受体的变异核酸文库

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40100779

Country of ref document: HK