CN118011004B - 使用纳米孔表征靶多肽的方法 - Google Patents
使用纳米孔表征靶多肽的方法Info
- Publication number
- CN118011004B CN118011004B CN202410066918.XA CN202410066918A CN118011004B CN 118011004 B CN118011004 B CN 118011004B CN 202410066918 A CN202410066918 A CN 202410066918A CN 118011004 B CN118011004 B CN 118011004B
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- nanopore
- polypeptide
- protein
- conjugate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6818—Sequencing of polypeptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3517—Marker; Tag
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2458/00—Labels used in chemical analysis of biological material
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Nanotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Cell Biology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Plant Pathology (AREA)
- Peptides Or Proteins (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供了在靶多肽相对于纳米孔移动时表征所述靶多肽的方法。还提供了用于执行此类方法的相关试剂盒、系统和设备。
Description
本申请是申请日为2020年12月01日,申请号为2020800834172,发明名称为“使用纳米孔表征靶多肽的方法”的中国发明专利申请的分案申请。
技术领域
本公开涉及通过形成靶多肽与多核苷酸的缀合物并使用多核苷酸处理蛋白来控制所述缀合物相对于纳米孔移动来表征所述靶多肽的方法。本公开还涉及用于执行此类方法的试剂盒、系统和设备。
背景技术
生物分子的表征在生物医学和生物技术应用中越来越重要。例如,核酸的测序允许研究基因组和其编码的蛋白质,例如,允许核酸突变与可观察现象(如疾病适应症)之间的相关性。核酸测序可以用于进化生物学中研究生物体之间的关系。宏基因组学涉及鉴定样品中存在的生物体,例如微生物组中的微生物,其中核酸测序允许鉴定此类生物体。虽然表征多核苷酸(例如,对多核苷酸进行测序)的技术已经广泛发展,但表征多肽的技术不太先进,尽管具有非常重要的生物技术重要性。例如,蛋白质序列的知识可以允许建立结构-活性关系,并且对用于开发针对特定受体的配体的合理药物开发策略产生影响。翻译后修饰的鉴定也是理解许多蛋白质的功能性质的关键。例如,通常30%-50%的蛋白质物种在真核生物中被磷酸化。一些蛋白质可能具有多个磷酸化位点,用于激活或灭活蛋白质、促进蛋白质降解或调节与蛋白质配偶体的相互作用。因此,迫切需要表征蛋白质和其它多肽的方法。
表征多肽的已知方法包含质谱法和埃德曼降解(Edman degradation)。
蛋白质质谱法涉及以电离形式表征整个蛋白质或其片段。已知的蛋白质质谱分析方法包含电喷雾电离(ESI)和基质辅助激光解吸/电离(MALDI)。质谱法有一些益处,但获得的结果可能会受到污染物的存在的影响,并且可能难以在脆性分子没有破碎的情况下对脆性分子进行加工。此外,质谱法不是单分子技术,并且仅提供有关被询问样品的大量信息。质谱法不适合用于表征多肽样品群内的差异,并且在试图区分相邻残基时不灵便。
允许对多肽进行逐个残基的测序的埃德曼降解是质谱法的替代性方法。埃德曼降解通过顺序切割N末端氨基酸并且然后使用色谱或电泳表征单独切割的残基来对多肽进行测序。然而,埃德曼测序很慢,涉及使用昂贵的试剂,并且像质谱法一样不是单分子技术。
因此,仍然迫切需要新技术来表征多肽,特别是在单分子水平上。已证明用于表征生物分子(如多核苷酸)的单分子技术由于其高保真度和避免扩增偏差而特别有吸引力。
一种对生物分子(如多肽)进行单分子表征的有吸引力的方法是纳米孔感测。纳米孔感测是一种依赖于对分析物分子与离子传导通道之间的个别结合或相互作用事件的观察的分析物检测和表征方法。可以通过在电绝缘膜中放置纳米尺寸的单孔和测量在存在分析物分子的情况下通过孔的电压驱动的离子电流来产生纳米孔传感器。纳米孔内部或附近的分析物的存在将改变通过孔的离子流,从而引起在通道上测量的离子或电流改变。分析物的同一性通过其独特的电流特征揭露,尤其是电流块的持续时间和程度以及与孔相互作用期间电流电平的变化。纳米孔感测有可能允许快速和廉价的多肽表征。
本领域已经提出了多肽的纳米孔感测和表征。例如,WO 2013/123379公开了NTP驱动的蛋白质加工解折叠酶用于加工要通过纳米孔转运的蛋白质的用途。然而,仍然需要表征多肽的替代性和/或改进的方法。
发明内容
本公开涉及表征靶多肽的方法。所述方法包括将所述靶多肽与多核苷酸缀合以形成多肽-多核苷酸缀合物。所述方法包括使所述缀合物与多核苷酸处理蛋白接触。所述多核苷酸处理蛋白能够控制所述多核苷酸相对于纳米孔移动。当所述缀合物相对于所述纳米孔移动时,进行所述多肽所特有的一个或多个测量。以此方式,包括在所述缀合物中的靶多肽被表征。
因此,本文提供了一种表征靶多肽的方法,所述方法包括
-将所述靶多肽与多核苷酸缀合以形成多核苷酸-多肽缀合物;
-使所述缀合物与能够控制所述多核苷酸相对于纳米孔移动的多核苷酸处理蛋白接触;以及
-当所述缀合物相对于所述纳米孔移动时,进行所述多肽所特有的一个或多个测量,由此表征所述多肽。
在一些实施例中,所述纳米孔具有收缩区。在一些实施例中,所述纳米孔被修饰以延伸所述多核苷酸处理蛋白与所述纳米孔的收缩区之间的距离。在一些实施例中,使用置换体单元将所述多核苷酸处理蛋白与所述纳米孔分离,由此延伸所述多核苷酸处理蛋白的活性位点与所述纳米孔之间的距离。在一些实施例中,所述置换体单元包括一种或多种蛋白质。在一些实施例中,所述多核苷酸处理蛋白被修饰以延伸从所述多核苷酸处理蛋白的活性位点到所述纳米孔的距离。
在一些实施例中,当与所述多核苷酸处理蛋白的所述活性位点接触的所述缀合物的部分包括多肽时,所述多核苷酸处理蛋白能够保持与所述缀合物结合。在一些实施例中,所述多核苷酸处理蛋白被修饰以防止当所述多核苷酸处理蛋白接触包括多肽的所述缀合物的一部分时,所述多核苷酸处理蛋白与所述缀合物脱离。在一些实施例中,所述多核苷酸处理蛋白被修饰以完全或部分封闭存在于未修饰蛋白的至少一种构象状态中的开口,多核苷酸链可通过所述开口解结合。在一些实施例中,所述多核苷酸处理蛋白是解旋酶。
在一些实施例中,所述缀合物包括多个多肽部分和/或多个多核苷酸部分。
在一些实施例中,所述多肽的长度为2到约50个肽单元。在一些实施例中,所述多肽以线性化形式保持。
在一些实施例中,所述多核苷酸的长度为约10到约1000个核苷酸。在一些实施例中,一个或多个衔接子和/或一个或多个系链和/或一个或多个锚与所述缀合物中的所述多核苷酸连接。
在所公开的方法的一些实施例中,
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的顺式侧向所述纳米孔的反式侧移动;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的反式侧向所述纳米孔的顺式侧移动。
在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽移动穿过所述纳米孔。在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽移动穿过所述纳米孔。
在一些实施例中,所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;并且
-m是0或1;
并且所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触;并且
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸部分(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸部分(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。
在一些实施例中,所述缀合物包括形式为L-P1-N-{P-N}n-Pm的一种或多种结构,其中:
-n是正整数;
-L是前导序列,其中L任选地是N部分;
-可相同或不同的每个P是多肽;
-可相同或不同的每个N包括多核苷酸;并且
-m是0或1;
并且所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使多肽(P1)与所述纳米孔接触;并且
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制每个多核苷酸(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧顺序地移动,由此控制每个多肽(P)顺序地移动穿过所述纳米孔;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制每个多核苷酸(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧顺序地移动,由此控制每个多肽(P)顺序地移动穿过所述纳米孔。
在所公开的方法的一些实施例中,
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的反式侧向所述纳米孔的顺式侧移动;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的顺式侧向所述纳米孔的反式侧移动。
在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽移动穿过所述纳米孔。在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽移动穿过所述纳米孔。
在一些实施例中,所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;
-m是0或1;
并且所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触;并且
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔;或者
i)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。
在一些实施例中,所述缀合物包括通过任选的连接子与所述多肽连接的封端部分,并且所述方法包括
i)使所述缀合物与所述纳米孔接触,使得所述封端部分位于所述纳米孔的与所述多核苷酸处理蛋白相对的一侧上;
ii)使所述缀合物的所述多核苷酸与所述多核苷酸处理蛋白接触;
iii)允许所述多核苷酸处理蛋白控制所述多核苷酸相对于所述纳米孔移动,由此控制所述多肽移动穿过所述纳米孔;
iv)当所述封端部分接触所述纳米孔,由此阻止所述缀合物进一步移动穿过所述纳米孔时,允许所述多核苷酸处理蛋白与所述多核苷酸瞬时解结合,使得所述缀合物在与由所述多核苷酸处理蛋白控制的移动方向相反的方向上在所施加的力下移动穿过所述纳米孔;以及
v)任选地重复步骤(ii)到(iv)以使所述多肽振荡穿过所述纳米孔。
在一些实施例中,所述一个或多个测量是所述多肽的选自以下的一个或多个特性所特有的:(i)所述多肽的长度;(ii)所述多肽的同一性;(iii)所述多肽的序列;(iv)所述多肽的二级结构;以及(v)所述多肽是否被修饰。
本文还提供了一种纳米孔,其包括收缩区,其中所述纳米孔被修饰以增加所述收缩区与和所述纳米孔接触的多核苷酸处理蛋白之间的距离。
还提供了一种系统,所述系统包括
-纳米孔,所述纳米孔包括收缩区;
-缀合物,所述缀合物包括与多核苷酸缀合的多肽;以及
-多核苷酸处理蛋白;
其中
i)所述纳米孔被修饰以在所述多核苷酸处理酶与所述纳米孔接触时,增加所述收缩区与所述多核苷酸处理蛋白的活性位点之间的距离;和/或
ii)所述系统进一步包括安置于所述纳米孔与所述多核苷酸处理蛋白之间的一个或多个置换体单元,由此延伸所述纳米孔与所述多核苷酸处理蛋白的活性位点之间的距离。
在一些实施例中,所述纳米孔、所述缀合物和/或所述多核苷酸处理蛋白以及任选地所述一个或多个置换体单元,如果存在的话,如本文所定义的。
还提供了一种试剂盒,所述试剂盒包括:
-纳米孔,所述纳米孔包括收缩区;
-多核苷酸,所述多核苷酸包括用于与靶多核苷酸缀合的反应性官能团;以及
-多核苷酸处理蛋白。
在一些实施例中,(i)所述纳米孔被修饰以在所述多核苷酸处理酶与所述纳米孔接触时,增加所述收缩区与所述多核苷酸处理蛋白之间的距离;和/或(ii)所述试剂盒进一步包括用于延伸所述纳米孔与所述多核苷酸处理蛋白的活性位点之间的距离的一个或多个置换体单元。在一些实施例中,所述纳米孔、所述多核苷酸和/或所述多核苷酸处理蛋白以及任选地所述一个或多个置换体单元,如果存在的话,如本文所定义的。
附图说明
图1.示出了所公开的方法的实施例的非限制性实例的示意图,其中位于纳米孔的顺式侧处的多核苷酸处理蛋白控制包括与多肽缀合的多核苷酸(DNA2)的缀合物从纳米孔的顺式侧到所述纳米孔的反式侧移动,因此允许在所述多肽相对于所述纳米孔移动时表征所述多肽。如图所示,任选的前导序列(DNA1)与缀合物连接以促进多肽穿过纳米孔。RED(本文所讨论的)示出为纳米孔中的收缩与多核苷酸处理蛋白的活性位点之间的概念距离。(A)可以通过向膜的反式侧施加例如正电压,将底物例如从膜的顺式侧捕获在纳米孔中。多核苷酸处理蛋白沿多核苷酸部分在虚线箭头所示的方向上移动,并且将底物馈送到孔中,进行到状态(B)。随着多核苷酸处理蛋白沿多核苷酸移动(例如,在1个核苷酸燃料驱动的步骤中),所述多核苷酸处理蛋白将缀合物馈送到纳米孔中,并且肽部分穿过纳米孔。
图2.示出了图1中所示的一般设置的实施例的示意图。在此非限制性实例中,多核苷酸处理蛋白最初停滞在缀合物(DNA)的多核苷酸部分中的间隔子(X)处。衔接子与缀合物的多核苷酸部分连接并且具有与其连接的系链以将缀合物定位在纳米孔区域中的膜中用于表征。步骤(A)和(B)与针对图1描述的一样。当多核苷酸处理蛋白处理多核苷酸时,所述多核苷酸处理蛋白可能会置换衔接子。
图3.示出了图1中所示的一般设置的另外的实施例的示意图。在此非限制性实例中,缀合物包括在多核苷酸处理蛋白的控制下顺序地移动穿过纳米孔多个多核苷酸和多肽部分。如图所示,最初将多核苷酸处理蛋白装载到缀合物的第一多核苷酸部分(DNA1)上,并且使缀合物的此部分移动穿过纳米孔。多核苷酸处理蛋白使缀合物的第一多肽部分穿过纳米孔而不从缀合物解离。多核苷酸处理蛋白然后与缀合物的第二多核苷酸部分(DNA2)接触,并且控制所述第二多核苷酸部分移动穿过纳米孔。另外的多肽和多核苷酸部分(未示出)可以类似地相对于纳米孔顺序地移动。
图4.示出了用于图3中所描述的实施例的底物的非限制性实例的示意图。A:缀合物的第一多核苷酸部分(DNA1)包括:具有前导序列(虚线)的测序Y衔接子,以促进纳米孔中的捕获;使得能够拴系到膜以将缀合物定位在纳米孔区域中的系链;以及由间隔子(X)停滞的多核苷酸处理蛋白。如图所示,缀合物的多核苷酸部分包括双链DNA。B:(A)中示出的底物的实施例的变型;系链(或另外的系链)可以位于缀合物的第二多核苷酸部分(DNA2)上。符号“顶部”和“底部”纯粹是为了便于理解。C:示出了本发明的使用4(A)中示出的底物的方法的示意图。
图5.示出了用于所公开的方法的底物的另外的非限制性实例的示意图。缀合物可以包括多个多核苷酸和多肽部分(n>0),所述多个多核苷酸和多肽部分可以由多核苷酸处理蛋白顺序地处理以通过本文所描述的纳米孔表征。
图6.示出了所公开的方法的实施例的非限制性实例的示意图,其中位于所述纳米孔的顺式侧处的多核苷酸处理蛋白控制包括与多肽缀合的多核苷酸(DNA2)的缀合物从纳米孔的反式侧到所述纳米孔的顺式侧移动,因此允许在所述多肽相对于所述纳米孔移动时表征所述多肽。如图所示,任选的前导序列与缀合物连接以促进多肽最初穿过纳米孔。(A)可以通过向膜的反式侧施加例如正电压,将底物例如从膜的顺式侧捕获在纳米孔中。多核苷酸处理蛋白沿多核苷酸部分在虚线箭头所示的方向上移动,以将底物移出孔,进行到状态(B)。随着多核苷酸处理蛋白沿多核苷酸移动(例如,在1个核苷酸燃料驱动的步骤中),所述多核苷酸处理蛋白将缀合物驱动到纳米孔之外。缀合物的多肽部分因此穿过纳米孔(状态C)并且因此被表征。
图7.示出了在与纳米孔接触时阻止缀合物移动穿过所述纳米孔的封端部分(黑色方块)的使用的非限制性实例的示意图。在如示出的非限制性实施例中,多核苷酸处理蛋白是可以通过延伸缀合物的多核苷酸部分来控制缀合物移动的聚合酶。链延伸可以继续,直到封端部分到达纳米孔。新合成的链的解离允许缀合物穿过纳米孔从顺式侧移动回到反式侧,并且然后多核苷酸可以重新循环缀合物穿过纳米孔从反式侧向顺式侧移动。以此方式,缀合物可以“梳理(flossed)”穿过纳米孔。其它多核苷酸处理蛋白可以用于类似方法。
图8.示出了用于增加纳米孔(例如纳米孔内的收缩)与用于控制缀合物相对于纳米孔移动的多核苷酸处理蛋白的活性位点之间的距离的策略的非限制性实例的示意图。A:示出未修饰的RED的未修饰的孔的示意图。B:可以修饰纳米孔以延伸RED。C:置换体单元可以用于从纳米孔置换多核苷酸处理蛋白,因此延伸RED。D:多种多核苷酸处理蛋白可以用于置换控制缀合物相对于纳米孔从纳米孔移动的活性多核苷酸处理蛋白。这些实施例在本文中更详细地描述。
图9.为清楚起见具有对应构建体的草图的实例1的代表性电流对时间迹线。状态A)-D)对应于图4C中描述的那些状态:A)-纳米孔捕获前导链,B)-Y衔接子易位穿过纳米孔读取器头(RED),C)-多肽易位穿过RED,D)-易位多核苷酸尾(DNA2)易位。第一迹线表示仅Y衔接子的部分易位事件(仅状态A)和B)),而第二迹线示出整个缀合的多核苷酸-多肽跨纳米孔的易位。如实例1中所描述的获得的数据(此数据针对含有序列SEQ ID NO:20的肽的多核苷酸-肽缀合物)。
图10.电流对时间迹线,展示数据收集的高吞吐量;在3秒的时间段内有5个捕获事件,其中4个对应于完整的多核苷酸-多肽缀合物(事件3是仅Y衔接子的部分易位)。实例1中所描述的数据(此数据针对含有序列SEQ ID NO:20的肽的多核苷酸-肽缀合物)。
图11.对应于肽序列GGSGRRSGSG(SEQ ID NO:21)的图4B和实例1中所描述的多核苷酸-肽缀合物的易位的电流迹线。A:相对于图4和图9中所描述的状态对齐的迹线的11个实例。B:同样11条迹线的叠加。C:11个示例迹线的堆叠图以展示使用动态时间扭曲算法对时间轴进行归一化以促进关键迹线特征的最佳对齐。
图12.对应于肽序列GGSGYYSGSG(SEQ ID NO:22)的图4B和实例1中所描述的多核苷酸-肽缀合物的易位的电流迹线。A:相对于图4和图9中所描述的状态对齐的迹线的12个实例。B:同样12条迹线的叠加。C:12个示例迹线的堆叠图。
图13.对应于肽序列GGSGDDSGSG(SEQ ID NO:20)的图4B和实例1中所描述的多核苷酸-肽缀合物的易位的电流迹线。A:相对于图4和图9中所描述的状态对齐的迹线的11个实例。B:同样11条迹线的叠加。C:11个示例迹线的堆叠图。
图14.使用SEQ ID NO:22的肽获得的构建体的示意性结构;包括SEQ ID NO:11、12和13的多核苷酸链的Y衔接子;以及包括SEQ ID NO:14和16的多核苷酸链的多核苷酸尾(在实例1中描述)。
图15.与实例1相比的实例2的代表性电流对时间迹线。状态A)-D)对应于图4C中描述的那些状态:A)-纳米孔捕获前导链,B)-Y衔接子易位穿过纳米孔读取器头(RED),C)-多肽易位穿过RED,D)-易位多核苷酸尾(DNA2)易位。顶图中的迹线是根据实例1中的方案(使用合成期间预修饰的肽)收集的;底图中的迹线示出了根据实例2中的方案缀合的多核苷酸-多肽的易位(使用未修饰的SEQ ID NO:23的肽;即,与实例1的对应迹线中相同的序列)。
图16.10-氨基酸肽(顶图;SEQ ID NO:20)与21-氨基酸肽(底图;SEQ ID NO:24)相比的多核苷酸-肽缀合物的易位的代表性电流对时间迹线。状态A)-D)对应于图4C中描述的那些状态:A)-纳米孔捕获前导链,B)-Y衔接子易位穿过纳米孔读取器头(RED),C)-多肽易位穿过RED,D)-易位多核苷酸尾易位。结果在实例3中描述。
具体实施方式
本发明将相对于具体实施例并参考某些附图来说明,但本发明并不受限于此而只受权利要求限制。权利要求中的任何附图标记不应被解释为限制范围。当然,应当理解,不一定所有方面或优点可以根据本发明的任何特定实施例来实现。因此,例如,本领域技术人员将认识到,本发明可以以实现或优化如本文所教导的一个优点或一组优点的方式体现或执行,而不必实现如本文可以教导或建议的其它方面或优点。
当结合附图阅读时,通过参考以下详细描述,可以最好地理解本发明(关于组织和操作方法两者)以及其特征和优点。本发明的各方面和优点将根据下文描述的一个或多个实施例而变得显而易见,并且将参考所述实施例进行阐述。在整个本说明书中对“一个实施例”或“一实施例”的提及意味着结合实施例描述的特定特征、结构或特性包含在本发明的至少一个实施例中。因此,在整个本说明书中各个地方出现的短语“在一个实施例中(inone embodiment)”或“在一实施例中(in an embodiment)”不一定都是指同一个实施例,但是可以指代同一个实施例。类似地,应当理解,在本发明的示例性实施例的描述中,出于简单化本公开并且帮助理解各种发明性方面中的一个或多个的目的,本发明的各种特征有时被一起分组在单个实施例、附图或其描述中。然而,本公开的方法不应被解释为反映所要求保护的发明需要的特征比在每个权利要求中明确地叙述的更多的意图。相反,如以下权利要求书所反映,发明性方面在于比单个前述公开的实施例的所有特征更少。
应当理解,除非上下文另有说明,否则本公开的“实施例”可以具体地组合在一起。所有公开的实施例的特定组合(除非上下文另有暗示)是要求保护的发明的进一步公开的实施例。
另外,如在本说明书和所附权利要求中所使用的,除非内容另外明确指明,否则单数形式的“一个/一种(a/an)”以及“所述(the)”均包含复数对象。因此,例如,对“多核苷酸”的提及包含两个或更多个多核苷酸;对“马达蛋白”的提及包含两个或更多个此类蛋白质;对“解旋酶”的提及包含两个或更多个解旋酶;对“单体”的提及是指两个或更多个单体;对“孔”的提及包含两个或更多个孔等。
本文引用的所有出版物、专利和专利申请,无论是上文还是下文,均通过引用整体并入本文。
定义
当提及单数名词(例如“一个/一种(a/an)”、“所述(the)”)时使用不定冠词或定冠词时,除非另有具体说明,否则这包含所述名词的复数形式。在本说明书和权利要求书中使用术语“包括(comprising)”时,其并不排除其它要素或步骤。此外,说明书和权利要求书中的术语第一、第二、第三等用于区分相似要素,而不一定用于描述顺序或时间次序。应当理解,如此使用的术语在适当情况下是可互换的,并且本文所述的本发明的实施例能够以不同于本文描述或说明的其它顺序操作。提供以下术语或定义仅用于帮助理解本发明。除非本文另有具体定义,否则在本文中使用的所有术语具有对本发明所属领域的技术人员来说相同的含义。针对本领域的定义和术语,执业医师特别参照Sambrook等人,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,第4版,纽约普莱恩维尤冷泉港出版社(Cold Spring Harbor Press,Plainsview,New York)(2012);和Ausubel等人,《分子生物学最新方案(Current Protocols in Molecular Biology)》(增刊114),纽约约翰威利父子出版社(John Wiley&Sons,New York)(2016)。本文提供的定义不应被解释为具有小于本领域普通技术人员所理解的范围。
当提及如量、持续时间等可测量的值时,本文所使用的术语“约”意味着涵盖与指定值的±20%或±10%,更优选±5%,甚至更优选±1%,以及还更优选±0.1%的偏差,因为此类偏差适合于执行所公开的方法。
本文所使用的术语“核苷酸序列”、“DNA序列”或“一个或多个核酸分子”是指任何长度的核苷酸的聚合形式,无论是核糖核苷酸还是脱氧核糖核苷酸。此术语仅指分子的一级结构。因此,此术语包含双链和单链DNA,以及RNA。本文所使用的术语“核酸”是单链或双链共价连接的核苷酸序列,其中每个核苷酸上的3'和5'末端通过磷酸二酯键连接。多核苷酸可以由脱氧核糖核苷酸碱基或核糖核苷酸碱基构成。核酸可以在体外合成制造,或者从天然来源中分离。核酸可以进一步包含经修饰的DNA或RNA,例如已经被甲基化的DNA或RNA,或已经经受翻译后修饰的RNA,所述翻译后修饰例如是采用7-甲基鸟苷的5'封端、如裂解和聚腺苷酸化等3'加工以及剪接。核酸还可以包含合成核酸(XNA),如己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、甘油核酸(GNA)、锁核酸(LNA)和肽核酸(PNA)。核酸(在本文中也称为“多核苷酸”)的大小通常表示为双链多核苷酸的碱基对(bp)的数量,或在单链多核苷酸的情况下,表示为核苷酸(nt)的数量。一千bp或nt等于千碱基(kb)。长度小于约40个核苷酸的多核苷酸通常被称为“寡核苷酸”,并且可以包括用于如通过聚合酶链反应(PCR)操纵DNA的引物。
在本公开的上下文中,术语“氨基酸”以其最广泛的意义使用,并且意指包含含有胺(NH2)和羧基(COOH)官能团以及对每种氨基酸具有特异性的侧链(例如R基团)的有机化合物。在一些实施例中,氨基酸是指天然存在的Lα-氨基酸或残基。本文中使用天然存在的氨基酸的一个和三个常用的字母缩写:A=Ala;C=Cys;D=Asp;E=Glu;F=Phe;G=Gly;H=His;I=Ile;K=Lys;L=Leu;M=Met;N=Asn;P=Pro;Q=Gln;R=Arg;S=Ser;T=Thr;V=Val;W=Trp;并且Y=Tyr(Lehninger,A.L.,(1975)《生物化学(Biochemistry)》,第2版,第71-92页,纽约沃茨出版社(Worth Publishers,New York))。一般术语“氨基酸”进一步包含D-氨基酸、逆反式氨基酸以及化学修饰的氨基酸,如氨基酸类似物、通常不并入到蛋白质中的天然存在的氨基酸(如正亮氨酸)以及具有本领域已知为氨基酸特性的性质的化学合成的化合物(如β-氨基酸)。例如,允许与天然Phe或Pro相同的肽化合物的构象限制的苯丙氨酸或脯氨酸的类似物或模拟物包含在氨基酸的定义内。此类类似物和模拟物在本文中被称为相应氨基酸的“功能等同物”。氨基酸的其它实例由Roberts和Vellaccio,《肽:分析、合成、生物学(The Peptides:Analysis,Synthesis,Biology)》,Gross和Meiehofer编辑,第5期第341页,纽约学术出版社(Academic Press,Inc.,N.Y.),1983列出,所述文献通过引用并入本文。
术语“多肽”和“肽”在本文中可互换使用以指代氨基酸残基的聚合物以及其变体和合成类似物。因此,这些术语适用于氨基酸聚合物,其中一个或多个氨基酸残基是合成的非天然存在的氨基酸,如对应的天然存在的氨基酸的化学类似物,以及适用于天然存在的氨基酸聚合物。多肽还可以经历成熟或翻译后修饰过程,所述过程可以包含但不限于:糖基化、蛋白水解切割、脂质化、信号肽切割、前肽切割、磷酸化等。可以使用重组技术例如通过表达重组或合成的多核苷酸来制备肽。重组产生的肽通常基本上不含培养基,例如,培养基占蛋白质制剂体积的小于约20%,更优选小于约10%,最优选小于约5%。
术语“蛋白质”用于描述具有二级或三级结构的折叠多肽。蛋白质可以由单个多肽构成,或者可以包括组装形成多聚体的多个多肽。多聚体可以是同源寡聚体或异源寡聚体。蛋白质可以是天然存在的或野生型蛋白质,或者是经修饰的或非天然存在的蛋白质。蛋白质可以例如通过一个或多个氨基酸的添加、取代或缺失而不同于野生型蛋白质。
蛋白质的“变体”涵盖肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未经修饰的或野生型蛋白质具有氨基酸取代、缺失和/或插入,并且具有与其所衍生的未经修饰的蛋白质类似的生物和功能活性。如本文所用,术语“氨基酸同一性”是指序列在氨基酸对氨基酸的基础上在比较窗口上相同的程度。因此,“序列同一性百分比”通过以下来计算:在比较窗口上比较两个经过最佳比对的序列,确定相同的氨基酸残基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met)出现在这两个序列中的位置的数量以产生匹配位置的数量,用匹配位置的数量除以比较窗口中的位置的总数(即,窗口大小),以及将结果乘以100以产生序列同一性百分比。
对于本发明的所有方面和实施例,“变体”与对应的野生型蛋白质的氨基酸序列具有至少50%、60%、70%、80%、90%、95%或99%完整序列同一性。序列同一性还可以是全长多核苷酸或多肽的片段或部分。因此,序列可以与全长参考序列具有仅50%的整体序列同一性,但是特定区域、结构域或亚基的序列可以与参考序列共享80%、90%或多达99%的序列同一性。
术语“野生型”是指与天然存在的来源分离的基因或基因产物。野生型基因是群体中最常观察到的基因,并且因此被任意设计为基因的“正常”或“野生型”形式。相反,术语“经修饰的”、“突变体”或“变体”是指与野生型基因或基因产物相比显示序列的修饰(例如,取代、截短或插入)、翻译后修饰和/或功能特性质(例如,改变的特性)的基因或基因产物。注意,天然存在的突变体可以被分离;通过与野生型基因或基因产物相比其具有改变的特性这一事实来鉴定这些突变体。用于引入或取代天然存在的氨基酸的方法在本领域是众所周知的。举例来说,可通过在编码突变单体的多核苷酸中的相关位置处用精氨酸的密码子(CGT)置换甲硫氨酸的密码子(ATG),而用精氨酸(R)来取代甲硫氨酸(M)。用于引入或取代非天然存在的氨基酸的方法在本领域也是众所周知的。举例来说,可以通过在用于表达突变单体的IVTT系统中包含合成氨基酰基-tRNA来引入非天然存在的氨基酸。可替代地,其可以通过在大肠杆菌(E.coli)中表达突变单体来引入,所述突变单体在存在那些特定氨基酸的合成(即非天然存在的)类似物的情况下对于特定氨基酸是营养缺陷型的。如果突变单体使用部分肽合成产生,则其还可以通过裸连接产生。保守取代用具有相似化学结构、相似化学特性或相似侧链体积的其它氨基酸代替氨基酸。引入的氨基酸可以具有与其替代的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。可替代地,保守取代可以引入芳香族或脂肪族的另一种氨基酸代替预先存在的芳香族或脂肪族氨基酸。保守氨基酸改变在本领域是众所周知的,并且可以根据如在下表1中限定的20种主要氨基酸的性质来进行选择。在氨基酸具有类似极性的情况下,还可以参考表2中的氨基酸侧链的亲水性尺度来确定这一点。
表1-氨基酸的化学性质
表2-亲水性标度
突变体或经修饰的蛋白质、单体或肽还可以以任何方式和在任何位点进行化学修饰。优选地通过将分子附接到一个或多个半胱氨酸(半胱氨酸连接)、将分子附接到一个或多个赖氨酸、将分子附接到一个或多个非天然氨基酸、表位的酶修饰或末端的修饰对突变体或经修饰的单体进行化学修饰。用于进行此类修饰的合适方法在本领域是众所周知的。经修饰的蛋白质、单体或肽的突变体可以通过任何分子的附接进行化学修饰。举例来说,经修饰的蛋白质、单体或肽的突变体可以通过染料或荧光团的连接进行化学修饰。
所公开的方法
本公开涉及通过形成与多核苷酸的缀合物并使用多核苷酸处理蛋白来控制所述缀合物相对于纳米孔移动来表征多肽的方法。
与寻求使用多肽处理酶控制多肽相对于纳米孔移动的方法相比,本公开的方法使得能够使用多核苷酸处理酶来控制多肽相对于纳米孔移动。
本文所公开的方法利用多核苷酸处理蛋白控制不仅包括多核苷酸的缀合物移动的能力。特别地,可以使用如本文所描述的多核苷酸处理蛋白以受控方式移动包括多肽的缀合物。本文中更详细地描述了适用于所公开的方法的多核苷酸处理蛋白。
因此,本文提供了一种表征靶多肽的方法,所述方法包括
-将所述靶多肽与多核苷酸缀合以形成多核苷酸-多肽缀合物;
-使所述缀合物与能够控制所述多核苷酸相对于纳米孔移动的多核苷酸处理蛋白接触;以及
-当所述缀合物相对于所述纳米孔移动时,进行所述多肽所特有的一个或多个测量,
由此表征所述多肽。
可以使用本文所公开的方法表征任何合适的多肽。在一些实施例中,靶多肽是蛋白质或天然存在的多肽。在一些实施例中,所述多肽是合成多肽。本文中更详细地描述了可以根据所公开的方法表征的多肽。
任何合适的多核苷酸可以用于形成用于本文所公开的方法的缀合物。在一些实施例中,多核苷酸的长度至少与要表征的靶多肽的一部分一样长。在一些实施例中,多核苷酸的长度大于要表征的靶多肽的部分。下文中更详细地讨论了这一点。本文中更详细地公开了适用于所公开的方法的多核苷酸。
在所公开的方法中,可以使用任何合适的方式将靶多肽与多核苷酸缀合。本文更详细地描述了一些示例性方式。
在所公开的方法中形成的缀合物与能够控制多核苷酸相对于纳米孔移动的多核苷酸处理蛋白接触。本文更详细地描述了示例性多核苷酸处理蛋白。
多核苷酸处理蛋白控制多核苷酸相对于纳米孔移动。因此,多核苷酸处理蛋白控制缀合物相对于纳米孔移动。在所公开的方法中可以使用任何合适的纳米孔。本文中更详细地描述了适用于所公开的方法的纳米孔。
所公开的方法包括当所述缀合物相对于所述纳米孔移动时,进行所述多肽所特有的一个或多个测量。所述一个或多个测量可以是任何合适的测量。通常,所述一个或多个测量是电测量,例如电流测量,和/或是一个或多个光学测量。本文更详细地描述了用于记录合适测量的设备以及此类测量可以提供的信息。
表征靶多肽
如本文所公开的,多核苷酸可以用于控制多肽相对于纳米孔移动。多核苷酸移动由多核苷酸处理蛋白控制。因为多核苷酸与缀合物中的多肽缀合,所以多核苷酸移动驱动多肽移动。
与本领域已知的用于表征多肽的方法相比,使用多核苷酸处理蛋白控制多核苷酸移动并且因此控制多肽移动可能具有优势。举例来说,与多肽处理酶相比,多核苷酸处理蛋白能够以更高的周转率加工多核苷酸的处理。这意味着与先前已知的方法相比,针对根据所公开的方法表征的多肽可以更快速地获得表征数据。
这些和其它优势将贯穿本公开变得明显。
在开发本公开的方法中,发明人已经发现,与具有较短筒或通道的纳米孔相比,当使用具有较长筒或通道的纳米孔时,可以表征的多肽的长度通常得到改善。不受理论束缚,发明人相信这可能是因为与具有较短筒或通道的孔相比,具有较长筒或通道的孔当与所公开的方法中的多核苷酸处理蛋白结合使用时,导致多核苷酸处理蛋白的活性位点与纳米孔中的收缩之间的距离更长。此距离可以别称为RED(读取器-酶距离)。本领域技术人员将理解(如下文所讨论的)纳米孔的形式不是限制性的。纳米孔可以是蛋白纳米孔或固态纳米孔。如果纳米孔在纳米孔的通道内不具有变窄,那么如本文所使用的收缩,例如,在一个实施例中,可以用纳米孔的开口来鉴定。
不受理论束缚,推测缀合物内可以由纳米孔表征的多肽部分的长度可以对应于RED或由RED测定。换句话说,纳米孔可以包括读取头,并且一个或多个测量是多肽的“读取部分”所特有的,其中读取部分的长度对应于读取头与多核苷酸处理蛋白的活性位点之间的距离或由读取头与多核苷酸处理蛋白的活性位点之间的距离测定。
鉴于此,在所公开的方法的一些实施例中,多核苷酸的长度至少与要表征的靶多肽的一部分一样长。在一些实施例中,多核苷酸的长度比要表征的靶多肽的部分更长。这确保了可以表征的多肽部分的长度不受多核苷酸的量的限制,因为多核苷酸处理蛋白控制所述多核苷酸的移动。
所述方法可以通过参考图1来理解,图1展示了所公开的方法的一个非限制性实例。缀合物可以包括多核苷酸和多肽,并且与多核苷酸处理蛋白接触,使得多肽穿过纳米孔。在所展示的实施例中,使用另外的多核苷酸来促进多肽穿过纳米孔。此类使用在所公开的方法的范围内,然而这不是必需的。
多核苷酸处理蛋白加工与多肽缀合的多核苷酸。当多核苷酸处理蛋白加工多核苷酸时,缀合物穿过纳米孔,并且因此多肽穿过纳米孔。当多肽穿过纳米孔时,所述多肽被表征。
在图1中所展示的实例中,从多核苷酸处理蛋白的“观点”来看,多核苷酸处理蛋白使缀合物“移动到孔中”。例如,如图所示,多核苷酸处理蛋白位于纳米孔的顺式侧上并且将缀合物移动到孔中,即从顺式侧到反式侧。也可以使用相反的设置。
换句话说,在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的顺式侧向所述纳米孔的反式侧移动。因此,在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽移动穿过所述纳米孔。
在其它实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的反式侧向所述纳米孔的顺式侧移动。因此,在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽移动穿过所述纳米孔。
如本文所解释的,缀合物可以包括前导序列。如本文所解释的,可以使用任何合适的前导序列。任选地,前导序列可以是多核苷酸。前导序列可以与缀合物中的多核苷酸相同或不同。如上文所解释的,前导序列可以促进缀合物穿过纳米孔。
换句话说,在一些实施例中,所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;并且
-m是0或1;
并且所述方法可以包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触。
在一些此类实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸部分(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。在其它实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸部分(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。
如本文更详细解释的,缀合物可以包括一个或多个衔接子和/或锚。图2示出了此类设置的非限制性实例。
如本文更详细解释的,在一些实施例中,缀合物包括多个多核苷酸和多肽。在此类实施例中,多核苷酸处理蛋白顺序地控制多核苷酸相对于纳米孔的移动,因此相对于纳米孔顺序地移动多肽。以此方式,可以在所公开的方法中顺序地表征缀合物内的每个多肽。
例如,所述缀合物可以包括形式为L-P1-N-{P-N}n-Pm的一种或多种结构,其中:
-n是正整数;
-L是前导序列,其中L任选地是N部分;
-可相同或不同的每个P是多肽;
-可相同或不同的每个N包括多核苷酸;并且
-m是0或1;
并且所述方法可以包括使所述前导序列(L)穿过所述纳米孔,由此使多肽(P1)与所述纳米孔接触。
通常,在此类实施例中,n是1到约1000,例如2到约100,例如约3到约10,例如1、2、3、4、5、6、7、8、9或10。
在一些此类实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制每个多核苷酸(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧顺序地移动,由此控制每个多肽(P)顺序地移动穿过所述纳米孔。在其它此类实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制每个多核苷酸(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧顺序地移动,由此控制每个多肽(P)顺序地移动穿过所述纳米孔。
本领域技术人员将理解,当缀合物包括多于一种多肽时,有利的是(如本文更详细描述的)多核苷酸处理蛋白在接触多肽时可以保持与缀合物结合而不解离。例如,如图3中示出的,这允许多核苷酸处理蛋白在与缀合物中的多肽部分接触时越过它们,以便移动到多核苷酸的连续部分上,从而控制缀合物相对于纳米孔移动。
图4描绘了根据图3中示出的实施例的更复杂设置的非限制性实例,其中使用各种衔接子和系链来促进多肽的表征。图4中仅示出了一个多肽部分,尽管本领域技术人员将理解可以合并多个此类部分,如图5中示意性地示出的。
图6中示意性地示出了所公开的方法的另一个非限制性实施例。缀合物可以包括多核苷酸和多肽,并且与多核苷酸处理蛋白接触,使得多肽穿过纳米孔。在所展示的实施例中,使用前导序列(其任选地是另外的多核苷酸)来促进多肽穿过纳米孔。此类使用在所公开的方法的范围内,然而这不是必需的。
多核苷酸处理蛋白加工与多肽缀合的多核苷酸。当多核苷酸处理蛋白加工多核苷酸时,缀合物穿过纳米孔,并且因此多肽穿过纳米孔。当多肽穿过纳米孔时,所述多肽被表征。
在图6中所展示的实例中,从多核苷酸处理蛋白的“观点”来看,多核苷酸处理蛋白将缀合物从孔中移“出”。例如,如图所示,多核苷酸处理蛋白位于纳米孔的顺式侧上并且将缀合物移动到孔中,即从反式侧到顺式侧。也可以使用相反的设置。
换句话说,在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的反式侧向所述纳米孔的顺式侧移动。因此,在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽移动穿过所述纳米孔。
在其它实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的顺式侧向所述纳米孔的反式侧移动。因此,在一些实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述多核苷酸从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽移动穿过所述纳米孔。
使用与上述类似的符号,在一些实施例中,所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;
-m是0或1;
并且所述方法可以包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触。
在一些此类实施例中,所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。在其它此类实施例中,所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。
在一些实施例中,特别是如上文所讨论的多核苷酸处理蛋白控制缀合物移“出”纳米孔的实施例中,缀合物可以包括通过任选的连接子与多肽连接的封端部分。封端部分通常太大而无法穿过纳米孔,并且因此当缀合物相对于纳米孔移动使封端部分与纳米孔接触时,会阻止缀合物穿过纳米孔的进一步移动。此时可以允许多核苷酸处理蛋白从缀合物瞬时解结合。在所公开的方法的实施例中,其中缀合物在施加的力(例如电压电势或化学势)下相对于纳米孔移动,然后,缀合物可以以与多核苷酸处理蛋白控制的移动相反的方向穿过孔“向后”移动。缀合物穿过孔向后移动允许所述缀合物的多肽部分再次被重新表征。
所述过程可以通过顺序地允许多核苷酸处理蛋白与缀合物结合和重新结合而重复多次。以这样的方式,缀合物可以振荡穿过孔(即,所述缀合物可以“梳理”穿过纳米孔)。这种“梳理”允许缀合物的多肽部分通过纳米孔重复地表征。在一些实施例中,这允许增加表征信息的准确性。
在此类实施例中,可以使用任何合适的封端部分。例如,缀合物可以用生物素修饰并且封端部分可以是例如链霉亲和素、亲和素或中性亲和素。封端部分可以是大的化学基团,如树状物。封端部分可以是纳米颗粒或珠粒。其它合适的封端部分对本领域的技术人员而言将是显而易见的。
图7示出了此类方法的非限制性实例。
因此,在一些实施例中,所述方法包括
i)使所述缀合物与所述纳米孔接触,使得所述封端部分位于所述纳米孔的与所述多核苷酸处理蛋白相对的一侧上;
ii)使所述缀合物的所述多核苷酸与所述多核苷酸处理蛋白接触;
iii)允许所述多核苷酸处理蛋白控制所述多核苷酸相对于所述纳米孔移动,由此控制所述多肽移动穿过所述纳米孔;
iv)当所述封端部分接触所述纳米孔,由此阻止所述缀合物进一步移动穿过所述纳米孔时,允许所述多核苷酸处理蛋白与所述多核苷酸瞬时解结合,使得所述缀合物在与由所述多核苷酸处理蛋白控制的移动方向相反的方向上在所施加的力下移动穿过所述纳米孔;以及
v)任选地重复步骤(ii)到(iv)以使所述多肽振荡穿过所述纳米孔。
置换体单元
如上文所描述的并且不受理论束缚,发明人已经发现,与具有较短筒或通道的纳米孔相比,当使用具有较长筒或通道的纳米孔时,可以表征的多肽的长度通常得到改善。如上文所解释的,这被认为与“RED”距离相关或由其确定,如图8A(A)中示出的。
因此,在一些实施例中,所述纳米孔被修饰以延伸所述多核苷酸处理蛋白与所述纳米孔的收缩区之间的距离。纳米孔通常被修饰以在多核苷酸处理蛋白用于控制缀合物相对于纳米孔移动时,延伸如所确定的多核苷酸处理蛋白与纳米孔的收缩区之间的距离。在一些实施例中,多核苷酸处理蛋白在用于控制缀合物相对于纳米孔移动时处于与纳米孔接触的“就坐位置”,例如与纳米孔的顺式或反式开口接触。这在本文中更详细地描述并且在图8A(B)中示意性地示出。
在一些实施例中,多核苷酸处理蛋白的活性位点与纳米孔之间的距离可以通过使用置换体单元来延伸。图8A(C)示意性地示出了置换体单元的使用。因此,在一些实施例中,本文所提供的方法包括提供置换体单元。在一些实施例中,置换体单元用于将多肽处理蛋白与纳米孔分离,由此延伸多核苷酸处理蛋白与纳米孔之间的距离。
在此类实施例中,可以使用任何合适的置换体单元。例如,置换体单元可以作为蛋白质提供。
任何合适的蛋白质都可以用作置换体单元。示例性蛋白质包含采用环形构象的蛋白质,例如作为多聚体,并且其因此可以容易地定位在纳米孔的入口处。许多合适的环形蛋白质在本领域中是已知的,包含如本文所描述的纳米孔、解旋酶(例如T7解旋酶)和其变体等。不要求置换体本身具有任何活性。在一些实施例中,置换体单元不提供对缀合物中的多核苷酸或肽的任何显著区分。
在一些实施例中,置换体单元可以包括一种或多种多核苷酸处理蛋白或其无活性变体。这示意性地示出于图8B中。如图所示,多核苷酸处理蛋白(E1)用于控制缀合物相对于纳米孔移动。多核苷酸处理蛋白E2...En最初与缀合物的多肽部分接触,并且因此不控制缀合物相对于纳米孔移动;然而,它们从纳米孔中替代了多核苷酸处理蛋白E1,因此增加了RED。
在此类实施例中,用作置换体单元的多核苷酸处理蛋白可以与用于控制缀合物移动的多核苷酸处理蛋白相同或不同。在一些实施例中,用作置换体单元的多核苷酸处理蛋白由用于控制缀合物移动的相同多核苷酸处理蛋白的无活性变体形成。
一个或多个置换体单元,例如本文所描述的一个或多个置换体单元,可以与纳米孔连接(例如与纳米孔共价或非共价地偶联)。可替代地,一个或多个置换体单元可以与纳米孔相关联,例如通过使用多核苷酸来控制其相对于纳米孔的位置。
在其它实施例中,所述多核苷酸处理蛋白被修饰以延伸从所述多核苷酸处理蛋白的活性位点到所述纳米孔的距离。多核苷酸处理蛋白通常被修饰以延伸如当多核苷酸处理蛋白用于控制缀合物相对于纳米孔移动时所测定的多核苷酸处理蛋白的活性位点与纳米孔之间的距离。这在本文中进行了更详细的描述。
多肽
如上文所解释的,所公开的方法包括在缀合物相对于纳米孔移动时表征缀合物内的靶多肽。
在所公开的方法中可以表征任何合适的多肽。
在一些实施例中,靶多肽是未修饰的蛋白质或其部分,或天然存在的多肽或其部分。
在一些实施例中,靶多肽由细胞分泌。可替代地,靶多肽可以在细胞内产生,使得必须从细胞中提取靶多肽以通过所公开的方法进行表征。多肽可以包括质粒的细胞表达产物,例如用于根据Sambrook等人,《分子克隆:实验室手册》,第4版,纽约普莱恩维尤冷泉港出版社(2012);以及Ausubel等人,《当代分子生物学实验指南》(增刊114),纽约约翰威利父子出版公司,纽约(2016)中所描述的方法克隆蛋白质的质粒。
多肽可以从任何生物体或微生物中获得或提取。多肽可以获得自人或动物,例如获得自尿液、淋巴、唾液、粘液、精液或羊水,或获得自全血、血浆或血清。多肽可以获得自植物,例如谷类、豆类、水果或蔬菜。
靶多肽可以作为一种或多种多肽和一种或多种杂质的不纯混合物提供。杂质可以包括截短形式的靶多肽,其不同于用于在所公开的方法中表征的“靶多肽”。例如,靶多肽可以是全长蛋白质并且杂质可以包括蛋白质的部分。杂质还可以包括除靶蛋白之外的蛋白质,例如可以从细胞培养物中共同纯化或从样品中获得的蛋白质。
多肽可以包括任何氨基酸、氨基酸类似物和经修饰的氨基酸(即氨基酸衍生物)的任何组合。多肽中的氨基酸(和衍生物、类似物等)可以通过其物理大小和电荷来区分。
氨基酸/衍生物/类似物可以是天然存在的或人工的。
在一些实施例中,多肽可以包括任何天然存在的氨基酸。二十种氨基酸由通用遗传密码编码。这些密码为:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(glutamic acid/glutamate)(E)、谷氨酰胺(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。其它天然存在的氨基酸包含硒代半胱氨酸和吡咯赖氨酸。
在一些实施例中,多肽是经修饰的。在一些实施例中,多肽被被修饰以用于使用所公开的方法进行检测。在一些实施例中,所公开的方法用于表征靶多肽中的修饰。
在一些实施例中,多肽中的一种或多种氨基酸/衍生物/类似物被修饰。在一些实施例中,多肽中的一种或多种氨基酸/衍生物/类似物是翻译后修饰的。因此,本文所公开的方法可以用于检测多肽中翻译后修饰的存在、不存在、位置的数量。所公开的方法可以用于表征多肽已被翻译后修饰的程度。
多肽中可以存在任何一个或多个翻译后修饰。典型的翻译后修饰包含用疏水基团修饰、用辅因子修饰、添加化学基团、糖化(糖的非酶促连接)、生物素化和聚乙二醇化。翻译后修饰也可以是非天然的,使得它们是在实验室中出于生物技术或生物医学目的进行的化学修饰。与天然对应物相比,这可以允许监测实验室制造的肽、多肽或蛋白质的水平。
用疏水基团进行的翻译后修饰的实例包含:豆蔻酰化、豆蔻酸酯的连接、C14饱和酸;棕榈酰化,棕榈酸酯的连接,C16饱和酸;异戊二烯化或异戊烯化,类异戊二烯基团的连接;法尼基化,法尼醇基团的连接;香叶酰香叶酰化,香叶基香叶醇基团的连接;和糖基磷脂酰肌醇化(glypiation),以及通过酰胺键的糖基磷脂酰肌醇(GPI)锚形成。
用辅因子进行翻译后修饰的实例包含脂酰化、硫辛酸酯(C8)官能团的连接;黄素化,黄素部分(例如黄素单核苷酸(FMN)或黄素腺嘌呤二核苷酸(FAD))的连接;亚铁血红素C的连接,例如通过与半胱氨酸的硫醚键;磷酸巯基乙胺化(phosphopantetheinylation),4'-磷酸泛酰巯基乙胺基的连接;以及亚视黄基席夫碱形成。
通过添加化学基团进行的翻译后修饰的实例包含酰化,例如O-酰化(酯)、N-酰化(酰胺)或S-酰化(硫酯);乙酰化,例如将乙酰基与N末端或赖氨酸连接;甲酰化;烷基化,添加烷基,如甲基或乙基;甲基化,例如向赖氨酸或精氨酸添加甲基;酰胺化;丁酰化;γ-羧化;糖基化,糖基与例如精氨酸、天冬酰胺、半胱氨酸、羟赖氨酸、丝氨酸、苏氨酸、酪氨酸或色氨酸的酶促连接;聚唾液酸化,聚唾液酸的连接;丙二酰化;羟基化;碘化;溴化;瓜氨酸化;核苷酸添加,任何核苷酸,如上文所讨论的任何核苷酸的连接,ADP核糖基化;氧化;磷酸化,磷酸基团与例如丝氨酸、苏氨酸或酪氨酸(O-连接)或组氨酸(N-连接)的连接;腺苷酸化,腺苷酸部分与例如酪氨酸(O-连接)或组氨酸或赖氨酸(N-连接)的连接;丙酰化;焦谷氨酸形成;S-谷胱甘肽化;苏素化;S-亚硝基化;琥珀酰化,琥珀酰基例如与赖氨酸的连接;硒酰化,硒的并入;以及泛素化,添加泛素亚基(N-连接)。
用分子标记对多肽进行标记是在本文所提供的方法的范围内。分子标记可以是促进在本文所提供的方法中检测多肽的多肽修饰。例如,标记可以是对多肽的修饰,其改变表征缀合物时获得的信号。例如,标记可能会干扰通过纳米孔的离子的通量。以这种方式,标记可以改进方法的灵敏度。
在一些实施例中,多肽含有一个或多个交联部分,例如C-C桥。在一些实施例中,在使用所公开的方法表征多肽之前,多肽未交联。
在一些实施例中,多肽包括含硫氨基酸并且因此具有形成二硫键的潜力。通常,在此类实施例中,在使用所公开的方法表征多条之前,使用如DTT(二硫苏糖醇)或TCEP(三(2-羧基乙基)膦)等试剂还原多肽。
在一些实施例中,多肽是全长蛋白质或天然存在的多肽。在一些实施例中,蛋白质或天然存在的多肽在与多核苷酸缀合之前被片段化。在一些实施例中,蛋白质或多肽是化学或酶促片段化的。在一些实施例中,多肽或多肽片段可以缀合以形成更长的靶多肽。
多肽可以是任何合适长度的多肽。在一些实施例中,所述多肽的长度为约2到约300个肽单元。在一些实施例中,多肽的长度为约2到约100个肽单元,例如约2到约50个肽单元,例如约2到约40个肽单元,如约2到约30个肽单元,例如约2到约25个肽单元,例如约2到约20个肽单元;或约3到约50个肽单元,例如约3到约40个肽单元,如约3到约30个肽单元,例如约3到约25个肽单元,例如约3到约20个肽单元;或约5到约50个肽单元,例如约5到约40个肽单元,如约5到约30个肽单元,如约5到约25个肽单元,例如约5到约20个肽单元;例如约7到约16个肽单元,如约9到约12个肽单元;或约16到约25个肽单元,如约18到约22个肽单元。
在所公开的方法中可以表征任何数量的多肽。例如,所述方法可以包括表征2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、50个、100个或更多个多肽。如果使用两个或更多个多肽,则其可以是不同的多肽或同一多肽的两个或更多个实例。
因此显而易见的是,在所公开的方法中进行的测量通常是多肽的选自以下的一个或多个特性所特有的:(i)所述多肽的长度;(ii)所述多肽的同一性;(iii)所述多肽的序列;(iv)所述多肽的二级结构;以及(v)所述多肽是否被修饰。在典型的实施例中,测量是多肽的序列所特有的,或者多肽是否例如通过一种或多种翻译后修饰被修饰。在一些实施例中,测量是多肽的序列的特性。
在一些实施例中,多肽处于松弛形式。在一些实施例中,所述多肽以线性化形式保持。将多肽保持在线性化形式可以促进在逐个残基的基础上表征多肽,因为防止了纳米孔内的多肽“聚集”。
可以使用任何合适的方式使多肽以线性化形式保持。
例如,如果多肽带电荷,则可以通过施加电压使多肽以线性化形式保持。
如果多肽不带电荷或仅带弱电荷,则可以通过调节pH来改变或控制电荷。例如,通过使用高pH来增加多肽的相对负电荷,可以使多肽以线性化形式保持。增加多肽的负电荷允许其在例如正电压下以线性化形式保持。可替代地,通过使用低pH来增加多肽的相对正电荷,可以使多肽以线性化形式保持。增加多肽的正电荷允许其在例如负电压下以线性化形式保持。在所公开的方法中,多核苷酸处理蛋白用于控制多核苷酸相对于纳米孔移动。由于多核苷酸通常带负电荷,因此通常最适合通过增加pH来增加多肽的线性化,从而使多肽带更多负电荷,这与多核苷酸相同。以此方式,缀合物保留了总的负电荷,并且因此可以例如在施加的电压下容易地移动。
可以通过使用合适的变性条件使多肽以线性化形式保持。合适的变性条件包含,例如,存在适当浓度的变性剂,如盐酸胍和/或尿素。在所公开的方法中使用的此类变性剂的浓度取决于方法中要表征的靶多肽,并且本领域技术人员可以容易地选择。
可以通过使用合适的洗涤剂使多肽以线性化形式保持。适用于所公开的方法的洗涤剂包含SDS(十二烷基硫酸钠)。
通过在升高的温度下执行所公开的方法,可以使多肽以线性化形式保持。升高温度克服了链内键合并且允许多肽采用线性化形式。
通过在强电渗透力下执行所公开的方法,可以使多肽以线性化形式保持。此类力可以通过使用不对称盐条件和/或在纳米孔的通道中提供合适的电荷来提供。蛋白质纳米孔通道中的电荷可以例如通过诱变来改变。改变纳米孔的电荷完全在本领域技术人员的能力范围内。当跨纳米孔施加电压时,改变纳米孔的电荷会因阳离子和阴离子穿过纳米孔的不平衡流动而产生强大的电渗透力。
通过使多肽穿过如纳米柱阵列的结构、穿过纳米狭缝或跨过纳米间隙,可以使多肽以线性化形式保持。在一些实施例中,此类结构的物理限制可以迫使多肽采用线性化形式。
缀合物的形成
如本文更详细解释的,缀合物包括与靶多肽缀合的多核苷酸。
靶多肽可以在任何合适的位置与多核苷酸缀合。例如,多肽可以在多肽的N末端或C末端与多核苷酸缀合。多肽可以通过多肽中残基(例如氨基酸残基)的侧链基团与多核苷酸缀合。
在一些实施例中,靶多肽具有可以用于促进与多核苷酸缀合的天然存在的反应性官能团。例如,半胱氨酸残基可以用于与多核苷酸或其上的经修饰基团形成二硫键。
在一些实施例中,靶多肽被修饰以促进其与多核苷酸的缀合。例如,在一些实施例中,通过连接包括用于与多核苷酸连接的反应性官能团的部分来修饰多肽。例如,在一些实施例中,多肽可以在N末端或C末端处延伸一个或多个残基(例如氨基酸残基),所述一个或多个残基包括用于与多核苷酸上的对应反应性官能团反应的一个或多个反应性官能团。例如,在一些实施例中,多肽可以在N末端和/或C末端处延伸一个或多个半胱氨酸残基。此类残基可以用于与缀合物的多核苷酸部分的连接,例如通过马来酰亚胺化学(例如,通过半胱氨酸与叠氮基-马来酰亚胺化合物(如叠氮基-[Pol]-马来酰亚胺,其中[Pol]通常是短链聚合物,如PEG,例如PEG2、PEG3或PEG4)反应;然后与适当功能化的多核苷酸,例如带有BCN基团的多核苷酸偶联,用于与叠氮化物反应)。实例2中描述了此类化学。为避免疑义,当多肽在N和/或C末端包括适当的天然存在的残基(例如,在N和/或C末端的天然存在的半胱氨酸残基)时,此类残基可以用于与多核苷酸的连接。
在一些实施例中,靶多肽中的残基被修饰以促进靶多肽与多核苷酸连接。在一些实施例中,多肽中的残基(例如氨基酸残基)被化学地修饰用于与多核苷酸连接。在一些实施例中,多肽中的残基(例如氨基酸残基)被酶促地修饰用于与多核苷酸连接。
多核苷酸与缀合物中的多肽之间的缀合化学不受具体的限制。可以使用任何合适的反应性官能团的组合。许多合适的反应基团和其化学目标是本领域已知的。一些示例性的反应性基团和其对应的目标包含可以与胺反应的芳基叠氮化物、可以与胺和羧基反应的碳二亚胺、可以与碳水化合物反应的酰肼、可以与胺反应的羟甲基膦、可以与胺反应的亚氨酸酯、可以与羟基反应的异氰酸酯、可以与肼反应的羰基、可以与巯基反应的马来酰亚胺、可以与胺反应的NHS-酯、可以与胺反应的PFP-酯、可以与胸腺嘧啶反应的补骨脂素、可以与巯基反应的吡啶基二硫化物、可以与巯基胺和羟基反应的乙烯基砜、乙烯基磺酰胺等。
用于将多肽与多核苷酸缀合的其它合适的化学包含点击化学。许多合适的点击化学试剂是本领域已知的。点击化学的合适的实例包含但不限于以下:
(a)铜(I)催化的叠氮化物-炔烃环加成(叠氮化物炔烃胡伊斯根(Huisgen)环加成);
(b)应变促进的叠氮化物-炔烃环加成;包含烯烃和叠氮化物[3+2]环加成;烯烃和四嗪逆需求狄尔斯-阿尔德(Diels-Alder)反应;以及烯烃和四唑光点击反应;
(c)1,3偶极环加成反应的无铜变体,其中叠氮化物与炔烃在应变下反应,例如在环辛烷环中,如在双环[6.1.0]壬炔(BCN)中;
(d)一个连接子上的氧亲核试剂与另一个连接子上的环氧化物或氮丙啶反应性部分的反应;以及
(e)施陶丁格连接(Staudinger ligation),其中,炔部分可以被芳基膦替代,导致与叠氮化物的特异性反应,得到酰胺键。
任何反应性基团都可以用于形成缀合物。一些合适的反应性基团包含[1,4-双[3-(2-吡啶基二硫代)丙酰胺基]丁烷;1,1,1-双-马来酰亚胺基三乙二醇;3,3'-二硫代二丙酸二(N-羟基琥珀酰亚胺酯);乙二醇-双(琥珀酸N-羟基琥珀酰亚胺酯);4,4'-二异硫氰酸基二苯乙烯-2,2'-二磺酸二钠盐;双[2-(4-叠氮基水杨酰基氨基)乙基]二硫化物;3-(2-吡啶基二硫代)丙酸N-羟基琥珀酰亚胺酯;4-马来酰亚胺丁酸N-羟基琥珀酰亚胺酯;碘乙酸N-羟基琥珀酰亚胺酯;S-乙酰巯基乙酸N-羟基琥珀酰亚胺酯;叠氮化物-PEG-马来酰亚胺;和炔烃-PEG-马来酰亚胺。反应性基团可以是在WO 2010/086602中,特别是在此申请的表3中公开的那些基团中的任何一个。
在一些实施例中,在缀合步骤之前,反应性官能团包括在多核苷酸中并且靶官能团包括在多肽中。在其它实施例中,在缀合步骤之前,反应性官能团包括在多肽中并且靶官能团包括在多核苷酸中。在一些实施例中,反应性官能团直接与多肽连接。在一些实施例中,反应性官能团通过间隔子与多肽连接。可以使用任何合适的间隔子。合适的间隔子包含例如烷基二胺,如乙基二胺等。
从上文讨论将显而易见的是,在一些实施例中,所述缀合物包括多个多肽部分和/或多个多核苷酸部分。例如,缀合物可以包括形式为...-P-N-P-N-P-N...的结构,其中P为多肽,并且N为多核苷酸。在此类实施例中,多核苷酸处理蛋白顺序地控制缀合物的N部分相对于纳米孔移动并且因此顺序地控制P部分相对于纳米孔移动,从而允许顺序地表征P部分。在此类实施例中,多个多核苷酸和多肽可以通过相同或不同的化学缀合在一起。
如本文所解释的,缀合物可以包括前导序列。如本文所解释的,可以使用任何合适的前导序列。在一些实施例中,前导序列是多核苷酸。在其中前导序列是多核苷酸的实施例中,前导序列可以是与缀合物中使用的多核苷酸相同种类的多核苷酸,或者前导序列可以是不同类型的多核苷酸。例如,缀合物中的多核苷酸可以是DNA,并且前导序列可以是RNA,或反之亦然。
在一些实施例中,前导序列是带电荷聚合物,例如带负电荷的聚合物。在一些实施例中,前导序列包括聚合物,如PEG或多糖。在此类实施例中,前导序列的长度可以为10到150个单体单元(例如乙二醇或糖单元),如长度为20到120个,例如30到100个,例如40到80个,如50到70个单体单元(例如乙二醇或糖单元)。
多核苷酸
如本文更详细解释的,本文所提供的方法包括将多肽与多核苷酸缀合并且使用多核苷酸处理蛋白控制缀合物相对于纳米孔移动。
在所公开的方法中,可以使用任何合适的多核苷酸。
在一些实施例中,多核苷酸由细胞分泌。可替代地,多核苷酸可以在细胞内产生,使得必须从细胞中提取多核苷酸以用于所公开的方法。
多核苷酸可以作为一种或多种多核苷酸和一种或多种杂质的不纯混合物提供。杂质可以包括截短形式的多核苷酸,其不同于用于形成缀合物的多核苷酸。例如,用于形成缀合物的多核苷酸可以是基因组DNA,并且杂质可以包括基因组DNA、质粒等的部分。靶多核苷酸可以是基因组DNA的编码区,并且不期望的多核苷酸可以包括DNA的非编码区。
多核苷酸的实例包含DNA和RNA。DNA和RNA中的碱基可以通过其物理大小来区分。
多核苷酸或核酸可以包括任何核苷酸的任何组合。核苷酸可以是天然存在的或人工的。多核苷酸中的一个或多个核苷酸可以被氧化或甲基化。多核苷酸中的一个或多个核苷酸可以是受损的。例如,多核苷酸可以包括嘧啶二聚体。此类二聚体通常与紫外线损伤有关并且是皮肤黑色素瘤的主要病因。
多核苷酸中的一个或多个核苷酸可以例如用标记或标签修饰,所述标记或标签的合适的实例是技术人员已知的。多核苷酸可以包括一个或多个间隔子。衔接子,例如测序衔接子,可以包括在多核苷酸中。本文更详细地描述了衔接子、标签和间隔子。
经修饰的碱基的实例在本文中公开并且可以通过本领域已知的方式,例如通过在链复制期间(例如在PCR中)通过聚合酶掺入经修饰的核苷酸三磷酸或通过聚合酶填充方法掺入到多核苷酸中。在一些实施例中,可以使用本领域已知的试剂通过化学方式修饰一个或多个碱基。
核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。核碱基通常是杂环的。核碱基包含但不限于嘌呤和嘧啶,并且更具体地包含腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。糖通常是戊糖。核苷酸糖包含但不限于核糖和脱氧核糖。糖优选地是脱氧核糖。多核苷酸优选地包括以下核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。核苷酸可以包括多于三个磷酸,如4个或5个磷酸。磷酸可以连接在核苷酸的5'或3'侧上。多核苷酸中的核苷酸可以以任何方式彼此连接。核苷酸通常通过其糖和磷酸基连接,如在核酸中那样。核苷酸可以通过其核碱基连接,如在嘧啶二聚体中那样。
多核苷酸可以是双链或单链的。
在一些实施例中,多核苷酸是单链DNA。在一些实施例中,多核苷酸是单链RNA。在一些实施例中,多核苷酸是单链DNA-RNA杂交体。DNA-RNA杂交体可以通过将单链DNA与RNA连接来制备,或反之亦然。多核苷酸最典型地是单链脱氧核糖核酸(DNA)或单链核糖核酸(RNA)。
在一些实施例中,多核苷酸是双链DNA。在一些实施例中,多核苷酸是双链RNA。在一些实施例中,多核苷酸是双链DNA-RNA杂交体。双链DNA-RNA杂交体可以通过逆转录cDNA补体从单链RNA制备。
多核苷酸可以是任何长度的。例如,多核苷酸的长度可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸或核苷酸对。多核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对、5000个或更多个核苷酸或核苷酸对、或100000个或更多个核苷酸或核苷酸对。
更典型地,多核苷酸的长度为约1到约10,000个核苷酸或核苷酸对,如约1到约1000个核苷酸或核苷酸对(例如,约10到约1000个核苷酸或核苷酸对),例如,约5到约500个核苷酸或核苷酸对,如约10到约100个核苷酸或核苷酸对,例如,约20到约80个核苷酸或核苷酸对,如约30到约50个核苷酸或核苷酸对。
在所公开的方法中可以使用任何数量的多核苷酸。例如,方法可以包括使用2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、50个、100个或更多个多核苷酸。如果使用两个或更多个多核苷酸,则其可以是不同的多核苷酸或同一多核苷酸的两个实例。多核苷酸可以是天然存在的或人工的。
核苷酸可以具有任何同一性,并且包含但不限于单磷酸腺苷(AMP)、单磷酸鸟苷(GMP)、单磷酸胸苷(TMP)、单磷酸尿苷(UMP)、5-甲基胞苷单磷酸、5-羟基甲基胞苷单磷酸、单磷酸胞苷(CMP)、单磷酸环腺苷(cAMP)、单磷酸环鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸脱氧胸苷(dTMP)、单磷酸脱氧尿苷(dUMP)、单磷酸脱氧胞苷(dCMP)和单磷酸脱氧甲基胞苷。核苷酸优选地是选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMP和dUMP。核苷酸可以无碱基(即缺乏核碱基)。核苷酸还可以缺乏核碱基和糖(即,是C3间隔子)。
多核苷酸可以包括PCR反应的产物、基因组DNA、内切核酸酶消化的产物和/或DNA文库。多核苷酸可以从任何生物体或微生物中获得或提取。多核苷酸可以获得自人或动物,例如获得自尿液、淋巴、唾液、粘液、精液或羊水,或获得自全血、血浆或血清。多核苷酸可以获得自植物,例如谷类、豆类、水果或蔬菜。多核苷酸可以包括基因组DNA。可以使基因组DNA片段化。可以通过任何合适的方法使DNA片段化。例如,片段化DNA的方法是本领域已知的,这样的方法可以使用转座酶,如MuA转座酶。通常,不对基因组DNA进行片段化。
用分子标记对多核苷酸进行标记是在本文所提供的方法的范围内。分子标记可以是促进在本文所提供的方法中检测多核苷酸或缀合物的多核苷酸修饰。例如,标记可以是对多核苷酸的修饰,其改变表征缀合物时获得的信号。例如,标记可能会干扰通过纳米孔的离子的通量。以这种方式,标记可以改进方法的灵敏度。
衔接子
在本文所提供的方法的一些实施例中,多核苷酸具有与其连接的多核苷酸衔接子。衔接子通常包括能够与多核苷酸的末端连接的多核苷酸链。
在一些实施例中,衔接子在与多肽形成缀合物之前与多核苷酸连接。在一些实施例中,衔接子与多核苷酸与多肽的缀合物连接。
因此,在一些实施例中,所述方法包括将衔接子(例如,如本文所描述的衔接子)与多核苷酸连接,并且通过将多核苷酸/衔接子构建体与靶多肽缀合来形成缀合物。在一些实施例中,通过将衔接子(例如,本文所描述的衔接子)与多核苷酸连接并且通过将衔接子与靶多肽连接来形成缀合物。
在一些实施例中,可以选择或修饰衔接子以提供用于与多核苷酸缀合的特定位点。
衔接子可以仅与多核苷酸或缀合物的一个末端连接。多核苷酸衔接子可以添加到多核苷酸或缀合物的两个末端。可替代地,可以将不同的衔接子添加到多核苷酸或缀合物的两个末端。
衔接子可以添加到双链多核苷酸的两条链。衔接子可以添加到单链多核苷酸。将衔接子添加到多核苷酸的方法是本领域已知的。衔接子可以例如通过连接,通过点击化学,通过标记,通过拓扑异构化或通过任何其它合适的方法与多核苷酸连接。
在一个实施例中,所述衔接子或每个衔接子是合成的或人工的。通常,所述衔接子或每个衔接子包括如本文所描述的聚合物。在一些实施例中,所述衔接子或每个衔接子包括如本文所描述的间隔子。在一些实施例中,所述衔接子或每个衔接子包括多核苷酸。所述多核苷酸衔接子或每个多核苷酸衔接子可以包括DNA、RNA、经修饰的DNA(如无碱基DNA)、RNA、PNA、LNA、BNA和/或PEG。通常,所述衔接子或每个衔接子包括单链和/或双链DNA或RNA。衔接子可以包括与其所连接的多核苷酸链相同类型的多核苷酸。衔接子可以包括与其所连接的多核苷酸链不同类型的多核苷酸。在一些实施例中,在所公开的方法中使用的多核苷酸链是单链DNA链并且衔接子包括DNA或RNA,通常是单链DNA。在一些实施例中,多核苷酸是双链DNA链并且衔接子包括DNA或RNA,例如,双链或单链DNA。
在一些实施例中,衔接子可以是桥接部分。桥接部分可以用于连接双链多核苷酸的两条链。例如,在一些实施例中,桥接部分用于将双链多核苷酸的模板链与双链多核苷酸的互补链连接。
桥接部分通常共价连接双链多核苷酸的两条链。桥接部分可以是能够连接双链多核苷酸的两条链的任何东西,前提是桥接部分不干扰多核苷酸相对于纳米孔移动。合适的桥接部分包含但不限于聚合连接子、化学连接子、多核苷酸或多肽。优选地,桥接部分包括DNA、RNA、经修饰的DNA(如无碱基DNA)、RNA、PNA、LNA或PEG。桥接部分更优选地是DNA或RNA。
在一些实施例中,桥接部分是发夹衔接子。发夹衔接子是包括单个多核苷酸链的衔接子,其中多核苷酸链的末端能够彼此杂交或被杂交到彼此,并且其中多核苷酸的中间区段形成环。可以使用本领域中已知的方法来设计合适的发夹衔接子。在一些实施例中,发夹环的长度通常为4到100个核苷酸,例如长度为4到50个,如4到20个,例如4到8个核苷酸。在一些实施例中,桥接部分(例如,发夹衔接子)连接在双链多核苷酸的一个末端处。桥接部分(例如,发夹衔接子)通常不连接在双链多核苷酸的两个末端处。
在一些实施例中,衔接子是线性衔接子。线性衔接子可以结合到单链多核苷酸的任一末端或两个末端。当多核苷酸是双链多核苷酸时,线性衔接子可以结合到双链多核苷酸的任一条链或两条链的任一末端或两个末端。线性衔接子可以包括如本文所描述的前导序列。线性衔接子可以包括用于与如本文所描述的标签(如孔标签)杂交的部分。线性衔接子的长度可以为10到150个核苷酸,如长度为20到120个,例如30到100个,例如40到80个,如50到70个核苷酸。线性衔接子可以是单链的。线性衔接子可以是双链的。
在一些实施例中,衔接子可以是Y衔接子。Y衔接子通常是多核苷酸衔接子。Y衔接子通常是双链的,并且包括(a)在一端,两条链杂交在一起的区域,和(b)在另一端,两条链不互补的区域。链的非互补部分通常形成突出端。由于两条链通常不像双链部分那样彼此不杂交,所以在Y衔接子中非互补区域的存在使衔接子具有Y形状。Y衔接子的两个单链部分的长度可以相同,或者长度可以不同。例如,Y衔接子的一个单链部分的长度可以为10到150个核苷酸,如长度为20到120个,例如30到100个,例如40到80个,如50到70个核苷酸,并且Y衔接子的另一个单链部分的长度可以独立地为10到150个核苷酸,如长度为20到120个,例如30到100个,例如40到80个,如50到70个核苷酸。Y衔接子的双链“茎”部分的长度可以为例如10到150个核苷酸,如长度为20到120个,例如30到100个,例如40到80个,如50到70个核苷酸。
可以通过本领域已知的任何合适的方式将衔接子与靶多核苷酸连接。衔接子可以单独的合成,并且化学连接或酶促地与靶多核苷酸连接。可替代地,衔接子可以在靶多核苷酸的加工中产生。在一些实施例中,衔接子在靶多核苷酸的一个末端处或附近与靶多核苷酸连接。在一些实施例中,衔接子与靶多核苷酸在所述靶多核苷酸末端的50个核苷酸内,例如20个核苷酸内,例如10个核苷酸内连接。在一些实施例中,衔接子在靶多核苷酸的末端处与所述靶多核苷酸连接。当衔接子与靶多核苷酸连接时,所述衔接子可以包括与所述靶多核苷酸相同类型的核苷酸或者可以包括与所述靶多核苷酸不同的核苷酸。
特别适用于所公开的方法的衔接子可以包括线性均聚物区域(例如,约5到约20个核苷酸,如约10到约30个核苷酸,例如,胸腺嘧啶或胞苷)和/或用于与一个或多个系链或锚杂交的杂交位点(如本文更详细描述的)。此类衔接子还可以包括用于与靶多肽结合的反应性官能团。点击化学基团在这方面特别合适。例如,包含在衔接子中的示例性基团包含可以在无铜点击化学中形成微粒的基团,例如基于BCN(双环[6.1.0]壬炔)和其衍生物的基团、二苯并环辛炔(DBCO)基团等。此类基团的反应在本领域中是熟知的。例如,BCN基团通常与如可以例如并入多肽中的叠氮化物、四嗪和硝酮等基团反应。DBCO基团对叠氮基团具有高反应性。特别合适的其它化学基团包含2-吡啶羧基醛(2-PCA)基团及和衍生物。例如,6-(叠氮基甲基)-2-吡啶羧基醛可以与肽的N末端氨基反应。
间隔子
在本文所提供的方法的一些实施例中,多核苷酸、通过多核苷酸与多肽反应形成的缀合物或本文所描述的衔接子可以包括间隔子。例如,多核苷酸衔接子中可以存在一个或多个间隔子。例如,多核苷酸衔接子可以包括一个到约20个间隔子,例如,约1个到约10个,例如,1个到约5个间隔子,例如,1个、2个、3个、4个或5个间隔子。间隔子可以包括任何合适数量的间隔子单元。间隔子可以提供阻碍多核苷酸处理蛋白移动的能量势垒。例如,间隔子可以通过减少多核苷酸处理蛋白在多核苷酸上的牵引力来停滞多核苷酸处理蛋白。这可以例如通过使用无碱基间隔子,即其中从多核苷酸衔接子中的一个或多个核苷酸去除了碱基的间隔子来实现。间隔子可以物理地阻止多核苷酸处理蛋白的移动,例如通过引入庞大的化学基团以物理地阻碍多核苷酸处理蛋白的移动。
在一些实施例中,一个或多个间隔子包含在如本文要求保护的方法中使用的多核苷酸或缀合物或衔接子中,为了在所述多核苷酸或缀合物或衔接子穿过或跨过纳米孔时,即当所述多核苷酸或缀合物或衔接子相对于纳米孔移动时提供独特的信号。
在一些实施例中,间隔子可以包括线性分子,如聚合物。通常,此类间隔子具有与缀合物中使用的多核苷酸不同的结构。例如,如果多核苷酸是DNA,则所述间隔子或每个间隔子不包括DNA。特别地,如果多核苷酸是脱氧核糖核酸(DNA)或核糖核酸(RNA),则所述间隔子或每个间隔子优选地包括肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的合成聚合物。在一些实施例中,间隔子可以包括一个或多个硝基吲哚、一个或多个肌苷、一个或多个吖啶、一个或多个2-氨基嘌呤、一个或多个2-6-二氨基嘌呤、一个或多个5-溴-脱氧尿苷、一个或多个反向胸苷(反向dT)、一个或多个反向双脱氧胸苷(ddT)、一个或多个双脱氧胞苷(ddC)、一个或多个5-甲基胞苷、一个或多个5-羟甲基胞苷、一个或多个2'-O-甲基RNA碱基、一个或多个异脱氧胞苷(Iso-dC)、一个或多个异脱氧鸟苷(Iso-dG)、一个或多个C3(OC3H6OPO3)基团、一个或多个光可切割(PC)[OC3H6-C(O)NHCH2-C6H3NO2-CH(CH3)OPO3]基团、一个或多个己二醇基团、一个或多个间隔子9(iSp9)[(OCH2CH2)3OPO3]基团或一个或多个间隔子18(iSp18)[(OCH2CH2)6OPO3]基团;或一个或多个硫醇连接。间隔子可以包括这些基团的任何组合。这些基团中的许多可以从(Integrated DNA )商购获得。例如,C3、iSp9和iSp18间隔子均可从获得。间隔子可以包括任何数量的上述基团作为间隔子单元。
在一些实施例中,间隔子可以包括一个或多个导致多核苷酸处理蛋白停滞的化学基团。在一些实施例中,合适的化学基团是一个或多个化学侧基。一个或多个化学基团可以与多核苷酸、构建体或衔接子中的一个或多个核碱基连接。一个或多个化学基团可以与多核苷酸衔接子的主链连接。可以存在任何数目的适当的化学基团,如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多。合适的基团包含但不限于荧光团、链霉亲和素和/或生物素、胆固醇、亚甲蓝、二硝基苯酚(DNP)、地高辛和/或抗地高辛和二苯基环辛炔基团。在一些实施例中,间隔子可以包括聚合物。在一些实施例中,间隔子可以包括聚合物,所述聚合物是多肽或聚乙二醇(PEG)。
间隔子可以包括一个或多个无碱基核苷酸(即,缺少核碱基的核苷酸),如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个无碱基核苷酸。在无碱基核苷酸中,核碱基可被-H(idSp)或-OH替换。通过从一个或多个相邻核苷酸中去除碱基,可以将无碱基间隔子插入到靶多核苷酸中。例如,可以将多核苷酸修饰为包含3-甲基腺嘌呤、7-甲基鸟嘌呤、1,N6-亚乙烯基腺嘌呤肌苷或次黄嘌呤,并且可以使用人烷基腺嘌呤DNA糖苷酶(hAAG)从这些核苷酸中去除核碱基。可替代地,可以将多核苷酸修饰成包含尿嘧啶,并且用尿嘧啶-DNA糖苷酶(UDG)去除核碱基。在一个实施例中,一个或多个间隔子不包括任何无碱基核苷酸。
在WO 2014/135838中描述了使用间隔子使多核苷酸处理蛋白如解旋酶停滞在多核苷酸衔接子上的方法,所述文献在此通过引用整体并入。
锚
在一些实施例中,多核苷酸、其与多肽的缀合物或与其连接的衔接子可以包括例如与衔接子连接的膜锚或跨膜孔锚。在一个实施例中,锚有助于根据本文所公开的方法表征缀合物。例如,膜锚或跨膜孔锚可以促进缀合物在膜中纳米孔周围的定位。
锚可以是可以插入到膜中的多肽锚和/或疏水性锚。在一个实施例中,疏水性锚是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸酯或生育酚。锚可以包括硫醇、生物素或表面活性剂。
一方面,锚可以是生物素(用于与链霉亲和素结合)、直链淀粉(用于与麦芽糖结合蛋白或融合蛋白结合)、Ni-NTA(用于与聚组氨酸或聚组氨酸标记的蛋白结合)或肽(如抗原)。
在一个实施例中,锚可以包括连接子,或2个、3个、4个或更多个连接子。优选的连接子包含但不限于聚合物,如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些连接子可以是线性、支链或环状的。例如,连接子可以是环状多核苷酸。衔接子可以与环状多核苷酸连接子上的互补序列杂交。一个或多个锚或一个或多个连接子可以包括可被切割或分解的组分,如限制性位点或光不稳定基团。连接子可以用马来酰亚胺基团官能化以与蛋白质中的半胱氨酸残基连接。WO 2010/086602中描述了适合的连接子。
在一个实施例中,锚是胆固醇或脂肪酰基链。例如,可以使用具有的长度为6到30个碳原子的任何脂肪酰基链,如十六烷酸。WO 2012/164270和WO 2015/150786中公开了合适的锚的实例以及将锚与衔接子连接的方法。
控制缀合物相对于纳米孔移动
如上文更详细解释的,本文所提供的方法包括:使所述缀合物与能够控制所述多核苷酸相对于纳米孔移动的多核苷酸处理蛋白接触;以及当所述缀合物相对于所述纳米孔移动时,进行所述多肽所特有的一个或多个测量。
缀合物相对于纳米孔移动可以通过任何合适的方式来驱动。在一些实施例中,缀合物的移动由物理或化学力(势)驱动。在一些实施例中,物理力由电势(例如电压电势)或温度梯度等提供。
在一些实施例中,当跨纳米孔施加电势时,缀合物相对于纳米孔移动。多核苷酸带负电,并且因此跨纳米孔施加电压电势将导致多核苷酸在所施加的电压电势的影响下相对于纳米孔移动。例如,如果相对于纳米孔的顺式侧向纳米孔的反式侧施加正电压电势,则这将诱导带负电的分析物从纳米孔的顺式侧移动到纳米孔的反式侧。类似地,如果相对于纳米孔的顺式侧向纳米孔的反式侧施加正电压电势,则这将阻碍带负电的分析物从纳米孔的反式侧向纳米孔的顺式侧移动。如果相对于纳米孔的顺式侧向纳米孔的反式侧施加负电压电势,则会发生相反的情况。本文更详细地描述了施加适当电压的设备和方法。
在一些实施例中,化学力由浓度(例如,pH)梯度提供。
在一些实施例中,多核苷酸处理蛋白控制缀合物在与物理或化学力(势)相同的方向上的移动。例如,在一些实施例中,相对于纳米孔的顺式侧向纳米孔的反式侧施加正电压,并且多核苷酸处理蛋白控制缀合物从纳米孔的顺式侧到纳米孔的反式侧移动。在一些实施例中,相对于纳米孔的反式侧向纳米孔的顺式侧施加正电压,并且多核苷酸处理蛋白控制缀合物从纳米孔的反式侧到纳米孔的顺式侧移动。
在一些实施例中,多核苷酸处理蛋白控制缀合物在与物理或化学力(电势)相反的方向上移动。例如,在一些实施例中,相对于纳米孔的顺式侧向纳米孔的反式侧施加正电压,并且多核苷酸处理蛋白控制缀合物从纳米孔的反式侧到纳米孔的顺式侧移动。在一些实施例中,相对于纳米孔的反式侧向纳米孔的顺式侧施加正电压,并且多核苷酸处理蛋白控制缀合物从纳米孔的顺式侧向纳米孔的反式侧移动。
在一些实施例中,缀合物的移动由多核苷酸处理蛋白在不存在施加电势的情况下驱动。
在所公开的方法中,所述多核苷酸处理蛋白能够控制所述多核苷酸相对于纳米孔移动。换句话说,多核苷酸处理蛋白能够控制缀合物移动。在一些实施例中,多核苷酸处理蛋白能够控制多核苷酸和多肽移动。
合适的多核苷酸处理蛋白也被称为马达蛋白或多核苷酸处理酶。合适的多核苷酸处理蛋白是本领域已知的,并且下文中更详细地描述了一些示例性多核苷酸处理蛋白。
在一个实施例中,马达蛋白是或源自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并且修饰其的至少一个性质的多肽。酶可以通过切割多核苷酸以形成单独的核苷酸或较短核苷酸链如二核苷酸或三核苷酸来对多核苷酸进行修饰。所述酶可以通过将多核苷酸朝向或使其移动到特定位置来对多核苷酸进行修饰。
在一些实施例中,多核苷酸处理蛋白可以在缀合物与纳米孔接触之前存在于缀合物上。例如,多核苷酸处理蛋白可以存在于缀合物中的多核苷酸上。在一些实施例中,多核苷酸处理蛋白存在于包括缀合物的一部分的衔接子上,或者可以另外存在于缀合物的一部分上。
在一些实施例中,当与所述多核苷酸处理蛋白的所述活性位点接触的所述缀合物的部分包括多肽时,所述多核苷酸处理蛋白能够保持与所述缀合物结合。换句话说,在一些实施例中,当多核苷酸处理蛋白接触缀合物的多肽部分时,多核苷酸处理蛋白不从缀合物解离。在一些实施例中,多核苷酸处理蛋白相对于多肽部分自由移动,直到接触缀合物的一个或多个后续多核苷酸部分。
在一些实施例中,所述多核苷酸处理蛋白被修饰以防止当所述多核苷酸处理蛋白接触包括多肽的所述缀合物的一部分时,所述多核苷酸处理蛋白与所述缀合物、多核苷酸或衔接子脱离(除了穿过移开缀合物、多核苷酸或衔接子的末端)。此类经修饰的多核苷酸处理蛋白特别适用于所公开的方法。
多核苷酸处理蛋白可以以任何合适的方式进行调整。例如,可以将多核苷酸处理蛋白装载到多核苷酸、缀合物或衔接子上,并且然后对其进行修饰以防止其脱离。可替代地,可以修饰多核苷酸处理蛋白以防止其在装载到多核苷酸、缀合物或衔接子上之前脱离。可以使用本领域已知的方法,如在WO 2014/013260(特此通过引用整体并入)中讨论的方法并特别参考描述修饰多核苷酸处理蛋白(多核苷酸结合蛋白)(如解旋酶)以防止它们与多核苷酸链脱离的段落来实现多核苷酸处理蛋白的修饰以防止其与多核苷酸、缀合物或衔接子脱离。
例如,多核苷酸处理蛋白可以具有多核苷酸解结合开口;例如,当多核苷酸处理蛋白与链脱离时,多核苷酸链可以通过的空腔、裂缝或空隙。在一些实施例中,给定马达蛋白(多核苷酸处理蛋白)的多核苷酸解结合开口可以通过参考其结构,例如参考其X射线晶体结构来确定。X射线晶体结构可以在多核苷酸底物存在和/或不存在下获得。在一些实施例中,可以使用本领域已知的标准包通过分子建模来推断或证实给定多核苷酸处理蛋白中多核苷酸解结合开口的位置。在一些实施例中,多核苷酸解结合开口可以通过多核苷酸处理蛋白的一个或多个部分例如一个或多个结构域的移动而瞬时产生。
可以通过关闭多核苷酸解结合开口来修饰多核苷酸处理蛋白(马达蛋白)。因此,关闭多核苷酸解结合开口可以防止多核苷酸处理蛋白与缀合物的多肽部分脱离以及防止其与多核苷酸或衔接子脱离。例如,可以通过共价关闭多核苷酸解结合开口来修饰马达蛋白。在一些实施例中,用于以此方式寻址的马达蛋白是如本文所描述的解旋酶。因此,在所公开的方法的一些实施例中,所述多核苷酸处理蛋白被修饰以完全或部分封闭存在于未修饰蛋白的至少一种构象状态中的开口,多核苷酸链可通过所述开口解结合。
可以根据本文所公开的方法中表征的缀合物中使用的多核苷酸来挑选或选择多核苷酸处理蛋白。可替代地,可以根据用于控制缀合物移动的多核苷酸处理蛋白来挑选或选择多核苷酸。例如,当多核苷酸是DNA时,通常可以使用DNA马达蛋白。当多核苷酸是RNA时,可以使用RNA马达蛋白。当多核苷酸是DNA与RNA的杂交体时,可以使用可以加工DNA和RNA两者的马达蛋白。
在一个实施例中,马达蛋白源自任何酶分类(EC)组的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。
在一些实施例中,马达蛋白是解旋酶、聚合酶、外切核酸酶、拓扑异构酶或其变体。
在一个实施例中,马达蛋白是外切核酸酶。合适酶包含但不限于来自大肠杆菌的外切核酸酶I(SEQ ID NO:1)、来自大肠杆菌的外切核酸酶III(SEQ ID NO:2)、来自嗜热栖热菌(T.thermophilus)的RecJ(SEQ ID NO:3)和噬菌体λ外切核酸酶(SEQ ID NO:4)、TatD外切核酸酶和其变体。包括SEQ ID NO:3中所示序列的三个亚基或其变体相互作用以形成三聚体外切核酸酶。
在一个实施例中,马达蛋白是聚合酶。聚合酶可以是3173DNA聚合酶(其可商购自公司)、SD聚合酶(可商购自)、来自NEB的Klenow或其变体。在一个实施例中,酶是Phi29 DNA聚合酶(SEQ ID NO:5)或其变体。可用于所公开的方法的Phi29聚合酶的经修饰版本公开于美国专利第5,576,204号中。
在本文所提供的包括通过合成与多核苷酸互补的链来控制缀合物移动的方法的实施例中,多核苷酸处理蛋白通常是聚合酶,例如本文所描述的聚合酶。
在一个实施例中,所述多核苷酸处理蛋白是拓扑异构酶。在一个实施例中,拓扑异构酶是部分分类(EC)组5.99.1.2和5.99.1.3中的任一个的成员。拓扑异构酶可以是逆转录酶,其是能够催化从RNA模板形成cDNA的酶。它们可从例如New England和商购获得。
在一个实施例中,所述多核苷酸处理蛋白是解旋酶。可以根据本文提供的方法使用任何合适的解旋酶。例如,根据本公开使用的所述马达蛋白或每个马达蛋白可以独立地选自Hel308解旋酶、RecD解旋酶、TraI解旋酶、TrwC解旋酶、XPD解旋酶和Dda解旋酶或其变体。单聚解旋酶可以包括连接在一起的若干结构域。例如,TraI解旋酶和TraI亚组解旋酶可以含有两个RecD解旋酶结构域、释放酶结构域和C末端结构域。这些结构域通常形成能够起作用而不会形成寡聚体的单聚解旋酶。合适的解旋酶的具体实例包含Hel308、NS3、Dda、UvrD、Rep、PcrA、Pif1和TraI。这些解旋酶通常作用于单链DNA。可以沿着双链DNA的两条链移动的解旋酶的实例包含FtfK和六聚酶复合物,或多亚基复合物,如RecBCD。NS3解旋酶特别适用于所公开的方法,因为它们能够加工DNA和RNA,并且因此可以用于其中靶双链核酸是DNA-RNA杂交体的所公开的方法的实施例中。
Hel308解旋酶在出版物如WO 2013/057495中有所描述,其全部内容通过引用并入。RecD解旋酶在如WO 2013/098562的出版物中有描述,其全部内容通过引用并入。XPD解旋酶在如WO 2013/098561的出版物中有所描述,其全部内容通过引用并入。Dda解旋酶在如WO 2015/055981和WO 2016/055777的出版物中有所描述,其各自的全部内容通过引用并入。
在一个实施例中,解旋酶包括SEQ ID NO:6中所示的序列(Trwc Cba)或其变体、SEQ ID NO:7中所示的序列(Hel308 Mbu)或其变体或SEQ ID NO:8中所示的序列(Dda)或其变体。变体可以以下文论述的方式中的任何方式与天然序列不同。SEQ ID NO:8的示例变体包括E94C/A360C。SEQ ID NO:8的另一个示例变体包括E94C/A360C,并且然后是(ΔM1)G1G2(即M1的缺失,并且然后是G1和G2的添加)。
在一些实施例中,马达蛋白(例如解旋酶)可以在至少两种活性操作模式(当马达蛋白具有所有必要组分以促进移动时,例如本文所讨论的燃料和辅因子,如ATP和Mg2+)和一种非活性操作模式(当马达蛋白没有提供促进移动所需的组分时)中控制缀合物移动。
当提供所有必要的组分以促进运动(即在活性模式下)时,马达蛋白(例如解旋酶)在5'到3'或3'到5'方向(取决于马达蛋白)上沿着多核苷酸移动。马达蛋白可以用于将缀合物移动远离(例如移出)孔(例如抵抗施加的力)或将缀合物移动朝着(例如进入)孔(例如使用施加的力)。例如,当马达蛋白所移动的缀合物的末端被孔捕获时,马达蛋白会逆着力的方向工作,并且将穿过的缀合物拉出孔(例如进入顺式室)。然而,当马达蛋白所移动的远离的末端被捕获在孔中时,马达蛋白使用力的方向工作并且将穿过的缀合物推入到孔中(例如进入反式室)。
当马达蛋白(例如解旋酶)没有提供促进移动的必要组分(即处于非活性模式)时,它可以与缀合物结合并作为制动器,当它相对于纳米孔移动时减慢构建体的移动,例如通过被力拉入到孔中。在非活性模式下,缀合物的哪一个末端被捕获并不重要,所施加的力决定了缀合物相对于孔的移动,并且多核苷酸结合蛋白充当制动器。当在非活动模式中时,通过多核苷酸结合蛋白对缀合物的移动控制可以多种方式(包含棘轮、滑动和制动)描述。
马达蛋白通常需要燃料来处理多核苷酸的加工。燃料通常是游离核苷酸或游离核苷酸类似物。游离核苷酸可以是但不限于腺苷一磷酸(AMP)、腺苷二磷酸(ADP)、腺苷三磷酸(ATP)、鸟苷一磷酸(GMP)、鸟苷二磷酸(GDP)、鸟苷三磷酸(GTP)、胸苷一磷酸(TMP)、胸苷二磷酸(TDP)、胸苷三磷酸(TTP)、尿苷一磷酸(UMP)、尿苷二磷酸(UDP)、尿苷三磷酸(UTP)、胞苷一磷酸(CMP)、胞苷二磷酸(CDP)、胞苷三磷酸(CTP)、环腺苷一磷酸(cAMP)、环鸟苷一磷酸(cGMP)、脱氧腺苷一磷酸(dAMP)、脱氧腺苷二磷酸(dADP)、脱氧腺苷三磷酸(dATP)、脱氧鸟苷一磷酸(dGMP)、脱氧鸟苷二磷酸(dGDP)、脱氧鸟苷三磷酸(dGTP)、脱氧胸苷一磷酸(dTMP)、脱氧胸苷二磷酸(dTDP)、脱氧胸苷三磷酸(dTTP)、脱氧尿苷一磷酸(dUMP)、脱氧尿苷二磷酸(dUDP)、脱氧尿苷三磷酸(dUTP)、脱氧胞苷一磷酸(dCMP)、脱氧胞苷二磷酸(dCDP)和脱氧胞苷三磷酸(dCTP)。游离核苷酸通常选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸通常是三磷酸腺苷(ATP)。
马达蛋白的辅因子是允许马达蛋白发挥功能的因子。辅因子优选地是二价金属阳离子。二价金属阳离子优选为Mg2+、Mn2+、Ca2+或Co2+。辅因子最优选地为Mg2+。
如本文所解释的,在一些实施例中,多核苷酸处理蛋白被修饰以在使用多核苷酸处理蛋白来控制缀合物相对于纳米孔移动时延伸多核苷酸处理蛋白与纳米孔之间的距离。
可以以任何合适的方式修饰多核苷酸处理蛋白。蛋白质(如多核苷酸处理蛋白)的修饰在本领域技术人员的知识范围内。
可以通过在蛋白质结构中引入另外的氨基酸来修饰多核苷酸处理蛋白。在一些实施例中,通过引入一个或多个延伸超出蛋白质天然范围的环区域来修饰多核苷酸处理蛋白。在其中多核苷酸处理蛋白包括多个亚基的实施例中,可以将一个或多个环区域引入到多核苷酸处理蛋白的一个或多个亚基中。
可以通过融合一个或多个另外的结构域来修饰多核苷酸处理蛋白,以在多核苷酸处理蛋白相对于纳米孔处于“就坐位置”时置换纳米孔。
纳米孔
如上文所解释的,本文所公开的方法包括使用多核苷酸处理蛋白控制缀合物相对于纳米孔移动。
在所公开的方法中,可以使用任何合适的纳米孔。在一个实施例中,纳米孔是跨膜孔。
跨膜孔是某种程度上跨膜的结构。它允许由施加的电势驱动的水合离子在膜上或膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流向膜的另一侧。然而,跨膜孔不必要穿过膜。它可能在一端封闭。例如,孔可以是膜中的孔、间隙、通道、沟槽或狭缝,水合离子可以沿着膜流入或流入到膜中。
在本文提供的方法中可以使用任何跨膜孔。孔可以是生物的或人造的。合适的孔包含但不限于蛋白质孔、多核苷酸孔和固态孔。在一个实施例中,固态孔可以包括纳米通道。孔可以是DNA折纸孔(Langecker等人,《科学(Science)》,2012;338:932-936)。WO2013/083983中公开了合适的DNA折纸孔。
在一个实施例中,纳米孔是跨膜蛋白孔。跨膜蛋白孔是允许水合离子(例如多核苷酸)从膜的一侧流向膜的另一侧的多肽或多肽集合。在本文所提供的方法中,跨膜蛋白孔能够形成允许由施加的电势驱动的水合离子从膜的一侧流向另一侧的孔。跨膜蛋白孔优选地允许多核苷酸从膜(如三嵌段共聚物膜)的一侧流到另一侧。跨膜蛋白孔允许多核苷酸移动通过孔。
在一个实施例中,纳米孔是跨膜蛋白孔,其为单体或寡聚体。孔优选地由若干重复的亚基,如至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个或至少16个亚基构成。孔优选地是六聚体、七聚体、八聚体或非聚体的孔。孔可以是同型寡聚体或异型低聚物。
在一个实施例中,跨膜蛋白孔包括离子可以通过其流动的桶或通道。孔的亚基通常围绕中心轴线,并向跨膜β-桶或通道或跨膜α-螺旋束或通道贡献链。
通常,跨膜蛋白质孔的桶或通道包括促进与分析物,如靶多核苷酸(如本文所描述的)的相互作用的氨基酸。这些氨基酸优选地位于桶或通道的缢痕附近。跨膜蛋白质孔通常包含一个或多个带正电荷的氨基酸,如精氨酸、赖氨酸或组氨酸,或芳香族氨基酸,如酪氨酸或色氨酸。这些氨基酸通常促进孔与核苷酸、多核苷酸或核酸之间的相互作用。
在一个实施例中,纳米孔是源自β-桶孔或α-螺旋束孔的跨膜蛋白孔。β-桶孔包括由β-链形成的桶或通道。合适的β-桶孔包含但不限于β-毒素,如α-溶血素、炭疽毒素和白细胞素,以及细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),例如MspA、MspB、MspC或MspD、CsgG,外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟氏球菌(Neisseria)自转运蛋白(NalP)以及其它孔隙,如胞溶素。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α-螺旋束孔包含但不限于内膜蛋白和α外膜蛋白,如WZA和ClyA毒素。
在一个实施例中,纳米孔是衍生自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Sp1以及溶血蛋白fragaceatoxin C(FraC)的跨膜孔。
在一个实施例中,纳米孔是衍生自CsgG,例如衍生自来自大肠杆菌菌株K-12亚株MC4100的CsgG的跨膜蛋白质孔。此类孔是寡聚的,并且通常包括衍生自CsgG的7个、8个、9个或10个单体。孔可以是衍生自包括相同单体的CsgG的同质寡聚孔。可替代地,孔可以是衍生自CsgG的异源寡聚孔,其包括不同于其它单体的至少一种单体。WO 2016/034591中公开了衍生自CsgG的合适的孔的实例。
在一个实施例中,纳米孔是源自胞溶素的跨膜孔。WO 2013/153359中公开了衍生自胞溶素的合适的孔的实例。
在一个实施例中,纳米孔是源自或基于α-溶血素(α-HL)的跨膜孔。野生型α-溶血素孔由7个相同的单体或亚基形成(即,它是七聚的)。α-溶血素孔可以是α-溶血素-NN或其变体。变体优选地包括在位置E111和K147处的N个残基。
在一个实施例中,纳米孔是源自Msp,例如源自MspA的跨膜蛋白孔。WO 2012/107778中公开了衍生自MspA的合适的孔的实例。
在一个实施例中,纳米孔是源自或基于ClyA的跨膜孔。
如上文所解释的,在一些实施例中,纳米孔包括收缩。收缩通常是贯穿纳米孔的通道中的变窄,其可以确定或控制当缀合物相对于纳米孔移动时获得的信号。如本文所使用的,蛋白质和固态纳米孔两者通常都包括“收缩”。
在一些实施例中,所述纳米孔被修饰以延伸所述多核苷酸处理蛋白与所述纳米孔的收缩区之间的距离。在一些实施例中,纳米孔被修饰以在多核苷酸处理蛋白被用于控制缀合物相对于纳米孔移动时,延伸多核苷酸处理蛋白与纳米孔的收缩区之间的距离。在一些实施例中,所述纳米孔被修饰以在多核苷酸处理蛋白与纳米孔接触时延伸所述多核苷酸处理蛋白与所述纳米孔的收缩区之间的距离。
在一些实施例中,所述纳米孔被修饰以延伸所述多核苷酸处理蛋白的活性位点与所述纳米孔的收缩区之间的距离。在此类实施例中,所述距离可以是当多核苷酸处理蛋白用于控制缀合物相对于纳米孔移动时和/或当多核苷酸处理蛋白与纳米孔接触时,多核苷酸处理蛋白的活性位点与纳米孔的收缩之间的距离。
可以以任何合适的方式修饰纳米孔。如蛋白质纳米孔等纳米孔的修饰在本领域技术人员的知识范围内。固态纳米孔的修饰是常规的并且可以通过控制形成纳米孔的底物(例如其厚度)或形成纳米孔的组分来实现。
例如,可以修饰纳米孔以延伸穿过孔的通道的长度。
可以通过将另外的氨基酸引入到孔结构中来修饰蛋白质纳米孔。在一些实施例中,通过引入一个或多个延伸超出纳米孔天然范围的环区域来修饰蛋白质纳米孔。在其中纳米孔包括多个亚基的实施例中,可以将一个或多个环区域引入到纳米孔的一个或多个亚基中。环区域可以例如延伸超出纳米孔的顺式入口。
可以修饰蛋白质纳米孔以延伸穿过孔的桶或通道的长度。例如,可以通过在形成桶的部分中将另外的氨基酸引入到蛋白质序列中来修饰β-桶孔,由此延伸桶的长度。此类修饰的相关位置的合理设计可以例如通过参考蛋白质和/或其单体亚基的结构(例如X-射线)结构来进行。
蛋白质纳米孔可以通过融合一个或多个另外的结构域来修饰,以提高多核苷酸处理蛋白相对于纳米孔的“就坐位置”。
在一些实施例中,可以通过将蛋白质纳米孔与另一个蛋白质纳米孔融合来对其进行修饰。以此方式,可以制造具有贯穿其中的单个通道的纳米孔链,以延伸通道中的收缩与多核苷酸处理蛋白之间的距离。在此类情况下,多个纳米孔可以相同或不同。
标签
在本文所提供的方法的一些实施例中,可以使用纳米孔上的标签,例如促进纳米孔捕获缀合物。
纳米孔上的标签与多核苷酸上的结合位点(例如,存在于缀合物的多核苷酸部分中或存在于与缀合物连接的衔接子中的结合位点,其中结合位点可以由衔接子的锚或前导序列或由衔接子的双链体茎内的捕获序列提供)之间的相互作用可以是可逆的。例如,多核苷酸可以例如通过其衔接子结合到纳米孔上的标签,并且例如在通过纳米孔表征多核苷酸期间和/或在马达蛋白加工期间在某些点处释放。强的非共价结合(例如,生物素/亲和素)仍然是可逆的,并且可以用于本文所描述的方法的一些实施例中。例如,一对孔标签和多核苷酸衔接子可以被设计成在双链多核苷酸的补体(或衔接子的与补体连接的一部分)与纳米孔之间提供足够的相互作用,使得补体保持靠近纳米孔(不会与纳米孔分离并扩散),但能够在处理时从纳米孔中释放出来。
孔标签和多核苷酸衔接子可以被配置成使得多核苷酸上的结合位点(例如,由衔接子的锚或前导序列或由衔接子的双链体茎内的捕获序列提供的结合位点)与纳米孔上的标签的结合强度或亲和力足以维持纳米孔与多核苷酸之间的偶联,直到施加的力放置于其上以从纳米孔释放结合的多核苷酸。
在一些实施例中,标签或系链不带电荷。这样可以确保在电势差(如果存在的话)的影响下,标签或系链不会被拉入纳米孔中。
吸引或结合缀合物、多核苷酸或衔接子的一个或多个分子可以与纳米孔连接。可以使用与缀合物、衔接子和/或多核苷酸杂交的任何分子。连接到孔的分子可以选自PNA标签、PEG连接子、短寡核苷酸、带正电荷的氨基酸和适体。具有与它们连接的此类分子的孔是本领域已知的。例如,具有连接到其的短寡核苷酸的孔公开于Howarka等人(2001)《自然生物技术(Nature Biotech)》19:636-639和WO 2010/086620,并且包括连接在孔的内腔内PEG的孔公开于Howarka等人(2000)《美国化学协会期刊(J.Am.Chem.Soc.)》122(11):2411-2416。
与纳米孔连接的短寡核苷酸包括与缀合物中的序列互补的序列(例如,在衔接子中的前导序列或另一个单链序列中)可以用于在本文所描述的方法中增强缀合物的捕获。
在一些实施例中,标签或系链可以包括或可以是寡核苷酸(例如,DNA、RNA、LNA、BNA、PNA或吗啉代)。寡核苷酸的长度可以为约10-30个核苷酸或长度为约10-20个核苷酸。在一些实施例中,寡核苷酸可以具有至少一个被修饰用于与其它修饰或固体底物表面(包括,例如珠粒)的末端(例如,3'或5'末端)缀合。末端改性剂可以添加可以用于缀合的反应性官能团。可以添加的官能团的实例包含但不限于氨基、羧基、硫醇、马来酰亚胺、氨氧基和其任何组合。官能团可以与不同长度的间隔子(例如,C3、C9、C12、间隔子9和18)组合以增加官能团与寡核苷酸序列末端的物理距离。
寡核苷酸的3'和/或5'末端上的修饰的实例包含但不限于3'亲和标签和用于化学连接的官能团(包括,例如3'-生物素、3'-伯胺、3'-二硫化物酰胺、3'-吡啶基二硫基及其任何组合);5'末端修饰(包含,例如5'-伯胺和/或5'-荧光素),用于点击化学的修饰(包括,例如3'-叠氮化物、3'-炔烃、5'-叠氮化物、5'-炔烃)和其任何组合。
在一些实施例中,标签或系链可以进一步包括聚合物连接子,例如,以促进偶联到纳米孔。示例性聚合物连接子包含但不限于聚乙二醇(PEG)。聚合物连接子的分子量可以为约500Da到约10kDa(包括端值),或约1kDa到约5kDa(包括端值)。聚合物连接子(例如,PEG)可以用不同的官能团官能化,包含例如但不限于马来酰亚胺、NHS酯、二苯并环辛炔(DBCO)、叠氮化物、生物素、胺、炔烃、醛和其任何组合。
标签或系链的其它实例包含但不限于His标签、生物素或链霉亲和素、与分析物结合的抗体、与分析物结合的适体、分析物结合结构域,如DNA结合结构域(包含例如肽拉链,如亮氨酸拉链、单链DNA结合蛋白(SSB))和其任何组合。
可以使用本领域已知的任何方法,将标签或系链连接到纳米孔的外表面,例如,在膜的顺式侧。例如,一种或多种标签或系链可以通过一种或多种半胱氨酸(半胱氨酸键)、一种或多种伯胺(如赖氨酸)、一种或多种非天然氨基酸、一种或多种组氨酸(His标签)、一种或多种生物素或链霉亲和素、一种或多种基于抗体的标签、表位的一种或多种酶修饰(包含例如乙酰转移酶)和其任意组合与纳米孔连接。用于进行此类修饰的合适方法在本领域是众所周知的。合适的非天然氨基酸包含但不限于4-叠氮基-L-苯丙氨酸(Faz),以及LiuC.C.和Schultz P.G.,《生物化学年鉴(AnnuRev Biochem)》,2010,79,413-444的图1中编号为1-71的氨基酸中的任一种。
在一个或多个标签或系链通过半胱氨酸键连接到纳米孔的一些实施例中,可以将一种或多种半胱氨酸引入到通过取代形成纳米孔的一种或多种单体中。在一些实施例中,可以通过连接如下来对纳米孔进行化学修饰:(i)马来酰亚胺,包含二溴马来酰亚胺,如:4-苯氮霉素、1.N-(2-羟乙基)马来酰亚胺、N-环己基马来酰亚胺、1.3-马来酰亚胺基丙酸、1.1-4-氨基苯基-1H-吡咯,2,5,二酮、1.1-4-羟基苯基-1H-吡咯,2,5,二酮、N-乙基马来酰亚胺、N-甲氧基羰基马来酰亚胺、N-叔丁基马来酰亚胺、N-(2-氨基乙基)马来酰亚胺、3-马来酰亚胺基-丙氧基、N-(4-氯苯基)马来酰亚胺、1-[4-(二甲基氨基)-3,5-二硝基苯基]-1H-吡咯-2,5-二酮、N-[4-(2-苯并咪唑基)苯基]马来酰亚胺、N-[4-(2-苯并恶唑基)苯基]马来酰亚胺、N-(1-萘基)马来酰亚胺、N-(2,4-二甲苯基)马来酰亚胺、N-(2,4-二氟苯基)马来酰亚胺、N-(3-氯-对-甲苯基)-马来酰亚胺、1-(2-氨基-乙基)-吡咯-2,5-二酮盐酸盐、1-环戊基-3-甲基-2,5-二氢-1H-吡咯-2,5-二酮、1-(3-氨基丙基)-2,5-二氢-1H-吡咯-2,5-二酮盐酸盐、3-甲基-1-[2-氧代-2-(哌嗪-1-基)乙基]-2,5-二氢-1H-吡咯-2,5-二酮盐酸盐、1-苄基-2,5-二氢-1H-吡咯-2,5-二酮、3-甲基-1-(3,3,3-三氟丙基)-2,5-二氢-1H-吡咯-2,5-二酮、1-[4-(甲基氨基)环己基]-2,5-二氢-1H-吡咯-2,5-二酮三氟乙酸、SMILES O=C1C=CC(=O)N1CC=2C=CN=CC2、SMILES O=C1C=CC(=O)N1CN2CCNCC2、1-苄基-3-甲基-2,5-二氢-1H-吡咯-2,5-二酮、1-(2-氟苯基)-3-甲基-2,5-二氢1H-吡咯-2,5-二酮、N-(4-苯氧基苯基)马来酰亚胺、N-(4-硝基苯基)马来酰亚胺,(ii)碘代乙酰胺,如3-(2-碘乙酰氨基)-丙氧基、N-(环丙基甲基)-2-碘乙酰胺、2-碘-N-(2-苯乙基)乙酰胺、2-碘-N-(2,2,2-三氟乙基)乙酰胺、N-(4-乙酰基苯基)-2-碘代乙酰胺、N-(4-(氨基磺酰基)苯基)-2-碘代乙酰胺、N-(1,3-苯并噻唑-2-基)-2-碘代乙酰胺、N-(2,6-二乙基苯基)-2-碘代乙酰胺、N-(2-苯甲酰基-4-氯苯基)-2-碘代乙酰胺,(iii)溴代乙酰胺:如N-(4-(乙酰氨基)苯基)-2-溴代乙酰胺、N-(2-乙酰基苯基)-2-溴代乙酰胺、2-溴-n-(2-氰基苯基)乙酰胺、2-溴-N-(3-(三氟甲基)苯基)乙酰胺、N-(2-苯甲酰基苯基)-2-溴代乙酰胺、2-溴-N-(4-氟苯基)-3-甲基丁酰胺、N-苄基-2-溴-N-苯基丙酰胺、N-(2-溴-丁酰基)-4-氯-苯磺酰胺、2-溴-N-甲基-N苯基乙酰胺、2-溴-N-苯乙基-乙酰胺、2-金刚烷-1-基-2-溴-N-环己基-乙酰胺、2-溴-N-(2-甲基苯基)丁酰胺、乙酰替对溴苯胺,(iv)二硫化物,如:aldrithiol-2、aldrithiol-4、异丙基二硫化物、1-(异丁基二硫烷基)-2-甲基丙烷、二苄基二硫化物、4-氨基苯基二硫化物、3-(2-吡啶基二硫代)丙酸酸、3-(2-吡啶基二硫代)丙酸酰肼、3-(2-吡啶基二硫代)丙酸N-琥珀酰亚胺酯、am6amPDP1-βCD;以及(v)硫醇,如:4-苯基噻唑-2-硫醇、Pulpald、5,6,7,8-四氢-喹唑啉-2-硫醇。
在一些实施例中,标签或系链可以直接或通过一个或多个连接子连接到纳米孔。可以使用WO 2010/086602中描述的杂交连接子将标签或系链连接到纳米孔。可替代地,可以使用肽连接子。肽连接子是氨基酸序列。肽连接子的长度、柔性和亲水性通常被设计为使得其不干扰单体和孔的功能。优选的柔性肽连接子是2个到20个,如4个、6个、8个、10个或16个丝氨酸和/或甘氨酸的延伸段。更优选的柔性连接子包含(SG)1、(SG)2、(SG)3、(SG)4、(SG)5和(SG)8,其中S是丝氨酸且G是甘氨酸。优选的刚性连接子是2个到30个,如4个、6个、8个、16个或24个脯氨酸的延伸段。更优选的刚性连接子包括(P)12,其中P是脯氨酸。
膜
通常,在所公开的方法中,纳米孔通常存在于膜中。系统中可以使用任何合适的膜。
膜优选地是两亲层。两亲层是由如磷脂等两亲分子形成的层,其具有亲水性和亲脂性两者。两亲性分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,并且包含例如嵌段共聚物(Gonzalez-Perez等人,《朗缪尔(Langmuir)》,2009,25,10447-10450)。嵌段共聚物是聚合在一起的两个或更多个单体亚基产生单一聚合物链的聚合材料。嵌段共聚物通常具有通过每个单体亚基贡献的性质。然而,嵌段共聚物可以具有由个别子单元形成的聚合物不拥有的独特特性。嵌段共聚物可进行工程改造,使得单体子单元中的一个在水性介质中是疏水性的(即亲脂性),而其它子单元是亲水性的。在此情况下,嵌段共聚物可拥有两亲特性,并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段的(其由两个单体子单元组成),但也可以由超过两个的单体子单元来构建,形成表现为两亲物的更复杂的排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选地是三嵌段共聚物膜。
古细菌双极性四醚脂质是天然存在的脂质,其被构建成使得脂质形成单层膜。这些脂质一般发现于在苛刻生物环境中存活的嗜极生物、嗜热生物、嗜盐生物和嗜酸生物中。认为其稳定性是源于最终双层的融合性质。直接了当的做法是,通过产生具有一般基序亲水性-疏水性-亲水性的三嵌段聚合物来构建模拟这些生物实体的嵌段共聚物材料。这种材料可以形成表现类似于脂质双层并且涵盖从囊泡到层状膜的一系列阶段表现的单体膜。由这些三嵌段共聚物形成的膜在生物脂质膜上保持若干优势。因为合成三嵌段共聚物,所以可小心地控制准确的构建,以提供形成膜和与孔和其它蛋白质相互作用所需的正确链长度和特性。
还可以由不分类为脂质亚材料的子单元来构建嵌段共聚物;例如可由硅氧烷或其它非基于烃的单体来制成疏水性聚合物。嵌段共聚物的亲水性亚区段还可以具备低蛋白质结合特性,这允许产生当暴露于原始生物样品时具有高度抗性的膜。此头基单元还可来源于非经典的脂质头基。
与生物脂质膜进行比较,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高许多的操作温度或pH范围。嵌段共聚物的合成性质提供定制用于广泛范围应用的基于聚合物的膜的平台。
在一些实施例中,膜是国际申请第WO2014/064443号或第WO2014/064444号中所公开的膜中的一个膜。
两亲分子可以进行化学修饰或官能化,以便于偶联多核苷酸。两亲性层可以是单层或双层。两亲性层通常是平面的。两亲性层可以是弯曲的。两亲性层可以是支撑式的。
两亲膜通常是天然可移动的,基本上以大约10-8cm s-1的脂质扩散速率充当二维液体。这意味着孔和偶联的多核苷酸可以通常在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并且用作一系列实验研究的极佳平台。例如,脂质双层可以用于通过单通道记录对膜蛋白进行活体外研究。可替代地,脂质双层可以用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。合适的脂质双层包含但不限于平面脂质双层、支持双层或脂质体。脂质双层优选地是平坦脂质双层。合适脂质双层公开于WO 2008/102121、WO 2009/077734和WO 2006/100484中。
用于形成脂质双层的方法在本领域中是已知的。脂质双层通常通过Montal和Mueller的方法(《美国国家科学学院院报(Proc.Natl.Acad.Sci.USA.)》,1972;69:3561-3566)来形成,其中脂质单层携载于通过开孔两侧的水溶液/空气界面上,所述开孔垂直于所述界面。通常通过首先将脂质溶解在有机溶剂中,并且然后使在开孔两侧上的水溶液的表面上蒸发一滴溶剂,来将脂质添加到水性电解质溶液的表面。一旦有机溶剂已蒸发,那么开孔两侧上的溶液/空气界面来回物理地移动通过开孔,直到形成双层为止。可以跨膜中的开孔或跨凹槽中的开口形成平面脂质双层。
Montal和Mueller的方法是常用的,这是因为是节约成本的,且是形成适合于蛋白孔插入的良好品质脂质双层的相对直接了当的方法。双层形成的其它常见方法包含脂质体双层的尖端浸没、双层涂刷和贴片夹持。
尖端浸没双层形成需要使开孔表面(例如移液管尖端)接触到携载脂质单层的测试溶液的表面。同样,通过将溶解于有机溶剂中的一滴脂质在溶液表面处蒸发来首先在溶液/空气界面处产生脂质单层。接着,通过朗缪尔-沙佛(Langmuir-Schaefer)过程形成双层,并且需要机械自动以使开孔相对于溶液表面移动。
对于涂刷的双层,将溶解于有机溶剂中的一滴脂质直接应用于开孔,所述开孔浸没在水性测试溶液中。使用笔刷或等效物,使脂质溶液稀薄地扩散在开孔内。溶剂的稀化使得形成脂质双层。然而,从双层完全去除溶剂是非常困难的,并且因此通过这种方法形成的双层较不稳定且更倾向于在电化学测量期间具有噪声。
贴片夹持是在生物细胞膜研究中常用的。通过抽汲将细胞膜夹持到移液管的末端,并且膜贴片变为连接在开孔内。所述方法适用于通过夹持接着爆裂以离开密封在移液管的开孔内的脂质双层的脂质体来产生脂质双层。所述方法需要稳定的、巨大的且单层脂质体和在具有玻璃表面的材料中制造小开孔。
脂质体可以通过超声处理、挤出或Mozafari方法(Colas等人(2007)《微米(Micron)》38:841-847)来形成。
在一些实施例中,如国际申请第WO 2009/077734号中所描述形成脂质双层。在此方法中有利的是,由干燥脂质形成脂质双层。在一最优选实施例中,跨越开口形成脂质双层,如WO2009/077734中所描述。
由脂质的两个相对层形成脂质双层。两个脂质层被布置成使得其疏水尾部基团面朝彼此,形成疏水性的内部。脂质的亲水性头基朝外面向双层每侧上的水性环境。双层可以存在于多种脂质阶段中,所述脂质阶段包含但不限于液体无序阶段(液体片层)、液体有序阶段、固体有序阶段(片层凝胶阶段、交错结合的凝胶阶段)和平面双层晶体(片层亚凝胶阶段、片层结晶阶段)。
可以使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得脂质双层具有所需的特性,例如表面电荷、支持膜蛋白的能力、充填密度或所形成的机械特性。脂质组合物可以包括一种或多种不同脂质。例如,脂质组合物可以含有至多100种脂质。脂质组合物优选地含有1到10种脂质。脂质组合物可以包括天然存在的脂质和/或人工脂质。
脂质通常包括头基、界面部分和可相同或不同的两个疏水尾部基团。合适的头基包含(但不限于):中性头基,例如二酰基甘油酯(DG)和脑酰胺(CM);两性离子头基,如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电荷的头基,如磷脂酰甘油(PG);磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸(PA)和心磷脂(CA);以及带正电荷的头基,如三甲基铵丙烷(TAP)。合适界面部分包含但不限于天然存在的界面部分,例如基于甘油或基于脑酰胺的部分。合适的疏水尾部基团包含但不限于:饱和烃链,例如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,如油酸(顺-9-十八烷酸);和支链烃链,如植烷酰基。链的长度和不饱和烃链中的双键的位置和数量可以变化。链的长度和支链烃链中的支链(如甲基)的位置和数量可以变化。疏水尾部基团可以作为醚或酯连接到界面部分。脂质可以是分枝菌酸。
脂质还可以进行化学修饰。脂质的头基或尾部基团可以进行化学修饰。头基已进行化学修饰的合适的脂质包含但不限于:经PEG修饰的脂质,如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化PEG脂质,如1,2-二硬脂酰基-sn-甘油-3磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];以及针对缀合修饰的脂质,如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-(琥珀酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-(生物素基)。尾基已进行化学修饰的合适的脂质包含但不限于:可聚合脂质,如1,2-双(10,12-二十三碳二炔基)-sn-甘油-3-磷酸胆碱;氟化脂质,如1-棕榈酰基-2-(16-氟棕榈酰基)-sn-甘油-3-磷酸胆碱;氘化脂质,如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;以及醚连接的脂质,如1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱。脂质可以进行化学修饰或官能化,以便于偶联多核苷酸。
两亲性层,例如脂质组合物,通常包括将影响层的特性的一种或多种添加剂。合适的添加剂包含但不限于:脂肪酸,如棕榈酸、肉豆蔻酸和油酸;脂肪醇,如棕榈醇、肉豆蔻醇和油醇;甾醇,如胆固醇、麦角固醇、羊毛甾醇、谷甾醇和豆甾醇;溶血磷脂,如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;以及神经酰胺。
在另一个实施例中,膜包括固态层。固态层可以由有机材料和无机材料两者形成,所述材料包含但不限于:微电子材料、绝缘材料(如Si3N4、A12O3和SiO)、有机和无机聚合物(如聚酰胺)、塑料(如)或弹性体(如双组分加成固化硅橡胶)以及玻璃。固态层可以由石墨烯形成。合适的石墨烯层公开于WO 2009/035647中。如果膜包括固态层,则孔通常存在于两亲膜或层中,所述两亲膜或层包含在固态层内,例如在固态层内的孔洞、孔、间隙、通道、沟槽或缝隙内。技术人员可以制备合适的固态/两亲性杂交系统。合适的系统公开于WO2009/020682和WO 2012/005857中。可以使用以上所论述的两亲膜或层中的任一个。
通常使用以下来实行本文公开的方法:(i)包括孔的人工两亲层,(ii)包括孔的分离的天然存在的脂质双层,或(iii)其中插入孔的细胞。通常使用人工两亲层(如人工三嵌段共聚物层)来执行方法。所述层可以包括其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。下文论述了合适的设备和条件。所公开的方法通常在体外进行。
条件
如上文所解释的,所公开的方法包括在其中包括多肽的缀合物相对于纳米孔移动时表征所述多肽。
表征方法可以使用适合于研究其中将孔插入到膜中的膜/孔系统的任何设备来进行。可以使用适合于跨膜孔感测的任何设备来进行表征方法。例如,所述设备可以包括包含水溶液的室和将室分成两段的屏障。屏障通常具有开孔,在开孔中形成含有孔的膜。本文描述了跨膜孔。
可以使用在WO 2008/102120、WO 2010/122293或WO 00/28312中描述的设备进行表征方法。
表征方法可以涉及通常通过测量电流来测量流经孔的离子电流。可替代地,可以光学测量通过孔的离子流,如Heron等人:《美国化学学会期刊》9Vol.131,No.5,2009中所公开的。因此,设备还可以包括能够施加电位并且测量跨膜和孔的电信号的电路。可以使用膜片钳或电压钳来进行表征方法。表征方法优选地涉及电压钳的使用。
表征方法可以在基于硅的孔阵列上进行,其中每个阵列包括128个、256个、512个、1024个、2000个、3000个、4000个、6000个、10000个、12000个、15000个或更多个孔。
表征方法可以涉及测量流过孔的电流。所述方法通常在跨膜和孔施加电压的情况下进行。所使用的电压通常为+2V到-2V,通常为-400mV到+400mV。所使用的电压优选地处于具有下限和上限的范围内,所述下限选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV,并且所述上限独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV。所使用的电压更优选地处于100mV到240mV的范围内,并且最优选地处于120mV到220mV的范围内。通过使用增加的施加电位,可以通过孔增加不同核苷酸之间的区分度。
通常在存在任何电荷载流子的情况下进行表征方法,所述电荷载流子如金属盐,例如碱金属盐;卤盐,例如氯化物盐,如碱金属氯化物盐。电荷载体可以包含离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑。在上文讨论的示例性设备中,盐存在于室内的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)或氯化铯(CsCl)。KCl是优选的。盐可以是碱土金属盐,如氯化钙(CaCl2)。盐浓度可以处于饱和状态。盐浓度可以是3M或更低,并且通常为0.1M到2.5M、0.3M到1.9M、0.5M到1.8M、0.7M到1.7M、0.9M到1.6M、或1M到1.4M。盐浓度优选地为150mM到1M。优选地使用至少0.3M的盐浓度进行表征方法,如至少0.4M,至少0.5M,至少0.6M,至少0.8M,至少1.0M,至少1.5M,至少2.0M,至少2.5M或至少3.0M。高盐浓度提供高信噪比,并允许在正常电流波动的背景下识别指示结合/无结合的电流。
通常在存在缓冲液的情况下进行表征方法。在上文讨论的示例性设备中,缓冲液存在于腔室中的水溶液中。可以使用任何合适的缓冲液。通常,缓冲液是HEPES。另一种合适的缓冲液是Tris-HCl缓冲液。通常在以下的pH下进行所述方法:4.0到12.0、4.5到10.0、5.0到9.0、5.5到8.8、6.0到8.7或7.0到8.8或7.5到8.5。使用的pH优选地是约7.5。
可以在以下温度下进行表征方法:0℃到100℃、15℃到95℃、16℃到90℃、17℃到85℃、18℃到80℃、19℃到70℃或20℃到60℃。通常在室温下进行表征方法。任选地在支持酶功能的温度下进行表征方法,如在约37℃下进行。
经修饰的纳米孔
还提供了一种纳米孔,其包括收缩区,其中所述纳米孔被修饰以增加所述收缩区与和所述纳米孔接触的多核苷酸处理蛋白之间的距离。纳米孔可以如本文所描述。可以如本文所描述修饰纳米孔。
系统
还提供了一种系统,所述系统包括
-纳米孔,所述纳米孔包括收缩区;
-缀合物,所述缀合物包括与多核苷酸缀合的多肽;以及
-多核苷酸处理蛋白;
其中
i)所述纳米孔被修饰以在所述多核苷酸处理酶与所述纳米孔接触时,增加所述收缩区与所述多核苷酸处理蛋白的活性位点之间的距离;和/或
ii)所述系统进一步包括安置于所述纳米孔与所述多核苷酸处理蛋白之间的一个或多个置换体单元,由此延伸所述纳米孔与所述多核苷酸处理蛋白的活性位点之间的距离。
在一些实施例中,所述纳米孔、所述缀合物和/或所述多核苷酸处理蛋白以及任选地所述一个或多个置换体单元,如果存在的话,如本文所描述的。
试剂盒
还提供了一种试剂盒,所述试剂盒包括:
-纳米孔,所述纳米孔包括收缩区;
-多核苷酸,所述多核苷酸包括用于与靶多核苷酸缀合的反应性官能团;以及
-多核苷酸处理蛋白。
在一些实施例中,所述纳米孔被修饰以在所述多核苷酸处理酶与所述纳米孔接触时,增加所述收缩区与所述多核苷酸处理蛋白之间的距离。
在一些实施例中,所述试剂盒进一步包括用于延伸所述纳米孔与所述多核苷酸处理蛋白的活性位点之间的距离的一个或多个置换体单元。
在一些实施例中,所述纳米孔、所述多核苷酸和/或所述多核苷酸处理蛋白以及任选地所述一个或多个置换体单元,如果存在的话,如本文所描述。
所述试剂盒可以被配置成与本文也提供的算法一起使用,所述算法被适配成在计算机系统上运行。所述算法可以被适配成检测多肽所特有的信息(例如,多肽序列所特有的信息和/或多肽是否被修饰),并且选择性地处理当包括与多核苷酸缀合的多肽的缀合物相对于纳米孔移动时获得的信号。还提供了包括计算装置的系统,所述计算装置被配置成检测多肽所特有的信息(例如,多肽序列所特有的信息和/或多肽是否被修饰),并且选择性地处理当包括与多核苷酸缀合的多肽的缀合物相对于纳米孔移动时获得的信号。在一些实施例中,所述系统包括用于从多肽的检测接收数据的接收装置、用于处理当缀合物相对于纳米孔移动时获得的信号的处理装置以及用于输出由此获得的表征信息的输出装置。
应当理解,虽然本文已经针对根据本发明的方法讨论了特定实施例、特定构造以及材料和/或分子,但是可以在不脱离本发明的范围和精神的情况下在形式和细节上进行各种改变或修改。提供前述实施例和以下实例仅用于说明,并且不应被认为限制本申请。本申请仅由权利要求书限制。
实例
实例1
此实例展示了缀合物的受控易位,所述缀合物包括侧接两片多核苷酸的多肽;dsDNA Y衔接子(DNA1)和dsDNA尾(DNA2)。纳米孔的顺式侧处的多核苷酸处理蛋白通过首先展开DNA1并在ssDNA上转移5'-3',然后滑过多肽部分以最终展开DNA2片段来控制缀合物移动。随着此构建体从纳米孔的顺式侧移动到反式侧,从而穿过RED,多肽部分可以在电流对时间图上可视化,使得能够进行表征。
通过粘接DNA寡核苷酸(SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13)制备Y衔接子。如WO 2014/013260中所描述的,将DNA马达(Dda解旋酶)装载在衔接子上并在其上关闭。随后的材料经HPLC纯化。Y衔接子含有30个C3前导序列部分,便于由纳米孔捕获,以及侧臂用于拴系到膜上。通过粘接DNA寡核苷酸(SEQ ID NO:14、SEQ ID NO:16)来制备DNA尾。
在此实施例中,模型多肽分析物(SEQ ID NO:20、21、22)是通过在N末端预先合成的叠氮化物部分获得的,并且直接在C端之后使用与肽骨架一致的乙二胺间隔子获得。然后通过叠氮化物与BCN(双环[6.1.0]壬炔)部分之间的无铜点击化学反应将每种分析物与Y衔接子和DNA尾缀合。图4A示出了所得构建体的示意图。使用Agencourt AMPure XP(贝克曼库尔特公司(Beckman Coulter))珠粒纯化样品,并且使用来自牛津纳米孔技术公司(OxfordNanopore Technologies)测序试剂盒(SQK-LSK109)的LNB进行两次洗涤。将缀合的底物洗脱到10mM Tris-Cl、50mM NaCl(pH 8.0)中。
使用牛津纳米孔技术公司的MinION Mk1b和具有MspA纳米孔的定制MinION流通池进行电测量。用含有50nM DNA系链和缺乏ATP的测序缓冲液的系链混合物冲洗流通池。最初添加800μL系链混合物5分钟,然后在SpotON端口打开的情况下,再将200μL混合物流过系统。在缺乏ATP的测序缓冲液和牛津纳米孔技术公司测序试剂盒(SQK-LSK109)的LB中制备浓度为0.5nM的DNA肽构建体,产生“测序混合物”。通过SpotON流通池端口将75μL测序混合物添加到MinION流通池中。将混合物在流通池上温育5-10分钟以允许构建体拴系和随后被纳米孔捕获。在没有ATP的情况下,DNA马达在Y衔接子的间隔子区域保持停滞,缀合物被纳米孔捕获,但没有易位。温育后,添加200μL含有ATP的测序缓冲液;在存在ATP的情况下,被捕获的DNA-肽缀合物通过解旋酶移动穿过纳米孔,从而产生可重现的电流足迹。
180mV的标准测序脚本运行30分钟到1小时,并且每1分钟进行一次静态翻转以去除扩展型纳米孔块。使用MinKNOW软件(牛津纳米孔技术公司)在批量FAST5文件中收集原始数据。
在图9中可以看到与DNA Y衔接子和尾缀合的模型肽之一(SEQ ID NO:20)的示例性电流对时间迹线。Y衔接子部分和dsDNA尾可以与“曲线”(迹线)的肽部分分离,使得能够进行肽的表征。
通过每秒观察到的多个易位事件实现了高通量。图10中示出了与图9中使用的相同构建体(即含有SEQ ID NO:20的肽区域)的示出了多个捕获和易位事件的示例电流对时间迹线。
如上文所描述进行其它缀合的多核苷酸-多肽构建体的表征。图11到13示出了可重现的电流对时间迹线,使得能够表征并入肽区域的构建体,所述肽区域含有带正电荷的氨基酸(SEQ ID NO:21;图11);芳香族氨基酸(SEQ ID NO:22,图12)和带负电荷的氨基酸(SEQ ID NO:20,图13)。
为了便于参考,使用SEQ ID NO:22的肽获得的构建体的示意性结构如图14所示。
实例2
此实例证明了所公开的方法在表征从未预先合成以包含连接基团的肽获得的多核苷酸-多肽构建体中的效用。
在此实例中,Y衔接子与实例1中的相同,并且通过粘接DNA寡核苷酸(SEQ ID NO:15、SEQ ID NO:16)制备dsDNA尾。使用实例1中建立的方案,在来自牛津纳米孔技术公司的MinION Mk1b和具有MspA纳米孔的定制MinION流通池上进行数据收集。
此实例中使用的肽分析物几乎与实例1中使用的模型肽(GGSGDDSGSG,实例1的SEQID NO:20;实例2的SEQ ID NO:23)几乎相同,但缺乏用于多核苷酸衔接子和尾的点击化学缀合的预合成叠氮化物分子。包含另外的C末端半胱氨酸以使得能够进行马来酰亚胺化学。肽的N末端用四嗪-NHS酯化合物(BroadPharm公司,产品代码:BP-22946)官能化。用氨基官能化磁性颗粒(西格玛奥德里奇公司(Sigma Aldrich),产品代码:53572)去除未缀合的四嗪。
然后将肽与DNA尾(SEQ ID NO:15、SEQ ID NO:16)在4℃下温育过夜,以促进四嗪与TCO(反式环辛烯)之间的点击反应。温育后,将C末端肽半胱氨酸之间可能的二硫键在室温下用5mM DTT还原30分钟,并使用Agencourt AMPure XP珠粒(贝克曼库尔特公司)纯化肽-DNA缀合物以去除未反应的肽和DTT。然后将暴露的半胱氨酸与叠氮基-PEG3-马来酰亚胺(BroadPharm公司,产品代码:BP-22468)反应。用Agencourt AMPure XP珠粒去除多余的马来酰亚胺连接子,并通过BCN与叠氮化物之间的点击化学在4℃下使构建体与Y衔接子反应过夜。使用Agencourt AMPure XP珠粒纯化肽C末端与Y衔接子以及N末端与DNA尾之间的缀合形成的构建体,以将完整构建体与肽-DNA尾分离。
如实例1所述评估最终构建体,并且示例性电流迹线呈现在图15中。如可以看到的,肽的表征是可能的,而不需要连接点的预先合成。
实例3
此实例比较了在表征21-氨基酸肽和10-氨基酸肽方面所公开的方法。
根据实例1中所描述的方法制备和分析21-氨基酸肽的多核苷酸-多肽缀合物。将用21-氨基酸构建体获得的电流对时间迹线与使用来自实例2的10-氨基酸构建体获得的迹线进行比较。使用的肽序列为GDDDGSASGDDDGSASGDDDG(21aa;SEQ ID NO:24)和GGSGDDSGSG(10aa;SEQ ID NO:20)。
示出10-氨基酸肽和21-氨基酸肽的多核苷酸-肽缀合物易位的电流对时间迹线的数据在图16中示出。放置在同一时间尺度上的两条迹线强调21-氨基酸多肽的当前部分大约是10-氨基酸多肽的两倍长。
因此,此实例证实所公开的方法可以用于表征不同长度和延伸长度的多肽。
序列表说明
SEQ ID NO:1示出了来自大肠杆菌的(六组氨酸标记的)外切核酸酶I(EcoExo I)的氨基酸序列。
SEQ ID NO:2示出了来自大肠杆菌的外切核酸酶III酶的氨基酸序列。
SEQ ID NO:3示出了来自嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。
SEQ ID NO:4示出了噬菌体λ外切核酸酶的氨基酸序列。所述序列是组装成三聚体的三个完全相同亚基中的之一。(http://www.neb.com/nebecomm/products/productM0262.asp)。
SEQ ID NO:5示出了来自枯草芽孢杆菌(Bacillus subtilis)的Phi29 DNA聚合酶的氨基酸序列。
SEQ ID NO:6示出了Trwc Cba(深洋柠檬色微菌(Citromicrobiumbathyomarinum))解旋酶的氨基酸序列。
SEQ ID NO:7示出了Hel308 Mbu(布氏拟甲烷球菌(Methanococcoidesburtonii))解旋酶的氨基酸序列。
SEQ ID NO:8示出了来自肠杆菌噬菌体T4的Dda解旋酶1993的氨基酸序列。
SEQ ID NO:11示出了用于产生如实例1中所描述的Y衔接子的第一多核苷酸链的序列(DNA1-顶部,具有C3[(OC3H6OPO3)]前导序列,3'BCN点击连接,以及酶停滞化学;8=iSp18[(OCH2CH2)6OPO3])。
SEQ ID NO:12示出了用于产生如实例1中所描述的Y衔接子的第二多核苷酸链的序列(DNA1-后部具有用于系链的侧臂)。
SEQ ID NO:13示出了用于产生如实例1中所描述的Y衔接子的第三多核苷酸链的序列(DNA1-底部)。
SEQ ID NO:14示出了用于产生如实例1中所描述的dsDNA尾的第一多核苷酸链的序列(DNA2-顶部链,5'BCN点击化学)。
SEQ ID NO:15示出了用于产生如实例1中所描述的dsDNA尾的第二多核苷酸链的序列(DNA2-顶部链,5'TCO(正交点击化学))。
SEQ ID NO:16示出了用于产生如实例2中所描述的dsDNA尾的多核苷酸链的序列(DNA2-底部链,无侧臂)。
SEQ ID NO:20示出了用于产生如实例1中所描述的第一多核苷酸-多肽构建体的第一肽片段的氨基酸序列。
SEQ ID NO:21示出了用于产生如实例1中所描述的第二多核苷酸-多肽构建体的第二肽片段的氨基酸序列。
SEQ ID NO:22示出了用于产生如实例1中所描述的第三多核苷酸-多肽构建体的第三肽片段的氨基酸序列。
SEQ ID NO:23示出了用于产生如实例2中所描述的多核苷酸-多肽构建体的肽片段的氨基酸序列。
SEQ ID NO:24示出了用于产生如实例3中所描述的多核苷酸-多肽构建体的21氨基酸肽片段的氨基酸序列。
序列表
SEQ ID NO:1-来自大肠杆菌的外切核酸酶I
SEQ ID NO:2-来自大肠杆菌的外切核酸酶III酶
SEQ ID NO:3-来自嗜热栖热菌的RecJ酶
SEQ ID NO:4-噬菌体λ外切核酸酶
SEQ ID NO:5-Phi29 DNA聚合酶
SEQ ID NO:6-Trwc Cba解旋酶
SEQ ID NO:7-Hel308 Mbu解旋酶
SEQ ID NO:8-Dda解旋酶
SEQ ID NO:11
SEQ ID NO:12
CGACGTACGCATTCGACGATTGCTTTGAGGCGAGCGGTCAA
SEQ ID NO:13
GCAATACGTAACTGAACGAAGT/iBNA-A//iBNA-meC//iBNA-A//iBNAT//3BNA-T/SEQ IDNO:14
BCN-AATGTACTTCGTTCAGTTACGTATTGCTGCTTGGGTGTTTAACC
SEQ ID NO:15
TCO-AATGTACTTCGTTCAGTTACGTATTGCTGCTTGGGTGTTTAACC
SEQ ID NO:16
GGTTAAACACCCAAGCAGCAATACGTAACTGAACGAAGTACATT
SEQ ID NO:20
X-GGSGDDSGSG-ed-X
(X=叠氮基乙酰基;ed=乙二胺)
SEQ ID NO:21
X-GGSGRRSGSG-ed-X
(X=叠氮基乙酰基;ed=乙二胺)
SEQ ID NO:22
X-GGSGYYSGSG-ed-X
(X=叠氮基乙酰基;ed=乙二胺)
SEQ ID NO:23
GGSGDDSGSC
SEQ ID NO:24
GDDDGSASGDDDGSASGDDDG
Claims (21)
1.一种表征靶多肽的方法,其包括:
-将所述靶多肽与多核苷酸缀合以形成多核苷酸-多肽缀合物;
-使所述缀合物与能够控制所述多核苷酸相对于纳米孔移动的多核苷酸处理蛋白接触;以及
-当所述缀合物相对于所述纳米孔移动时,进行表征所述多肽的一个或多个测量,
由此表征所述多肽;
其中所述缀合物包括促进所述缀合物穿过所述纳米孔的前导序列;并且
其中所述纳米孔是跨膜蛋白孔。
2.根据权利要求1所述的方法,其中所述前导序列包括多核苷酸或带电荷聚合物。
3.根据权利要求1所述的方法,其中当与所述多核苷酸处理蛋白的活性位点接触的所述缀合物的部分包括多肽时,所述多核苷酸处理蛋白能够保持与所述缀合物结合。
4.根据权利要求1所述的方法,其中所述多核苷酸处理蛋白被修饰以防止当所述多核苷酸处理蛋白接触包括多肽的所述缀合物的一部分时,所述多核苷酸处理蛋白与所述缀合物脱离。
5.根据权利要求1所述的方法,其中所述多核苷酸处理蛋白被修饰以完全或部分封闭存在于未修饰蛋白的至少一种构象状态中的开口,多核苷酸链能够通过所述开口解结合。
6.根据权利要求1所述的方法,其中所述多核苷酸处理蛋白是解旋酶。
7.根据权利要求1所述的方法,其中所述缀合物包括多个多肽部分和/或多个多核苷酸部分。
8.根据权利要求1所述的方法,其中所述多肽的长度为2到50个肽单元,和/或
其中所述多核苷酸的长度为10到1000个核苷酸。
9.根据权利要求1所述的方法,其中一个或多个衔接子与所述缀合物中的所述多核苷酸连接。
10.根据权利要求1所述的方法,其中所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;并且
-m是0或1;
并且其中所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触。
11.根据权利要求1所述的方法,其中:
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的顺式侧向所述纳米孔的反式侧移动;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的反式侧向所述纳米孔的顺式侧移动。
12.根据权利要求1所述的方法,其中所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;并且
-m是0或1;
并且其中所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触;并且
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸部分(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸部分(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。
13.根据权利要求12所述的方法,其中所述缀合物包括形式为L-P1-N-{P-N}n-Pm的一种或多种结构,其中:
-n是正整数;
-L是前导序列,其中L任选地是N部分;
-可相同或不同的每个P是多肽;
-可相同或不同的每个N包括多核苷酸;并且
-m是0或1;
并且其中所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使多肽(P1)与所述纳米孔接触;并且
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制每个多核苷酸(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧顺序地移动,由此控制每个多肽(P)顺序地移动穿过所述纳米孔;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制每个多核苷酸(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧顺序地移动,由此控制每个多肽(P)顺序地移动穿过所述纳米孔。
14.根据权利要求1所述的方法,其中:
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的反式侧向所述纳米孔的顺式侧移动;或者
ii)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述多核苷酸处理蛋白控制所述缀合物从所述纳米孔的顺式侧向所述纳米孔的反式侧移动。
15.根据权利要求1所述的方法,其中所述缀合物包括形式为L-{P-N}-Pm的一种或多种结构,其中:
-L是前导序列,其中L任选地是N部分;
-P是多肽;
-N包括多核苷酸;
-m是0或1;
并且其中所述方法包括使所述前导序列(L)穿过所述纳米孔,由此使所述多肽(P)与所述纳米孔接触;并且
i)所述多核苷酸处理蛋白位于所述纳米孔的顺式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸(N)从所述纳米孔的反式侧向所述纳米孔的顺式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔;或者
i)所述多核苷酸处理蛋白位于所述纳米孔的反式侧上,并且所述方法包括允许所述多核苷酸处理蛋白控制所述多核苷酸(N)从所述纳米孔的顺式侧向所述纳米孔的反式侧移动,由此控制所述多肽(P)移动穿过所述纳米孔。
16.根据权利要求1所述的方法,其中所述一个或多个测量是选自以下的所述多肽的一个或多个特性的表征:(i)所述多肽的长度;(ii)所述多肽的身份;(iii)所述多肽的序列;(iv)所述多肽的二级结构;以及(v)所述多肽是否被修饰。
17.根据权利要求1所述的方法,其中当所述缀合物相对于所述纳米孔移动时,进行表征所述多肽的一个或多个测量的步骤包括测量流经所述纳米孔的离子电流。
18.根据权利要求1所述的方法,其中所述跨膜蛋白孔是源自或基于Msp、α-溶血素、CsgG、ClyA、Sp1或FraC的跨膜蛋白孔。
19.根据权利要求18所述的方法,(i)其中所述跨膜蛋白孔是源自MspA的跨膜蛋白孔;或(ii)其中所述跨膜蛋白孔是源自CsgG的跨膜蛋白孔。
20.根据权利要求1所述的方法,其中所述纳米孔包括收缩区。
21.一种试剂盒,其包括:
-纳米孔,所述纳米孔包括收缩区,其中所述纳米孔是跨膜蛋白孔;
-多核苷酸,所述多核苷酸包括用于与靶多肽缀合的反应性官能团;以及
-多核苷酸处理蛋白,所述多核苷酸处理蛋白能够控制所述多核苷酸相对于所述纳米孔的移动。
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB1917599.1 | 2019-12-02 | ||
| GBGB1917599.1A GB201917599D0 (en) | 2019-12-02 | 2019-12-02 | Method |
| GBGB2015479.5A GB202015479D0 (en) | 2020-09-30 | 2020-09-30 | Method |
| GB2015479.5 | 2020-09-30 | ||
| CN202080083417.2A CN114761799A (zh) | 2019-12-02 | 2020-12-01 | 使用纳米孔表征靶多肽的方法 |
| PCT/GB2020/053082 WO2021111125A1 (en) | 2019-12-02 | 2020-12-01 | Method of characterising a target polypeptide using a nanopore |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080083417.2A Division CN114761799A (zh) | 2019-12-02 | 2020-12-01 | 使用纳米孔表征靶多肽的方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN118011004A CN118011004A (zh) | 2024-05-10 |
| CN118011004B true CN118011004B (zh) | 2025-12-30 |
Family
ID=73854830
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080083417.2A Pending CN114761799A (zh) | 2019-12-02 | 2020-12-01 | 使用纳米孔表征靶多肽的方法 |
| CN202410066918.XA Active CN118011004B (zh) | 2019-12-02 | 2020-12-01 | 使用纳米孔表征靶多肽的方法 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080083417.2A Pending CN114761799A (zh) | 2019-12-02 | 2020-12-01 | 使用纳米孔表征靶多肽的方法 |
Country Status (8)
| Country | Link |
|---|---|
| US (2) | US20230024319A1 (zh) |
| EP (3) | EP4070092B1 (zh) |
| JP (1) | JP2023503514A (zh) |
| KR (1) | KR20220110213A (zh) |
| CN (2) | CN114761799A (zh) |
| AU (1) | AU2020395930A1 (zh) |
| CA (1) | CA3159307A1 (zh) |
| WO (1) | WO2021111125A1 (zh) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12105079B2 (en) | 2018-09-11 | 2024-10-01 | Rijksuniversiteit Groningen | Biological nanopores having tunable pore diameters and uses thereof as analytical tools |
| NL2024579B1 (en) * | 2019-12-24 | 2021-09-06 | Univ Delft Tech | Protein and peptide fingerprinting and sequencing by nanopore translocation of peptide-oligonucleotide complexes |
| JP2023530155A (ja) * | 2020-06-18 | 2023-07-13 | オックスフォード ナノポール テクノロジーズ ピーエルシー | ナノポアを通って移動するポリヌクレオチドを特徴付ける方法 |
| CN113930406B (zh) * | 2021-12-17 | 2022-04-08 | 北京齐碳科技有限公司 | 一种Pif1-like解旋酶及其应用 |
| US11994508B2 (en) * | 2020-12-23 | 2024-05-28 | Northeastern University | Method and system for linearization and translocation of single protein molecules through nanopores |
| WO2023009896A2 (en) * | 2021-07-30 | 2023-02-02 | President And Fellows Of Harvard College | Single-molecule protein identification via stretching |
| GB202112235D0 (en) | 2021-08-26 | 2021-10-13 | Oxford Nanopore Tech Ltd | Nanopore |
| GB202118906D0 (en) * | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
| GB202118908D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
| WO2024030919A1 (en) | 2022-08-02 | 2024-02-08 | Glyphic Biotechnologies, Inc. | Protein sequencing via coupling of polymerizable molecules |
| WO2024091124A1 (en) | 2022-10-28 | 2024-05-02 | Rijksuniversiteit Groningen | Nanopore-based analysis of proteins |
| GB202216162D0 (en) | 2022-10-31 | 2022-12-14 | Oxford Nanopore Tech Plc | Method |
| CN120344850A (zh) * | 2022-12-28 | 2025-07-18 | 深圳华大生命科学研究院 | 纳米孔传感器及其在测序中的应用 |
| WO2024222911A1 (zh) * | 2023-04-28 | 2024-10-31 | 清华大学 | 一种被修饰的多肽、多肽复合物、多肽混合物及控制多肽移位速度或表征多肽的系统和方法 |
| GB202307494D0 (en) | 2023-05-18 | 2023-07-05 | Oxford Nanopore Tech Ltd | Nanopore sequencing and preparation modular instrument |
| WO2025010736A1 (zh) * | 2023-07-13 | 2025-01-16 | 深圳华大生命科学研究院 | 核酸多肽复合物及其在肽测序中的应用 |
| GB202317028D0 (en) | 2023-11-06 | 2023-12-20 | Oxford Nanopore Tech Ltd | Method |
| WO2025129587A1 (zh) * | 2023-12-21 | 2025-06-26 | 深圳华大生命科学研究院 | 核酸-多肽-核酸三元复合物及其在多肽纳米孔测序中的应用 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105765387A (zh) * | 2013-09-23 | 2016-07-13 | 伊希斯创新有限公司 | 一种方法 |
| CN109072295A (zh) * | 2015-12-08 | 2018-12-21 | 鲁汶大学研究与发展中心 | 修饰的纳米孔,包含其的组合物及其应用 |
Family Cites Families (35)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
| US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
| GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
| NZ579083A (en) | 2007-02-20 | 2012-07-27 | Oxford Nanopore Tech Ltd | Lipid bilayer sensor system |
| EP3543357A1 (en) | 2007-05-08 | 2019-09-25 | Trustees of Boston University | Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof |
| EP3540436B1 (en) | 2007-09-12 | 2023-11-01 | President And Fellows Of Harvard College | High-resolution molecular sensor |
| GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
| CN102439043A (zh) | 2009-01-30 | 2012-05-02 | 牛津纳米孔技术有限公司 | 杂交连接物 |
| GB0901588D0 (en) | 2009-02-02 | 2009-03-11 | Itis Holdings Plc | Apparatus and methods for providing journey information |
| BRPI1012752B1 (pt) | 2009-04-20 | 2019-06-25 | Oxford Nanopore Technologies Limited | Método e aparelho para detectar uma interação de uma entidade molecular com uma proteína de membrana em uma camada de moléculas anfifílicas |
| CN103154729B (zh) | 2010-06-08 | 2015-01-07 | 哈佛大学校长及研究员协会 | 具有由石墨烯支持的人工脂质膜的纳米孔装置 |
| WO2012107778A2 (en) | 2011-02-11 | 2012-08-16 | Oxford Nanopore Technologies Limited | Mutant pores |
| KR101963918B1 (ko) | 2011-05-27 | 2019-03-29 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 커플링 방법 |
| US10175195B2 (en) * | 2011-07-27 | 2019-01-08 | The Board Of Trustees Of The University Of Illinois | Nanopore sensors for biomolecular characterization |
| EP2987870B1 (en) | 2011-10-21 | 2020-02-19 | Oxford Nanopore Technologies Limited | Method of characterizing a target polynucleotide using a transmembrane pore and molecular motor |
| GB201120910D0 (en) | 2011-12-06 | 2012-01-18 | Cambridge Entpr Ltd | Nanopore functionality control |
| WO2013098561A1 (en) | 2011-12-29 | 2013-07-04 | Oxford Nanopore Technologies Limited | Method for characterising a polynucelotide by using a xpd helicase |
| CA2861808C (en) | 2011-12-29 | 2021-02-23 | Oxford Nanopore Technologies Limited | Enzyme method |
| DK2814939T3 (en) * | 2012-02-16 | 2018-07-30 | Univ California | Nanoporesensor for enzyme-mediated protein translocation |
| CN104350067A (zh) | 2012-04-10 | 2015-02-11 | 牛津纳米孔技术公司 | 突变胞溶素孔 |
| JP6614972B2 (ja) | 2012-07-19 | 2019-12-04 | オックスフォード ナノポール テクノロジーズ リミテッド | 修飾ヘリカーゼ |
| GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
| AU2013336430B2 (en) | 2012-10-26 | 2018-02-15 | Oxford Nanopore Technologies Limited | Droplet interfaces |
| SG11201507138RA (en) | 2013-03-08 | 2015-10-29 | Oxford Nanopore Tech Ltd | Enzyme stalling method |
| WO2015051378A1 (en) * | 2013-10-04 | 2015-04-09 | University Of Washington Through Its Center For Commercialization | Systems and methods for nanopore-based analysis of nucleic acids |
| CA2927726A1 (en) | 2013-10-18 | 2015-04-23 | Oxford Nanopore Technologies Limited | Modified helicases for use in nucleic acid sequencing |
| EP2886663A1 (en) * | 2013-12-19 | 2015-06-24 | Centre National de la Recherche Scientifique (CNRS) | Nanopore sequencing using replicative polymerases and helicases |
| US10337060B2 (en) | 2014-04-04 | 2019-07-02 | Oxford Nanopore Technologies Ltd. | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
| GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
| WO2016034591A2 (en) | 2014-09-01 | 2016-03-10 | Vib Vzw | Mutant pores |
| WO2016053891A1 (en) * | 2014-09-29 | 2016-04-07 | The Regents Of The University Of California | Nanopore sequencing of polynucleotides with multiple passes |
| WO2017149316A1 (en) * | 2016-03-02 | 2017-09-08 | Oxford Nanopore Technologies Limited | Mutant pore |
| GB201821155D0 (en) * | 2018-12-21 | 2019-02-06 | Oxford Nanopore Tech Ltd | Method |
| GB201907244D0 (en) * | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
| CN112147185B (zh) * | 2019-06-29 | 2022-07-01 | 清华大学 | 一种控制多肽穿过纳米孔速度的方法及其应用 |
-
2020
- 2020-12-01 US US17/781,469 patent/US20230024319A1/en active Pending
- 2020-12-01 CN CN202080083417.2A patent/CN114761799A/zh active Pending
- 2020-12-01 JP JP2022531468A patent/JP2023503514A/ja active Pending
- 2020-12-01 WO PCT/GB2020/053082 patent/WO2021111125A1/en not_active Ceased
- 2020-12-01 EP EP20825190.0A patent/EP4070092B1/en active Active
- 2020-12-01 AU AU2020395930A patent/AU2020395930A1/en active Pending
- 2020-12-01 CA CA3159307A patent/CA3159307A1/en active Pending
- 2020-12-01 KR KR1020227019292A patent/KR20220110213A/ko active Pending
- 2020-12-01 EP EP23182542.3A patent/EP4270008B1/en active Active
- 2020-12-01 EP EP25215625.2A patent/EP4671766A2/en active Pending
- 2020-12-01 CN CN202410066918.XA patent/CN118011004B/zh active Active
-
2023
- 2023-07-24 US US18/357,504 patent/US20240044865A1/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105765387A (zh) * | 2013-09-23 | 2016-07-13 | 伊希斯创新有限公司 | 一种方法 |
| CN109072295A (zh) * | 2015-12-08 | 2018-12-21 | 鲁汶大学研究与发展中心 | 修饰的纳米孔,包含其的组合物及其应用 |
Non-Patent Citations (1)
| Title |
|---|
| Paving the way to single-molecule protein sequencing;Laura Restrepo-Pérez等;NATURE NANOTECHNOLOGY;20180930;第13卷;786-796 * |
Also Published As
| Publication number | Publication date |
|---|---|
| CN114761799A (zh) | 2022-07-15 |
| KR20220110213A (ko) | 2022-08-05 |
| US20230024319A1 (en) | 2023-01-26 |
| EP4070092A1 (en) | 2022-10-12 |
| CN118011004A (zh) | 2024-05-10 |
| US20240044865A1 (en) | 2024-02-08 |
| JP2023503514A (ja) | 2023-01-30 |
| EP4270008A2 (en) | 2023-11-01 |
| WO2021111125A1 (en) | 2021-06-10 |
| EP4070092B1 (en) | 2023-08-30 |
| CA3159307A1 (en) | 2021-06-10 |
| EP4270008A3 (en) | 2024-01-10 |
| AU2020395930A1 (en) | 2022-05-26 |
| EP4671766A2 (en) | 2025-12-31 |
| EP4270008B1 (en) | 2026-02-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN118011004B (zh) | 使用纳米孔表征靶多肽的方法 | |
| US12473595B2 (en) | Coupling method | |
| CN118696233A (zh) | 使用纳米孔表征多肽的方法 | |
| CN115004030A (zh) | 方法 | |
| CN114945679B (zh) | 双链测序的方法 | |
| CN120051689A (zh) | 方法 | |
| US20250188533A1 (en) | Nanopore | |
| JP2025500399A (ja) | 方法 | |
| US20250164497A1 (en) | Method of characterising polypeptides using a nanopore | |
| US20230227902A1 (en) | Method of repeatedly moving a double-stranded polynucleotide through a nanopore | |
| WO2025099094A1 (en) | Method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |