TW202526036A

TW202526036A - 準確地平行定量核酸的高靈敏度方法

Info

Publication number: TW202526036A
Application number: TW113140291A
Authority: TW
Inventors: 尤哈–佩卡普西海莫; 塔圖希爾沃寧; 馬努塔米寧; 安東尼科爾基亞科斯基
Original assignee: 芬蘭商基諾米爾健康公司
Priority date: 2023-11-02
Filing date: 2024-10-23
Publication date: 2025-07-01
Also published as: CN119932164A; EP4549581A1; US20250146063A1; KR20250065218A; JP2025077015A

Abstract

本發明所公開實施方式的方面係關於下一代DNA測序方法和用於準確且大規模平行定量例如大量未經純化的樣品材料中的一種或多種核酸靶標的用途。還關於一種方法和試劑盒，其中試劑盒包括用於檢測和定量複雜樣品中的基因靶標的探針。包括用於每個基因靶標的一個或多個靶標特異性核酸探針(左探針和右探針)，以及橋寡核苷酸或橋寡核苷酸複合體。

Description

準確地平行定量核酸的高靈敏度方法

本發明所公開實施方式的方面係關於一種改進的下一代DNA測序方法，用於對一種或多種核酸靶標進行準確且大規模平行定量。更具體地，所公開實施方式的方面關於包括用於檢測和定量複雜DNA池中基因靶標的探針的方法和試劑盒，主要用於基因靶標和變體檢測。所公開實施方式的方面使用用於每種基因靶標的一種或多種靶標特異性核酸探針(左探針和右探針)和橋寡核苷酸或橋寡核苷酸複合體。

隨著研究基因變異技術的進步，在植物和動物中檢測基因變異並不繁瑣。然而，儘管測序成本下降，但檢測和準確定量基因變異(諸如突變)，特別是在訊號較弱的樣品中，目前仍然是繁瑣、費力和昂貴的。各種問題可更準確地表述如下：諸如特異性以在共有背景下檢測基因訊號、靈敏度以檢測弱基因訊號、準確性以準確定量經檢測的訊號、每次檢測的經靶向基因靶標的通量數量、每次測定的成本、當平行測定多個樣品時確定測定成本規模的規模化以及確定從採樣到結果的時間長度的周轉(turn-over)。

目前，液體活組織檢查和概念上類似的測定(諸如抗生素抗性基因檢測)的典型定量方法包括定量PCR(qPCR)、陣列qPCR、數位PCR、多重連接依賴式探針擴增(MLPA)或來自下一代DNA測序數據的定量。雖然定量方法是穩健且成熟的方法，但每種方法都與下面更詳細討論的具體問題有關係：

定量PCR：定量PCR(qPCR)是一種包括在PCR過程中(即實時)擴增經靶向的DNA分子的技術。實時PCR分為定量使用(定量實時PCR)，以及也可以半定量使用，即高於/低於一定量的DNA分子(半定量實時PCR)。定量PCR(qPCR)是基因靶標定量的金標準。目前，qPCR反應的實驗室成本約為2$。然而，考慮到設置反應所需的大量實際操作時間(人工成本)、標準曲線的需要以及每個經定量靶標的重複，實際成本事實上要高得多。由於每種基因靶標都需要單獨的定量實驗，因此實際操作時間會隨著樣品數量的增加而急劇增加。

陣列PCR：PCR陣列是分析相關通路-或聚焦疾病的一組基因表達的最可靠工具。每個96孔板、384孔板或100孔圓盤PCR陣列都包括SYBR Green優化的引物測定，用於對一組聚焦基因進行徹底研究。qPCR技術的一個新的迭代是陣列qPCR，其將單個qPCR反應小型化。陣列PCR降低了單個qPCR反應的成本，並提高了該方法對多個靶標和樣品的可擴展性。然而，該方法目前局限於以每晶片數千美元的成本加上讀出基礎設施的巨大資本成本來剖析來自12個樣品的384種靶標(或者相反地，來自384個樣品的12種靶標)。因此，使用上述設置剖析數千個樣品仍然非常昂貴。

數位PCR：數位聚合酶鏈式反應(digital PCR、DigitalPCR、dPCR或dePCR)是一種通過微滴微流體和螢光檢測來提供靶標絕對定量的方法。這種方法相對成本有效(每個樣品的一個靶標成本約為3$)，但每個樣品中每種靶標的準備，設置和運行單獨實驗的實際時間使得難以擴展至在數千個樣品。

多重連接依賴式探針擴增(MLPA)提供了一種簡化單個樣品中多個基因靶標檢測的方法。然而，MLPA只提供了靶標的相對定量，並需要對每個樣品進行單獨的檢測實驗。最近，MLPA的一種變型引入了DNA條形碼的概念。與傳統的MLPA工作流程相比，該概念允許更好的定量分辨率和樣品複用。

基於下一代測序的方法：下一代測序(NGS)，也稱為高通量測序，使得基於序列的基因表達分析成為模擬技術的“數位”替代物。隨著DNA測序成本的不斷降低，從下一代DNA測序數據中進行靶標計數正變得越來越有吸引力，並且目前正用於例如NIPT篩選。然而，目前的方法存在測序文庫製備成本高和測序工作浪費在非相關基因靶標測序上的問題。例如，在癌症相關液體活組織檢查中，非靶向方法導致腫瘤學的非相關基因座測序工作的浪費。在胎兒診斷學中，基因座的非靶向採樣極大地限制了解釋數據的統計選擇。Guardant Health Inc.提供了更具靶向性的測序方法，其中一系列RNA捕獲探針豐富了下一代DNA測序的靶標。

Akhras et al.(2007)PLoS ONE 2(2)：e223公開了一種涉及條形碼化靶標特異性探針、靶標環化和測序的多重病原體檢測測定。還公開了使用橋寡核苷酸來連接靶標特異性探針。

WO2018109206描述了使用掛鎖探針和滾環擴增檢測樣品中分析物的方法。沒有描述使用橋寡核苷酸。

WO2019038372描述了下一代測序方法，其中通過體外轉錄從含有T7聚合酶啟動子的連接複合體中選擇性擴增感興趣的靶標序列，然後進行cDNA合成和測序。雖然這種方法可以對樣品中的許多靶標序列進行準確和平行的檢測和定量，但對於更複雜、大體積、稀釋和/或不純的樣品仍具有挑戰性。

因此，根據前述討論，需要通過對核酸靶標的準確和大規模平行定量來克服前述缺點，諸如但不限於特異性、靈敏度、準確性、通量、成本、規模化(scaling)和周轉。

所公開實施方式的方面提供了使用下一代測序在大體積樣品(高達數十毫升)和/或稀釋和/或未純化的樣品材料中進行高靈敏度、可規模化且準確的靶標定量的方法。而且，避免了諸如WO2019038372中描述的RNA擴增步驟，使得該方法更加簡單。

在第一個主要方面，所公開實施方式的方面涉及高通量檢測多個樣品中的一種或多種靶標核苷酸序列的方法，該方法包括以下步驟：

(i)為每個樣品中的每種靶標核苷酸序列提供：第一探針、第二探針和橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸；

其中，第一探針在分子的5'端起包括第一橋寡核苷酸特異性序列、第一通用序列、可選的第一序列條形碼，和位於第一探針的3'端的第一靶標特異性部分；

並且其中，第二探針自分子的5'端起包括第二靶標特異性部分、可選的第二序列條形碼、第二通用序列，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

並且其中，橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的橋寡核苷酸複合體包括與第一探針中的第一橋寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列分別互補的序列，以及可選的第三條形碼；

並且其中，第一序列條形碼或者第二序列條形碼或者第三條形碼中的至少一者分別存在於第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中；

並且其中，第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中的至少一者包括核酸內切酶的識別序列；

並且其中，可選地，第一探針或者第二探針或者橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸中的至少一者包括第一捕獲部；

(ii)通過以下形成雜交複合體；

(ii-a)對於一種或多種靶標核苷酸序列中的每一種，使第一探針、第二探針以及橋寡核苷酸或能夠彼此退火以形成橋接寡核苷酸複合體的多個寡核苷酸接觸並允許自退火成多個連接複合體；

使存在於待測的一種或多種靶標核苷酸序列的多個樣品中的每一個中的核酸與連接複合體接觸；和

允許來自連接複合體的第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分與多個樣品的每一個中的一種或多種靶標核苷酸序列上基本相鄰的區段雜交，從而形成一個或多個第一雜交複合體；

或者

(ii-b)使存在於待測的一種或多種靶核苷酸序列的多個樣品的每一個中的核酸與第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分接觸，以與一種或多種靶標核苷酸序列上基本相鄰的區段雜交，並且使經雜交的一種或多種靶標核苷酸序列以及第一探針和第二探針與橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸接觸，從而形成一個或多個第二雜交複合體；

(iii)使用連接酶或多種連接酶或者連接酶與DNA聚合酶的組合，將一個或多個第一雜交複合體或者一個或多個第二雜交複合體中的探針連接起來，以提供一個或多個經連接的連接複合體；

(iv)用鏈置換聚合酶通過滾環擴增從一個或多個經連接的連接複合體中擴增核酸，以形成經擴增的一個或多個單鏈的多聯體序列；

並進行以下步驟之一：

(v-a)可選地，使步驟(iv)中獲得的經擴增的一個或多個單鏈的多聯體序列與含核酸內切酶的識別序列的特異性寡核苷酸退火，其中特異性寡核苷酸與識別序列退火以形成含核酸內切酶的識別位點的經退火複合體；和

用所述核酸內切酶切割在步驟(iv)中獲得的單鏈的多聯體序列或者切割經退火複合體以形成核酸片段；

或者

(v-b)使一個或多個單鏈的多聯體序列與固體支持物接觸，其中該固體支持物可替代地包括第二捕獲部，允許第一捕獲部和第二捕獲部相互作用，從而使得一個或多個單鏈的多聯體序列與固體支持物相連，以及使與固體支持物相連的多聯體序列和樣品未與固體支持物相連的組分分離；或使用能夠以高親和力與經修飾或未經修飾DNA結合的固體支持物，或使用固定在固體表面上的互補寡核苷酸；

(vi)使步驟(iv-a)中獲得的核酸片段或者步驟(iv-b)中獲得的一個或多個單鏈的多聯體序列經受高通量測序技術以確定條形碼序列；和

(vii)通過確定第一靶標特異性部分和/或第二靶標特異性部分的至少一部分，和/或第一條形碼和/或第二條形碼的至少一部分，和/或第三條形碼的至少一部分，來鑒別多個樣品的每一個中靶標核苷酸序列的存在和/或數量。

在另一主要方面，所公開實施方式的方面涉及包括多個容器的成套的試劑盒(a kit of parts)，其中至少一個容器容納一組或多組的第一探針和第二探針，並且至少一個容器容納一個或多個橋寡核苷酸或能夠形成橋寡核苷酸複合體的多個寡核苷酸；

其中，第一探針自分子的5'端起包括第一橋寡核苷酸特異性序列、可選的第一序列條形碼，和位於第一探針的3'端的第一靶標特異性部分；

其中，第二探針自分子的5'端起包括第二靶標特異性部分，可選的第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

其中，橋寡核苷酸或橋寡核苷酸複合體包括與第一探針中的第一橋接寡核苷酸特異性序列和第二探針中的第二橋接寡核苷酸特異性序列分別互補的序列，以及可選的第三條形碼；

其中，第一序列條形碼或者第二序列條形碼或者第三條形碼中的至少一者分別存在於第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中；

其中，該成套的試劑盒進一步包括能夠與所述識別序列退火從而獲得所述核酸內切酶的識別位點的寡核苷酸；並且其中，橋寡核苷酸或橋寡核苷酸複合體包括第四條形碼，該第四條形碼包括能夠與樣品的靶標序列退火的序列。

102:樣品

103:樣品雜質

104:連接複合體

106:靶標核酸

110:多個樣品

112:混合樣品

116:探針的長的多聯體拷貝

117:PCR

202:修飾1

204:橋結合序列1

206:條形碼1

208:基因靶標

210:左探針上的修飾1

214:右探針上的修飾2

216:右探針與基因靶標結合的部分

218:條形碼2

220:橋接序列2，用於高效結合橋接寡核苷酸

222:右探針上的橋序列8

224:第三橋寡核苷酸

226:內切酶識別位點，位於第三橋接寡核苷酸上

228:右探針的橋序列1

230:捕獲部

3’:3’端

5’:5’端

234:磷酸基或可切除基團

236:第二橋寡核苷酸的橋序列4

238:第一橋寡核苷酸的橋序列2

240:第二橋寡核苷酸的橋序列5

242:第三橋寡核苷酸的橋序列6

圖1示出了根據本文實施方式的多重連接測定(MLA)的流程圖，包括(從上至下列出)10 SEQ ID編號1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27和28。

圖2A示出了根據本文實施方式的具有多個探針實體的探針三聯體(包括SEQ ID編號29、30和31)的原理結構。

圖2B示出了根據本文實施方式的第一探針和第二探針之間的間隙填補。

圖2C示出了根據本文實施方式的第一探針和第二探針與橋複合體之間的間隙填補。

圖3示出了用限制性核酸內切酶消化之前(泳道2)和之後(泳道1)工作流程中的RCA產物。

圖4示出了實驗流程對四個重複反應中以對數遞減的基因靶標數量的線性響應，由此推斷出通過列舉分子條形碼從下一代DNA測序數據。每一行代表靶標序列的三種濃度。響應在三個數量級上呈線性。

定義：

靶標核苷酸序列：術語“靶標核苷酸序列”可以是需要檢測的任何感興趣的核苷酸序列。應當理解，給出的術語是指連續核苷酸序列以及具有互補序列的核酸分子。在一些實施方式中，靶標序列是代表多態性或與多態性相關的核苷酸序列。

多態性：術語“多態性”是指在群體中出現兩種或更多種基因決定的替代序列或等位基因。多態性標誌物或位點是發生序列差異的基因座。多態性基因座(polymorphic locus)可以小到一個鹼基對。

樣品：術語“樣品”在本文中用於含有兩種或更多種靶標序列的兩個或更多個樣品。根據公開實施方式的方法提供的樣品可已製備好，以便至少提取靶標核酸，並使那些核酸可被公開的實施方式中使用的探針接近。特別地，在一些實施方式中，每個樣品包括至少兩種不同的靶標序列，優選至少100種，更優選至少250種，更優選至少500種，最優選至少2000種或更多。術語“樣品”可以指但不限於從人體/動物體內獲得的兩個或更多個樣品，包括尿液、活組織、唾液和其他分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查樣品)；或從環境中獲得的兩個或更多個樣品，包括水、廢水、土壤、植物；或包含病毒或細菌等的兩個或更多個樣品。在一個實施方式中，多個樣品包括血液樣品、唾液樣品、尿液樣品或糞便樣品、另一體液的樣品或身體材料的提取物，例如毛髮或皮屑。

探針：術語“探針”是可變長度(通常50至1000個鹼基長，優選50至200個鹼基長)的DNA或RNA片段，其可用於DNA或RNA樣品以檢測與探針中序列互補的核苷酸序列(DNA或RNA靶標)的存在。寡核苷酸探針與靶標序列互補的區段被設計成使得對於樣品中的每種靶標序列，提供一對左探針和右探針，由此每個探針在其末端包含與靶標序列的一部分互補的區段。此外，本發明描述了用於接合左探針和右探針的橋寡核苷酸或橋寡核苷酸複合體。

通用(universal)：當用於描述擴增程序時，術語“通用”是指能夠使用單個引物或一組引物進行多個擴增反應的序列。這種引物的使用極大地簡化了多重化(multiplexing)，因為只需要兩個引物來擴增多個選定的核酸序列。當用於描述引物位點時，術語“通用”是指通用引物將雜交的位點。還應注意的是，可以使用通用引發序列/引物的“組”。

雜交：術語“雜交(或雜化)”描述脫氧核糖核酸(DNA)或核糖核酸(RNA)分子退火成互補DNA或RNA的過程。DNA或RNA複製以及DNA轉錄成RNA都依賴於核苷酸雜交。

連接(ligation)：術語“連接”是指通過酶的作用接合兩個核酸片段。DNA連接酶是能夠催化在互補鏈上相鄰位點結合的兩條多核苷酸鏈(的端部)之間形成磷酸二酯鍵的酶。在一個實施方式中，連接也可以通過化學方式進行，特別是如果多核苷酸的兩個相鄰的端部都被修飾以使得能夠化學連接。

擴增：本文使用的術語“擴增”指的是使用DNA聚合酶來增加核苷酸序列混合物中具體核苷酸序列的濃度。“PCR”或“聚合酶鏈式反應”是體外酶擴增特定DNA/RNA片段的快速程序。待擴增的DNA/RNA可通過加熱樣品而變性。術語“引物”是RNA或DNA的短鏈(通常約18至22個鹼基)，其作為DNA合成的起點。這是DNA複製所必需的，因為催化這一過程的酶，DNA聚合酶，只能在現有的DNA鏈上添加新的核苷酸。

聚合酶：聚合酶是一種合成長鏈核酸或核酸聚合物的酶。DNA聚合酶和RNA聚合酶分別用於通過鹼基配對相互作用複製DNA或RNA模板鏈來組裝DNA和RNA分子。

高通量：術語“高通量”指的是同時處理和篩選大量DNA樣品的能力；以及在單個DNA樣品中同時篩選大量不同的基因座的能力。高通量測序或篩選，通常縮寫為HTS，是一種特別適用於同時有效篩選大量樣品的科學實驗方法。

核酸內切酶：核酸內切酶是一種在隨機或特定位置使DNA雙鏈或單鏈裂解的酶。

如上文所述，本發明涉及利用連接依賴性測定法在非常多的樣品中高通量檢測靶標核苷酸序列的方法。本發明提供了使用下一代測序允許的技術確定複雜核酸池中基因靶標的序列的方法。本發明還提供了通過利用連接依賴性測定法在多個樣品中(優選在非常多的樣品中)對多種基因靶標進行剖析的方法。本發明提供了用於多重連接依賴性探針擴增的方法，其使得能夠查詢多個樣品中的不同靶標核酸。本發明實施方式的方法使得能夠對多個樣品中的一種或多種靶標核苷酸序列進行測序，為不同的靶標核酸提供多個不同的探針組。在處理測序數據時，獨特的序列標識符用於鑒定基因靶標核和對樣品池中的單個樣品進行絕對定量。

在第一個主要方面，所公開實施方式的方面涉及高通量檢測多個樣品中一種或多種靶標核苷酸序列的方法，該方法包括以下步驟：

其中，第一探針自分子的5'端起包括第一橋寡核苷酸特異性序列、第一通用序列、可選的第一序列條形碼，和位於第一探針的3'端的第一靶標特異性部分；

並且其中，橋寡核苷酸或能夠彼此退火以形成橋接寡核苷酸複合體的橋寡核苷酸複合體包括與第一探針中的第一橋寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列分別互補的序列，以及可選的第三條形碼；

(ii)通過以下形成雜交複合體：

(ii-a)對於一種或多種靶標核苷酸序列中的每一種，使第一探針、第二探針和橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸接觸並允許自退火為多個連接複合體；

允許來自連接複合體的第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分與多個樣品中的每一個中的一種或多種靶標核苷酸序列上基本相鄰的區段雜交，從而形成一個或多個第一雜交複合體；

或

(ii-b)使存在於待測的一種或多種靶標核苷酸序列的多個樣品的每一個中的核酸與第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分接觸，以與一種或多種靶標核苷酸序列上基本相鄰的區段雜交，並且使經雜交的一種或多種靶標核苷酸序列以及第一探針和第二探針與橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸接觸，從而形成一個或多個第二雜交複合體；

(iv)用鏈置換聚合酶通過滾環擴增從一個或多個經連接的連接複合體擴增核酸，以形成經擴增的一個或多個單鏈的多聯體序列；

以及進行以下步驟之一：

用所述核酸內切酶切割在(iv)中獲得的單鏈的多聯體序列或者切割經退火複合體以形成核酸片段；

或者

(v-b)使一個或多個單鏈的多聯體序列與固體支持物接觸，該固體支持物可替代地包括第二捕獲部，允許第一捕獲部和第二捕獲部相互作用，從而使得一個或多個單鏈的多聯體序列與固體支持物相連，以及與固體支持物相連的多聯體序列和樣品未與固體支持物相連的組分分離；或使用能夠以高親和力與經修飾或未經修飾的DNA結合的固體支持物，或使用固定在固體表面上的互補寡核苷酸；

(vi)使步驟(iv-a)中獲得的核酸片段或步驟(iv-b)中獲得的一個或多個單鏈的多聯體序列經受高通量測序技術以確定條形碼序列；以及

在另一個主要方面，所公開實施方式的方面涉及包括多個容器的成套的試劑盒，其中至少一個容器容納一組或多組的第一探針和第二探針，並且至少一個容器容納一個或多個橋寡核苷酸或能夠形成橋寡核苷酸複合體的多個寡核苷酸；

其中，第二探針自分子的5'端起包括第二靶標特異性部分、可選第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

圖1提供了所公開實施方式的方法的實施方式的非限制性說明。

所公開實施方式的方法利用三種核酸探針，其中兩種靶標特異性的核酸探針(左探針和右探針)對基因靶標具有特異性，並且一種核酸探針通常是通用的(橋寡核苷酸或橋寡核苷酸複合體)。左探針和右探針與橋探針或橋寡核苷酸複合體雜交形成連接複合體。使樣品DNA或RNA上具有靶標鑒定位點的連接複合體(包括一種或多種條形碼序列)與查詢樣品的互補靶標序列進行雜交。雜交後，左探針和右探針被化學連接或通過DNA連接酶以酶法連接，形成經連接的連接複合體。在所公開實施方式的方面中，在待分析的多個樣品的樣品分析過程中，將會形成多個這樣的經連接的連接複合體。

在實施方式中，“多個樣品”可以指但不限於從人體或動物體獲得的兩個或更多個樣品，包括活組織檢查樣品、唾液和其他分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查樣品)；從環境獲得的兩個或更多個樣品，包括水、廢水、土壤、植物；或者含病毒或細菌等的兩個或更多個樣品。在一個實施方式中，使用的樣品不需要事先進行核酸的純化或濃縮。在另一個實施方式中，可以對樣品進行預處理，例如裂解細胞以暴露核酸。

靶標序列可包括需要檢測的任何感興趣的核苷酸序列。本發明的靶標核苷酸序列可從患者血液中的一部分DNA或母體血液中的一部分DNA獲得，但不限於此。患者血液中的一部分DNA可以從凋亡/壞死的癌細胞中獲得，或者母體血液中的一部分DNA可以是胎兒和/或母體來源的。進一步地，分析結果用於，例如評估個體患上給定類型癌症的風險，確定給定治療對給定癌症的療效，腫瘤中耐藥性相關突變的發展，或胎兒攜帶基因疾病(諸如常見的三染色體唐氏綜合征、帕圖綜合征和愛德華茲綜合征)的風險。在某些實施方式中，該方法包括為每種靶標核苷酸序列提供多個不同的探針組。

如本文使用的，術語“探針組”包括第一探針、第二探針和橋寡核苷酸或橋寡核苷酸複合體。

在某些實施方式中，第一探針自分子的5’端起包括可選的5'磷酸、第一橋寡核苷酸特異性序列、可選的第一通用序列、可選的第一序列條形碼，和位於其3'端的第一靶標特異性部分。在某些實施方式中，第二探針自分子的5’端起包括可選的5'磷酸、第二靶標特異性部分、可選的第二序列條形碼、可選的第二通用序列，和位於其3'端的第二橋寡核苷酸特異性序列。

在優選的實施方式中，第一探針或第二探針包含第一序列條形碼或第二序列條形碼中的至少一者。第一序列條形碼或第二序列條形碼或者這兩者可以是隨機序列，或者可以包含靶標核苷酸序列標識符序列、樣品標識符序列和/或分子條形碼，用於靶標列舉(target enumeration)。

在優選的實施方式中，橋寡核苷酸或橋寡核苷酸複合體包含與在第一探針中的第一橋接寡核苷酸特異性序列和第二探針中的第二橋接寡核苷酸特異性序列分別互補的序列，可選的通用序列，和/或，或者可包含第三條形碼，該第三條形碼可以是隨機序列或可包含樣品或序列標識符序列。在這方面，第三條形碼不一定意味著已經存在第一條形碼和第二條形碼。如此前所述，在經連接的連接複合體中應存在至少一個條形碼，這使得能夠在所有測試樣品中的所有連接複合體獨特地定義該複合體。

此外，第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中至少一者包括核酸內切酶的識別序列。在步驟(x)中切割多聯體序列需要識別序列。在一個實施方式中，識別序列是限制性核酸內切酶(諸如EcoRI)的識別序列。在另一個實施方式中，識別序列是歸巢核酸內切酶(諸如I-CeuI)的識別序列。在另一個實施方式中，識別序列是嚮導DNAaseI或CRISPR-Cas類切割體系的識別序列。

可選地，第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中的至少一者包括第一捕獲部。在本文中使用時，“第一捕獲部”是指使得探針、連接複合體或雜交複合體被連接到固體支持物的第二捕獲部捕獲所捕獲(即與之結合)的部分，諸如化學基團。本領域內已知的任何合適的捕獲部均可用於此目的。眾所周知的合適例子是使用包被有鏈黴親和素的磁珠捕獲生物素化的分子。因此，在一個實施方式中，第一捕獲部是生物素部，其可以與連接到固體支持物(諸如磁珠)上的鏈黴親和素或親和素部(第二捕獲部)相互作用。其他選擇包括生物素衍生物，諸如雙生物素、脫硫生物素或可光解的生物素，它們可用於與鏈黴親和素/親和素綴合。進一步的選擇包括使用硫醇和丙烯醯胺(acrydite)基團進行丙烯醯胺(acrydite)/丙烯醯胺(acrylamide)綴合，使用炔基和疊氮基進行點擊化學，和使用地高辛用於與抗地高辛抗體綴合。綴合配偶體(conjugation partner)可以設置在任何固體表面上，諸如珠子(磁性或其他)或固體支持物。

優選地，第一靶標特異性部分、第二靶標特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列彼此獨立地包含至少一個經化學修飾的核苷酸以增加探針結合。增加探針結合的化學修飾包括但不限於核糖核酸、肽核酸和鎖定核酸(例如，如WO2019038372 的圖3所示，該文件通過引用併入本文)。在一個實施方式中，第一探針或第二探針或者這兩者的橋接部分都包括經化學修飾的鹼基，以允許改善與橋寡核苷酸或橋寡核苷酸複合體的結合。在另一個實施方式中，第一靶標特異性部分、第二靶標特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列彼此獨立地包括一個或多個經化學修飾的核苷酸。在某些實施方式中，化學修飾允許相鄰探針的化學連接。在一些實施方式中，上文描述的探針與完全相鄰的遺傳基因座結合或者與相距至多500個鹼基對，例如相距至多200個鹼基對，諸如相距至多50個鹼基對，優選相距至多40個鹼基對，更優選相距至多30個鹼基對，更優選相距至多20個鹼基對，更優選相距至多10個鹼基對，最優選相距至多5個鹼基對的遺傳基因座結合。

在一些實施方式中，第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體可包括用於DNA測序平臺諸如(但不限於)Illumina的接頭序列。這些接頭序列允許得到的測序文庫與測序設備的檢測部件(諸如Illumina流動池)結合。

此外，在一些實施方式中，橋寡核苷酸或橋寡核苷酸複合體包括：

(i)一至五個3'突出的鹼基(即，不與第二探針形成雙螺旋的額外鹼基)，和/或

(ii)3′磷酸，和/或

(iii)在從3'端起的三個位置內的一個或多個硫代磷酸酯修飾，

(iv)第一捕獲部，諸如5′端的生物素。

在一個實施方式中，優選對於在單獨的管中的每個樣品，在探針與含靶標序列的樣品接觸之前，使第一探針和第二探針與橋寡核苷酸或能夠形成橋寡核苷酸複合體的多個寡核苷酸接觸，並且允許自退火成連接複合體(步驟(ii))。在其中橋不是一個寡核苷酸而是能夠彼此退火形成橋寡核苷酸複合體的多個寡核苷酸(諸如三個或五個寡核苷酸)的實施方式(本文中在圖2C中示出)中，該多個寡核苷酸可以在與第一探針和第二探針退火之前，是經預退火的，或者所有的退火步驟可以一次完成。

優選地，每個連接複合體對於第一靶標特異性序列、第二靶標特異性序列和一個或多個條形碼序列的組合是獨特的。這使得能夠在擴增後對靶標序列進行列舉，並對結果進行分析。

在一些實施方式中，如果第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中的至少一者包括第一捕獲部，則使來自(步驟ii)的連接複合體與含第二捕獲部的固體支持物接觸，並允許第一捕獲部和第二捕獲部相互作用，從而使得雜交複合體與固體支持物相連，並且與固體支持物相連的連接複合體與未與固體支持物相連的連接複合體分離(可選步驟(額外步驟1))。此後，使與固體支持物相連的連接複合體與樣品中未與固體支持物相連的組分分離。如果固體支持物是磁珠，則可以使用磁鐵將磁珠固定，並且可去除剩餘的液體樣品。可選地，在繼續之前進行洗滌步驟；

步驟(額外步驟1)使得連接複合體固定在固體支持物上，諸如磁珠或平坦表面，後者在某些DNA測序應用中可用於例如螢光檢測。

此後，使多個樣品中的一個或多個靶標核苷酸序列與多個連接複合體接觸(步驟(iii))。第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分與靶標序列上基本相鄰的區段雜交，從而形成雜交複合體(步驟(iv))。在一些實施方式中，樣品由從血液、組織、FFPE樣品、唾液、尿液或糞便中提取的DNA組成。在一些實施方式中，樣品的體積超過100微升，例如超過1ml。在又一實施方式中，樣品的核酸濃度低於5pmol，例如低於1pmol，例如低於200fmol。在一個實施方式中，多個樣品包括一個或多個血液樣品、一個或多個唾液樣品、一個或多個尿液樣品，或者一個或多個糞便樣品。

在另一個實施方式中，使多個樣品中的一個或多個靶標核苷酸序列與多個第一探針和第二探針接觸。第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分與靶標序列上基本相鄰的區段雜交。隨後，使經靶向雜交的第一探針和第二探針與橋寡核苷酸接觸，從而形成雜交複合體。

隨後，在一些實施方式中，如果第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中的至少一者包括第一捕獲部，則使雜交複合體與含第二捕獲部的固體支持物接觸，並允許第一捕獲部和第二捕獲部相互作用，使得雜交複合體與固體支持物相連(可選的步驟(v))。此後，使與固體支持物相連的雜交複合體與樣品未與固體支持物相連的組分分離。如果固體支持物是磁珠，則可以使用磁鐵將磁珠固定，並可去除剩餘的液體樣品。可選地，在繼續之前進行洗滌步驟。

在一個實施方式中，步驟(v)帶來核酸的純化和富集，使得特別是對於高度不純的樣品具有改善的結果。在一個實施方式中，所公開實施方式的方法在步驟(v)之前不包括富集核酸的步驟。因此，在一個實施方式中，該方法在步驟(vi)之前不包括將原始樣品中的核酸濃縮大於2倍、大於10倍或大於100倍的步驟。在另一個實施方式中，所公開實施方式的方法在步驟(vi)中的連接之後不包括純化步驟。在另一個實施方式中，步驟(v)使得連接複合體固定在固體支持物上，諸如磁珠或平坦表面，後者可用於例如某些DNA測序應用中的螢光檢測。

隨後，以酶法或化學法進行所形成的雜交複合體中探針的連接，以提供經連接的連接複合體(步驟(vi))。可選地，作為步驟(vi)的一部分，第一探針與第二探針之間的間隙(如果存在)可通過引入聚合酶和一個或多個核苷酸來填補，其中一個或多個核苷酸可選地包括含捕獲部的經化學修飾的核苷酸，其中捕獲部包括但不限於內部氨基修飾劑、內部生物素修飾劑(生物素疊氮化物、生物素dT、脫硫生物素-TEG)、內部硫醇修飾劑、炔烴(int-5-octadiynyl dU)和內部疊氮化物(NHS酯)。聚合酶添加(a)與通用橋寡核苷酸序列互補和/或(b)與條形碼序列互補的核苷酸，從而填補第一探針和第二探針之間的兩個間隙，使左探針和右探針連接起來，並將通用序列和/或第三條形碼序列納入橋互補鏈中。橋寡核苷酸或橋寡核苷酸複合體從5'位點或3'位點延伸與經連接的探針互補，從而使得存在於第一探針或第二探針中的靶標序列標識符序列整合到橋寡核苷酸或橋寡核苷酸複合體中。優選地，使用不破壞雙鏈DNA的聚合酶，例如Taq聚合酶，以便在第一探針和第二探針與靶標序列退火時均不干擾第一探針與第二探針的連接。

隨後，在一些實施方式中(可選步驟(額外步驟2))，使經連接的連接複合體經受DNA變性條件，例如加熱或鹼性條件，以使橋寡核苷酸與經連接的連接複合體解離。這種解離將暴露經連接的連接複合體的通用序列區域，其可用於例如將這些經連接的連接複合體結合到固定的核苷酸探針上，用於包括某些DNA測序應用在內的螢光檢測應用。

可選地，在一些實施方式中(可選步驟(額外步驟3))，使經連接的連接複合體與固體支持物(諸如磁珠或平坦表面)接觸，後者例如可用於某些DNA測序應用中的螢光檢測。該固體支持物可包括第二捕獲部，允許經連接的連接複合體中的第一捕獲部和第二捕獲部相互作用，使得連接複合體與固體支持物相連，或者固體支持物可以被修飾為能夠以高親和力與未經修飾或經修飾的DNA結合，或者固體支持物可以包括通過DNA雜交對經連接的連接複合體具有親和力的固定的寡核苷酸。如果固體支持物是磁珠，則可以使用磁鐵將磁珠固定，並且可以去除剩餘的液體樣品。可選地，在繼續之前進行洗滌步驟。

步驟(額外步驟3)帶來經連接的連接複合體在固體支持物(例如磁珠或平坦表面)上的固定，其中當為平坦表面時可在某些DNA測序應用中用於例如螢光檢測。

然後，可選地，從一個或多個靶標樣品中匯集經連接的連接複合體(步驟(vii))。步驟(vi)和(vii)可以按照指定的順序進行或可替代地以相反的順序進行。

接下來，從一個或多個經連接的連接複合體中擴增核酸(步驟(viii))。使用鏈置換聚合酶，例如phi29聚合酶(UniProtKB-P03680；DPOL_BPPH2)或Bst聚合酶(P52026；DPO1_GEOSE)通過滾環擴增來進行擴增，其中鏈置換聚合酶可選地包括含捕獲部的經化學修飾的核苷酸，該捕獲部包括但不限於內部氨基修飾劑、內部生物素修飾劑(生物素疊氮化物、生物素dT、脫硫生物素-TEG)、內部硫醇修飾劑、炔烴(int-5-octadiynyl dU)和內部疊氮化物(NHS酯)。在接下來的步驟(ix)中，在步驟(viii)中獲得的經擴增的一個或多個單鏈的多聯體序列可選地與含核酸內切酶的識別序列的特定寡核苷酸退火，其中所述寡核苷酸與步驟(i)中的所述識別序列退火，從而獲得核酸內切酶的識別位點。含識別序列的特異性寡核苷酸通常將在識別序列周圍包含一些額外的特異性序列，以便能夠形成用於切割的穩定雙螺旋。

隨後步驟(viii)中獲得的單鏈的多聯體序列或在步驟(ix)中獲得的經退火複合體可選地用所述核酸內切酶進行切割(步驟(x))，從而產生NGS文庫。

可選地，擴增後，去除固體支持物(如果存在)，並且將上清液用於後續處理。例如，如果固體支持物是磁性顆粒，則可使用磁鐵將其去除。在所公開實施方式的方法的其他一些實施方式中，在步驟(vi)之後、步驟(vii)之後或步驟(viii)之後，立即破壞第一捕獲部和第二捕獲部之間的相互作用。例如，如果第一捕獲部是生物素且第二捕獲部是鏈黴親和素，則可以通過添加過量的可溶性生物素來破壞相互作用。如果鏈黴親和素與磁性顆粒結合，則可隨後使用磁鐵將其去除。

在另一個實施方式(可選步驟(額外步驟4))中，使在步驟(viii)中獲得的多聯體序列與固體支持物接觸，該固體支持物可替代地包括第二捕獲部，允許多聯體序列中的第一捕獲部或多個第一捕獲部與第二捕獲部相互作用，使得雜交複合體與固體支持物相連，並且與固體支持物相連的雜交複合體與樣品中未與固體支持物相連組分分離，或使用能夠以高親和力與經修飾或未經修飾DNA結合的固體支持物，或者固體支持物可包括通過DNA雜交對多聯體序列具有親和力的經固定的寡核苷酸。如果固體支持物是磁珠，則可以使用磁鐵將磁珠固定，並且可以去除剩餘的液體樣品。可選地，在繼續之前進行洗滌步驟。

步驟(額外步驟4)帶來了多聯體序列在固體支持物(例如磁珠或平坦表面)上的固定，其中在採用平坦表面時在某些DNA測序應用中可用於例如螢光檢測。

此外，可選地，在步驟(x)和步驟(xi)之間，可選地使用與第一探針和第二探針的通用部分結合的引物進行PCR擴增，其中所述引物可選地包括用於後續步驟(xi)中測序的接頭序列。

可通過高通量測序技術(步驟(xi)和步驟(xii))確定第一和/或第二靶標特異性部分的至少一部分、第一和/或第二條形碼的至少一部分，和/或第三條形碼的至少一部分來鑒別多個樣品中靶標核苷酸序列的存在和/或數量，例如，使用下一代測序平臺，包括但不限於Illumina iSeq、MiSeq、HiSeq、NextSeq或NovaSeq。優選地，通過計算每種靶標和每個樣品的分子條形碼數量進行計數來允許對基因靶標進行列舉(enumeration)。樣品從序列數據中分離出來(去卷積)，並且在DNA測序後在silico中對序列靶標進行定量。

在優選的實施方式中，用第一引物和第二引物來進一步擴增分子以提供擴增產物。優選地使用通用第一引物和通用第二引物，它們與存在於連接複合體中的第一或第二通用序列反向互補。

與傳統核酸測序技術相比，所公開實施方式的優點包括但不限於低成本、高簡單性、高特異性、高靈敏度、高準確度、高通量、高可擴展性和高周轉性的定量測定。所公開實施方式的另一個方面是，所公開實施方式的方法使得能夠對包括人類和動物群體在內並且包括大體積的未純化樣品材料在內的多個樣品中的多種核酸靶標進行準確和大規模平行定量。如所提及的，在優選的實施方式中，使用的樣品，諸如尿液樣品不需要事先進行核酸的純化或濃縮。在另一個實施方式中，可對樣品進行預處理，例如裂解細胞以暴露核酸。公開的實施方式的一個特別的優點是能夠使用獨特的探針設計(即探針三聯體)，來檢測和擴增感興趣的靶標序列。探針設計有特殊定位的經修飾的核苷酸，可提高退火和結合效率。結合特性的改善引起更高的檢測特異性、靈敏度和準確性。所公開實施方式的方法同樣適用於研究基因變體並在診斷和預後中找到應用，包括但不限於對一種或多種序列和/或多態性(諸如SNP和/或插入缺失(indel))、癌症診斷或來自母體血液的胎兒染色體疾病的樣品進行基因分型。在優選的實施方式中，對於兩個或更多個樣品或者對於兩個或更多個基因座/等位基因組合，使用條形碼序列對樣品中一種或多種序列和/或多態性(例如SNP和/或插入缺失)進行基因分型。

在另一方面，所公開實施方式的方面提供了含多個容器的成套的試劑盒，其中至少一個容器容納一組或多組的第一探針和第二探針，並且至少一個容器容納一個或多個橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸；

其中，橋寡核苷酸或橋寡核苷酸複合體包括與第一探針中的第一橋接寡核苷酸特異性序列和第二探針中的第二橋接寡核苷酸特異性序列互補的序列，以及可選的第三條形碼；

其中，第一探針或者第二探針或者橋寡核苷酸或橋寡核苷酸複合體中的至少一者包括核酸內切酶的識別序列；

並且其中，該成套的試劑盒進一步包括能夠與所述識別序列退火的寡核苷酸，從而獲得所述核酸內切酶的識別位點。

優選地，對第一探針的3'端或第二探針的5'端，或這兩者進行修飾，以允許第一探針與第二探針的化學連接。

優選地，橋寡核苷酸或橋寡核苷酸複合體在與第一探針序列互補的序列，或與第二探針序列互補的序列中，或這兩者中包括一個或多個經化學修飾的核苷酸。

優選地，第一探針或第二探針的橋接部分，或者這兩者包括經化學修飾的鹼基，以允許改進與橋寡核苷酸或橋寡核苷酸複合體的結合。

在一個具體的實施方式中，容納第一和第二探針組的至少一個容器和容納橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸的至少一個容器是同一容器。在這種情況下，上述三個探針可以預先退火並形成經連接的複合體。

所公開實施方式的一個特別的優點是能夠使用獨特的探針設計(即探針三聯體)來檢測和擴增感興趣的靶標序列。探針被設計為具有改善的結合特性，從而引起更高的測定特異性、靈敏度和準確性。所公開實施方式的方面應用於分子生物學、進化生物學、元基因組學、基因分型領域，更具體地說，但不限於癌症診斷或胎兒染色體疾病，包括但不限於對樣品的一個或多個序列和/或多態性(諸如SNP和/或插入缺失)進行基因分型。

在一個特別優選的實施方式中，橋寡核苷酸或橋寡核苷酸複合體包括用於鑒別樣品的信息，並包括獨特的條形碼。在這種情況下，第一和第二探針普遍適用於所有樣品(並且僅包括用於鑒別靶標的信息)。因此，在一個優選的實施方式中，提供了根據所公開實施方式的方面的方法或試劑盒，其中橋寡核苷酸或橋寡核苷酸複合體包括含獨特序列的條形碼，該獨特序列使得能夠列舉每個樣品的靶標序列。

此外，所公開實施方式的方面涉及：

實施方式1：高通量檢測多個樣品中一種或多種靶標核苷酸序列的方法，該方法包括以下步驟：

(i)為每個樣品中的每種靶標核苷酸序列提供：第一探針、第二探針和橋寡核苷酸；

並且其中，第二探針自分子的5'端起包括第二靶標特異性部分、可選的第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

並且其中，橋寡核苷酸包括與第一探針中的第一橋接寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列分別互補的序列，以及可選的第三條形碼；

並且其中，第一序列條形碼或第二序列條形碼或第三條形碼中的至少一者分別存在於第一探針或第二探針或橋寡核苷酸中；

並且其中，第一探針或第二探針或橋寡核苷酸中的至少一者包括核酸內切酶的識別序列；

並且其中，可選地，第一探針或第二探針或橋寡核苷酸中的至少一者包括第一捕獲部；

(ii)可選地，對於一種或多種靶標核苷酸序列中的每一種，在獨立的管中，使第一探針和第二探針，橋寡核苷酸或能夠彼此退火以形成橋寡核苷酸複合體的多個寡核苷酸接觸並允許自退火成多個連接複合體；

(額外步驟1)可選地，使來自步驟(ii)的連接複合體與含第二捕獲部的固體支持物接觸，允許第一捕獲部和第二捕獲部相互作用，使得雜交複合體與固體支持物相連，並且與固體支持物相連的連接複合體和未與固體支持物相連的連接複合體分離；

(iii)使待測靶標核苷酸序列的樣品中的每一個中存在的核酸與來自步驟(ii)或(額外步驟1)中的連接複合體接觸；

(iv)允許來自步驟(ii)或(額外步驟1)的連接複合體的第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分與靶標序列上基本相鄰的區段雜交，從而形成雜交複合體；

(額外步驟6)可選地，使待測靶標核苷酸序列的樣品中的每一個中存在的核酸與第一探針的第一靶標特異性部分和第二探針的第二靶標特異性部分接觸以與靶標序列上基本相鄰的區段雜交；

(額外步驟5)可選地，使來自步驟(額外步驟6)中的經靶標雜交的第一和第二探針與橋接接觸，從而形成雜交複合體；

(v)可選地，使來自步驟(iv)或步驟(額外步驟5)的雜交複合體與含第二捕獲部的固體支持物接觸，允許第一捕獲部和第二捕獲部相互作用，使得雜交複合體與固體支持物相連，並且與固體支持物相連的雜交複合體和樣品中未與固體支持物相連的組分分離；或使用固定在固體表面上的寡核苷酸，其通過與雜交複合體的部分反向互補而對雜交複合體具有親和力；

(vi)使用連接酶或多種連接酶或者連接酶與DNA聚合酶的組合，將來自步驟(iv)或步驟(額外步驟5)或步驟(v)的雜交複合體中的探針連接起來，以提供經連接的連接複合體，可選地使用含捕獲部的經修飾的核苷酸(包括但不限於內部氨基修飾劑、內部生物素修飾劑(生物素疊氮化物、生物素dT、脫硫生物素-TEG)、內部硫醇修飾劑、炔烴(int-5-octadiynyl dU)和內部疊氮化物(NHS酯))；

(額外步驟2)可選地，使經連接的連接複合體經受DNA變性條件，諸如加熱或鹼處理，以使橋寡核苷酸與雜交複合體解離；

(額外步驟3)可選地，使經連接的連接複合體與固體支持物接觸，該固體支持物可替代地包括第二捕獲部，允許第一捕獲部和第二捕獲部相互作用，使得雜交複合體與固體支持物相連，並且與固體支持物相連的雜交複合體與樣品未與固體支持物相連的組分分離；或使用能夠以高親和力與經修飾或未經修飾的DNA結合的固體支持物，或使用固定在固體表面上的互補寡核苷酸；

(vii)匯集來自多個樣品的經連接的連接複合體；

(viii)用鏈置換聚合酶通過滾環擴增從一個或多個經連接的連接複合體擴增核酸，以形成經擴增的一個或多個單鏈的多聯體序列，可選地使用含捕獲部的經修飾的核苷酸(包括但不限於內部氨基修飾劑、內部生物素修飾劑(生物素疊氮化物、生物素dT、脫硫生物素-TEG)、內部硫醇修飾劑、炔烴(int-5-octadiynyl dU)和內部疊氮化物(NHS酯))；

(ix)可選地，使步驟(viii)中獲得的經擴增的一個或多個單鏈的多聯體序列與含核酸內切酶的識別序列的特異性寡核苷酸退火，其中寡核苷酸與步驟(i)中特定的識別序列退火，從而獲得核酸內切酶的識別位點；

(x)用所述核酸內切酶切割在步驟(viii)中獲得的單鏈的多聯體序列或在步驟(ix)中獲得的經退火複合體；

(額外步驟4)可選地，使在步驟(viii)中獲得的多聯體序列與固體支持物接觸，該固體支持物可替代地包括第二捕獲部，允許第一捕獲部和第二捕獲部相互作用，使得多聯體序列與固體支持物相連，並將與固體支持物相連的多聯體序列和樣品未與固體支持物相連的組分分離；或使用能夠以高親和力與經修飾或未經修飾的DNA結合的固體支持物，或使用固定在固體表面上的互補寡核苷酸；

(xi)使步驟(x)中獲得的核酸片段經受高通量測序技術，以確定條形碼序列；以及

(xii)通過確定第一靶標特異性部分和/或第二靶標特異性部分的至少一部分，和/或第一條形碼和/或第二條形碼的至少一部分，和/或第三條形碼的至少一部分，來鑒別靶標核苷酸序列在多個樣品中的存在和/或數量；

其中步驟(vi)和步驟(vii)可按任何順序進行；

其中步驟(額外步驟1)、步驟(v)、(額外步驟3)或(額外步驟4)中的一個完成，

其中步驟(ii)或(額外步驟6)中的一個完成。

實施方式2：根據實施方式1的方法，其中多個樣品包括血液樣品、組織樣品、FFPE樣品、唾液樣品、尿液樣品或糞便樣品或從這些中的任一種提取的DNA。

實施方式3：根據實施方式1或2的方法，其中第一探針或者第二探針或者橋寡核苷酸中的至少一者包括第一捕獲部，其中該方法包括步驟(v)，並且該方法不包括步驟(v)之前富集核酸的步驟。

實施方式4：根據實施方式1至3中任一項的方法，其中第一探針或者第二探針或者橋寡核苷酸中的至少一者包括第一捕獲部，其中該方法包括步驟(v)，並且其中第一捕獲部是生物素部，且第二捕獲部是鏈黴親和素部或親和素部。

實施方式5：根據實施方式1至4中任一項的方法，其中第一探針或者第二探針或者橋寡核苷酸中的至少一者包括第一捕獲部，其中該方法包括步驟(v)，並且其中在步驟(v)和(vi)之間進行洗滌步驟。

實施方式6：根據實施方式1至5中任一項的方法，其中橋寡核苷酸包括：

(i)一至五個3'突出的鹼基，和/或

(ii)3'磷酸，和/或

(iii)在自3′端起的三個位置內的一個或多個硫代磷酸酯修飾，

實施方式7：根據實施方式1至6中任一項的方法，其中對第一探針的3'端或第二探針的5'端，或者這兩者進行修飾，以允許第一探針與第二探針的化學連接。

實施方式8：根據實施方式1至7中任一項的方法，其中第一探針或第二探針的橋接部分，或者這兩者包括經化學修飾的鹼基，以改進與橋寡核苷酸的結合。

實施方式9：根據實施方式1至8中任一項的方法，其中第一靶標特異性部分、第二靶標特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列彼此獨立地包括一個或多個經化學修飾的核苷酸。

實施方式10：根據實施方式1至9中任一項的方法，其中使用phi29聚合酶或Bst聚合酶進行步驟(viii)。

實施方式11：如請求項1至9中任一項的方法，其中在步驟(x)和步驟(xi)之間，使用與第一和第二探針的通用部分結合的引物進行PCR擴增，其中所述引物可選地包括用於步驟(xi)中的後續測序的接頭。

實施方式12：根據實施方式1至11中任一項的方法，其中通過對每種靶標和每個樣品的分子條形碼數量進行計數來允許對基因靶標進行列舉。

實施方式13：根據實施方式1至12中任一項的方法，其中對於兩個或更多個樣品或者對於兩個或更多個基因座/等位基因組合，使用條形碼序列對樣品的一種或多種序列和/或多態性(諸如SNP和/或插入缺失(indel))，進行基因分型。

實施方式14：包括多個容器的成套的試劑盒，其中至少一個容器容納一組或多組的第一探針和第二探針，並且至少一個容器容納一個或多個橋寡核苷酸；

其中，第二探針自分子的5'端起包括第二靶標特異性部分、可選的第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；

其中，橋寡核苷酸包括與第一探針中的第一橋寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列分別互補的序列，以及可選的第三條形碼；

其中，第一序列條形碼或第二序列條形碼或第三條形碼中的至少一者分別存在於第一探針或第二探針或橋寡核苷酸中；

並且其中，該成套的試劑盒進一步包括能夠與所述識別序列退火從而獲得所述核酸內切酶的識別位點的寡核苷酸。

實施例

方法

1.探針複合體的形成

探針複合體包含基因組靶向、樣品索引和構建Illumina測序文庫所需的序列。

能夠形成包括以下三部分的探針複合體(如圖2所示)：

(a)第一探針，從分子的5'端起具有第一橋寡核苷酸特異性序列，和位於第一探針的3'端的第一靶標特異性部分；

(b)第二探針，從分子的5'端起具有第二靶標特異性部分，第二序列條形碼，和位於第二探針的3'端的第二橋寡核苷酸特異性序列；以及

(c)橋寡核苷酸，其具有與第一探針中的第一橋寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列分別互補的序列；

通過在退火反應中使所有三部分(橋、右臂和左臂)以等摩爾量結合來構建探針複合體。反應在熱循環儀中進行(退火程序見表1)。

表1

2.靶標捕獲

靶向含有感興趣突變的特定基因組區域。經純化的DNA(例如來自組織、血漿、尿液或唾液)可以用作樣品，或者樣品可以是未純化的，只是經過預處理，例如煮沸和/或離心。

使探針複合體通過鹼基序列互補相互作用與靶標區域雜交。為了啟動靶標捕獲，反應探針和靶標DNA混合並在熱循環儀中孵育(靶標捕獲和間隙填補程序如表2所示)。

表2

3.間隙填補(GapFill)反應

靶標捕獲後，通過加入Phusion DNA聚合酶、核苷酸和Ampligase DNA連接酶的組合，並在+45℃下孵育45分鐘來延伸和連接探針複合體。

4.滾環擴增

延伸和連接後，使環形探針分子經受滾環擴增(RCA)。對於RCA反應，靶標捕獲反應與含EquipPhi29(Thermo Scientific)聚合酶的RCA反應混合物混合。該反應在+42℃下孵育30分鐘至2小時。RCA反應後，通過用Qubit螢光儀測量單鏈DNA(ssDNA)的濃度來分析反應效率。

5.酶消化

RCA反應產生長的多聯體ssDNA分子，其具有多個靶標文庫拷貝。每個完整的靶標文庫由EcoRI限制性內切酶識別序列分隔。該序列通過與含EcoRI限制性酶識別序列的特異性寡核苷酸退火，能夠對長的多聯體進行序列特異性切割，並釋放處準備好的靶標文庫。經過簡單的純化步驟後，這些文庫可用於進一步分析。RCA產物在+37℃下用EcoRI消化1小時。

6.文庫純化

EcoRI消化後，通過電泳後從瓊脂糖凝膠中提取文庫分子或使用尺寸選擇珠(諸如Macherey Nagel NucleoMag)來純化文庫分子。

7.測序

使用最先進的測序儀器對經純化的MiSeq或iSeq100兼容文庫進行序列分析。重要的是，通過簡單的寡核苷酸修飾，這些文庫可以轉換成適合任何現有測序平臺的文庫。結合使用Unix命令行工具以及Python和R編程語言來處理測序數據。簡而言之，序列處理的原理是鑒定每個讀長中的探針序列，對它們之間的基因組區域進行測序，並對與每個基因靶標相關的分子條形碼的數量進行計數。

實驗1

在第一個實驗中，探針混合物是帶來四個重複反應的四個不同索引探針的集合。它們靶向EML-ALK融合體。靶標寡核苷酸具有獨特的識別序列，允許鑒別每個靶標。

作為樣品，將三種合成靶標寡核苷酸以對數遞增的濃度混合。如上所述進行靶標捕獲、延伸和連接反應、滾環擴增和隨後的EcoRI消化。典型結果示例如圖3所示。

利用MiSeq和iSeq100儀器對準備好的文庫進行測序，通過匹配每個讀長中的探針序列，鑒定探針序列之間的基因組序列區域，對分子條形碼進行計數，來檢測序列數據中的靶標區域。計數數據準確地反映了插入模板分子的數量，檢測到的訊號對靶標分子的存在具有高度特異性(圖4)。

圖1和圖2的詳細描述

圖1示出了本發明的一個實施方式的工作流程。在步驟1中，使樣品(102)內的核酸(DNA或RNA)與一組連接複合體(104)接觸。連接複合體在靶標核酸(106)上退火。在步驟2中，從樣品材料可選地捕獲結合靶標的連接複合體，留下樣品雜質(103)。在步驟3中，使經退火的連接複合體進行連接，得到經連接的連接複合體。在步驟4中，將來自多個樣品(110)的經連接的連接複合體匯集在一起(112)。在步驟5中，使用phi29聚合酶或其他鏈置換聚合酶通過滾環擴增來擴增探針序列，獲得探針的長的多聯體拷貝(116)。在步驟6中，使用限制性核酸內切酶(例如EcoRI)或歸巢核酸酶(例如I-CeuI)將多聯體探針拷貝可選地切割成單體單元，並可選地使用PCR或乳濁液PCR進一步擴增(117)。在步驟7中，使用下一代DNA測序對經擴增的DNA進行測序。在步驟8中，使用生物信息學管線將DNA測序結果轉換為靶標計數。

圖2A示出了根據本文實施方式的具有多個探針實體的探針三聯體的原理結構。多個探針實體包括在樣品退火之前組裝的左探針、右探針和橋寡核苷酸。左探針的第一個鹼基(202)可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾，稱為修飾1。左探針的15-25個鹼基(204)包括橋結合序列1，其進一步可包括經化學修飾的鹼基，用於有效結合橋接寡核苷酸，稱為橋接位點1。左探針自5'端進一步可選地包括後續10-20個鹼基(206)，其包括隨機核苷酸的片段，其形成稱為條形碼1的分子特異性條形碼或樣品特異性條形碼。左探針自5'端進一步包括後續15-30個鹼基(208)，與基因靶標結合。204或208的一些或全部核苷酸可包括化學修飾，以增加探針對靶標或橋寡核苷酸 (226)的親和力。左探針的最後一個鹼基(210)可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾，被稱為修飾1。

右探針的第一個鹼基(214)可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾，稱為修飾2。右探針自5'端的15-30個鹼基(216)包括右探針與基因靶標結合的部分。右探針自5'端的後續10-20個鹼基(218)可選地包括隨機核苷酸的片段，其形成分子特異性條形碼或樣品特異性條形碼，稱為條形碼2。右探針的最後15-25個鹼基(220)包括有效結合橋寡核苷酸的序列，稱為橋接序列2。204、208、216或220的一些或全部核苷酸可包括化學修飾，以增加探針對靶標或橋寡核苷酸的親和力。

橋寡核苷酸5'端的前15-25個鹼基(228)，稱為橋序列3，與右探針的橋序列1(204)反向互補，並且可選地包括經化學修飾的核苷酸，用於增加結合。橋的最後15-25個鹼基(224)，稱為橋序列2，與左探針的橋序列2序列(220)反向互補，並且可選地包括經化學修飾的核苷酸，用於增加結合。這裡的橋序列(226)包括限制性核酸內切酶(諸如EcoRI)或歸巢核酸內切酶(諸如I-CeuI)的識別位點。橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部(230)。

圖2B示出了根據本文實施方式的第一探針和第二探針之間的間隙填補。此處，橋寡核苷酸包含橋序列1(228)和橋序列2(224)之間的間隙1。間隙2形成在探針1和2(208和216)的靶標結合部分之間。通過引入聚合酶和一種或多種核苷酸來填補這些間隙。在此過程中，可使用Stoffel片段、Taq聚合酶或Phusion聚合酶，和DNA連接酶(例如Ampligase)的混合物。聚合酶添加(a)與通用橋寡核苷酸序列互補和(b)與靶標序列互補的核苷酸，從而填補第一探針和第二探針之間的兩個間隙，即間隙1和間隙2，DNA連接酶的後續作用使得與橋寡核苷酸與靶標序列互補的左探針和右探針連接成環形複合體。

圖2C示出了根據本文的實施方式的具有多個探針實體的探針五件套的原理結構。多個探針實體包括左探針、右探針和由三個寡核苷酸組成的橋。此處，探針複合體包括左探針和第二橋(228和236)之間、第二橋和右探針(240和222)之間、第一和第三橋寡核苷酸(238和242)之間以及左和右探針(208和216)之間的間隙。通過引入聚合酶和一種或多種核苷酸來填補這些間隙。在此過程中，可以使用Stoffel片段、Taq聚合酶或Phusion聚合酶和DNA連接酶(諸如Ampligase)的混合物。聚合酶填補這些間隙，並且DNA連接酶的後續作用使得探針和橋寡核苷酸連接成環形複合體。

左探針的15-25個鹼基(228)包括橋結合序列1，該序列可選地包括用於經化學修飾的鹼基，用於有效結合橋寡核苷酸，被稱為橋序列1。左探針自5'端進一步可選地包括後續10-20個鹼基(204)，其包括用於文庫索引的通用序列。左探針自5'端進一步可選地包括後續10-20個鹼基(206)，其包括隨機核苷酸的片段，其形成被稱為條形碼1的分子特異性條形碼或樣品特異性條形碼。左探針自5'端進一步包括來後續15-30個鹼基(208)，與基因靶標結合。228的一些或全部核苷酸可包括化學修飾，以增加探針對靶標或橋(226)的親和力。左探針的最後一個鹼基(210)可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾，被稱為修飾1。

右探針的第一個鹼基(214)可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針的5'端的修飾，被稱為修飾2。右探針自5'端的15-30個鹼基(216)包括右探針與基因靶標結合的部分。右探針自5' 端的後續10-20個鹼基(218)可選地包括隨機核苷酸的片段，其形成分子特異性條形碼或樣品特異性條形碼(被稱為條形碼2)。右探針自5'端的後續10-20個鹼基(220)可選地包括通用序列。右探針的最後15-25個鹼基(222)稱為橋序列8，與第三橋寡核苷酸(224)的橋序列7反向互補。208、216、222或228的一些或全部核苷酸可包括化學修飾，以增加探針對靶標或橋寡核苷酸的親和力。

第一橋寡核苷酸自5'端起的前15-25個鹼基(226)被稱為橋序列3，與右探針的橋序列1(228)反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第一橋寡核苷酸的最後15-25個鹼基(238)被稱為橋序列2，與第二橋寡核苷酸的橋序列4(236)序列反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第一橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部(230)。

第二橋寡核苷酸自5'端起的前15-25個鹼基(240)被稱為橋序列5，與第三橋寡核苷酸的橋序列6(242)反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第二橋寡核苷酸的最後15-25個鹼基(236)被稱為橋序列4，與第一橋寡核苷酸的橋序列2(238)序列反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。

第三橋寡核苷酸自5'端起的前15-25個鹼基(242)被稱為橋序列6，與第二橋寡核苷酸的橋序列5(240)序列反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第一橋寡核苷酸的最後15-25個(224)鹼基被稱為橋序列7，與右探針的橋序列8(222)序列反向互補，並且可選地包括經化學修飾的核苷酸以增加結合。第三橋寡核苷酸的3'端可選地包括磷酸(或其他可裂解)部(234)，以防止在間隙填補期間的延伸。