CN116287159A - 小rna的新型检测方法及其应用 - Google Patents
小rna的新型检测方法及其应用 Download PDFInfo
- Publication number
- CN116287159A CN116287159A CN202111571180.5A CN202111571180A CN116287159A CN 116287159 A CN116287159 A CN 116287159A CN 202111571180 A CN202111571180 A CN 202111571180A CN 116287159 A CN116287159 A CN 116287159A
- Authority
- CN
- China
- Prior art keywords
- srna
- rna
- dna
- linker sequence
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种小RNA的新型检测方法及其应用。本发明揭示了新型的检测sRNA 3’端修饰的方法,包括TANT‑seq和TE‑qPCR方法。本发明所披露的检测方法为sRNA‑cP的检测和鉴定提供了新的技术手段,同时也为一次性定性/半定量/定量鉴定多种末端修饰的sRNA提供了新思路。
Description
技术领域
本发明属于生物技术领域,更具体地,本发明涉及小RNA的新型检测方法及其应用。
背景技术
小RNA(sRNA)是生物体内一类重要的特殊分子,目前认为此类特殊分子能够诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多生命活动的调控过程。
高通量测序技术的发展极大地促进了小RNA(sRNA)的发现,例如miRNA,piRNA,tsRNA(tRNA-derived small RNA),srRNA(small rDNA-derived RNA)等。miRNA是一类长度在15-30nt范围内的具有重要生物学调控作用的sRNA,通过和靶标RNA互补配对参与多种生物学过程。
本领域中,目前常规sRNA高通量测序文库构建策略主要是通过在sRNA的3’末端加上接头序列,而添加接头序列的连接反应是基于T4 RNA连接酶2。T4 RNA连接酶2可特异性地将接头序列连接到sRNA的3’末端-OH上。
然而,鉴于目前关于sRNA 3’端修饰的研究尚不明确,这样的测定方法是否能够反映细胞内所存在的sRNA的全貌,在本领域中是不够清楚的。
发明内容
本发明的目的在于提供小RNA的新型检测方法及其应用。
在本发明的第一方面,提供一种检测sRNA的末端修饰的方法,所述末端修饰包括3’-OH和3’-cP修饰,所述方法包括:
(a)提供待测sRNA,使其中存在3’-OH的sRNA的3’端连接上标记3’-OH的接头序列;
(b)对(a)的产物进行脱磷酸化处理,获得5’端和3’端脱去磷酸的产物;
(c)对(b)的产物进行氧化处理,使3’-OH发生氧化,分离(回收)sRNA;
(d)对(c)的产物进行磷酸化处理,获得携带5’-P的产物;
(e)使(d)的产物中存在3’-cP的sRNA连接上标记3’-cP的接头序列;
(f)根据标记3’-OH的接头序列、标记3’-cP的接头序列,鉴定(f)的产物中含有3’-OH和3’-cP的sRNA。
在一个或多个实施方式中,(a)中,所述标记3’-OH的接头序列、标记3’-cP的接头序列、标记sRNA的5’-接头序列的序列各不相同。
在一个或多个实施方式中,(a)或(e)中,所述接头序列为适当长度的接头序列,如5-100nt,例如但不限于10、12、16、18、20、25、30nt等,优选地如16nt。
在一个或多个实施方式中,(c)中,特定长度为根据研究对象的不同而感兴趣的sRNA的长度,如10-150nt,例如但不限于12、16、18、20、25、30、50、60、80、100、120nt等,优选地如16nt,优选地如15-46nt的sRNA。
在一个或多个实施方式中,(a)中,利用T4 RNA连接酶2连接标记3’-OH的接头序列。
在一个或多个实施方式中,(b)中,以碱性磷酸酶(AP)进行脱磷酸化处理。
在一个或多个实施方式中,(c)中,以高碘酸钠(NaIO4)进行氧化处理。
在一个或多个实施方式中,(d)中,以T4多聚合核苷酸激酶(3’磷酸酶缺失)(较佳地为T4 Pnk 3’phosphatase minus)进行磷酸化处理。
在一个或多个实施方式中,(e)中,以RtcB连接反应连接标记3’-cP的接头序列。
在一个或多个实施方式中,在(e)和(f)之间,还包括:在(e)的产物的5’端连接上标记sRNA的5’-接头序列;较佳地,利用T4 RNA连接酶1(T4 Rnl1)连接标记sRNA的5’-接头序列。
在一个或多个实施方式中,(f)中,根据标记3’-OH的接头序列、标记3’-cP的接头序列的存在情况(定性)/存在量(定量),确定携带3’-OH和携带3’-cP的sRNA的存在情况或存在量;较佳地,标记3’-OH的接头序列、标记3’-cP的接头序列、标记sRNA的5’-接头序列为配合规模化测序的接头序列(如携带常规sRNA测序的P5和P7高通量测序上机序列)。
在一个或多个实施方式中,(f)中,对产物进行鉴定的方法包括(但不限于):定量PCR法,测序法,Northern blot法。
在一个或多个实施方式中,(f)后,还包括:通过高通量测序,去除所述的标记3’-OH的接头序列、标记3’-cP的接头序列,根据鉴定结果,建立子文库。
在一个或多个实施方式中,规模化检测(如全细胞sRNA检测)时,(a)中所述待测sRNA形成一个文库;经由所述方法进行测定后,根据(f)的鉴定结果,形成3’-OH的sRNA子文库、3’-cP修饰的sRNA子文库。
在一个或多个实施方式中,(a)的反应体系中包括:在待测sRNA中加入标记3’-OH的接头序列(如,含有3’-OH子文库条形码的App-DNA12-ddC接头序列),T4 RNA连接酶反应缓冲液,PEG8000,T4 RNA连接酶2,核糖核酸酶抑制剂。较佳地,样品置于16±3℃或16±2℃或16±1℃孵育10-20小时(如16小时)。
在一个或多个实施方式中,在(a)的反应体系反应之后,包括酶失活的步骤;较佳地,进行热失活,如在70±10℃热失活。
在一个或多个实施方式中,(b)的反应体系中包括:CutSmart缓冲液,核糖核酸酶抑制剂,碱性磷酸酶。较佳地,样品置于37±3℃或37±2℃或37±1℃孵育30±10分钟或30±5分钟。
在一个或多个实施方式中,在(b)的反应体系反应之后,包括酶失活的步骤;较佳地,进行热失活,如在70±10℃热失活。
在一个或多个实施方式中,所述碱性磷酸酶包括虾碱性磷酸酶。
在一个或多个实施方式中,(c)的反应体系中包括:NaIO4,核糖核酸酶抑制剂。较佳地,样品置于冰上,黑暗条件下孵育40±20分钟或40±10分钟。
在一个或多个实施方式中,(c)中,利用乙醇-乙酸钠进行沉淀、PAGE分离后回收15-46nt的sRNA。
在一个或多个实施方式中,(d)的反应体系中包括:T4 Pnk 3’phosphataseminus;之后抽提核酸,乙醇-乙酸钠沉淀。
在一个或多个实施方式中,(e)的反应体系中包括:标记3’-cP的接头序列(如,包含3’-cP子文库条形码的OH-RNA13-ddC接头序列),RtcB反应缓冲液,Mn2+离子,GTP,RtcB连接酶,核糖核酸酶抑制剂。较佳地,样品置于37±3℃或37±2℃或37±1℃孵育120±30分钟或120±15分钟。
在一个或多个实施方式中,在(e)的反应体系反应之后,包括酶失活的步骤;较佳地,进行热失活,如在70±10℃热失活。
在一个或多个实施方式中,在(e)的反应体系反应之后,包括分离连接产物,选择长度在31-46nt范围内的带有接头序列sRNA,回收。
在一个或多个实施方式中,(e)之后,RNA 5’接头序列连接反应的反应体系包括:标记sRNA的5’-接头序列(如,OH-RNA14-OH接头序列),T4 RNA连接酶反应缓冲液,PEG8000,ATP,T4 RNA连接酶1,核糖核酸酶抑制剂。较佳地,样品在25±3℃或25±2℃条件下反应2±1小时或2±0.5小时。较佳地,反应之后,包括酶失活的步骤;较佳地,进行热失活,如在70±10℃热失活。
在一个或多个实施方式中,反转录体系包括:反转录引物,SSIV缓冲液,反转录酶,DTT,dNTP,核糖核酸酶抑制剂。较佳地,样品在50±3℃或50±2℃条件下孵育1±0.5小时或1±0.2小时。较佳地,反应之后,包括酶失活的步骤;较佳地,进行热失活,如在80±10℃热失活。
在一个或多个实施方式中,反转录之后进行PCR扩增。
在本发明的另一方面,提供一种检测sRNA的末端修饰的方法,所述末端修饰包括3’-OH、3’-cP和3’-P,所述方法包括:
(1)提供待测sRNA,将其分成三组,分别以溶剂、碱性磷酸酶和T4多聚合核苷酸激酶处理:
溶剂组不变,
碱性磷酸酶组中,原3’-P修饰的sRNA的3’末端转变为3’-OH,
T4多聚合核苷酸激酶(非“T4 Pnk 3’phosphatase minus”;较佳地具体为T4 Pnk)组中,原3’-P修饰和原3’-cP修饰的sRNA的3’末端均转变为3’-OH;
(2)对(1)的产物进行聚腺苷化反应(PAP),使3’-OH的sRNA的3’端聚腺苷化(形成PolyA尾巴:
溶剂组中,仅原3’-OH的sRNA的3’端聚腺苷化,
碱性磷酸酶组中,原3’-OH和原3’-P修饰的sRNA的3’端聚腺苷化,
T4多聚合核苷酸激酶组中,原3’-OH、原3’-P修饰和原3’-cP修饰的sRNA的3’端聚腺苷化;
(3)对(2)的产物进行反转录反应:
溶剂组中,仅原3’-OH的sRNA的经3’端聚腺苷化的产物形成cDNA,
碱性磷酸酶组中,原3’-OH和原3’-P修饰的sRNA的经3’端聚腺苷化的产物形成cDNA,
T4多聚合核苷酸激酶组中,原3’-OH、原3’-P修饰和原3’-cP修饰的sRNA的经3’端聚腺苷化的产物形成cDNA;
(4)对(3)的反转录反应的产物进行定性或定量测定。
在一个或多个实施方式中,(3)中,进行反转录反应时,采用含有oligo dT的反转录引物(如OH-DNA15-OH)。
在一个或多个实施方式中,(1)中,所述的溶剂包括(但不限于):水,缓冲液。
在一个或多个实施方式中,(4)中,通过定量PCR进行定性或定量测定;较佳地,所述定量PCR为实时荧光定量PCR;更佳地,通过测定不同组的Ct值定量:溶剂组中,Ct值反映3’-OH的sRNA的量;碱性磷酸酶组中,Ct值反映3’-OH和3’-P修饰的sRNA的量;T4多聚合核苷酸激酶组中,Ct值反映3’-OH、3’-P和3’-cP修饰的sRNA的量。
在一个或多个实施方式中,(4)中,根据下列公式计算3’-OH,3’-P和3’-cP的相对含量:
(3′-OH)%=100%-(3′-P)%-(3′-cP)%。
在一个或多个实施方式中,还包括,将所述方法获得的sRNA产物进行进一步的细分;较佳地,所述方法获得的sRNA产物与sRNA的信息库或数据库进行比对,从而进行sRNA的细分。
在一个或多个实施方式中,规模化检测(如全细胞sRNA检测)时,(1)中所述待测sRNA形成一个文库;经由所述方法进行测定后,根据(4)的测定结果,形成3’-OH的sRNA子文库、和3’-cP修饰的sRNA子文库。
在一个或多个实施方式中,所述sRNA产物进一步细分为包括但不限于以下分子:tsRNA,miRNA,piRNA,snoRNA,snRNA,sinRNA,sgmRNA,smRNA,slncRNA,smcRNA,srpRNA等。
在一个或多个实施方式中,所述信息库或数据库包括但不限于:不同物种来源的rRNA数据库,GtRNAdb和mitotRNAdb数据库,来自miRbase和Ensembl中的miRNA数据库,来自piRNAdb中的piRNA数据库,来自Ensembl中的snRNA,snoRNA,lncRNA,miscRNA和otherncRNA数据库,来自Ensembl中的内含子数据库,来自Ensembl中的mature mRNA,IG gene,TRgene,Pseudogene,来自UCSC Genome Browser的重复序列数据库(RepeatMasker,GRCm38/mm10或GRCh38/hg38),基因组数据库(GRCm38/mm10或GRCh38/hg38),线粒体基因组数据库(NC_005089.1或NC_012920.1)等。
在一个或多个实施方式中,根据形态,所述待测sRNA包括(但不限于):来自细胞的总sRNA,局部获取或分离的sRNA。
在一个或多个实施方式中,根据物种,所述sRNA包括:动物、植物或微生物来源的sRNA。
在一个或多个实施方式中,所述动物包括(但不限于):哺乳动物、鱼类、禽类、两栖动物、昆虫。
在一个或多个实施方式中,所述植物包括(但不限于):单子叶植物,双子叶植物。
在一个或多个实施方式中,所述待测sRNA包括但不限于来自细胞(培养物)、组织、血液、血清、血浆、尿液、唾液、脑脊髓液的生物样品。
在本发明的另一方面,提供前面任一所述的方法的应用,包括用于检测sRNA的末端修饰;所述的sRNA的末端修饰包括选自:(a)3’-OH和3’-cP修饰;或,(b)3’-OH、3’-P和3’-cP修饰。
在本发明的另一方面,提供前面任一所述的方法的应用,包括用于建立细胞的sRNA的3’-OH和3’-cP末端修饰的sRNA的表达谱/图谱/文库,或建立3’-OH、3’-P和3’-cP末端修饰的sRNA的表达谱/图谱/文库。
在一个或多个实施方式中,sRNA末端修饰的区分进一步被用于测定特定的生物状态(包括生理变化或病理变化)。
在一个或多个实施方式中,sRNA末端修饰的区分进一步被用于筛选调节sRNA末端修饰的效应分子(如基因、蛋白、化合物等,具体如Ang和/或RNase 4在体外或细胞内显著增加sRNA-cPs产生)。
在本发明的另一方面,提供一种用于检测sRNA的末端修饰的试剂盒,其中包括下组试剂:检测sRNA的3’-OH和3’-cP末端修饰的试剂:T4 RNA连接酶2、碱性磷酸酶、高碘酸钠、T4多聚合核苷酸激酶(3’磷酸酶缺失,较佳地为T4 Pnk 3’phosphatase minus)、RtcB连接酶、标记3’-OH的接头序列、标记3’-cP的接头序列、标记5’的接头序列。
在本发明的另一方面,提供一种用于检测sRNA的末端修饰的试剂盒,其中包括下组试剂:检测sRNA的3’-OH、3’-P和3’-cP末端修饰的试剂:溶剂、碱性磷酸酶和T4多聚合核苷酸激酶(非“T4Pnk 3’phosphatase minus”;较佳地其具体为T4 Pnk)。
在一个或多个实施方式中,所述T4 RNA连接酶2包括KQ截短型T4 RNA连接酶2(T4Rnl2)。
在一个或多个实施方式中,所述碱性磷酸酶包括虾碱性磷酸酶。
在一个或多个实施方式中,T4多聚合核苷酸激酶为3’磷酸酶突变的酶。
在一个或多个实施方式中,各个试剂分装于不同的容器/包装中,置于所述试剂盒中。
在一个或多个实施方式中,其中还包括(但不限于)选自下组的试剂:spike-in混合物,T4 RNA连接酶反应缓冲液,水(包括无核酸酶水),PEG8000,核糖核酸酶抑制剂,CutSmart缓冲液,核酸沉淀试剂(如乙醇-乙酸钠),核酸抽提试剂(如苯酚-氯仿),RtcB反应缓冲液,Mn2+离子溶液,GTP,ATP,反转录引物,SSIV缓冲液,SuperScript IV反转录酶,DTT,dNTP,DNA聚合酶。
在本发明的另一方面,提供Ang和/或RNase 4的应用,用于促进sRNA-cP的形成;较佳地,所述的促进包括体外或胞内的促进。
在一个或多个实施方式中,本发明前面任一所述的方法或应用为非诊断性/非治疗性的方法或应用。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、小鼠肝脏中15-30nt sRNA主要为sRNA-cP。
(a)T4 RNA连接酶2连接反应表明只有少数15-30nt sRNA能被App-DNA3-ddC连接。
(b)聚腺苷化反应显示绝大多数sRNA不能加上聚腺苷化尾。
(c)LC-MS/MS质谱检测发现小鼠肝脏15-30nt sRNA存在大量修饰。数字标识分别代表如下修饰1,m1A;2,2’,3’-cUMP;3,2’,3’-cGMP;4,2’,3’-cAMP;5,2’,3’-cCMP;6,m6A;7,m3C;8,ψ;9,I;10,m5C;11,Um;12,m2 2G。
(d)LC-MS/MS检测结果中15-30nt sRNA末端环磷酸修饰的定量统计。
(e-f)通过T4 RNA连接酶2连接反应(e)和聚腺苷化反应(f)分析15-30nt sRNA末端修饰。
(g)定量统计e,f中sRNA-OH和sRNA-cP比例。
图2、TANT-seq测序表明哺乳动物15-30nt sRNA-OH和sRNA-cP存在多种高丰度sRNA类型。
(a)TANT-seq流程示意图。
(b)TANT-seq检测小鼠肝脏sRNA-OH和sRNA-cP相对含量。
(c)小鼠肝脏中不同类型sRNA-OH和sRNA-cP相对miRNA-OH的丰度。
(d)哺乳动物不同类型15-30nt sRNA中不同类别sRNA含量分析。#表示3’-OH和3’-cP子文库之间存在显著变化。
(e)小鼠肝脏中15-30nt sRNA的长度分布情况。
(f)在3’-OH和3’-cP子文库中tsRNA种类存在显著差异。
(g)3’-OH和3’-cP子文库中的的全部sRNA或丰度排名前1000的sRNA序列重叠性分析。
图3、TE-qPCR和Northern blot验证TANT-seq数据。
(a)TE-qPCR检测3’-OH,3’-P或3’-cP sRNA示意图。
(b)合成标准品sRNA验证TE-qPCR效果。
(c-d)分别用TE-qPCR检测小鼠肝脏(c),Hepa 1-6和NIH/3T3细胞(d)中特定sRNA。
(e)小鼠肝脏15-30nt sRNA用AP或T4 Pnk处理后,通过T4 RNA连接酶2连接反应后,用Northern blot检测特定sRNA末端修饰。
(f)TE-qPCR检测禁食、高脂饮食和db/db小鼠肝脏中特定sRNA含量。
图4、哺乳动物sRNA-cP产生部分依赖于Ang和RNase 4。
(a)小鼠肝脏15-30nt sRNA-cP 3’和5’端碱基保守性分析。
(b)RNase A或RNase T1处理小鼠肝脏总RNA后对应RNA变化情况。a,P<0.05;b,P<0.01;c,P<0.001。
(c)小鼠肝脏中RNase A家族成员的mRNA表达量分析。
(d)RNase A、Ang或RNase 4处理小鼠肝脏总RNA后对应RNA变化情况。
(e)Ang或RNase 4处理小鼠肝脏总RNA后,Northern blot分析特定sRNA表达量。箭头表示预期序列大小。
(f)TE-qPCR检测显示,转染Ang或RNase 4蛋白到RNH1敲除的Hepa 1-6细胞中部分sRNA-cP表达量显著升高。
(g)Northern blot结果表明RNH1敲除的Hepa 1-6细胞中转染Ang或RNase 4蛋白后部分sRNA-cP表达量显著升高。
(h-i)TE-qPCR(h)和Northern blot(i)检测重组核糖核酸酶抑制剂预处理的Hepa1-6细胞中部分sRNA表达量。
(j)火山图展示AKO、RKO和DKO Hepa 1-6细胞中sRNA-OH和sRNA-cP变化情况。
(k)TE-qPCR检测部分sRNA在AKO、RKO和DKO Hep G2敲除细胞系中的变化情况。
图5、LC-MS/MS分析RNA修饰。
(a-d)2’,3’-cAMP(a),2’,3’-cUMP(b),2’,3’-cCMP(c)and 2’,3’-cGMP(d)四种环磷酸修饰的电喷雾电离质谱图。
(e)LC-MS/MS质谱分析组织和细胞中sRNA修饰。
(f)定量统计组织和细胞中sRNA环磷酸修饰。
图6、小鼠和人15-30nt sRNA主要为sRNA-cP。
(a)聚腺苷化实验分析多种组织和细胞中15-30nt sRNA末端修饰。
(b)定量分析图2a中聚腺苷化实验结果。
(c)定量比较多种组织和细胞中15-30nt sRNA-OH和sRNA-cP含量。
图7、sRNA文库构建策略验证。
(a)RtcB连接酶特异性连接3’末端为3’-P或3’-cP的sRNA。
(b)sRNA文库构建中的的关键步骤汇总表。
(c)15%变性PAGE分析经T4 RNA连接酶2连接、AP去磷酸、NaIO4氧化、乙醇沉淀后连接产物,表明仅sRNA-OH与App-DNA12-ddC连接。矩形框内的产物通过胶回收用于下一步反应。
(d)15%变性PAGE分析经T4 Pnk(3’磷酸酶缺失)处理,苯酚-氯仿抽提,RtcB连接酶连接的连接产物,表明不同建库策略可将末端为3’-P和3’-cP的sRNA与OH-RNA13-ddC连接。矩形框内的产物通过胶回收用于下一步反应。
(e)7.5%非变性PAGE分析最终扩增的文库。
(f)qPCR检测不同文库构建策略对合成RNA标准品的扩增效率。
图8、Hepa 1-6和Hep G2细胞TANT-seq高通量测序数据分析。
(a)TANT-seq检测样品中外源添加spike-in分布情况。
(b)小鼠肝脏15-30nt sRNA TANT-seq高通量测序结果重复性分析。Pearson相关系数表明独立重复实验高度重叠。
(c,e)Hepa 1-6和Hep G2细胞中15-30nt sRNA-OH和sRNA-cP相对丰度。
(d,f)TANT-seq揭示Hepa 1-6和Hep G2细胞中含有大量高丰度的不同类型sRNA。
(g,h)Hepa 1-6和Hep G2细胞中15-30nt sRNA的长度分布情况。
(i,j)Hepa 1-6和Hep G2细胞中3’-OH和3’-cP子文库中tsRNA种类存在显著差异。
图9、sRNA-OH和sRNA-cP序列重叠性分析。
(a-c)小鼠肝脏(a)、Hepa 1-6(b)或Hep G2(c)细胞中,3’-OH和3’-cP子文库之间的sRNAs仅存在少量重叠。
图10、TE-qPCR和Northern blot验证TANT-seq测序结果。
(a,b)小鼠(a)和人源(b)样品中,TE-qPCR验证TANT-seq数据。
(c,d)小鼠肝脏组织中,通过T4 RNA连接酶2连接反应(c)和聚腺苷化反应(d)结合Northern blot验证sRNA末端修饰。
图11、15-30nt sRNA-OH和sRNA-cP碱基保守性分析。
(a)小鼠肝脏15-30nt sRNA-OH 3’和5’端碱基保守性分析。
(b)小鼠肝脏中不同类型sRNA 3’端碱基保守性分析。
(c)Hepa 1-6细胞15-30nt sRNA碱基保守性分析。
(d)Hep G2细胞15-30nt sRNA碱基保守性分析。
图12、Ang和RNase 4是部分sRNA-cPs产生必需的。
(a,b)重组Ang(a)和RNase 4(b)蛋白纯度鉴定。
(c)定量分析图4e中Ang或RNase 4酶切小鼠肝脏总RNA后的sRNA相对表达量。
(d)Hepa 1-6细胞中转染Ang或RNase 4蛋白后增加部分sRNA表达量。
(e)RNH1敲除Hepa 1-6细胞DNA测序结果。
(f)定量分析图4g中Ang或RNase 4酶切后的sRNA相对表达量。
(g)Ang和RNase 4单敲除Hepa 1-6细胞和Ang/RNase 4双敲除Hepa 1-6细胞DNA测序结果。
(h)TE-qPCR检测AKO、RKO和DKO Hepa 1-6细胞中部分sRNA表达量。
(i)重组核糖核酸酶抑制剂预处理的Hepa 1-6细胞中15-30nt sRNA含量检测和定量。15-30nt RN A定量统计用5S rRNA表达水平归一化。
(j)Northern blot检测WT、AKO、RKO和DKO Hepa 1-6细胞中部分sRNA表达量。
(k)定量分析图4i和图12j中Northern blot检测结果。
(l)Ang和RNase 4单敲除Hep G2细胞和Ang/RNase 4双敲除Hep G2细胞DNA测序结果。
图13A、鼠肝细胞或Hepa1-6细胞中TANT-seq鉴定到的代表性15-30nt sRNA-OH。
图13B、鼠肝细胞或Hepa1-6细胞中TANT-seq鉴定到的代表性15-30nt sRNA-cP。
图13C、人Hep G2细胞通过TANT-seq中鉴定到的代表性15-30nt sRNA-OH。
图13D、人Hep G2细胞通过TANT-seq中鉴定到的代表性15-30nt sRNA-cP。
具体实施方式
sRNA广泛存在修饰,在sRNA测序中,当sRNA 3’端存在化学修饰时会严重阻碍连接反应进行。本发明人在深入研究后,揭示了新型的检测sRNA 3’端修饰的方法,包括TANT-seq和TE-qPCR方法。本发明所披露的检测方法为sRNA-cP的鉴定提供了全新的技术手段,也为多种sRNA末端修饰的一次性定性/半定量/定量鉴定提供了新思路。
术语
如本发明所用,术语“sRNA(小分子RNA,small RNA)”是指在生物体中表示的短的RNA,通常指长度小于200nt的RNA(如5-199nt,具体如10、15、20、25、30、40、50、60、80、100、120、140、150、160、180或190)。sRNA通常不翻译成蛋白质且通过互补结合有效抑制特定mRNA的翻译,包括但不限于参与诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多调控过程。
如本发明所用,“待测sRNA”没有特别的限制,其可以是来自细胞的总sRNA,局部获取或分离的sRNA;其可以为来自动物、植物或微生物来源的sRNA。
如本发明所用,“seq”为测序的简称。“RNA-seq”表示RNA测序;“sRNA-seq”表示sRNA测序。sRNA-seq包括使sRNA物质富集并对其进行测序,小RNA物质诸如微小RNA(miRNA)、Piwi相互作用RNA(piRNA)、小核仁RNA(snoRNA)、转运RNA来源的小RNA(tsRNA)、核糖体RNA来源的小RNA片段(rsRNA)、小rRNA来源的RNA(srRNA)等。sRNA-seq可结合高通量测序平台来进行。通常,sRNA测序文库制备包括从样品中分离总RNA,大小分级,测序连接序列的连接,逆转录和PCR扩增,以及DNA测序。
如本发明所用,除非另外说明,5’-P为sRNA的3’磷酸修饰的简称,3’-OH为3’羟基修饰的简称,3’-cP为sRNA的3’环磷酸修饰的简称。
如本发明所用,srRNA为small rDNA-derived RNA的简称;tsRNA为tRNA-derivedsmall RNA的简称;snoRNA为核仁小RNA(small nucleolar RNA)的简称;snRNA为小核RNA(small nuclearRNA,snRNA)的简称;sinRNA为小内含子RNA的简称;sgmRNA为小基因组衍生RNA的简称;smRNA为小成熟mRNA的简称;slncRNA为小lncRNA的简称;piRNA为与Piwi蛋白相作用的RNA(Piwi-interactiing RNA)的简称;smcRNA为小miscRNA的简称;srpRNA为小重复元件衍生RNA的简称。
如本发明所用,“TANT-seq”为本发明提出的一种sRNA高通量测序方法,其是基于T4 Rnl2/AP/NaIO4/T4 Pnk/RtcB的sRNA-seq方法。
如本发明所用,“TE-qPCR”为本发明提出的一种同时检测RNA三种3’末端的qPCR方法。
检测sRNA的末端修饰的方法
本发明首先提供了一种区分sRNA的3’-OH和3’-cP末端修饰的方法,称为TANT-seq,这一方法可同时实现两种末端修饰的同时定性和定量分析,可配合高通量测序平台,可满足高通量测序的需求。这一方法可实现从建立的sRNA总文库中进行末端修饰的区分、进而根据修饰的不同建立子文库。
所述TANT-seq高通量测序方法主要基于多个步骤的处理,包括:(a)使待测sRNA中存在3’-OH的sRNA的3’连接上标记3’-OH的接头序列;(b)对(a)的产物进行脱磷酸化处理;(c)对(b)的产物进行氧化处理;(d)对(c)的产物进行磷酸化处理;(e)使(d)的产物中存在3’-cP的sRNA连接上标记3’-cP的接头序列;以及(f)根据标记3’-OH的接头序列、标记3’-cP的接头序列,鉴定(f)的产物中3’-OH、3’-cP修饰修饰的sRNA。作为本发明的优选方式,所述的各个步骤中,将多种酶/化学物质的联合运用,它们包括:T4 Rnl2,AP,NaIO4,T4 Pnk以及RtcB。优选地,所述T4 Rnl2为KQ截短型的酶。优选地,所述T4 Pnk为3’磷酸酶突变的酶。
本发明也提供了一种区分sRNA的3’-OH、3’-cP和3’-P末端修饰的方法,称为TE-qPCR,这一方法可同时实现三种末端修饰的测定,适用于精细化的分析。可以一次定量检测一个样品中不同的末端修饰的sRNA比例,包含sRNA-cP,sRNA-P和sRNA-OH。
所述TE-qPCR的sRNA修饰测定方法主要基于多个步骤的处理,包括:(1)提供待测sRNA,将其分成三组,分别以溶剂、碱性磷酸酶和T4多聚合核苷酸激酶处理;(2)对(1)的产物进行聚腺苷化反应(PAP),使3’-OH的sRNA的3’端聚腺苷化;(3)对(2)的产物进行反转录反应;以及(4)对(3)的反转录反应的产物进行定性或定量测定。这一方法利用RNA样品在经由水、AP或T4 Pnk处理后形成不同的修饰,对处理后的RNA进行聚腺苷化反应和反转录反应,随后用特异性的引物进行qPCR检测。
应理解,本发明的上述两种检测方法中,所用的酶、生物活性物质也包括了它们的同功能的变异体、截短体、与其它功能性分子的融合蛋白、同源分子、衍生物、异构体等。
多种多样的生物样品中可以获取待测sRNA并应用本发明的方法进行检测,包括固体组织和/或生物液体,本发明中没有特别的限制。可以在原核或真核生物中获取sRNA,所述原核或真核生物包括动物(例如,脊椎动物和无脊椎动物)、植物、微生物(例如,细菌和酵母),或在一些实施方案中,包括源自这些来源的培养的细胞。作为一些实施方式,待测样品是来自人或动物受试者(例如,哺乳动物受试者)的生物流体样品,诸如血液、血清、血浆、尿液、唾液或脑脊髓液。
在sRNA处理之前从样品中提取RNA用于检测。在给定样品中,提取并分离所有RNA(如细胞总RNA)或部分RNA(如特定细胞器来源的RNA)的方法是本领域公知的方法。多种方法可提取RNA,其中异硫氰酸胍法和Trizol法是动物组织及动物细胞总RNA提取较为常用的方法。Trizol方法中,Trizol内含异硫氰酸胍能迅速破碎细胞,同时使核蛋白复合体中的蛋白变性并释放出核酸,由于释放出的DNA和RNA在特定pH值下的溶解度不同,且分别位于中间相和水相,从而使DNA和RNA得到分离,取出水相后,通过有机溶剂(如氯仿)抽提及异丙醇沉淀,可得到纯净RNA。RNA可以使用多种标准方法纯化。另外,还存在各种商业上可用于分离小分子量RNA的方法以及产品。
为了获得适当大小的含有sRNA的样品,可进行RNA的大小分级。例如,通过使分离的RNA在变性聚丙烯酰胺凝胶上跑胶(或使用各种市售试剂盒中的任一种)来分离小RNA。在一些实施方案中,考虑将长度为15-46nt sRNA作为感兴趣的sRNA。
可以通过连接步骤将连接序列添加到小RNA的两个末端,所述连接序列在逆转录和PCR扩增期间可作为引物结合位点。例如,使用连接酶诸如T4 RNA连接酶2(KQ截短型)将后面是5’-连接序列的预腺苷酸化单链DNA 3’-连接序列连接至小RNA。利用连接序列以标记/分离特定修饰的小RNA(例如,微RNA)。然后通过PCR使sRNA文库逆转录和扩增。该步骤将连接序列连接的RNA转化为作为测序反应的模板的cDNA克隆。经设计具有独特核苷酸标签的引物也可用于该步骤,以在合并的文库多重测序中产生ID标签(即条形码)。
sRNA的规模化测序列的测序平台可以是多种,所述检测平台可以利用逆转录、扩增和/或探针的杂交,包括定量或定性PCR,或实时PCR。例如包括基于聚合酶的边合成边测序(例如,Illumina)、如焦磷酸测序(例如,454Life Sciences)、或连接法测序(例如,ABI固体测序平台)等。运用不同的测序平台时,与之相应地,可运用与特定平台相配合的测序用接头序列(如本发明所定义的标记3’-OH的接头序列、标记3’-cP的接头序列、标记3’-OH的接头序列),在实施例中也称为“条形码(序列)”。一些实施方案中,PCR检测可以应用RT-PCR引物,以及应用与之相配合的荧光标记探针。通常,实时聚合酶链反应(qPCR)在PCR期间(即实时)监测靶DNA分子的扩增。实时PCR可以定量和半定量地使用。在实时PCR中检测PCR产物的两种常用方法是:(i)嵌入任何双链DNA的非特异性荧光染料(例如,SYBR Green(I或II)),和(ii)由荧光报告因子标记的寡核苷酸组成的序列特异性DNA探针,所述荧光报告因子只有在探针与其互补序列(例如TAQMAN)杂交后才能检测到。
在一些实施方案中,在标记、完成测序后,从sRNA序列中去除所定义的测序用接头序列。所述接头序列通常根据所运用的测序平台来定义。
在经由本发明的方法进行测定后,优选地,在去除了接头序列后,根据所测定的修饰的sRNA的不同修饰,建立子文库。对于子文库,还可以进一步鉴定和量化、细分的不同类型的sRNA。
利用本发明的特定的方法确定的特定修饰的sRNA,其可进一步与本领域技术人员的研究中生成和/或提供的数据/数据库进行比对,并根据比对结果来。所述的数据/数据库例如被列举于本发明的实施例中的那些,也可以是本领域已经揭示或正在发展中的一些数据/数据库,也可以是出于一些特定的目的而自行建立的数据/数据库。
可以鉴定sRNA的修饰形式,籍此了解细胞或生物状态的各种效用,包括人类和动物健康以及农业中的效用。例如,本发明可用于药物发现、药物的毒理学和治疗学研究,动植物体的个性化研究。
鉴于sRNA可进一步细分为多种类型的功能性RNA分子,本发明的方法所测定后,确定了修饰形式的sRNA,可以进行进一步的细分;较佳地,所述方法获得的sRNA产物与sRNA的信息库或数据库进行比对,从而进行sRNA的细分。也可通过软件程序鉴定,利用软件程序量化来实现大规模的细分。优选地,可先将接头序列进行去除,以便鉴定单个sRNA,包括tsRNA,miRNA,piRNA,snoRNA,snRNA,sinRNA,sgmRNA,smRNA,slncRNA,smcRNA,srpRNA等。
应用
本发明的方法可应用于检测sRNA的末端修饰,所述的sRNA的末端修饰包括选自:(a)3’-OH和3’-cP修饰;或,(b)3’-OH、3’-P修饰和3’-cP修饰。
在本发明中,发现动物15-30nt sRNA中主要是sRNA-cP,而不是之前通常认为的sRNA-OH(如本领域所熟知的miRNA)。同时,检测到sRNA-OH大约占到10%,而sRNA-cP约占85%。对于sRNA-OH和sRNA-cP含量的检测是在本发明中首次提出。
本发明人深入研究后确定,本领域中以末端为3’-OH的sRNA(sRNA-OH)作为15-30nt范围内最主要的sRNA是存在技术偏见的,针对多种细胞的测定显示,15-30nt sRNA中主要是sRNA-cP,而不是之前通常认为的sRNA-OH。
本发明开发了两种新的检测sRNA修饰的方法,TANT-seq和TE-qPCR,均可以同时检测sRNA-OH和sRNA-cP。之前本领域存在至检测sRNA-cP的cP-RNA-seq方法,与其相比,本发明中TANT-seq可以同时定性和定量分析sRNA-OH和sRNA-cP,而且不会将2’端为氧甲基修饰(2’-OMe)的sRNA错误的当作sRNA-cP(RtcB连接酶有贡献于实现这一效果)。以往有的研究中仅能获得sRNA-OH、sRNA-P和sRNA-cP混合在一起的信息、而不能精准的区分每一单独序列的特定末端修饰,本发明解决了这一问题。在以往的一些研究中,通过对RNA进行AlkB处理,可以克服某些RNA甲基化对反转录抑制的影响,从而提高sRNA-seq完整性,但AlkB处理RNA会增加RNA降解的风险,所以在本发明中,并未将AlkB处理过程加入其中。对于开发的TE-qPCR,可以一次定量检测一个样品中不同的末端修饰的sRNA比例,包含sRNA-cP,sRNA-P和sRNA-OH,这为sRNA-cP的鉴定提供了新的技术手段。
根据本发明的实施例,利用本发明的两种新方法,发现和验证了超过10种不同生物型类的小鼠和人来源的sRNA-OH和sRNA-cP,同时也提供了相关的命名和详细信息。以往不同型类的sRNA仅能基于sRNA-OH测序,比如利用smRNA-Seq测序得到小鼠大脑组织中miRNA约为sRNA-OH总量的16.6%。在本发明中,利用TANT-seq发现小鼠肝脏中miRNA大约只占sRNA-OH总量的10.5%,这也和之前的报道相吻合。基于miRNA在多种生理病理状态下的重要性,本发明人推测占比更高的sRNA-cP也很有可能在一些生物过程中扮演关键角色。
生物体内有多种生物学过程和末端3’-cP修饰的RNA产生有关,例如通过内切酶或核酶酶切产生,RNA剪接时产生,通过外切酶酶切产生,或利用RNA 3’末端磷酸环化酶进行从头合成等。本发明中,发现两种内切酶—Ang和RNase 4可以介导一部分sRNA-cP在哺乳动物细胞中的生成。参考熟知的miRNA或piRNA这些已被发现和证明分别通过Drosha/Dicer和Zucchini依赖的特定通路产生,本发明提供了新的sRNA的来源途径,这也为不同末端sRNA序列不相同提供了合理依据。
因此,本发明发现哺乳动物中存在大量之前未被报道的3’-cP修饰sRNA,扩充了sRNA库,同时提供了两个强大的sRNA研究方法,推进了对sRNA的认识,极大的拓展了sRNA研究领域。
本发明中,所述的待测sRNA可以是来自具有特定适应症/疾病状态的样品。例如,适应症/疾病状态包括神经退行性疾病、心血管疾病、炎性和/或免疫性疾病和癌症等。可以基于晚期或早期疾病、或疾病进展过程、接受的治疗和患者对治疗的响应来进一步定义、细分待测sRNA的来源。尽管如此,本发明的方法的主要目的在于分析sRNA的修饰状态,可以从分析结果中确定一些影响sRNA修饰的因素/因子(如基因、蛋白、小分子物质)、信号通路,确定一些有意义的具有特定修饰的sRNA。由此可见,本发明的方法的主要目的可以不在于进行疾病的直接诊断和治疗;然而,人们可在本发明所提供的技术方案的基础上,进行进一步的分析、研究、筛选,以将有意义的sRNA或其存在情况(如比例)与疾病实现真正的关联,进而推进人们对于疾病的认识,或推进人们开发诊断或治疗疾病的新方案。
试剂盒
本发明的方法中所应用的试剂,可被组合在一起,形成适用于检测sRNA的末端修饰的试剂盒。
作为本发明的一种优选方式,所述的用于检测sRNA的末端修饰的试剂盒中包括检测sRNA的3’-OH和3’-cP末端修饰的试剂:T4 RNA连接酶2、碱性磷酸酶、高碘酸钠、T4多聚合核苷酸激酶、RtcB连接酶、标记3’-OH的接头序列、标记3’-cP的接头序列、标记3’-OH的接头序列。
作为本发明的一种优选方式,所述的用于检测sRNA的末端修饰的试剂盒中包括检测sRNA的3’-OH、3’-P和3’-cP末端修饰的试剂:溶剂、碱性磷酸酶和T4多聚合核苷酸激酶。
作为本发明的一种优选方式,各个试剂分装于不同的容器/包装中,置于所述试剂盒中。
作为本发明的一种优选方式,各个试剂被混合于适当的溶剂或缓冲液中,装于容器/包装中并置于所述试剂盒中。
所述的试剂盒中还可含有多种配合本发明的方法的实施的溶剂、缓冲液、辅助试剂等。
所述试剂盒中还可含有使用说明书,其中说明了实施本发明的技术方案的方法,从而便于本领域技术人员应用。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,中所述的条件,或按照制造厂商所建议的条件。
材料与方法
1、寡核苷酸
本发明所涉及的DNA和RNA寡核苷酸序列附于表1中。
表1
2、实验动物
本实验涉及动物均按照动物护理和使用委员会的指导方针进行饲养和使用。
小鼠禁食实验,8周龄雄性C57BL/6小鼠随机为两组,在有或没有食物的标准饲养笼中饲养24h,自由饮水。
小鼠高脂饮食实验,8周龄雄性C57BL/6小鼠随机分为两组,分别饲喂含60kcal%脂肪的高脂饮食(研究饮食)和正常饲料,共喂食16周。
db/db小鼠则选用16周龄雄性小鼠。
小鼠麻醉解剖后,立即收集组织用液氮快速冷冻,保存在-80℃冰箱。
3、细胞培养
小鼠肝癌细胞(Hepa 1-6),小鼠肝细胞(AML12),小鼠胚胎成纤维细胞(NIH/3T3)和人肝癌细胞(Hep G2)在含10%的胎牛血清的DMEM,于37℃,5%的CO2条件下培养。当细胞长到80-90%时提取总RNA,并分离sRNA。
4、变性PAGE分析
RNA或DNA寡聚物样品与等体积的2×RNA加样缓冲液(95%甲酰胺,18mM EDTA,0.025%SDS,0.025%溴酚蓝,0.025%二甲苯氰)混合,于70℃孵育10min后,立即将样本置于冰上。样品通过含有7M尿素的15%变性PAGE胶进行分离,电泳结束的PAGE胶用SYBR Gold染色液(Invitrogen)进行染色,在紫外灯下拍照,用ImageJ软件对凝胶图像进行定量分析。
5、RNA或DNA胶回收
用注射器挤压粉碎含有RNA或DNA的PAGE凝胶,将粉碎的凝胶块在0.3M NaCl中4℃恒定旋转浸泡约2小时,用乙醇-乙酸钠(3倍体积无水乙醇和0.1倍体积3M乙酸钠,pH 5.2)沉淀,沉淀样品置于-80℃冰箱过夜。样品用预先冷却到4℃的离心机在12000g条件下离心15分钟,最后RNA或DNA寡聚体溶解在无核酸酶水中保存备用。
6、预腺苷化DNA寡核苷酸制备
使用5’DNA腺苷化试剂盒(NEB)对5’为磷酸的单链DNA进行腺苷化。20μl反应体系如下:5’磷酸化DNA寡核苷酸100pmol,2μl 10×5’DNA腺苷化反应缓冲液,2μl 1mM ATP,100pmol Mth RNA连接酶,样品混合均匀后置于65℃条件下反应1小时,然后在85℃孵育5分钟灭活酶。反应后样品用含7M尿素的15%变性PAGE胶进行分离,然后用SYBR Gold染色,将腺苷化的产物从凝胶中回收。
7、制备5’-P,3’-cP sRNA标准品
Mth RNA连接酶具有将3’-P转化为3’-cP的活性,利用该特性制备3’-cP sRNA标准品。反应体系如下:100pmol合成的结构为5’-OH和3’-P sRNA,2μl 10×5’DNA腺苷化反应缓冲液,2μl 1mM ATP,100pmol Mth RNA连接酶,补充H2O至20μl,混合均匀后置于65℃反应1小时,85℃下5分钟失活酶。然后添加1μl 10×CutSmart缓冲液,18μl无核酸酶水和1μl虾碱性磷酸酶(NEB),样品在37℃条件下孵育30分钟,将未反应的3’-P转化为3’-OH,然后在65℃条件下孵育10分钟热失活酶,反应结束置于冰上。之后添加1μl 10×poly(A)聚合酶反应缓冲液,加入4μl ATP(10μM),10U重组核糖核酸酶抑制剂(RRI),10U poly(A)聚合酶(NEB)并加入无核酸酶水至终体积40μl,混合均匀后样品置于37℃下孵育30分钟,将3’末端未转换为3’-cP的剩余sRNA加上poly(A)尾,用含7M尿素的15%变性PAGE胶进行分离,将含有5’-OH和3’-cP的小RNA从凝胶中分离并提取。
为获得结构为P-sRNA-cP标准品,反应体系如下:300pmol结构为5’-OH,3’-cP的sRNA,5μl10×T4 Pnk反应缓冲液,5μl ATP(10μM),40U重组核糖核酸酶抑制剂,10U T4 Pnk(3’磷酸酶突变)(NEB),补加无核酸酶水至终体积50μl,样品在37℃下反应30分钟,然后于65℃条件下孵育20分钟热失活酶,用QIAquick Nucleotide Removal Kit(Qiagen)回收5’-P,3’-cP sRNA,并溶解于无核酸酶水中备用。
8、总RNA提取和sRNA分离
按照Trizol试剂(Invitrogen)使用说明提取组织或细胞的总RNA,具体步骤参照说明书。总RNA用5%聚乙二醇8000(PEG8000)和0.5M NaCl冰上孵育45分钟,将大分子量RNA(大于200nt)沉淀出来,通过离心去除沉淀,上清中包含小于200nt的sRNA,用乙醇-乙酸钠进行沉淀,最终sRNA用无核酸酶水溶解,-80℃保存或用于反应。15-30nt sRNA则用15%变性PAGE胶进行分离,SYBR Gold染色,然后从凝胶中切胶回收相应长度sRNA。
9、T4 RNA连接酶2连接sRNA-OHs
连接反应体系如下:50ng sRNA,20pmol腺苷化DNA linker,2μl 10×T4 RNA连接酶反应缓冲液,4μl 50%PEG8000,20U重组核糖核酸酶抑制剂,200U的截断KQ型T4 RNA连接酶2(T4 Rnl2,KQ)(NEB),加无核酸酶水补齐至20μl。样品在16℃条件下孵育16小时,用含7M尿素的15%变性PAGE分析连接产物。
10、RNA聚腺苷化实验
RNA聚腺苷化实验体系如下:50ng sRNA,2μl 10×poly(A)聚合酶反应缓冲液,2μl10mM ATP,20U重组核糖核酸酶抑制剂,5U poly(A)聚合酶,加无核酸酶水补齐至20μl。样品在37℃孵育30分钟然后利用含7M尿素的15%变性PAGE分析反应产物。
11、LC-MS/MS分析RNA修饰
腺苷酸(A),尿苷(U),胞嘧啶核苷(C),鸟苷(G),2’-O-甲基腺苷(Am),1-甲基腺苷(m1A),N6-甲基腺苷(m6A),N6-异戊烯腺苷(i6A),2’-O-甲基尿苷(Um),5-甲基-2-硫代尿苷(m5s2U),5-甲氧基尿苷(mo5U),5-甲基尿苷(m5U),4-硫代尿苷(s4U),3’-O-甲基尿苷(3-OMeU),2’-O-甲基胞苷(Cm),5-甲基胞苷(m5C),N4-乙酰胞苷(ac4C),2’-O-甲基鸟苷(Gm),N2-甲基鸟苷(m2G),7-甲基鸟苷(m7G),肌苷(I),腺苷2’,3’-环磷酸(2’,3’-cAMP),尿苷2’,3’-环磷酸(2’,3’-cUMP),胞苷2’,3’-环磷酸(2’,3’-cCMP)和鸟苷2’,3’-环磷酸(2’,3’-cGMP)购自Sigma-Aldrich。5,2’-O-二甲基尿苷(m5Um),3-甲基尿苷(m3U),2-硫代胞苷(s2C),5-羟甲基尿苷(hm5C),N2-二甲基鸟苷(m2 2G),假尿苷(ψ),1-甲基尿苷(m1ψ)和2’-O-甲基肌苷(Im),3’-O-甲基胞苷(3’-OMeC),5,2’-O-二甲基胞苷(m5Cm),N4-乙酰-2’-O-甲基胞苷(ac4Cm),1-甲基鸟苷(m1G),3’-O-甲基鸟苷(3’-OMeG),N2,N2,7-三甲基鸟苷(m2,2,7G),5’-O-甲基胸腺嘧啶(5’-OMeT)和3’-O-甲基肌苷(3’-OMeI)均购自Carbosynth。鸟苷5’-单磷酸(13C10,15N5)购自剑桥同位素实验室。140μg/mL 5’-单磷酸鸟苷(13C10,15N5)用牛碱性磷酸酶(Takara)水解24小时得到鸟苷(13C10,15N5)。
RNA处理方法和LC-MS/MS分析简述如下:100ng sRNA在60μl 50mM NH4OAc,pH 5.3溶液中,加入0.2U核酸酶P1(Sigma-Aldrich),50℃孵育3小时,然后加入0.04U磷酸二酯酶I(USB)在37℃下处理2小时。随后,RNA样品在37℃下用2U碱性磷酸酶(Sigma-Aldrich)处理2小时。通过Nanosep 3K Omega膜(Pall)离心去除蛋白。核苷混合物通过API 4000Q-TRAP质谱仪(Applied Biosystems)进行分析。
12、虾碱性磷酸酶或T4 Pnk反应
虾碱性磷酸酶(rSAP)(简称AP)(NEB)反应体系如下:50ng sRNA,1μl 10×CutSmart缓冲液,20U重组核糖核酸酶抑制剂,1U rSAP,加无核酸酶水至10μl。样品在37℃孵育30分钟,65℃继续孵育5分钟热失活酶,反应结束置于冰上用于后续的连接反应或RNA聚腺苷化反应(PAP)。
T4 Pnk反应体系如下:50ng sRNA,1μl 10×T4 Pnk反应缓冲液,20U重组核糖核酸酶抑制剂,10U T4 Pnk,加无核酸酶水至10μl,样品在37℃孵育30分钟,65℃继续孵育5分钟热失活酶,反应结束置于冰上用于后续的连接反应或RNA聚腺苷化反应。
13、RtcB连接反应
用于RtcB连接反应的15-30nt sRNA先用T4 Pnk(3’磷酸酶突变)处理,使sRNA的5’-OH转变为5’-P,然后通过苯酚-氯仿抽提,乙醇-乙酸钠沉淀,溶解于无核酸酶水中。RtcB(NEB)连接反应体系如下:50ng sRNA,20pmol linker(OH-RNA8-OH),2μl 10×RtcB反应缓冲液,2μl MnCl2(10mM),1μl GTP(10mM),15pmol RtcB连接酶,20U重组核糖核酸酶抑制剂,加无核酸酶水至20μl。样品混合均匀后在37℃下孵育2小时,然后用含7M尿素的15%变性PAGE分析连接产物。
14、TANT-seq sRNA文库制备和高通量测序
TANT-seq sRNA文库制备流程和相关反应体系如下:1μg小于200nt sRNA(9μl体积)与1μl spike-in混合物(P-RNA2-OH,P-RNA10-P和P-RNA6-cP各8nM;P-RNA9-OH,P-RNA5-P和P-RNA18-cP各0.8nM;P-RNA16-OH,P-RNA17-P和P-RNA11-cP各0.08nM)于70℃孵育5分钟后立即置冰上冷却,然后加入20pmol含有3’-OH子文库条形码的App-DNA12-ddC接头序列(Applied Biosystems),4μl 10×T4 RNA连接酶反应缓冲液,8μl 50%PEG8000,400U KQ截短型T4 RNA连接酶2(T4 Rnl2)(购自NEB),40U重组核糖核酸酶抑制剂,加无核酸酶水至40μl,样品置于16℃孵育16小时。70℃继续孵育5分钟热失活酶。
随后,加入1μl 10×CutSmart缓冲液,20U重组核糖核酸酶抑制剂,2.5U虾碱性磷酸酶(AP),并补加无核酸酶水至终体积50μl,混合均匀于37℃下孵育30分钟,65℃继续孵育5分钟热失活酶。
随后,加入20μl 100mM NaIO4,40U重组核糖核酸酶抑制剂,并补加无核酸酶水至终体积为200μl,样品置于冰上,黑暗条件下孵育40分钟。之后利用乙醇-乙酸钠进行沉淀,RNA用15%变性PAGE进行分离,选择长度在15-46nt范围内的sRNA进行切胶回收,并溶解于无核酸酶水中备用。
回收的样品经T4 Pnk(3’磷酸酶突变)(NEB)处理,然后用苯酚-氯仿抽提,乙醇-乙酸钠沉淀,溶解在无核酸酶水中。
之后进行RtcB连接反应,连接体系如下:10pmol包含3’-cP子文库条形码的OH-RNA13-ddC接头序列,2μl 10×RtcB反应缓冲液,2μl MnCl2(10mM),1μl GTP(10mM),15pmolRtcB连接酶,20U重组核糖核酸酶抑制剂,并补加无核酸酶水至终体积为20μl。样品在37℃下孵育2小时,然后70℃孵育5分钟热失活酶,用15%变性PAGE分离连接产物,选择长度在31-46nt范围内的带有接头序列sRNA进行切胶回收,回收产物溶解在无核酸酶水中。
之后进行RNA 5’接头序列连接反应,反应体系如下:5pmol OH-RNA14-OH接头序列,3μl 10×T4RNA连接酶反应缓冲液,6μl 50%PEG8000,1μl ATP(10mM),30U T4 RNA连接酶1(T4 Rnl1)(NEB),20U重组核糖核酸酶抑制剂,并补加无核酸酶水至终体积为30μl。混合均匀后样品在25℃条件下反应2小时,然后70℃孵育5分钟热失活酶。
连接产物随后进行反转录实验(RT-PCR),体系如下:3pmol OH-DNA15-OH反转录引物,4μl5×SSIV缓冲液,200U SuperScript IV反转录酶(Invitrogen),2.5μl DTT(100mM),2.5μl dNTP(10mM),20U重组核糖核酸酶抑制剂,并补加无核酸酶水至终体积为50μl。混合均匀后样品在50℃条件下孵育1小时,然后80℃孵育10分钟热失活酶。
接着用Phusion高保真DNA聚合酶(NEB)进行PCR扩增,实验用到的PCR引物和PCRindex序列见表1。扩增产物用7.5%的非变性PAGE胶进行分离,选择长度在130-160bp的产物进行切胶回收。回收的样品利用Illumina公司的Xten平台进行高通量测序。本发明人将这种基于T4 Rnl2/AP/NaIO4/T4Pnk(3’磷酸酶突变)/RtcB的sRNA-seq方法称为TANT-seq。
15、TANT-seq sRNA测序数据分析
高通量测序原始序列(TANT方法中获得的序列)首先使用fastp(v0.20.0)去除接头序列,低质量序列(Phred score<30),长度短于21nt或长于46nt的序列也被去除。然后将App-DNA12-ddC中带有GACGTA条形码序列(Applied Biosystems)和OH-RNA13-ddC中带有CTATCG条形码序列(Applied Biosystems)分别分类到3’-OH子文库和3’-cP子文库中,并去除相应的条形码序列。
随后,使用ncbi-BLAST+2.11.0将序列按顺序比对到相应的参考数据库。比对之前,首先对相关数据库就行修改,具体如下:在GtRNAdb和mitotRNAdb中的所有tRNA序列的3’末端添加CCA序列。
首先将序列和spike-in序列(表1)进行比对,然后将剩余的序列按照种属分别比对到小鼠rRNA数据库或人rRNA数据库,小鼠rRNA数据库包括:mmu-5S rRNA(NR_030686.1),mmu-5.8S rRNA(NR_003280.2),mmu-12S rRNA(NC_005089.1),mmu-16S rRNA(NC_005089.1),mmu-18S rRNA(NR_003278.3),mmu-28S rRNA(NR_003279.1),mmu-45S rRNA(NR_046233.2)和Ensembl数据库中的小鼠rRNA序列;人rRNA数据库包括:has-5S rRNA(NR_023363.1),has-5.8S rRNA(NR_145821.1),has-12S rRNA(NC_012920.1),has-16S rRNA(NC_012920.1),has-18S rRNA(NR_146146.1,NR_145820.1),has-28S rRNA(NR_003287.4,NR_146118.1,NR_146154.1,NR_146148.1,NR_145822.1),has-45S rRNA(NR_046235.3,NR_146117.1,NR_146151.1,NR_146144.1)和Ensembl数据库中的人rRNA序列。然后再依次比对到小鼠或人的添加了3’-CCA的GtRNAdb和mitotRNAdb数据库,来自miRbase和Ensembl中的miRNA数据库,来自piRNAdb(https://www.pirnadb.org)中的piRNA数据库,来自Ensembl中的snRNA,snoRNA,lncRNA,miscRNA和other ncRNA数据库,来自Ensembl中的内含子数据库,来自Ensembl中的mature mRNA,IG gene,TR gene,Pseudogene数据库,来自UCSC GenomeBrowser(http://genome.ucsc.edu)的重复序列数据库(RepeatMasker,GRCm38/mm10或GRCh38/hg38),基因组数据库(GRCm38/mm10或GRCh38/hg38),线粒体基因组数据库(NC_005089.1或NC_012920.1)。和数据库中序列完全匹配的序列被分配到对应比对到的类别中,然后将未比对上的序列再次比对到上述数据库,但此次比对时允许错配+跳跃碱基个数≤2,将比对上的序列再次分配到对应类别中。两次都未比对上的序列被舍弃。
将Dfam数据库中归类为假基因的重复序列的序列进行挑选,归类于假基因。同时利用NCBI网站中的核苷酸-核苷酸BLAST软件对每个类型的高丰富的sRNA进行手动检查。在小鼠样本中,将分类到重复序列中但可以比对到snRNA,C/D box 118(Snord118)(NR_028566.3)或Gm25313(XR_004935972.1)的序列重新分配给snoRNA或snRNA;分类到mRNA序列中但可以比对到Snord14c(NR_028276.2)的序列分配给snoRNA。在人源样本中,将分类到重复序列中但可以比对到RNU5A-1(NR_002756.2)和RNU5B-1(NR_002757.3)的序列分配给snRNA;将分类到重复序列中但可以比对到snRNA,C/D box 118(SNORD118)(NR_033294.1)的序列分配给snoRNA。
将比对到rRNA和tRNA上的sRNA分别分类到为srRNA和tsRNA。比对到内含子、lncRNA、基因组、成熟mRNA、重复序列和miscRNA的sRNA分别命名为小内含子RNA(sinRNA)、小lncRNA(slncRNA)、基因组衍生小RNA(sgmRNA)、小成熟mRNA(smRNA)、重复序列衍生小RNA(srpRNA)、小miscRNA(smcRNA)。对平均测序读数大于2的sRNA进行了统一性的命名,命名原则是依据sRNA类别,匹配序列名称,起始位置、序列长度和3’末端修饰;同时为了简化小RNA命名,依据sRNA类别,按照丰度从高到底的排列进行顺序命名。具体sRNA命名的代表性举例如图13A-D。其中,图13A、鼠肝细胞或Hepa1-6细胞中TANT-seq鉴定到的代表性15-30ntsRNA-OH;图13B、鼠肝细胞或Hepa1-6细胞中TANT-seq鉴定到的代表性15-30nt sRNA-cP;图13C、人Hep G2细胞通过TANT-seq中鉴定到的代表性15-30nt sRNA-OH;图13D、人Hep G2细胞通过TANT-seq中鉴定到的代表性15-30nt sRNA-cP。
此外,tsRNA依据其在全长tRNA中的位置可以进一步分为5’-tsRNA(tRNA-derivedsRNA containing 5’-end)、3’-CCA-tsRNA(tRNA-derived sRNA containing CCA at 3’-end)、3’-CC-tsRNA(tRNA-derived sRNA containing the additional CC at 3’-terminal)和internal-tsRNA。
对于测序结果重现性分析,采用GraphPad Prism 7.0计算任意两个独立重复样品Pearson相关系数,用来比较TANT-seq方法的可重现性。
15-30nt sRNA或各种类别sRNA含有3’-OH和3’-cP相对含量计算如下:考虑到Poly(A)聚合酶反应活性强,几乎可以使得所有的sRNA-OH被聚腺苷化,使用图1e和图1f中的反应结果计算T4 RNA连接酶2对15-30nt中sRNA-OH的连接效率。用图7a和图1f中的反应结果计算RtcB连接酶对15-30nt中sRNA-cP的连接效率。然后根据T4 RNA连接酶2和RtcB连接酶的连接效率校准TANT-seq测序数据中sRNA-OH和sRNA-cP的相对含量,或计算各种类别sRNA的相对含量。
维恩图是由VennDiagram制作生成。保守性分析是通过R语言中的ggseqlogo制作生成。
对于TNAT-seq测序结果的差异表达分析,用edgeR计算变化倍数和P值,调整的P值用Benjamini-Yekutieli方法进行校准。调整后的P<0.01和log2(fold change)≥2或≤-2的sRNA被认为有显著变化。火山图中显示了平均读值≥2的sRNA序列。
16、定量PCR
采用Roche公司FastStart Universal SYBR Green Master进行定量PCR。qPCR反向和正向引物在表1中列出,实验按照产品说明书进行。
17、3’-OH,3’-P或3’-cP sRNA定量分析
图3a中展示了qPCR定量检测3种RNA 3’末端(3’-OH,3’-P和3’-cP)的原理。反应体系如下:1μlspike-in RNA(P-RNA2-OH,P-RNA10-P和P-RNA6-cP,各8nM;P-RNA9-OH,P-RNA5-P和P-RNA18-cP,各0.8nM;P-RNA16-OH,P-RNA17-P和P-RNA11-cP,各0.08nM)或1μg总RNA分别用水、虾碱性磷酸酶和T4 Pnk处理,反应体积为10μl。然后加入1μl 10×poly(A)聚合酶反应缓冲液,2μl ATP(10mM),5U重组核糖核酸酶抑制剂,5U poly(A)聚合酶,补加无核酸酶水至终体积20μl,在37℃条件下孵育60分钟,然后70℃继续孵育5分钟进行热失活。
随后,加入3pmol反转录引物(表1),200U SuperScript IV反转录酶,4μl 5×SSIV缓冲液,2.5μl DTT(100mM),2.5μl dNTP(10mM),20U重组核糖核酸抑制剂,并补加无核酸酶水至终体积为40μl。混合均匀后再50℃条件下孵育60分钟,80℃继续孵育10分钟进行热失活。
随后采用FastStart Universal SYBR Green Master进行定量PCR,qPCR引物附于表1。三组处理分别得到Ct(3’-OH),Ct[3’-(OH+P)]和Ct[3’-(OH+P+cP)],然后根据下列公式计算3’-OH,3’-P和3’-cP的相对含量:
(3′-OH)%=100%-(3′-P)%-(3′-cP)%
18、Northern blot
20μg总RNA或100-200ng 15-30nt sRNA通过15%变性PAGE分离,并转移到带正电的尼龙膜(Roche)上。随后进行紫外交联,加入DIG Easy Hyb buffer(Roche)进行预杂交。然后,加入10nM 3’端地高辛标记的寡核苷酸探针在45-55℃条件下孵育过夜,温度主要取决于每个探针的退火温度,探针信息附于表1中。杂交结束后进行洗涤和封闭膜,然后加入Anti-Digoxigenin-AP Fab fragments (Roche)室温孵育45分钟,并用CSPD ready-to-use试剂(Roche)检测sRNA的表达。
19、重组蛋白的表达和纯化
利用表1中所列引物,从小鼠肝脏cDNA中扩增获得Ang和RNase4基因序列,并将其插入pET28a质粒中的Nde I和Xho I位点,得到pET28a-Ang和pET28a-RNase 4原核表达质粒。重组Ang和RNase4在大肠杆菌BL21 Rosetta(DE3)细胞中诱导表达,并用His-Tag纯化树脂(Roche)和离子交换柱(Hitrap Q HP,GE Healthcare)纯化。纯化得到的Ang和RNase 4蛋白经SDS-PAGE和考马斯蓝染色分析纯度,最后透析到储存缓冲液(20mM Tris-HCl pH 7.5,200mM NaCl,5%甘油)中,-80℃冰箱中保存。
20、RNA酶消化肝脏总RNA
4μg小鼠肝脏总RNA分别用0.5ng RNase A(Thermo),1U RNase T1(Thermo),0.32μg Ang或0.08μg RNase4处理,反应在37℃下进行30分钟。然后用苯酚-氯仿提取样品中RNA,经过乙醇-乙酸钠沉淀,最终RNA溶解于无核酸酶水中,用于TE-qPCR或Northern blot检测。
21、分析RNase A家族成员的表达水平
分析小鼠肝脏RNase A家族亚成员的表达水平的RNA-seq数据来源于GEO数据库(登录代码:GSE164819)。表达水平采用FPKM(Fragments Per Kilobase of exon modelper Million mapped fragments)表示。
22、CRISPR/Cas9基因编辑
将表1中编码gRNA的两条互补寡核苷酸进行退火,形成双链,然后将其插入lentiCRISPR v2(Addgene plasmid 52961)载体的BsmBI位点,构建好的质粒通过一代测序进行验证。分别得到lentiCRISPR-mRNH1-sgRNA,lentiCRISPR-mANG-sgRNA1,lentiCRISPR-mRNase4-sgRNA,lentiCRISPR-hAng-sgRNA1,lentiCRISPR-hRNase 4-sgRNA质粒。为了构建双敲除细胞系,选择含有mCherry的px330-mp50质粒系统,将sgRNA插入到px330-mp50质粒的Bbs I位点,得到px330-mp-mAng-sgRNA2和px330-mp-hAng-sgRNA2质粒。
根据转染试剂说明书,将构建好的包含有sgRNA的质粒通过Lipofectamine 3000转染试剂(Thermo)转染进入Hepa 1-6或Hep G2细胞。并用2ng/μl嘌呤霉素对转染后的细胞进行筛选,筛选48小时后,对细胞进行消化稀释,分离获得单克隆细胞。通过免疫印迹和/或一代测序确认基因敲除效果,获得对照Hepa 1-6或Hep G2细胞(WT),Ang敲除Hepa 1-6或Hep G2细胞(AKO),RNase 4敲除Hepa 1-6或Hep G2细胞(RKO)和RNH1敲除(RNH1 KO)Hepa1-6细胞。为了进一步构建双敲除细胞系,用Lipofectamine 3000转染试剂分别转染px330-mp-mAng-sgRNA2和px330-mp-hAng-sgRNA2到RNase 4敲除Hepa 1-6和Ang敲除Hep G2细胞,转染48小时后,用流式细胞仪将红色荧光细胞分选到96孔板中,每孔1个细胞,随后收集单克隆细胞,通过免疫印迹和/或测序确认基因敲除,获得Ang和RNase4双敲除(DKO)的Hepa1-6和Hep G2细胞。
23、蛋白转染
使用Xfect蛋白转染试剂(Takara)在6孔板中转染2μg Ang或RNase 4蛋白进入转染WT或RNH1KO Hepa 1-6细胞,转染6小时后,用PBS洗涤2次,随后用Trizol试剂提取总RNA。
24、核糖核酸酶抑制剂处理
将重组核糖核酸酶抑制剂(Takara)加入到WT、AKO、RKO或DKO Hepa 1-6或Hep G2细胞的细胞培养基中,最终浓度为2000U/ml。孵育48小时后,用Trizol试剂提取总RNA,进行TE-qPCR,Northern blot或TANT-seq检测。
25、免疫印迹
用含有50mM Tris-HCl,pH 7.6,150mM NaCl,1%NP-40,1%脱氧胆酸钠,0.1%SDS的RIPA裂解缓冲液裂解细胞。免疫印迹检检测中的抗体和稀释比例如下:anti-RNH1(abclone,A4079,1:500),anti-Angiogenin(Abcam,ab189207,1:1000),anti-RNase 4(Abcam,ab200717,1:1000)或anti-Tubulin(Sigma-Aldrich,T6074,1:1000)。
26、定量检测15-30nt sRNA
收集经重组核糖核酸酶抑制剂预处理48小时的WT,AKO,RKO或DKO Hepa 1-6细胞,Trizol试剂提取总RNA。4μg总RNA,分别用H2O或T4 Pnk处理,37℃条件下孵育30分钟,然后65℃继续孵育20分钟进行热失活。随后加入20pmol App-DNA12-ddC,1μl 10×T4 RNA连接缓冲液,2μl 50%PEG8000,20U重组核糖核酸酶抑制剂,200U KQ截短型T4 RNA连接酶2,补加无核酸酶水至终体积为20μl,样品置于16℃下孵育16小时。反应结束后,用15%变性PAGE分离,然后转移到尼龙膜上进行Northern blot,加入带地高辛标记的与App-DNA12-ddC反向互补的寡核苷酸探针进行杂交。ImageJ分析长度在31-46nt连接产物sRNA(对应初始sRNA范围是15-30nt),并通过5S rRNA进行归一化。
27、统计分析
除有特殊说明外,数据以至少三次独立实验的均值±SD表示,采用Student’s t检验或单因素方差分析评估统计学意义。除有特殊说明外,在P<0.05时认为差异有统计学意义。*或a表示P<0.05、**或b表示P<0.01,***或c表示P<0.001。
28、数据可用性
测序原始序列数据保存于NCBI Sequence Read Archive中,BioProject编号:PRJNA725316。
实施例1、小鼠和人15-30nt sRNA末端主要是3’-cP
首先,利用了常规的sRNA建库方法中的T4 RNA连接酶2连接反应从整体上检测3’末端为-OH的sRNA在15-30nt sRNA中的比重。通过切胶回收小鼠肝脏15-30nt sRNA,然后利用预腺苷化的接头序列进行连接。结果显示,大约只有10%的sRNA能被连接,与此同时,合成的sRNA-OH标准品在相同条件下几乎可以被完全连接(图1a)。
为排除单一酶促反应可能带来的实验误差,又利用E.coli Poly(A)聚合酶可以在RNA 3’-OH末端非模板性连续添加ATP的特性,对回收的小鼠肝脏15-30nt sRNA进行了RNA聚腺苷化实验,结果发现大约90%的sRNA不能被聚腺苷化,同样,合成的sRNA-OH标准品可以被完全聚腺苷化(图1b)。
上述两个实验的结果表明,小鼠肝脏中的15-30nt的sRNA中只有一小部分是3’-OH,且占比约为10%,并提示在此范围内还有大量的未被发现的sRNA,而这些sRNA可能含有特定修饰,进而阻止3’末端的连接反应或聚腺苷化反应。
为探究sRNA上可能存在的修饰,采用之前报道(PMID:24261999)过的一种可以一次性定性和定量超过40种不同类型的核苷和核苷酸的LC-MS/MS方法,用于分析15-30ntsRNA的修饰含量。LC-MS/MS结果表明,sRNA上存在大量的修饰,如ψ,m1A,Um,m6A,m3C,m2 2G,m5C,I,与此同时,还发现大量的3’-cP修饰(2’,3’-cCMP,2’,3’-cUMP,2’,3’-cAMP和2’,3’-cGMP),定量计算表明大约80%的15-30nt sRNA末端含有3’-cP(sRNA-cP)(图1c,d;图5a-d)。3’-cP是存在于RNA 3’末端的特定修饰,可以封闭T4 RNA连接酶2对sRNA的连接作用。为了探究这一现象是否是广泛存在,利用LC-MS/MS检测了不同来源的组织和细胞sRNA,发现小鼠脾脏组织、Hepa 1-6和Hep G2细胞中大约80%的小RNA也带有3’-cP修饰(图5e,f)。上述实验表明,小鼠和人的15-30nt sRNA末端主要是3’-cP修饰。
为进一步证实上述实验结果,将sRNA用T4多核苷酸激酶(T4 Pnk)处理,用以除去sRNA的3’磷酸(3’-P)和3’-cP,或用碱性磷酸酶(AP)处理用以去除3’-P基团,然后再通过T4RNA连接酶2连接反应或聚腺苷化反应分析sRNA的含量,结果表明AP处理后没有明显的变化,而当T4 Pnk处理后,sRNA几乎完全被连接或聚腺苷化(图1e,f)。这些结果进一步证实,15-30nt sRNA3’末端主要是3’-cP修饰(图1g)。同样,在小鼠脾脏、脑组织、白色脂肪组织、Hepa 1-6细胞、AML12细胞、NIH/3T3细胞和Hep G2细胞中也观测到了相似的现象(图6a-b)。
以上实验数据表明,小鼠和人15-30nt sRNA中3’-OH序列约为10%,其余主要是末端为3’-cP序列。
实施例2、TANT-seq揭示15-30nt sRNA完整表达谱,表明sRNA-OH和sRNA-cP通常具有不同序列
前面的结果表明哺乳动物15-30nt sRNA中最主要的是sRNA-OH和sRNA-cP,为系统揭示15-30nt sRNA完整表达谱,选择特异性连接3’-P/cP的RtcB连接酶,开发了新的sRNA文库构建策略(图7a,b)。
通过对关键步骤的PAGE分析和对构建文库进行qPCR检测(图7c-f),最终选择了T4Rnl2/AP/NaIO4/T4 Pnk(3’磷酸酶突变)/RtcB-依赖的sRNA-seq(TANT-seq)方法构建sRNA高通量测序文库(图2a),该方法可以在一个文库中同时分开检测sRNA-OH和sRNA-cP。
TANT-seq建库样品中外源添加了合成的sRNA-OH和sRNA-cP标准品(spike-in),数据分析时表明外源添加的sRNA的丰度与预期一致(图8a),并且不同末端的外源sRNA在3’-OH和3’-cP子文库之间没有明显的交叉污染,这充分说明了TANT-seq建库数据的可靠性和准确性。重复性分析结果发现3’-OH和3’-cP子文库的各自的Pearson相关系数超过0.94(图8b),这表明TANT-seq具有较高的可重现性。此外,结合TANT-seq测序数据和T4 RNA连接酶2和RtcB连接酶的连接效率可以得到3’-OH和3’-cP子文库相对含量,结果表明sRNA-OH和sRNA-cP在小鼠肝脏、Hepa 1-6和Hep G2细胞中的相对含量分别为11.7%和88.3%,11.4%和88.6%,12.4%和87.6%(图2b,图8c,e),这和之前的连接反应,聚腺苷化反应和LC-MS/MS结果相近。
TANT-seq全面揭示了sRNA-OH和sRNA-cP的表达谱,依据来源,将sRNA分成10余个类别(图2c)。其中,在小鼠肝脏3’-cP子文库中的srRNA,tsRNA,小内含子RNA(sinRNA),小lncRNA(slncRNA),snRNA,小基因组衍生RNA(sgmRNA),小成熟mRNA(smRNA),小重复元件衍生RNA(srpRNA),snoRNA,小miscRNA(smcRNA)和piRNA的丰度和3’-OH子文库中的miRNA相比,分别为33.8、21.9、5.4、1.8、1.8、1.4、1.3、0.71、0.68、0.64和0.38倍(图2c),同样,在Hepa 1-6和Hep G2细胞中也观察到了这些具有3’-cP修饰的高丰度sRNA(图8d,f),这些结果表明哺乳动物组织或细胞中存在大量不同来源的sRNA-cP。
接着通过对3’-OH和3’-cP子文库中各种类型sRNA的相对含量分析,发现小鼠肝脏、Hepa 1-6和Hep G2细胞中的3’-OH子文库中有10.5%、5.5%和8.2%的sRNA能与miRNAs匹配,而在3’-cP子文库中分别只有0.15%、0.40%和0.19%的sRNA与miRNAs匹配(图2d)。同时,也分析了小鼠肝脏、Hepa 1-6和Hep G2细胞中sRNA-OH或sRNA-cP的长度分布,结果如图2e和图8g,h所示。与之前miRNA的报道一致(Lau,N.C.等,An abundant class of tinyRNAs with probable regulatory roles in Caenorhabditis elegans.Science 294,858,(2001)),sRNA-OH子文库中miRNAs在21-24nt有一个明显的富集峰,而sRNA-cP则与其不同(图2e,图8i,j)。
为了进一步揭示sRNA-OH和sRNA-cP之间的差异,分析了两种文库间序列的相似程度。结果表明小鼠肝脏、Hepa 1-6和Hep G2细胞中,3’-OH和3’-cP子文库中的sRNA序列并不相同,在丰度排名前1000的sRNA中,只有不到3%的sRNA重叠度(图2f-g)。此外,进一步分析每个型类的sRNA,结果也显示只有极少量重叠序列(图9a-c)。这些结果表明,sRNA-OH和sRNA-cP通常具有不同的序列。
综合以上结果,成功地建立了一种称为TANT-seq的sRNA高通量测序方法,其主要优势是可以在一个文库中同时检测sRNA-OH和sRNA-cP。利用TANT-seq,揭示了小鼠和人15-30nt sRNA-OH和sRNA-cP的完整图谱,并发现它们通常具有不同的序列。
实施例3、TE-qPCR建立和TANT-seq数据验证
为了验证TANT-seq检测得到的大量新发现的sRNA-cP,又建立了一种同时检测RNA三种3’末端的qPCR方法(TE-qPCR),此方法可同时检测RNA样品中含有3’-OH,3’-P和3’-cP的sRNA(图3a)。具体操作方法是将RNA样品分为3份,分别用水、AP或T4 Pnk处理,然后对处理后的RNA进行聚腺苷化反应和反转录反应,随后用特异性的引物进行qPCR检测(图3a),最后通过计算公式(材料部分),便可以的对样品中特定序列的sRNA-OH、sRNA-P和sRNA-cP含量进行定量分析。为了验证方法的可行性,首先利用合成的3’-OH,3’-P和3’-cP标准品对TE-qPCR体系进行了验证,结果显示TE-qPCR可以很好的区分不同3’末端修饰的sRNA(图3b)。
利用TE-qPCR方法,对小鼠肝脏组织、Hepa 1-6和Hep G2细胞样本进行检测,结果显示在检测的sRNA中,miRNA 3’末端几乎100%是3’-OH,这进一步说明了TE-qPCR方法的可靠性,而与此同时TANT-seq中所发现的sRNA-cP 3’末端则是3’-cP(图3c,d,图10a,b)。此外,本发明人也在小鼠脑组织,小鼠白色脂肪组织,NIH/3T3和AML12细胞中也检测到了从TANT-seq中发现的一些sRNA-cPs(图d,图10a),这表明sRNA-cP在不同的组织或培养细胞中普遍表达。
接下来,进一步利用Northern blot验证TANT-seq中发现的sRNA的表达和末端修饰(图3e,图10c,d)。本发明人发现阴性对照(miRNA)可以直接被T4 RNA连接酶2连接或者被聚腺苷化,但只有用T4 Pnk而不是AP处理后,sRNA-cP才可以被T4 RNA连接酶2连接或聚腺苷化(图3e,图6c),这些数据进一步证明TANT-seq中发现的sRNA-cP的表达和大小是可靠的。
此外,还利用TE-qPCR探究了部分新发现sRNA-cP在不同生理和病理条件下的表达情况。如图3f所示,当小鼠禁食24小时后,在小鼠肝脏中,rsR-67-cP、tsR-2-cP、sn-7-cP、sinR-7-cP和smR-26-cP的表达水平显著提高;在高脂饮食的小鼠或db/db小鼠的肝脏中,rsR-67-cP、sn-7-cP、snR-7-cP、sinR-7-cP、smR-26-cP、slncR-106-cP和smR-13-cP表达水平显著降低。这些结果提示,部分sRNA-cP与生理和病理变化有关,并潜在地可作为某些特定的生物状态测定的标记物。
实施例4、血管生成素和RNase 4参与小RNA-cPs的生成
通过对TANT-seq测序结果的核苷酸富集分析,发现sRNA-cP的3’端嘧啶碱基具有强烈富集信号,而其5’端嘌呤碱基有一定程度的富集(图4a);而对sRNA-OH,仅在一些特定的类型中观察到3’端核苷酸的显著富集,如tsRNA,snoRNA,snRNA,sgmRNA,piRNA和smcRNA(图11a-d),这表明sRNA-cP和sRNA-OH很可能具有不同的产生方式。通过体外酶切反应实验,发现小鼠总RNA经过RNase A酶切后会导致actin和miR-122显著下降,但sRNA-cP的表达量却有显著增加(图4b)。与此相反的是,用G碱基后酶切RNA生成3’-cP的RNase T1酶切小鼠总RNA,所检测的sRNA均明显减少(图4b)。RNase A酶是一个大家族酶类,小鼠中包含十几个亚成员,有趣的是,在小鼠肝脏中RNase A家族中只有血管生成素(Ang)和RNase 4具有较高的表达量(图4c),因此接下来将Ang和RNase 4作为主要研究目标。Ang和RNase 4的体外酶切实验结果表明,两者均可导致actin和miR-122显著减少,但可以显著增加sRNA-cP的表达(图4d,图12a,b)。Northern blotting实验也进一步证实这一结果,且sRNA-cP的表达量呈现出对Ang和RNase 4剂量依赖关系(图4e,图12c)。
为了探究Ang和RNase 4在细胞内是否和sRNA-cP产生有关,转染Ang或RNase 4蛋白到Hepa 1-6细胞内,通过TE-qPCR检测发现部分sRNA-cP表达量有适度的增加(图12d)。已知细胞中的RNH1蛋白可以与Ang或RNase 4结合并抑制其活性,对此,利用CRISPR/Cas9技术建立了稳定的RNH1敲除(HKO)Hepa 1-6细胞系,并通过测序和免疫印迹对敲除细胞系进行了验证(图12e,图4f)。然后将Ang或RNase 4蛋白转染到RNH1敲除的Hepa 1-6细胞中,利用TE-qPCR和Northern blot检测发现部分sRNA-cP表达量有显著增加(图4f,g,图12f)。这些数据表明,Ang和RNase 4可以在体外或细胞内导致sRNA-cPs产生。
接下来进一步利用CRISPR/Cas9技术构建了稳定的Ang敲除(AKO)、RNase 4敲除(RKO)和Ang/RNase 4双敲除(DKO)的Hepa 1-6细胞系,并通过测序和免疫印迹对敲除细胞系进行了验证(图12g,图4i)。通过TE-qPCR检测,发现RKO和DKO的Hepa 1-6细胞中部分sRNA-cP表达量一定程度降低(图12h)。由于细胞培养基中含有血清,而血清中含有的RNase可以进入细胞,因此在Hepa 1-6细胞培养基中加入重组核糖核酸酶抑制剂阻断外源RNase活性。重组核糖核酸酶抑制剂预处理后,在RKO和DKO Hepa 1-6细胞中,srR-67-cP、snR-7-cP、sinR-7-cP、smR-26-cP和slncR-106-cP水平显著降低(图4h,i,图12j,k)。此外,利用T4RNA连接酶2连接反应结合Northern blot方法系统检测野生型(WT)、AKO、RKO和DKO Hepa1-6细胞中15-30nt sRNA 3’为-OH末端和3’为-(OH+P+cP)末端的sRNA相对表达量,结果表明RKO和DKO Hepa 1-6细胞中,sRNA-OH含量无明显变化,但是T4Pnk处理后得到的3’为-(OH+P+cP)末端的sRNA含量显著降低,而之前的结果表明此范围内sRNA-cP占大多数的,进一步说明sRNA-cP在RKO和DKO Hepa 1-6细胞中显著减少(图12i)。
为了系统研究Ang、RNase 4在Hepa 1-6细胞中对15-30nt sRNA生成的作用,利用TANT-seq对上述敲除细胞系进行了高通量测序。结果表明在重组核糖核酸酶抑制剂预处理后,AKO,RKO和DKO的Hepa 1-6细胞中sRNA-OH显著降低的分别有367、346、222个,而sRNA-cP显著降低分别有96、3598、3630个(图4j),这些数据表明,RNase 4在小鼠sRNA-cP的生物发生中具有重要作用。
此外,为更进一步探究Ang和RNase 4对人源sRNA-cP生成的作用,又建立了稳定的AKO、RKO和DKO的Hep G2敲除细胞系,并通过测序验证敲除效果(图12l)。通过TE-qPCR检测,发现重组核糖核酸酶抑制剂预处理后AKO、RKO和DKO Hep G2细胞中,srR-12-cP、srR-20-cP、snR-31-cP、sinR-20-cP、sinR-90-cP、smR-44和slncR-13表达水平显著降低(图4k)。这些数据说明Ang和RNase 4在人源细胞中和sRNA-cP的生物发生密切相关。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海营养与健康研究所
<120> 小RNA的新型检测方法及其应用
<130> 216531
<160> 125
<170> SIPOSequenceListing 1.0
<210> 1
<211> 35
<212> DNA/RNA
<213> Artificial Sequence
<400> 1
aacgacaaga cacacaccac gagagcaaua agcag 35
<210> 2
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 2
gucaucugaa acuugcucuc gaaaa 25
<210> 3
<211> 44
<212> DNA/RNA
<213> Artificial Sequence
<400> 3
gtagcacgac aagacacaca ccacgagagc aataagcaga tgac 44
<210> 4
<211> 28
<212> DNA/RNA
<213> Artificial Sequence
<400> 4
aucgauucga ucguaaucgu augccuaa 28
<210> 5
<211> 29
<212> DNA/RNA
<213> Artificial Sequence
<400> 5
ucacugcaga ugaugaguag acacguaga 29
<210> 6
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 6
augccuaugg auucgucguc 20
<210> 7
<211> 32
<212> DNA/RNA
<213> Artificial Sequence
<400> 7
caguacagua ugcagccuca ucaaagugaa ga 32
<210> 8
<211> 40
<212> DNA/RNA
<213> Artificial Sequence
<400> 8
aacgacaaga cacacaccac gagagcaaua agcagaugac 40
<210> 9
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 9
guucucgagu aaaagugugu c 21
<210> 10
<211> 27
<212> DNA/RNA
<213> Artificial Sequence
<400> 10
cucaguugau cacacaugau ccuaugu 27
<210> 11
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 11
cacguagagc cuucuuagcg cag 23
<210> 12
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 12
gacgtatgga attct 15
<210> 13
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 13
cuaucgugga auucu 15
<210> 14
<211> 26
<212> DNA/RNA
<213> Artificial Sequence
<400> 14
guucagaguu cuacaguccg acgauc 26
<210> 15
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 15
gccttggcac ccgagaattc ca 22
<210> 16
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 16
gucaucugaa acuugcucuc gaaaa 25
<210> 17
<211> 29
<212> DNA/RNA
<213> Artificial Sequence
<400> 17
ucacugcaga ugaugaguag acacguaga 29
<210> 18
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 18
augccuaugg auucgucguc 20
<210> 19
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 19
guucucgagu aaaagugugu c 21
<210> 20
<211> 27
<212> DNA/RNA
<213> Artificial Sequence
<400> 20
cucaguugau cacacaugau ccuaugu 27
<210> 21
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 21
cacguagagc cuucuuagcg cag 23
<210> 22
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 22
uggaauucuc gggcaccaag gu 22
<210> 23
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 23
guggaacuca gaccuaaacg g 21
<210> 24
<211> 26
<212> DNA/RNA
<213> Artificial Sequence
<400> 24
uccaguuaug aucaggaauu ucaguu 26
<210> 25
<211> 50
<212> DNA/RNA
<213> Artificial Sequence
<400> 25
aatgatacgg cgaccaccga gatctacacg ttcagagttc tacagtccga 50
<210> 26
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 26
caagcagaag acggcatacg agatcgtgat gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 27
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 27
caagcagaag acggcatacg agatacatcg gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 28
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 28
caagcagaag acggcatacg agatgcctaa gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 29
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 29
caagcagaag acggcatacg agattggtca gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 30
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 30
caagcagaag acggcatacg agatcactgt gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 31
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 31
caagcagaag acggcatacg agatattggc gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 32
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 32
caagcagaag acggcatacg agatgatctg gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 33
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 33
caagcagaag acggcatacg agattcaagt gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 34
<211> 63
<212> DNA/RNA
<213> Artificial Sequence
<400> 34
caagcagaag acggcatacg agatctgatc gtgactggag ttccttggca cccgagaatt 60
cca 63
<210> 35
<211> 46
<212> DNA/RNA
<213> Artificial Sequence
<400> 35
gcgagcacag aattaatacg actcactata ggtttttttt ttttvn 46
<210> 36
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 36
caagcagaag acggcatacg 20
<210> 37
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 37
gcgagcacag aattaatacg ac 22
<210> 38
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 38
tcatctgaaa cttgctctcg aaaa 24
<210> 39
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 39
gcagatgatg agtagacacg taga 24
<210> 40
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 40
atgcctatgg attcgtcgtc 20
<210> 41
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 41
gttctcgagt aaaagtgtgt c 21
<210> 42
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 42
agttgatcac acatgatcct atgt 24
<210> 43
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 43
cacgtagagc cttcttagcg cag 23
<210> 44
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 44
tggaattctc gggcaccaag gt 22
<210> 45
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 45
gtggaactca gacctaaacg g 21
<210> 46
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 46
cagttatgat caggaatttc agtt 24
<210> 47
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 47
gtctacggcc ataccaccct g 21
<210> 48
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 48
aaagcctaca gcacccggta t 21
<210> 49
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 49
tgtccacctt ccagcagatg t 21
<210> 50
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 50
agctcagtaa cagtccgcct aga 23
<210> 51
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 51
agcggaggaa aagaaactaa aa 22
<210> 52
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 52
gtttccgtag tgtagtggtt aaaa 24
<210> 53
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 53
ctgcgatgat gtcatatctt aaaa 24
<210> 54
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 54
acctggcagg ggagatacca aaa 23
<210> 55
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 55
agaagtttgg gatatactaa aa 22
<210> 56
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 56
aattccacct ttcgggcgcc aaaa 24
<210> 57
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 57
gcgcggcgcc tcgcctcaaa a 21
<210> 58
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 58
tttgaaacac gggaaacctc aaaa 24
<210> 59
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 59
gcgcggtggc gcacgcctgt aaaa 24
<210> 60
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 60
acggccatac caccctgaac aaaa 24
<210> 61
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 61
gactcttagc ggtggatcaa aa 22
<210> 62
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 62
aggggaatcc gactgtttaa aa 22
<210> 63
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 63
tcaggatggc cgagcggtct aaaa 24
<210> 64
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 64
ggggaattag ctcaaatggt aaaa 24
<210> 65
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 65
acacaacttt tttccccatc aaaa 24
<210> 66
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 66
agtgatgtga tgattctgcc aaaa 24
<210> 67
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 67
gtgtagtatc tgttcttatc aaaa 24
<210> 68
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 68
gcgggaaact cgactgcaaa a 21
<210> 69
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 69
gagttcggtt cccagcaccc aaaa 24
<210> 70
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 70
ggttcagtgg tagaattctc aaaa 24
<210> 71
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 71
agggaacgtg agctgggatt aaaa 24
<210> 72
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 72
tccttttgta tagtggtgag taaaa 25
<210> 73
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 73
ggagagatgg ctcagccgtt aaaa 24
<210> 74
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 74
aggctcacaa ccaaaaatat aaaa 24
<210> 75
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 75
gttaatgtgc ttaataacaa aa 22
<210> 76
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 76
gttctgggct gtagtgcgct aaaa 24
<210> 77
<211> 26
<212> DNA/RNA
<213> Artificial Sequence
<400> 77
tggagtgtga caatggtgtt tgaaaa 26
<210> 78
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 78
agcttatcag actgatgttg aaaa 24
<210> 79
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 79
tcagtgcatg acagaacttg gaaaa 25
<210> 80
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 80
attcaacgct gtcggtgagt aaaa 24
<210> 81
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 81
gcaaatctat gcaaaactga aaa 23
<210> 82
<211> 26
<212> DNA/RNA
<213> Artificial Sequence
<400> 82
tcagtgcact acagaacttt gtaaaa 26
<210> 83
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 83
cgactcttag cggtggatca aaa 23
<210> 84
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 84
gcgccgaatc cccgccccgc aaaa 24
<210> 85
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 85
agtgaaactg cgaatggctc aaaa 24
<210> 86
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 86
gtttccgtag tgtagtggtc aaaa 24
<210> 87
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 87
gccgctggtg tagtggtatc aaaa 24
<210> 88
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 88
actggtctgc agctgttctt aaaa 24
<210> 89
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 89
ccggatgtgc tgacccctgc aaaa 24
<210> 90
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 90
aaattcgtga agcgttccaa aa 22
<210> 91
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 91
ttccgtagtg tagtggtatc aaaa 24
<210> 92
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 92
acttgaacgc gcccgatctc aaaa 24
<210> 93
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 93
ctggcgctct cgctcccgac aaaa 24
<210> 94
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 94
cttagtagag cagccaccac aaaa 24
<210> 95
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 95
gccgatcggg tgtccgcact aaaa 24
<210> 96
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 96
gggccagagg cggccctaac aaaa 24
<210> 97
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 97
tggtccgaag gtagtgagtt aaaa 24
<210> 98
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 98
cagtggagag cattgactgc aaaa 24
<210> 99
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 99
ccaagttctg tcatgcactg a 21
<210> 100
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 100
caaacaccat tgtcacactc ca 22
<210> 101
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 101
agtttctttt cctccgct 18
<210> 102
<211> 19
<212> DNA/RNA
<213> Artificial Sequence
<400> 102
ggtatctccc ctgccaggt 19
<210> 103
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 103
agtatatccc aaacttct 18
<210> 104
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 104
ggcgcccgaa aggtggaatt 20
<210> 105
<211> 17
<212> DNA/RNA
<213> Artificial Sequence
<400> 105
gaggcgaggc gccgcgc 17
<210> 106
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 106
acaggcgtgc gccaccgcgc ccggc 25
<210> 107
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 107
gagaattcca tacgtc 16
<210> 108
<211> 26
<212> DNA/RNA
<213> Artificial Sequence
<400> 108
catatgcagg atgactccag gtacac 26
<210> 109
<211> 28
<212> DNA/RNA
<213> Artificial Sequence
<400> 109
gctcgagcta tagactgaaa aacgactc 28
<210> 110
<211> 27
<212> DNA/RNA
<213> Artificial Sequence
<400> 110
catatgcagg atcgaatgta ccaacgg 27
<210> 111
<211> 27
<212> DNA/RNA
<213> Artificial Sequence
<400> 111
gctcgagcta tctgtcaaag tgcactg 27
<210> 112
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 112
caccgatgtc aacaccttta tcca 24
<210> 113
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 113
aaattggata aaggtgttga catc 24
<210> 114
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 114
caccgcttga tcttcgtgct gggtc 25
<210> 115
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 115
aaacgaccca gcacgaagat caagc 25
<210> 116
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 116
caccgggtgt tgaagcgttt gcac 24
<210> 117
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 117
aaatgtgcaa acgcttcaac accc 24
<210> 118
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 118
caccgcaata cgaagtggtc aggt 24
<210> 119
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 119
aaatacctga ccacttcgta ttgc 24
<210> 120
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 120
caccgtggca tcatagtgct gggtc 25
<210> 121
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 121
aaacgaccca gcactatgat gccac 25
<210> 122
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 122
caccgatcgc tggtacatgc catcc 25
<210> 123
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 123
aaacggatgg catgtaccag cgatc 25
<210> 124
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 124
caccgatcgc tggtacatgc catcc 25
<210> 125
<211> 25
<212> DNA/RNA
<213> Artificial Sequence
<400> 125
aaacggatgg catgtaccag cgatc 25
Claims (16)
1.一种检测sRNA的末端修饰的方法,其特征在于,所述末端修饰包括3’-OH和3’-cP修饰,所述方法包括:
(a)提供待测sRNA,使其中存在3’-OH的sRNA的3’端连接上标记3’-OH的接头序列;
(b)对(a)的产物进行脱磷酸化处理,获得5’端和3’端脱去磷酸的产物;
(c)对(b)的产物进行氧化处理,使3’-OH发生氧化,分离sRNA;
(d)对(c)的产物进行磷酸化处理,获得携带5’-P的产物;
(e)使(d)的产物中存在3’-cP的sRNA连接上标记3’-cP的接头序列;
(f)根据标记3’-OH的接头序列、标记3’-cP的接头序列,鉴定(f)的产物中含有3’-OH和3’-cP的sRNA。
2.如权利要求1所述的方法,其特征在于,(a)中,利用T4 RNA连接酶2连接标记3’-OH的接头序列;和/或
(b)中,以碱性磷酸酶进行脱磷酸化处理;和/或
(c)中,以高碘酸钠进行氧化处理;和/或
(d)中,以T4多聚合核苷酸激酶进行磷酸化处理;较佳地该T4多聚合核苷酸激酶3’磷酸酶缺失,更佳地其为T4 Pnk 3’phosphatase minus;和/或
(e)中,以RtcB连接反应连接标记3’-cP的接头序列。
3.如权利要求1所述的方法,其特征在于,在(e)和(f)之间,还包括:在(e)的产物的5’端连接上标记sRNA的5’-接头序列;较佳地,利用T4 RNA连接酶1连接标记sRNA的5’-接头序列。
4.如权利要求1所述的方法,其特征在于,(f)中,根据标记3’-OH的接头序列、标记3’-cP的接头序列的存在情况/存在量,确定携带3’-OH和携带3’-cP的sRNA的存在情况或存在量;较佳地,标记3’-OH的接头序列、标记3’-cP的接头序列、标记sRNA的5’-接头序列为配合规模化测序的接头序列。
5.如权利要求1或4所述的方法,其特征在于,(f)中,对产物进行鉴定的方法包括:定量PCR法,测序法,Northern blot法;或
(f)后,还包括:通过高通量测序,去除所述的标记3’-OH的接头序列、标记3’-cP的接头序列,根据鉴定结果,建立子文库。
6.一种检测sRNA的末端修饰的方法,其特征在于,所述末端修饰包括3’-OH、3’-cP和3’-P,所述方法包括:
(1)提供待测sRNA,将其分成三组,分别以溶剂、碱性磷酸酶和T4多聚合核苷酸激酶处理:
溶剂组不变,
碱性磷酸酶组中,原3’-P修饰的sRNA的3’末端转变为3’-OH,
T4多聚合核苷酸激酶组中,原3’-P修饰和原3’-cP修饰的sRNA的3’末端均转变为3’-OH;较佳地该T4多聚合核苷酸激酶不是T4 Pnk 3’phosphatase minus;
(2)对(1)的产物进行聚腺苷化反应,使3’-OH的sRNA的3’端聚腺苷化:
溶剂组中,仅原3’-OH的sRNA的3’端聚腺苷化,
碱性磷酸酶组中,原3’-OH和原3’-P修饰的sRNA的3’端聚腺苷化,
T4多聚合核苷酸激酶组中,原3’-OH、原3’-P修饰和原3’-cP修饰的sRNA的3’端聚腺苷化;
(3)对(2)的产物进行反转录反应:
溶剂组中,仅原3’-OH的sRNA的经3’端聚腺苷化的产物形成cDNA,
碱性磷酸酶组中,原3’-OH和原3’-P修饰的sRNA的经3’端聚腺苷化的产物形成cDNA,
T4多聚合核苷酸激酶组中,原3’-OH、原3’-P修饰和原3’-cP修饰的sRNA的经3’端聚腺苷化的产物形成cDNA;
(4)对(3)的反转录反应的产物进行定性或定量测定。
7.如权利要求6所述的方法,其特征在于,(3)中,进行反转录反应时,采用含有oligodT的反转录引物;较佳地如OH-DNA15-OH。
8.如权利要求7所述的方法,其特征在于,(1)中,所述的溶剂包括:水,缓冲液;和/或
(4)中,通过定量PCR进行定性或定量测定;较佳地,所述定量PCR为实时荧光定量PCR;更佳地,通过测定不同组的Ct值定量:
溶剂组中,Ct值反映3’-OH的sRNA的量;
碱性磷酸酶组中,Ct值反映3’-OH和3’-P修饰的sRNA的量;
T4多聚合核苷酸激酶组中,Ct值反映3’-OH、3’-P和3’-cP修饰的sRNA的量。
10.如权利要求1或6所述的方法,其特征在于,还包括,将所述方法获得的sRNA产物进行进一步的细分;较佳地,所述方法获得的sRNA产物与sRNA的信息库或数据库进行比对,从而进行sRNA的细分。
11.如权利要求1或6所述的方法,其特征在于,根据形态,所述待测sRNA包括:来自细胞的总sRNA,局部获取或分离的sRNA;或
根据物种,所述sRNA包括:动物、植物或微生物来源的sRNA。
12.权利要求1-11任一所述的方法的应用,包括:
用于检测sRNA的末端修饰;所述的sRNA的末端修饰包括选自:(a)3’-OH和3’-cP修饰;或,(b)3’-OH、3’-P和3’-cP修饰;或
用于建立细胞的sRNA的3’-OH和3’-cP末端修饰的sRNA的表达谱/图谱/文库,或建立3’-OH、3’-P和3’-cP末端修饰的sRNA的表达谱/图谱/文库。
13.如权利要求12所述的应用,其特征在于,sRNA末端修饰的区分进一步被用于:
测定特定的生物状态;
筛选调节sRNA末端修饰的效应分子。
14.一种用于检测sRNA的末端修饰的试剂盒,其特征在于,其中包括下组试剂:
检测sRNA的3’-OH和3’-cP末端修饰的试剂:T4 RNA连接酶2、碱性磷酸酶、高碘酸钠、T4多聚合核苷酸激酶、RtcB连接酶、标记3’-OH的接头序列、标记3’-cP的接头序列、标记5’的接头序列;较佳地该T4多聚合核苷酸激酶3’磷酸酶缺失,更佳地其为T4 Pnk 3’phosphatase minus;或
检测sRNA的3’-OH、3’-P和3’-cP末端修饰的试剂:溶剂、碱性磷酸酶和T4多聚合核苷酸激酶。
15.如权利要求14所述的用于检测sRNA的末端修饰的试剂盒,其特征在于,其中还包括选自下组的试剂:spike-in混合物,T4 RNA连接酶反应缓冲液,水,PEG8000,核糖核酸酶抑制剂,CutSmart缓冲液,核酸沉淀试剂,核酸抽提试剂,RtcB反应缓冲液,Mn2+离子溶液,GTP,ATP,反转录引物,SSIV缓冲液,SuperScriptIV反转录酶,DTT,dNTP,DNA聚合酶。
16.Ang和/或RNase 4的应用,用于促进sRNA-cP的形成;较佳地,所述的促进包括体外或胞内的促进。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111571180.5A CN116287159A (zh) | 2021-12-21 | 2021-12-21 | 小rna的新型检测方法及其应用 |
| PCT/CN2022/138474 WO2023116490A1 (zh) | 2021-12-21 | 2022-12-12 | 小rna的新型检测方法及其应用 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111571180.5A CN116287159A (zh) | 2021-12-21 | 2021-12-21 | 小rna的新型检测方法及其应用 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116287159A true CN116287159A (zh) | 2023-06-23 |
Family
ID=86822630
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202111571180.5A Pending CN116287159A (zh) | 2021-12-21 | 2021-12-21 | 小rna的新型检测方法及其应用 |
Country Status (2)
| Country | Link |
|---|---|
| CN (1) | CN116287159A (zh) |
| WO (1) | WO2023116490A1 (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116287159A (zh) * | 2021-12-21 | 2023-06-23 | 中国科学院上海营养与健康研究所 | 小rna的新型检测方法及其应用 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2815554A1 (en) * | 2004-03-12 | 2005-09-29 | Alnylam Pharmaceuticals, Inc. | Irna agents targeting vegf |
| CN113025689A (zh) * | 2021-04-02 | 2021-06-25 | 上海科技大学 | 一种携带修饰的小rna的建库方法及其应用 |
| CN113817803A (zh) * | 2020-06-18 | 2021-12-21 | 上海科技大学 | 一种携带修饰的小rna的建库方法及其应用 |
| WO2023116490A1 (zh) * | 2021-12-21 | 2023-06-29 | 中国科学院上海营养与健康研究所 | 小rna的新型检测方法及其应用 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11248262B2 (en) * | 2015-08-24 | 2022-02-15 | Qiagen Gmbh | Method for generating a RNA-sequencing library |
| WO2018136936A1 (en) * | 2017-01-23 | 2018-07-26 | Srnalytics, Inc. | Methods for identifying and using small rna predictors |
| CN109161586B (zh) * | 2018-09-29 | 2019-07-09 | 曲阜师范大学 | 一种对rna分子进行绝对定量的高通量测序方法 |
| CN113249437A (zh) * | 2021-04-20 | 2021-08-13 | 成都罗宁生物科技有限公司 | 一种用于sRNA测序的建库方法 |
-
2021
- 2021-12-21 CN CN202111571180.5A patent/CN116287159A/zh active Pending
-
2022
- 2022-12-12 WO PCT/CN2022/138474 patent/WO2023116490A1/zh not_active Ceased
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2815554A1 (en) * | 2004-03-12 | 2005-09-29 | Alnylam Pharmaceuticals, Inc. | Irna agents targeting vegf |
| CN113817803A (zh) * | 2020-06-18 | 2021-12-21 | 上海科技大学 | 一种携带修饰的小rna的建库方法及其应用 |
| CN113025689A (zh) * | 2021-04-02 | 2021-06-25 | 上海科技大学 | 一种携带修饰的小rna的建库方法及其应用 |
| WO2023116490A1 (zh) * | 2021-12-21 | 2023-06-29 | 中国科学院上海营养与健康研究所 | 小rna的新型检测方法及其应用 |
Non-Patent Citations (3)
| Title |
|---|
| HANQING GU ET AL.: ""A 5’tRNA-Ala-derived small RNA regulates anti-fungal defense in plants"", 《SCI CHINA LIFE SCI》, vol. 65, no. 1, 22 October 2021 (2021-10-22), pages 1 - 15 * |
| HEJIN LAI ET AL.: ""Discovery of the major 15–30 nt mammalian small RNAs, their biogenesis and function"", 《NATURE COMMUNICATIONS》, vol. 14, 18 September 2023 (2023-09-18), pages 1 - 16 * |
| SHOZO HONDA ET AL.: ""Selective amplification and sequencing of cyclic phosphate–containing RNAs by the cP-RNA-seq method"", 《NATURE PROTOCOLS》, vol. 11, no. 3, 11 February 2016 (2016-02-11), pages 476 - 489, XP055691458, DOI: 10.1038/nprot.2016.025 * |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023116490A1 (zh) | 2023-06-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1024201B1 (en) | Microassay for serial analysis of gene expression and applications thereof | |
| EP2914745B1 (en) | Barcoding nucleic acids | |
| EP3730628B1 (en) | Polynucleotide adapter design for reduced bias | |
| WO2018024082A1 (zh) | 一种串联rad标签测序文库的构建方法 | |
| CN111808854B (zh) | 带有分子条码的平衡接头及快速构建转录组文库的方法 | |
| Smith et al. | Reading canonical and modified nucleotides in 16S ribosomal RNA using nanopore direct RNA sequencing | |
| CN103687961B (zh) | 用于等温全基因组扩增的方法和组合物 | |
| EP3765478B1 (en) | Methods of quantifying rna and dna variants through sequencing employing phosphorothioates | |
| CN114736951B (zh) | 一种小分子rna的高通量测序文库构建方法 | |
| CN112322700B (zh) | 短rna片段文库的构建方法、试剂盒及应用 | |
| WO2017215517A1 (zh) | 测序文库构建中5'和3'接头连接副产物的去除方法 | |
| US20150087556A1 (en) | COMPOSITIONS AND METHODS FOR MAKING cDNA LIBRARIES FROM SMALL RNAs | |
| WO2019191122A1 (en) | Integrative dna and rna library preparations and uses thereof | |
| CN109971843B (zh) | 一种单细胞转录组的测序方法 | |
| US11326160B2 (en) | Method for making a cDNA library | |
| CN116287159A (zh) | 小rna的新型检测方法及其应用 | |
| CN103555848B (zh) | 小RNA的3’-5’-qPCR定量检测技术 | |
| US10954542B2 (en) | Size selection of RNA using poly(A) polymerase | |
| Bhattacharya et al. | Experimental toolkit to study RNA level regulation | |
| WO2025000136A1 (zh) | 一种快速检测多种类型rna的链特异性文库制备方法与高通量测序技术 | |
| US20220348996A1 (en) | Method and kit for non-specific amplification of natural short-fragment nucleic acid | |
| US20110269137A1 (en) | Rapid and efficient assay to assess the sequence and size of 3' ends of polynucleotides | |
| US20250084484A1 (en) | Methods and compositions for transcriptome analysis | |
| Wang et al. | Capture, amplification, and global profiling of microRNAs from low quantities of whole cell lysate | |
| Pan et al. | Updated pseudo-seq protocol for transcriptome-wide detection of pseudouridines |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |