RU2843259C2 - Method of capturing cleavage products of crispr endonuclease - Google Patents
Method of capturing cleavage products of crispr endonuclease Download PDFInfo
- Publication number
- RU2843259C2 RU2843259C2 RU2024118667A RU2024118667A RU2843259C2 RU 2843259 C2 RU2843259 C2 RU 2843259C2 RU 2024118667 A RU2024118667 A RU 2024118667A RU 2024118667 A RU2024118667 A RU 2024118667A RU 2843259 C2 RU2843259 C2 RU 2843259C2
- Authority
- RU
- Russia
- Prior art keywords
- insdqualifier
- insdfeature
- nucleic acid
- insdseq
- name
- Prior art date
Links
Abstract
Description
ОБЛАСТЬ ИЗОБРЕТЕНИЯFIELD OF INVENTION
[001] Настоящее изобретение относится к области нуклеиновых кислот и ассоциированных с эндонуклеазами способов, и более конкретно - к способам захвата нуклеиновых кислот для последующего анализа, такого как секвенирование. [001] The present invention relates to the field of nucleic acids and endonuclease-associated methods, and more particularly to methods for capturing nucleic acids for subsequent analysis, such as sequencing.
ЗАЯВЛЕНИЕ О ФЕДЕРАЛЬНО СПОНСИРУЕМЫХ ИССЛЕДОВАНИЯХFEDERALLY SPONSORED RESEARCH STATEMENT
[002] Отсутствует.[002] None.
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES
[003] Место для заполнения.[003] Place to fill.
УРОВЕНЬ ТЕХНИКИLEVEL OF TECHNOLOGY
[004] Захват нуклеиновых кислот с помощью клонирующих векторов или адаптеров основан на лигировании. Более эффективное лигирование включает совместимые липкие концы нуклеиновых кислот, подлежащих лигированию, т.е. нуклеиновые кислоты имеют липкие концы, способные гибридизоваться с липкими концами партнера по лигированию. Лигирование липких концов является кинетически более предпочтительным, чем лигирование тупых концов, когда партнеры по лигированию не образуют каких-либо гибридов перед лигированием. По этой причине распространенный способ лигирования включает создание липких концов в одно основание посредством получения dA-хвоста. Используют ферментативные или химические способы для добавления липкого конца dA на один из партнеров по лигированию и липкого конца dT на другого партнера по лигированию. Получение dA-хвоста или TA-клонирование используют в клонировании и получении библиотеки секвенирования.[004] Capture of nucleic acids by cloning vectors or adaptors is based on ligation. More efficient ligation involves compatible sticky ends of the nucleic acids to be ligated, i.e., the nucleic acids have sticky ends that are capable of hybridizing to the sticky ends of the ligation partner. Sticky end ligation is kinetically more favorable than blunt end ligation, where the ligation partners do not form any hybrids prior to ligation. For this reason, a common ligation method involves creating single base sticky ends by dA tailing. Enzymatic or chemical methods are used to add a dA sticky end to one of the ligation partners and a dT sticky end to the other ligation partner. dA tailing or TA cloning is used in cloning and sequencing library preparation.
[005] Хотя способ получения dA-хвоста является предпочтительным из-за своей простоты, он имеет несколько недостатков. Во-первых, встраиваемый нуклеотид A является нежелательным, если захватываемая последовательность является кодирующей последовательностью или частью кодирующей последовательности. Во-вторых, захват через получение dA-хвоста является неспецифическим. Все нуклеиновые кислоты в образце, имеющие доступный 3’-конец, будут модифицироваться концевой трансферазой с включением 3’-концевого A, и, таким образом, и желаемые, и нежелательные нуклеиновые кислоты будут становиться субстратами для реакции лигирования.[005] Although the dA tailing method is preferred due to its simplicity, it has several disadvantages. First, the incorporated A nucleotide is undesirable if the captured sequence is a coding sequence or part of a coding sequence. Second, capture via dA tailing is non-specific. All nucleic acids in the sample that have an accessible 3' end will be modified by the terminal transferase to incorporate the 3' terminal A, and thus both desired and undesired nucleic acids will become substrates for the ligation reaction.
[006] Существует потребность в точном и эффективном способе захвата нуклеиновых кислот, расщепленных эндонуклеазами, такими как эндонуклеазы рестрикции и эндонуклеазы CRISPR.[006] There is a need for an accurate and efficient method for capturing nucleic acids cleaved by endonucleases such as restriction endonucleases and CRISPR endonucleases.
СУЩНОСТЬ ИЗОБРЕТЕНИЯESSENCE OF THE INVENTION
[007] Настоящее изобретение относится к способу захвата концов расщепленных эндонуклеазами нуклеиновых кислот посредством образования липких 5’-концов с помощью контролируемого расщепление экзонуклеазами таким образом, что адаптер с липким 5’-концом будет эффективно лигироваться. Способ представляет собой альтернативу способу получения dA-хвоста, являющуюся более эффективной и более специфичной.[007] The present invention relates to a method for capturing the ends of endonuclease-cleaved nucleic acids by forming sticky 5'-ends using controlled cleavage with exonucleases such that an adapter with a sticky 5'-end will be effectively ligated. The method is an alternative to the method for producing a dA tail, which is more efficient and more specific.
[008] В некоторых вариантах осуществления настоящее изобретение относится к способу захвата нуклеиновой кислоты из образца, содержащего целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, включающему: приведение двухцепочечной целевой нуклеиновой кислоты, имеющей 3’-конец, в контакт с катализатором, обладающим 3’-5’-экзонуклеазной активностью и, таким образом, получение первого липкого 5’-конца на первом 5’-конце и первого углубленного 3’-конца в целевой нуклеиновой кислоте; приведение нуклеиновой кислоты в контакт с адаптером, имеющим второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом, и, таким образом, получение гибрида между первым и вторым липкими 5’-концами; и связывание по меньшей мере одного из первых 3’-концов со вторым 5’-концом и, таким образом, захват целевой нуклеиновой кислоты посредством образования снабженной адаптером нуклеиновой кислоты. В некоторых вариантах осуществления адаптер дополнительно содержит второй углубленный 3’-конец, и связывание дополнительно включает связывание первого 5’-конца со вторым 3’-концом. В некоторых вариантах осуществления 3’-конец двухцепочечной целевой нуклеиновой кислоты является частью тупого конца. В некоторых вариантах осуществления 3’-конец двухцепочечной целевой нуклеиновой кислоты является частью липкого 3’-конца. В некоторых вариантах осуществления 3’-конец двухцепочечной целевой нуклеиновой кислоты получают посредством расщепления нуклеиновой кислоты специфической для последовательности эндонуклеазой.[008] In some embodiments, the present invention relates to a method of capturing a nucleic acid from a sample comprising a target nucleic acid and non-target nucleic acids, comprising: contacting a double-stranded target nucleic acid having a 3' end with a catalyst having 3'-5' exonuclease activity and thereby producing a first 5' overhang at the first 5' end and a first 3' recessed end in the target nucleic acid; contacting the nucleic acid with an adapter having a second 5' overhang at a second 5' end, a second 5' overhang capable of hybridizing to the first 5' overhang, and thereby producing a hybrid between the first and second 5' overhangs; and linking at least one of the first 3' ends to the second 5' end and thereby capturing the target nucleic acid by forming an adaptor-equipped nucleic acid. In some embodiments, the adaptor further comprises a second recessed 3' end, and the linking further comprises linking the first 5' end to the second 3' end. In some embodiments, the 3' end of the double-stranded target nucleic acid is part of a blunt end. In some embodiments, the 3' end of the double-stranded target nucleic acid is part of a 3' overhang. In some embodiments, the 3' end of the double-stranded target nucleic acid is obtained by cleaving the nucleic acid with a sequence-specific endonuclease.
[009] В некоторых вариантах осуществления специфическая для последовательности эндонуклеаза является эндонуклеазой рестрикции. В некоторых вариантах осуществления специфическая для последовательности эндонуклеаза является эндонуклеазой CRISPR. В некоторых вариантах осуществления специфическая для последовательности эндонуклеаза является каталитически неактивной эндонуклеазой CRISPR, слитой с Fok I. В некоторых вариантах осуществления специфическая для последовательности эндонуклеаза является нуклеазой на основе эффектора, подобного активатору транскрипции (TALEN) или слитым белком TALEN-Fok I. В некоторых вариантах осуществления специфическая для последовательности эндонуклеаза является нуклеазой с цинковыми пальцами (ZFN) или слитым белком ZFN-Fok I. В некоторых вариантах осуществления катализатор, обладающий 3’-5’-экзонуклеазной активностью, является ДНК-полимеразой.[009] In some embodiments, the sequence-specific endonuclease is a restriction endonuclease. In some embodiments, the sequence-specific endonuclease is a CRISPR endonuclease. In some embodiments, the sequence-specific endonuclease is a catalytically inactive CRISPR endonuclease fused to Fok I. In some embodiments, the sequence-specific endonuclease is a transcription activator-like effector nuclease (TALEN) or a TALEN-Fok I fusion protein. In some embodiments, the sequence-specific endonuclease is a zinc finger nuclease (ZFN) or a ZFN-Fok I fusion protein. In some embodiments, the catalyst having 3'-5' exonuclease activity is a DNA polymerase.
[0010] В некоторых вариантах осуществления ДНК-полимераза, обладающая 3’-5’-экзонуклеазной активностью, является полимеразой семейства A, полимеразой семейства B или полимеразой семейства C, содержащих домены Exo I, Exo II и Exo III фрагмента Кленова Pol I E. coli. В некоторых вариантах осуществления ДНК-полимераза содержит остатки аспартата, соответствующие остаткам D355, D424 и D501 фрагмента Кленова Pol I E. coli. В некоторых вариантах осуществления ДНК-полимераза выбрана из группы, состоящей из ДНК-полимеразы T4, ДНК-полимеразы RB69, фрагмента Кленова, ДНК-полимеразы T7, фрагмента дельта Pol III E. coli, эукариотической полимеразы эпсилон, эукариотической полимеразы дельта и митохондриальной полимеразы гамма.[0010] In some embodiments, the DNA polymerase having 3'-5' exonuclease activity is a family A polymerase, a family B polymerase, or a family C polymerase comprising the Exo I, Exo II, and Exo III domains of the Klenow fragment of Pol I.E. coli. In some embodiments, the DNA polymerase comprises aspartate residues corresponding to residues D355, D424, and D501 of the Pol I Klenow fragmentE. coli. In some embodiments, the DNA polymerase is selected from the group consisting of T4 DNA polymerase, RB69 DNA polymerase, Klenow fragment, T7 DNA polymerase, delta Pol IIIE. coli, eukaryotic polymerase epsilon, eukaryotic polymerase delta and mitochondrial polymerase gamma.
[0011] В некоторых вариантах осуществления 3’-5’-экзонуклеазная активность демонстрируется в присутствии менее чем четырех из dATP, dCTP, dGTP и dTTP, и приведение в контакт осуществляют с менее чем четырьмя из dATP, dCTP, dGTP и dTTP и, 3’-5’-экзонуклеазная активность прекращается на нуклеотиде, идентичном одному из менее чем четырех dATP, dCTP, dGTP и dTTP. В некоторых вариантах осуществления используют один dNTP, и 3’-5’-экзонуклеазная активность прекращается на нуклеотиде, идентичном одному dNTP.[0011] In some embodiments, 3'-5' exonuclease activity is demonstrated in the presence of less than four of dATP, dCTP, dGTP, and dTTP, and the contacting is with less than four of dATP, dCTP, dGTP, and dTTP, and the 3'-5' exonuclease activity is terminated at a nucleotide identical to one of less than four of dATP, dCTP, dGTP, and dTTP. In some embodiments, a single dNTP is used, and the 3'-5' exonuclease activity is terminated at a nucleotide identical to the single dNTP.
[0012] В некоторых вариантах осуществления липкий 5’-конец имеет длину 2-15 нуклеотидов. В некоторых вариантах осуществления адаптер содержит по меньшей мере один из штрихкода нуклеиновой кислоты, участка связывания праймера для секвенирования и участка связывания праймера для амплификации. В некоторых вариантах осуществления штрихкод выбран из уникального молекулярного ID (UMI) и ID образца (SID) или того и другого.[0012] In some embodiments, the 5' sticky end is 2-15 nucleotides in length. In some embodiments, the adapter comprises at least one of a nucleic acid barcode, a sequencing primer binding site, and an amplification primer binding site. In some embodiments, the barcode is selected from a unique molecular ID (UMI) and a sample ID (SID), or both.
[0013] В некоторых вариантах осуществления адаптер получают посредством отжига двух цепей нуклеиновой кислоты. В некоторых вариантах осуществления адаптер получают посредством расщепления экзонуклеазами 3’-конца для образования олигонуклеотида с липким 5’-концом. В некоторых вариантах осуществления адаптер содержит модификацию нуклеиновой кислоты, повышающую температуру плавления дуплекса нуклеиновой кислоты, включающего модификацию. В некоторых вариантах осуществления адаптер содержит последовательность, выбранную из SEQ ID NO: 7-11.[0013] In some embodiments, the adapter is produced by annealing two strands of nucleic acid. In some embodiments, the adapter is produced by exonuclease cleavage of the 3' end to form an oligonucleotide with a sticky 5' end. In some embodiments, the adapter comprises a nucleic acid modification that increases the melting temperature of a nucleic acid duplex comprising the modification. In some embodiments, the adapter comprises a sequence selected from SEQ ID NO: 7-11.
[0014] В некоторых вариантах осуществления связывание осуществляют посредством лигирования, и ему предшествует фосфорилирование нуклеиновых кислот или адаптера, т.е. с использованием полинуклеотидкиназы.[0014] In some embodiments, the linking is accomplished by ligation and is preceded by phosphorylation of the nucleic acids or adapter, i.e., using polynucleotide kinase.
[0015] В некоторых вариантах осуществления способ дополнительно включает амплификацию захваченной нуклеиновой кислоты, например, с помощью праймера для амплификации, отжигающегося на участке связывания праймера в адаптере. В некоторых вариантах осуществления праймер для амплификации содержит последовательность, выбранную из SEQ ID NO: 12-16. В некоторых вариантах осуществления амплификация является линейной амплификацией. В некоторых вариантах осуществления амплификация является экспоненциальной амплификацией посредством ПЦР, например, включающей 5, 10, 20, 30 или 40 циклов.[0015] In some embodiments, the method further comprises amplifying the captured nucleic acid, such as with an amplification primer that anneals to a primer binding site in the adapter. In some embodiments, the amplification primer comprises a sequence selected from SEQ ID NO: 12-16. In some embodiments, the amplification is a linear amplification. In some embodiments, the amplification is an exponential amplification by PCR, such as comprising 5, 10, 20, 30, or 40 cycles.
[0016] В некоторых вариантах осуществления адаптер связан с функциональным фрагментом захвата, и способ дополнительно включает захват функционального фрагмента захвата в снабженной адаптером нуклеиновой кислоте и, таким образом, захват нуклеиновой кислоты. В некоторых вариантах осуществления функциональный фрагмент захвата выбран из биотина, антигена, способного связываться с антителом захвата, и последовательности захвата, способной гибридизоваться с нуклеиновой кислотой захвата.[0016] In some embodiments, the adapter is linked to a functional capture moiety, and the method further comprises capturing the functional capture moiety in the adapter-equipped nucleic acid and thereby capturing the nucleic acid. In some embodiments, the functional capture moiety is selected from biotin, an antigen capable of binding to a capture antibody, and a capture sequence capable of hybridizing to the capture nucleic acid.
[0017] В некоторых вариантах осуществления способ дополнительно включает секвенирование захваченной нуклеиновой кислоты. В некоторых вариантах осуществления праймер для секвенирования отжигается на участке связывания праймера в адаптере. В некоторых вариантах осуществления секвенирование осуществляют после амплификации. В некоторых вариантах осуществления праймер для секвенирования отжигается на участке связывания праймера, присутствующем в праймере для амплификации. В некоторых вариантах осуществления захваченная нуклеиновая кислота имеет длину 1, 10 или 100 т.п.н.[0017] In some embodiments, the method further comprises sequencing the captured nucleic acid. In some embodiments, the sequencing primer anneals to a primer binding site in the adapter. In some embodiments, sequencing is performed after amplification. In some embodiments, the sequencing primer anneals to a primer binding site present in the amplification primer. In some embodiments, the captured nucleic acid is 1, 10, or 100 kb in length.
[0018] В некоторых вариантах осуществления способ не включает промежуточные стадии очистки.[0018] In some embodiments, the method does not include intermediate purification steps.
[0019] В некоторых вариантах осуществления настоящее изобретение относится к способу секвенирования целевой нуклеиновой кислоты в образце, содержащем целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, включающему: приведение двухцепочечной целевой нуклеиновой кислоты, имеющей 3’-конец, в контакт с катализатором, обладающим 3’-5’-экзонуклеазной активностью, и, таким образом, получение первого липкого 5’-конца на первом 5’-конце и первого углубленного 3’-конца в целевой нуклеиновой кислоте; приведение нуклеиновой кислоты в контакт с адаптером, имеющим второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом, и, таким образом, получение гибрида между первым и вторым 5’-липкими концами; связывание по меньшей мере одного из первого 3’-конца со вторым 5’-концом и, таким образом, получение снабженной адаптером нуклеиновой кислоты; и секвенирование снабженной адаптером нуклеиновой кислоты.[0019] In some embodiments, the present invention relates to a method of sequencing a target nucleic acid in a sample comprising the target nucleic acid and non-target nucleic acids, comprising: contacting a double-stranded target nucleic acid having a 3' end with a catalyst having a 3'-5' exonuclease activity, thereby producing a first 5' overhang at the first 5' end and a first 3' recessed end in the target nucleic acid; contacting the nucleic acid with an adapter having a second 5' overhang at a second 5' end, a second 5' overhang capable of hybridizing to the first 5' overhang, thereby producing a hybrid between the first and second 5' overhangs; linking at least one of the first 3'-end to the second 5'-end and thereby obtaining an adapter-equipped nucleic acid; and sequencing the adapter-equipped nucleic acid.
[0020] В некоторых вариантах осуществления способ дополнительно включает амплификацию захваченной нуклеиновой кислоты перед секвенированием. В некоторых вариантах осуществления секвенированная нуклеиновая кислота имеет длину 1, 10 или 100 т.п.н.[0020] In some embodiments, the method further comprises amplifying the captured nucleic acid prior to sequencing. In some embodiments, the sequenced nucleic acid is 1, 10, or 100 kb in length.
[0021] В некоторых вариантах осуществления способ секвенирования не включает промежуточные стадии очистки.[0021] In some embodiments, the sequencing method does not include intermediate purification steps.
[0022] В некоторых вариантах осуществления настоящее изобретение относится к способу обогащения нуклеиновой кислоты из образца, содержащего целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, включающему: приведение двухцепочечной целевой нуклеиновой кислоты, имеющей 3’-конец, в контакт с катализатором, обладающим 3’-5’-экзонуклеазной активностью, и, таким образом, получение первого липкого 5’-конца на первом 5’-конце и первого углубленного 3’-конца в целевой нуклеиновой кислоте; приведение нуклеиновой кислоты в контакт с адаптером, имеющим второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом, и, таким образом, получение гибрида между первым и вторым 5’-липкими концами; где адаптер дополнительно содержит функциональный фрагмент захвата; связывание по меньшей мере одного из первых 3’-концов со вторым 5’-концом и, таким образом, получение снабженной адаптером нуклеиновой кислоты; и захват функционального фрагмента захвата на адаптере и, таким образом, обогащение целевых нуклеиновых кислот из образца.[0022] In some embodiments, the present invention relates to a method of enriching a nucleic acid from a sample comprising a target nucleic acid and non-target nucleic acids, comprising: contacting a double-stranded target nucleic acid having a 3' end with a catalyst having a 3'-5' exonuclease activity, thereby producing a first 5' overhang at a first 5' end and a first 3' recessed end in the target nucleic acid; contacting the nucleic acid with an adaptor having a second 5' overhang at a second 5' end, a second 5' overhang capable of hybridizing to the first 5' overhang, thereby producing a hybrid between the first and second 5' overhangs; wherein the adaptor further comprises a functional capture moiety; linking at least one of the first 3'-ends to the second 5'-end and thereby obtaining an adapter-equipped nucleic acid; and capturing a functional capture moiety on the adapter and thereby enriching target nucleic acids from the sample.
[0023] В некоторых вариантах осуществления обогащенная нуклеиновая кислота имеет длину 1, 10 или 100 т.п.н.[0023] In some embodiments, the enriched nucleic acid is 1, 10, or 100 kb in length.
[0024] В некоторых вариантах осуществления способ обогащения не включает промежуточные стадии очистки.[0024] In some embodiments, the enrichment method does not include intermediate purification steps.
[0025] В некоторых вариантах осуществления настоящее изобретение относится к набору для обогащения нуклеиновой кислоты из образца, содержащего целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, содержащему: катализатор, обладающий 3’-5’-экзонуклеазной активностью и способный образовывать липкий 5’-конец в нуклеиновых кислотах; адаптер, сконструированный так, чтобы иметь липкий 5’-конец на 5’-конце, липкий 5’-конец, способный гибридизоваться с липким 5’-концом, ожидаемым в целевой нуклеиновой кислоте после обработки катализатором; и ДНК-лигазу.[0025] In some embodiments, the present invention relates to a kit for enriching a nucleic acid from a sample comprising a target nucleic acid and non-target nucleic acids, comprising: a catalyst having 3'-5' exonuclease activity and capable of forming a 5' sticky end in nucleic acids; an adapter designed to have a 5' sticky end at the 5' end, the 5' sticky end capable of hybridizing to a 5' sticky end expected in the target nucleic acid after treatment with the catalyst; and a DNA ligase.
[0026] В некоторых вариантах осуществления адаптер является двухцепочечным и дополнительно содержит второй углубленный 3’-конец.[0026] In some embodiments, the adapter is double-stranded and further comprises a second recessed 3' end.
[0027] В некоторых вариантах осуществления катализатор, обладающий 3’-5’-экзонуклеазной активностью, является ДНК-полимеразой. В некоторых вариантах осуществления ДНК-полимераза, обладающая 3’-5’-экзонуклеазной активностью, является полимеразой семейства A, полимеразой семейства B или полимеразой семейства C, содержащих домены Exo I, Exo II и Exo III фрагмента Кленова Pol I E. coli. В некоторых вариантах осуществления ДНК-полимераза содержит остатки аспартата, соответствующие остаткам D355, D424 и D501 фрагмента Кленова Pol I E. coli. В некоторых вариантах осуществления ДНК-полимераза выбрана из группы, состоящей из ДНК-полимеразы T4, ДНК-полимеразы RB69, фрагмента Кленова, ДНК-полимеразы T7, фрагмента дельта Pol III E. coli, эукариотической полимеразы эпсилон, эукариотической полимеразы дельта и митохондриальной полимеразы гамма.[0027] In some embodiments, the catalyst having 3'-5' exonuclease activity is a DNA polymerase. In some embodiments, the DNA polymerase having 3'-5' exonuclease activity is a family A polymerase, a family B polymerase, or a family C polymerase comprising the Exo I, Exo II, and Exo III domains of the Klenow fragment of Pol IE. coli. In some embodiments, the DNA polymerase comprises aspartate residues corresponding to residues D355, D424, and D501 of the Pol I Klenow fragmentE. coli. In some embodiments, the DNA polymerase is selected from the group consisting of T4 DNA polymerase, RB69 DNA polymerase, Klenow fragment, T7 DNA polymerase, delta Pol IIIE. coli, eukaryotic polymerase epsilon, eukaryotic polymerase delta and mitochondrial polymerase gamma.
[0028] В некоторых вариантах осуществления набор дополнительно содержит один или более из dATP, dCTP, dGTP и dTTP.[0028] In some embodiments, the kit further comprises one or more of dATP, dCTP, dGTP, and dTTP.
[0029] В некоторых вариантах осуществления липкий 5’-конец в адаптере имеет длину 2-15 нуклеотидов. В некоторых вариантах осуществления адаптер содержит по меньшей мере один из штрихкода нуклеиновой кислоты, участка связывания праймера для секвенирования и участка связывания праймера для амплификации. В некоторых вариантах осуществления штрихкод выбран из уникального молекулярного ID (UMI) и ID образца (SID) или того и другого. В некоторых вариантах осуществления адаптер получают посредством отжига двух цепей нуклеиновой кислоты. В некоторых вариантах осуществления адаптер получают посредством расщепления экзонуклеазами 3’-конца для получения олигонуклеотида с липким 5’-концом. В некоторых вариантах осуществления адаптер содержит модификацию нуклеиновой кислоты, повышающую температуру плавления дуплекса нуклеиновой кислоты, включающего модификацию. В некоторых вариантах осуществления адаптер содержит последовательность, выбранную из SEQ ID NO: 7-11. В некоторых вариантах осуществления адаптер связан с функциональным фрагментом захвата, т.е. биотином, антигеном, способным связываться с антителом захвата, и последовательностью захвата, способным гибридизоваться с нуклеиновой кислотой захвата.[0029] In some embodiments, the 5' sticky end in the adapter is 2-15 nucleotides in length. In some embodiments, the adapter comprises at least one of a nucleic acid barcode, a sequencing primer binding region, and an amplification primer binding region. In some embodiments, the barcode is selected from a unique molecular ID (UMI) and a sample ID (SID), or both. In some embodiments, the adapter is produced by annealing two strands of a nucleic acid. In some embodiments, the adapter is produced by exonuclease cleavage of the 3' end to produce an oligonucleotide with a 5' sticky end. In some embodiments, the adapter comprises a nucleic acid modification that increases the melting temperature of a nucleic acid duplex comprising the modification. In some embodiments, the adapter comprises a sequence selected from SEQ ID NOs: 7-11. In some embodiments, the adapter is linked to a functional capture moiety, i.e., biotin, an antigen capable of binding to the capture antibody, and a capture sequence capable of hybridizing to the capture nucleic acid.
[0030] В некоторых вариантах осуществления набор дополнительно содержит полинуклеотидкиназу, реагенты для амплификации нуклеиновые кислоты (например, праймер для амплификации, способный отжигаться на участке связывания праймера в адаптере) и реагенты для секвенирования нуклеиновых кислот (например, праймер для секвенирования, способный отжигаться на участке связывания праймера в адаптере). В некоторых вариантах осуществления праймер для амплификации содержит последовательность, выбранную из SEQ ID NO: 12-16.[0030] In some embodiments, the kit further comprises a polynucleotide kinase, reagents for amplifying nucleic acids (e.g., an amplification primer capable of annealing to a primer binding site in an adapter), and reagents for sequencing nucleic acids (e.g., a sequencing primer capable of annealing to a primer binding site in an adapter). In some embodiments, the amplification primer comprises a sequence selected from SEQ ID NO: 12-16.
[0031] В некоторых вариантах осуществления настоящее изобретение относится к реакционной смеси для обогащения нуклеиновой кислоты из образца, содержащего целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, содержащей: двухцепочечную целевую нуклеиновую кислоту, имеющую 3’-конец; катализатор, обладающий 3’-5’-экзонуклеазной активностью, способный образовывать первый липкий 5’-конец на первом 5’-конце и первый углубленный 3’-конец в целевой нуклеиновой кислоте; и адаптер, имеющий второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом, и, необязательно, ДНК-лигазу.[0031] In some embodiments, the present invention relates to a reaction mixture for enriching a nucleic acid from a sample comprising a target nucleic acid and non-target nucleic acids, comprising: a double-stranded target nucleic acid having a 3' end; a catalyst having 3'-5' exonuclease activity capable of forming a first 5' overhang at a first 5' end and a first 3' recessed end in the target nucleic acid; and an adapter having a second 5' overhang at a second 5' end, a second 5' overhang capable of hybridizing to the first 5' overhang, and, optionally, a DNA ligase.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF DRAWINGS
[0032] Фигура 1 представляет собой схему способа, используемого для целевой последовательности, расщепленной эндонуклеазой Cas9 CRISPR. Показаны стадии расщепления двухцепочечной ДНК, расщепления экзонуклеазами и лигирования адаптера.[0032] Figure 1 is a schematic of the method used for a Cas9 CRISPR endonuclease-cleaved target sequence. The steps of double-stranded DNA cleavage, exonuclease cleavage, and adapter ligation are shown.
[0033] Фигура 2 представляет собой схему целевого локуса ДНК, где показана локализация участка расщепления эндонуклеазами, последовательности распознавания гидовой РНК CRISPR (спейсерные последовательности) и локализация участков связывания праймера для амплификации.[0033] Figure 2 is a schematic of a target DNA locus showing the location of the endonuclease cleavage site, the CRISPR guide RNA recognition sequences (spacer sequences), and the location of the amplification primer binding sites.
[0034] На фигуре 3 показаны результаты эксперимента по лигированию адаптера T/A (предшествующий уровень техники), используемого для целевой ДНК плазмиды, и где комплекс рибонуклеопротеина (RNP) Cas9 включает гидовые cрРНК CrA и CrB.[0034] Figure 3 shows the results of a T/A adaptor ligation experiment (prior art) used to target plasmid DNA, and wherein the Cas9 ribonucleoprotein (RNP) complex includes the CrA and CrB guide rRNAs.
[0035] На фигуре 4 показаны результаты эксперимента со способом по изобретению, используемым для целевой ДНК плазмиды, и где комплекс рибонуклеопротеина (RNP) Cas9 включает гидовые cрРНК CrA и CrB.[0035] Figure 4 shows the results of an experiment with the method of the invention used to target plasmid DNA, and wherein the Cas9 ribonucleoprotein (RNP) complex includes the guide rRNAs CrA and CrB.
[0036] На фигуре 5 показаны результаты эксперимента по лигированию адаптера T/A (предшествующий уровень техники), используемого для целевой геномной ДНК, и где комплекс рибонуклеопротеина (RNP) Cas9 включает гидовые cрРНК CrA и CrB.[0036] Figure 5 shows the results of a T/A adaptor ligation experiment (prior art) used to target genomic DNA, and wherein the Cas9 ribonucleoprotein (RNP) complex includes the CrA and CrB guide rRNAs.
[0037] На фигуре 6 показаны результаты эксперимента со способом по изобретению, используемым для целевой геномная ДНК, и где комплекс рибонуклеопротеина (RNP) Cas9 включает гидовые cрРНК CrA и CrB.[0037] Figure 6 shows the results of an experiment with the method of the invention used to target genomic DNA, and wherein the Cas9 ribonucleoprotein (RNP) complex includes the guide rRNAs CrA and CrB.
[0038] На фигуре 7 показаны результаты эксперимента со способом по изобретению, используемым для целевой геномной ДНК, где комплекс рибонуклеопротеина (RNP) Cas9 включает гидовые cрРНК CrC и CrD.[0038] Figure 7 shows the results of an experiment with the method of the invention used for target genomic DNA, wherein the Cas9 ribonucleoprotein (RNP) complex includes the guide rRNAs CrC and CrD.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
[0039] Определения [0039] Definitions
[0040] Если не указано иначе, технические и научные термины, используемые в настоящем описании, обладают значением, общепринято понятным специалисту в этой области. См., Sambrook et al., Molecular Cloning, A Laboratory Manual, 4th Ed. Cold Spring Harbor Lab Press (2012).[0040] Unless otherwise defined, technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art. See, Sambrook et al ., Molecular Cloning, A Laboratory Manual , 4th Ed. Cold Spring Harbor Lab Press (2012).
[0041] Следующие определения приведены для лучшего понимания настоящего изобретения.[0041] The following definitions are provided to better understand the present invention.
[0042] Термин "эндонуклеаза" относится к ферменту, катализирующему гидролиз фосфодиэфирной связи между двумя нуклеозидными остатками в полинуклеотиде (ДНК или РНК), где ни один из нуклеозидных остатков не является концевым. Эндонуклеаза может вносить одноцепочечный разрыв или двухцепочечный разрыв. Одноцепочечную эндонуклеазу обозначают как "никазу". Двухцепочечный разрыв может являться тупым (образование тупых концов) или ступенчатым (образование выступающих или углубленных концов).[0042] The term "endonuclease" refers to an enzyme that catalyzes the hydrolysis of a phosphodiester bond between two nucleoside residues in a polynucleotide (DNA or RNA) where neither nucleoside residue is terminal. An endonuclease may introduce a single-strand break or a double-strand break. A single-strand endonuclease is referred to as a "nickase". A double-strand break may be blunt (forming blunt ends) or staggered (forming overhanging or recessed ends).
[0043] Термин "экзонуклеаза" относится к ферменту, катализирующему гидролиз фосфодиэфирной связи между концевым нуклеозидным остатком и предпоследним нуклеозидным остатком в полинуклеотиде (ДНК или РНК). Экзонуклеазы могут являться процессивными или способными к постадийному удалению множества нуклеозидных остатков с конца цепи нуклеиновой кислоты.[0043] The term "exonuclease" refers to an enzyme that catalyzes the hydrolysis of the phosphodiester bond between the terminal nucleoside residue and the penultimate nucleoside residue in a polynucleotide (DNA or RNA). Exonucleases may be processive or capable of stepwise removal of multiple nucleoside residues from the end of a nucleic acid chain.
[0044] Термин "повтор CRISPR" или "последовательность повтора CRISPR" относится к минимальной последовательности повтора CRISPR.[0044] The term "CRISPR repeat" or "CRISPR repeat sequence" refers to a minimal CRISPR repeat sequence.
[0045] Термин "эндорибонуклеаза" относится к ферменту, который может гидролизовать фосфодиэфирную связь в РНК. В некоторых вариантах осуществления эндорибонуклеаза может являться сайт-специфическим полипептидом. Эндорибонуклеаза может являться членом системы CRISPR (например, типа I, типа II, типа III). Термин "эндорибонуклеаза" может относиться к суперсемейству белков Repeat Associated Mysterious Protein (RAMP) (например, Cas6, семейства Cas6, Cas5). Эндорибонуклеазы также могут включать РНКазу A, РНКазу H, РНКазу I, члены семейства РНКаз III (например, Drosha, Dicer, РНКазу N), РНКазу L, РНКазу P, РНКазу PhyM, РНКазу T1, РНКазу T2, РНКазу U2, РНКазу V1, РНКазу V.[0045] The term "endoribonuclease" refers to an enzyme that can hydrolyze a phosphodiester bond in RNA. In some embodiments, the endoribonuclease can be a site-specific polypeptide. The endoribonuclease can be a member of the CRISPR system (e.g., type I, type II, type III). The term "endoribonuclease" can refer to the Repeat Associated Mysterious Protein (RAMP) superfamily of proteins (e.g., Cas6, Cas6, Cas5 families). Endoribonucleases can also include RNase A, RNase H, RNase I, RNase III family members (e.g., Drosha, Dicer, RNase N), RNase L, RNase P, RNase PhyM, RNase T1, RNase T2, RNase U2, RNase V1, RNase V.
[0046] Термин "ингибирующий" относится к способности химической структуры частично или полностью ингибировать химическую реакцию. Специалистам в этой области будет понятно, что то, является ли ингибирование частичным или полным, зависит от чувствительности способов детекции. Термин "ингибирующее расщепление" в отношении нуклеазы относится к способности детектируемо снижать количество продукта расщепления. Термин "превентивное расщепление" в отношении нуклеазы относится к способности снижать количество продукта расщепления ниже уровня определения.[0046] The term "inhibitory" refers to the ability of a chemical structure to partially or completely inhibit a chemical reaction. Those skilled in the art will appreciate that whether the inhibition is partial or complete depends on the sensitivity of the detection methods. The term "inhibitory cleavage" with respect to a nuclease refers to the ability to detectably reduce the amount of a cleavage product. The term "preventive cleavage" with respect to a nuclease refers to the ability to reduce the amount of a cleavage product below the detection level.
[0047] Термин "NATNA" относится к нуклеиновой кислоте, нацеленной на нуклеиновые кислоты. NATNA может являться частью программируемой эндонуклеазной системы, такой как система CRISPR. NATNA может содержать два нацеленных на нуклеиновые кислоты полинуклеотида ("двойные гидовые"), включая РНК CRISPR (cрРНК) и трансактивирующую РНК CRISPR (tracрРНК). NATNA может содержать один нацеленный на нуклеиновые кислоты полинуклеотид ("единый гидовый"), содержащий cрРНК и tracрРНК, соединенные областью слияния (линкером). cрРНК может содержать направляющую область и активирующую область. tracрРНК может содержать область, способную гибридизоваться с активирующей областью cрРНК. Термин "направляющая область" относится к области, способной гибридизоваться с последовательностью в целевой нуклеиновой кислоте. Термин "активирующая область" относится к области, взаимодействующей с полипептидом, например, нуклеазой CRISPR.[0047] The term "NATNA" refers to a nucleic acid that targets nucleic acids. The NATNA may be part of a programmable endonuclease system, such as the CRISPR system. The NATNA may comprise two nucleic acid-targeting polynucleotides ("dual guides"), including a CRISPR RNA (cRNA) and a CRISPR transactivating RNA (tracRNA). The NATNA may comprise a single nucleic acid-targeting polynucleotide ("single guide"), comprising a cRNA and a tracRNA connected by a fusion region (linker). The cRNA may comprise a guide region and an activating region. The tracRNA may comprise a region capable of hybridizing to the activating region of the cRNA. The term "guide region" refers to a region capable of hybridizing to a sequence in a target nucleic acid. The term "activating region" refers to a region that interacts with a polypeptide, such as a CRISPR nuclease.
[0048] Термин "адаптер" относится к нуклеиновой кислоте, добавляемой к нуклеиновым кислотам в образце. Как правило, один и тот же адаптер добавляют к множеству нуклеиновых кислот в образце. Термин "один и тот же адаптер" включает адаптеры, имеющие одну и ту же последовательность, за исключением разных штрихкодов (определено ниже). Термин "адаптер" охватывает одноцепочечные адаптеры, частично одноцепочечные (взаимозаменяемые с частично двухцепочечными) адаптеры и двухцепочечные адаптеры. Термин "липкий конец" в отношении нуклеиновой кислоты относится к одноцепочечной концевой части частично двухцепочечной нуклеиновой кислоты. Термины "углубленный" и "углубленный конец" в отношении нуклеиновой кислоты относится к концу двухцепочечной части частично двухцепочечной нуклеиновой кислоты. В частично двухцепочечной нуклеиновой кислоте углубленный конец одной цепи отмечает начало липкого конца на противоположной цепи.[0048] The term "adapter" refers to a nucleic acid added to nucleic acids in a sample. Typically, the same adapter is added to multiple nucleic acids in a sample. The term "same adapter" includes adapters that have the same sequence, except for different barcodes (defined below). The term "adapter" includes single-stranded adapters, partially single-stranded (interchangeable with partially double-stranded) adapters, and double-stranded adapters. The term "overhang" with respect to a nucleic acid refers to the single-stranded terminal portion of a partially double-stranded nucleic acid. The terms "recess" and "recessed end" with respect to a nucleic acid refer to the end of the double-stranded portion of a partially double-stranded nucleic acid. In a partially double-stranded nucleic acid, the recessed end of one strand marks the beginning of the sticky end on the opposite strand.
[0049] Термин "штрихкод" относится к последовательности нуклеиновой кислоты, встроенной в другую последовательность с целью идентификации. Штрихкоды, как правило, могут иметь длину 2 или более и до приблизительно 50 нуклеотидов. Штрихкоды сконструированы так, чтобы иметь по меньшей мере минимальное количество отличий от других штрихкодов в образце. Штрихкоды могут являться уникальными для каждой молекулы в образце или уникальными для образца и являться общими для множества молекул в образце. Термин "мультиплексный идентификатор", "MID" или "идентификатор образца", "SID" относятся к штрихкоду, с помощью которого идентифицируют образец или источник образца. В связи с этим, все или по существу все MID-штрихкодированные полинуклеотиды из одного источника или образца будут иметь общий MID одной последовательности; в то время как все или по существу все (например, по меньшей мере 90% или 99%) MID-штрихкодированные полинуклеотиды из разных источников или образцов будут иметь другую последовательность штрихкода MID. Полинуклеотиды из разных источников, имеющие разные MID, можно смешивать и секвенировать параллельно при поддержании информации об образце закодированной в штрихкоде MID. Термины "уникальный молекулярный идентификатор", "UMI" или "UID" относятся к штрихкоду, с помощью которого идентифицируют полинуклеотид, к которому его присоединяют. В некоторых вариантах осуществления все или по существу все (например, по меньшей мере 90% или 99%) штрихкоды UMI являются уникальными таким образом, что каждый или по существу каждый из UMI-штрихкодированных полинуклеотидов в образце имеет уникальный UMI. В других вариантах осуществления полинуклеотиды в образце мечены неуникально таким образом, что 1-50% полинуклеотидов в образце имеют UMI, являющиеся общими для по меньшей мере одного другого полинуклеотида, как описано например, в патенте США № 9902992.[0049] The term "barcode" refers to a nucleic acid sequence inserted into another sequence for identification purposes. Barcodes may typically be 2 or more and up to about 50 nucleotides in length. Barcodes are designed to be at least a minimal amount different from other barcodes in a sample. Barcodes may be unique to each molecule in a sample or unique to a sample and common to multiple molecules in a sample. The term "multiplex identifier," "MID," or "sample identifier," "SID" refers to a barcode that identifies a sample or source of a sample. As such, all or substantially all MID-barcoded polynucleotides from a single source or sample will share a common MID of a single sequence; while all or substantially all (e.g., at least 90% or 99%) of the MID barcoded polynucleotides from different sources or samples will have a different MID barcode sequence. Polynucleotides from different sources having different MIDs can be mixed and sequenced in parallel while maintaining sample information encoded in the MID barcode. The terms "unique molecular identifier," "UMI," or "UID" refer to a barcode that identifies the polynucleotide to which it is attached. In some embodiments, all or substantially all (e.g., at least 90% or 99%) of the UMI barcodes are unique such that each or substantially each of the UMI barcoded polynucleotides in a sample has a unique UMI. In other embodiments, the polynucleotides in a sample are non-uniquely labeled such that 1-50% of the polynucleotides in the sample have UMIs that are common to at least one other polynucleotide, as described, for example, in U.S. Patent No. 9,902,992.
[0050] Термин "праймер" относится к олигонуклеотиду, связывающемуся с конкретной областью молекулы одноцепочечной матричной нуклеиновой кислоты и инициирующему синтез нуклеиновых кислот с помощью опосредованной полимеразой ферментативной реакции. Как правило, праймер содержит менее приблизительно 100 нуклеотидов и предпочтительно содержит менее приблизительно 30 нуклеотидов. Мишене-специфический праймер специфически гибридизуется с целевым полинуклеотидом в условиях гибридизации. Такие условия гибридизации могут включать, в качестве неограничивающих примеров, гибридизацию в буфере для изотермической амплификации (20 мМ Трис-HCl, 10 мМ (NH4)2SO4), 50 мМ KCl, 2 мМ MgSO4, 0,1% TWEEN® 20, pH 8,8 при 25°C) при температуре от приблизительно 40°C до приблизительно 70°C. В дополнение к связывающей мишень области, праймер может содержать дополнительные области, как правило, в 5’-части. Дополнительная область может включать участок связывания универсального праймера или штрихкод.[0050] The term "primer" refers to an oligonucleotide that binds to a specific region of a single-stranded template nucleic acid molecule and initiates nucleic acid synthesis via a polymerase-mediated enzymatic reaction. Typically, a primer comprises less than about 100 nucleotides, and preferably comprises less than about 30 nucleotides. A target-specific primer specifically hybridizes to a target polynucleotide under hybridization conditions. Such hybridization conditions may include, but are not limited to, hybridization in isothermal amplification buffer (20 mM Tris-HCl, 10 mM ( NH4 ) 2SO4 ), 50 mM KCl, 2 mM MgSO4, 0.1% TWEEN® 20 , pH 8.8 at 25°C) at a temperature of from about 40°C to about 70°C. In addition to the target binding region, the primer may comprise additional regions, typically in the 5' portion. The additional region may include a universal primer binding site or a barcode.
[0051] Термин "универсальный праймер" относится к праймеру, который может гибридизоваться с участком связывания универсального праймера, присутствующим во множестве разных нуклеиновых кислот в образце. Универсальный праймер, в отличие от мишене-специфического праймера, способен к примированию амплификации всех нуклеиновых кислот в образце без отклонения в пользу какой-либо последовательности. Участки связывания универсальных праймеров могут являться природными или искусственными последовательностями, как правило, добавляемыми к целевой последовательности не-мишене-специфическим образом.[0051] The term "universal primer" refers to a primer that can hybridize to a universal primer binding site present in a plurality of different nucleic acids in a sample. A universal primer, in contrast to a target-specific primer, is capable of priming the amplification of all nucleic acids in a sample without bias in favor of any sequence. Universal primer binding sites may be natural or artificial sequences, typically added to a target sequence in a non-target-specific manner.
[0052] Термин "мишень" или "целевая нуклеиновая кислота" относятся к интересующей нуклеиновой кислоте в образце. Образец может содержать множество мишеней, а также множество копий каждой мишени.[0052] The term "target" or "target nucleic acid" refers to a nucleic acid of interest in a sample. A sample may contain multiple targets, as well as multiple copies of each target.
[0053] Существующие на предшествующем уровне техники способы захвата и нуклеиновые кислоты включают получение dA-хвоста и лигирование адаптера с dT-хвостом. Способ получения dA-хвоста и связующего лигирования включает добавление нуклеотида A на 3’-конец первой нуклеиновой кислоты (например, мишени или вставки) и нуклеотида T на 3’-конец второй нуклеиновой кислоты (например, адаптера или вектора). Способ получения dA-хвоста используют в секвенировании и клонировании. Например, в ПЦР-клонировании используют природное получение dA-хвоста с помощью Taq-полимеразы и используют вектор с dT-хвостом, чтобы сделать возможным лигирование липкого конца. При получении библиотек секвенирования способ получения dA-хвоста используют для случайным образом фрагментированной ДНК (например, обработанной ультразвуком ДНК или природно фрагментированной бесклеточной ДНК). Способ получения dA-хвоста также используют для нуклеиновых кислот, расщепленных эндонуклеазами, включая эндонуклеазы CRISPR, см. Gilpatrick et al., (2020) Targeted nanopore sequencing with Cas9-guided adaptor ligation, Nat. Biotechnol. 38:433. Кроме того, в SITE-Seq®, способе геномного секвенирования CRISPR-опосредованных модификаций генома также используют способ получения dA-хвоста, см. Cameron, P., et al., (2017). Mapping the genomic landscape of CRISPR-Cas9 cleavage. Nature Methods, 14(6), 600-606.[0053] Prior art capture methods and nucleic acids include dA tailing and dT-tailed adaptor ligation. The dA tailing and tether ligation method includes adding an A nucleotide to the 3' end of a first nucleic acid (e.g., a target or insert) and a T nucleotide to the 3' end of a second nucleic acid (e.g., an adaptor or vector). The dA tailing method is used in sequencing and cloning. For example, PCR cloning utilizes the natural dA tailing by Taq polymerase and uses a dT-tailed vector to allow sticky end ligation. In the production of sequencing libraries, the dA tailing method is used for randomly fragmented DNA (e.g., sonicated DNA or naturally fragmented cell-free DNA). The dA tailing method is also used for nucleic acids cleaved by endonucleases, including CRISPR endonucleases, see Gilpatrick et al., (2020)Targeted nanopore sequencing with Cas9-guided adapter ligation, Nat. Biotechnol. 38:433. In addition, SITE-Seq®, a method for genomic sequencing of CRISPR-mediated genome modifications, also uses the dA tailing method, see Cameron, P.,et al., (2017).Mapping the genomic landscape of CRISPR-Cas9 cleavage. Nature Methods, 14(6), 600-606.
[0054] Альтернативные способы получения липких концов для лигирования включает расщепление экзонуклеазами. Например, сборка Гибсона включает сборку крупных фрагментов ДНК с помощью ограниченного расщепления нуклеазами, создающего совместимые или полусовместимые концы ДНК, см. Gibson, D.G., et al., (2009) Enzymatic assembly of DNA molecules up to several hundred kilobases, Nat. Methods 6, 343-345, и Gibson, D.G., et al., (2010) Creation of Bacterial Cell Controlled by a Chemically Synthesized Genome, Science 329, 52-56. Ранее меченые праймеры для ПЦР и контролируемое расщепление экзонуклеазами использовали для получения совместимых концов для независящего от лигирования клонирования продуктов ПЦР в бактериальных клетках, см. Aslanidis, C. and de Jong, P., (1990) Ligation-independent cloning of PCR products (LIC-ПЦР), Nucleic Acids Res. 18:6069.[0054] Alternative methods for producing sticky ends for ligation include exonuclease digestion. For example, Gibson assembly involves the assembly of large DNA fragments by limited nuclease digestion, creating compatible or semi-compatible DNA ends, see Gibson, D.G.,et al., (2009)Enzymatic assembly of DNA molecules up to several hundred kilobases,Nat. Methods 6, 343-345, and Gibson, D. G., et al., (2010)Creation of Bacterial Cell Controlled by a Chemically Synthesized Genome,Science 329, 52-56. Previously, labeled PCR primers and controlled exonuclease digestion were used to generate compatible ends for ligation-independent cloning of PCR products in bacterial cells, see Aslanidis, C. and de Jong, P., (1990)Ligation-independent cloning of PCR products (LIC-PCR), Nucleic Acids Res. 18:6069.
[0055] Настоящее изобретение относится к альтернативе получения dA-хвоста и улучшенному способу захвата конца ДНК, образуемого специфической для последовательности эндонуклеазой (например, эндонуклеазой рестрикции или эндонуклеазой CRISPR). В способе используют контролируемую экзонуклеазную активность в отношении конца ДНК, подлежащего захвату, для эксцизии определенного сегмента из 3'-конца таким образом, чтобы получить липкий 5’-конец. Адаптер конструируют с липким 5’-концом, способным гибридизоваться с липким 5’-концом в ДНК, подлежащей захвату. Адаптер (или другой партнер нуклеиновой кислоты) образует специфический и стабильный гибрид с ДНК, подлежащей захвату. Затем адаптер можно ковалентно соединять с помощью лигазы. Прямое сравнение изобретения с общеупотребительным лигированием адаптера 3’-A-липких концов ("способом получения dA-хвоста") демонстрирует улучшение специфичности и эффективности лигирования.[0055] The present invention relates to an alternative to producing a dA tail and an improved method for capturing a DNA end formed by a sequence-specific endonuclease (e.g., a restriction endonuclease or a CRISPR endonuclease). The method uses controlled exonuclease activity on a DNA end to be captured to excise a specific segment from the 3' end so as to produce a sticky 5' end. An adapter is designed with a sticky 5' end capable of hybridizing to a sticky 5' end in the DNA to be captured. The adapter (or other nucleic acid partner) forms a specific and stable hybrid to the DNA to be captured. The adapter can then be covalently linked using a ligase. Direct comparison of the invention with the commonly used 3'-A-sticky end adaptor ligation ("dA-tailing method") demonstrates improvement in ligation specificity and efficiency.
[0056] На схеме на фигуре 1 показан один из вариантов осуществления способа. В примере, показанном на фигуре 1, двухцепочечный разрыв с тупым концом образуется в целевой ДНК под действием эндонуклеазы Cas9CRISPR. Конец обрабатывают с использованием контролируемой 3’-5’-экзонуклеазной активности. В некоторых вариантах осуществления контролируемая экзонуклеазная активность демонстрируется ДНК-полимеразой в отсутствие dNTP или в присутствии менее чем всех 4 dNTP, например, в присутствии только одного dNTP, определяющего положение, в котором терминируется расщепление экзонуклеазами. В примере на фиг. 1, экзонуклеаза является ДНК-полимеразой T4 в присутствии только dGTP. В этом примере расщепление экзонуклеазами термин6ируется, когда ДНК-полимераза T4 сталкивается с первым G в цепи, подвергаемой расщеплению. В некоторых вариантах осуществления последовательность на 3’-конце, подлежащему лигированию, содержит фрагмент из 2-15 нуклеотидов только с 3 из 4 присутствующих оснований. Таким образом, dNTP с 4-ым основанием можно добавлять в реакцию экзонуклеазы для прекращения экзонуклеазной активности на конце фрагмента из 2-15 нуклеотидов. Адаптеры сконструированы для отжига на липком 5’-конце, образуемом под действием контролируемой экзонуклеазной активности. Отожженные адаптеры лигируют с помощью лигазы.[0056] The diagram in Figure 1 shows one embodiment of the method. In the example shown in Figure 1, a blunt-ended double-strand break is generated in the target DNA by a Cas9CRISPR endonuclease. The end is processed using controlled 3'-5' exonuclease activity. In some embodiments, the controlled exonuclease activity is exhibited by the DNA polymerase in the absence of dNTPs or in the presence of less than all 4 dNTPs, such as in the presence of only one dNTP that defines the position at which exonuclease cleavage is terminated. In the example in Figure 1, the exonuclease is T4 DNA polymerase in the presence of only dGTP. In this example, exonuclease cleavage is terminated when T4 DNA polymerase encounters the first G in the strand being cleaved. In some embodiments, the sequence at the 3' end to be ligated comprises a 2-15 nucleotide fragment with only 3 of the 4 bases present. Thus, a 4-base dNTP can be added to the exonuclease reaction to terminate the exonuclease activity at the end of the 2-15 nucleotide fragment. The adapters are designed to anneal at the sticky 5' end formed by the controlled exonuclease activity. The annealed adapters are ligated using ligase.
[0057] В некоторых вариантах осуществления способ по изобретению сравнивают со способом получения dA-хвоста, известным на предшествующем уровне техники. В некоторых вариантах осуществления выбранная мишень является локусом T-клеточного рецептора человека (локусом T Cell Receptor Alpha Constant или TRAC). В некоторых вариантах осуществления специфическая для последовательности эндонуклеаза является эндонуклеазой Cas9 CRISPR, и реакционная смесь дополнительно содержит cрРНК и tracрРНК. cрРНК, нацеленные на локус TRAC, добавляют к гидовой специфической для последовательности эндонуклеазы Cas9 для локуса TRAC. В некоторых вариантах осуществления сконструировано несколько cрРНК для локуса TRAC. Карта локуса, положение cрРНК (Cr-A, B, C и D) и участок расщепления (стрелка) показаны на фигуре 2. В некоторых вариантах осуществления каждая реакция включает одну из cрРНК (например, Cr-A, B, C или D, фигура 2).[0057] In some embodiments, the method of the invention is compared to a method for producing a dA tail known in the art. In some embodiments, the selected target is a human T cell receptor locus (T Cell Receptor Alpha Constant or TRAC locus). In some embodiments, the sequence-specific endonuclease is Cas9 CRISPR endonuclease, and the reaction mixture further comprises a rRNA and a trac rRNA. The rRNAs targeting the TRAC locus are added to a Cas9 sequence-specific endonuclease guide for the TRAC locus. In some embodiments, multiple rRNAs are designed for the TRAC locus. A map of the locus, the position of the rRNAs (Cr-A, B, C, and D), and the cleavage site (arrow) are shown in Figure 2. In some embodiments, each reaction includes one of the rRNAs (e.g., Cr-A, B, C, or D, Figure 2).
[0058] После расщепления экзонуклеазами конец ДНК ниже двухцепочечного разрыва направляется на лигирование. Для лигирования по изобретению реакционную смесь инкубируют с ДНК-полимеразой, обладающей 3’-5’-экзонуклеазной активностью (например, ДНК-полимеразой T4), и менее 4 dNTP (например, один dNTP, dGTP для целевой последовательности, показанной на фигуре 1).[0058] Following exonuclease digestion, the end of the DNA below the double-strand break is targeted for ligation. For ligation according to the invention, the reaction mixture is incubated with a DNA polymerase having 3'-5' exonuclease activity (e.g., T4 DNA polymerase) and less than 4 dNTPs (e.g., one dNTP, dGTP for the target sequence shown in Figure 1).
[0059] Получение dA-хвоста и лигирование T/A осуществляют в параллельной реакции в соответствии с уровнем техники.[0059] The preparation of the dA tail and the T/A ligation are carried out in a parallel reaction according to the state of the art.
[0060] После лигирования адаптера, необязательно, осуществляют ПЦР для амплификации снабженной адаптером ДНК. В некоторых вариантах осуществления праймеры для ПЦР содержат праймер, отжигающийся на адаптере. В некоторых вариантах осуществления адаптер содержит участок связывания универсального праймера. В некоторых вариантах осуществления универсальный праймер спаривается с нижележащим праймером, способным гибридизоваться с целевой последовательностью ниже участка расщепления эндонуклеазами. В некоторых вариантах осуществления один из обратных праймеров, показанных на фигуре 2 (rv-1, 2, 3, или 4), используют для локуса TRAC.[0060] After ligation of the adapter, PCR is optionally performed to amplify the adapter-equipped DNA. In some embodiments, the PCR primers comprise a primer that anneals to the adapter. In some embodiments, the adapter comprises a universal primer binding site. In some embodiments, the universal primer pairs with a downstream primer capable of hybridizing to a target sequence downstream of an endonuclease cleavage site. In some embodiments, one of the reverse primers shown in Figure 2 (rv-1, 2, 3, or 4) is used for the TRAC locus.
[0061] В некоторых вариантах осуществления амплифицированную снабженную адаптером ДНК визуализируют, например, посредством электрофореза в геле, как показано в настоящем описании. Результаты в примерах, представленных в настоящем описании, оцениваемые посредством электрофореза в геле (фигуры 3-7), свидетельствуют о том, что оба способа приводили к образованию продуктов ПЦР с ожидаемым размером. Примечательно, что в способе получения dA-хвоста, известном на современном уровне техники, наблюдают множество ампликонов (фигура 3, дорожки 3, 4, 7 и 8), что свидетельствует о том, что вероятно, множество адаптеров лигировано с целевым концом ДНК. В случае способа по изобретению мультимеры не наблюдают (фигуры 2, 6 и 7), что свидетельствует о повышенной специфичности способа из-за более длинных липких 5’-концов адаптеров. Кроме того, сравнение фигуры 5 (геномная ДНК, получение dA-хвоста по предшествующему уровню техники) с фигурами 6 и 7 (геномная ДНК, настоящее изобретение) демонстрирует большее количество специфического продукта и меньше нежелательных молекул, что свидетельствует о более высокой специфичности и эффективности, достигаемых с помощью настоящего изобретения.[0061] In some embodiments, the amplified adaptor-tipped DNA is visualized, for example, by gel electrophoresis as shown herein. The results in the examples provided herein, as assessed by gel electrophoresis (Figures 3-7), indicate that both methods resulted in PCR products of the expected size. Notably, in the dA-tailing method known in the art, multiple amplicons are observed (Figure 3, lanes 3, 4, 7, and 8), indicating that multiple adapters are likely ligated to the target end of the DNA. In the case of the method of the invention, multimers are not observed (Figures 2, 6, and 7), indicating increased specificity of the method due to the longer sticky 5' ends of the adapters. Furthermore, comparison of Figure 5 (genomic DNA, dA tailing according to the prior art) with Figures 6 and 7 (genomic DNA, present invention) demonstrates a higher amount of specific product and less unwanted molecules, indicating the higher specificity and efficiency achieved by the present invention.
[0062] Настоящее изобретение включает способ обработки нуклеиновых кислот из образца. В некоторых вариантах осуществления образец получают из индивидуума или пациента. В некоторых вариантах осуществления образец может содержать фрагмент твердой ткани или солидной опухоли, полученный из индивидуума или пациента, например, с помощью биопсии. Образец также может содержать физиологические жидкости, которые могут содержать нуклеиновые кислоты (например, мочу, мокроту, сыворотку, кровь или фракции крови, т.е. плазму, лимфу, слюну, мокроту, пол, слезу, спинномозговую жидкость, амниотическую жидкость, синовиальную жидкость, перикардиальную жидкость, перитонеальную жидкость, плевральную жидкость, содержимое кисты, желчь, жидкость желудка, жидкость кишечника или образцы кала). В других вариантах осуществления образец является культуральным образцом, например, культурой ткани, содержащим клетки и жидкости, из которых можно выделять нуклеиновые кислоты. В некоторых вариантах осуществления образец включает фиксированные формалином, погруженные в парафин ткани (FFPET) и выделенные из них нуклеиновые кислоты. Образец также может включать бесклеточный материал, такой как бесклеточная фракция крови, содержая бесклеточную ДНК (cfDNA) или циркулирующую опухолевую ДНК (ctDNA). В некоторых вариантах осуществления интересующие нуклеиновые кислоты в образце происходят из возбудителей инфекций, таких как вирусы, бактерии, простейшие или грибы, инфицирующие пациента, служащего источником образца. Образец можно собирать из человека, неявляющегося человеком индивидуума или окружающей среды. В некоторых вариантах осуществления образец представляет собой реакционную смесь, содержащую нуклеиновые кислоты, подвергнутые одной или более биохимическим реакциям in vitro.[0062] The present invention includes a method for processing nucleic acids from a sample. In some embodiments, the sample is obtained from an individual or a patient. In some embodiments, the sample may comprise a solid tissue fragment or a solid tumor obtained from the individual or patient, such as by biopsy. The sample may also comprise bodily fluids that may contain nucleic acids (e.g., urine, sputum, serum, blood or blood fractions, i.e., plasma, lymph, saliva, sputum, sex, tears, cerebrospinal fluid, amniotic fluid, synovial fluid, pericardial fluid, peritoneal fluid, pleural fluid, cyst contents, bile, gastric fluid, intestinal fluid, or stool samples). In other embodiments, the sample is a culture sample, such as a tissue culture containing cells and fluids from which nucleic acids can be isolated. In some embodiments, the sample includes formalin-fixed, paraffin-embedded (FFPET) tissues and nucleic acids isolated therefrom. The sample may also include acellular material, such as a cell-free fraction of blood, containing cell-free DNA (cfDNA) or circulating tumor DNA (ctDNA). In some embodiments, the nucleic acids of interest in the sample are derived from infectious agents, such as viruses, bacteria, protozoa, or fungi, infecting the patient serving as the source of the sample. The sample may be collected from a human, a non-human individual, or the environment. In some embodiments, the sample is a reaction mixture containing nucleic acids that have undergone one or more in vitro biochemical reactions.
[0063] Настоящее изобретение включает манипуляции с нуклеиновыми кислотами, выделенными или экстрагированными из образца. Способы выделения нуклеиновой кислоты хорошо известны в этой области. См. J. Sambrook et al., "Molecular Cloning: A Laboratory Manual," 1989, 2nd Ed., Cold Spring Harbor Laboratory Press: New York, N.Y. Различные реагенты и наборы коммерчески доступны для выделения нуклеиновых кислот (ДНК или РНК) из биологических образцов, включая продукты от BD Biosciences (San Jose, Cal.), Clontech (TaKaRa Bio.); Epicentre Technologies (Madison, Wisc.); Gentra Systems, (Minneapolis, Minn.); Qiagen (Valencia, Cal.); Ambion (Austin, Tex.); BioRad Laboratories (Hercules, Cal.); KAPA Biosystems (Roche Sequencing Solutions, Pleasanton, Cal.) и т.д.[0063] The present invention includes manipulation of nucleic acids isolated or extracted from a sample. Methods for isolating nucleic acid are well known in the art. See J. Sambrook et al., "Molecular Cloning: A Laboratory Manual," 1989, 2 nd Ed., Cold Spring Harbor Laboratory Press: New York, NY Various reagents and kits are commercially available for isolating nucleic acids (DNA or RNA) from biological samples, including products from BD Biosciences (San Jose, Cal.), Clontech (TaKaRa Bio.); Epicentre Technologies (Madison, Wisc.); Gentra Systems, (Minneapolis, Minn.); Qiagen (Valencia, Cal.); Ambion (Austin, Tex.); BioRad Laboratories (Hercules, Cal.); KAPA Biosystems (Roche Sequencing Solutions, Pleasanton, Cal.), etc.
[0064] В некоторых вариантах осуществления настоящее изобретение включает промежуточные стадии очистки или разделения, например, для удаления неиспользуемых праймеров и адаптеров или нелигированной ДНК образца. Очистку или разделение можно осуществлять эксклюзионным способом, выбранным из электрофореза в геле, аффинной хроматографии и эксклюзионной хроматографии. В некоторых вариантах осуществления селекцию по размеру можно осуществлять с помощью технологии обратимой твердофазной иммобилизации (SPRI) от Beckman Coulter (Brea, Cal.).[0064] In some embodiments, the present invention includes intermediate purification or separation steps, such as to remove unused primers and adapters or unligated sample DNA. Purification or separation can be accomplished by a size exclusion method selected from gel electrophoresis, affinity chromatography, and size exclusion chromatography. In some embodiments, size selection can be accomplished using the reversible solid phase immobilization (SPRI) technology from Beckman Coulter (Brea, Cal.).
[0065] В некоторых вариантах осуществления использование совместимых буферных систем позволяет опустить стадии очистки или разделения между стадией образования углубленного 3’-конца, стадией лигирования адаптера и стадией дополнительной обработки захваченной нуклеиновой кислоты, например, посредством амплификации и/или секвенирования.[0065] In some embodiments, the use of compatible buffer systems allows for the omission of purification or separation steps between the 3' deep end formation step, the adaptor ligation step, and the step of further processing the captured nucleic acid, such as by amplification and/or sequencing.
[0066] В некоторых вариантах осуществления в настоящем изобретении используют катализатор (фермент), обладающий 3’-5’-экзонуклеазной активностью. Такая активность присутствует у полимераз нуклеиновых кислот, и иногда ее обозначают как "корректирующую активность", например, у ДНК-полимераз, активных на репликационной вилке ДНК. Эта активность проявляется в присутствии ионов магния и в отсутствие dNTP. По сравнению с экзонуклеазами, такими как, например, экзонуклеаза III, скорость и степень гидролиза является медленной и программируемой. Если присутствует меньше, чем все четыре dNTP, 3’-5’-экзонуклеазная активность происходит, пока не встретится первый нуклеотид, идентичный dNTP в реакционной смеси, в цепи, подвергаемой расщеплению. В примере, показанном на фигуре 1, желательно удалить последовательность 3’-TCCACC-5’ из более длинной последовательности 3’-TCCACCGTG…-5’. Реакционная смесь содержит фермент с 3’-5’-корректирующей экзонуклеазной активностью и только dGTP. Экзонуклеаза удаляет шесть нуклеотидов TCCACC, пока не встретится G (соответствующего dGTP в реакционной смеси). В примере показано, что, зная последовательность, подлежащую гидролизу на 3’-конце, специалист в этой области может получать способ и реакционную смесь посредством опущения корректного dNTP или dNTP таким образом, что гидролиз 3’-5’-экзонуклеазой происходит до желаемого положения, и образуется желаемый выступающий 5’-конец.[0066] In some embodiments, the present invention utilizes a catalyst (enzyme) having 3'-5' exonuclease activity. Such activity is present in nucleic acid polymerases and is sometimes referred to as "proofreading activity," such as in DNA polymerases active at a DNA replication fork. This activity occurs in the presence of magnesium ions and in the absence of dNTPs. Compared to exonucleases such as, for example, exonuclease III, the rate and extent of hydrolysis is slow and programmable. If less than all four dNTPs are present, 3'-5' exonuclease activity occurs until the first nucleotide identical to the dNTP in the reaction mixture is encountered in the strand being cleaved. In the example shown in Figure 1, it is desirable to remove the sequence 3'- TCCACC -5' from the longer sequence 3'- TCCACC GTG...-5'. The reaction mixture contains an enzyme with 3'-5' proofreading exonuclease activity and only dGTP. The exonuclease removes six TCCACC nucleotides until a G (corresponding to the dGTP in the reaction mixture) is encountered. The example shows that, knowing the sequence to be hydrolyzed at the 3' end, one skilled in the art can prepare a method and a reaction mixture by omitting the correct dNTP or dNTPs such that hydrolysis by the 3'-5' exonuclease occurs to the desired position and the desired overhanging 5' end is formed.
[0067] Корректирующая 3’-5’-экзонуклеазная активность присутствует у многих ДНК-полимераз вирусного, бактериального и эукариотического происхождения. В некоторых вариантах осуществления катализатор является ДНК-полимеразой. ДНК-полимеразы с 3’-5’-корректирующей активностью содержат домены Exo I, Exo II и Exo III фрагмента Кленова Pol I E. coli. В некоторых вариантах осуществления ДНК-полимераза выбрана из полимеразы семейства A, полимеразы семейства B и полимеразы семейства C, полимеразы, содержащих домены Exo I, Exo II и Exo III фрагмента Кленова Pol I E. coli.[0067] 3'-5' proofreading exonuclease activity is present in many DNA polymerases of viral, bacterial, and eukaryotic origin. In some embodiments, the catalyst is a DNA polymerase. DNA polymerases with 3'-5' proofreading activity comprise the Exo I, Exo II, and Exo III domains of the Klenow fragment of E. coli Pol I. In some embodiments, the DNA polymerase is selected from a family A polymerase, a family B polymerase, and a family C polymerase, polymerases comprising the Exo I, Exo II, and Exo III domains of the Klenow fragment of E. coli Pol I.
[0068] В некоторых вариантах осуществления ДНК-полимераза выбрана из полимеразы семейства A, полимеразы семейства B и полимеразы семейства C, полимеразы, включающей ДНК-полимеразу, содержащую остатки аспартата, соответствующие остаткам D355, D424 и D501 фрагмента Кленова Pol I E. coli.[0068] In some embodiments, the DNA polymerase is selected from a family A polymerase, a family B polymerase, and a family C polymerase, a polymerase comprising a DNA polymerase containing aspartate residues corresponding to residues D355, D424, and D501 of the Klenow fragment of E. coli Pol I.
[0069] В некоторых вариантах осуществления ДНК-полимераза выбрана из ДНК-полимеразы T4, ДНК-полимеразы RB69, фрагмента Кленова, ДНК-полимеразы T7, фрагмента δ (дельта) Pol III E. coli, эукариотической полимеразы ε (эпсилон), эукариотической полимеразы δ (дельта) и митохондриальной полимеразы γ (гамма).[0069] In some embodiments, the DNA polymerase is selected from T4 DNA polymerase, RB69 DNA polymerase, Klenow fragment, T7 DNA polymerase, E. coli Pol III δ (delta) fragment, eukaryotic polymerase ε (epsilon), eukaryotic polymerase δ (delta), and mitochondrial polymerase γ (gamma).
[0070] В некоторых вариантах осуществления ДНК-полимераза является ДНК-полимеразой дикого типа. В некоторых вариантах осуществления ДНК-полимераза является мутантной ДНК-полимеразой, имеющей повышенную 3’-5’-экзонуклеазную активность. В некоторых вариантах осуществления мутантная ДНК-полимераза является ДНК-полимеразой T4, имеющей одну или более мутаций, выбранных из R335C, L412I, I417V, P424L, Q730S, A737V и A777V.[0070] In some embodiments, the DNA polymerase is a wild-type DNA polymerase. In some embodiments, the DNA polymerase is a mutant DNA polymerase having increased 3'-5' exonuclease activity. In some embodiments, the mutant DNA polymerase is a T4 DNA polymerase having one or more mutations selected from R335C, L412I, I417V, P424L, Q730S, A737V, and A777V.
[0071] В некоторых вариантах осуществления ДНК-полимераза является мутантной ДНК-полимеразой, имеющей сниженную 3’-5’-экзонуклеазную активность. В некоторых вариантах осуществления мутантная ДНК-полимераза является ДНК-полимеразой T4, имеющей одну или более мутаций, выбранных из D219A, D112A и E114A.[0071] In some embodiments, the DNA polymerase is a mutant DNA polymerase having reduced 3'-5' exonuclease activity. In some embodiments, the mutant DNA polymerase is a T4 DNA polymerase having one or more mutations selected from D219A, D112A, and E114A.
[0072] В некоторых вариантах осуществления конец двухцепочечной нуклеиновой кислоты получают с помощью специфической для последовательности эндонуклеазы. В некоторых вариантах осуществления эндонуклеаза кодируется локусом CRISPR. Геномный локус CRISPR (короткие палиндромные повторы, регулярно расположенные группами) обнаружен во многих прокариотических геномах и обеспечивает резистентность к инвазии чужеродных нуклеиновых кислот. Обзор структуры, номенклатуры и классификации локусов CRISPR приведен в Makarova et al., Evolution and classification of the CRISPR-Cas systems. Nature Reviews Microbiology. 2011 июня; 9(6): 467-477.[0072] In some embodiments, the end of the double-stranded nucleic acid is generated by a sequence-specific endonuclease. In some embodiments, the endonuclease is encoded by a CRISPR locus. The genomic CRISPR (clustered regularly interspaced short palindromic repeats) locus is found in many prokaryotic genomes and confers resistance to invasion by foreign nucleic acids. A review of the structure, nomenclature, and classification of CRISPR loci is provided in Makarova et al. , Evolution and classification of the CRISPR-Cas systems . Nature Reviews Microbiology. 2011 Jun; 9(6): 467-477.
[0073] В кратком изложении типичный локус CRISPR включает ряд коротких повторов, регулярно чередующихся со спейсерами. Локус CRISPR также включает кодирующие последовательности CRISPR-ассоциированных (Cas) генов. Единица последовательности спейсер-повтор кодирует РНК CRISPR (cрРНК). In vivo зрелые cрРНК процессируются из полицистронного транскрипта, обозначаемого как пре-cрРНК или массива пре-cрРНК. Повторы в массиве пре-cрРНК распознаются кодируемыми Cas белками, связывающимися и расщепляющими повторы, высвобождая зрелые cрРНК. Системы CRISPR осуществляют расщепление целевой нуклеиновой кислоты, где белки Cas и cрРНК образуют рибонуклеопротеины CRISPR (crRNP). Молекула cрРНК направляет crRNP к целевой нуклеиновой кислоте (например, чужеродной нуклеиновой кислоте, инвазирующей бактериальную клетку), и белки нуклеаз Cas расщепляют целевую нуклеиновую кислоту.[0073] Briefly, a typical CRISPR locus includes a series of short repeats regularly interspersed with spacers. A CRISPR locus also includes coding sequences for CRISPR-associated (Cas) genes. A unit of spacer-repeat sequence encodes a CRISPR RNA (crRNA). In vivo, mature crRNAs are processed from a polycistronic transcript referred to as a pre-crRNA or pre-crRNA array. Repeats in the pre-crRNA array are recognized by Cas proteins, which bind to and cleave the repeats, releasing mature crRNAs. CRISPR systems cleave the target nucleic acid, where the Cas proteins and crRNAs form CRISPR ribonucleoproteins (crRNPs). The crRNA molecule directs the crRNP to a target nucleic acid (e.g., a foreign nucleic acid invading a bacterial cell), and Cas nuclease proteins cleave the target nucleic acid.
[0074] Системы CRISPR типа I включают средства для процессинга массива пре-cрРНК, включающего мультибелковый комплекс под названием Cascade (CRISPR-ассоциированный комплекс для антивирусной защиты), состоящий из субъединиц CasA, B, C, D и E. Комплекс Cascade-cрРНК распознает целевую нуклеиновую кислоту посредством гибридизации целевой нуклеиновой кислоты с cрРНК. Связанный нуклеопротеиновый комплекс рекрутирует хеликазу/нуклеазу Cas3 для облегчения расщепления целевой нуклеиновой кислоты.[0074] Type I CRISPR systems include means for processing a pre-rRNA array that includes a multiprotein complex called Cascade (CRISPR-associated complex for antiviral defense), consisting of CasA, B, C, D, and E subunits. The Cascade-rRNA complex recognizes a target nucleic acid by hybridizing the target nucleic acid to the rRNA. The associated nucleoprotein complex recruits the Cas3 helicase/nuclease to facilitate cleavage of the target nucleic acid.
[0075] Системы CRISPR типа II включают трансактивирующую РНК CRISPR (tracрРНК). tracрРНК гибридизуется с повтором cрРНК в массиве пре-cрРНК и рекрутирует эндогенную РНКазу III для расщепления массива пре-cрРНК. Комплекс tracрРНК/cрРНК может связываться с нуклеазой, например, Cas9. Комплекс cрРНК-tracрРНК-Cas9 распознает целевую нуклеиновую кислоту посредством гибридизации целевой нуклеиновой кислоты с cрРНК. Гибридизация cрРНК с целевой нуклеиновой кислотой активирует нуклеазу Cas9 для расщепления целевой нуклеиновой кислоты.[0075] Type II CRISPR systems include a transactivating CRISPR RNA (tracrRNA). The tracrRNA hybridizes to a repeat of the sRNA in the pre-sRNA array and recruits endogenous RNase III to cleave the pre-sRNA array. The tracrRNA/sRNA complex can associate with a nuclease, such as Cas9. The sRNA-tracrRNA-Cas9 complex recognizes a target nucleic acid by hybridizing the target nucleic acid to the sRNA. Hybridization of the sRNA to the target nucleic acid activates the Cas9 nuclease to cleave the target nucleic acid.
[0076] Системы CRISPR типа III включают суперсемейство RAMP эндорибонуклеаз (например, Cas6), расщепляющее массив пре-cрРНК с помощью одного или более CRISPR-полимераза-подобных белков. [0076] Type III CRISPR systems include the RAMP superfamily of endoribonucleases (e.g., Cas6) that cleave pre-sRNA arrays using one or more CRISPR polymerase-like proteins.
[0077] Системы CRISPR типа V содержат другой набор Cas-подобных генов, включая Csf1, Csf2, Csf3 и Csf4, являющие отдаленными гомологами генов Cas в системах CRISPR типа I-III.[0077] Type V CRISPR systems contain another set of Cas-like genes, including Csf1, Csf2, Csf3, and Csf4, which are distant homologs of the Cas genes in Type I-III CRISPR systems.
[0078] Эндонуклеазам CRISPR необходима нуклеиновая кислота, нацеленная на нуклеиновые кислоты (NATNA), также известная как гидовая РНК. Эндонуклеаза может образовывать рибонуклеопротеиновый комплекс (RNP) с одной или более гидовыми РНК. В некоторых вариантах осуществления эндонуклеаза является эндонуклеазой CRISPR типа II, и NATNA содержит tracрРНК и cрРНК.[0078] CRISPR endonucleases require a nucleic acid targeting nucleic acid (NATNA), also known as a guide RNA. The endonuclease may form a ribonucleoprotein complex (RNP) with one or more guide RNAs. In some embodiments, the endonuclease is a type II CRISPR endonuclease and the NATNA comprises tracRNA and crRNA.
[0079] В некоторых вариантах осуществления NATNA выбрана из вариантов осуществления, описанных в патенте США № 9260752. В кратком изложении, NATNA может содержать в порядке от 5′ к 3′ спейсерный удлиняющий сегмент, спейсер, минимальный повтор CRISPR, одиночный гидовый коннектор, минимальную tracрРНК, последовательность 3′-tracрРНК и удлиняющий сегмент tracрРНК. В некоторых случаях нуклеиновая кислота, нацеленная на нуклеиновые кислоты, может содержать удлиняющий сегмент tracрРНК, последовательность 3′-tracрРНК, минимальную tracрРНК, одиночный гидовый коннектор, минимальный повтор CRISPR, спейсер и спейсерный удлиняющий сегмент в любом порядке.[0079] In some embodiments, the NATNA is selected from the embodiments described in U.S. Patent No. 9,260,752. Briefly, the NATNA may comprise, in order from 5′ to 3′, a spacer extension, a spacer, a minimal CRISPR repeat, a single guide connector, a minimal tracrRNA, a 3′ tracrRNA sequence, and a tracrRNA extension. In some cases, the nucleic acid targeted to the nucleic acids may comprise a tracrRNA extension, a 3′ tracrRNA sequence, a minimal tracrRNA, a single guide connector, a minimal CRISPR repeat, a spacer, and a spacer extension in any order.
[0080] В некоторых вариантах осуществления гидовая нуклеиновая кислота, нацеленная на нуклеиновые кислоты, может содержать одну гидовую NATNA. NATNA содержит спейсерную последовательность, которую можно конструировать для гибридизации целевой последовательности нуклеиновой кислоты. NATNA дополнительно содержит повтор CRISPR, содержащий последовательность, которая может гибридизоваться с последовательностью tracрРНК. Необязательно, NATNA может иметь спейсерный удлиняющий сегмент и удлиняющий сегмент tracрРНК. Эти элементы могут включать элементы, которые могут вносить вклад в стабильность NATNA. Повтор CRISPR и последовательность tracрРНК могут взаимодействовать с образованием спаренной, двухцепочечной структуры. Структура может облегчать связывание эндонуклеазы с NATNA.[0080] In some embodiments, a guide nucleic acid targeting nucleic acids may comprise a single NATNA guide. The NATNA comprises a spacer sequence that can be designed to hybridize to a target nucleic acid sequence. The NATNA further comprises a CRISPR repeat comprising a sequence that can hybridize to a tracrRNA sequence. Optionally, the NATNA may have a spacer extension segment and a tracrRNA extension segment. These elements may include elements that can contribute to the stability of the NATNA. The CRISPR repeat and the tracrRNA sequence may interact to form a paired, double-stranded structure. The structure may facilitate binding of an endonuclease to the NATNA.
[0081] В некоторых вариантах осуществления одиночная гидовая NATNA содержит спейсерную последовательность, локализованную на 5′ первого дуплекса, содержащего область гибридизации между минимальным повтором CRISPR и минимальной последовательностью tracрРНК. Первый дуплекс может прерываться выпетливанием. Выпетливание облегчает рекрутирование эндонуклеазы к NATNA. После выпетливания может следовать первый стебель, содержащий линкер, соединяющий минимальный повтор CRISPR и минимальную последовательность tracрРНК. Последний спаренный нуклеотид на 3′-конце первого дуплекса можно соединять со вторым линкером, соединяющим первый дуплекс с mid-tracрРНК. mid-tracрРНК может содержать одну или более дополнительных шпилек.[0081] In some embodiments, a single guide NATNA comprises a spacer sequence located 5' of a first duplex comprising a region of hybridization between a minimal CRISPR repeat and a minimal tracrRNA sequence. The first duplex may be interrupted by a loop. The loop facilitates recruitment of an endonuclease to NATNA. The loop may be followed by a first stem comprising a linker connecting the minimal CRISPR repeat and the minimal tracrRNA sequence. The last paired nucleotide at the 3' end of the first duplex may be connected to a second linker connecting the first duplex to the mid-tracrRNA. The mid-tracrRNA may comprise one or more additional hairpins.
[0082] В некоторых вариантах осуществления NATNA может содержать двойную структуру гидовой нуклеиновой кислоты. Двойная гидовая NATNA содержит спейсерный удлиняющий сегмент, спейсер, минимальный повтор CRISPR, минимальную последовательность tracрРНК, 3′-последовательность tracрРНК и удлиняющий сегмент tracрРНК. Двойная гидовая NATNA не включает одиночный гидовый коннектор. Вместо этого, минимальная последовательность повтора CRISPR содержит 3′-последовательность повтора CRISPR, и минимальная последовательность tracрРНК содержит 5′-последовательность tracрРНК, и двойные гидовые NATNA могут гибридизоваться через минимальный повтор CRISPR и минимальную последовательность tracрРНК.[0082] In some embodiments, a NATNA may comprise a dual guide nucleic acid structure. The dual guide NATNA comprises a spacer extension segment, a spacer, a minimal CRISPR repeat, a minimal tracrRNA sequence, a 3′ tracrRNA sequence, and a tracrRNA extension segment. The dual guide NATNA does not include a single guide connector. Instead, the minimal CRISPR repeat sequence comprises a 3′ CRISPR repeat sequence, and the minimal tracrRNA sequence comprises a 5′ tracrRNA sequence, and the dual guide NATNAs can hybridize through the minimal CRISPR repeat and the minimal tracrRNA sequence.
[0083] В некоторых вариантах осуществления NATNA является сконструированной гидовой РНК, содержащей один или более остатков ДНК (CRISPR-гибридную RDNA или chRDNA). В некоторых вариантах осуществления NATNA выбрана из вариантов осуществления, описанных в патенте США № 9650617. В кратком изложении, некоторые chRDNA для использования с системой CRISPR типа II может состоять из двух цепей, образующих вторичную структуру, включающую активирующую область, состоящую из верхней дуплексной области, нижней дуплексной области, выпетливания, нацеливающей области, связи и одной или более шпилек. Нуклеотидная последовательность непосредственно ниже нацеливающей области может содержать различные пропорции ДНК и РНК. Другая chRDNA может являться одиночной гидовой D(R)NA для использования с системой CRISPR типа II, содержащей нацеливающую область, и активирующей областью, состоящей из нижней дуплексной области, верхней дуплексной области, области слияния, выпетливания, связи и одной или более шпилек. Нуклеотидная последовательность непосредственно ниже нацеливающей области может содержать различные пропорции ДНК и РНК. Например, нацеливающая область может содержать ДНК или смесь ДНК и РНК, и активирующая область может содержать РНК или смесь ДНК и РНК.[0083] In some embodiments, the NATNA is an engineered guide RNA comprising one or more DNA residues (CRISPR hybrid RDNA or chRDNA). In some embodiments, the NATNA is selected from the embodiments described in U.S. Patent No. 9,650,617. Briefly, some chRDNA for use with a Type II CRISPR system may be comprised of two strands forming a secondary structure comprising an activating region comprising an upper duplex region, a lower duplex region, a loop, a targeting region, a ligament, and one or more hairpins. The nucleotide sequence immediately downstream of the targeting region may comprise varying proportions of DNA and RNA. Another chRDNA may be a single guide D(R)NA for use with a type II CRISPR system that comprises a targeting region and an activating region consisting of a lower duplex region, an upper duplex region, a fusion region, a loop, a linkage, and one or more hairpins. The nucleotide sequence immediately downstream of the targeting region may contain varying proportions of DNA and RNA. For example, the targeting region may contain DNA or a mixture of DNA and RNA, and the activating region may contain RNA or a mixture of DNA and RNA.
[0084] В некоторых вариантах осуществления эндонуклеаза, образующая 3’-конец двухцепочечной целевой нуклеиновой кислоты, является эндонуклеазой рестрикции, например, эндонуклеазой рестрикции типа II. В некоторых вариантах осуществления эндонуклеаза рестрикции приводит к образованию тупого конца. В случае каждой эндонуклеазы адаптер по изобретению содержит липкий 5’-конец, способный гибридизоваться с липким 5’-концом, образующемся в способе, представленном в настоящем описании, в эксцизированной нуклеиновой кислоте, подлежащей захвату.[0084] In some embodiments, the endonuclease that forms the 3' end of the double-stranded target nucleic acid is a restriction endonuclease, such as a type II restriction endonuclease. In some embodiments, the restriction endonuclease results in the formation of a blunt end. For each endonuclease, the adaptor of the invention comprises a 5' sticky end capable of hybridizing to the 5' sticky end formed in the method provided herein in the excised nucleic acid to be captured.
[0085] В вариантах осуществления эндонуклеаза, образующая 3’-конец двухцепочечной целевой нуклеиновой кислоты, является каталитически неактивной эндонуклеазой CRISPR (например, каталитически неактивной Cas9 или Cas12a), конъюгированной с расщепляющим доменом эндонуклеазы рестрикции Fok I (см., например, Guilinger, J. P., et al., (2014). Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification, Nature biotechnology, 32(6), 577-582).[0085] In embodiments, the endonuclease that forms the 3' end of the double-stranded target nucleic acid is a catalytically inactive CRISPR endonuclease (e.g., a catalytically inactive Cas9 or Cas12a) conjugated to the cleavage domain of the restriction endonuclease Fok I (see, for example, Guilinger, J. P.,et al.,(2014).Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification, Nature biotechnology,32(6), 577-582).
[0086] В вариантах осуществления, где эндонуклеаза, образующая 3’-конец двухцепочечной целевой нуклеиновой кислоты, является нуклеазой с цинковыми пальцами (ZFN) или слитым белком ZFN-Fok I, целевая последовательность имеет длину приблизительно 22-52 оснований и содержит пару последовательностей распознавания ZFN, каждая длиной 9-18 нуклеотидов, разделенных спейсером длиной 4-18 нуклеотидов (см., например, Kim Y.G., et al., (1996). Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain, Proc Natl. Acad. Sci USA. 93(3): 1156-1160).[0086] In embodiments wherein the endonuclease that forms the 3' end of the double-stranded target nucleic acid is a zinc finger nuclease (ZFN) or a ZFN-Fok I fusion protein, the target sequence is approximately 22-52 bases in length and comprises a pair of ZFN recognition sequences, each 9-18 nucleotides in length, separated by a spacer of 4-18 nucleotides in length (see, e.g., Kim Y. G., et al., (1996). Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain, Proc Natl. Acad. Sci USA. 93(3): 1156-1160).
[0087] В вариантах осуществления, где эндонуклеаза, образующая 3’-конец двухцепочечной целевой нуклеиновой кислоты, является нуклеазой на основе эффектора, подобного активатору транскрипции (TALEN) или слитым белком TALEN-Fok I, целевая последовательность имеет длину приблизительно 48-85 нуклеотидов и содержит пару последовательностей распознавания TALEN, каждая длиной 18-30 оснований, разделенных спейсером длиной 12-25 оснований (см., например, Christian M. et al., (2010) Targeting ДНК double-strand breaks with TAL effector nucleases, Genetics. 186 (2): 757-61).[0087] In embodiments wherein the endonuclease that forms the 3' end of the double-stranded target nucleic acid is a transcription activator-like effector (TALEN) nuclease or a TALEN-Fok I fusion protein, the target sequence is approximately 48-85 nucleotides in length and comprises a pair of TALEN recognition sequences, each 18-30 bases in length, separated by a spacer of 12-25 bases in length (see, e.g., Christian M. et al., (2010) Targeting DNA double-strand breaks with TAL effector nucleases, Genetics. 186 (2): 757-61).
[0088] Как показано на фигуре 1, в способах и композициях, представленных в настоящем описании, используют последовательность, ассоциированную с участком распознавания и участком расщепления каждой эндонуклеазы. В некоторых вариантах осуществления последовательность распознавания и участок расщепления являются одинаковыми. Например, в случае эндонуклеаз рестрикции типа II участок распознавания является палиндромной последовательностью, и расщепление происходит в палиндромной последовательности. В некоторых вариантах осуществления участок распознавания отличается от участка расщепления. В некоторых вариантах осуществления эндонуклеаза является эндонуклеазой CRSIPR, и участок распознавания является последовательностью, содержащей мотив, смежный с протоспейсером (PAM), в то время как участок расщепления находится в области, гибридизующейся с нацеливающей областью гидовой РНК CRISPR (спейсерной областью). PAM является смежным с известным фрагментом целевой последовательности.[0088] As shown in the figure 1, the methods and compositions provided herein utilize a sequence associated with a recognition site and a cleavage site of each endonuclease. In some embodiments, the recognition sequence and the cleavage site are the same. For example, in the case of type II restriction endonucleases, the recognition site is a palindromic sequence and cleavage occurs at the palindromic sequence. In some embodiments, the recognition site is different from the cleavage site. In some embodiments, the endonuclease is a CRSIPR endonuclease and the recognition site is a sequence containing a protospacer adjacent motif (PAM), while the cleavage site is in a region that hybridizes to the targeting region of the CRISPR guide RNA (spacer region). The PAM is adjacent to a known fragment of the target sequence.
[0089] Нуклеазы CRISPR не расщепляют фиксированную последовательность, но вместо этого направляются гидовой нуклеиновой кислотой, как описано выше. Однако нуклеазы CRISPR распознают дополнительную последовательность, названную мотивом, смежным с протоспейсером (PAM). В настоящем изобретении используют последовательность PAM, а также последовательность целевой нуклеиновой кислоты, о которой известно, что она влияет на захват эксцизированной целевой нуклеиновой кислоты. Как показано на фигуре 1, PAM и короткий фрагмент смежной целевой последовательности используют для конструирования адаптерного олигонуклеотида. В некоторых вариантах осуществления PAM и короткий фрагмент между PAM и участком расщепления используют для конструирования липкого 5’-конца, способного гибридизоваться с липким 5’-концом, полученным способом, представленным в настоящем описании, в эксцизированной нуклеиновой кислоте, подлежащей захвату.[0089] CRISPR nucleases do not cleave a fixed sequence, but are instead guided by a guide nucleic acid, as described above. However, CRISPR nucleases recognize an additional sequence called a protospacer adjacent motif (PAM). The present invention utilizes a PAM sequence as well as a target nucleic acid sequence known to affect the capture of an excised target nucleic acid. As shown in Figure 1, the PAM and a short fragment of the adjacent target sequence are used to design an adapter oligonucleotide. In some embodiments, the PAM and a short fragment between the PAM and the cleavage site are used to design a 5' overhang capable of hybridizing to a 5' overhang generated by the method described herein in an excised nucleic acid to be captured.
[0090] В некоторых вариантах осуществления эндонуклеаза, образующая 3’-конец двухцепочечной целевой нуклеиновой кислоты, является эндонуклеазой CRISPR класса I (CASCADE), и мотив, смежный с протоспейсером (PAM), состоит из последовательности, выбранной из 5’-AAG-3’, 5’-AGG-3’, 5’-ATG-3’, 5’-GAG-3’, 5’-CAG-3’, 5’-GTG-3’ 5’-TAA-3’, 5’-TGG-3’, 5’-AAA-3’, 5’-AAC-3’, 5’-AAT-3’5’-ATA-3’, 5’-TAG-3’ и 5’-TTG-3’.[0090] In some embodiments, the endonuclease that forms the 3' end of the double-stranded target nucleic acid is a class I CRISPR endonuclease (CASCADE), and the protospacer adjacent motif (PAM) consists of a sequence selected from 5'-AAG-3', 5'-AGG-3', 5'-ATG-3', 5'-GAG-3', 5'-CAG-3', 5'-GTG-3', 5'-TAA-3', 5'-TGG-3', 5'-AAA-3', 5'-AAC-3', 5'-AAT-3', 5'-ATA-3', 5'-TAG-3', and 5'-TTG-3'.
[0091] В некоторых вариантах осуществления эндонуклеаза, образующая 3’-конец двухцепочечной целевой нуклеиновой кислоты, является эндонуклеазой CRISPR класса II, и мотив, смежный с протоспейсером (PAM), состоит из последовательности, выбранной из 5′-NGG-3′, 5′-NGGNG-3′, 5′-NNAAAAW-3′, 5′-NNNNGATT-3′, 5′-GNNNCNNA-3′, и 5′-NNNACA-3′,5’-TTN-3’, 5’-TTTN-3’ и 5’-TTTV-3’.[0091] In some embodiments, the endonuclease that forms the 3' end of the double-stranded target nucleic acid is a class II CRISPR endonuclease, and the protospacer adjacent motif (PAM) consists of a sequence selected from 5'-NGG-3', 5'-NGGNG-3', 5'-NNAAAAW-3', 5'-NNNNGATT-3', 5'-GNNNCNNA-3', and 5'-NNNACA-3',5'-TTN-3', 5'-TTTN-3', and 5'-TTTV-3'.
[0092] В некоторых вариантах осуществления в настоящем изобретении используют адаптер, добавляемый на по меньшей мере один конец нуклеиновой кислоты или цепи нуклеиновой кислоты. Адаптер может являться одноцепочечными, двухцепочечными или частично двухцепочечными адаптерами. Адаптер содержит двухцепочечную часть, где двухцепочечная часть лигирована с двухцепочечной нуклеиновой кислотой способом, представленным в настоящем описании. В этой области известны адаптеры разных форм и функций, см., например, патенты США №№ 8822150 (Y-образный адаптер); 8455193 (адаптер стебель-петля/шпилька); и 11085084 (разные формы частично двухцепочечных адаптеров). В некоторых вариантах осуществления функцией адаптера является встраивание некоторых полезных элементов в нуклеиновую кислоту. Примеры элементов адаптерного происхождения включают штрихкоды нуклеиновой кислоты, участки связывания праймера для амплификации, участки связывания праймера для секвенирования, участки распознавания ферментов и участки, обеспечивающие лигирование.[0092] In some embodiments, the present invention utilizes an adapter added to at least one end of a nucleic acid or a nucleic acid strand. The adapter may be a single-stranded, double-stranded, or partially double-stranded adapter. The adapter comprises a double-stranded portion, wherein the double-stranded portion is ligated to the double-stranded nucleic acid in a manner described herein. Adapters of various shapes and functions are known in the art, see, for example, U.S. Patent Nos. 8,822,150 (Y-shaped adapter); 8,455,193 (stem-loop/hairpin adapter); and 11,085,084 (various shapes of partially double-stranded adapters). In some embodiments, the function of the adapter is to incorporate certain useful elements into the nucleic acid. Examples of adapter-derived elements include nucleic acid barcodes, amplification primer binding sites, sequencing primer binding sites, enzyme recognition sites, and ligation sites.
[0093] В некоторых вариантах осуществления молекулы адаптеров являются синтезированными in vitro искусственными последовательностями. В других вариантах осуществления молекулы адаптеров являются синтезированными in vitro природными последовательностями. В других вариантах осуществления молекулы адаптеров являются выделенными природными молекулами или выделенными неприродными молекулами.[0093] In some embodiments, the adapter molecules are in vitro synthesized artificial sequences. In other embodiments, the adapter molecules are in vitro synthesized natural sequences. In other embodiments, the adapter molecules are isolated natural molecules or isolated non-natural molecules.
[0094] В некоторых вариантах осуществления изобретения адаптер является одноцепочечным, и 5’-последовательность адаптера гибридизуется с липким 5’-концом целевой нуклеиновой кислоты, и 5’-конец адаптера лигируют с углубленным 3’-концом целевой нуклеиновой кислоты.[0094] In some embodiments, the adapter is single-stranded and the 5' sequence of the adapter hybridizes to the sticky 5' end of the target nucleic acid and the 5' end of the adapter is ligated to the recessed 3' end of the target nucleic acid.
[0095] В некоторых вариантах осуществления изобретения адаптер является по меньшей мере частично двухцепочечным и содержит липкий 5’-конец. Липкий 5’-конец адаптера гибридизуется с липким 5’-концом целевой нуклеиновой кислоты, и 5’-конец адаптера лигируют с углубленным 3’-концом целевой нуклеиновой кислоты, в то время как углубленный 3’-конец адаптера лигируют с 5’-концом целевой нуклеиновой кислотой.[0095] In some embodiments, the adapter is at least partially double-stranded and comprises a 5' sticky end. The 5' sticky end of the adapter hybridizes to the 5' sticky end of the target nucleic acid, and the 5' end of the adapter is ligated to the recessed 3' end of the target nucleic acid, while the recessed 3' end of the adapter is ligated to the 5' end of the target nucleic acid.
[0096] В случае двухцепочечного адаптера (или адаптера, имеющего двухцепочечную часть) липкий 5’-конец на 5’-конце адаптера может гибридизоваться или гибридизуется с липким 5’-концом целевой нуклеиновой кислоты и может лигироваться с 3’-концом целевой нуклеиновой кислоты.[0096] In the case of a double-stranded adaptor (or an adaptor having a double-stranded portion), the 5' sticky end at the 5' end of the adaptor may hybridize or hybridizes to the 5' sticky end of the target nucleic acid and may ligate to the 3' end of the target nucleic acid.
[0097] В некоторых вариантах осуществления настоящее изобретение включает конструирование адаптера. Термин "конструирование" относится к идентификации разных последовательностей в целевой нуклеиновой кислоте, которые можно захватывать с помощью адаптера, представленного в настоящем описании, и кроме того, к конструированию липкого 5’-конца адаптерного олигонуклеотида, чтобы сделать возможной гибридизацию с такими последовательностями. Как подробно описано в настоящем описании, способ включает получение липкого 5’-конца вблизи участка расщепления в целевой нуклеиновой кислоте. Последовательность вблизи участка расщепления в целевой нуклеиновой кислоте включает известные и неизвестные последовательности. Известные последовательности включают по меньшей мере часть последовательности распознавания для эндонуклеазы вблизи участка расщепления. Известную последовательность используют для дизайна способа расщепления экзонуклеазами. Известную последовательность дополнительно используют для конструирования адаптерного олигонуклеотида.[0097] In some embodiments, the present invention includes designing an adapter. The term "designing" refers to identifying different sequences in a target nucleic acid that can be captured by an adapter as provided herein, and further designing a 5' sticky end of an adapter oligonucleotide to allow hybridization to such sequences. As described in detail herein, the method includes providing a 5' sticky end near a cleavage site in a target nucleic acid. The sequence near the cleavage site in the target nucleic acid includes known and unknown sequences. The known sequences include at least a portion of a recognition sequence for an endonuclease near the cleavage site. The known sequence is used to design a method for exonuclease cleavage. The known sequence is further used to design the adapter oligonucleotide.
[0098] Например, на фигуре 1 показана целевая нуклеиновая кислота, расщепленная эндонуклеазой CRISPR, где известные последовательности, смежные с концом нуклеиновой кислоты, включают целевую последовательность, мотив, смежный с протоспейсером (PAM), и часть спейсерной последовательности до участка расщепления. В этом примере известную последовательность 5’-AGGTGG(N)n-3’ (включая смежную целевую последовательность) используют для дизайна экзонуклеазной реакции, содержащей ДНК-полимеразу T4 и dGTP для получения липкого конца 5’-AGGTGG на целевой нуклеиновой кислоте. В этом примере адаптер конструируют так, чтобы он имел липкий 5’-конец, содержащий последовательность 5’-CCACCT-3’.[0098] For example, Figure 1 shows a target nucleic acid cleaved by a CRISPR endonuclease, wherein known sequences adjacent to the end of the nucleic acid include a target sequence, a protospacer adjacent motif (PAM), and a portion of the spacer sequence prior to the cleavage site. In this example, the known sequence 5'-AGGTGG(N) n -3' (including the adjacent target sequence) is used to design an exonuclease reaction comprising T4 DNA polymerase and dGTP to produce a 5'-AGGTGG overhang on the target nucleic acid. In this example, the adaptor is designed to have a 5' overhang comprising the sequence 5'-CCACCT-3'.
[0099] В примере, показанном на фигуре 1, расщепление происходит между 3-им и 4-ым нуклеотидом 5’ PAM, что является эквиваленту положению между 17-ым и 18-ым нуклеотидами спейсера. В других вариантах осуществления другие эндонуклеазы CRISPR расщепляют по разным положениям в спейсерной последовательности. В некоторых вариантах осуществления PAM находится ниже (3’-сторона) спейсерной последовательности, содержащей участок расщепления. В некоторых вариантах осуществления PAM находится выше (5’-сторона) спейсерной последовательности, содержащей участок расщепления.[0099] In the example shown in Figure 1, the cleavage occurs between the 3rd and 4th nucleotide of the 5' PAM, which is equivalent to a position between the 17th and 18th nucleotides of the spacer. In other embodiments, other CRISPR endonucleases cleave at different positions in the spacer sequence. In some embodiments, the PAM is downstream (3' side) of the spacer sequence containing the cleavage site. In some embodiments, the PAM is upstream (5' side) of the spacer sequence containing the cleavage site.
[00100] Многие эндонуклеазы рестрикции приводят к образованию липких концов, делающих возможным простое лигирование с совместимым концом. Однако многие эндонуклеазы рестрикции приводят к образованию тупых концов, например, Afe I, AluI, BsaAI, BsaBI, BstuI, DpnI, DraI, Eco53kI, EcoRV, FspI, HaeIII, HincII, HpaI, HpyCH4V, Hpy166II, MscI, NaeII, NlaVI, NruI, PmlI, PvuII, RsaI, ScaI, SfoI, SnaBI, SspI, StuI, SwaI и ZraI являются некоторыми из образующих тупые концы ферментов, которые можно использовать в способе по настоящему изобретению. В случае образующей тупые концы эндонуклеаза рестрикции известные последовательности включают целевую последовательность и палиндромную последовательность распознавания, которая в случае образующих тупые концы ферментов расщепляется посредством двухцепочечного разрыва в середине палиндрома. Известную последовательность используют для дизайна способа расщепления экзонуклеазами. Известную последовательность дополнительно используют для конструирования адаптерного олигонуклеотида. Например, в случае EcoRV последовательность распознавания представляет собой 5’-GATATC-3’, которая может встречаться в целевой последовательности 5’-GATATC-3’. Расщепление эндонуклеазой EcoRV оставляет фрагмент нуклеиновой кислоты с 5’-ATC(N)n-3’. Последовательность 5’-ATC-3’ и любую известную смежную последовательность используют для дизайна экзонуклеазной реакции, содержащей ДНК-полимеразу T4 и нуклеотид, смежный с C, для образования липкого конца 5’-ATC на целевой нуклеиновой кислоте. В этом примере адаптер конструируют так, чтобы он имел липкий 5’-конец, содержащий по меньшей мере последовательность 5’-GAT-3’.[00100] Many restriction endonucleases produce sticky ends that allow easy ligation to a compatible end. However, many restriction endonucleases produce blunt ends, for example, Afe I, AluI, BsaAI, BsaBI, BstuI, DpnI, DraI, Eco53kI, EcoRV, FspI, HaeIII, HincII, HpaI, HpyCH4V, Hpy166II, MscI, NaeII, NlaVI, NruI, PmlI, PvuII, RsaI, ScaI, SfoI, SnaBI, SspI, StuI, SwaI and ZraI are some of the blunt end forming enzymes that can be used in the method of the present invention. In the case of blunt-ending restriction endonuclease, the known sequences include a target sequence and a palindromic recognition sequence, which in the case of blunt-ending enzymes is cleaved via a double-strand break in the middle of the palindrome. The known sequence is used to design an exonuclease cleavage method. The known sequence is further used to design an adapter oligonucleotide. For example, in the case of EcoRV, the recognition sequence is 5'-GATATC-3', which can occur in the target sequence 5'-GATATC-3'. Cleavage with EcoRV endonuclease leaves a nucleic acid fragment with 5'-ATC(N) n -3'. The 5'-ATC-3' sequence and any known adjacent sequence are used to design an exonuclease reaction containing T4 DNA polymerase and a nucleotide adjacent to C to form a 5'-ATC sticky end on the target nucleic acid. In this example, the adapter is designed to have a sticky 5' end containing at least the sequence 5'-GAT-3'.
[00101] Специалисту в этой области будет понятно, что гибридизация между цепями нуклеиновой кислоты не требует 100% комплементарности или 100% образованию уотсон-криковских пар. В некоторых вариантах осуществления стабильный гибрид между липким 5’-концом адаптера и липким 5’-концом целевой нуклеиновой кислоты включает образование канонических (уотсон-криковских) пар оснований, а также неканонических пар оснований и ошибочно спаренных оснований. В некоторых вариантах осуществления адаптер конструируют так, чтобы он содержал химически модифицированные нуклеиновые кислоты, где модификация способствует образованию стабильного гибрида. Например, липкий 5’-конец адаптера может содержать химическую модификацию, повышающую температуру плавления двухцепочечной области. Кроме того, специалисту в этой области будет понятно, что образование стабильного гибрида между цепями нуклеиновой кислоты зависит от условий реакции, включая ионную силу буфера и температуру. Таким образом, адаптер и условия реакции получают и составляют таким образом, что липкий 5’-конец адаптера образует стабильный гибрид с липким 5’-концом целевой нуклеиновой кислоты в выбранных условиях реакции.[00101] One skilled in the art will appreciate that hybridization between nucleic acid strands does not require 100% complementarity or 100% Watson-Crick base pairing. In some embodiments, a stable hybrid between the 5' sticky end of the adapter and the 5' sticky end of the target nucleic acid includes the formation of canonical (Watson-Crick) base pairs as well as non-canonical base pairs and mismatches. In some embodiments, the adapter is designed to contain chemically modified nucleic acids, wherein the modification facilitates the formation of a stable hybrid. For example, the 5' sticky end of the adapter may contain a chemical modification that increases the melting temperature of the double-stranded region. In addition, one skilled in the art will appreciate that the formation of a stable hybrid between nucleic acid strands depends on reaction conditions, including the ionic strength of the buffer and the temperature. Thus, the adaptor and reaction conditions are prepared and formulated such that the sticky 5' end of the adaptor forms a stable hybrid with the sticky 5' end of the target nucleic acid under the selected reaction conditions.
[00102] Сделанные на заказ синтетические олигонуклеотиды легко доступны у многих коммерческих поставщиков, использующих фосфорасмидитную химию, включая ThermoFisher Scientific, Applied Biosystems (Waltham, Mass.), Biolytic (Newark, Cal.), BioAutomation (Plano, Tex.) и Integrated DNA Technologies (Coralville, Ia.). Другие способы синтеза используют в Twist Bioscience (South San Francisco, Cal.) и Custom Array/GenScript (Redmond, Wash.). Необязательно, сделанные на заказ синтетические олигонуклеотиды, используемые для получения адаптера, представленного в настоящем описании, можно дополнительно очищать любыми стандартными способами, такими как высокоэффективная жидкостная хроматография (ВЭЖХ). Необязательно, в очистке можно использовать защитные группы, такие как DMT (диметокситритил). Например, препарат неочищенного олигонуклеотида можно очищать с помощью колонки для ВЭЖХ RP 18 (Hypersil, 8 × 240 мм) с использованием градиента 0,1 M ацетата триэтиламмония, pH 7,1, ацетонитрила. DMT на пике можно собирать, обессоливать посредством диализа, выпаривать и растворять в 10 мМ Трис, pH 8,0. Можно определять OD, измеренную при 260 нм, для оценки выхода.[00102] Custom synthetic oligonucleotides are readily available from many commercial suppliers using phosphorasmidite chemistry, including ThermoFisher Scientific, Applied Biosystems (Waltham, Mass.), Biolytic (Newark, Cal.), BioAutomation (Plano, Tex.), and Integrated DNA Technologies (Coralville, Ia.). Other synthetic methods are used by Twist Bioscience (South San Francisco, Cal.) and Custom Array/GenScript (Redmond, Wash.). Optionally, the custom synthetic oligonucleotides used to prepare the adapter described herein can be further purified by any standard method, such as high performance liquid chromatography (HPLC). Optionally, protecting groups such as DMT (dimethoxytrityl) can be used in the purification. For example, a crude oligonucleotide preparation can be purified using an RP 18 HPLC column (Hypersil, 8 x 240 mm) using a gradient of 0.1 M triethylammonium acetate, pH 7.1, acetonitrile. The DMT at the peak can be collected, desalted by dialysis, evaporated, and dissolved in 10 mM Tris, pH 8.0. The OD measured at 260 nm can be determined to estimate the yield.
[00103] Двухцепочечный адаптерный олигонуклеотид можно получать посредством комбинирования двух цепей нуклеиновой кислоты (цепи с липким концом и цепи без липкого конца) в реакционной смеси, содержащей подходящий буфер (например, 1-кратный TE или 1,5-кратный TE). Для обеспечения правильного отжига без какой-либо нежелательной вторичной структуры реакционную смесь можно нагревать, например, до 90°C или более и медленно охлаждать. В некоторых вариантах осуществления частично двухцепочечный адаптер содержит одиночную цепь, принимающую вторичную структуру, например, гантель, стебель-петлю или шпильку. Такие адаптеры также можно получать, подвергая одиночную цепь нагреву с последующим медленным охлаждением в подходящем буфере (например, 1-кратном TE или 1,5-кратном TE) для обеспечения образования желаемой вторичной структуры.[00103] A double-stranded adapter oligonucleotide can be prepared by combining two nucleic acid strands (a strand with an overhang and a strand without an overhang) in a reaction mixture containing a suitable buffer (e.g., 1x TE or 1.5x TE). To ensure proper annealing without any unwanted secondary structure, the reaction mixture can be heated, for example, to 90°C or more, and slowly cooled. In some embodiments, a partially double-stranded adapter comprises a single strand that adopts a secondary structure, such as a dumbbell, a stem-loop, or a hairpin. Such adapters can also be prepared by subjecting a single strand to heating followed by slow cooling in a suitable buffer (e.g., 1x TE or 1.5x TE) to ensure formation of the desired secondary structure.
[00104] В некоторых вариантах осуществления адаптер включает одну или более химических модификаций. В некоторых вариантах осуществления модификация вызывает повышенную стабильность двухцепочечной области адаптера. В некоторых вариантах осуществления модификация придает резистентность к расщеплению экзонуклеазами или ингибирование экзонуклеаз.[00104] In some embodiments, the adapter includes one or more chemical modifications. In some embodiments, the modification causes increased stability of the double-stranded region of the adapter. In some embodiments, the modification confers resistance to exonuclease cleavage or inhibition of exonucleases.
[00105] В некоторых вариантах осуществления модификация является модификацией остова. Одним из типов модификации остова является модифицированная межнуклеозидная связь. Например, модификация включает фосфотиоатные связи и гетероатомные межнуклеозидные связи.[00105] In some embodiments, the modification is a backbone modification. One type of backbone modification is a modified internucleoside linkage. For example, the modification includes phosphorothioate linkages and heteroatom internucleoside linkages.
[00106] Другим типом модификации остова является модификация сахарного остатка. В некоторых вариантах осуществления модификация включает встраивание 6-членного морфолинового кольца вместо рибозного или дезоксирибозного кольца. Другая модификация остова включает встраивание циклогексенильного кольца вместо рибозы или дезоксирибозы (ceNA). Другая модификация остова включает встраивание замкнутых нуклеиновых кислот (ЗНК), в которых 2′-гидроксильная группа связана с 4′-атомом углерода рибозы и, таким образом, образование бициклической структуры, имеющей 2′-C,4′-C-оксиметиленовую связь. ЗНК отличаются стабильностью дуплекса и резистентностью к расщеплению 3’-5’-экзонуклеазами.[00106] Another type of backbone modification is a modification of the sugar moiety. In some embodiments, the modification comprises the insertion of a 6-membered morpholine ring in place of the ribose or deoxyribose ring. Another backbone modification comprises the insertion of a cyclohexenyl ring in place of the ribose or deoxyribose (ceNA). Another backbone modification includes the insertion of closed nucleic acids (LNAs) in which the 2′-hydroxyl group is linked to the 4′-carbon of the ribose, thereby forming a bicyclic structure having a 2′-C,4′-C-oxymethylene bond. LNAs are characterized by duplex stability and resistance to cleavage by 3′-5′ exonucleases.
[00107] В некоторых вариантах осуществления модификация является модификацией азотистого основания. Например, двухцепочечный нуклеиновый субстрат может включать один или более из 5-метилцитозина (5-me-C), 5-гидроксиметилцитозина, ксантина, гипоксантина, 2-аминоаденина, 6-метильных и других алкильных производных аденина и гуанина, 2-пропильных и других алкильных производных аденина и гуанина, 2-тиоурацила, 2-тиотимина и 2-тиоцитозина, 5-галогенурацила и -цитозина, 5-пропинил (-C=C-CH3)-урацила и -цитозина и других алкинильных производных пиримидиновых оснований, 6-азоурацила, -цитозина и -тимина, 5-урацила (псевдоурацила), 4-тиоурацил-, 8-галоген-, 8-амино-, 8-тио-, 8-тиоалкил-, 8-гидроксильных и других 8-замещенных аденинов и гуанинов, 5-галоген, в частности 5-бром-, 5-трифторметил- и других 5-замещенных урацилов и цитозинов, 7-метилгуанина и 7-метиладенина, 2-F-аденина, 2-аминоаденина, 8-азагуанина и 8-азааденина, 7-деазагуанина и 7-деазааденина и 3-деазагуанина и 3-деазааденина. Модифицированные нуклеиновые основания могут включать трициклические пиримидины, такие как феноксазин цитидин(1H-пиримидо(5,4-b)(1,4)бензоксазин-2(3H)-он), фенотиазин цитидин (1H-пиримидо(5,4-b)(1,4)бензотиазин-2(3H)-он), G-фиксирующие основания, такие как замещенный феноксазин цитидин (например, 9-(2-аминоэтокси)-H-пиримидо(5,4-(b) (1,4)бензоксазин-2(3H)-он), карбазол цитидин (2H-пиримидо(4,5-b)индол-2-он), пиридоиндол цитидин (H-пиридо(3′,2′:4,5)пирроло(2,3-d)пиримидин-2-он), 7-деаза-аденин, 7-деазагуанозин, 2-аминопиридин и 2-пиридон. Нуклеиновые основания можно использовать для повышения аффинности связывания полинуклеотидного соединения. Они могут включать 5-замещенные пиримидины, 6-азапиримидины и N-2-, N-6- и 0-6-замещенные пурины, включая 2-аминопропиладенин, 5-пропинилурацил и 5-пропинилцитозин. Замены 5-метилцитозина могут повышать стабильность дуплекса нуклеиновой кислоты на 0,6-1,2°C и могут представлять собой подходящие замены оснований (например, при комбинировании с 2′-O-метоксиэтильными модификациями сахаров).[00107] In some embodiments, the modification is a nitrogenous base modification. For example, the double-stranded nucleic acid substrate may include one or more of 5-methylcytosine (5-me-C), 5-hydroxymethylcytosine, xanthine, hypoxanthine, 2-aminoadenine, 6-methyl and other alkyl derivatives of adenine and guanine, 2-propyl and other alkyl derivatives of adenine and guanine, 2-thiouracil, 2-thiothymine and 2-thiocytosine, 5-halouracil and -cytosine, 5-propynyl (-C=C-CH3)-uracil and -cytosine and other alkynyl derivatives of pyrimidine bases, 6-azouracil, -cytosine and -thymine, 5-uracil (pseudouracil), 4-thiouracil-, 8-halo-, 8-amino-, 8-thio-, 8-thioalkyl-, 8-hydroxyl and other 8-substituted adenines and guanines, 5-halogen, in particular 5-bromo-, 5-trifluoromethyl- and other 5-substituted uracils and cytosines, 7-methylguanine and 7-methyladenine, 2-F-adenine, 2-aminoadenine, 8-azaguanine and 8-azaadenine, 7-deazaguanine and 7-deazaadenine and 3-deazaguanine and 3-deazaadenine. Modified nucleobases may include tricyclic pyrimidines such as phenoxazine cytidine (1H-pyrimido(5,4-b)(1,4)benzoxazin-2(3H)-one), phenothiazine cytidine (1H-pyrimido(5,4-b)(1,4)benzothiazin-2(3H)-one), G-fixing bases such as substituted phenoxazine cytidine (e.g. 9-(2-aminoethoxy)-H-pyrimido(5,4-(b)(1,4)benzoxazin-2(3H)-one), carbazole cytidine (2H-pyrimido(4,5-b)indol-2-one), pyridoindole cytidine (H-pyrido(3′,2′:4,5)pyrrolo(2,3-d)pyrimidin-2-one), 7-deaza-adenine, 7-deazaguanosine, 2-aminopyridine and 2-pyridone. Nucleobases can be used to enhance the binding affinity of a polynucleotide compound. They can include 5-substituted pyrimidines, 6-azapyrimidines and N-2-, N-6- and 0-6-substituted purines including 2-aminopropyladenine, 5-propynyluracil and 5-propynylcytosine. 5-methylcytosine substitutions can increase nucleic acid duplex stability by 0.6-1.2°C and can be useful base substitutions (e.g. when combined with 2′-O-methoxyethyl sugar modifications).
[00108] В некоторых вариантах осуществления двухцепочечная часть адаптера включает модифицированный нуклеотид, повышающий температуру плавления двухцепочечной части, например, 5-метилцитозин, 2,6-диаминопурин, 5-гидроксибутинил-2’-дезоксиуридин, 8-аза-7-деазагуанозин, рибонуклеотид, 2’O-метил-рибонуклеотид или замкнутую нуклеиновую кислоту. В другом аспекте адаптер модифицируют для ингибирования расщепления нуклеазой, например, посредством включения фосфотиоатного нуклеотида.[00108] In some embodiments, the double-stranded portion of the adapter includes a modified nucleotide that increases the melting temperature of the double-stranded portion, such as 5-methylcytosine, 2,6-diaminopurine, 5-hydroxybutynyl-2'-deoxyuridine, 8-aza-7-deazaguanosine, a ribonucleotide, 2'O-methyl-ribonucleotide, or a locked nucleic acid. In another aspect, the adapter is modified to inhibit nuclease cleavage, such as by including a phosphorothioate nucleotide.
[00109] В некоторых вариантах осуществления настоящее изобретение включает использование штрихкода. Для анализа отдельных молекул нуклеиновой кислоты посредством массивного параллельного секвенирования, как правило, необходим отдельный уровень штрихкодирования для идентификации образцов и коррекции ошибок. Использование молекулярных штрихкодов описано, например, в патентах США №№ 7393665, 8168385, 8481292, 8685678 и 8722368. Уникальный молекулярный идентификаторный штрихкод (UMI или UID) добавляют к каждой молекуле, подлежащей секвенированию, для мечения молекулы и ее потомства (например, исходной молекулы и ее ампликонов, полученных посредством ПЦР). В некоторых вариантах осуществления UMI находится в 5’-части праймера для амплификации. В некоторых вариантах осуществления UMI находится в адаптере, лигированном с нуклеиновой кислотой.[00109] In some embodiments, the present invention includes the use of a barcode. Analysis of individual nucleic acid molecules by massively parallel sequencing typically requires a separate level of barcoding to identify samples and correct for errors. The use of molecular barcodes is described, for example, in U.S. Patent Nos. 7,393,665, 8,168,385, 8,481,292, 8,685,678, and 8,722,368. A unique molecular identifier barcode (UMI or UID) is added to each molecule to be sequenced to label the molecule and its progeny (e.g., the original molecule and its PCR amplicons). In some embodiments, the UMI is in the 5' portion of the amplification primer. In some embodiments, the UMI is in an adapter ligated to the nucleic acid.
[00110] UMI имеет множественное использование, включая подсчет количества исходных целевых молекул в образце и коррекцию ошибок (Newman, A., et al., (2014) An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage, Nature Medicine doi:10.1038/nm.3519). В кратком изложении, целое потомство одной целевой молекулы метят одним и тем же штрихкодом UMI, и оно образует штрихкодированное семейство. Различия последовательности, не являющиеся общими для всех (или большинства) членов штрихкодированного семейства, отбрасывают как артефакт. Штрихкоды UMI также можно использовать для позиционной дедупликации и количественного анализа мишени, т.к. все семейство представляет собой одну молекулу в исходном образце (Newman, A., et al., (2016) Integrated digital error suppression for improved detection of circulating tumor DNA, Nature Biotechnology 34:547). Адаптер, содержащий штрихкод UMI, можно конъюгировать с нуклеиновой кислотой, подлежащей секвенированию.[00110] UMI has multiple uses, including enumeration of the number of parent target molecules in a sample and error correction (Newman, A., et al ., (2014) An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage , Nature Medicine doi:10.1038/nm.3519). Briefly, all progeny of a single target molecule are labeled with the same UMI barcode and form a barcoded family. Sequence differences that are not common to all (or most) members of a barcoded family are discarded as an artifact. UMI barcodes can also be used for positional deduplication and target quantification, since the entire family represents a single molecule in the original sample (Newman, A., et al ., (2016) Integrated digital error suppression for improved detection of circulating tumor DNA , Nature Biotechnology 34:547). An adapter containing the UMI barcode can be conjugated to the nucleic acid to be sequenced.
[00111] Штрихкод для идентификации образца используют для мультиплексного секвенирования. Мультиплексный штрихкод ID образца (MID или SID) используют для идентификации источника нуклеиновой кислоты, где два или более образцов нуклеиновых кислот смешивают перед внесением в проточную кювету для секвенирования.[00111] A sample identification barcode is used for multiplex sequencing. A multiplex sample ID barcode (MID or SID) is used to identify a nucleic acid source where two or more nucleic acid samples are mixed prior to being added to a flow cell for sequencing.
[00112] В некоторых вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, включает UMI и MID. В некоторых вариантах осуществления один штрихкод используют и как UMI, и как MID. В некоторых вариантах осуществления штрихкод состоит из нескольких частей. Например, уникальная информация для идентифицирования состоит из последовательности штрихкода и последовательности конца нуклеиновой кислоты. В некоторых вариантах осуществления штрихкод состоит из нескольких подкодов, как описано в публикации патентной заявки США № 20200109397 "Modular Nucleic Acid Adaptors".[00112] In some embodiments, a nucleic acid molecule to be sequenced includes a UMI and a MID. In some embodiments, a single barcode is used as both a UMI and a MID. In some embodiments, a barcode consists of multiple parts. For example, the unique identification information consists of a barcode sequence and a nucleic acid end sequence. In some embodiments, a barcode consists of multiple subcodes, as described in U.S. Patent Application Publication No. 20200109397, " Modular Nucleic Acid Adaptors ."
[00113] В некоторых вариантах осуществления каждый штрихкод содержит заранее определенную последовательность. В других вариантах осуществления штрихкод содержит случайную последовательность. Штрихкоды имеют длину приблизительно 4-20 оснований таким образом, что к геномному образцу человека можно добавлять от 96 до 384 разных адаптеров, каждый из которых содержит иную пару идентичных штрихкодов. В некоторых вариантах осуществления количество UMI в реакции может быть с избытком количества молекул, подлежащих мечению. Специалисту в этой области будет понятно, что количество штрихкодов зависит от сложности образца (т.е. ожидаемого количества уникальных целевых молекул), и он может конструировать подходящее количество штрихкодов подходящей длины для каждого эксперимента.[00113] In some embodiments, each barcode comprises a predetermined sequence. In other embodiments, the barcode comprises a random sequence. The barcodes are approximately 4-20 bases long, such that between 96 and 384 different adapters, each containing a different pair of identical barcodes, can be added to a human genomic sample. In some embodiments, the number of UMIs in a reaction can be in excess of the number of molecules to be labeled. One skilled in the art will appreciate that the number of barcodes depends on the complexity of the sample (i.e., the expected number of unique target molecules), and can design an appropriate number of barcodes of an appropriate length for each experiment.
[00114] В некоторых вариантах осуществления настоящее изобретение включает стадию лигирования. Согласно способам, широко известным в этой области (Sambrook et al., Molecular Cloning, A Laboratory Manual, 4th Ed. Cold Spring Harbor Lab Press (2012)), фермент лигаза катализирует присоединение остатка 5’-фосфата (5’-конца) к остатку 3′-гидроксила (3’-концу). При присоединении образуется ковалентная связь, обозначаемая как фосфодиэфирная связь между концами нуклеиновых кислот. Лигирование катализируется одноцепочечной или двухцепочечной ДНК-лигазой, например, одноцепочечной ДНК-лигазой, такой как лигаза оцДНК CircLigase™ (Epicentre Biotechnologies, Madison, Wisc. или Lucigen, Middleton, Wisc.), или двухцепочечной ДНК-лигазой, выбранной из ДНК-лигазы T3, ДНК-лигазы T4, ДНК-лигазы T7, ДНК-лигазы E. coli или любого другого фермента, способного эффективно катализировать образование фосфодиэфирных связей между двумя нуклеиновыми кислотами.[00114] In some embodiments, the present invention includes a ligation step. According to methods well known in the art (Sambrook et al ., Molecular Cloning, A Laboratory Manual , 4th Ed. Cold Spring Harbor Lab Press (2012)), a ligase enzyme catalyzes the addition of a 5'-phosphate residue (5'-end) to a 3'-hydroxyl residue (3'-end). The addition forms a covalent bond, referred to as a phosphodiester bond, between the ends of the nucleic acids. The ligation is catalyzed by a single-stranded or double-stranded DNA ligase, such as a single-stranded DNA ligase such as CircLigase™ ssDNA ligase (Epicentre Biotechnologies, Madison, Wisc. or Lucigen, Middleton, Wisc.), or a double-stranded DNA ligase selected from T3 DNA ligase, T4 DNA ligase, T7 DNA ligase, E. coli DNA ligase, or any other enzyme capable of efficiently catalyzing the formation of phosphodiester bonds between two nucleic acids.
[00115] В некоторых вариантах осуществления остаток 5′-фосфата от природы присутствует в продуктах расщепления эндонуклеазами целевой нуклеиновой кислоты. В некоторых вариантах осуществления остаток 5′-фосфата добавляют к расщепленной экзонуклеазами целевой нуклеиновой кислоте или адаптерному олигонуклеотиду. Добавление 5′-фосфата можно осуществлять в отношении фрагмента ферментативно, например, с помощью полинуклеотидкиназы, такой как полинуклеотидкиназа T4.[00115] In some embodiments, the 5'-phosphate residue is naturally present in the products of endonuclease cleavage of a target nucleic acid. In some embodiments, the 5'-phosphate residue is added to the exonuclease-cleaved target nucleic acid or adapter oligonucleotide. The addition of the 5'-phosphate can be performed on the fragment enzymatically, for example, using a polynucleotide kinase, such as T4 polynucleotide kinase.
[00116] В некоторых вариантах осуществления способ включает образование библиотеки, содержащей две или более нуклеиновые кислоты из образца. Например, библиотека может состоять из множества разных нуклеиновых кислот, конъюгированных с адаптерами, содержащими элементы, необходимые для манипуляций с библиотекой, включая участки связывания универсального праймера для амплификации, участки связывания универсального праймера для секвенирования, уникальные штрихкоды или штрихкоды для идентификации образцов. Библиотека нуклеиновых кислот готова для секвенирования или другого типа способа детекции, например, ПЦР. Библиотеку можно хранить и аликвоты библиотеки можно использовать для множества раундов анализа.[00116] In some embodiments, the method includes forming a library comprising two or more nucleic acids from a sample. For example, the library may consist of a plurality of different nucleic acids conjugated to adapters comprising elements necessary for manipulation of the library, including universal primer binding sites for amplification, universal primer binding sites for sequencing, unique barcodes, or barcodes for identifying samples. The nucleic acid library is ready for sequencing or another type of detection method, such as PCR. The library may be stored and aliquots of the library may be used for multiple rounds of analysis.
[00117] В некоторых вариантах осуществления нуклеиновые кислоты в образце содержат все нуклеиновые кислоты, исходно обнаруживаемые в образце, полученном из организма, индивидуума (например, пациента) или окружающей среды. В некоторых вариантах осуществления нуклеиновые кислоты в образце обогащены. В некоторых вариантах осуществления обогащение осуществляют посредством удаления, например, захвата и удаления повторяющихся последовательностей или находящихся в избытке последовательностей или транскриптов из генома организма (или индивидуума) (например, последовательностей Alu человека, последовательностей глобина млекопитающих или последовательностей рРНК, присутствующих во всех клеточных организмах). В некоторых вариантах осуществления обогащение осуществляют посредством захвата и удержания интересующих последовательностей. В некоторых вариантах осуществления используют оба способа обогащения, например, сначала удаляют повторяющиеся или избыточные последовательности для облегчения или улучшения последующего захвата интересующих последовательностей из образца. Для обогащения зонды для захвата могут находиться свободно в растворе или фиксированными на твердой подложке.[00117] In some embodiments, the nucleic acids in the sample comprise all of the nucleic acids originally found in the sample obtained from the organism, individual (e.g., patient), or environment. In some embodiments, the nucleic acids in the sample are enriched. In some embodiments, enrichment is accomplished by removing, such as capturing and removing, repetitive sequences or abundant sequences or transcripts from the organism's (or individual's) genome (e.g., human Alu sequences, mammalian globin sequences, or rRNA sequences present in all cellular organisms). In some embodiments, enrichment is accomplished by capturing and retaining sequences of interest. In some embodiments, both enrichment methods are used, such as first removing repetitive or redundant sequences to facilitate or improve subsequent capture of sequences of interest from the sample. For enrichment, the capture probes may be free in solution or fixed to a solid support.
[00118] В некоторых вариантах осуществления в обогащении посредством захвата используют адаптеры, лигированные с целевыми нуклеиновыми кислотами, как представлено в настоящем описании. В рамках изобретения адаптер лигируют с целевой нуклеиновой кислотой, специфически эксцизированной с помощью специфической для последовательности нуклеазы (например, эндонуклеазы рестрикции или эндонуклеазы CRISPR). Адаптер служит в качестве зонда для захвата, и с помощью него отделяют целевые нуклеиновые кислоты от образца, таким образом, обогащая целевую нуклеиновую кислоту.[00118] In some embodiments, enrichment by capture uses adapters ligated to target nucleic acids as described herein. As part of the invention, an adapter is ligated to a target nucleic acid that has been specifically excised using a sequence-specific nuclease (e.g., a restriction endonuclease or a CRISPR endonuclease). The adapter serves as a capture probe and separates the target nucleic acids from the sample, thereby enriching the target nucleic acid.
[00119] В некоторых вариантах осуществления длина захваченной нуклеиновой кислоты составляет 1, 10, 50 т.п.н. или более.[00119] In some embodiments, the length of the captured nucleic acid is 1, 10, 50 kb, or more.
[00120] В некоторых вариантах осуществления настоящее изобретение относится к способу обогащения нуклеиновой кислоты из образца, содержащего целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, включающему: приведение двухцепочечной целевой нуклеиновой кислоты, имеющей 3’-конец, в контакт с катализатором, обладающим 3’-5’-экзонуклеазной активностью, и, таким образом, получение первого липкого 5’-конца на первом 5’-конце и первого углубленного 3’-конца; приведение нуклеиновой кислоты в контакт с адаптером, имеющим второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом, и таким образом, получение гибрида между первым и вторым 5’-липкими концами; где адаптер дополнительно содержит функциональный фрагмент захвата; связывание по меньшей мере одного из первого 3’-конца со вторым 5’-концом и, таким образом, получение снабженной адаптером нуклеиновой кислоты; и захват функционального фрагмента захвата на адаптере и, таким образом, обогащение целевых нуклеиновых кислот из образца.[00120] In some embodiments, the present invention relates to a method of enriching a nucleic acid from a sample comprising a target nucleic acid and non-target nucleic acids, comprising: contacting a double-stranded target nucleic acid having a 3' end with a catalyst having a 3'-5' exonuclease activity, thereby producing a first 5' overhang at the first 5' end and a first 3' recessed end; contacting the nucleic acid with an adaptor having a second 5' overhang at a second 5' end, a second 5' overhang capable of hybridizing to the first 5' overhang, thereby producing a hybrid between the first and second 5' overhangs; wherein the adaptor further comprises a functional capture moiety; linking at least one of the first 3'-end to the second 5'-end and thereby obtaining an adapter-equipped nucleic acid; and capturing a functional capture moiety on the adapter and thereby enriching target nucleic acids from the sample.
[00121] В случае обогащения зонд для захвата может содержать функциональный фрагмент захвата. Функциональный фрагмент захвата может являться любым функциональным фрагментом, способным специфически взаимодействовать с другой молекулой захвата. Пары "функциональные фрагменты для захвата-молекула захвата" включают авидин (стрептавидин)-биотин, антиген-антитело, магнитная (парамагнитная) частица-магнит или олигонуклеотид-комплементарный олигонуклеотид. Молекула захвата может быть связана с твердой подложкой таким образом, что любая нуклеиновая кислота, на которой находится функциональный фрагмент захвата, захватывается на твердой подложке и отделяется от остальной части образца или реакционной смеси. В некоторых вариантах осуществления молекула захвата содержит функциональный фрагмент захвата для вторичной молекулы захвата. Например, функциональный фрагмент захвата может являться олигонуклеотидом, комплементарным олигонуклеотиду захвата (молекула захвата). Олигонуклеотид захвата может являться биотинилированной и захватываться на стрептавидиновой бусине. В некоторых вариантах осуществления лигированную с адаптером нуклеиновую кислоту обогащают посредством захвата функционального фрагмента захвата и отделения лигированных с адаптером целевых нуклеиновых кислот от нелигированных нуклеиновых кислот в образце.[00121] If enriched, the capture probe may comprise a functional capture moiety. The functional capture moiety may be any functional moiety capable of specifically interacting with another capture molecule. Functional capture moieties-capture molecule pairs include avidin (streptavidin)-biotin, antigen-antibody, magnetic (paramagnetic) particle-magnet, or oligonucleotide-complementary oligonucleotide. The capture molecule may be linked to a solid support such that any nucleic acid on which the functional capture moiety is located is captured on the solid support and separated from the rest of the sample or reaction mixture. In some embodiments, the capture molecule comprises a functional capture moiety for a secondary capture molecule. For example, the functional capture moiety may be an oligonucleotide complementary to the capture oligonucleotide (capture molecule). The capture oligonucleotide may be biotinylated and captured on a streptavidin bead. In some embodiments, the adapter-ligated nucleic acid is enriched by capturing the functional capture moiety and separating the adapter-ligated target nucleic acids from unligated nucleic acids in the sample.
[00122] В некоторых вариантах осуществления способ включает секвенирование нуклеиновой кислоты, снабженной адаптером, способами, представленными в настоящем описании. Можно использовать любую из ряда технологий секвенирования или анализов секвенирования. В рамках изобретения термин "секвенирование нового поколения (NGS)" относится к способам секвенирования, делающим возможным массивное параллельное секвенирование отдельных молекул или клонально амплифицированных отдельных молекул.[00122] In some embodiments, the method comprises sequencing the nucleic acid provided with the adapter using the methods described herein. Any of a number of sequencing technologies or sequencing assays can be used. As used herein, the term "next generation sequencing (NGS)" refers to sequencing methods that enable massively parallel sequencing of single molecules or clonally amplified single molecules.
[00123] Неограничивающие примеры анализов последовательности, пригодных для использования в способах, представленных в настоящем описании включают нанопоровое секвенирование (патентные публикации США №№ 2013/0244340, 2013/0264207, 2014/0134616, 2015/0119259 и 2015/0337366), секвенирование по Сэнгеру, капиллярное секвенирование, термоциклическое секвенирование (Sears et al., Biotechniques, 13:626-633 (1992)), твердофазное секвенирование (Zimmerman et al., Methods Mol. Cell Biol., 3:39-42 (1992)), секвенирование с масс-спектрометрией, такое как времяпролетная масс-спектрометрия с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF/MS; Fu et al., Nature Biotech., 16:381-384 (1998)), секвенирование посредством гибридизации (Drmanac et al., Nature Biotech., 16:54-58 (1998)) и способы NGS, включая, в качестве неограничивающих примеров, секвенирование посредством синтеза (например, HiSeq™, MiSeq™ или Genome Analyzer, каждое из которых доступно в Illumina), секвенирование посредством лигирования (например, SOLiD™, Life Technologies), ионное полупроводниковое секвенирование (например, Ion Torrent™, Life Technologies) и секвенирование SMRT® (например, Pacific Biosciences).[00123] Non-limiting examples of sequence assays suitable for use in the methods provided herein include nanopore sequencing (U.S. Patent Publication Nos. 2013/0244340, 2013/0264207, 2014/0134616, 2015/0119259, and 2015/0337366), Sanger sequencing, capillary sequencing, thermal cycling sequencing (Sears et al., Biotechniques , 13:626-633 (1992)), solid-phase sequencing (Zimmerman et al., Methods Mol. Cell Biol ., 3:39-42 (1992)), sequencing with mass spectrometry, such as time-of-flight mass spectrometry, matrix-assisted laser desorption/ionization time of flight (MALDI-TOF/MS; Fu et al., Nature Biotech ., 16:381-384 (1998)), hybridization-mediated sequencing (Drmanac et al ., Nature Biotech ., 16:54-58 (1998)) and NGS methods including, but not limited to, sequencing-by-synthesis (e.g., HiSeq™, MiSeq™ or Genome Analyzer, each available from Illumina), ligation-mediated sequencing (e.g., SOLiD™, Life Technologies), ion semiconductor sequencing (e.g., Ion Torrent™, Life Technologies) and SMRT® sequencing (e.g., Pacific Biosciences).
[00124] Коммерчески доступные технологии секвенирования включают платформы для секвенирования посредством гибридизации от Affymetrix Inc. (Sunnyvale, Calif.), платформы для секвенирования посредством синтеза от Illumina/Solexa (San Diego, Calif.) и Helicos Biosciences (Cambridge, Mass.), платформу для секвенирования посредством лигирования от Applied Biosystems (Foster City, Calif.). Другие технологии секвенирования включают, в качестве неограничивающих примеров, технологию Ion Torrent (ThermoFisher Scientific, Waltham, Mass.), секвенирование одномолекулярного секвенирования в реальном времени (SMRT®) (Pacific Biosciences, Menlo Park, Calif.) и нанопоровое секвенирование (Genia/Stratos Technology от Roche Sequencing Solutions, Santa Clara, Calif.) и Oxford Nanopore Technologies (Oxford, UK). [00124] Commercially available sequencing technologies include hybridization-based sequencing platforms from Affymetrix Inc. (Sunnyvale, Calif.), synthesis-based sequencing platforms from Illumina/Solexa (San Diego, Calif.) and Helicos Biosciences (Cambridge, Mass.), and a ligation-based sequencing platform from Applied Biosystems (Foster City, Calif.). Other sequencing technologies include, but are not limited to, Ion Torrent technology (ThermoFisher Scientific, Waltham, Mass.), single-molecule real-time (SMRT®) sequencing (Pacific Biosciences, Menlo Park, Calif.), and nanopore sequencing (Genia/Stratos Technology from Roche Sequencing Solutions, Santa Clara, Calif.) and Oxford Nanopore Technologies (Oxford, UK).
[00125] В некоторых вариантах осуществления стадия секвенирования включает выравнивание последовательности и определение консенсуса. В некоторых вариантах осуществления консенсусную последовательность определяют из множества последовательностей, все из которых имеют идентичный UMI. Секвенированные последовательности, имеющие идентичный UMI, считают происходящими из одной исходной молекулы в результате амплификации. В других вариантах осуществления UMI используют для устранения артефактов, т.е. вариаций, существующих в потомстве одной молекулы (отличающемся конкретным UMI). Такие артефакты, являющиеся результатом ошибок ПЦР или ошибок секвенирования, можно устранять с помощью UMI.[00125] In some embodiments, the sequencing step includes aligning the sequence and determining a consensus. In some embodiments, the consensus sequence is determined from a plurality of sequences that all have an identical UMI. Sequences that have an identical UMI are considered to be derived from a single parent molecule as a result of amplification. In other embodiments, the UMI is used to eliminate artifacts, i.e., variations that exist in the progeny of a single molecule (distinguished by a particular UMI). Such artifacts, which are the result of PCR errors or sequencing errors, can be eliminated using the UMI.
[00126] В некоторых вариантах осуществления количество или репрезентацию каждой последовательности в образце можно количественно анализировать посредством подсчета относительных количеств последовательностей с каждым UMI среди популяции, имеющей один и тот же мультиплексный ID образца (MID). Специалист в этой области может определять количество ридов последовательностей на UMI ("глубину последовательности"), необходимое для определения консенсусной последовательности. В некоторых вариантах осуществления желаемая глубина составляет 5-50 ридов на UMI.[00126] In some embodiments, the amount or representation of each sequence in a sample can be quantitatively analyzed by counting the relative amounts of sequences at each UMI among a population having the same multiplex sample ID (MID). One of skill in the art can determine the number of sequence reads per UMI ("sequence depth") required to determine a consensus sequence. In some embodiments, the desired depth is 5-50 reads per UMI.
[00127] Пригодность адаптеров и праймеров для амплификации для встраивания дополнительных элементов в библиотеку нуклеиновых кислот, подлежащих секвенированию, описана, например, в патентах США №№ 9476095; 9260753; 8822150; 8563478; 7741463; 8182989 и 8053192.[00127] The utility of adapters and amplification primers for introducing additional elements into a nucleic acid library to be sequenced is described, for example, in U.S. Patent Nos. 9,476,095; 9,260,753; 8,822,150; 8,563,478; 7,741,463; 8,182,989; and 8,053,192.
[00128] В некоторых вариантах осуществления настоящее изобретение относится к способу секвенирования целевой нуклеиновой кислоты в образце, содержащем целевую нуклеиновую кислоту и нецелевые нуклеиновые кислоты, включающему: приведение двухцепочечной целевой нуклеиновой кислоты, имеющей 3’-конец, в контакт с катализатором, обладающим 3’-5’-экзонуклеазной активностью, и, таким образом, получение первого липкого 5’-конца на первом 5’-конце и первого углубленного 3’-конца; приведение нуклеиновой кислоты в контакт с адаптером, имеющим второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом и, таким образом, образующий гибрид между первым и вторым 5’-липкими концами; связывание по меньшей мере одного из первого 3’-конца со вторым 5’-концом и, таким образом, получение снабженной адаптером нуклеиновой кислоты; и секвенирование снабженной адаптером нуклеиновой кислоты.[00128] In some embodiments, the present invention relates to a method of sequencing a target nucleic acid in a sample comprising the target nucleic acid and non-target nucleic acids, comprising: contacting a double-stranded target nucleic acid having a 3' end with a catalyst having 3'-5' exonuclease activity, thereby producing a first 5' overhang at the first 5' end and a first 3' recessed end; contacting the nucleic acid with an adapter having a second 5' overhang at a second 5' end, the second 5' overhang capable of hybridizing to the first 5' overhang and thereby forming a hybrid between the first and second 5' overhangs; linking at least one of the first 3'-end to the second 5'-end and thereby obtaining an adapter-equipped nucleic acid; and sequencing the adapter-equipped nucleic acid.
[00129] В некоторых вариантах осуществления длина захваченной и секвенированной нуклеиновой кислоты составляет 1, 10, 50 т.п.н. или более. Недавний прогресс в нанопоровом секвенирование делает возможным считывание 5-20 т.п.н. мишеней, когда мишени подвергнуты эксцизии с помощью эндонуклеазы Cas9 CRISPR и захвачены с помощью получения dA-хвоста и лигирования адаптера, см. брошюру к набору для секвенирования Cas9, кат. № SQK-CS9109 от Oxford Nanopore (Oxford, UK). Технология секвенирования позволяет считывать последовательности более 50 т.п.н.; однако такие последовательности не захватываются способом получения dA-хвоста и лигирования, вместо этого, их захватывают с помощью направляемой транспозазой инсерции адаптеров (тагментации), см. брошюру к набору для секвенирования ультрадлинной ДНК, кат. № SQK-ULK0001 от Oxford Nanopore. Показано, что настоящее изобретение является более эффективным и специфичным, чем способ получения dA-хвоста, и, таким образом, с помощью него можно обеспечивать секвенирование коротких матриц для секвенирования, а также матриц длиннее 20 т.п.н.[00129] In some embodiments, the length of the captured and sequenced nucleic acid is 1 kb, 10 kb, 50 kb, or more. Recent advances in nanopore sequencing allow reads of 5-20 kb targets when the targets are excised with Cas9 CRISPR endonuclease and captured by dA tailing and adapter ligation, see Cas9 Sequencing Kit Brochure, Cat. No. SQK-CS9109 from Oxford Nanopore (Oxford, UK). The sequencing technology allows reads of sequences greater than 50 kb; However, such sequences are not captured by the dA tailing and ligation method, but are instead captured by transposase-directed insertion of adaptors (tagmentation), see the Ultra Long DNA Sequencing Kit brochure, Cat. No. SQK-ULK0001 from Oxford Nanopore. The present invention has been shown to be more efficient and specific than the dA tailing method, and thus can be used to sequence short sequencing templates as well as templates longer than 20 kb.
[00130] В некоторых вариантах осуществления настоящее изобретение включает стадию амплификации. Снабженные адаптером нуклеиновые кислоты, полученные способом, представленным в настоящем описании, можно амплифицировать, например, перед секвенированием или любой другой последующей стадией анализа. Стадия амплификация может включать линейную или экспоненциальную амплификацию, например, ПЦР. Амплификация может являться изотермической или включать термоциклирование. В некоторых вариантах осуществления амплификация является экспоненциальной и включает ПЦР или любой из ее вариантов, включая ПЦР в реальном времени, цифровую капельную ПЦР (ddPCR), эмульсионную ПЦР и т.п.[00130] In some embodiments, the present invention includes an amplification step. The adapter-equipped nucleic acids produced by the method described herein can be amplified, for example, prior to sequencing or any other subsequent analysis step. The amplification step can include linear or exponential amplification, such as PCR. The amplification can be isothermal or include thermal cycling. In some embodiments, the amplification is exponential and includes PCR or any of its variants, including real-time PCR, digital droplet PCR (ddPCR), emulsion PCR, and the like.
[00131] В некоторых вариантах осуществления используют универсальный праймер, т.е. праймер, гибридизующийся с участком связывания универсального праймера, присутствующим на всех нуклеиновых кислотах в образце. В некоторых вариантах осуществления участок связывания универсального праймера находится в адаптере, полученном по настоящему изобретению. В некоторых вариантах осуществления участок связывания универсального праймера добавляют посредством удлинения праймера, гибридизующегося с адаптером или целевой нуклеиновой кислотой и содержащего участок связывания универсального праймера в негибридизующейся 5’-области праймера. Все нуклеиновые кислоты, имеющие участок связывания универсального праймера, можно амплифицировать с использованием одного и того же универсального праймера. Количество циклов амплификации, в которых используют универсальные праймеры, может являться низким, но также может составлять 10, 20 или даже 30 или более циклов, в зависимости от количества продукта амплификации, необходимого для последующих стадий. Т.к. амплификация с использованием универсальных праймеров имеет сниженное отклонение последовательности, количество циклов амплификации может не быть ограниченным по причине проблемы отклонения амплификации.[00131] In some embodiments, a universal primer is used, i.e., a primer that hybridizes to a universal primer binding site present on all nucleic acids in a sample. In some embodiments, the universal primer binding site is in an adapter produced according to the present invention. In some embodiments, the universal primer binding site is added by extending a primer that hybridizes to the adapter or the target nucleic acid and contains the universal primer binding site in the non-hybridizing 5' region of the primer. All nucleic acids having a universal primer binding site can be amplified using the same universal primer. The number of amplification cycles in which universal primers are used can be low, but can also be 10, 20, or even 30 or more cycles, depending on the amount of amplification product needed for subsequent steps. Since Amplification using universal primers has reduced sequence bias, the number of amplification cycles may not be limited due to the problem of amplification bias.
[00132] В некоторых вариантах осуществления обратный праймер спарен с первым универсальным праймером. Обратный праймер конструируют для гибридизации с целевой нуклеиновой кислотой с цепью, противоположной цепи, с которой гибридизуется первый универсальный праймер. В некоторых вариантах осуществления конструируют более одного обратного праймера для оптимальной амплификации снабженной адаптером нуклеиновой кислоты (см. фиг. 2, где показан пример с четырьмя обратными праймерами rv-1, rv-2, rv-3 и rv-4.). В некоторых вариантах осуществления обратный праймер содержит участок связывания второго универсального праймера. Второй универсальный праймер может являться тем же или отличаться от первого универсального праймера. В некоторых вариантах осуществления после одного раунда или ограниченного количества раундов амплификации с обратным праймером, для амплификации можно использовать только второй универсальный праймер, спаренный с первым универсальным праймером.[00132] In some embodiments, a reverse primer is paired with a first universal primer. The reverse primer is designed to hybridize to a target nucleic acid on a strand opposite to the strand to which the first universal primer hybridizes. In some embodiments, more than one reverse primer is designed to optimally amplify the adapter-equipped nucleic acid (see Fig. 2 for an example with four reverse primers rv-1, rv-2, rv-3, and rv-4). In some embodiments, the reverse primer comprises a binding site for a second universal primer. The second universal primer may be the same or different from the first universal primer. In some embodiments, after one round or a limited number of rounds of amplification with the reverse primer, only the second universal primer paired with the first universal primer may be used for amplification.
[00133] В некоторых вариантах осуществления настоящее изобретение относится к набору для обогащения нуклеиновой кислоты из образца способом по настоящему изобретению. Набор содержит по меньшей мере катализатор, обладающий 3’-5’-экзонуклеазной активностью и способный образовывать липкий 5’-конец в нуклеиновых кислотах; адаптер, сконструированный так, чтобы иметь липкий 5’-конец на 5’-конце, липкий 5’-конец, способный гибридизоваться с липким 5’-концом, ожидаемым в целевой нуклеиновой кислоте после обработки катализатором; и ДНК-лигазу. Набор дополнительно может содержать полинуклеотидкиназу.[00133] In some embodiments, the present invention relates to a kit for enriching a nucleic acid from a sample using the method of the present invention. The kit comprises at least a catalyst having 3'-5' exonuclease activity and capable of forming a 5' sticky end in nucleic acids; an adapter designed to have a 5' sticky end at the 5' end, a 5' sticky end capable of hybridizing to a 5' sticky end expected in a target nucleic acid after treatment with the catalyst; and a DNA ligase. The kit may further comprise a polynucleotide kinase.
[00134] Адаптер в наборе может являться одноцепочечным (т.е. иметь один 5’-конец) или двухцепочечным и иметь углубленный 3’-конец на конце с липким 5’-концом.[00134] The adapter in the kit may be single-stranded (i.e., have one 5' end) or double-stranded and have a recessed 3' end at the end with a sticky 5' end.
[00135] Как представлено в настоящем описании, в некоторых вариантах осуществления катализатор, обладающий 3’-5’-экзонуклеазной активностью, является ДНК-полимеразой, такой как полимераза семейства A, полимераза семейства B или полимераза семейства C, содержащие домены Exo I, Exo II и Exo III фрагмента Кленова Pol I E. coli; или ДНК-полимеразой, содержащей остатки аспартата, соответствующие остаткам D355, D424 и D501 фрагмента Кленова Pol I E. coli, или ДНК-полимераза выбрана из группы, состоящей из ДНК-полимеразы T4, ДНК-полимеразы RB69, фрагмента Кленова, ДНК-полимеразы T7, фрагмента дельта Pol III E. coli, эукариотической полимеразы эпсилон, эукариотической полимеразы дельта и митохондриальной полимеразы гамма.[00135] As provided herein, in some embodiments, the catalyst having 3'-5' exonuclease activity is a DNA polymerase, such as a family A polymerase, a family B polymerase, or a family C polymerase comprising the Exo I, Exo II, and Exo III domains of the Klenow fragment of Pol I.E. coli; or a DNA polymerase containing aspartate residues corresponding to residues D355, D424, and D501 of the Klenow fragment of Pol IE. coli, or the DNA polymerase is selected from the group consisting of T4 DNA polymerase, RB69 DNA polymerase, Klenow fragment, T7 DNA polymerase, fragment delta Pol IIIE. coli, eukaryotic polymerase epsilon, eukaryotic polymerase delta and mitochondrial polymerase gamma.
[00136] В некоторых вариантах осуществления набор дополнительно содержит один или более из dATP, dCTP, dGTP и dTTP.[00136] In some embodiments, the kit further comprises one or more of dATP, dCTP, dGTP, and dTTP.
[00137] В некоторых вариантах осуществления липкий 5’-конец в адаптере имеет длину 2-15 нуклеотидов. В некоторых вариантах осуществления адаптер содержит по меньшей мере один из штрихкода нуклеиновой кислоты, участка связывания праймера для секвенирования и участка связывания праймера для амплификации. Штрихкод может являться уникальным молекулярным ID (UMI) и ID образца (SID). Адаптер может содержать модификацию нуклеиновой кислоты, повышающую температуру плавления дуплекса нуклеиновой кислоты, включающего модификацию. В некоторых вариантах осуществления адаптер связан с функциональным фрагментом захвата, выбранным из биотина, антигена, способного связываться с антителом захвата, и последовательности захвата, способной гибридизоваться с нуклеиновой кислотой захвата.[00137] In some embodiments, the 5' sticky end in the adapter is 2-15 nucleotides in length. In some embodiments, the adapter comprises at least one of a nucleic acid barcode, a sequencing primer binding region, and an amplification primer binding region. The barcode can be a unique molecular ID (UMI) and a sample ID (SID). The adapter can comprise a nucleic acid modification that increases the melting temperature of a nucleic acid duplex comprising the modification. In some embodiments, the adapter is linked to a functional capture moiety selected from biotin, an antigen capable of binding to a capture antibody, and a capture sequence capable of hybridizing to a capture nucleic acid.
[00138] В некоторых вариантах осуществления набор включает реагенты для амплификации нуклеиновых кислот, такие как праймер, способный отжигаться с участком связывания праймера в адаптере (универсальный праймер).[00138] In some embodiments, the kit includes reagents for amplifying nucleic acids, such as a primer capable of annealing to a primer binding site in an adapter (universal primer).
[00139] В некоторых вариантах осуществления набор включает реагенты для секвенирования нуклеиновые кислоты, такие как праймер для секвенирования, способный отжигаться на участке связывания праймера в адаптере.[00139] In some embodiments, the kit includes reagents for sequencing nucleic acids, such as a sequencing primer capable of annealing to a primer binding site in an adapter.
[00140] В некоторых вариантах осуществления набор дополнительно содержит инструкции по осуществлению способа захвата подвергнутой эксцизии нуклеиновой кислоты способом, представленным в настоящем описании.[00140] In some embodiments, the kit further comprises instructions for performing a method of capturing excised nucleic acid using the method described herein.
[00141] В некоторых вариантах осуществления настоящее изобретение относится к реакционной смеси для обогащения нуклеиновой кислоты из образца. Реакционная смесь содержит двухцепочечную целевую нуклеиновую кислоту, имеющую 3’-конец; катализатор, обладающий 3’-5’-экзонуклеазной активностью, способный образовывать первый липкий 5’-конец на первом 5’-конце и первый углубленный 3’-конец в целевой нуклеиновой кислоте; и адаптер, имеющий второй липкий 5’-конец на втором 5’-конце, второй липкий 5’-конец, способный гибридизоваться с первым липким 5’-концом. Реакционная смесь может дополнительно содержать ДНК-лигазу.[00141] In some embodiments, the present invention relates to a reaction mixture for enriching a nucleic acid from a sample. The reaction mixture comprises a double-stranded target nucleic acid having a 3' end; a catalyst having 3'-5' exonuclease activity, capable of forming a first 5' sticky end at a first 5' end and a first recessed 3' end in the target nucleic acid; and an adapter having a second 5' sticky end at a second 5' end, the second 5' sticky end capable of hybridizing with the first 5' sticky end. The reaction mixture may further comprise a DNA ligase.
[00142] В некоторых вариантах осуществления двухцепочечная целевая нуклеиновая кислота имеет длину 1, 10 или 100 т.п.н.[00142] In some embodiments, the double-stranded target nucleic acid is 1, 10, or 100 kb in length.
[00143] 3’-конец двухцепочечной целевой нуклеиновой кислоты в реакционной смеси может являться частью тупого конца. 3’-конец двухцепочечной целевой нуклеиновой кислоты может являться частью липкого 3’-конца. 3’-конец двухцепочечной целевой нуклеиновой кислоты можно получать посредством расщепления нуклеиновой кислоты с помощью специфической для последовательности эндонуклеазы, такой как эндонуклеаза рестрикции, эндонуклеаза CRISPR, каталитически неактивная эндонуклеаза CRISPR, слитая с Fok I, нуклеаза на основе эффектора, подобного активатору транскрипции (TALEN), или слитый белок TALEN-Fok I или нуклеаза с цинковыми пальцами (ZFN) или слитый белок ZFN-Fok I.[00143] The 3' end of the double-stranded target nucleic acid in the reaction mixture may be part of a blunt end. The 3' end of the double-stranded target nucleic acid may be part of a 3' sticky end. The 3' end of the double-stranded target nucleic acid can be obtained by cleaving the nucleic acid with a sequence-specific endonuclease, such as a restriction endonuclease, a CRISPR endonuclease, a catalytically inactive CRISPR endonuclease fused to Fok I, a transcription activator-like effector nuclease (TALEN), or a TALEN-Fok I fusion protein, or a zinc finger nuclease (ZFN), or a ZFN-Fok I fusion protein.
[00144] Катализатор, обладающий 3’-5’-экзонуклеазной активностью в реакционной смесью может являться ДНК-полимеразой. ДНК-полимераза может являться полимеразой семейства A, полимеразой семейства B или полимеразой семейства C, содержащими домены Exo I, Exo II и Exo III фрагмента Кленова Pol I E. coli. ДНК-полимераза также может являться ДНК-полимеразой с остатками аспартата, соответствующими остаткам D355, D424 и D501 фрагмента Кленова Pol I E. coli. ДНК-полимераза может являться ДНК-полимеразой T4, ДНК-полимеразой RB69, фрагментом Кленова, ДНК-полимеразой T7, фрагментом дельта Pol III E. coli, эукариотической полимеразой эпсилон, эукариотической полимеразой дельта и митохондриальной полимеразой гамма.[00144] The catalyst having 3'-5' exonuclease activity in the reaction mixture may be a DNA polymerase. The DNA polymerase may be a family A polymerase, a family B polymerase, or a family C polymerase containing the Exo I, Exo II, and Exo III domains of the Klenow fragment of Pol IE. coli. DNA polymerase may also be a DNA polymerase with aspartate residues corresponding to residues D355, D424, and D501 of the Pol I Klenow fragmentE. coli. DNA polymerase can be T4 DNA polymerase, RB69 DNA polymerase, Klenow fragment, T7 DNA polymerase, fragment delta Pol IIIE. coli, eukaryotic polymerase epsilon, eukaryotic polymerase delta and mitochondrial polymerase gamma.
[00145] В некоторых вариантах осуществления реакционная смесь также включает менее четырех из dATP, dCTP, dGTP и dTTP, например, три, два или только один dNTP.[00145] In some embodiments, the reaction mixture also includes less than four of dATP, dCTP, dGTP, and dTTP, such as three, two, or only one dNTP.
[00146] В некоторых вариантах осуществления адаптер является двухцепочечным и дополнительно содержит второй углубленный 3’-конец. В некоторых вариантах осуществления липкий 5’-конец имеет длину 2-15 нуклеотидов. Адаптер в реакционной смеси может содержать штрихкод нуклеиновой кислоты (например, уникальный молекулярный ID (UMI) или ID образца (SID)), участок связывания праймера для секвенирования и участок связывания праймера для амплификации. Адаптер может содержать модификацию нуклеиновой кислоты, повышающую температуру плавления дуплекса нуклеиновой кислоты, включающего модификацию. В некоторых вариантах осуществления адаптер связан с функциональным фрагментом захвата, выбранным из биотина, антигена, способного связываться с антителом захвата, и последовательности захвата, способной гибридизоваться с нуклеиновой кислотой захвата.[00146] In some embodiments, the adapter is double-stranded and further comprises a second recessed 3' end. In some embodiments, the overhanging 5' end is 2-15 nucleotides in length. The adapter in the reaction mixture may comprise a nucleic acid barcode (e.g., a unique molecular ID (UMI) or a sample ID (SID)), a sequencing primer binding site, and an amplification primer binding site. The adapter may comprise a nucleic acid modification that increases the melting temperature of a nucleic acid duplex comprising the modification. In some embodiments, the adapter is linked to a functional capture moiety selected from biotin, an antigen capable of binding to a capture antibody, and a capture sequence capable of hybridizing to a capture nucleic acid.
ПРИМЕРЫEXAMPLES
[00147] Пример 1. Получение реагентов [00147] Example 1. Obtaining reagents
[00148] Нуклеиновые кислоты: плазмидная и геномная ДНК. [00148] Nucleic acids: plasmid and genomic DNA.
[00149] Плазмиды 1 и 2 получали с помощью мини-набора Macherey-Nagel NucleoSpin Plasmide (доступного в Analytics Shop, Stockbridge, Ga.). Геномную ДНК человека получали с помощью набора Gentra Puregene (Qiagen, Germantown, Md.) из мононуклеарных клеток периферической крови человека. Геномную ДНК дефосфорилировали с помощью Quick CIP от New England Biolabs (NEB, Ipswich, Mass.) (кат. № #0525): 5 мкг ДНК инкубировали с 3 мкл QuickCIP при 37°C в течение 10 минут, затем 80°C в течение 2 минут в 1-кратном буфере NEB CutSmart®. Карта ДНК-мишени показана на фигуре 2.[00149] Plasmids 1 and 2 were prepared using the Macherey-Nagel NucleoSpin Plasmide Mini Kit (available from the Analytics Shop, Stockbridge, Ga.). Human genomic DNA was prepared using the Gentra Puregene kit (Qiagen, Germantown, Md.) from human peripheral blood mononuclear cells. Genomic DNA was dephosphorylated using Quick CIP from New England Biolabs (NEB, Ipswich, Mass.) (cat. #0525): 5 μg DNA was incubated with 3 μl QuickCIP at 37°C for 10 min, then 80°C for 2 min in 1× NEB CutSmart® buffer. The target DNA map is shown in Figure 2.
[00150] Последовательность плазмид P1 и P2 отличается от геномной области тем, что 1) они не содержат последовательности, распознаваемые гидовыми Cr-C и Cr-D, или участки связывания праймеров rv-3 и rv-4; и 2) они содержат вставку размером 574 или 2147 п.н., соответственно, между участками гидовых Cr и участками праймеров rv, определяющую длину образующихся ампликонов.[00150] The sequence of plasmids P1 and P2 differs from the genomic region in that 1) they do not contain sequences recognized by the Cr-C and Cr-D guides or the rv-3 and rv-4 primer binding sites; and 2) they contain an insert of 574 or 2147 bp, respectively, between the Cr guide sites and the rv primer sites that determines the length of the resulting amplicons.
[00151] Эндонуклеаза [00151] Endonuclease
[00152] Получение рибонуклеопротеинов (RNP) Cas9. cрРНК и tracрРНК (IDT, кат. № 1072532) растворяли в воде без нуклеаз при 100 мкМ. Комбинировали 1 мкл cрРНК (любой из Cr-A, B, C или D), 1 мкл tracрРНК и 8 мкл буфера для дуплекса IDT, затем нагревали до 95°C в течение 2 минут, затем позволяли охлаждаться до комнатной температуры со скоростью 0,1°C в секунду, получая 10 мкМ стока гидовых cr:tracr. Сток 500 нМ Cas9:1000 нМ гидового RNP получали посредством комбинирования 10 мкл буфера NEB CutSmart®, 79,2 мкл воды без нуклеазы, 10 мкл 10 мкМ гидовых RNP и 0,8 мкл 10 мг/мл (62 мкМ) белка Cas9, затем инкубировали при 37°C в течение 15 минут. Аликвоты хранили при -80°C.[00152] Preparation of Cas9 ribonucleoproteins (RNPs). cRNA and tracRNA (IDT Cat# 1072532) were dissolved in nuclease-free water at 100 μM. 1 μL of cRNA (any of Cr-A, B, C , or D ), 1 μL of tracRNA, and 8 μL of IDT duplex buffer were combined, then heated to 95°C for 2 min, then allowed to cool to room temperature at a rate of 0.1°C per second to yield a 10 μM cr:tracr guide stock. A 500 nM Cas9:1000 nM guide RNP stock was prepared by combining 10 µl NEB CutSmart® buffer, 79.2 µl nuclease-free water, 10 µl 10 µM guide RNPs, and 0.8 µl 10 mg/ml (62 µM) Cas9 protein, then incubated at 37°C for 15 min. Aliquots were stored at -80°C.
[00153] Адаптеры [00153] Adapters
[00154] Стоки адаптеров состояли из 5 мкМ каждого олигонуклеотида в воде. Аликвоты 100 мкл нагревали до 95°C в течение 2 минут, затем позволяли охлаждаться до комнатной температуры со скоростью 0,1°C в секунду, получая сток 5 мкМ адаптера. Адаптер для dA-хвоста получали из олигонуклеотидов dA-top и dA-bottom. Адаптеры CRISPR-LE получали из олигонуклеотида ABCD-top, спаренного с A-bot, B-bot, C-bot или D-bot, для получения специфических адаптеров для реакций с использованием гидовых Cr-A, Cr-B, Cr-C или Cr-D, соответственно.[00154] Adapter stocks consisted of 5 μM of each oligonucleotide in water. Aliquots of 100 μL were heated to 95 °C for 2 min, then allowed to cool to room temperature at a rate of 0.1 °C per second, yielding a stock of 5 μM adapter. The dA-tail adapter was prepared from the dA-top and dA-bottom oligonucleotides. CRISPR-LE adapters were prepared from the ABCD-top oligonucleotide paired with A-bot , B-bot , C-bot , or D-bot to generate specific adapters for reactions using the Cr-A, Cr-B, Cr-C, or Cr-D guides, respectively.
[00155] Адаптер и концевые последовательности для каждого эксперимента приведены в таблице 1 и таблице 2. В таблице 2 дополнительно приведены dNTP, присутствующие в реакционной смеси для расщепления экзонуклеазами, останавливающие продолжение расщепления экзонуклеазами.[00155] The adapter and end sequences for each experiment are provided in Table 1 and Table 2. Table 2 additionally provides the dNTPs present in the exonuclease digestion reaction mixture that stop further exonuclease digestion.
[00156] Таблица 1. Эксперимент с получением dA-хвоста [00156] Table 1. Experiment with obtaining a dA tail
3’GTCTGTGAGTGTGATTATGAGCp5 5' CAGACACTCACACTAATACTCGT 3'
3' GTCGTGAGTGTGTTATGAGCp 5
SEQ ID NO: 6SEQ ID NO: 5/
SEQ ID NO:6
[00157] Таблица 1 (продолжение). Эксперимент с получением dA-хвоста [00157] Table 1 (continued). Experiment with obtaining a dA tail
3’ A AACCCCTC…5’ 5' pTTGGGGAG… 3'
3' AAACCCCTC … 5'
3’ A GTGACCGT…5’ 5' pCACTGGCA… 3'
3' A GTGACCGT… 5'
3’ A GCGTCCAC…5’ 5' pCGCAGGTG… 3'
3' A GCGTCCAC… 5'
3’ A CATTCCTC…5’ 5' pGTAAGGAG… 3'
3' A CATTCCTC… 5'
[00158] Таблица 2. Эксперимент с расщеплением нуклеазами [00158] Table 2. Nuclease digestion experiment
3’ GTCTGTGAGTGTGATTATGAGCAACCCCTCTp5 5' CAGACACTCACACTAATACTCG 3'
3' GTCTGTGAGTGTGATTATGAGCAACCCCTCTp 5
3’ GTCTGTGAGTGTGATTATGAGCGTGAp5’ 5' CAGACACTCACACTAATACTCG 3'
3' GTCTGTGAGTGTGATTATGAGCGTGAp 5'
3’ GTCTGTGAGTGTGATTATGAGCGCGTCCp5 5' CAGACACTCACACTAATACTCG 3'
3' GTCTGTGAGTGTGATTATGAGCGCGTCCp 5
3’ GTCTGTGAGTGTGATTATGAGCCATTCCTCp5 5' CAGACACTCACACTAATACTCG 3'
3' GTCTGTGAGTGTGATTATGAGCCATTCCTCp 5
[00159] Таблица 2 (продолжение). Эксперимент с расщеплением нуклеазами [00159] Table 2 (continued). Nuclease digestion experiment
3’GGTGA……5’ 5' pTTGGGGAGACCACT…… 3'
3' GGTGA…… 5'
3’CCGTAGACC ……5 5' pCACTGGCATCTGG …… 3'
3' CCGTAGACC …… 5
3’ ACAA ……5’ 5' pCGCAGGTGTT …… 3'
3' ACAA …… 5'
3’ GACGA ……5’ 5' pGTAAGGAGCTGCT …… 3'
3' GACGA …… 5'
[00160] Пример 2. Расщепление RNP и получение dA-хвоста (способ предшествующего уровня техники), используемые в отношении образцов плазмидной и геномной ДНК. [00160] Example 2. RNP cleavage and dA tailing (prior art method) used with plasmid and genomic DNA samples.
[00161] 200 нг плазмидной ДНК комбинировали с 5 мкл RNP (конечная концентрация 100 нМ), 1 мкл 10мкМ dATP, 1 мкл NEB Taq (кат. № M0273) в 1-кратном буфере CutSmart® всего в 25 мкл. Реакционные смеси инкубировали при 37°C в течение 15 минут, затем 72°C в течение 5 минут (для удаления Cas9 из целевой ДНК и добавления dA-хвоста с помощью Taq). Образцы очищали с помощью SPRI перед переходом к стадии лигирования. Способ был идентичен для образцов геномной ДНК, за исключением того, что 1 мкг фосфорилированной геномной ДНК заменяли 200 нг плазмидной ДНК. Результаты для плазмидной ДНК показаны на фигуре 3, а результаты для геномной ДНК показаны на фигуре 5.[00161] 200 ng of plasmid DNA was combined with 5 µl of RNP (final concentration 100 nM), 1 µl of 10 µM dATP, 1 µl of NEB Taq (Cat# M0273) in 1x CutSmart® buffer in a total of 25 µl. Reaction mixtures were incubated at 37°C for 15 minutes, then 72°C for 5 minutes (to remove Cas9 from the target DNA and add a dA tail with Taq). Samples were purified with SPRI before proceeding to the ligation step. The method was identical for genomic DNA samples except that 1 µg of phosphorylated genomic DNA was replaced with 200 ng of plasmid DNA. The results for plasmid DNA are shown in Figure 3, and the results for genomic DNA are shown in Figure 5.
[00162] Пример 3. Расщепление RNP и способ CRISPR-LE (по изобретению), используемые в отношении образцов плазмидной и геномной ДНК. [00162] Example 3. RNP cleavage and the CRISPR-LE method (according to the invention) used with respect to plasmid and genomic DNA samples.
[00163] 200 нг плазмидной ДНК комбинировали с 5 мкл RNP (конечная концентрация 100 нМ) в 1-кратном буфере CutSmart® всего в 25 мкл. Реакционные смеси инкубировали при 37°C в течение 15 минут, затем 72°C в течение 5 минут (для удаления Cas9 из целевой ДНК). ДНК очищали с помощью 0,8 объема SPRI и элюировали с помощью 15 мкл воды. Затем все 15 мкл ДНК обрабатывали 1 мкл 0,067 мг/мл ДНК-полимеразы T4, 2,5 мМ подходящего dNTP, 10 мМ Трис-HCl, pH 8,0, 50 мМ NaCl, 10 мМ MgCl2, 1 мМ DTT в объеме 20 мкл и инкубировали при 22°C в течение 30 минут, затем 75°C в течение 20 минут. ДНК очищали с помощью 0,8 объема SPRI и элюировали с помощью 15 мкл воды перед переходом к стадии лигирования. Способ был идентичен для образцов геномной ДНК за исключением того, что 1 мкг дефосфорилированной геномная ДНК заменяли 200 нг плазмидной ДНК.[00163] 200 ng of plasmid DNA was combined with 5 µl of RNP (final concentration 100 nM) in 1x CutSmart® buffer in a total of 25 µl. Reaction mixtures were incubated at 37°C for 15 min, then 72°C for 5 min (to remove Cas9 from the target DNA). DNA was purified with 0.8 volume of SPRI and eluted with 15 µl of water. All 15 μl of DNA were then treated with 1 μl of 0.067 mg/ml T4 DNA polymerase, 2.5 mM appropriate dNTP, 10 mM Tris-HCl, pH 8.0, 50 mM NaCl, 10 mM MgCl2 , 1 mM DTT in a volume of 20 μl and incubated at 22°C for 30 min, then 75°C for 20 min. DNA was purified with 0.8 volume of SPRI and eluted with 15 μl of water before proceeding to the ligation step. The method was identical for genomic DNA samples except that 1 μg of dephosphorylated genomic DNA was replaced by 200 ng of plasmid DNA.
[00164] Результаты для плазмидой ДНК показаны на фигуре 4, а результаты для геномной ДНК показаны на фигуре 6 (cрРНК CrA и CrB) и фигуре 7 (cрРНК CrC и CrD).[00164] The results for plasmid DNA are shown in Figure 4, and the results for genomic DNA are shown in Figure 6 (CrA and CrB rRNA) and Figure 7 (CrC and CrD rRNA).
[00165] Пример 4. Промежуточные стадии очистки [00165] Example 4. Intermediate stages of purification
[00166] Очистка с помощью SPRI. Очистку с помощью SPRI осуществляли с помощью набора реагентов Beckman Coulter SPRIselect (кат. № B23317). Объемы реакционной смеси сначала доводили до 100 мкл с помощью воды, затем добавляли 0,8 объема бус SPRI. Смеси ДНК-SPRI инкубировали на магнитном штативе в течение 4 минут, затем удаляли супернатант. Бусы промывали 2 раз посредством добавления 85% этанола, затем элюировали в 15 мкл воды.[00166] SPRI purification. SPRI purification was performed using the Beckman Coulter SPRIselect reagent kit (Cat. #B23317). Reaction volumes were first adjusted to 100 µL with water, then 0.8 volume of SPRI beads were added. DNA-SPRI mixtures were incubated on a magnetic stand for 4 min, then the supernatant was removed. The beads were washed 2 times with 85% ethanol, then eluted in 15 µL of water.
[00167] Пример 5. Лигирование адаптеров [00167] Example 5. Ligation of adapters
[00168] Образцы очищенной с помощью SPRI ДНК (15 мкл) комбинировали с 1 мкл лигазы NEB Quick (кат. № M2200) и 250 нМ адаптера в 1-кратном буфере для лигазы NEB Quick (кат. № B6058S) в объеме 20 мкл реакционной смеси и инкубировали в течение 20 минут при комнатной температуре. Продукты лигирования очищали с помощью 0,8 объема SPRI и элюировали с помощью 20 мкл воды перед переходом к стадии ПЦР.[00168] SPRI purified DNA samples (15 µl) were combined with 1 µl NEB Quick Ligase (Cat# M2200) and 250 nM adapter in 1x NEB Quick Ligase Buffer (Cat# B6058S) in a 20 µl reaction volume and incubated for 20 min at room temperature. Ligation products were purified with 0.8 volume SPRI and eluted with 20 µl water before proceeding to the PCR step.
[00169] Пример 6. Амплификация [00169] Example 6: Amplification
[00170] 20 мкл смесей для PCR состояли из 0,2 мкл высокоточной ДНК-полимеразы NEB Q5 Hot Start (кат. №M0493), 2 мкл лигированной с адаптером ДНК, 500 нМ прямого праймера (F), 500 нМ подходящего обратного праймера (rv-1, 2, 3 или 4), 200 нМ каждого NTP в 1-кратном реакционном буфере Q5. Условия термоциклирования являлись следующими: 98°C в течение 30 секунд, (98°C - 10 секунд, 58°C - 30 секунд, 72°C - 45 секунд) 32 раза, 72°C - 2 минуты.[00170] 20 µl PCR mixtures consisted of 0.2 µl NEB Q5 Hot Start High Fidelity DNA Polymerase (Cat. #M0493), 2 µl adapter ligated DNA, 500 nM forward primer ( F ), 500 nM appropriate reverse primer ( rv-1, 2, 3, or 4 ), 200 nM each NTP in 1x Q5 reaction buffer. Thermal cycling conditions were 98°C for 30 sec, (98°C for 10 sec, 58°C for 30 sec, 72°C for 45 sec) 32 times, 72°C for 2 minutes.
[00171] Пример 7. Электрофорез в геле.[00171] Example 7. Gel electrophoresis .
[00172] 10 мкл каждого продукта ПЦР прогоняли на гелях 1% агароза-TAE при 90 вольтах в течение 60 минут и визуализировали с помощью системы Bio-Rad Gel Doc EZ Imaging System. Ожидаемые размеры ампликонов (в п.н.) для каждой конфигурации приведены в таблице 3.[00172] 10 μl of each PCR product were run on 1% agarose-TAE gels at 90 volts for 60 min and visualized using the Bio-Rad Gel Doc EZ Imaging System. Expected amplicon sizes (in bp) for each configuration are shown in Table 3.
[00173] Таблица 3. Ожидаемые размеры ампликонов [00173] Table 3. Expected amplicon sizes
[00174] Хотя настоящее изобретение подробно описано со ссылкой на конкретные примеры, специалисту в этой области очевидно, что можно осуществлять различные модификации в объеме настоящего изобретения. Таким образом, объем изобретения ограничен не примерами, представленными в настоящем описании, а приведенной ниже формулой изобретения.[00174] Although the present invention has been described in detail with reference to specific examples, it will be obvious to those skilled in the art that various modifications can be made within the scope of the present invention. Accordingly, the scope of the invention is not limited by the examples presented in the present description, but by the claims below.
[00175] СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ В ПРОИЗВОЛЬНОЙ ФОРМЕ[00175] LIST OF SEQUENCES IN ARBITRARY FORM
Легенда:Legend:
[00176] SEQ ID NO: Геномная последовательность 21TRAC (1600 п.н.), показанная на фигуре 2:[00176] SEQ ID NO: Genomic sequence of 21TRAC (1600 bp) shown in Figure 2:
GGCTCCAACTAACATTTGTTTGGTACTTTACAGTTTATTAAATAGATGTTTATATGGAGAAGCTCTCATTTCTTTCTCAGAAGAGCCTGGCTAGGAAGGTGGATGAGGCACCATATTCATTTTGCAGGTGAAATTCCTGAGATGTAAGGAGCTGCTGTGACTTGCTCAAGGCCTTATATCGAGTAAACGGTAGTGCTGGGGCTTAGACGCAGGTGTTCTGATTTATAGTTCAAAACCTCTATCAATGAGAGAGCAATCTCCTGGTAATGTGATAGATTTCCCAACTTAATGCCAACATACCATAAACCTCCCATTCTGCTAATGCCCAGCCTAAGTTGGGGAGACCACTCCAGATTCCAAGATGTACAGTTTGCTTTGCTGGGCCTTTTTCCCATGCCTGCCTTTACTCTGCCAGAGTTATATTGCTGGGGTTTTGAAGAAGATCCTATTAAATAAAAGAATAAGCAGTATTATTAAGTAGCCCTGCATTTCAGGTTTCCTTGAGTGGCAGGCCAGGCCTGGCCGTGAACGTTCACTGAAATCATGGCCTCTTGGCCAAGATTGATAGCTTGTGCCTGTCCCTGAGTCCCAGTCCATCACGAGCAGCTGGTTTCTAAGATGCTATTTCCCGTATAAAGCATGAGACCGTGACTTGCCAGCCCCACAGAGCCCCGCCCTTGTCCATCACTGGCATCTGGACTCCAGCCTGGGTTGGGGCAAAGAGGGAAATGAGATCATGTCCTAACCCTGATCCTCTTGTCCCACAGATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGGTAAGGGCAGCTTTGGTGCCTTCGCAGGCTGTTTCCTTGCTTCAGGAATGGCCAGGTTCTGCCCAGAGCTCTGGTCAATGATGTCTAAAACTCCTCTGATTGGTGGTCTCGGCCTTATCCATTGCCACCAAAACCCTCTTTTTACTAAGAAACAGTGAGCCTTGTTCTGGCAGTCCAGAGAATGACACGGGAAAAAAGCAGATGAAGAGAAGGTGGCAGGAGAGGGCACGTGGCCCAGCCTCAGTCTCTCCAACTGAGTTCCTGCCTGCCTGCCTTTGCTCAGACTGTTTGCCCCTTACTGCTCTTCTAGGCCTCATTCTAAGCCCCTTCTCCAAGTTGCCTCTCCTTATTTCTCCCTGTCTGCCAAAAAATCTTTCCCAGCTCACTAAGTCAGTCTCACGCAGTCACTCATTAACCCACCAATCACTGATTGTGCCGGCACATGAATGCACCAGGTGTTGAAGTGGAGGAATTAAAAAGTCAGATGAGGGGTGTGCCCAGAGGAAGCACCATTCTAGTTGGGGGAGCCCATCTGTCAGCTGGGAAAAGTCCAAATAACTGGCTCCAACTAACATTTGTTTGGTACTTTACAGTTTATTAAATAGATGTTTATATGGAGAAGCTCTCATTTCTTTCTCAGAAGAGCCTGGCTAGGAAGGTGGATGAGGCACCATATTCATTTTGCAGGTGAAATTCCCTGAGATGTAAGGAGCTGCTGTGACTTGCTCAAGGCCTTATATCGAGTAAAACGGTAGTGCTGGG GCTTAGACGCAGGTGTTCTGATTTATAGTTCAAAACCTCTATCAATGAGAGAGCAATCTCCTGGTAATGTGATAGATTTCCCAACTTAATGCCAACATACCATAAACCTCCCATTCTGCTAATGCCCAGCCTAAGTTGGGGAGACCACTCCAGATTCCAAGATGTACAGTTTGCTTTGCTGGGCCTTTTTCCCATGCCTG CCTTTACTCTGCCAGAGTTATATTGCTGGGGTTTTGAAGAAGATCCTATTAAATAAAAGAATAAGCAGTATTATTAAGTAGCCCTGCATTTCAGGTTTCCTTGAGTGGCAGGCCAGGCCTGGCCGTGAACGTTCACTGAAATCATGGCCTCTTGGCCAAGATTGATAGCTTGTGCCTGTCCCTGAGTCCCAGTCCATCAC GAGCAGCTGGTTTCTAAGATGCTATTTCCCGTATAAAGCATGAGACCGTGACTTGCCAGCCCCACAGAGCCCCGCCCTTGTCCATCACTGGCATCTGGACTCCAGCCTGGGTTGGGGCAAAGAGGAAATGAGATCATGTCCTAACCCTGATCCTCTTGTCCCACAGATATCCAGAACCCTGACCCTGCCGTGTACCAGC TGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAAC AACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGGTAAGGGCAGCTTTGGTGCCTTCGCAGGCTGTTTCCTTGCTTCAGGAATGGCCAGGTTCTGCCCAGAGCTCTGGTCAATGATGTCTAAAACTCCTCTGATTGGTGGTCTCGGCCTTATCCATTGCCACCAAAACCCTCTTTTTACTAAGAAACAGTGAGC CTTGTTCTGGCAGTCCAGAGAATGACACGGGAAAAAAGCAGATGAAGAGAAGGTGGCAGGAGAGGGCACGTGGCCCAGCCTCAGTCTCTCCAACTGAGTTCCTGCCTGCCTGCCTTTGCTCAGACTGTTTGCCCCTTACTGCTCTTCTAGGCCTCATTCTAAGCCCCTCTCTCCAAGTTGCCTCTCCTTATTTCTCCCTGT CTGCCAAAAAATCTTTCCCAGCTCACTAAGTCAGTCTCACGCAGTCACTCATTAACCCACCAATCACTGATTGTGCCGGCACATGAATGCACCAGGTGTTGAAGTGGAGGAATTAAAAAGTCAGATGAGGGGTGTGCCCAGAGGAAGCACCATTCTAGTTGGGGGAGCCCATCTGTCAGCTGGGAAAAGTCCAAATAACT
--->--->
<?xml version="1.0" encoding="UTF-8"?><?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ST26SequenceListing PUBLIC "-//WIPO//DTD Sequence Listing <!DOCTYPE ST26SequenceListing PUBLIC "-//WIPO//DTD Sequence Listing
1.3//EN" "ST26SequenceListing_V1_3.dtd">1.3//EN" "ST26SequenceListing_V1_3.dtd">
<ST26SequenceListing dtdVersion="V1_3" fileName="CBI043.30.xml" <ST26SequenceListing dtdVersion="V1_3" fileName="CBI043.30.xml"
softwareName="WIPO Sequence" softwareVersion="2.2.0" softwareName="WIPO Sequence" softwareVersion="2.2.0"
productionDate="2023-02-08">productionDate="2023-02-08">
<ApplicationIdentification><ApplicationIdentification>
<IPOfficeCode>US</IPOfficeCode> <IPOfficeCode>US</IPOfficeCode>
<ApplicationNumberText>PCT/US2022/080938</ApplicationNumberText> <ApplicationNumberText>PCT/US2022/080938</ApplicationNumberText>
<FilingDate>2022-12-05</FilingDate> <FilingDate>2022-12-05</FilingDate>
</ApplicationIdentification></ApplicationIdentification>
<ApplicantFileReference>CBI043.30</ApplicantFileReference> <ApplicantFileReference>CBI043.30</ApplicantFileReference>
<EarliestPriorityApplicationIdentification> <EarliestPriorityApplicationIdentification>
<IPOfficeCode>US</IPOfficeCode> <IPOfficeCode>US</IPOfficeCode>
<ApplicationNumberText>US 63/286,922</ApplicationNumberText> <ApplicationNumberText>US 63/286,922</ApplicationNumberText>
<FilingDate>2021-12-07</FilingDate> <FilingDate>2021-12-07</FilingDate>
</EarliestPriorityApplicationIdentification> </EarliestPriorityApplicationIdentification>
<ApplicantName languageCode="en">CARIBOU BIOSCIENCES, <ApplicantName languageCode="en">CARIBOU BIOSCIENCES,
INC.</ApplicantName>INC.</ApplicantName>
<InventionTitle languageCode="en">A METHOD OF CAPTURING CRISPR <InventionTitle languageCode="en">A METHOD OF CAPTURING CRISPR
ENDONUCLEASE CLEAVAGE PRODUCTS</InventionTitle>ENDONUCLEASE CLEAVAGE PRODUCTS</InventionTitle>
<SequenceTotalQuantity>21</SequenceTotalQuantity> <SequenceTotalQuantity>21</SequenceTotalQuantity>
<SequenceData sequenceIDNumber="1"> <SequenceData sequenceIDNumber="1">
<INSDSeq><INSDSeq>
<INSDSeq_length>20</INSDSeq_length> <INSDSeq_length>20</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q1"><INSDQualifier id="q1">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-A</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-A</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q2"><INSDQualifier id="q2">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>ctaatgcccagcctaagttg</INSDSeq_sequence> <INSDSeq_sequence>ctaatgcccagcctaagttg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="2"> <SequenceData sequenceIDNumber="2">
<INSDSeq><INSDSeq>
<INSDSeq_length>20</INSDSeq_length> <INSDSeq_length>20</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q3"><INSDQualifier id="q3">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-B</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-B</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q4"><INSDQualifier id="q4">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>gccccgcccttgtccatcac</INSDSeq_sequence> <INSDSeq_sequence>gccccgcccttgtccatcac</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="3"> <SequenceData sequenceIDNumber="3">
<INSDSeq><INSDSeq>
<INSDSeq_length>20</INSDSeq_length> <INSDSeq_length>20</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q5"><INSDQualifier id="q5">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-C</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-C</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q6"><INSDQualifier id="q6">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>tagtgctggggcttagacgc</INSDSeq_sequence> <INSDSeq_sequence>tagtgctggggcttagacgc</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="4"> <SequenceData sequenceIDNumber="4">
<INSDSeq><INSDSeq>
<INSDSeq_length>20</INSDSeq_length> <INSDSeq_length>20</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q7"><INSDQualifier id="q7">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-D</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-D</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..20</INSDFeature_location> <INSDFeature_location>1..20</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q8"><INSDQualifier id="q8">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>ggtgaaattcctgagatgta</INSDSeq_sequence> <INSDSeq_sequence>ggtgaaattcctgagatgta</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="5"> <SequenceData sequenceIDNumber="5">
<INSDSeq><INSDSeq>
<INSDSeq_length>23</INSDSeq_length> <INSDSeq_length>23</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..23</INSDFeature_location> <INSDFeature_location>1..23</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q9"><INSDQualifier id="q9">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: dA-top</INSDQualifier_value> <INSDQualifier_value>Synthetic: dA-top</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..23</INSDFeature_location> <INSDFeature_location>1..23</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q10"> <INSDQualifier id="q10">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cagacactcacactaatactcgt</INSDSeq_sequence> <INSDSeq_sequence>cagacactcacactaatactcgt</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="6"> <SequenceData sequenceIDNumber="6">
<INSDSeq><INSDSeq>
<INSDSeq_length>22</INSDSeq_length> <INSDSeq_length>22</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q11"> <INSDQualifier id="q11">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: <INSDQualifier_value>Synthetic:
dA-bottom</INSDQualifier_value>dA-bottom</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q12"> <INSDQualifier id="q12">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q13"> <INSDQualifier id="q13">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cgagtattagtgtgagtgtctg</INSDSeq_sequence> <INSDSeq_sequence>cgagtattagtgtgagtgtctg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="7"> <SequenceData sequenceIDNumber="7">
<INSDSeq><INSDSeq>
<INSDSeq_length>22</INSDSeq_length> <INSDSeq_length>22</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q14"> <INSDQualifier id="q14">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: ABCD-top</INSDQualifier_value> <INSDQualifier_value>Synthetic: ABCD-top</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q15"> <INSDQualifier id="q15">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cagacactcacactaatactcg</INSDSeq_sequence> <INSDSeq_sequence>cagacactcacactaatactcg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="8"> <SequenceData sequenceIDNumber="8">
<INSDSeq><INSDSeq>
<INSDSeq_length>31</INSDSeq_length> <INSDSeq_length>31</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..31</INSDFeature_location> <INSDFeature_location>1..31</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q16"> <INSDQualifier id="q16">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: A-bottom</INSDQualifier_value> <INSDQualifier_value>Synthetic: A-bottom</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q17"> <INSDQualifier id="q17">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..31</INSDFeature_location> <INSDFeature_location>1..31</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q18"> <INSDQualifier id="q18">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>tctccccaacgagtattagtgtgagtgtctg</INSDSeq_sequence <INSDSeq_sequence>tctccccaacgagtattagtgtgagtgtctg</INSDSeq_sequence
>>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="9"> <SequenceData sequenceIDNumber="9">
<INSDSeq><INSDSeq>
<INSDSeq_length>26</INSDSeq_length> <INSDSeq_length>26</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..26</INSDFeature_location> <INSDFeature_location>1..26</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q19"> <INSDQualifier id="q19">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: B-bottom</INSDQualifier_value> <INSDQualifier_value>Synthetic: B-bottom</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q20"> <INSDQualifier id="q20">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..26</INSDFeature_location> <INSDFeature_location>1..26</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q21"> <INSDQualifier id="q21">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>agtgcgagtattagtgtgagtgtctg</INSDSeq_sequence> <INSDSeq_sequence>agtgcgagtattagtgtgagtgtctg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="10"> <SequenceData sequenceIDNumber="10">
<INSDSeq><INSDSeq>
<INSDSeq_length>28</INSDSeq_length> <INSDSeq_length>28</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..28</INSDFeature_location> <INSDFeature_location>1..28</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q22"> <INSDQualifier id="q22">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: C-bottom</INSDQualifier_value> <INSDQualifier_value>Synthetic: C-bottom</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q23"> <INSDQualifier id="q23">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..28</INSDFeature_location> <INSDFeature_location>1..28</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q24"> <INSDQualifier id="q24">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cctgcgcgagtattagtgtgagtgtctg</INSDSeq_sequence> <INSDSeq_sequence>cctgcgcgagtattagtgtgagtgtctg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="11"> <SequenceData sequenceIDNumber="11">
<INSDSeq><INSDSeq>
<INSDSeq_length>30</INSDSeq_length> <INSDSeq_length>30</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..30</INSDFeature_location> <INSDFeature_location>1..30</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q25"> <INSDQualifier id="q25">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: D-bottom</INSDQualifier_value> <INSDQualifier_value>Synthetic: D-bottom</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q26"> <INSDQualifier id="q26">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..30</INSDFeature_location> <INSDFeature_location>1..30</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q27"> <INSDQualifier id="q27">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>ctccttaccgagtattagtgtgagtgtctg</INSDSeq_sequence> <INSDSeq_sequence>ctccttaccgagtattagtgtgagtgtctg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="12"> <SequenceData sequenceIDNumber="12">
<INSDSeq><INSDSeq>
<INSDSeq_length>22</INSDSeq_length> <INSDSeq_length>22</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q28"> <INSDQualifier id="q28">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: rv-1</INSDQualifier_value> <INSDQualifier_value>Synthetic: rv-1</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q29"> <INSDQualifier id="q29">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>tgaagtccatagacctcatgtc</INSDSeq_sequence> <INSDSeq_sequence>tgaagtccatagacctcatgtc</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="13"> <SequenceData sequenceIDNumber="13">
<INSDSeq><INSDSeq>
<INSDSeq_length>22</INSDSeq_length> <INSDSeq_length>22</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q30"> <INSDQualifier id="q30">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: rv-2</INSDQualifier_value> <INSDQualifier_value>Synthetic: rv-2</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q31"> <INSDQualifier id="q31">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>atcaaaatcggtgaataggcag</INSDSeq_sequence> <INSDSeq_sequence>atcaaaatcggtgaataggcag</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="14"> <SequenceData sequenceIDNumber="14">
<INSDSeq><INSDSeq>
<INSDSeq_length>21</INSDSeq_length> <INSDSeq_length>21</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..21</INSDFeature_location> <INSDFeature_location>1..21</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q32"> <INSDQualifier id="q32">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: rv-3</INSDQualifier_value> <INSDQualifier_value>Synthetic: rv-3</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..21</INSDFeature_location> <INSDFeature_location>1..21</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q33"> <INSDQualifier id="q33">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>ggagaaataaggagaggcaac</INSDSeq_sequence> <INSDSeq_sequence>ggagaaataaggagaggcaac</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="15"> <SequenceData sequenceIDNumber="15">
<INSDSeq><INSDSeq>
<INSDSeq_length>21</INSDSeq_length> <INSDSeq_length>21</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..21</INSDFeature_location> <INSDFeature_location>1..21</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q34"> <INSDQualifier id="q34">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: rv-4</INSDQualifier_value> <INSDQualifier_value>Synthetic: rv-4</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..21</INSDFeature_location> <INSDFeature_location>1..21</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q35"> <INSDQualifier id="q35">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>taattcctccacttcaacacc</INSDSeq_sequence> <INSDSeq_sequence>taattcctccacttcaacacc</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="16"> <SequenceData sequenceIDNumber="16">
<INSDSeq><INSDSeq>
<INSDSeq_length>22</INSDSeq_length> <INSDSeq_length>22</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q36"> <INSDQualifier id="q36">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: F</INSDQualifier_value> <INSDQualifier_value>Synthetic: F</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..22</INSDFeature_location> <INSDFeature_location>1..22</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q37"> <INSDQualifier id="q37">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cagacactcacactaatactcg</INSDSeq_sequence> <INSDSeq_sequence>cagacactcacactaatactcg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="17"> <SequenceData sequenceIDNumber="17">
<INSDSeq><INSDSeq>
<INSDSeq_length>14</INSDSeq_length> <INSDSeq_length>14</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..14</INSDFeature_location> <INSDFeature_location>1..14</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q38"> <INSDQualifier id="q38">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-A</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-A</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q39"> <INSDQualifier id="q39">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..14</INSDFeature_location> <INSDFeature_location>1..14</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q40"> <INSDQualifier id="q40">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>ttggggagaccact</INSDSeq_sequence> <INSDSeq_sequence>ttggggagaaccact</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="18"> <SequenceData sequenceIDNumber="18">
<INSDSeq><INSDSeq>
<INSDSeq_length>13</INSDSeq_length> <INSDSeq_length>13</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..13</INSDFeature_location> <INSDFeature_location>1..13</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q41"> <INSDQualifier id="q41">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-B</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-B</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q42"> <INSDQualifier id="q42">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..13</INSDFeature_location> <INSDFeature_location>1..13</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q43"> <INSDQualifier id="q43">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cactggcatctgg</INSDSeq_sequence> <INSDSeq_sequence>cactggcatctgg</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="19"> <SequenceData sequenceIDNumber="19">
<INSDSeq><INSDSeq>
<INSDSeq_length>10</INSDSeq_length> <INSDSeq_length>10</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..10</INSDFeature_location> <INSDFeature_location>1..10</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q44"> <INSDQualifier id="q44">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-C</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-C</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q45"> <INSDQualifier id="q45">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..10</INSDFeature_location> <INSDFeature_location>1..10</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q46"> <INSDQualifier id="q46">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>cgcaggtgtt</INSDSeq_sequence> <INSDSeq_sequence>cgcaggtgtt</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="20"> <SequenceData sequenceIDNumber="20">
<INSDSeq><INSDSeq>
<INSDSeq_length>13</INSDSeq_length> <INSDSeq_length>13</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..13</INSDFeature_location> <INSDFeature_location>1..13</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q47"> <INSDQualifier id="q47">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: Cr-D</INSDQualifier_value> <INSDQualifier_value>Synthetic: Cr-D</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>modified_base</INSDFeature_key> <INSDFeature_key>modified_base</INSDFeature_key>
<INSDFeature_location>1</INSDFeature_location> <INSDFeature_location>1</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mod_base</INSDQualifier_name> <INSDQualifier_name>mod_base</INSDQualifier_name>
<INSDQualifier_value>OTHER</INSDQualifier_value> <INSDQualifier_value>OTHER</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q48"> <INSDQualifier id="q48">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>5'-phosphate</INSDQualifier_value> <INSDQualifier_value>5'-phosphate</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..13</INSDFeature_location> <INSDFeature_location>1..13</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q49"> <INSDQualifier id="q49">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>gtaaggagctgct</INSDSeq_sequence> <INSDSeq_sequence>gtaaggagctgct</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
<SequenceData sequenceIDNumber="21"> <SequenceData sequenceIDNumber="21">
<INSDSeq><INSDSeq>
<INSDSeq_length>1600</INSDSeq_length> <INSDSeq_length>1600</INSDSeq_length>
<INSDSeq_moltype>DNA</INSDSeq_moltype> <INSDSeq_moltype>DNA</INSDSeq_moltype>
<INSDSeq_division>PAT</INSDSeq_division> <INSDSeq_division>PAT</INSDSeq_division>
<INSDSeq_feature-table><INSDSeq_feature-table>
<INSDFeature><INSDFeature>
<INSDFeature_key>misc_feature</INSDFeature_key> <INSDFeature_key>misc_feature</INSDFeature_key>
<INSDFeature_location>1..1600</INSDFeature_location> <INSDFeature_location>1..1600</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier id="q50"> <INSDQualifier id="q50">
<INSDQualifier_name>note</INSDQualifier_name> <INSDQualifier_name>note</INSDQualifier_name>
<INSDQualifier_value>Synthetic: TRAC genomic <INSDQualifier_value>Synthetic: TRAC genomic
sequence</INSDQualifier_value>sequence</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
<INSDFeature><INSDFeature>
<INSDFeature_key>source</INSDFeature_key> <INSDFeature_key>source</INSDFeature_key>
<INSDFeature_location>1..1600</INSDFeature_location> <INSDFeature_location>1..1600</INSDFeature_location>
<INSDFeature_quals><INSDFeature_quals>
<INSDQualifier><INSDQualifier>
<INSDQualifier_name>mol_type</INSDQualifier_name> <INSDQualifier_name>mol_type</INSDQualifier_name>
<INSDQualifier_value>other DNA</INSDQualifier_value> <INSDQualifier_value>other DNA</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
<INSDQualifier id="q51"> <INSDQualifier id="q51">
<INSDQualifier_name>organism</INSDQualifier_name> <INSDQualifier_name>organism</INSDQualifier_name>
<INSDQualifier_value>synthetic construct</INSDQualifier_value> <INSDQualifier_value>synthetic construct</INSDQualifier_value>
</INSDQualifier></INSDQualifier>
</INSDFeature_quals></INSDFeature_quals>
</INSDFeature></INSDFeature>
</INSDSeq_feature-table></INSDSeq_feature-table>
<INSDSeq_sequence>ggctccaactaacatttgtttggtactttacagtttattaaatagatgt <INSDSeq_sequence>ggctccaactaacatttgtttggtactttacagtttattaaatagatgt
ttatatggagaagctctcatttctttctcagaagagcctggctaggaaggtggatgaggcaccatattcattatatggagaagctctcatttctttctcagaagagcctggctaggaaggtggatgaggcaccatattca
ttttgcaggtgaaattcctgagatgtaaggagctgctgtgacttgctcaaggccttatatcgagtaaacgttttgcaggtgaaattcctgagatgtaaggagctgctgtgacttgctcaaggccttatatcgagtaaacg
gtagtgctggggcttagacgcaggtgttctgatttatagttcaaaacctctatcaatgagagagcaatctgtagtgctggggcttagacgcaggtgttctgatttatagttcaaaacctctatcaatgagagagcaatct
cctggtaatgtgatagatttcccaacttaatgccaacataccataaacctcccattctgctaatgcccagcctggtaatgtgatagatttcccaacttaatgccaacataccataaacctcccattctgctaatgcccag
cctaagttggggagaccactccagattccaagatgtacagtttgctttgctgggcctttttcccatgcctcctaagttggggagaccactccagattccaagatgtacagtttgctttgctgggcctttttcccatgcct
gcctttactctgccagagttatattgctggggttttgaagaagatcctattaaataaaagaataagcagtgcctttactctgccagagttatattgctggggttttgaagaagatcctattaaataaaagaataagcagt
attattaagtagccctgcatttcaggtttccttgagtggcaggccaggcctggccgtgaacgttcactgaattattaagtagccctgcatttcaggtttccttgagtggcaggccaggcctggccgtgaacgttcactga
aatcatggcctcttggccaagattgatagcttgtgcctgtccctgagtcccagtccatcacgagcagctgaatcatggcctcttggccaagattgatagcttgtgcctgtccctgagtcccagtccatcacgagcagctg
gtttctaagatgctatttcccgtataaagcatgagaccgtgacttgccagccccacagagccccgcccttgtttctaagatgctatttcccgtataaagcatgagaccgtgacttgccagccccacagagccccgccctt
gtccatcactggcatctggactccagcctgggttggggcaaagagggaaatgagatcatgtcctaaccctgtccatcactggcatctggactccagcctgggttggggcaaagagggaaatgagatcatgtcctaaccct
gatcctcttgtcccacagatatccagaaccctgaccctgccgtgtaccagctgagagactctaaatccaggatcctcttgtcccacagatatccagaaccctgaccctgccgtgtaccagctgagagactctaaatccag
tgacaagtctgtctgcctattcaccgattttgattctcaaacaaatgtgtcacaaagtaaggattctgattgacaagtctgtctgcctattcaccgattttgattctcaaacaaatgtgtcacaaagtaaggattctgat
gtgtatatcacagacaaaactgtgctagacatgaggtctatggacttcaagagcaacagtgctgtggcctgtgtatatcacagacaaaactgtgctagacatgaggtctatggacttcaagagcaacagtgctgtggcct
ggagcaacaaatctgactttgcatgtgcaaacgccttcaacaacagcattattccagaagacaccttcttggagcaacaaatctgactttgcatgtgcaaacgccttcaacaacagcattattccagaagacaccttctt
ccccagcccaggtaagggcagctttggtgccttcgcaggctgtttccttgcttcaggaatggccaggttcccccagcccaggtaagggcagctttggtgccttcgcaggctgtttccttgcttcaggaatggccaggttc
tgcccagagctctggtcaatgatgtctaaaactcctctgattggtggtctcggccttatccattgccacctgcccagagctctggtcaatgatgtctaaaactcctctgattggtggtctcggccttatccattgccacc
aaaaccctctttttactaagaaacagtgagccttgttctggcagtccagagaatgacacgggaaaaaagcaaaaccctctttttactaagaaacagtgagccttgttctggcagtccagagaatgacacgggaaaaaagc
agatgaagagaaggtggcaggagagggcacgtggcccagcctcagtctctccaactgagttcctgcctgcagatgaagagaaggtggcaggagagggcacgtggcccagcctcagtctctccaactgagttcctgcctgc
ctgcctttgctcagactgtttgccccttactgctcttctaggcctcattctaagccccttctccaagttgctgcctttgctcagactgtttgccccttactgctcttctaggcctcattctaagccccttctccaagttg
cctctccttatttctccctgtctgccaaaaaatctttcccagctcactaagtcagtctcacgcagtcactcctctccttatttctccctgtctgccaaaaaatctttcccagctcactaagtcagtctcacgcagtcact
cattaacccaccaatcactgattgtgccggcacatgaatgcaccaggtgttgaagtggaggaattaaaaacattaacccaccaatcactgattgtgccggcacatgaatgcaccaggtgttgaagtggaggaattaaaaa
gtcagatgaggggtgtgcccagaggaagcaccattctagttgggggagcccatctgtcagctgggaaaaggtcagatgaggggtgtgcccagaggaagcaccattctagttgggggagcccatctgtcagctgggaaaag
tccaaataact</INSDSeq_sequence>tccaaataact</INSDSeq_sequence>
</INSDSeq></INSDSeq>
</SequenceData></SequenceData>
</ST26SequenceListing></ST26SequenceListing>
<---<---
Claims (19)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US63/286,922 | 2021-12-07 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2024118667A RU2024118667A (en) | 2024-08-02 |
| RU2843259C2 true RU2843259C2 (en) | 2025-07-09 |
Family
ID=
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021138094A1 (en) * | 2019-12-31 | 2021-07-08 | Singular Genomics Systems, Inc. | Polynucleotide barcodes for long read sequencing |
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021138094A1 (en) * | 2019-12-31 | 2021-07-08 | Singular Genomics Systems, Inc. | Polynucleotide barcodes for long read sequencing |
Non-Patent Citations (1)
| Title |
|---|
| HARDIGAN A.A. et al., CRISPR/Cas9-targeted removal of unwanted sequences from small-RNA sequencing libraries, Nucleic Acids Res, 2019, v. 47, N. 14, e84. МИХАЙЛОВ В.С. и др., Аффинный захват заданных фрагментов ДНК с помощью коротких синтетических последовательностей, Биоорганическая химия, 2013, т. 39, N. 1, c. 81-86. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2015279862B2 (en) | Library preparation of tagged nucleic acid using single tube add-on protocol | |
| EP4090766B1 (en) | Methods of targeted sequencing | |
| WO2011161549A2 (en) | Methods and compositions for polynucleotide library production, immortalization and region of interest extraction | |
| US20190169603A1 (en) | Compositions and Methods for Labeling Target Nucleic Acid Molecules | |
| JP2019500852A (en) | Ligase-assisted nucleic acid circularization and amplification | |
| CN111542532B (en) | Method and system for synthesizing oligonucleotide by enzyme method | |
| US11155857B2 (en) | Methods for measuring RNA translation rates | |
| KR20230163386A (en) | Blocking oligonucleotides to selectively deplete undesirable fragments from amplified libraries | |
| RU2843259C2 (en) | Method of capturing cleavage products of crispr endonuclease | |
| AU2022407332B2 (en) | A method of capturing crispr endonuclease cleavage products | |
| CN107002290A (en) | Sample preparation method | |
| JP7490071B2 (en) | Novel nucleic acid template structures for sequencing | |
| CN112041461A (en) | Methods for attaching adaptors to single-stranded regions of double-stranded polynucleotides | |
| US20250011759A1 (en) | Improved library preparation method | |
| WO2019018404A1 (en) | Rapid library construction for high throughput sequencing | |
| WO2025132779A2 (en) | Methods and compositions for nucleic acid library and template preparation for duplexed sequencing by expansion | |
| EP4605545A1 (en) | Detection of modified nucleobases in nucleic acid samples | |
| WO2025024703A1 (en) | Dual-tagmentation single-cell dnaseq | |
| CN116710573A (en) | Insertion section and identification non-denaturing sequencing method | |
| WO2021156295A1 (en) | Methods for amplification of genomic dna and preparation of sequencing libraries | |
| HK1231918A1 (en) | Library preparation of tagged nucleic acid using single tube add-on protocol | |
| HK1231918B (en) | Library preparation of tagged nucleic acid using single tube add-on protocol |