본 발명의 실시 형태는 향상된 형광 강도, 조정가능한 스토크스 이동 및 개선된 화학적 안정성을 갖는 비스-붕소 융합 헤테로사이클을 함유하는 염료에 관한 것이다. 일부 실시 형태에서, 본 명세서에 기재된 염료의 스토크스 이동은 약 15 nm 내지 50 nm(예를 들어, 약 20 nm)의 범위이다. 본 명세서에 기재된 비스-붕소 함유 염료는 2-채널 검출(녹색광 여기 및 청색광 여기)을 갖는 Illumina의 서열분석 플랫폼, 예를 들어 MiSeq™에 사용될 수 있다.
정의
본 명세서에 사용된 섹션 제목은 조직학적 목적을 위한 것으로, 기재된 주제를 제한하는 것으로 해석되어서는 안된다.
본 명세서 및 첨부된 청구범위에 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 명시적으로 그리고 명백하게 하나의 지시 대상으로 제한되지 않는 한 복수의 지시 대상을 포함한다는 점에 유의해야 한다. 본 교시의 사상 또는 범위를 벗어나지 않고 본 명세서에 기재된 다양한 실시 형태에 대해 다양한 수정 및 변경이 이루어질 수 있음이 당업자에게 명백할 것이다. 따라서, 본 명세서에 기재된 다양한 실시 형태는 첨부된 청구범위 및 그 등가물의 범위 내에서 다른 수정 및 변경을 포함하는 것으로 의도된다.
달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 당업자에 의해 일반적으로 이해하는 것과 동일한 의미를 갖는다. 용어 "포함하는"뿐만 아니라 "포함하다", "포함한다", 및 "포함된"과 같은 다른 형태의 사용은 제한적이지 않다. 용어 "갖는"뿐만 아니라 "갖다", "갖는다", 및 "가진"과 같은 다른 형태의 사용은 제한적이지 않다. 본 명세서에 사용된 바와 같이, 전이 문구 또는 청구범위의 중심부에서든, 용어 "포함한다(comprise(s))" 및 "포함하는(comprising)"은 개방 말단형 의미를 갖는 것으로 해석되어야 한다. 즉, 상기 용어는 문구 "적어도 ~ 갖는(having at least)" 또는 "적어도 ~ 포함하는(including at least)"과 동의어로 해석되어야 한다. 예를 들어, 공정과 관련하여 사용되는 경우, 용어 "포함하는"은 공정이 적어도 언급된 단계들을 포함하지만, 추가의 단계들을 포함할 수 있음을 의미한다. 화합물, 조성물, 또는 장치의 맥락에서 사용될 때, 용어 "포함하는(comprising)"은 화합물, 조성물, 또는 장치가 적어도 나열된 특성 또는 구성요소를 포함하지만, 또한 추가 특성 또는 구성요소를 포함할 수 있음을 의미한다.
본 명세서에 사용되는 일반적인 유기 약어는 하기와 같이 정의된다:
본 명세서에 사용되는 용어 "어레이"는 상이한 프로브 분자가 상대적 위치에 따라 서로 구별될 수 있도록 하나 이상의 기질에 부착된 상이한 프로브 분자의 집단을 지칭한다. 어레이는 기질 상의 상이한 어드레스가능한 위치에 각각 위치한 상이한 프로브 분자를 포함할 수 있다. 대안적으로 또는 추가로, 어레이는 각각 상이한 프로브 분자를 갖는 별개의 기질을 포함할 수 있으며, 여기서 상이한 프로브 분자는 기질이 부착된 표면 상의 기질의 위치에 따라 또는 액체 중에서의 기질의 위치에 따라 식별될 수 있다. 별도의 기질이 표면에 위치하는 예시적인 어레이는 예를 들어, 미국 특허 제6,355,431 B1호, 미국 특허 출원 제2002/0102578호 및 국제 특허 공개 WO 00/63437호에 기재된 바와 같이, 웰에 비드를 포함하는 것들을 포함하지만 이에 한정되지 않는다. 예를 들어, 형광 활성화 세포 분별기(FACS)와 같은 마이크로유체 소자를 사용하여 액체 어레이에서 비드를 구별하기 위해 본 발명에서 사용될 수 있는 예시적인 포맷은 예를 들어, 미국 특허 제6,524,793호에 기재되어 있다. 본 발명에서 사용될 수 있는 어레이의 추가의 예는 미국 특허 제5,429,807호; 제5,436,327호; 제5,561,071호; 제5,583,211호; 제5,658,734호; 제5,837,858호; 제5,874,219호; 제5,919,523호; 제6,136,269호; 제6,287,768호; 제6,287,776호; 제6,288,220호; 제6,297,006호; 제6,291,193호; 제6,346,413호; 제6,416,949호; 제6,482,591호; 제6,514,751호 및 제6,610,482호; 국제 특허 공개 WO 93/17126호; 국제 특허 공개 WO 95/11995호; 국제 특허 공개 WO 95/35505호; EP 742 287호; 및 EP 799 897호에 기재된 것들을 포함하지만 이에 한정되지 않는다.
본 명세서에 사용되는 용어 "공유 부착된(covalently attached)" 또는 "공유 결합된(covalently bonded)"은 원자들 사이에 전자쌍을 공유하는 것을 특징으로 하는 화학 결합의 형성을 지칭한다. 예를 들어, 공유 결합된 중합체 코팅은 다른 수단, 예를 들어 접착 또는 정전기 상호작용을 통한 표면에 대한 부착과 비교하여, 기질의 작용화 표면과 화학 결합을 형성하는 중합체 코팅을 지칭한다. 표면에 공유 결합된 중합체는 또한 공유 결합 이외의 수단을 통해 결합될 수 있음이 이해될 것이다.
본 명세서에 사용되는 용어 "할로겐" 또는 "할로"는 원소 주기율표의 7족의 방사성 안정 원자, 예를 들어 불소, 염소, 브롬 또는 요오드 중 임의의 하나를 의미하며, 불소 및 염소가 바람직하다.
본 명세서에 사용되는 "Ca 내지 Cb"(여기서, a" 및 "b"는 정수임)는 알킬 기, 알케닐 기 또는 알키닐 기의 탄소 원자수, 또는 사이클로알킬 기 또는 아릴 기의 고리 원자수를 지칭한다. 즉, 알킬, 알케닐, 알키닐, 사이클로알킬 고리 및 아릴 고리는 "a" 내지 "b"개(종점 포함)의 탄소 원자를 포함할 수 있다. 예를 들어, "C1 내지 C4 알킬" 기는 1개 내지 4개의 탄소를 갖는 모든 알킬 기, 즉, CH3-, CH3CH2-, CH3CH2CH2-, (CH3)2CH-, CH3CH2CH2CH2-, CH3CH2CH(CH3)- 및 (CH3)3C-를 지칭하고; C3 내지 C4 사이클로알킬 기는 3개 또는 4개의 탄소 원자를 갖는 모든 사이클로알킬 기, 즉, 사이클로프로필 및 사이클로부틸을 지칭한다. 유사하게, "4원 내지 6원 헤테로사이클릴"기는 4 내지 6개의 총 고리 원자를 갖는 모든 헤테로사이클릴 기, 예를 들어 아제티딘, 옥세탄, 옥사졸린, 피롤리딘, 피페리딘, 피페라진, 모르폴린 등을 지칭한다. "a" 및 "b"가 알킬 기, 알케닐 기, 알키닐 기, 사이클로알킬 기 또는 아릴 기에 관하여 지정되어 있지 않다면, 이들 정의에 기재된 가장 넓은 범위가 가정되어야 한다. 본 명세서에 사용되는 용어 "C1-6"는 C1, C2, C3, C4, C5 및 C6, 및 임의의 이들 2개의 숫자에 의해 정의되는 범위를 포함한다. 예를 들어, C1-C6 알킬은 C1, C2, C3, C4, C5 및 C6 알킬, C2-C6 알킬, C1-C3 알킬 등을 포함한다. 유사하게, C2-C6 알케닐은 C2, C3, C4, C5 및 C6 알케닐, C2-C5 알케닐, C3-C4 알케닐 등을 포함하며; C2-C6 알키닐은 C2, C3, C4, C5 및 C6 알키닐, C2-C5 알키닐, C3-C4 알키닐 등을 포함한다. C3-C8 사이클로알킬은 각각 3개, 4개, 5개, 6개, 7개 및 8개의 탄소 원자, 또는 임의의 이들 2개의 숫자에 의해 정의되는 범위, 예컨대 C3-C7 사이클로알킬 또는 C5-C6 사이클로알킬을 포함하는 탄화수소 고리를 포함한다.
본 명세서에 사용되는 "알킬"은 완전 포화된(즉, 이중 또는 삼중 결합을 함유하지 않는) 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 알킬 기는 1개 내지 20개의 탄소 원자를 가질 수 있다(본 명세서에 나타날 때마다, "1 내지 20"과 같은 수치 범위는 주어진 범위 내의 각각의 정수를 지칭하며; 예를 들어, "1개 내지 20개의 탄소 원자"는 알킬 기가 1개의 탄소 원자, 2개의 탄소 원자, 3개의 탄소 원자 등, 20개를 포함하여 20개 이하의 탄소 원자로 이루어질 수 있음을 의미하지만, 본 정의는 또한 수치 범위가 지정되지 않은 용어 "알킬"의 경우도 포함한다). 알킬 기는 또한 1개 내지 9개의 탄소 원자를 갖는 중간 크기 알킬일 수 있다. 알킬 기는 또한 1개 내지 6개의 탄소 원자를 갖는 저급 알킬일 수 있다. 단지 예로서, "C1-6 알킬" 또는 "C1-C6 알킬"은 알킬 사슬 내에 1 내지 6개의 탄소 원자가 있음을 나타내며, 즉, 알킬 사슬은 메틸, 에틸, 프로필, 아이소-프로필, n-부틸, 아이소-부틸, sec-부틸, 및 t-부틸로 이루어진 군으로부터 선택된다. 전형적인 알킬 기는 메틸, 에틸, 프로필, 아이소프로필, 부틸, 아이소부틸, 삼차 부틸, 펜틸, 헥실 등을 포함하지만 결코 이로 한정되지 않는다.
본 명세서에 사용되는 "알콕시"는 화학식 -OR (여기서, R은 상기에 정의된 바와 같은 알킬임), 예컨대 "C1-9 알콕시" 또는 "C1-C9 알콕시"이며, 이에는 메톡시, 에톡시, n-프로폭시, 1-메틸에톡시(아이소프로폭시), n-부톡시, 아이소-부톡시, sec-부톡시, 및 tert-부톡시 등이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "-OAc" 또는 "-O-아실"은 구조 -O-C(=O)CH3을 갖는 아세틸옥시를 지칭한다.
본 명세서에 사용되는 "알케닐"은 하나 이상의 이중 결합을 함유하는 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 알케닐 기는 2개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "알케닐"의 경우도 포함한다. 알케닐 기는 또한 2개 내지 9개의 탄소 원자를 갖는 중간 크기 알케닐일 수 있다. 알케닐 기는 또한 2개 내지 6개의 탄소 원자를 갖는 저급 알케닐일 수 있다. 단지 예로서, "C2-C6 알케닐" 또는 "C2-6 알케닐"은 알케닐 사슬 내에 2 내지 6개의 탄소 원자가 존재함을 나타내며, 즉, 알케닐 사슬은 에테닐, 프로펜-1-일, 프로펜-2-일, 프로펜-3-일, 부텐-1-일, 부텐-2-일, 부텐-3-일, 부텐-4-일, 1-메틸-프로펜-1-일, 2-메틸-프로펜-1-일, 1-에틸-에텐-1-일, 2-메틸-프로펜-3-일, 부타-1,3-다이에닐, 부타-1,2-다이에닐, 및 부타-1,2-다이엔-4-일로 이루어진 군으로부터 선택된다. 전형적인 알케닐 기에는 에테닐, 프로페닐, 부테닐, 펜테닐, 및 헥세닐 등이 포함되지만 결코 이로 한정되지 않는다.
본 명세서에 사용되는 "알키닐"은 하나 이상의 삼중 결합을 포함하는 직쇄 또는 분지형 탄화수소 사슬을 지칭한다. 알키닐 기는 2개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "알키닐"의 경우도 포함한다. 알키닐 기는 또한 2개 내지 9개의 탄소 원자를 갖는 중간 크기 알키닐일 수 있다. 알키닐 기는 또한 2개 내지 6개의 탄소 원자를 갖는 저급 알키닐일 수 있다. 단지 예로서, "C2-6 알키닐" 또는 "C2-C6 알케닐"은 알키닐 사슬 내에 2 내지 6개의 탄소 원자가 있음을 나타내며, 즉, 알키닐 사슬은 에티닐, 프로핀-1-일, 프로핀-2-일, 부틴-1-일, 부틴-3-일, 부틴-4-일, 및 2-부티닐로 이루어진 군으로부터 선택된다. 전형적인 알키닐 기에는 에티닐, 프로피닐, 부티닐, 펜티닐, 및 헥시닐 등이 포함되지만 결코 이로 한정되지 않는다.
용어 "방향족"은 컨쥬게이트된 π 전자계를 갖는 고리 또는 고리계를 지칭하며, 카르보사이클릭 방향족 기(예를 들어, 페닐) 및 헤테로사이클릭 방향족 기(예를 들어, 피리딘)를 모두 포함한다. 이 용어는, 전체 고리계가 방향족이라면, 모노사이클릭 또는 융합 고리 폴리사이클릭(즉, 인접한 원자쌍을 공유하는 고리) 기를 포함한다.
본 명세서에 사용되는 "아릴"은 고리 백본 내에 탄소만을 함유하는 방향족 고리 또는 고리계(즉, 2개의 인접한 탄소 원자를 공유하는 2개 이상의 융합된 고리)를 지칭한다. 아릴이 고리계일 때, 시스템 내의 모든 고리는 방향족이다. 아릴 기는 6개 내지 18개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "아릴"의 경우도 포함한다. 일부 실시 형태에서, 아릴 기는 6 내지 10개의 탄소 원자를 갖는다. 아릴 기는 "C6-C10 아릴", "C6 또는 C10 아릴", 또는 유사한 명칭으로 지정될 수 있다. 아릴 기의 예에는 페닐, 나프틸, 아줄레닐, 및 안트라세닐이 포함되지만 이로 한정되지 않는다.
"아르알킬" 또는 "아릴알킬"은 치환체로서, 알킬렌 기를 통해 연결된 아릴 기, 예컨대 "C7-14 아르알킬" 등이며, 이에는 벤질, 2-페닐에틸, 3-페닐프로필, 및 나프틸알킬이 포함되지만 이로 한정되지 않는다. 일부 경우에, 알킬렌 기는 저급 알킬렌 기(즉, C1-6 알킬렌 기)이다.
본 명세서에 사용되는 "헤테로아릴"은 고리 백본 내에 하나 이상의 헤테로원자, 즉, 질소, 산소 및 황을 포함하지만 이로 한정되지 않는 탄소 이외의 원소를 함유하는 방향족 고리 또는 고리계(즉, 2개의 인접한 원자를 공유하는 2개 이상의 융합된 고리)를 지칭한다. 헤테로아릴이 고리계일 때, 시스템 내의 모든 고리는 방향족이다. 헤테로아릴 기는 5개 내지 18개의 고리 구성원(즉, 탄소 원자 및 헤테로원자를 포함하는 고리 백본을 구성하는 원자수)을 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "헤테로아릴"의 경우도 포함한다. 일부 실시 형태에서, 헤테로아릴 기는 5개 내지 10개의 고리 구성원 또는 5 내지 7개의 고리 구성원을 갖는다. 헤테로아릴 기는 "5원 내지 7원 헤테로아릴", "5원 내지 10원 헤테로아릴", 또는 유사한 명칭으로 지정될 수 있다. 헤테로아릴 고리의 예에는 푸릴, 티에닐, 프탈라지닐, 피롤릴, 옥사졸릴, 티아졸릴, 이미다졸릴, 피라졸릴, 아이소옥사졸릴, 아이소티아졸릴, 트라이아졸릴, 티아디아졸릴, 피리디닐, 피리다지닐, 피리미디닐, 피라지닐, 트리아지닐, 퀴놀리닐, 아이소퀴놀리닐, 벤즈이미다졸릴, 벤족사졸릴, 벤조티아졸릴, 인돌릴, 아이소인돌릴, 및 벤조티에닐이 포함되지만 이로 한정되지 않는다.
"헤테로아르알킬" 또는 "헤테로아릴알킬"은 치환체로서, 알킬렌 기를 통해 연결된 헤테로아릴 기이다. 예에는 2-티에닐메틸, 3-티에닐메틸, 푸릴메틸, 티에닐에틸, 피롤릴알킬, 피리딜알킬, 아이소옥사졸릴알킬, 및 이미다졸릴알킬이 포함되지만 이로 한정되지 않는다. 일부 경우에, 알킬렌 기는 저급 알킬렌 기(즉, C1-6 알킬렌 기)이다.
본 명세서에 사용되는 "카르보사이클릴"은 고리계 골격에 탄소 원자만을 포함하는 비방향족 사이클릭 고리 또는 고리계를 의미한다. 카르보사이클릴이 고리계인 경우에는, 2개 이상의 고리가 융합된, 가교된 또는 스피로 연결된 형태로 함께 결합될 수 있다. 카르보사이클릴은 고리계의 적어도 하나의 고리가 방향족이 아니면 임의의 포화도를 가질 수 있다. 따라서, 카르보사이클릴에는 사이클로알킬, 사이클로알케닐, 및 사이클로알키닐이 포함된다. 카르보사이클릴 기는 3개 내지 20개의 탄소 원자를 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "카르보사이클릴"의 경우도 포함한다. 카르보사이클릴 기는 또한 3개 내지 10개의 탄소 원자를 갖는 중간 크기 카르보사이클릴일 수 있다. 카르보사이클릴 기는 또한 3개 내지 6개의 탄소 원자를 갖는 카르보사이클릴일 수 있다. 카르보사이클릴 기는 "C3-6 카르보사이클릴", "C3-C6 카르보사이클릴" 또는 유사한 명칭으로 지정될 수 있다. 카르보사이클릴 고리의 예에는 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실, 사이클로헥세닐, 2,3-다이하이드로-인덴, 바이사이클[2.2.2]옥타닐, 아다만틸, 및 스피로 [4.4]노나닐이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "사이클로알킬"은 완전 포화 카보사이클릴 고리 또는 고리계를 의미한다. 예에는 사이클로프로필, 사이클로부틸, 사이클로펜틸, 및 사이클로헥실이 포함된다.
본 명세서에 사용되는 "헤테로사이클릴"은 고리 골격에 적어도 하나의 헤테로원자를 포함하는 비방향족 사이클릭 고리 또는 고리계를 의미한다. 헤테로사이클릴은 융합된, 가교된 또는 스피로 연결된 형태로 함께 결합될 수 있다. 헤테로사이클릴은 고리계의 적어도 하나의 고리가 방향족이 아니면 임의의 포화도를 가질 수 있다. 헤테로원자(들)는 고리계의 비방향족 또는 방향족 고리 중 어느 하나에 존재할 수 있다. 헤테로사이클릴 기는 3개 내지 20개의 고리 구성원(즉, 탄소 원자 및 헤테로원자를 포함하는 고리 골격을 구성하는 원자수)을 가질 수 있지만, 본 정의는 수치 범위가 지정되지 않은 용어 "헤테로사이클릴"의 경우도 포함한다. 헤테로사이클릴 기는 또한 3개 내지 10개의 고리 구성원을 갖는 중간 크기 헤테로사이클릴일 수 있다. 헤테로사이클릴 기는 또한 3개 내지 6개의 고리 구성원을 갖는 헤테로사이클릴일 수 있다. 헤테로사이클릴 기는 "3원 내지 6원 헤테로사이클릴" 또는 유사한 명칭으로 지정될 수 있다. 바람직한 6원 모노사이클릭 헤테로사이클릴에서, 헤테로원자(들)는 O, N 또는 S 중 1개 내지 최대 3개로부터 선택되며, 바람직한 5원 모노사이클릭 헤테로사이클릴에서, 헤테로원자(들)는 O, N, 또는 S로부터 선택되는 1개 또는 2개의 헤테로원자로부터 선택된다. 헤테로사이클릴 고리의 예에는 아제피닐, 아크리디닐, 카르바졸릴, 신놀리닐, 다이옥솔라닐, 이미다졸리닐, 이미다졸리디닐, 모르폴리닐, 옥시라닐, 옥세파닐, 티에파닐, 피페리디닐, 피페라지닐, 다이옥소피페라지닐, 피롤리디닐, 피롤리도닐, 피롤리디오닐, 4-피페리도닐, 피라졸리닐, 피라졸리디닐, 1,3-다이옥시닐, 1,3-다이옥사닐, 1,4-다이옥시닐, 1,4-다이옥사닐, 1,3-옥사티아닐, 1,4-옥사티이닐, 1,4-옥사티아닐, 2H-1,2-옥사지닐, 트라이옥사닐, 헥사하이드로-1,3,5-트라이아지닐, 1,3-다이옥솔릴, 1,3-다이옥솔라닐, 1,3-다이티올릴, 1,3-다이티올라닐, 아이소옥사졸리닐, 아이소옥사졸리디닐, 옥사졸리닐, 옥사졸리디닐, 옥사졸리디노일, 티아졸리닐, 티아졸리디닐, 1,3-옥사티올라닐, 인돌리닐, 아이소인돌리닐, 테트라하이드로푸라닐, 테트라하이드로피라닐, 테트라하이드로티오페닐, 테트라하이드로티오피라닐, 테트라하이드로-1,4-티아지닐, 티아모르폴리닐, 다이하이드로벤조푸라닐, 벤즈이미다졸리디닐, 및 테트라하이드로퀴놀린이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 "알콕시알킬" 또는 "(알콕시)알킬"은 알킬렌 기를 통해 연결된 알콕시 기, 예컨대 C2-C8 알콕시알킬, 또는 (C1-C6 알콕시)C1-C6 알킬, 예를 들어 -(CH2)1-3-OCH3를 지칭한다.
"O-카르복시" 기는 "-OC(=O)R" 기를 지칭하며, 여기서 R은 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"C-카르복시" 기는 "-C(=O)OR" 기를 지칭하며, 여기서 R은 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로 이루어진 군으로부터 선택되며, 이는 본 명세서에 정의된 바와 같다. 비제한적인 예에는 카르복실(즉, -C(=O)OH)이 포함된다.
"설포닐" 기는 "-SO2R" 기를 지칭하며, 여기서 R은 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"설피노" 기는 "-S(=O)OH" 기를 지칭한다.
"설포" 기는 "-S(=O)2OH" 또는 "-SO3H" 기를 지칭한다.
"설포네이트" 기는 "-SO3ㄿ" 기를 지칭한다.
"설페이트" 기는 "-SO4ㄿ" 기를 지칭한다.
"S-설폰아미도" 기는 "-SO2NRARB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"N-설폰아미도" 기는 "-N(RA)SO2RB" 기를 지칭하며, 여기서 RA 및 Rb는 각각 독립적으로 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"C-아미도" 기는 "-C(=O)NRARB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"N-아미도" 기는 "-N(RA)C(=O)RB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다.
"아미노" 기는 "-NRARB" 기를 지칭하며, 여기서 RA 및 RB는 각각 독립적으로 수소, C1-6 알킬, C2-6 알케닐, C2-6 알키닐, C3-7 카르보사이클릴, C6-10 아릴, 5원 내지 10원 헤테로아릴, 및 3원 내지 10원 헤테로사이클릴로부터 선택되며, 이는 본 명세서에 정의된 바와 같다. 비제한적인 예에는 유리 아미노(즉, -NH2)가 포함된다.
"아미노알킬" 기는 알킬렌 기를 통해 연결된 아미노 기를 지칭한다.
"알콕시알킬" 기는 알킬렌 기를 통해 연결된 알콕시 기, 예를 들어 "C2-C8 알콕시알킬" 등을 지칭한다.
기가 "임의로 치환된"으로 기재되는 경우, 이는 비치환 또는 치환될 수 있다. 마찬가지로, 기가 "치환된" 것으로 기술되는 경우, 치환체는 하나 이상의 표시된 치환체로부터 선택될 수 있다. 본 명세서에 사용되는 치환된 기는 비치환된 모 기(parent group)의 하나 이상의 수소 원자를 다른 원자 또는 기로 교환한 것으로부터 유도된다. 달리 지시되지 않는 한, 기가 "치환된" 것으로 간주될 때, 이는 해당 기가 C1-C6 알킬, C1-C6 알케닐, C1-C6 알키닐, C3-C7 카르보사이클릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), C3-C7-카르보사이클릴-C1-C6-알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 3원 내지 10원 헤테로사이클릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 3원 내지 10원 헤테로사이클릴-C1-C6-알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 아릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 아릴(C1-C6)알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 5원 내지 10원 헤테로아릴(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 5원 내지 10원 헤테로아릴(C1-C6)알킬(할로, C1-C6 알킬, C1-C6 알콕시, C1-C6 할로알킬, 및 C1-C6 할로알콕시로 선택적으로 치환됨), 할로, -CN, 하이드록시, C1-C6 알콕시, C1-C6 알콕시(C1-C6)알킬(즉, 에테르), 아릴옥시, 설피드릴(메르캅토), 할로(C1-C6)알킬(예컨대, -CF3), 할로(C1-C6)알콕시(예컨대, -OCF3), C1-C6 알킬티오, 아릴티오, 아미노, 아미노(C1-C6)알킬, 니트로, O-카르바밀, N-카르바밀, O-티오카르바밀, N-티오카르바밀, C-아미도, N-아미도, S-설폰아미도, N-설폰아미도, C-카르복시, O-카르복시, 아실, 시아나토, 아이소시아나토, 티오시아나토, 아이소티오시아나토, 설피닐, 설포닐, -SO3H, 설포네이트, 설페이트, 설피노, -OSO2C1-C4알킬, 및 옥소(=O)로부터 독립적으로 선택되는 하나 이상의 치환체로 치환됨을 의미한다. 기가 "선택적으로 치환된"으로 기재되는 경우에는 언제든지, 그 기는 상기 치환체로 치환될 수 있다. 일부 실시 형태에서, 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 카르보사이클릴 또는 헤테로사이클릴 기가 치환된 경우, 각각은 할로, -CN, -SO3 ㄿ, -OSO3 ㄿ, -SO3H, -SRA, -ORA, -NRBRC, 옥소, -CONRBRC, -SO2NRBRC, -COOH, 및 -COORB로 이루어진 군으로부터 독립적으로 선택되는 하나 이상의 치환체로 치환되며, 여기서, RA, RB 및 RC는 각각 독립적으로 H, 알킬, 치환된 알킬, 알케닐, 치환된 알케닐, 알키닐, 치환된 알키닐, 아릴, 및 치환된 아릴로부터 선택된다.
당업자에 의해 이해되는 바와 같이, 본 명세서에 기재된 화합물은 이온화된 형태, 예컨대, -CO2 ㄿ, -SO3 ㄿ 또는 -O-SO3ㄿ으로 존재할 수 있다. 화합물이 양으로 또는 음으로 하전된 치환기, 예를 들어 -SO3 ㄿ을 함유하는 경우, 그것은 또한, 화합물이 전체적으로 중성이 되게 하는 음으로 또는 양으로 하전된 반대이온을 함유할 수 있다. 다른 태양에서, 화합물은 염 형태로 존재할 수 있으며, 여기서는 반대이온이 짝산 또는 짝염기에 의해 제공된다.
소정의 라디칼 명명 규약은 문맥에 따라 모노-라디칼 또는 다이-라디칼 중 어느 하나를 포함할 수 있음이 이해되어야 한다. 예를 들어, 치환체가 분자의 나머지 부분에 대한 2개의 부착점을 필요로 하는 경우, 치환체는 다이-라디칼인 것으로 이해된다. 예를 들어, 2개의 부착점을 필요로 하는 알킬로 확인되는 치환체는 다이-라디칼, 예컨대 -CH2-, -CH2CH2-, -CH2CH(CH3)CH2- 등을 포함한다. 다른 라디칼 명명 규약은 라디칼이 "알킬렌" 또는 "알케닐렌"과 같은 다이-라디칼임을 명확하게 나타낸다.
2개의 "인접한" R 기가 "이들이 부착되어 있는 원자와 함께" 고리를 형성하는 것으로 언급되어 있을 때, 이는 원자들의 집합적 단위, 개재 결합, 및 2개의 R 기가 언급된 고리임을 의미한다. 예를 들어, 하기 하위구조가 존재하고:
R1 및 R2는 수소 및 알킬로 이루어진 군으로부터 선택되는 것으로 정의되거나, R1과 R2 는 이들이 부착되어 있는 원자와 함께 아릴 또는 카르보사이클릴을 형성하는 경우, 이는, R1 및 R2는 수소 또는 알킬로부터 선택될 수 있거나, 또는 대안적으로, 이 하위구조가 하기 구조를 가짐을 의미한다:
(상기 식에서, A는 표현된 이중 결합을 함유하는 아릴 고리 또는 카르보사이클릴임).
치환체가 다이-라디칼로서 표시된(즉, 분자의 나머지에 대해 2개의 부착점을 갖는) 경우는 어느 경우이든, 달리 지시되지 않는 한 치환체는 어떠한 방향 배치로도 부착될 수 있음이 이해되어야 한다. 따라서, 예를 들어, -AE- 또는 로 표시된 치환체는 A가 분자의 가장 왼쪽의 부착점에 부착되도록 치환체가 배향되는 것뿐만 아니라, A가 분자의 가장 오른쪽의 부착점에 부착되는 경우도 포함한다. 또한, 기 또는 치환체가 로 표시되고, L이 임의로 존재하는 링커 부분으로 정의되는 경우; L이 존재하지 않는 경우(또는 부재하는 경우), 이러한 기 또는 치환체는 에 상응한다.
본 명세서에 기재된 화합물은 몇몇 메소머 형태로 표시될 수 있다. 단일 구조가 그려져 있는 경우, 관련 메소머 형태들 중 임의의 것이 의도된다. 본 명세서에 기재된 비스-붕소 함유 염료는 단일 구조로 표시되지만, 관련된 메소머 형태들 중 임의의 것으로 동일하게 표시될 수 있다. 예시적인 메소머 구조가 화학식 I에 대해 하기에 나타나 있다:
본 명세서에 기재된 화합물의 단일 메소머 형태가 나타나 있는 각각의 경우에, 대안적인 메소머 형태가 동일하게 고려된다. 또한, 질소 원자 상의 양전하(질소 원자에 연결된 4개의 결합이 존재하는 경우) 및 붕소 원자 상의 음전하(붕소 원자에 연결된 4개의 결합이 존재하는 경우)는 특정 화합물 구조에서는 단순화를 위해 표시되지 않을 수 있다.
본 명세서에 사용되는 "뉴클레오티드"는 질소 함유 헤테로사이클릭 염기, 당, 및 하나 이상의 포스페이트 기를 포함한다. 이들은 핵산 서열의 단량체 단위이다. RNA에서, 당은 리보스이고, DNA에서는 데옥시리보스, 즉 리보스에 존재하는 하이드록시 기가 결여되어 있는 당이다. 질소 함유 헤테로사이클릭 염기는 퓨린, 데아자퓨린, 또는 피리미딘 염기일 수 있다. 퓨린 염기는 아데닌(A) 및 구아닌(G), 및 이들의 변형된 유도체 또는 유사체, 예컨대 7-데아자 아데닌 또는 7-데아자 구아닌을 포함한다. 피리미딘 염기는 시토신(C), 티민(T), 및 우라실(U), 및 이들의 변형된 유도체 또는 유사체를 포함한다. 데옥시리보스의 C-1 원자는 피리미딘의 N-1 또는 퓨린의 N-9에 결합된다.
본 명세서에 사용되는 "뉴클레오시드"는 뉴클레오티드와 구조적으로 유사하지만 포스페이트 부분이 존재하지 않는다. 뉴클레오시드 유사체의 한 예는 표지가 염기에 연결되어 있고 당 분자에 부착된 포스페이트 기가 없는 것일 것이다. 용어 "뉴클레오시드"는 당업자에게 명백한 이의 통상적인 의미로 본 명세서에 사용된다. 예에는 리보스 부분을 포함하는 리보뉴클레오시드 및 데옥시리보스 부분을 포함하는 데옥시리보뉴클레오시드가 포함되지만 이로 한정되지 않는다. 변형된 펜토스 모이어티는 산소 원자가 탄소로 치환되고/되거나 탄소가 황 또는 산소 원자로 치환된 펜토스 모이어티이다. "뉴클레오시드"는 치환된 염기 및/또는 당 부분을 가질 수 있는 단량체이다. 추가로, 뉴클레오시드는 더 큰 DNA 및/또는 RNA 중합체 및 올리고머 내로 도입될 수 있다.
용어 "퓨린 염기"는 당업자에게 명백한 이의 통상적인 의미로 본 명세서에 사용되며, 이의 호변이성질체를 포함한다. 유사하게, 용어 "피리미딘 염기"는 당업자에게 명백한 이의 통상적인 의미로 본 명세서에 사용되며, 이의 호변이성질체를 포함한다. 선택적으로 치환된 퓨린-염기의 비제한적인 목록은 퓨린, 아데닌, 구아닌, 데아자퓨린, 7-데아자 아데닌, 7-데아자 구아닌, 하이포잔틴, 잔틴, 알록잔틴, 7-알킬구아닌(예를 들어, 7-메틸구아닌), 테오브로민, 카페인, 요산 및 아이소구아닌을 포함한다. 피리미딘 염기의 예에는 시토신, 티민, 우라실, 5,6-다이하이드로우라실 및 5-알킬시토신(예를 들어, 5-메틸시토신)이 포함되지만 이로 한정되지 않는다.
본 명세서에 사용되는 바와 같이, 올리고뉴클레오티드 또는 폴리뉴클레오티드가 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드를 "포함하는" 것으로 기재될 때, 그것은 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드가 올리고뉴클레오티드 또는 폴리뉴클레오티드와 공유 결합을 형성한다는 것을 의미한다. 유사하게, 뉴클레오시드 또는 뉴클레오티드가 올리고뉴클레오티드 또는 폴리뉴클레오티드의 일부로서 기재될 때, 예컨대 올리고뉴클레오티드 또는 폴리뉴클레오티드 "에 도입된" 것으로 기재될 때, 그것은 본 명세서에 기재된 뉴클레오시드 또는 뉴클레오티드가 올리고뉴클레오티드 또는 폴리뉴클레오티드와 공유 결합을 형성한다는 것을 의미한다. 일부 그러한 실시 형태에서, 공유 결합은 올리고뉴클레오티드 또는 폴리뉴클레오티드의 3' 탄소 원자와 뉴클레오티드의 5' 탄소 원자 사이의 포스포다이에스테르 결합으로서, 올리고뉴클레오티드 또는 폴리뉴클레오티드의 3' 하이드록시 기와 본 명세서에 기재된 뉴클레오티드의 5' 포스페이트 기 사이에 형성된다.
본 명세서에 사용되는 용어 "절단가능한 링커"는 전체 링커가 제거되어야 하는 것을 내포하는 것으로 의미하지 않는다. 절단 부위는 링커의 일부가 절단 후 검출가능한 표지 및/또는 뉴클레오시드 또는 뉴클레오티드 부분에 부착된 채로 남아 있는 것을 보장하는 링커 상의 위치에 위치될 수 있다.
본 명세서에 사용되는 "유도체" 및 "유사체"는 변형된 염기 부분 및/또는 변형된 당 부분을 갖는 합성 뉴클레오티드 또는 뉴클레오시드 유도체를 의미한다. 그러한 유도체 및 유사체는, 예를 들어 문헌[Scheit, Nucleotide Analogs (John Wiley & Son, 1980)] 및 문헌[Uhlman et al., Chemical Reviews 90:543-584, 1990]에 논의되어 있다. 뉴클레오티드 유사체는 또한, 포스포로티오에이트, 포스포로다이티오에이트, 알킬-포스포네이트, 포스포르아닐리데이트 및 포스포르아미데이트 결합을 포함한 변형된 포스포다이에스테르 결합을 포함할 수 있다. 본 명세서에 사용되는 "유도체", "유사체" 및 "변형된"은 상호교환 가능하게 사용될 수 있으며, 본 명세서에 정의된 용어 "뉴클레오티드" 및 "뉴클레오시드"에 의해 포함된다.
본 명세서에 사용되는 용어 "포스페이트"는 당업자에게 명백한 이의 통상적인 의미로 사용되고, 이의 양성자화 형태(예를 들어, 및 )를 포함한다. 본 명세서에 사용되는 용어 "모노포스페이트", "다이포스페이트" 및 "트라이포스페이트"는 당업자에게 명백한 이의 통상적인 의미로 사용되고, 양성자화 형태를 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "페이징"은 3' 종결자 및 형광단의 불완전한 제거 및/또는 주어진 서열분석 사이클에서 폴리머라제에 의한 클러스터 내로의 DNA 가닥의 일부분의 도입의 실패로 인해 야기되는 SBS에서의 현상을 지칭한다. 프리페이징은 효과적인 3' 종결자를 갖지 않는 뉴클레오티드의 도입에 의해 야기되는데, 여기서 이러한 도입 이벤트는 종결 실패로 인해 1 사이클 먼저 앞서 간다. 페이징 및 프리페이징은 특정 사이클에 대해 측정된 신호 강도가 현재 사이클로부터의 신호뿐만 아니라 선행 사이클 및 후행 사이클로부터의 잡음으로 이루어지게 한다. 사이클 수가 증가함에 따라, 페이징 및 프리페이징에 의해 영향을 받는 클러스터당 서열의 분율이 증가하여, 올바른 염기의 확인을 방해한다. 프리페이징은 합성에 의한 서열분석(SBS) 동안 미량의 보호되지 않거나 블록킹되지 않은 3'-OH 뉴클레오티드의 존재에 의해 야기될 수 있다. 비보호된 3'-OH 뉴클레오티드는 제조 공정 동안 또는 가능하게는 저장 및 시약 취급 과정 동안 생성될 수 있다. 따라서, 프리페이징의 발생을 감소시키는 뉴클레오티드 유사체의 발견은 놀라우며, 기존의 뉴클레오티드 유사체에 비해 SBS 응용에서 큰 이점을 제공한다. 예를 들어, 제공된 뉴클레오티드 유사체는 더 빠른 SBS 사이클 시간, 더 낮은 페이징 및 프리페이징 값, 및 더 긴 서열분석 판독 길이를 초래할 수 있다.
화학식 I의 비스-붕소 융합 헤테로사이클을 함유하는 염료
본 발명의 일부 태양은 하기 화학식 I의 비스-붕소 함유 염료, 및 이의 염 및 메소머 형태에 관한 것이다:
[화학식 I]
(상기 식에서, R1, R2, R3 및 R4의 각각은 독립적으로 H, 비치환 또는 치환된 C1-C6 알킬, C1-C6 알콕시, C2-C6 알케닐, C2-C6 알키닐, C1-C6 할로알킬, C1-C6 할로알콕시, C1-C6 하이드록시알킬, (C1-C6 알콕시)(C1-C6 알킬), 비치환 또는 치환된 아미노, 할로, 시아노, 하이드록시, 니트로, 설포닐, 설피노, 설포, 설포네이트, S-설폰아미도, N-설폰아미도, 비치환 또는 치환된 C3-C10 카르보사이클릴, 비치환 또는 치환된 C6-C10 아릴, 비치환 또는 치환된 5원 내지 10원 헤테로아릴, 또는 비치환 또는 치환된 3원 내지 10원 헤테로사이클릴이고;
Ra, Rb, Rc 및 Rd의 각각은 독립적으로 할로, 시아노, C1-C6 알킬, C1-C6 할로알킬, C1-C6 알콕시, C1-C6 할로알콕시, C6-C10 아릴, C6-C10 아릴옥시, 또는 -O-C(=O)R5이고;
대안적으로, Ra와 Rb 둘 모두가 -O-C(=O)R5인 경우, 2개의 R5는 이들이 부착되어 있는 원자와 함께 비치환 또는 치환된 6원 내지 10원 헤테로사이클릴을 형성하고; Rc와 Rd 둘 모두가 -O-C(=O)R5인 경우, 2개의 R5는 이들이 부착되어 있는 원자와 함께 비치환 또는 치환된 6원 내지 10원 헤테로사이클릴을 형성하고;
R5는 비치환 또는 치환된 C1-C6 알킬이고;
고리 A는 하나 이상의 R6으로 선택적으로 치환된 6원, 7원, 8원, 9원 또는 10원 헤테로아릴이고;
각각의 R6은 독립적으로 비치환 또는 치환된 C1-C6 알킬, C1-C6 알콕시, C2-C6 알케닐, C2-C6 알키닐, C1-C6 할로알킬, C1-C6 할로알콕시, C1-C6 하이드록시알킬, (C1-C6 알콕시)(C1-C6 알킬), -NR7R8, 할로, 시아노, 카르복실, 하이드록시, 니트로, 설포닐, 설피노, 설포, 설포네이트, S-설폰아미도, N-설폰아미도, 비치환 또는 치환된 C3-C10 카르보사이클릴, 비치환 또는 치환된 C6-C10 아릴, 비치환 또는 치환된 5원 내지 10원 헤테로아릴, 또는 비치환 또는 치환된 3원 내지 10원 헤테로사이클릴이고;
R7 및 R8의 각각은 독립적으로 H, 비치환 또는 치환된 C1-C6 알킬이거나, 또는 R7과 R8은 이들이 부착되어 있는 질소 원자와 함께 비치환 또는 치환된 3원 내지 10원 헤테로사이클릴을 형성하되;
단, Ra, Rb, Rc 및 Rd의 각각이 플루오로인 경우, R1, R2, R3, R4, 및 고리 A 중 적어도 하나는 카르복실 기를 포함함). 일부 추가의 실시 형태에서, R1, R2, R3, R4, 및 고리 A 중 적어도 하나는 카르복실 기를 포함한다. 일부 추가의 실시 형태에서, R1, R2, R3, R4, 및 고리 A 중 하나는 카르복실 기를 포함한다.
화학식 I의 화합물의 일부 실시 형태에서, 고리 A는 하나 이상의 R6으로 선택적으로 치환된 6원 헤테로아릴이다. 일부 실시 형태에서, 6원 헤테로아릴은 1개 또는 2개의 질소 원자를 포함한다. 추가의 실시 형태에서, 6원 헤테로아릴은 피리딜, 피리미딜 또는 피라지닐이다. 추가의 실시 형태에서, 화학식 I의 화합물은 또한 화학식 Ia 또는 화학식 Ib, 또는 이의 염 또는 메소머 형태로 표시된다:
[화학식 Ia]
[화학식 Ib]
(상기 식에서, m은 0, 1, 2, 또는 3임).
추가의 실시 형태에서, 화학식 Ia의 화합물은 또한 화학식 Ic로 표시되고, 화학식 Ib의 화합물은 또한 화학식 Id 또는 화학식 Ie, 또는 이의 염 또는 메소머 형태로 표시된다:
[화학식 Ic]
[화학식 Id]
[화학식 Ie]
화학식 I 및 화학식 Ia 내지 화학식 Ie의 화합물의 일부 실시 형태에서, 각각의 R6은 독립적으로 할로, 시아노, 카르복실, 비치환 또는 치환된 C1-C6 알킬, 비치환된 페닐, 카르복실로 치환된 페닐, 비치환된 5원 헤테로아릴, 카르복실로 치환된 5원 헤테로아릴, 또는 -NR7R8이다. 일부 실시 형태에서, R6은 할로(예컨대, 플루오로, 클로로 또는 브로모)이다. 일부 실시 형태에서, R6은 비치환된 푸란, 또는 카르복실로 치환된 푸란이다. 일부 추가의 실시 형태에서, R6은 할로, -CN, -SO3 ㄿ, -SO3H, -NH2, -NH(C1-C6 알킬), -N(C1-C6 알킬)2, -C(=O)OH, 및 -C(=O)O(C1-C6 알킬)로 이루어진 군으로부터 선택되는 하나 이상의 치환체로 독립적으로 치환된, 치환된 C1-C6 알킬(예를 들어, 메틸, 에틸, n-프로필, 아이소프로필, n-부틸, 아이소부틸, n-펜틸, 아이소펜틸, n-헥실 또는 아이소헥실)이다. 일부 추가의 실시 형태에서, R6은 -NR7R8이고, R7은 H이고, R8은 카르복실, 설포 및 설포네이트로 이루어진 군으로부터 선택되는 하나 이상의 치환체로 치환된 C1-C6 알킬이거나, 또는 R7과 R8은 이들이 부착되어 있는 질소 원자와 함께, 카르복시로 치환된 3원 내지 10원 헤테로사이클릴(예컨대, 질소 원자, 또는 하나의 질소와 두 번째 헤테로원자, 예컨대 산소 또는 황을 포함하는 4원, 5원, 6원, 또는 7원 헤테로사이클릴)을 형성한다. 일부 추가의 실시 형태에서, R6은 , 또는 이고, 각각의 고리 구조는 카르복실로 선택적으로 치환된다.
화학식 I 및 화학식 Ia 내지 화학식 Ie의 화합물의 일부 실시 형태에서, R1, R2 및 R3의 각각은 H이다. 일부 다른 실시 형태에서, R1, R2 및 R3의 각각은 독립적으로 비치환된 C1-C6 알킬(예컨대, 메틸, 에틸, n-프로필, 아이소프로필, n-부틸, 아이소부틸, n-펜틸, 아이소펜틸, n-헥실 또는 아이소헥실)이다. 일 실시 형태에서, R1 및 R3의 각각은 메틸이고 R2는 에틸이다. 일부 다른 실시 형태에서, R1, R2 및 R3 중 2개는 H 또는 비치환된 C1-C6 알킬이고, R1, R2 및 R3 중 하나는 할로, 페닐, 5원 또는 6원 헤테로아릴, 카르복실, 또는 카르복실로 치환된 C1-C6 알킬이다. 추가의 실시 형태에서, R1 및 R3의 각각은 메틸이고, R2는 브로모, 클로로, 플루오로, 페닐, 카르복실, 또는 -CH2-COOH이다.
화학식 I 및 화학식 Ia 내지 화학식 Ie의 화합물의 일부 실시 형태에서, R4는 H 또는 비치환된 C1-C6 알킬이다. 일부 다른 실시 형태에서, R4는 카르복실로 각각 치환된 C1-C6 알킬 또는 페닐이다.
화학식 I 및 화학식 Ia 내지 화학식 Ie의 화합물의 일부 실시 형태에서, Ra 및 Rb의 각각은 독립적으로 플루오로, 시아노, 메틸, 트라이플루오로메틸, 메톡시, 페닐, 페녹시, 또는 -O- 아실
(-OC(=O)CH3 또는 -OAc)이다. 추가의 실시 형태에서, Ra와 Rb 둘 모두는 플루오로, 메틸, 트라이플루오로메틸, 메톡시, 또는 -O-아실이다. 다른 실시 형태에서, Ra와 Rb 둘 모두는 -OC(=O)R5이고, 2개의 R5는 이들이 부착되어 있는 원자와 함께 구조 를 갖는 6원 헤테로사이클릴을 형성하고, 이 구조의 메틸렌 모이어티는 플루오로, 메틸, 트라이플루오로메틸, 메톡시, 페닐 또는 페녹시로부터 선택되는 1개 또는 2개의 치환체로 선택적으로 치환될 수 있다. 일부 실시 형태에서, Rc 및 Rd의 각각은 독립적으로 플루오로, 시아노, 메틸, 트라이플루오로메틸, 메톡시, 페닐, 페녹시, 또는 -O-아실이다. 추가의 실시 형태에서, Rc와 Rd 둘 모두는 플루오로, 메틸, 트라이플루오로메틸, 메톡시, 또는 -O-아실이다. 다른 실시 형태에서, Rc와 Rd 둘 모두는 -OC(=O)R5이고, 2개의 R5는 이들이 부착되어 있는 원자와 함께 구조 를 갖는 6원 헤테로사이클릴을 형성하고, 이 구조의 메틸렌 모이어티는 플루오로, 메틸, 트라이플루오로메틸, 메톡시, 페닐 또는 페녹시로부터 선택되는 1개 또는 2개의 치환체로 선택적으로 치환될 수 있다.
화학식 I 및 화학식 Ia 내지 화학식 Ie의 화합물의 임의의 실시 형태에서, C3-C10 카르보사이클릴(예컨대, C3-C10 사이클로알킬), C6-C10 아릴, 5원 내지 10원 헤테로아릴, 또는 3원 내지 10원 헤테로사이클릴이 치환되는 경우, 하나 이상의 R6로 치환될 수 있다. 기가 치환된 C1-C6 알킬로서 정의될 때, 기는 카르복실, 카르복실레이트, 설포, 설포네이트, -C(O)O(C1-C6 알킬) 또는 -C(O)NReRf로 치환된 C1, C2, C3, C4, C5 또는 C6 알킬(예컨대, 메틸, 에틸, n-프로필, 아이소프로필, n-부틸, 아이소부틸, n-펜틸, 아이소펜틸, n-헥실 또는 아이소헥실)일 수 있고, 각각의 Re 및 Rf는 독립적으로 H, 또는 카르복실, 카르복실레이트, 설포 또는 설포네이트로 치환된 C1-C6 알킬이다.
화학식 I의 화합물의 추가 실시 형태에는
(I-32), (I-33) 및 (I-34), 및 이들의 염 및 메소머 형태가 포함되지만 이로 한정되지 않는다. 비제한적인 예에는 상응하는 C1-C6 알킬 카르복실산 에스테르(예컨대 화합물의 카르복실산 기로부터 형성된 메틸 에스테르, 에틸 에스테르 아이소프로필 에스테르, 및 t-부틸 에스테르)이 포함된다.
본 명세서에 기재된 비스-붕소 융합 헤테로사이클릭 화합물의 임의의 실시 형태에서, 화합물은 공유 결합된 광-보호 모이어티, 예를 들어 사이클로옥타테트라엔 모이어티를 도입시키도록 추가로 변형될 수 있다.
표지된 뉴클레오티드
본 발명의 일 태양에 따르면, 본 명세서에 기재된 염료 화합물은 기질 모이어티에 대한 부착에 적합하며, 특히 기질 모이어티에 대한 부착을 가능하게 하는 링커 기를 포함한다. 기질 모이어티는 사실상 본 발명의 염료가 접합될 수 있는 임의의 분자 또는 물질일 수 있으며, 비제한적인 예로서, 뉴클레오시드, 뉴클레오티드, 폴리뉴클레오티드, 탄수화물, 리간드, 입자, 고체 표면, 유기 및 무기 중합체, 염색체, 핵, 살아있는 세포, 및 이들의 조합 또는 집합체를 포함할 수 있다. 염료는 소수성 인력, 이온성 인력, 및 공유 부착을 포함하는 다양한 수단에 의해 선택적인 링커에 의해 접합될 수 있다. 일부 태양에서, 염료는 공유 부착에 의해 기질에 접합된다. 더 특히, 공유 부착은 링커 기에 의한 것이다. 일부 경우에, 그러한 표지된 뉴클레오티드는 "변형된 뉴클레오티드"로도 지칭된다.
본 발명의 일부 태양은 본 명세서에 기재된 바와 같은 화학식 I(화학식 Ia 내지 화학식 Ie)의 염료, 또는 이의 메소머 형태의 염, 또는 본 명세서에 기재된 광-보호 모이어티 COT를 함유하는 이의 유도체로 표지된 뉴클레오티드에 관한 것이다. 표지된 뉴클레오티드 또는 올리고뉴클레오티드는 카르복실(-CO2H) 또는 알킬-카르복실 기를 통해 본 명세서에 개시된 염료 화합물에 부착되어 아미드 또는 알킬-아미드 결합을 형성할 수 있다. 일부 추가의 실시 형태에서, 카르복실 기는 뉴클레오티드 또는 올리고뉴클레오티드의 아미노 또는 하이드록시 기에 부착하기 위해 사용될 수 있는, 활성화된 형태의 카르복실 기, 예를 들어, 아미드 또는 에스테르의 형태일 수 있다. 본 명세서에 사용되는 바와 같이 용어 "활성화된 에스테르"는 예를 들어, 온화한 조건에서 아미노 기를 함유하는 화합물과 반응할 수 있는 카르복실 기 유도체를 지칭한다. 활성화된 에스테르의 비제한적인 예에는 p-니트로페닐, 펜타플루오로페닐 및 석신이미도 에스테르가 포함되지만 이로 한정되지 않는다.
예를 들어, 화학식 I(화학식 Ia 내지 화학식 Ie)의 염료 화합물은 화학식 I의 R1, R2, R3, R4, 및 고리 A 중 하나를 통해 뉴클레오티드에 부착될 수 있다. 일부 그러한 실시 형태에서, 화학식 I의 R1, R2, R3, R4, 및 고리 A 중 하나는 카르복실 기를 포함하고 부착은 화학식 I의 화합물의 카르복실 작용기와 뉴클레오티드 또는 뉴클레오티드 링커의 아미노 작용기 사이에 아미드 모이어티를 형성한다.
일부 실시 형태에서, 염료 화합물은 뉴클레오티드 염기를 통해 뉴클레오티드에 공유적으로 부착될 수 있다. 일부 이러한 실시 형태에서, 표지된 뉴클레오티드는 선택적으로 링커 모이어티를 통해 피리미딘 염기의 C5 위치 또는 7-데아자 퓨린 염기의 C7 위치에 부착된 염료를 가질 수 있다. 예를 들어, 핵염기는 7-데아자 아데닌일 수 있고, 염료는, 선택적으로 링커를 통해, C7 위치에서 7-데아자 아데닌에 부착된다. 핵염기는 7-데아자 구아닌일 수 있고, 염료는, 선택적으로 링커를 통해, C7 위치에서 7-데아자 구아닌에 부착된다. 핵염기는 시토신일 수 있고, 염료는, 선택적으로 링커를 통해, C5 위치에서 시토신에 부착된다. 다른 예로서, 핵염기는 티민 또는 우라실일 수 있고, 염료는, 선택적으로 링커를 통해, C5 위치에서 티민 또는 우라실에 부착된다.
3' 블록킹 기
표지된 뉴클레오티드 또는 올리고뉴클레오티드는 또한 뉴클레오티드의 리보스 또는 데옥시리보스 당에 공유적으로 부착된 블록킹 기를 가질 수 있다. 블록킹 기는 리보스 또는 데옥시리보스 당 상의 임의의 위치에 부착될 수 있다. 특정 실시 형태에서, 블록킹 기는 뉴클레오티드의 리보스 또는 데옥시리보스 당의 3' 위치에 있다. 다양한 3' 블록킹 기가 국제 특허 공개 WO2004/018497호 및 WO2014/139596호에 개시되어 있으며, 이들은 본 명세서에 참고로 포함된다. 예를 들어, 블록킹 기는 리보스 또는 데옥시리보스 모이어티의 3' 산소 원자에 연결되는 아지도메틸(-CH2N3) 또는 치환된 아지도메틸(예를 들어, -CH(CHF2)N3 또는 CH(CH2F)N3), 또는 알릴일 수 있다. 일부 실시 형태에서, 3' 블록킹 기는 아지도메틸로서, 이는 리보스 또는 데옥시리보스의 3' 탄소와 함께 3'-OCH2N3를 형성한다.
일부 다른 실시 형태에서, 3' 블록킹 기와 3' 산소 원자는 리보스 또는 데옥시리보스의 3' 탄소에 공유적으로 부착된 구조 의 아세탈 기를 형성하며, 여기서
각각의 R1a 및 R1b는 독립적으로 H, C1-C6 알킬, C1-C6 할로알킬, C1-C6 알콕시, C1-C6 할로알콕시, 시아노, 할로겐, 선택적으로 치환된 페닐, 또는 선택적으로 치환된 아르알킬이고;
각각의 R2a 및 R2b는 독립적으로 H, C1-C6 알킬, C1-C6 할로알킬, 시아노, 또는 할로겐이고;
대안적으로, R1a와 R2a는 이들이 부착되어 있는 원자와 함께, 선택적으로 치환된 5원 내지 8원 헤테로사이클릴 기를 형성하고;
RF는 H, 선택적으로 치환된 C2-C6 알케닐, 선택적으로 치환된 C3-C7 사이클로알케닐, 선택적으로 치환된 C2-C6 알키닐, 또는 선택적으로 치환된 (C1-C6 알킬렌)Si(R3a)3이고;
각각의 R3a는 독립적으로 H, C1-C6 알킬, 또는 선택적으로 치환된 C6-C10 아릴이다.
추가의 3' 하이드록시 블록킹 기는 미국 특허 출원 공개 제2020/0216891 A1호에 개시되어 있으며, 이는 전체적으로 참고로 포함된다. 아세탈 블록킹 기의 비제한적인 예에는 (AOM), , , 및 가 포함되며, 각각은 리보스 또는 데옥시리보스의 3' 탄소에 공유적으로 부착되어 있다.
3
'
블록킹 기의 탈보호
일부 실시 형태에서, 아지도메틸 3' 하이드록시 보호기는 수용성 포스핀 시약을 사용함으로써 제거되거나 탈보호될 수 있다. 비제한적인 예에는 트리스(하이드록시메틸)포스핀(THMP), 트리스(하이드록시에틸)포스핀(THEP) 또는 트리스(하이드록시프로필)포스핀(THP 또는 THPP)이 포함된다. 본 명세서에 기재된 3' 블록킹 기는 다양한 화학적 조건 하에서 제거되거나 절단될 수 있다. 비닐 또는 알케닐 모이어티를 함유하는 아세탈 블록킹 기 의 경우, 비제한적인 절단 조건은 포스핀 리간드, 예를 들어 트리스(하이드록시메틸)포스핀(THMP), 또는 트리스(하이드록시프로필)포스핀(THP 또는 THPP)의 존재 하에서 Pd(II) 착물, 예컨대 Pd(OAc)2 또는 알릴Pd(II) 클로라이드 이량체를 포함한다. 알키닐 기(예를 들어, 에티닐)를 함유하는 블록킹 기의 경우, 이들은 또한 포스핀 리간드(예를 들어, THP 또는 THMP)의 존재 하에서 Pd(II) 착물(예를 들어, Na2PdCl4, K2PdCl4, Pd(OAc)2 또는 알릴 Pd(II) 클로라이드 이량체)에 의해 제거될 수 있다.
팔라듐 절단 시약
일부 실시 형태에서, 본 명세서에 기재된 3' 블록킹 기는 팔라듐 촉매에 의해 절단될 수 있다. 일부 그러한 실시 형태에서, Pd 촉매는 수용성이다. 일부 그러한 실시 형태에서, Pd(0) 촉매(예를 들어, 트리스(3,3′,3″-포스피니딘트리스(벤젠설포네이토)팔라듐(0) 9나트륨 염 9수화물)이다. 일부 경우에, Pd(0) 착물은 알켄, 알코올, 아민, 포스핀, 또는 금속 수소화물과 같은 시약에 의해 Pd(II) 착물의 환원으로부터 계내(in situ)에서 생성될 수 있다. 적합한 팔라듐 공급원은 Na2PdCl4, K2PdCl4, Pd(CH3CN)2Cl2, (PdCl(C3H5))2, [Pd(C3H5)(THP)]Cl, [Pd(C3H5)(THP)2]Cl, Pd(OAc)2, Pd(Ph3)4, Pd(dba)2, Pd(Acac)2, PdCl2(COD), 및 Pd(TFA)2. 그러한 일 실시 형태에서, Pd(0) 착물은 Na2PdCl4로부터 계내에서 생성된다. 다른 실시 형태에서, 팔라듐 공급원은 알릴 팔라듐(II) 클로라이드 이량체 [(PdCl(C3H5))2]이다. 일부 실시 형태에서, Pd(0) 착물은 Pd(II) 착물을 포스핀과 혼합함으로써 수용액 중에서 생성된다. 적절한 포스핀은 수용성 포스핀, 예컨대 트리스(하이드록시프로필)포스핀(THP), 트리스(하이드록시메틸)포스핀(THMP), 1,3,5-트라이아자-7-포스파아다만탄(PTA), 비스(p-설포네이토페닐)페닐포스핀 2수화물 칼륨염, 트리스(카르복시에틸)포스핀(TCEP) 및 트라이페닐포스핀-3,3',3"-트라이설폰산 삼나트륨염을 포함한다.
일부 실시 형태에서, Pd(0)는 계내에서 Pd(II) 착물 [(PdCl(C3H5))2]을 THP와 혼합함으로써 제조된다. Pd(II) 착물과 THP의 몰비는 약 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9, 또는 1:10일 수 있다. 추가의 일부 실시 형태에서, 아스코르브산 또는 이의 염(예를 들어, 아스코르브산 나트륨)과 같은 하나 이상의 환원제가 첨가될 수 있다. 일부 실시 형태에서, 절단 혼합물은 추가의 완충 시약, 예컨대 1차 아민, 2차 아민, 3차 아민, 카르보네이트 염, 포스페이트 염, 또는 보레이트 염, 또는 이들의 조합을 함유할 수 있다. 일부 추가의 실시 형태에서, 완충 시약은 에탄올아민(EA), 트리스(하이드록시메틸)아미노메탄(Tris), 글리신, 탄산나트륨, 인산나트륨, 붕산나트륨, 2-다이메틸에탄올아민(DMEA), 2-다이에틸에탄올아민(DEEA), N,N,N′,N′-테트라메틸에틸렌다이아민(TEMED), 또는 N,N,N′,N′-테트라에틸에틸렌다이아민(TEEDA), 또는 이들의 조합을 포함한다. 일 실시 형태에서, 완충 시약은 DEEA이다. 다른 실시 형태에서, 완충 시약은 하나 이상의 무기염, 예컨대 카르보네이트염, 포스페이트염 또는 보레이트염, 또는 이들의 조합을 함유한다. 일 실시 형태에서, 무기염은 나트륨염이다.
링커
본 명세서에 개시된 바와 같은 염료 화합물은 기질 또는 다른 분자에 대한 이 화합물의 공유 부착을 위한 치환체 위치들 중 하나에 반응성 링커 기를 포함할 수 있다. 반응성 연결기는 결합(예를 들어, 공유 결합 또는 비공유 결합), 특히 공유 결합을 형성할 수 있는 모이어티이다. 특정 실시 형태에서, 링커는 절단가능한 링커일 수 있다. 용어 "절단가능한 링커"의 사용은 전체 링커가 제거될 것이 요구되는 것을 내포하는 것으로 의미되지 않는다. 절단 부위는 링커의 일부가 절단 후 염료 및/또는 기질 모이어티에 부착된 채로 남아 있는 것을 보장하는 링커 상의 위치에 위치될 수 있다. 절단가능한 링커는, 비제한적인 예로서, 친전자적으로 절단가능한 링커, 친핵적으로 절단가능한 링커, 광절단성 링커일 수 있으며, 이들은 환원성 조건(예를 들어, 다이설파이드 또는 아지드 함유 링커), 산화성 조건 하에서 절단가능하고, 안전성-캐치 링커(safety-catch linker)의 사용을 통해 절단가능하고, 제거 기전에 의해 절단가능하다. 염료 화합물을 기질 모이어티에 부착하기 위한 절단가능한 링커의 사용은 표지를, 필요하다면, 검출 후에 제거하여, 하류 단계들에서 어떠한 간섭 신호도 피할 수 있음을 보장한다.
유용한 링커 기를 국제 특허 출원 공개 WO2004/018493호(본 명세서에 참고로 포함됨)에서 찾아볼 수 있으며, 이의 예에는 전이 금속 및 적어도 부분적으로 수용성인 리간드로부터 형성된 수용성 전이 금속 촉매 또는 수용성 포스핀을 사용하여 절단될 수 있는 링커가 포함된다. 수용액 중에서, 후자는 적어도 부분적으로 수용성인 전이 금속 착물을 형성한다. 그러한 절단가능한 링커는 본 명세서에 기재된 염료와 같은 표지에 뉴클레오티드의 염기를 연결하는 데 사용될 수 있다.
특정 링커는 국제 특허 출원 공개 WO2004/018493호(본 명세서에 참고로 포함됨)에 개시된 것들, 예컨대 하기 화학식의 모이어티를 포함하는 것들을 포함한다:
(상기 식에서, X는 O, S, NH 및 NQ를 포함하는 군으로부터 선택되며, 여기서 Q는 C1-10 치환 또는 비치환된 알킬 기이고, Y는 O, S, NH 및 N(알릴)을 포함하는 군으로부터 선택되고, T는 수소 또는 C1-C10 치환 또는 비치환된 알킬 기이고, *는 모이어티가 뉴클레오티드 또는 뉴클레오시드의 나머지 부분에 연결되는 경우를 나타냄). 일부 태양에서, 링커는, 예를 들어 본 명세서에 기재된 염료 화합물과 같은 표지에 뉴클레오티드의 염기를 연결한다.
링커의 추가의 예에는 미국 특허 출원 공개 제2016/0040225호(본 명세서에 참고로 포함됨)에 개시된 것들, 예컨대 하기 화학식의 모이어티를 포함하는 것들이 포함된다:
(상기 식에서, *는 모이어티가 뉴클레오티드 또는 뉴클레오시드의 나머지 부분에 연결되는 경우를 나타냄). 본 명세서에 예시된 링커 모이어티는 뉴클레오티드/뉴클레오시드와 표지 사이의 전체 또는 부분 링커 구조를 포함할 수 있다. 본 명세서에 예시된 링커 모이어티는 뉴클레오티드/뉴클레오시드와 표지 사이의 전체 또는 부분 링커 구조를 포함할 수 있다.
링커의 추가적인 예는 하기 화학식의 모이어티를 포함한다:
, 또는
, (상기 식에서, B는 핵염기이고; Z는 -N3(아지도), -O-C1-C6 알킬, -O-C2-C6 알케닐, 또는 -O-C2-C6 알키닐이고; Fl는 추가 링커 구조를 포함할 수 있는 염료 모이어티를 포함함). 당업자는 본 명세서에 기재된 염료 화합물은 염료 화합물의 작용기(예를 들어, 카르복실)를 링커의 작용기(예를 들어, 아미노)와 반응시킴으로써 링커에 공유 결합됨을 이해한다. 일 실시 형태에서, 절단성 링커는 ("AOL" 링커 모이어티) (여기서, Z는 -O-알릴임)를 포함한다.
특정 실시 형태에서, 형광 염료(형광단)와 구아닌 염기 사이의 링커의 길이는, 예를 들어 폴리에틸렌 글리콜 스페이서 기를 도입함으로써 변경될 수 있으며, 그럼으로써 당업계에 알려진 다른 결합을 통해 구아닌 염기에 부착된 동일한 형광단과 비교하여 형광 강도를 증가시킬 수 있다. 예시적인 링커 및 그의 특성이 국제 특허 출원 공개 WO2007/020457호(본 명세서에 참고로 포함됨)에 기재되어 있다. 링커의 설계, 특히 그의 증가된 길이는, DNA와 같은 폴리뉴클레오티드 내로 도입될 때, 구아노신 뉴클레오티드의 구아닌 염기에 부착된 형광단의 밝기의 개선을 가능하게 할 수 있다. 따라서, 염료가 구아닌-함유 뉴클레오티드에 부착된 형광 염료 표지의 검출을 필요로 하는 임의의 분석 방법에 사용하기 위한 것일 때, 국제 특허 공개 제2007/020457호에 기재된 바와 같이, 링커가 화학식 -((CH2)2O)n-(여기서, n은 2 내지 50의 정수임)의 스페이서 기를 포함하는 경우에 유리하다.
뉴클레오시드 및 뉴클레오티드는 당 또는 핵염기 상의 부위에 표지될 수 있다. 당업계에 알려진 바와 같이, "뉴클레오티드"는 질소성 염기(nitrogenous base), 당 및 하나 이상의 포스페이트 기로 이루어진다. RNA에서, 당은 리보스이고, DNA에서는 데옥시리보스, 즉, 리보스에 존재하는 하이드록시 기가 결여되어 있는 당이다. 질소성 염기는 퓨린 또는 피리미딘의 유도체이다. 퓨린은 아데닌(A) 및 구아닌(G)이고, 피리미딘은 시토신(C) 및 티민(T), 또는 RNA와 관련해서는, 우라실(U)이다. 데옥시리보스의 C-1 원자는 피리미딘의 N-1 또는 퓨린의 N-9에 결합된다. 뉴클레오티드는 또한 뉴클레오시드의 포스페이트 에스테르이며, 이때 에스테르화는 당의 C-3 또는 C-5에 부착된 하이드록시 기에서 발생한다. 뉴클레오티드는 통상 모노, 다이 또는 트라이포스페이트이다.
"뉴클레오시드"는 뉴클레오티드와 구조적으로 유사하지만 포스페이트 부분이 결여되어 있다. 뉴클레오시드 유사체의 한 예는 표지가 염기에 연결되어 있고 당 분자에 부착된 포스페이트 기가 없는 것일 것이다.
염기는 통상 퓨린 또는 피리미딘으로 지칭되지만, 당업자는 왓슨-크릭 염기쌍 형성(Watson-Crick base pairing)을 거치는 뉴클레오티드 또는 뉴클레오시드의 능력을 변경시키지 않는 유도체 및 유사체가 이용가능하다는 것을 인식할 것이다. "유도체" 또는 "유사체"는, 코어 구조가 모 화합물의 코어 구조와 동일하거나 근접하게 유사하지만, 예를 들어 유도체 뉴클레오티드 또는 뉴클레오시드가 다른 분자에 연결될 수 있게 하는 상이한 또는 추가적인 측기와 같은 화학적 또는 물리적 변형을 갖는 화합물 또는 분자를 의미한다. 예를 들어, 염기는 데아자퓨린일 수 있다. 특정 실시 형태에서, 유도체는 왓슨-크릭 쌍형성을 거칠 수 있어야 한다. "유도체" 및 "유사체"는 또한, 예를 들어, 변형된 염기 부분 및/또는 변형된 당 부분을 갖는 합성 뉴클레오티드 또는 뉴클레오시드 유도체를 포함한다. 그러한 유도체 및 유사체는, 예를 들어 문헌[Scheit, Nucleotide analogs (John Wiley & Son, 1980) 및 Uhlman et al., Chemical Reviews 90:543-584, 1990]에 논의되어 있다. 뉴클레오티드 유사체는 포스포로티오에이트, 포스포로다이티오에이트, 알킬-포스포네이트, 포스포르아닐리데이트, 포스포르아미데이트 결합 등을 포함한 변형된 포스포다이에스테르 결합을 포함할 수 있다.
염료는, 예를 들어 링커를 통해 뉴클레오티드 염기 상의 임의의 위치에 부착될 수 있다. 특정 실시 형태에서, 생성된 유사체에 대해 왓슨-크릭 염기쌍 형성이 여전히 수행될 수 있다. 특정 핵염기 표지화 부위는 피리미딘 염기의 C5 위치 또는 7-데아자퓨린 염기의 C7 위치를 포함한다. 전술된 바와 같이, 뉴클레오시드 또는 뉴클레오티드에 염료를 공유적으로 부착하는 데 링커 기가 사용될 수 있다.
특정 실시 형태에서, 표지된 뉴클레오티드 또는 올리고뉴클레오티드는 효소적으로 도입가능하고 효소적으로 신장가능할 수 있다. 따라서, 링커 부분은 화합물이 핵산 복제 효소에 의한 뉴클레오티드의 전체적인 결합 및 인식을 크게 방해하지 않도록 뉴클레오티드를 화합물에 연결하기에 충분한 길이를 가질 수 있다. 따라서, 링커는 또한 스페이서 단위를 포함할 수 있다. 스페이서는, 예를 들어 절단 부위 또는 표지로부터 뉴클레오티드 염기를 이격시킨다.
본 명세서에 기재된 염료로 표지된 뉴클레오시드 또는 뉴클레오티드는 하기 화학식을 가질 수 있다:
상기 식에서, Dye는 (염료의 작용기와 링커 "L"의 작용기 사이의 공유 결합 후의) 본 명세서에 기재된 융합 비스-붕소 헤테로사이클(표지) 모이어티를 함유하는 염료이고; B는 예를 들어 우라실, 티민, 시토신, 아데닌, 7-데아자 아데닌, 구아닌, 7-데아자 구아닌 등과 같은 핵염기이고; L은 존재할 수 있거나 존재하지 않을 수 있는 선택적인 링커이고; R'은 H일 수 있거나, -OR'이 모노포스페이트, 다이포스페이트, 트라이포스페이트, 티오포스페이트, 포스페이트 에스테르 유사체, 반응성 인-함유 기에 부착된 -O-, 또는 블록킹 기에 의해 보호된 -O-이고; R''은 H 또는 OH이고; R'''은 H, 본 명세서에 기재된 3' 하이드록시 블록킹 기이거나, -OR'''이 포스포르아미다이트를 형성한다. -OR'''이 포스포르아미다이트인 경우, R'은 산-절단가능한 하이드록시 보호기이며, 이는 자동화 합성 조건 하에서 후속 단량체 커플링을 가능하게 한다. 일부 추가의 실시 형태에서, B는 , 또는 , 또는 이들의 선택적으로 치환된 유도체 및 유사체를 포함한다. 일부 추가의 실시 형태에서, 표지된 핵염기는 구조 , 또는 를 포함한다.
특정 실시 형태에서, 이러한 블록킹 기는 염료 화합물과 분리되어 있고 독립적이며, 즉 그것에 부착되어 있지 않다. 대안적으로, 염료는 3'-OH 블록킹 기의 전부 또는 일부를 포함할 수 있다. 따라서, R'''은 염료 화합물을 포함할 수 있거나 포함하지 않을 수 있는 3' 하이드록시 블록킹 기일 수 있다.
또 다른 대안적인 실시 형태에서, 펜토스 당의 3' 탄소 상에는 블록킹 기가 없으며, 염기에 부착된 염료(또는 염료 및 링커 작제물)는, 예를 들어, 추가의 뉴클레오티드의 도입에 대한 블록으로서 작용하기에 충분한 크기 또는 구조를 가질 수 있다. 따라서, 이러한 블록은, 염료가 당의 3' 위치에 부착되어 있든 그렇지 않든 간에, 입체 장애로 인한 것일 수 있거나 크기, 전하 및 구조의 조합으로 인한 것일 수 있다.
또 다른 대안적인 실시 형태에서, 블록킹 기는 펜토스 당의 2' 또는 4' 탄소 상에 존재하며, 추가의 뉴클레오티드의 도입에 대한 블록으로서 작용하기에 충분한 크기 또는 구조를 가질 수 있다.
블록킹 기의 사용은 중합이 제어될 수 있게 하는데, 이는, 예를 들어 표지된 뉴클레오티드가 도입될 때 신장을 정지시킴으로써 이루어진다. 블록킹 효과가, 예를 들어, 비제한적인 예로서, 화학적 조건을 변화시킴으로써 또는 화학적 블록의 제거에 의해 가역적인 경우, 신장이 소정의 지점에서는 정지되고, 이어서 계속되게 할 수 있다.
특정 실시 형태에서, 링커(염료와 뉴클레오티드 사이에 존재함) 및 블록킹 기 둘 모두가 존재하며, 별개의 모이어티이다. 특정 실시 형태에서, 링커 및 블록킹 기는 둘 모두 실질적으로 유사한 조건 하에서 절단가능하다. 따라서, 염료 화합물 및 블록킹 기 둘 모두를 제거하는 데 단지 단일 처리만이 요구될 것이기 때문에 탈보호 및 탈블록킹 공정이 더 효율적일 수 있다. 그러나, 일부 실시 형태에서 링커 및 블록킹 기는 유사한 조건 하에서 절단가능할 필요가 없으며, 대신에 별개의 조건 하에서 개별적으로 절단가능하다.
본 발명은 또한 염료 화합물을 도입시킨 폴리뉴클레오티드를 포함한다. 그러한 폴리뉴클레오티드는 포스포다이에스테르 결합으로 연결된 데옥시리보뉴클레오티드들 또는 리보뉴클레오티드들로 각각 구성된 DNA 또는 RNA일 수 있다. 폴리뉴클레오티드는 본 명세서에 기재된 바와 같은 적어도 하나의 변형된(예를 들어, 염료 화합물로 표지된) 뉴클레오티드와 조합된, 본 명세서에 기재된 표지된 뉴클레오티드 이외의 천연 발생 뉴클레오티드, 비천연 발생(또는 변형된) 뉴클레오티드, 또는 이들의 임의의 조합을 포함할 수 있다. 본 발명에 따른 폴리뉴클레오티드는 또한 비천연 골격 결합 및/또는 비-뉴클레오티드 화학적 변형을 포함할 수 있다. 적어도 하나의 표지된 뉴클레오티드를 포함하는 리보뉴클레오티드 및 데옥시리보뉴클레오티드의 혼합물로 구성된 키메라 구조가 또한 고려된다.
본 명세서에 기재된 바와 같은 비제한적인 예시적인 표지된 뉴클레오티드는 하기를 포함한다:
상기 식에서, L은 링커를 나타내고, R은 전술된 바와 같은 리보스 또는 데옥시리보스 모이어티, 또는 5' 위치가 모노-, 다이- 또는 트라이-포스페이트로 치환된 리보스 또는 데옥시리보스 모이어티를 나타낸다.
일부 실시 형태에서, 비제한적인 예시적인 형광 염료 접합체가 하기에 나타나 있다:
,
상기 식에서, PG는 본 명세서에 기재된 3' OH 블록킹 기를 나타내고; p는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10의 정수이고; k는 0, 1, 2, 3, 4, 또는 5이다. 일 실시 형태에서, -O-PG는 AOM이다. 다른 실시 형태에서, -O-PG는 -O-아지도메틸이다. 일 실시 형태에서, k는 5이다. 일부 추가의 실시 형태에서, p는 1, 2 또는 3이고; k는 5이다. 는 링커 부분의 아미노 기와 염료의 카르복실 기 사이의 반응의 결과로서 염료와 절단가능한 링커의 연결점을 지칭한다. 본 명세서에 기재된 표지된 뉴클레오티드의 임의의 실시 형태에서, 뉴클레오티드는 뉴클레오티드 트라이포스페이트이다.
본 발명의 추가적인 태양은 본 명세서에 기재된 표지된 뉴클레오티드를 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드에 관한 것이다. 일부 실시 형태에서, 올리고뉴클레오티드 또는 폴리뉴클레오티드는 표적 폴리뉴클레오티드의 적어도 일부분에 혼성화되고/되거나 상보적이다. 일부 실시 형태에서, 표적 폴리뉴클레오티드는 고체 지지체 상에 고정화된다. 일부 추가의 실시 형태에서, 고체 지지체는 복수의 고정화된 표적 폴리뉴클레오티드들의 어레이를 포함한다. 추가의 실시 형태에서, 고체 지지체는 패턴화된 플로우 셀을 포함한다.
본 발명의 추가적인 태양은 본 명세서에 기재된 하나 이상의 비스-붕소 염료를 포함하는 단백질 태그 또는 항체에 관한 것이다. 특히, 단백질 태그 또는 항체는 증가된 형광 강도를 위해 동일한 염료의 다수의 카피를 포함할 수 있다. 단백질 태그 또는 항체는 특정 유형의 비표지 3' 블록킹된 뉴클레오티드에 표면적으로 결합하는 친화성 시약으로서 사용될 수 있다.
키트
본 발명의 비스-붕소 염료(즉, 제1 표지)로 표지된 제1 유형의 뉴클레오티드를 포함하는 키트가 본 명세서에서 제공된다. 일부 실시 형태에서, 키트는 제1 표지된 뉴클레오티드에서의 비스-붕소 염료와는 상이한 제2 화합물(즉, 제2 표지)로 표지된, 제2 유형의 표지된 뉴클레오티드를 또한 포함한다. 일부 추가의 실시 형태에서, 키트는 제3 유형의 뉴클레오티드를 포함할 수 있으며, 제3 유형의 뉴클레오티드는 제1 표지 및 제2 표지와는 상이한 제3 화합물(즉, 제3 표지)로 표지된다. 일부 추가의 실시 형태에서, 키트는 제4 유형의 뉴클레오티드를 추가로 포함할 수 있다. 일부 이러한 실시 형태에서, 제4 유형의 뉴클레오티드는 비표지된다(암색(dark)이다). 다른 실시 형태에서, 제4 유형의 뉴클레오티드는 제1 뉴클레오티드, 제2 뉴클레오티드 및 제3 뉴클레오티드와는 상이한 화합물로 표지되며, 각각의 표지는 다른 표지와 구별가능한 별개의 흡광도 최대치를 갖는다. 일부 실시 형태에서, 뉴클레오티드는 상이한 파장을 갖는 2개의 광원의 사용을 수반하는 서열분석 응용에 사용될 수 있다. 일부 실시 형태에서, 제1 광원은 약 500 nm 내지 약 550 nm, 약 510 내지 약 540 nm, 또는 약 520 내지 약 530 nm(예컨대, 520 nm)의 파장을 갖는다. 제2 광원은 약 400 nm 내지 약 480 nm, 약 420nm 내지 약 470 nm, 또는 450 nm 내지 약 460 nm(예컨대, 450 nm)의 파장을 갖는다. 추가의 실시 형태에서, 제1 표지, 제2 표지, 및 제3 표지의 각각은 2개의 개별적인 수집 필터 또는 채널에서 수집될 수 있는 방출 스펙트럼을 갖는다.
일부 실시 형태에서, 키트는 4가지 유형의 표지된 뉴클레오티드(A, C, G 및 T 또는 U)를 수용할 수 있으며, 제1 유형의 뉴클레오티드는 본 명세서에 개시된 바와 같은 화합물로 표지된다. 그러한 키트에서, 4가지 유형의 뉴클레오티드의 각각은 나머지 다른 3개의 뉴클레오티드 상의 표지와 동일하거나 상이한 화합물로 표지될 수 있다. 대안적으로, 4가지 유형의 뉴클레오티드 중 제1 유형은 본 명세서에 기재된 표지된 뉴클레오티드(즉, 본 명세서에 기재된 비스-붕소 염료로 표지됨)이고, 제2 유형의 뉴클레오티드는 제2 표지를 보유하고, 제3 유형의 뉴클레오티드는 제3 표지를 보유하고, 제4 유형의 뉴클레오티드는 비표지된다(암색이다). 다른 예로서, 4가지 유형의 뉴클레오티드 중 제1 유형은 본 명세서에 기재된 표지된 뉴클레오티드이고, 제2 유형의 뉴클레오티드는 제2 표지를 보유하고, 제3 유형의 뉴클레오티드는 2가지 표지를 보유하는 제3 유형의 뉴클레오티드(예컨대, 제1 표지를 보유하는 제3 유형의 뉴클레오티드와 제2 표지를 보유하는 제3 유형의 뉴클레오티드)의 혼합물을 포함하고, 제4 유형의 뉴클레오티드는 비표지된다(암색이다). 이러한 특정 예에서, 제3 유형의 뉴클레오티드의 2가지 표지 중 하나 또는 둘 모두는 제1 표지 또는 제2 표지와는 구조적으로 상이하지만 광원의 동일한 파장 하에서 그러나 더 강한 방출 신호 강도로 여기될 수 있는 표지(예컨대, 제3 표지를 보유하는 제3 유형의 뉴클레오티드와 제4 표지를 보유하는 제3 유형의 뉴클레오티드, 여기서, 제3 표지는 제1 표지와 동일한 파장 하에서 여기될 수 있고, 제4 표지는 제2 표지와 동일한 파장 하에서 여기될 수 있음)일 수 있다. 이러한 예에서, 표지 화합물들 중 하나 이상은 그러한 화합물(들)이 다른 화합물과 구별될 수 있도록 하는 별개의 흡광도 최대치 및/또는 방출 최대치를 가질 수 있다. 예를 들어, 각각의 화합물은 별개의 흡광도 최대치 및/또는 방출 최대치를 가질 수 있어서, 화합물의 각각은 나머지 3개의 화합물(또는 제4 뉴클레오티드가 비표지되는 경우 2개의 화합물)과 스펙트럼적으로 구별가능하다. 최대치 이외에 흡광도 스펙트럼 및/또는 방출 스펙트럼의 일부는 상이할 수 있으며, 이들 차이는 이들 화합물을 구별하는 데 이용될 수 있음이 이해될 것이다. 키트는 이들 화합물 중 2개 이상이 별개의 흡광도 최대치를 갖도록 할 수 있다. 본 명세서에 기재된 비스-붕소 염료는 전형적으로 500 nm 미만의 영역에서 광을 흡수한다. 예를 들어, 이러한 비스-붕소 염료는 약 410 nm 내지 약 480 nm, 약 420 nm 내지 약 470 nm, 또는 약 440 nm 내지 약 460 nm의 흡수 파장을 가질 수 있다.
본 명세서에 기재된 비스-붕소 화합물, 뉴클레오티드, 또는 키트는 생물학적 시스템(예를 들어, 이의 프로세스 또는 성분을 포함함)을 검출, 측정, 또는 확인하는 데 사용될 수 있다. 화합물, 뉴클레오티드 또는 키트를 사용할 수 있는 예시적인 기법에는 서열분석, 발현 분석, 혼성화 분석, 유전자 분석, RNA 분석, 세포 검정(예를 들어, 세포 결합 또는 세포 기능 분석), 또는 단백질 검정(예를 들어, 단백질 결합 검정 또는 단백질 활성 검정)이 포함된다. 이러한 사용은 자동화 서열분석 기기와 같은 특정 기술을 수행하기 위한 자동화 기기에서 행해질 수 있다. 서열분석 기기는 상이한 파장에서 작동하는 2개의 광원을 포함할 수 있다.
특정 실시 형태에서, 본 명세서에 기재된 표지된 뉴클레오티드(들)는 비표지된 또는 본래의 뉴클레오티드, 또는 이들의 임의의 조합과 조합되어 공급될 수 있다. 뉴클레오티드들의 조합은 별개의 개별 성분들(예를 들어, 베셀(vessel) 또는 튜브당 하나의 뉴클레오티드 유형)로서 또는 뉴클레오티드 혼합물(예를 들어, 동일한 베셀 또는 튜브 내에서 혼합된 2개 이상의 뉴클레오티드)로서 제공될 수 있다.
키트가 복수의, 특히 2개, 또는 3개, 또는 더 구체적으로 4개의 뉴클레오티드를 포함하는 경우, 상이한 뉴클레오티드들은 상이한 염료 화합물들로 표지될 수 있거나, 하나는 염료 화합물을 함유하지 않아서 암색일 수 있다. 상이한 뉴클레오티드들이 상이한 염료 화합물들로 표지되는 경우, 이러한 염료 화합물들은 스펙트럼적으로 구별가능한 형광 염료라는 것이 상기 키트의 특징이다. 본 명세서에 사용되는 바와 같이, 용어 "스펙트럼적으로 구별가능한 형광 염료"는 2개 이상의 그러한 염료가 하나의 샘플 내에 존재할 때 형광 검출 장비(예를 들어, 시판 모세관 기반 DNA 서열분석 플랫폼)에 의해 구별될 수 있는 파장에서 형광 에너지를 방출하는 형광 염료를 지칭한다. 형광 염료 화합물로 표지된 2개의 뉴클레오티드가 키트 형태로 공급될 때, 스펙트럼적으로 구별가능한 형광 염료들이, 예를 들어 동일한 광원에 의해 동일한 파장에서 여기될 수 있다는 것이 일부 실시 형태의 특징이다. 형광 염료 화합물로 표지된 4개의 뉴클레오티드가 키트 형태로 공급될 때, 스펙트럼적으로 구별가능한 형광 염료들 중 2개는 모두 하나의 파장에서 여기될 수 있고, 나머지 2개의 스펙트럼적으로 구별가능한 염료는 모두 다른 파장에서 여기될 수 있다는 것이 일부 실시 형태의 특징이다. 염료에 대한 특정 여기 파장은 450 내지 460 nm, 490 내지 500 nm, 또는 520 nm 이상(예컨대, 532 nm)이다.
대안적인 실시 형태에서, 본 발명의 키트는 동일한 염기가 2개의 상이한 화합물로 표지된 뉴클레오티드들을 함유할 수 있다. 제1 뉴클레오티드는 본 발명의 화합물, 예를 들어, 500 nm 미만에서 흡수하는 '청색' 염료로 표지될 수 있다. 제2 뉴클레오티드는 스펙트럼적으로 구별되는 화합물, 예를 들어 600 nm 미만 그러나 500 nm 초과에서 흡수하는 '녹색' 염료로 표지될 수 있다. 제3 뉴클레오티드는 본 발명의 화합물 및 스펙트럼적으로 구별되는 화합물의 혼합물로 표지될 수 있고, 제4 뉴클레오티드는 '암색'이고 표지를 함유하지 않을 수 있다. 따라서, 간단히 말하면, 뉴클레오티드 1 내지 뉴클레오티드 4는 '청색', '녹색', '청색/녹색', 및 암색으로 표지될 수 있다. 계측을 더 단순화하기 위하여, 4개의 뉴클레오티드가 단일 광원으로 여기되는 2개의 염료로 표지될 수 있으며, 이에 따라 뉴클레오티드 1 내지 뉴클레오티드 4의 표지화는 '청색 1', '청색 2', '청색 1/청색 2', 및 암색일 수 있다.
키트가 상이한 염료 화합물들로 표지된 상이한 뉴클레오티드들을 갖는 구성들에 관하여 본 명세서에서 예시되어 있지만, 키트는 동일한 염료 화합물을 갖는 2개, 3개, 4개 또는 그 이상의 상이한 뉴클레오티드들을 포함할 수 있음이 이해될 것이다.
표지된 뉴클레오티드 외에도, 키트는 적어도 하나의 추가 성분을 함께 포함할 수 있다. 추가의 성분(들)은 본 명세서에 기재된 방법에서 또는 하기 실시예 섹션에서 확인된 성분들 중 하나 이상일 수 있다. 본 발명의 키트 내로 조합될 수 있는 성분들의 일부 비제한적인 예가 하기에 기재된다. 일부 실시 형태에서, 키트는 DNA 폴리머라제(예컨대 9°N 폴리머라제의 돌연변이, 예컨대 국제 특허 공개 WO 2005/024010호에 개시된 것들) 및 하나 이상의 완충액 조성물을 추가로 포함한다. 하나의 완충액 조성물은 산화방지제, 예컨대 아스코르브산 또는 아스코르브산 나트륨을 포함할 수 있으며, 이는 검출 동안 광손상으로부터 염료 화합물을 보호하는데 사용될 수 있다. 추가적인 완충액 조성물은 3' 블록킹 기 및/또는 절단가능한 링커를 절단하는 데 사용될 수 있는 시약을 포함할 수 있다. 예를 들어, 수용성 포스핀 또는 수용성 전이 금속 촉매는 팔라듐 착물과 같은, 전이 금속 및 적어도 부분적으로 수용성인 리간드로부터 형성하였다. 키트의 다양한 성분은 사용 전에 희석될 농축된 형태로 제공될 수 있다. 그러한 실시 형태에서, 적절한 희석 완충액이 또한 포함될 수 있다. 게다가, 본 명세서에 기재된 방법에서 확인된 성분들 중 하나 이상이 본 발명의 키트에 포함될 수 있다. 본 명세서에 기재된 뉴클레오티드 또는 표지된 뉴클레오티드의 임의의 실시 형태에서, 뉴클레오티드는 3' 블록킹 기를 함유한다.
대안적으로, 키트는 하나 이상의 상이한 유형의 비표지 3' 블록킹된 뉴클레오티드 및 하나 이상의 친화성 시약(예를 들어, 단백질 태그 및 항체)을 포함할 수 있으며, 여기서 적어도 하나의 친화성 시약은 본 명세서에 기재된 비스-붕소 염료의 다수의 카피로 표지된다.
서열분석 방법
본 발명에 따른 염료 화합물을 포함하는 뉴클레오티드는, 그 자체로든 또는 더 큰 분자 구조 또는 접합체 내로 도입되거나 그와 회합되든 간에, 이러한 뉴클레오티드에 부착된 형광 표지의 검출을 포함하는 방법과 같은 임의의 분석 방법에 사용될 수 있다. 이와 관련하여, 용어 "폴리뉴클레오티드 내로 도입된"은 5' 포스페이트가 그 자체로 더 긴 폴리뉴클레오티드 사슬의 일부를 형성할 수 있는 제2 뉴클레오티드의 3' 하이드록시 기에 포스포다이에스테르 결합으로 연결됨을 의미할 수 있다. 본 명세서에 기술된 뉴클레오티드의 3' 말단은 추가의 뉴클레오티드의 5' 포스페이트에 포스포다이에스테르 결합으로 연결될 수 있거나 연결되지 않을 수 있다. 따라서, 일 비제한적인 실시 형태에서, 본 발명은 폴리뉴클레오티드 내로 도입된 표지된 뉴클레오티드를 검출하는 방법을 제공하며, 상기 방법은 (a) 본 발명의 적어도 하나의 표지된 뉴클레오티드를 폴리뉴클레오티드 내로 도입시키는 단계, 및 (b) 상기 뉴클레오티드(들)에 부착된 염료 화합물로부터의 형광 신호를 검출함으로써 폴리뉴클레오티드 내로 도입된 뉴클레오티드(들)의 정체를 결정하는 단계를 포함한다.
이 방법은, 본 발명에 따른 하나 이상의 표지된 뉴클레오티드를 폴리뉴클레오티드 내로 도입시키는 합성 단계 (a) 및 폴리뉴클레오티드 내로 도입된 하나 이상의 표지된 뉴클레오티드(들)를 그의 형광을 검출하거나 정량적으로 측정함으로써 검출하는 검출 단계 (b)를 포함할 수 있다.
본 출원의 일부 실시 형태는 표적 폴리뉴클레오티드(예컨대, 단일 가닥 표적 폴리뉴클레오티드)의 서열을 결정하는 방법에 관한 것이며, 이 방법은 (a) 프라이머 폴리뉴클레오티드(예컨대 서열분석 프라이머)를 하나 이상의 표지된 뉴클레오티드(예컨대 뉴클레오시드 트라이포스페이트 A, G, C 및 T)와 접촉시키는 단계로서, 상기 표지된 뉴클레오티드 중 적어도 하나는 본 명세서에 기재된 표지된 뉴클레오티드이고, 프라이머 폴리뉴클레오티드는 표적 폴리뉴클레오티드의 적어도 일부분에 상보적인, 상기 단계; (b) 표지된 뉴클레오티드를 프라이머 폴리뉴클레오티드 내로 도입시키는 단계; 및 (c) 하나 이상의 형광 측정을 수행하여 도입된 뉴클레오티드의 정체를 결정하는 단계를 포함한다. 일부 이러한 실시 형태에서, 프라이머 폴리뉴클레오티드/표적 폴리뉴클레오티드 복합체는 표적 폴리뉴클레오티드를 표적 폴리뉴클레오티드의 적어도 일부분에 상보적인 프라이머 폴리뉴클레오티드와 접촉시킴으로써 형성된다. 일부 실시 형태에서, 본 방법은 (d) 프라이머 폴리뉴클레오티드 내로 도입된 뉴클레오티드로부터 표지 모이어티 및 3' 하이드록시 블록킹 기를 제거하는 단계를 추가로 포함한다. 일부 추가의 실시 형태에서, (e) 제거된 표지 모이어티 및 3' 블록킹 기를 프라이머 폴리뉴클레오티드 가닥으로부터 세척하는 단계를 또한 포함할 수 있다. 일부 실시 형태에서, 단계 (a) 내지 단계 (d) 또는 단계 (a) 내지 단계 (e)는 표적 폴리뉴클레오티드 가닥의 적어도 일부분의 서열이 결정될 때까지 반복된다. 일부 경우에, 단계 (a) 내지 단계 (d) 또는 단계 (a) 내지 단계 (e)는 적어도 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 또는 300 사이클 반복된다. 일부 실시 형태에서, 프라이머 폴리뉴클레오티드 가닥 내로 도입된 뉴클레오티드로부터의 표지 모이어티 및 3' 블록킹 기는 단일 화학 반응에서 제거된다. 일부 추가의 실시 형태에서, 본 방법은 자동화 서열분석 기기에서 수행되고, 자동화 서열분석 기기는 상이한 파장에서 작동하는 2개의 광원을 포함한다. 일부 실시 형태에서, 서열 결정은 본 명세서에 기재된 서열분석 단계의 반복된 사이클의 완료 후에 수행된다.
본 발명의 일부 실시 형태는 표적 폴리뉴클레오티드(예컨대, 단일 가닥 표적 폴리뉴클레오티드)의 서열을 결정하는 방법에 관한 것이며, 이 방법은 (a) 프라이머 폴리뉴클레오티드를 4개의 상이한 유형의 뉴클레오티드 접합체 중 하나 이상을 포함하는 도입 혼합물과 접촉시키는 단계로서, 제1 유형의 뉴클레오티드 접합체는 제1 표지를 포함하고, 제2 유형의 뉴클레오티드 접합체는 제2 표지를 포함하고, 제3 유형의 뉴클레오티드 접합체는 제3 표지를 포함하며, 제1 표지, 제2 표지, 및 제3 표지의 각각은 서로 스펙트럼적으로 구별되고, 프라이머 폴리뉴클레오티드는 표적 폴리뉴클레오티드의 적어도 일부분에 상보적인, 상기 단계; (b) 혼합물로부터의 하나의 뉴클레오티드 접합체를 프라이머 폴리뉴클레오티드에 도입시켜 신장된 프라이머 폴리뉴클레오티드를 생성하는 단계; (c) 제1 여기 광원을 사용하여 제1 이미징 이벤트를 수행하고 신장된 폴리뉴클레오티드로부터 제1 방출 신호를 검출하는 단계; 및 (d) 제2 여기 광원을 사용하여 제2 이미지 이벤트를 수행하고 신장된 폴리뉴클레오티드로부터 제2 방출 신호를 검출하는 단계를 포함하며; 제1 여기 광원 및 제2 여기 광원은 상이한 파장을 갖고; 제1 방출 신호 및 제2 방출 신호는 단일 방출 검출 채널에서 검출되거나 수집된다. 일부 실시 형태에서, 본 명세서에 기재된 비스-붕소 염료는 본 방법에 기재된 제1 표지, 제2 표지 또는 제3 표지 중 어느 하나로서 사용될 수 있다. 일부 실시 형태에서, 본 방법은 제1 이미징 이벤트 후에 그리고 제2 이미징 이벤트 전에 혼합물에서 임의의 뉴클레오티드 접합체의 화학적 변형을 포함하지 않는다. 일부 추가의 실시 형태에서, 도입 혼합물은 제4 유형의 뉴클레오티드를 추가로 포함하며, 제4 유형의 뉴클레오티드는 비표지되거나, 제1 이미징 이벤트 또는 제2 이미징 이벤트로부터의 신호를 방출하지 않는 형광 모이어티로 표지된다. 이러한 서열분석 방법에서, 각각의 도입된 뉴클레오티드 접합체의 정체는 제1 이미징 이벤트 및 제2 이미징 이벤트의 검출 패턴에 기초하여 결정된다. 예를 들어, 제1 유형의 뉴클레오티드 접합체의 도입은 제1 이미징 이벤트에서의 신호 상태 및 제2 이미징 이벤트에서의 암색 상태에 의해 결정된다. 제2 유형의 뉴클레오티드 접합체의 도입은 제1 이미징 이벤트에서의 암색 상태 및 제2 이미징 이벤트에서의 신호 상태에 의해 결정된다. 제3 유형의 뉴클레오티드 접합체의 도입은 제1 이미징 이벤트 및 제2 이미징 이벤트 모두에서의 신호 상태에 의해 결정된다. 제4 유형의 뉴클레오티드 접합체의 도입은 제1 이미징 이벤트 및 제2 이미징 이벤트 모두에서의 암색 상태에 의해 결정된다. 추가의 실시 형태에서, 단계 (a) 내지 단계 (d)는 반복된 사이클로 (예컨대, 적어도 30, 50, 100, 150, 200, 250, 300, 400, 또는 500회) 수행되며, 본 방법은 각각의 순차적으로 도입된 뉴클레오티드 접합체의 정체에 기초하여 단일 가닥 표적 폴리뉴클레오티드의 적어도 일부분의 서열을 순차적으로 결정하는 단계를 추가로 포함한다. 일부 실시 형태에서, 제1 여기 광원은 제2 여기 광원보다 짧은 파장을 갖는다. 일부 이러한 실시 형태에서, 제1 여기 광원은 약 400 nm 내지 약 480 nm, 약 420 nm 내지 약 470 nm, 또는 약 450 nm 내지 약 460 nm(즉, "청색광")의 파장을 갖는다. 일 실시 형태에서, 제1 여기 광원은 약 450 nm의 파장을 갖는다. 제2 여기 광원은 약 500 nm 내지 약 550 nm, 약 510 nm 내지 약 540 nm, 또는 약 520 nm 내지 약 535 nm(즉, "녹색광")의 파장을 갖는다. 일 실시 형태에서, 제2 여기 광원은 약 520 nm의 파장을 갖는다. 다른 실시 형태에서, 제1 여기 광원은 제2 여기 광원보다 더 긴 파장을 갖는다. 일부 이러한 실시 형태에서, 제1 여기 광원은 약 500 nm 내지 약 550 nm, 약 510 nm 내지 약 540 nm, 또는 약 520 nm 내지 약 535 nm(즉, "녹색광")의 파장을 갖는다. 일 실시 형태에서, 제2 여기 광원은 약 520 nm의 파장을 갖는다. 제2 여기 광원은 약 400 nm 내지 약 480 nm, 약 420 nm 내지 약 470 nm, 또는 약 450 nm 내지 약 460 nm(즉, "청색광")의 파장을 갖는다. 일 실시 형태에서, 제2 여기 광원은 약 450 nm의 파장을 갖는다.
본 발명의 일부 실시 형태는 복수의 표적 폴리뉴클레오티드(예컨대 복수의 상이한 표적 폴리뉴클레오티드)의 서열을 결정하는 방법에 관한 것이며, 이 방법은 (a) 고체 지지체를 혼성화 조건 하에서 서열분석 프라이머를 포함하는 용액과 접촉시키는 단계로서, 고체 지지체는 그에 고정화된 복수의 상이한 표적 폴리뉴클레오티드를 포함하고; 서열분석 프라이머는 표적 폴리뉴클레오티드의 적어도 일부분에 상보적인, 상기 단계; (b) 고체 지지체를 DNA 폴리머라제-매개 프라이머 신장에 적합한 조건 하에서 4가지 상이한 유형의 뉴클레오티드 중 하나 이상 및 DNA 폴리머라제를 포함하는 수용액과 접촉시키는 단계로서, 뉴클레오티드 중 적어도 하나의 유형은 본 명세서에 기재된 표지된 뉴클레오티드인, 상기 단계; (c) 하나의 유형의 뉴클레오티드를 서열분석 프라이머 내로 도입시켜 신장된 카피 폴리뉴클레오티드를 생성하는 단계; 및 (d) 신장된 카피 폴리뉴클레오티드의 하나 이상의 형광 측정을 수행하여 도입된 뉴클레오티드의 정체를 결정하는 단계를 포함한다. 일부 실시 형태에서, 본 방법은 (e) 신장된 카피 폴리뉴클레오티드 내로 도입된 뉴클레오티드로부터 3' 블록킹 기를 제거하는 단계를 추가로 포함한다. 일부 이러한 실시 형태에서, 단계 (e)는 또한 도입된 뉴클레오티드의 표지를 제거한다. 일부 실시 형태에서, 본 방법은 상기 도입된 뉴클레오티드로부터 표지 및 3' 블록킹 기를 제거하는 단계 후에 (f) 고체 지지체를 세척하는 단계를 추가로 포함한다. 추가의 실시 형태에서, 본 방법은 표적 폴리뉴클레오티드의 적어도 일부분의 서열이 결정될 때까지 단계 (b) 내지 단계 (f)를 반복하는 단계를 포함한다. 일부 그러한 실시 형태에서, 단계 (b) 내지 단계 (f)는 적어도 50, 100, 150, 200, 250, 또는 300 사이클 반복된다. 추가의 실시 형태에서, 신장된 카피 폴리뉴클레오티드 내로 도입된 뉴클레오티드로부터의 표지 및 3' 블록킹 기는 단일 화학 반응에서 제거된다. 일부 실시 형태에서, 단계 (d)는 2회의 이미징 및 형광 측정을 포함한다. 추가의 실시 형태에서, 본 방법은 자동화 서열분석 기기에서 수행되고, 자동화 서열분석 기기는 상이한 파장에서 작동하는 2개의 광원을 포함한다. 일부 그러한 실시 형태에서, 하나의 광원은 약 400 nm 내지 약 480 nm, 약 420 nm 내지 약 470 nm, 또는 약 450 nm 내지 약 460 nm(즉, "청색광")에서 작동한다. 추가의 실시 형태에서, 다른 광원은 약 500 nm 내지 약 550 nm, 약 510 nm 내지 약 540 nm, 또는 약 520 nm 내지 약 535 nm(즉, "녹색광")에서 작동한다. 일부 실시 형태에서, 4가지 유형의 뉴클레오티드는 dATP, dCTP, dGTP 및 dTTP 또는 dUTP, 또는 이들의 비-천연 뉴클레오티드 유사체를 포함한다. 특정 실시 형태에서, 4가지 상이한 유형의 뉴클레오티드 중 하나 이상 및 DNA 폴리머라제를 포함하는 수용액은 도입 혼합물을 포함하거나 도입 혼합물이고, 이는 (본 명세서에 기재된 비스-붕소 염료로 표지된) 제1 표지를 보유하는 제1 유형의 뉴클레오티드, 제2 표지를 보유하는 제2 유형의 뉴클레오티드, 2가지 표지의 혼합물을 보유하는 제3 유형의 뉴클레오티드, 및 비표지된 (암색인) 제4 유형의 뉴클레오티드를 갖는다. 예를 들어, 제3 유형의 뉴클레오티드는 제1 표지를 보유하는 제3 유형의 뉴클레오티드와 제2 표지를 보유하는 제3 유형의 뉴클레오티드의 혼합물일 수 있다. 그러한 실시 형태에서, 제1 유형의 뉴클레오티드의 도입은 제1 이미징 이벤트/형광 측정에서의 신호 상태 및 제2 이미징 이벤트/형광 측정에서의 암색 상태에 의해 결정될 수 있다. 제2 유형의 뉴클레오티드의 도입은 제1 이미징 이벤트/형광 측정에서의 암색 상태 및 제2 이미징 이벤트/형광 측정에서의 신호 상태에 의해 결정될 수 있다. 제3 유형의 뉴클레오티드의 도입은 제1 및 제2 이미징 이벤트/형광 측정 둘 모두에서의 신호 상태에 의해 결정된다. 제4 유형의 뉴클레오티드 접합체의 도입은 제1 및 제2 이미징 이벤트/형광 측정 둘 모두에서의 암색 상태에 의해 결정된다. 다른 실시 형태에서, 도입 혼합물은 제1 표지를 보유하는 제1 유형의 뉴클레오티드(본 명세서에 기재된 비스-붕소 염료로 표지됨), 제2 표지를 보유하는 제2 유형의 뉴클레오티드, 제3 표지를 보유하는 제3 유형의 뉴클레오티드, 및 제4 유형의 비표지 뉴클레오티드를 포함한다. 이 경우에, 제1 표지, 제2 표지, 및 제3 표지의 각각은 서로 스펙트럼적으로 구별되고, 제1 표지는 제1 광원에 의해 여기가능하고, 제2 표지는 제2 광원에 의해 여기가능하고, 제3 표지는 제1 광원과 제2 광원 둘 모두에 의해 여기가능하다. 결과적으로, 4가지 유형의 뉴클레오티드의 도입은 또한 본 명세서에 기재된 동일한 신호 패턴에 기초하여 구별될 수 있다.
본 명세서에 기재된 서열분석 방법의 일부 실시 형태에서, 적어도 하나의 뉴클레오티드는 폴리머라제 효소의 작용에 의한 합성 단계에서 폴리뉴클레오티드(예컨대 본 명세서에 기재된 단일 가닥 프라이머 폴리뉴클레오티드) 내로 도입된다. 그러나, 예를 들어 화학적 올리고뉴클레오티드 합성 또는 비표지된 올리고뉴클레오티드에 대한 표지된 올리고뉴클레오티드의 라이게이션과 같은 뉴클레오티드를 폴리뉴클레오티드에 연결하는 다른 방법이 사용될 수 있다. 따라서, 뉴클레오티드 및 폴리뉴클레오티드와 관련하여 사용될 때, 용어 "도입시키는"은 화학적 방법뿐만 아니라 효소적 방법에 의한 폴리뉴클레오티드 합성을 포함할 수 있다.
특정 실시 형태에서, 합성 단계가 수행되며, 선택적으로 주형 또는 표적 폴리뉴클레오티드 가닥을 본 발명의 형광 표지된 뉴클레오티드를 포함하는 반응 혼합물과 함께 인큐베이션하는 단계를 포함할 수 있다. 폴리머라제는 또한, 주형 또는 표적 폴리뉴클레오티드 가닥에 어닐링된 폴리뉴클레오티드 가닥 상의 유리 3' 하이드록시 기와 뉴클레오티드 상의 5' 포스페이트 기 사이의 포스포다이에스테르 결합의 형성을 가능하게 하는 조건 하에서 제공될 수 있다. 따라서, 합성 단계는 주형/표적 가닥에 대한 뉴클레오티드의 상보적 염기쌍 형성에 의해 유도된 바와 같은 폴리뉴클레오티드 가닥의 형성을 포함할 수 있다.
상기 방법의 모든 실시 형태에서, 검출 단계는 표지된 뉴클레오티드가 도입된 폴리뉴클레오티드 가닥이 주형/표적 가닥에 어닐링되는 동안에, 또는 2개의 가닥이 분리되는 변성 단계 후에 수행될 수 있다. 추가의 단계, 예를 들어 화학적 또는 효소적 반응 단계 또는 정제 단계가 합성 단계와 검출 단계 사이에 포함될 수 있다. 특히, 표지된 뉴클레오티드(들)를 도입시킨 폴리뉴클레오티드 가닥은 단리되거나 정제되고, 이어서 추가로 처리되거나 후속 분석에 사용될 수 있다. 예로서, 합성 단계에서의 본 명세서에 기재된 바와 같은 표지된 뉴클레오티드(들)를 도입시키는 폴리뉴클레오티드 가닥은 표지된 프로브 또는 프라이머로서 후속적으로 사용될 수 있다. 다른 실시 형태에서, 본 명세서에 기재된 합성 단계의 산물은 추가의 반응 단계를 거칠 수 있으며, 필요하다면, 이들 후속 단계의 산물은 정제되거나 단리될 수 있다.
합성 단계에 적합한 조건은 표준 분자 생물학 기법에 익숙한 자들에게 잘 알려져 있을 것이다. 일 실시 형태에서, 합성 단계는 적합한 폴리머라제 효소의 존재 하에서 본 명세서에 기재된 바와 같은 표지된 뉴클레오티드를 포함한 뉴클레오티드 전구체를 사용하여 주형/표적 가닥에 상보적인 신장된 폴리뉴클레오티드 가닥(프라이머 폴리뉴클레오티드 가닥)을 형성하는 표준 프라이머 신장 반응과 유사할 수 있다. 다른 실시 형태에서, 합성 단계는 그 자체로서, 프라이머 폴리뉴클레오티드 가닥 및 주형 폴리뉴클레오티드 가닥의 카피로부터 유도되는 어닐링된 상보적 가닥들로 구성된 표지된 이중-가닥 증폭 산물을 생성하는 증폭 반응의 일부를 형성할 수 있다. 다른 예시적인 합성 단계는 닉 번역(nick translation), 가닥 치환 중합, 랜덤 프라이밍된 DNA 표지화 등을 포함한다. 합성 단계에 특히 유용한 폴리머라제 효소는 본 명세서에 기재된 바와 같은 표지된 뉴클레오티드의 도입을 촉매할 수 있는 것이다. 다양한 천연 발생 또는 돌연변이/변형된 폴리머라제가 사용될 수 있다. 예로서, 열안정성 폴리머라제가 열사이클링 조건을 사용하여 수행되는 합성 반응에는 사용될 수 있는 반면, 열안정성 폴리머라제는 등온 프라이머 신장 반응에 바람직하지 않을 수 있다. 본 발명에 따른 표지된 뉴클레오티드를 도입시킬 수 있는 적합한 열안정성 폴리머라제는 국제 특허 공개 WO 2005/024010호 또는 WO06120433호에 기재된 것들을 포함하며, 이들 각각은 본 명세서에 참고로 포함된다. 37℃와 같은 더 낮은 온도에서 수행되는 합성 반응에서, 폴리머라제 효소는 반드시 열안정성 폴리머라제일 필요는 없으며, 이에 따라 폴리머라제의 선택은 반응 온도, pH, 가닥-치환 활성 등과 같은 다수의 인자에 좌우될 것이다. 예시적인 중합효소는, 이에 제한되지는 않으나, Pol 812, Pol 1901, Pol 1558 또는 Pol 963을 포함한다. Pol 812, Pol 1901, Pol 1558 또는 Pol 963 DNA 중합효소의 아미노산 서열은, 예를 들어, 미국 특허 공개 2020/0131484 A1 및 2020/0181587 A1에 기재되어 있으며, 이들 둘 모두는 본 명세서에 참조로 포함된다.
구체적인 비제한적인 실시 형태에서, 본 발명은 핵산 서열분석 방법, 재서열분석 방법, 전체 게놈 서열분석 방법, 단일 뉴클레오티드 다형 점수화 방법, 폴리뉴클레오티드 내로 도입될 때 본 명세서에 기재된 염료로 표지된 변형된 뉴클레오티드 또는 뉴클레오시드의 검출을 수반하는 임의의 다른 응용을 포함한다.
본 발명의 특정 실시 형태는 합성에 의한 폴리뉴클레오티드 서열분석 반응에 있어서의 본 발명에 따른 염료 모이어티를 포함하는 표지된 뉴클레오티드의 용도를 제공한다. 합성에 의한 서열분석은 일반적으로, 서열분석하고자 하는 주형/표적 핵산에 상보적인 신장된 폴리뉴클레오티드 사슬을 형성하기 위하여 폴리머라제 또는 리가제를 사용하여 5'에서 3' 방향으로 성장하는 폴리뉴클레오티드 사슬에 하나 이상의 뉴클레오티드 또는 올리고뉴클레오티드를 순차적으로 부가하는 것을 수반한다. 부가된 뉴클레오티드(들) 중 하나 이상에 존재하는 염기의 동일성은 검출 또는 "이미징" 단계에서 결정될 수 있다. 부가된 염기의 동일성은 각각의 뉴클레오티드 도입 단계 후에 결정될 수 있다. 이어서, 주형의 서열은 통상적인 왓슨-크릭 염기쌍 형성 규칙을 사용하여 추론될 수 있다. 단일 염기의 정체의 결정을 위한 본 명세서에 기재된 염료로 표지된 뉴클레오티드의 사용은, 예를 들어 단일 뉴클레오티드 다형의 점수화에 유용할 수 있으며, 그러한 단일 염기 신장 반응은 본 발명의 범주 내에 있다.
본 발명의 일 실시 형태에서, 주형 폴리뉴클레오티드의 서열은 서열분석하고자 하는 주형/표적 폴리뉴클레오티드에 상보적인 신생(nascent) 가닥 내로의 하나 이상의 뉴클레오티드의 도입을, 그러한 도입된 뉴클레오티드(들)에 부착된 형광 표지(들)의 검출을 통해 검출함으로써 결정된다. 주형 폴리뉴클레오티드의 서열분석은 적절한 프라이머를 사용하여 프라이밍될 수 있고(또는 헤어핀의 일부로서 프라이머를 함유할 헤어핀 작제물로서 제조될 수 있고), 신생 사슬은 폴리머라제 촉매 반응에서 프라이머의 3' 말단에 대한 뉴클레오티드의 부가에 의해 단계적으로 신장된다.
특정 실시 형태에서, 상이한 뉴클레오티드 트라이포스페이트(A, T, G 및 C) 각각은 특유의 플루오로포어로 표지될 수 있으며, 또한 제어되지 않은 중합을 방지하기 위해 3' 위치에 블록킹 기를 포함한다. 대안적으로, 4개의 뉴클레오티드 중 하나는 비표지될 수 있다(암색). 폴리머라제 효소는 주형/표지 폴리뉴클레오티드에 상보적인 신생 사슬 내로 뉴클레오티드를 도입시키며, 블록킹 기는 뉴클레오티드의 추가 도입을 방지한다. 임의의 도입되지 않은 뉴클레오티드는 세척될 수 있고, 각각의 도입된 뉴클레오티드로부터의 형광 신호는 적합한 방출 필터 및 광원 여기를 사용하는 전하 결합 장치와 같은 적합한 수단에 의해 광학적으로 "판독"(read) 될 수 있다. 이어서, 3'-블록킹 기 및 형광 염료 화합물을 (동시에 또는 순차적으로) 제거하여(탈보호하여) 추가의 뉴클레오티드 도입을 위해 신생 사슬을 노출시킬 수 있다. 전형적으로, 도입된 뉴클레오티드의 동일성은 각각의 도입 단계 후에 결정될 것이지만, 이것이 절대적으로 필수적인 것은 아니다. 유사하게, 미국 특허 제5,302,509호(본 명세서에 참고로 포함됨)는 고체 지지체 상에 고정화된 폴리뉴클레오티드를 서열분석하는 방법을 개시한다.
상기에 예시된 바와 같이, 이 방법은 DNA 폴리머라제의 존재 하에서, 고정화된 폴리뉴클레오티드에 상보적인 성장 가닥 내로의 형광 표지된 3'-블록킹된 뉴클레오티드 A, G, C, 및 T의 도입을 이용한다. 폴리머라제는 표적 폴리뉴클레오티드에 상보적인 염기를 도입시키지만, 3'-블록킹 기에 의해 더 이상의 부가는 방지된다. 이어서, 도입된 뉴클레오티드의 표지를 결정할 수 있으며, 블록킹 기를 화학적 절단에 의해 제거하여 추가의 중합이 일어날 수 있게 할 수 있다. 합성에 의한 서열분석 반응에서 서열분석하고자 하는 핵산 주형은 서열분석이 요구되는 임의의 폴리뉴클레오티드일 수 있다. 서열분석 반응을 위한 핵산 주형은 전형적으로 서열분석 반응에서 추가의 뉴클레오티드의 부가를 위한 프라이머 또는 개시점으로서의 역할을 하는 유리 3' 하이드록시 기를 갖는 이중-가닥 영역을 포함할 것이다. 서열분석하고자 하는 주형의 영역은 상보적 가닥 상의 이러한 유리 3' 하이드록시 기를 오버행(overhang)할 것이다. 서열분석하고자 하는 주형의 오버행 영역은 단일-가닥일 수 있지만, 서열분석하고자 하는 주형 가닥에 상보적인 가닥 상에 "닉이 존재하여" 서열분석 반응의 개시를 위한 유리 3' OH 기를 제공한다면 이중-가닥일 수 있다. 그러한 실시 형태에서, 서열분석은 가닥 치환에 의해 진행될 수 있다. 소정 실시 형태에서, 유리 3' 하이드록시 기를 갖는 프라이머가 서열분석하고자 하는 주형의 단일-가닥 영역에 혼성화되는 별개의 성분(예를 들어, 짧은 올리고뉴클레오티드)으로서 첨가될 수 있다. 대안적으로, 프라이머 및 서열분석하고자 하는 주형 가닥은 각각, 예를 들어 헤어핀 루프 구조와 같은 분자내 이중체를 형성할 수 있는 부분적으로 자가상보적인 핵산 가닥의 일부를 형성할 수 있다. 헤어핀 폴리뉴클레오티드 및 이들이 고체 지지체에 부착될 수 있는 방법이 국제 특허 공개 WO0157248호 및 WO2005/047301호에 개시되어 있으며, 이들 각각은 전체적으로 본 명세서에 참고로 포함된다. 뉴클레오티드를 성장하는 프라이머에 연속적으로 부가할 수 있으며, 그 결과 5'에서 3' 방향으로 폴리뉴클레오티드 사슬이 합성될 수 있다. 부가된 염기의 성질은 각각의 뉴클레오티드 부가 후에 - 특히 그러나 반드시 그러한 것은 아님 - 결정되며, 이로써 핵산 주형에 대한 서열 정보를 제공할 수 있다. 따라서, 뉴클레오티드는 뉴클레오티드의 5' 포스페이트 기와의 포스포다이에스테르 결합의 형성을 통해 핵산 가닥의 유리 3' 하이드록시 기에 뉴클레오티드를 연결함으로써 핵산 가닥(또는 폴리뉴클레오티드) 내로 도입된다.
서열분석하고자 하는 핵산 주형은 DNA 또는 RNA, 또는 심지어 데옥시뉴클레오티드 및 리보뉴클레오티드로 구성된 하이브리드 분자일 수 있다. 핵산 주형은, 서열분석 반응에서 주형의 카피를 방해하지 않는 한, 천연 발생 및/또는 비천연 발생 뉴클레오티드 및 천연 또는 비천연 골격 결합을 포함할 수 있다.
특정한 실시 형태에서, 서열분석하고자 하는 핵산 주형은 당업계에 알려진 임의의 적절한 결합 방법을 통해, 예를 들어 공유 결합을 통해 고체 지지체에 부착될 수 있다. 특정한 실시 형태에서, 주형 폴리뉴클레오티드는 고체 지지체(예를 들어, 실리카 기반 지지체)에 직접 부착될 수 있다. 그러나, 본 발명의 다른 실시 형태에서, 고체 지지체의 표면은 주형 폴리뉴클레오티드의 직접 공유 결합을 가능하게 하거나, 그 자체가 고체 지지체에 비공유적으로 결합될 수 있는 하이드로겔 또는 다가전해질 다층을 통해 주형 폴리뉴클레오티드를 고정화하도록 어떤 방법으로든 개질될 수 있다.
국제 특허 공개 WO00/06770호(본 명세서에 참고로 포함됨)에 개시된 것들과 같이, 폴리뉴클레오티드가 지지체(예를 들어, 실리카-기반 지지체)에 직접 부착된 어레이에서, 폴리뉴클레오티드는 유리 상의 펜던트 에폭사이드 기와 폴리뉴클레오티드 상의 내부 아미노 기 사이의 반응에 의해 유리 지지체 상에 고정화된다. 또한, 폴리뉴클레오티드는, 예를 들어 국제 특허 공개 WO2005/047301호(본 명세서에 참고로 포함됨)에 기재된 바와 같이, 황-기반 친핵체와 고체 지지체의 반응에 의해 고체 지지체에 부착될 수 있다. 예를 들어 각각 본 명세서에 참고로 포함된 국제 특허 공개 WO00/31148호, WO01/01143호, WO02/12566호, WO03/014392호, 미국 특허 제6,465,178호, 및 국제 특허 공개 WO00/53812호에 기재된 바와 같이, 고체-지지된 주형 폴리뉴클레오티드의 또 다른 추가의 예는 주형 폴리뉴클레오티드가 실리카-기반 또는 다른 고체 지지체 상에 지지된 하이드로겔에 부착되어 있는 경우이다.
주형 폴리뉴클레오티드가 고정화될 수 있는 특정 표면은 폴리아크릴아미드 하이드로겔이다. 폴리아크릴아미드 하이드로겔은 상기에 인용된 참고문헌에 그리고 국제 특허 공개 WO2005/065814호(본 명세서에 참고로 포함됨)에 기재되어 있다. 사용될 수 있는 구체적인 하이드로겔은 국제 특허 공개 WO2005/065814호 및 미국 특허 출원 공개 제2014/0079923호에 기재된 것들을 포함한다. 일 실시 형태에서, 하이드로겔은 PAZAM(폴리(N-(5-아지도아세트아미딜펜틸) 아크릴아미드-코-아크릴아미드))이다.
DNA 주형 분자는, 예를 들어 미국 특허 제6,172,218호(이는 본 명세서에 참고로 포함됨)에 기재된 바와 같이 비드 또는 마이크로입자에 부착될 수 있다. 비드 또는 마이크로입자에 대한 부착은 서열분석 응용에 유용할 수 있다. 비드 라이브러리가 제조될 수 있으며, 여기서는 각각의 비드가 상이한 DNA 서열을 포함한다. 그들의 생성을 위한 예시적인 라이브러리 및 방법은 문헌[Nature, 437, 376-380 (2005); Science, 309, 5741, 1728-1732 (2005)]에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다. 본 명세서에 기재된 뉴클레오티드를 사용하는 그러한 비드들의 어레이의 서열분석은 본 발명의 범주 내에 있다.
서열분석하고자 하는 주형(들)은 고체 지지체 상의 "어레이"의 일부를 형성할 수 있으며, 이 경우에 어레이는 임의의 편리한 형태를 취할 수 있다. 따라서, 본 발명의 방법은 단일-분자 어레이, 클러스터링된 어레이, 및 비드 어레이를 포함한 모든 유형의 고밀도 어레이에 적용가능하다. 본 발명의 염료 화합물로 표지된 뉴클레오티드는, 고체 지지체 상에의 핵산 분자의 고정화에 의해 형성된 것들을 포함하지만 이로 한정되지 않는 본질적으로 임의의 유형의 어레이 상의 주형을 서열분석하는 데 사용될 수 있다.
그러나, 본 발명의 염료 화합물로 표지된 뉴클레오티드는 클러스터링된 어레이의 서열분석과 관련하여 특히 유리하다. 클러스터링된 어레이에서, 어레이 상의 별개의 영역(종종 부위 또는 특징부로 지칭됨)들은 다수의 폴리뉴클레오티드 주형 분자를 포함한다. 일반적으로, 이러한 다수의 폴리뉴클레오티드 분자는 광학적 수단에 의해 개별적으로 해상가능하지 않고 대신에 앙상블(ensemble)로서 검출된다. 어레이가 어떻게 형성되는지에 따라, 어레이 상의 각각의 부위는 하나의 개별 폴리뉴클레오티드 분자의 다수의 카피(예를 들어, 그 부위는 특정 단일- 또는 이중-가닥 핵산 종에 대해 균질함) 또는 심지어 소수의 상이한 폴리뉴클레오티드 분자들의 다수의 카피(예를 들어, 2개의 상이한 핵산 종의 다수의 카피)를 포함할 수 있다. 핵산 분자들의 클러스터링된 어레이는 당업계에서 일반적으로 알려진 기법을 사용하여 생성될 수 있다. 예로서, 국제 특허 공개 WO 98/44151호 및 WO00/18957호(각각 본 명세서에 참고로 포함됨)는 핵산의 증폭 방법을 기재하는데, 여기서는 고정화된 핵산 분자들의 클러스터들 또는 "콜로니"들로 구성된 어레이를 형성하기 위하여, 주형 및 증폭 산물이 고체 지지체 상에 고정화된 채로 남아 있다. 이들 방법에 따라 제조된 클러스터링된 어레이 상에 존재하는 핵산 분자들은 본 발명의 염료 화합물로 표지된 뉴클레오티드를 사용하여 서열분석하기에 적합한 주형이다.
본 발명의 염료 화합물로 표지된 뉴클레오티드는 또한 단일 분자 어레이 상의 주형의 서열분석에 유용하다. 본 명세서에 사용되는 용어 "단일 분자 어레이" 또는 "SMA"는 고체 지지체 상에 분포된(또는 배열된) 폴리뉴클레오티드 분자들의 집단을 지칭하며, 여기서 집단의 모든 다른 것들로부터 임의의 개별 폴리뉴클레오티드의 간격은 개별 폴리뉴클레오티드 분자들을 개별적으로 해상하는 것이 가능하도록 하는 것이다. 따라서, 고체 지지체의 표면 상에 고정화된 표적 핵산 분자는 일부 실시 형태에서 광학적 수단에 의해 해상될 수 있다. 이는, 각각의 신호가 하나의 폴리뉴클레오티드를 나타내는 하나 이상의 별개의 신호가, 사용되는 특정 이미징 장치의 해상가능한 영역 내에서 발생할 것임을 의미한다.
어레이 상의 인접한 폴리뉴클레오티드 분자들 사이의 간격이 적어도 100 nm, 더 특히 적어도 250 nm, 훨씬 더 특히 적어도 300 nm, 더욱 더 특히 적어도 350 nm인 단일 분자 검출이 달성될 수 있다. 따라서, 각각의 분자는 개별적으로 해상가능하고 단일 분자 형광점으로서 검출가능하고, 상기 단일 분자 형광점으로부터의 형광은 또한 단일 단계 광표백을 나타낸다.
용어 "개별적으로 해상된" 및 "개별 해상도"는, 시각화될 때, 어레이 상의 하나의 분자를 그의 이웃하는 분자와 구별하는 것이 가능함을 명시하기 위해 본 명세서에서 사용된다. 어레이 상의 개별 분자들 사이의 분리는 개별 분자들을 해상하는 데 사용되는 특정 기법에 의해 부분적으로 결정될 것이다. 단일 분자 어레이의 일반적인 특징은 국제 특허 공개 WO00/06770호 및 WO 01/57248호를 참조함으로써 이해될 것이며, 이들 각각은 본 명세서에 참고로 포함된다. 본 발명의 표지된 뉴클레오티드의 한 가지 용도는 합성에 의한 서열분석 반응에서의 것이지만, 그러한 뉴클레오티드의 유용성은 그러한 방법으로 제한되지 않는다. 실제로, 본 명세서에 기재된 표지된 뉴클레오티드는 폴리뉴클레오티드 내로 도입된 뉴클레오티드에 부착된 형광 표지의 검출을 필요로 하는 임의의 서열분석 방법에서 유리하게 사용될 수 있다.
특히, 본 발명의 염료 화합물로 표지된 뉴클레오티드는 자동화 형광 서열분석 프로토콜, 특히 Sanger 및 그 동료들의 사슬 종결 서열분석 방법에 기초한 형광 염료-종결자 사이클 서열분석에 사용될 수 있다. 그러한 방법은 일반적으로 효소, 및 프라이머 신장 서열분석 반응에서 형광 표지된 다이데옥시뉴클레오티드를 도입시키는 사이클 서열분석을 사용한다. 이른바 Sanger 서열분석 방법, 및 관련 프로토콜(Sanger-유형)은 표지된 다이데옥시뉴클레오티드를 갖는 랜덤화된 사슬 종결을 이용한다.
따라서, 본 발명은 또한 3' 및 2' 위치 둘 모두에서 하이드록시 기가 결여된 다이데옥시뉴클레오티드인 염료 화합물로 표지된 뉴클레오티드를 포함하며, 그러한 변형된 다이데옥시뉴클레오티드는 Sanger 유형 서열분석 방법 등에 사용하기에 적합하다.
3' 블록킹 기를 도입시킨 본 발명의 염료 화합물로 표지된 뉴클레오티드 - 이것은 인식될 것임 - 가 또한 Sanger 방법 및 관련 프로토콜에 이용될 수 있는데, 그 이유는, 다이데옥시 뉴클레오티드를 사용함으로써 달성되는 것과 동일한 효과가 3' 히드록시 블록킹 기를 갖는 뉴클레오티드를 사용함으로써 달성될 수 있기 때문이다: 둘 모두는 후속 뉴클레오티드의 도입을 방지한다. 3' 블록킹 기를 갖는 본 발명에 따른 뉴클레오티드가 Sanger-유형 서열분석 방법에서 사용되는 경우, 뉴클레오티드에 부착된 염료 화합물 또는 검출가능한 표지는 절단가능한 링커를 통해 연결될 필요가 없음이 이해될 것인데, 그 이유는, 본 발명의 표지된 뉴클레오티드가 도입되는 각각의 경우에, 뉴클레오티드는 후속으로 도입될 필요가 없으며, 이에 따라 표지는 뉴클레오티드로부터 제거될 필요가 없기 때문이다.
대안적으로, 본 명세서에 기재된 서열분석 방법은 비표지된 뉴클레오티드 및 본 명세서에 기재된 형광 염료를 함유하는 친화성 시약을 사용하여 또한 수행될 수 있다. 예를 들어, 단계 (a)의 도입 혼합물 내의 4개의 상이한 유형의 뉴클레오티드(예컨대, dATP, dCTP, dGTP 및 dTTP 또는 dUTP) 중 1개, 2개, 3개 또는 각각은 비표지될 수 있다. 4개의 유형의 뉴클레오티드의 각각(예컨대, dNTP)은 3' 하이드록시 블록킹 기를 가져서, 단일 염기만 폴리머라제에 의해 프라이머 폴리뉴클레오티드의 3' 말단에 첨가될 수 있도록 보장한다. 단계 (b)에서 비표지된 뉴클레오티드의 도입 후에, 나머지 도입되지 않은 뉴클레오티드는 세척된다. 이어서, 도입된 dNTP를 포함하는 표지된 신장 생성물을 제공하기 위해 도입된 dNTP를 특이적으로 인식하고 그에 결합하는 친화성 시약이 도입된다. 합성에 의한 서열분석에서 비표지된 뉴클레오티드 및 친화성 시약의 용도는 국제 특허 공개 WO 2018/129214호 및 WO 2020/097607호에 개시되어 있다. 비표지된 뉴클레오티드를 사용한 본 발명의 변형된 서열분석 방법은 하기 단계를 포함할 수 있다:
(a') 프라이머 폴리뉴클레오티드/표적 폴리뉴클레오티드 복합체를 하나 이상의 비표지된 뉴클레오티드(예컨대, dATP, dCTP, dGTP, 및 dTTP 또는 dUTP)와 접촉시키는 단계로서, 프라이머 폴리뉴클레오티드는 표적 폴리뉴클레오티드의 적어도 일부분에 상보적인, 상기 단계;
(b') 뉴클레오티드를 프라이머 폴리뉴클레오티드 내로 도입시켜 신장된 프라이머 폴리뉴클레오티드를 생성하는 단계;
(c') 도입된 비표지된 뉴클레오티드에 하나의 친화성 시약이 특이적으로 결합하는 조건 하에서, 신장된 프라이머 폴리뉴클레오티드를 친화성 시약의 세트와 접촉시켜 표지된 신장된 프라이머 폴리뉴클레오티드/표적 폴리뉴클레오티드 복합체를 제공하는 단계;
(d') 도입된 뉴클레오티드의 정체를 결정하기 위해 표지된 신장된 프라이머 폴리뉴클레오티드/표적 폴리뉴클레오티드 복합체의 하나 이상의 형광 측정을 수행하는 단계.
본 명세서에 기재된 변형된 서열분석 방법의 일부 실시 형태에서, 도입 혼합물 내의 비표지된 뉴클레오티드의 각각은 3' 블록킹 기를 함유한다. 추가의 실시 형태에서, 도입된 뉴클레오티드의 3' 블록킹 기는 다음 도입 사이클 전에 제거된다. 더 추가의 실시 형태에서, 본 방법은 도입된 뉴클레오티드로부터 친화성 시약을 제거하는 단계를 추가로 포함한다. 더 추가의 실시 형태에서, 3' 하이드록시 블록킹 기 및 친화성 시약은 동일한 반응에서 제거된다. 일부 실시 형태에서, 친화성 시약의 세트는 제1 유형의 뉴클레오티드에 특이적으로 결합하는 제1 친화성 시약, 제2 유형의 뉴클레오티드에 특이적으로 결합하는 제2 친화성 시약, 및 제3 유형의 뉴클레오티드에 특이적으로 결합하는 제3 친화성 시약을 포함할 수 있다. 일부 추가의 실시 형태에서, 제1 친화성 시약, 제2 친화성 시약, 및 제3 친화성 시약의 각각은 스펙트럼적으로 구별가능한 하나 이상의 검출가능한 표지를 포함한다. 일부 실시 형태에서, 친화성 시약은 단백질 태그, 항체(항체, 단일 사슬 항체, 이중특이적 항체 등의 결합 단편을 포함하지만 이로 한정되지 않음), 압타머(aptamer), 노틴(knottin), 아피머(affimer), 또는 도입된 뉴클레오티드에 적합한 특이성 및 친화성으로 결합하는 임의의 다른 공지된 제제를 포함할 수 있다. 일 실시 형태에서, 적어도 하나의 친화성 시약은 항체 또는 단백질 태그이다. 다른 실시 형태에서, 제1 유형, 제2 유형 및 제3 유형의 친화성 시약 중 적어도 하나는 하나 이상의 검출가능한 표지(예를 들어, 동일한 검출가능한 표지의 다수의 카피)를 포함하는 항체 또는 단백질 태그이며, 여기서 검출가능한 표지는 본 명세서에 기재된 비스-보론 염료 모이어티이거나 이를 포함한다.
실시예
추가의 실시 형태가 하기 실시예에서 더욱 상세히 개시되며, 이러한 실시예는 어떤 식으로든 청구범위의 범위를 제한하고자 의도되지 않는다.
실시예 1. 융합 비스-붕소 헤테로사이클을 함유하는 염료의 합성
EtOH (20 mL) 중 3,5-다이메틸피롤-2-카르복스알데하이드(369 mg, 3.00 mmol) 및 6-하이드라지노니코틴산(459 mg, 3.00 mmol)을 AcOH(100 μL)로 처리하고 5시간 동안 환류에서 가열하였다. 생성된 침전물을 진공 하에 여과하고 EtOH로 세척하여, 상응하는 하이드라존 생성물(화합물 a)을 황색 고체(595 mg, 77%)로서 수득하였다. 1H NMR (400 ㎒, DMSO-d 6) δ 10.91 (s, 1H), 10.73 (s, 1H), 8.59 (d, J = 2.2 ㎐, 1H), 8.07 ― 7.90 (m, 2H), 7.28 (d, J = 8.9 ㎐, 1H), 5.66 (d, J = 2.5 ㎐, 1H), 2.19 (s, 3H), 2.06 (s, 3H).
본 명세서에 기재된 일반 절차에 따라 화학식 I의 일부 비스-붕소 함유 융합 피리도- 및 피라지노-헤테로사이클의 유도체를 제조하였다.
일반 절차 A
톨루엔 중 관련 치환된 {2-[(1H-피롤-2-일)메틸렌]하이드라지닐}피리딘 또는 -피라진(1.0 당량)을 TEA(18.0 당량)로 처리하였다. 반응 혼합물을 10분 동안 환류시킨 후에 BF3·OEt2(20.0 당량)를 적가하였다. 반응 혼합물을 5시간 동안 환류에서 교반하였다. 반응 용매를 진공 하에 제거하였다. 조 물질을 DCM에 용해시키고 유기층을 H2O로 세척하고, 이어서 무수 Na2SO4로 건조시켰다. 조 생성물을 플래시 크로마토그래피에 의해 정제하였다.
톨루엔(10 mL) 중 하이드라존 화합물(129 mg, 0.5 mmol)을 Et3N(1.25 mL)으로 처리하고 실온에서 10분 동안 교반하였다. 이어서 BF3OEt(1.5 mL)를 적가하고 반응 혼합물을 18시간 동안 환류에서 교반하였다. 혼합물을 실온으로 냉각시키고, 진공에서 농축하고, 이어서 분취용 역상 HPLC에 의해 정제하여 화합물 I-1(70 μmol, 14%)을 수득하였다. 질량 분석: [M-] = 353
일반 절차 A에 기초하여 (Z)-2-클로로-6-(2-((4-에틸-3,5-다이메틸-1H-피롤-2-일)메틸렌)하이드라지네일)피라진으로부터 화합물 b를 제조하였다. 조 화합물을 플래시 크로마토그래피에 의해 정제하여 화합물을 밝은 황색 고체로서 수득하였다(수율: 61%). MS [M+ H]+ = 374.
일반 절차 A에 기초하여 화합물 c로부터 화합물 I-8을 제조하였다. 조 화합물을 플래시 크로마토그래피에 의해 정제하여 I-8을 밝은 황색 고체로서 수득하였다(수율: 67%). MS [M+H]+ = 356, [M-H]- = 354.
일반 절차 A에 기초하여 화합물 d로부터 화합물 e를 제조하였다. NMR 및 LCMS에 의해 구조 및 조성을 확인하였다.
밝은 황색 고체로서 5-((2-(6-클로로피리딘-2-일)하이드라지네일리덴)메틸)-2,4-다이메틸-1H-피롤-3-카르복실산(화합물 f)(1.0 당량)으로부터 일반 절차 A에 따라 화합물 I-7을 제조하였다. 조 물질을 플래시 크로마토그래피에 의해 정제하여 최종 생성물을 밝은 황색 고체로서 수득하였다(수율: 59%). MS [M- H]- = 387.
치환체의 변경, 예를 들어, 아진 고리의 위치 2에서 염소 원자의 치환에 의해, 예를 들어 일반 절차 B에 따라 화학식 I의 비스-붕소 함유 융합 피리도- 및 피라지노-헤테로사이클의 일부 새로운 작용성 유도체를 또한 제조할 수 있었다.
일반 절차 B
DMSO 중 적절한 클로로-치환된 화합물(1 당량), 1차-, 2차 아민 또는 아미노산(1.1 당량) 및 TEA(2 당량)의 혼합물을 95℃에서 5시간 동안 교반하였다. 이어서, 반응 혼합물을 MeCN 및 0.1 M TEAB로 희석하고, 역상 분취용 HPLC에 의해 정제하였다.
일반 절차 B에 따라 화합물 e를 설포알라닌과 반응시켜 화합물 I-3을 제조하였다. 반응 혼합물을 95℃에서 5시간 동안 가열하여 최종 생성물을 밝은 황색 고체로서 수득하였다(수율: 79%). MS [M-H]- = 504.
일반 절차 B에 따라 화합물 b를 설포알라닌과 반응시켜 화합물 I-6을 제조하였다. 반응 혼합물을 95℃에서 16시간 동안 가열하여 최종 생성물을 밝은 황색 고체로서 수득하였다(수율: 5%). MS [M-H]- = 505.
일반 절차 B에 따라 화합물 e를 아제티딘-3-카르복실산과 반응시켜 화합물 I-9를 제조하였다. 반응 혼합물을 95℃에서 5시간 동안 가열하여 최종 생성물을 밝은 황색 고체로서 수득하였다(수율: 99%). MS [M-H]- = 436.
일반 절차 B에 따라 화합물 I-7을 2-옥사-6-아자스피로[3.3]헵탄과 반응시켜 화합물 I-13을 제조하였다. 생성물을 밝은 황색 고체로서 단리하였다(수율: 69%). MS [M-H]-= 450.
일반 절차 C
DCM BCl3 (4.5 당량) 중 적절한 비스-다이플루오로붕소 함유 융합 헤테로사이클(1 당량)의 용액에 적가하였다. 반응 혼합물을 30분 동안 교반한 다음, TEA(12.0 당량)를 첨가한 후, 지방족, 방향족 모노- 또는 다이카본산, 예를 들어 아세트산(8.0 당량) 또는 말론산(4.0 당량) 또는 이들의 유도체를 첨가하였다. 반응 혼합물을 16시간 동안 교반하였다. 조 물질을 Celite를 통해 여과하고, Celite를 추가로 DCM으로 세척하였다. 용매를 진공 하에 제거하고 수득된 잔류물을 0.1 M TEAB를 갖는 MeCN 중에 용해시키고 역상 분취용 HPLC에 의해 정제하였다.
아세트산을 사용하여 일반 절차 C에 기초하여 I-3으로부터 화합물 I-4를 제조하였다. 반응 혼합물을 실온에서 16시간 동안 교반하여 I-3을 수득하였다(수율: 5%). MS [M-H]- = 664.
일반 절차 C에 기초하여 I-9로부터 화합물 I-10을 제조하였다. 반응 혼합물을 실온에서 16시간 동안 교반하여 I-10을 수득하였다(수율: 3%). MS [M-H]- =596.
일반 절차 D
THF 중 적절한 비스-다이플루오로붕소 함유 융합 헤테로사이클(1 당량)의 용액에 그리냐르 시약 RMgBr(20.0 당량)을 -78℃에서 적가하였다. 반응 혼합물을 16시간 동안 교반하였다. 용매를 진공 하에 제거하였다. 잔류물을 DCM에 용해시키고, 유기층을 H2O/NH4Cl로 세척하고, 이어서 무수 Na2SO4로 건조시키고 역상 분취용 HPLC에 의해 정제하였다.
일반 절차 D에 기초하여 I-9를 PhMgBr과 반응시킴으로써 화합물 I-14를 제조하였다(수율: 12%). MS [M-H]- =668.
일반 절차 D에 기초하여 I-3을 PhMgBr과 반응시킴으로써 화합물 I-15를 제조하였다(수율: 3%). MS [M-H]- =736.
본 명세서에 일부 개시된 예시적인 염료의 형광 스펙트럼이 하기 표 1에 요약되어 있다.
[표 1]
실시예 2. 비스-붕소 융합 헤테로사이클을 함유하는 염료로 표지된 ffN의 합성
본 명세서에 기재된 비스-붕소 함유 융합 헤테로사이클 화합물은 아미노 모이어티를 함유하는 적절한 작용화된 뉴클레오티드 유도체와의 커플링 반응에 의해 뉴클레오티드 표지화에 사용될 수 있다.
일반 절차 E
기재된 비스-붕소 함유 융합된 헤테로사이클 화합물은 아미노 모이어티를 함유하는 적절한 작용화된 뉴클레오티드와의 커플링 반응에 의해 뉴클레오티드 표지화에 사용될 수 있다. 화학식 I의 염료를 무수 N,N'-다이메틸아세트아미드(DMA)에 용해시켰다. N,N-다이아이소프로필에틸아민(DIPEA)을 첨가한 후에, TNTU를 첨가하였다. 반응물을 질소 하에 실온에서 30분 동안 교반하였다. 활성화된 비스-붕소 염료 용액을 트라이에틸암모늄 바이카르보네이트(TEAB) 용액 중 3' 블록킹된 2'-데옥시뉴클레오시드 트라이포스페이트-링커에 첨가하고 반응물을 실온에서 18시간 동안 교반하였다. 조 생성물을 먼저 DEAE-Sephadex A25 상에서 이온-교환 크로마토그래피에 의해 정제하였다. 작용화된 뉴클레오티드를 함유하는 분획을 풀링하고, 용매를 감압 하에 증발 건조시켰다. 조물질을 YMC-Pack-Pro C18 컬럼을 사용하여 분취 규모 RP-HPLC에 의해 추가로 정제하였다. 최종 화합물을 LC-MS, 분석용 RP-HPLC 및 UV-Vis 분광법에 의해 특성화하였다.
ffN 커플링의 일반 절차에 기초하여 I-1로부터 ffC-sPA-I-1을 제조하였다(수율: 14%). MS [M-] =1257.
ffN 커플링의 일반 절차에 기초하여 I-3으로부터 ffC-sPA-I-3을 제조하였다(수율: 6%). MS [M-] =1408.
ffN 커플링의 일반 절차에 기초하여 I-4로부터 ffC-sPA-I-4를 제조하였다(수율: 24%). MS [M-2H]2- =795.
ffN 커플링의 일반 절차에 기초하여 I-6으로부터 ffA-sPA-I-6을 제조하였다(수율: 8%). MS [M-2H]2- =717.
ffN 커플링의 일반 절차에 기초하여 I-9로부터 ffA-sPA-I-9를 제조하였다(수율: 17%). MS [M-2H]2- =681.
ffN 커플링의 일반 절차에 기초하여 I-13으로부터 ffA-sPA-I-13을 제조하였다. 반응 혼합물을 40℃에서 48시간 동안 가열하였고 A-SpA 및 DIPEA의 최종 당량은 저속 커플링 반응으로 인해 각각 (2.0 당량) 및 (20.0 당량)이다. MS [M-H]- = 1378, [M+H]+ =1380.
본 명세서에 개시된 예시적인 ffN의 형광 스펙트럼이 하기 표 2에 요약되어 있다.
[표 2]
실시예 3. ffN 스펙트럼 특성 비교
이 실시예에서, 비스-붕소 염료 I-4(A-sPA-I-4)와 접합된 완전히 작용화된 A 뉴클레오티드(ffA)의 스펙트럼 특성을 특성화하였다. 도 1은 Universal Scan Mix(USM, 1 M Tris pH 7.5, 0.05% TWEEN, 20 mM 아스코르브산 나트륨, 10 mM 에틸 갈레이트) 중 참조 염료 A(C-sPA-참조 염료 A)로 표지된 구매가능한 완전히 작용화된 C 뉴클레오티드(ffC) 및 A-spA-I-4의 방출 스펙트럼을 예시한다. 석영 또는 플라스틱 큐벳을 사용하여, Agilent Cary 100 UV-Vis 분광광도계 및 Cary Eclipse 형광 분광광도계에서 스펙트럼을 획득하였다. A-sPA-I-4는 참조 염료 A에 비해 더 짧은 스토크스 이동을 갖는 것으로 관찰되었다.
실시예 4. 비스-붕소 염료의 안정성
2일 동안 암실에서 37℃에서 50 mM 에탄올아민을 함유하는 도입 완충액 중에서 화합물을 인큐베이션함으로써, 화합물 I-1 및 화합물 I-3의 안정성을 평가하고 참조 염료 A로 표지된 시판 ffC와 비교하였다. 석영 큐벳을 사용하여, Agilent Cary 100 UV-Vis 분광광도계 및 Cary Eclipse 형광 분광광도계에서 용액의 형광 강도를 측정하였다. 또한, 분취량의 용액을 취하여 분석용 HPLC로 분석하였다. 도 2는 I-1 및 I-3의 형광 강도가 C-sPA-참조 염료 A와 비교하여 시간이 지남에 따라 매우 느리게 감소하였음을 보여주며, 이는 비스-붕소 염료 I-1 및 I-3이 동일한 조건 하에서 참조 염료 A와 비교하여 더 안정함을 나타낸다.
실시예 5. Illumina MiSeq™ 플랫폼에서의 서열분석 실험
녹색 여기 광(약 450 nm)을 사용하여 제1 이미지를 취하고 청색 여기 광(약 520 nm)을 사용하여 제2 이미지를 취하도록 설정된 Illumina MiSeq™ 기기에서 비스-붕소 염료 I-4로 표지된 ffA를 시험하였다. 실험에 사용한 도입 혼합물은 다음 5가지 ffN을 포함한다: A-sPA-I-4, 공지된 폴리메틴 녹색 염료 NR550S0으로 표지된 ffA(A-sPA-NR550S0), 청색 쿠마린 염료로 표지된 ffC(C-sPA-참조 염료 B), 녹색 염료 NR550S0으로 표지된 ffT(T-sPA-NR550S0), 및 비표지 ffG(암색 G)를 50 mM 에탄올아민 완충액, pH 9.6, 50 mM NaCl, 1 mM EDTA, 0.2% CHAPS, 4 mM MgSO4 및 DNA 폴리머라제 중에 포함한다. 도 3은 구매가능한 참조 1 ffN 세트 및 참조 2 ffN 세트와 비교하여 ffA-spA-I-4를 함유하는 ffN 세트의 서열분석 매트릭스 퍼센트 페이징을 나타낸다. 참조 1 ffN 세트는 다음 ffN을 포함한다: 암색 G, T-LN3-AF550POPOS0, C-sPA-참조 염료 A, C-LN3-SO7181, A-BL-참조 염료 A, A-BL-NR550S0. 참조 2 ffN 세트는 다음 ffN을 포함한다: 암색 G, T-LN3-AF550POPOS0, C-sPA-참조 염료 B, C-LN3-SO7181, A-sPA-BL-참조 염료 B, A-sPA-BL-NR550S0. C-sPA-참조 염료 B의 구조는 다음과 같다:
.
비스-붕소 염료 표지된 ffA를 포함하는 ffN 세트의 퍼센트 페이징은 26 사이클 후에 0.1% 미만인 것으로 관찰되었다. 그러나, 광량이 증가할 때, 페이징 값이 또한 증가하였다.
도 4a 및 도 4b는 사이클 26에서 ffA-spA-I-3을 함유하는 도입 혼합물에 대해 얻어진 산포도이다. 도 4c 및 도 4d는 사이클 26에서 ffA-spA-I-4를 함유하는 도입 혼합물에 대해 얻어진 산포도이다. 5배의 광량(5×)은 I-3으로 표지된 ffA에 대한 클라우드의 광표백을 유발하는 것으로 관찰되었다(도 4b, 상부 우측 사분면 참조). 그러나, 플루오로 기를 -OAc로 대체할 때, I-4로 표지된 ffA의 광안정성은 도 4d의 상부 우측 사분면에 나타나 있는 바와 같이 크게 개선되었다.