KR20160034901A

KR20160034901A - 서열 조작에 최적화된 ｃｒｉｓｐｒ-ｃａｓ 이중 닉카아제 시스템, 방법 및 조성물

Info

Publication number: KR20160034901A
Application number: KR1020167001293A
Authority: KR
Inventors: 펑 장; 패트릭 수; 치에-유 린; 페이 란
Original assignee: 더 브로드 인스티튜트, 인코퍼레이티드; 프레지던트 앤드 펠로우즈 오브 하바드 칼리지; 매사추세츠 인스티튜트 오브 테크놀로지
Priority date: 2013-06-17
Filing date: 2014-06-10
Publication date: 2016-03-30
Also published as: WO2014204725A1; JP2024023239A; EP4245853A2; AU2014281027A1; CN105492611A; US20230374550A1; JP2022071089A; US20160153006A1; US10711285B2; JP7383062B2; JP7083364B2; JP7682975B2; US11597949B2; EP4245853A3; CA2915837A1; US20200377912A1; WO2014204725A8; EP3011030B1; HK1223645A1; EP3011030A1

Abstract

본 발명은 서열들 및/또는 표적 서열들의 활성을 조작하기 위한 시스템들, 방법들 및 조성물들을 전달, 조작 및 최적화를 제공한다. 본 발명에는 벡터들과 벡터 시스템들[이것들 중 일부는 CRISPR 복합체의 구성성분 1 개 이상을 암호화함] 뿐만 아니라, 이와 같은 벡터들을 디자인하는 방법 및 이것들의 용도가 제공된다. 뿐만 아니라, 본 발명에는 원핵생물 및 진핵 세포 내에서 CRISPR 복합체 형성을 지시하여, 표적 인지 및 독성 회피에 대한 향상된 특이성을 보장하는 방법도 제공된다.

Description

서열 조작에 최적화된 ＣＲＩＳＰＲ-ＣＡＳ 이중 닉카아제 시스템, 방법 및 조성물{OPTIMIZED CRISPR-CAS DOUBLE NICKASE SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION}

관련 출원 및 참조로서의 포함

미국에 대해 2013년 6월 17일에 출원된 미국 가출원 61/836,123, 2013년 7월 17일에 출원된 61/847,537, 2013년 8월 5일에 출원된 61/862,355, 2013년 8월 28일에 출원된 61/871,301, 2013년 12월 12일에 출원된 61/915,383, 및 2013년 12월 12일에 출원된 PCT/US2013/074667이 우선권으로 주장되고, 본 출원은 또한 일부계속출원이다.

전술한 출원, 및 상기 출원에 또는 상기 출원의 절차 중에 인용된 모든 문헌("출원 인용 문헌") 및 상기 출원 인용 문헌에 인용되거나 참고된 모든 문헌, 및 본원에서 인용되거나 참고된 모든 문헌("본원 인용 문헌") 및 본원 인용 문헌에 인용되거나 참고된 모든 문헌은, 본원에 언급되거나 본원에 참고로 포함된 임의의 문헌에 언급된 임의의 제품에 대한 임의의 제조사의 지침서, 설명서, 제품 명세서 및 제품 시이트(sheet)와 함께, 본원에 참고로 포함되어 있으며, 그리고 본 발명의 실시에 사용될 수 있다. 더욱 구체적으로, 모든 참조된 문헌은 마치 각각의 개별 문헌을 참고로 포함하는 것으로 특정적으로 그리고 개별적으로 나타내는 것과 동일한 정도로 참고로 포함된다.

기술 분야

본 발명은 일반적으로 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats; CRISPR) 및 그의 구성성분과 관련된, 게놈 변동(genomic perturbation) 또는 유전자-편집(gene-editing)과 같이 서열 표적화를 수반하는 유전자 발현의 제어를 위해 사용되는 시스템, 방법 및 조성물의 전달, 유전자 조작 및 최적화에 관한 것이다.

연방 정부가 후원하는 연구에 대한 성명

본 발명은 미국 국립 보건원(National Institutes of Health)에 의해 지급된 NIH 파이오니어 어워드(Pioneer Award)(1DP1MH100706)하의 정부 지원으로 수행되었다. 정부는 본 발명에 소정의 권리를 갖는다.

게놈 시퀀싱(sequencing) 기법 및 분석 방법의 최근의 진전에 의해, 다양한 생물학적 기능 및 질병(disease)과 연관된 유전적 요인을 분류하고 발견하는 능력이 상당히 가속화되었다. 개별 유전 요소의 선택적 변동을 가능하게 함으로써 원인이 되는 유전 변이의 체계적인 역의 조작을 가능하게 할 뿐 아니라, 합성 생물학, 생명공학 및 의학 응용을 진전시키기 위하여, 정밀한 게놈 표적화 기술이 필요하다. 게놈-편집 기법, 예를 들어, 디자이너 징크 핑거, 전사 활성화제-유사 이펙터(effector)(TALE) 또는 귀소 메가뉴클레아제(homing meganuclease)가 표적화된 게놈 변동을 생성하는데 이용가능하지만, 가격이 알맞고, 설립하기 용이하며, 확대가능하고, 진핵 게놈 내의 다수의 위치를 표적화하는데 부합되는 새로운 게놈 조작 기술에 대한 필요성이 남아있다.

CRISPR/Cas 시스템은 특정 서열을 표적화하기 위해 맞춤형 단백질의 생성을 필요로 하지 않고, 오히려, 단일의 Cas 효소가 짧은 RNA 분자에 의해 프로그램화되어, 특정 DNA 표적을 인식할 수 있다. 게놈 시퀀싱(sequencing) 기법 및 분석 방법의 레퍼토리에 CRISPR-Cas 시스템을 부가하면, 방법을 상당히 단순화시킬 수 있으며, 다양한 생물학적 기능 및 질병과 연관된 유전적 요인을 분류하고 발견하는 능력을 가속화시킬 수 있다. 유해 영향 없이 게놈 교정을 위해 효율적으로 CRISPR-Cas 시스템을 사용하기 위하여, 청구된 발명의 양태인 이들 게놈 조작 도구의 최적화 및 조작의 양태를 이해하는 것이 중요하다.

다수의 적용분야를 지니는 서열 표적화를 위한 대안의 및 강한 시스템 및 기법에 대한 절실한 필요가 존재한다. 본 발명의 양태는 이러한 필요를 처리하고 관련된 이점을 제공한다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 가이드 서열과 복합체화되는 CRISPR 효소 복합체를 포함한다. 가이드 서열은 tracr 메이트 서열에 연결되고, 이는 결국 tracr 서열에 혼성화된다.

일 양태에서, 본 발명은 CRISPR 시스템의 요소들 1 개 이상을 사용하기 위한 방법을 제공한다. 본 발명의 CRISPR 복합체는 표적 폴리뉴클레오티드를 변형하기 위한 효과적인 수단을 제공한다. 본 발명의 CRISPR 복합체는 다수의 세포 유형들에 있어서 표적 폴리뉴클레오티드를 변형(예를 들어, 결실, 삽입, 전좌, 불활성화, 활성화)하는 것을 비롯하여 다 각도로 사용되고 있다. 일 양태에서, 세포는 진핵 세포다. 일 양태에서, 세포는 원핵 세포다. 그러므로 본 발명의 CRISPR 복합체는, 예를 들어 유전자 또는 게놈 편집, 유전자 요법, 약물 발견, 약물 스크리닝, 질병 진단 및 예후를 비롯한 분야에서 광범위하게 사용되고 있다. 예시적 CRISPR 복합체는 표적 폴리뉴클레오티드 내 표적 서열에 혼성화된 가이드 서열(guide sequence)과 복합체를 형성한 CRISPR 효소를 포함한다. 일 양태에서, 가이드 서열은 이후 tracr 메이트 서열(tracr mate sequence)과 결합하고 나서, tracr 서열(tracer sequence)과 혼성화된다. 일 양태에서, CRISPR 효소는 닉카아제(nickase)이다.

본 발명의 양태는 최적의 활성을 갖는 가이드 RNA를 갖는 CRISPR-Cas9 시스템에서 개선된 표적화 특이성을 갖는 Cas9 효소(이 때, Cas9 효소는 야생형 Cas9 효소(및 이를암호화하는 핵산 분자)보다 길이가 더 짧음), 및 키메라 Cas9 효소뿐만 아니라, Cas9 효소의 표적 특이성을 개선하는 방법, 또는 최적의 활성을 갖는 가이드 RNA를 설계 또는 준비하는 단계, 및/또는 야생형 Cas9보다 크기 또는 길이가 더 작은 Cas9를 선택 또는 준비함으로써, 야생형 Cas9에 대해서보다 전달 벡터 내에 더 적은 암호화 서열이 있기 때문에 전달 벡터 내로 상기 작제물을 암호화하는 핵산을 패키징하는 것이 유리한 단계 및/또는 키메라 Cas9 효소를 생성하는 단계를 포함하는 CRISPR-Cas9 시스템을 설계하는 방법에 관한 것이다.

또한 의학에서의 본 서열, 벡터, 효소 또는 시스템의 용도가 제공된다. 또한 유전자 또는 게놈 편집에서의 본 서열, 벡터, 효소 또는 시스템의 용도가 제공된다.

본 발명의 추가의 양태에서, Cas9 효소는 돌연변이를 1 개 이상 포함할 수 있으며, 기능성 도메인과 융합하거나 융합하지 않은 채 포괄적 DNA 결합 단백질로서 사용될 수 있다. 돌연변이들은 인위적으로 도입된 돌연변이, 기능획득 돌연변이 또는 기능상실 돌연변이일 수 있다. 돌연변이로서는 촉매적 도메인들 중 하나(예를 들어, 잔기 D10 및 H840)에서 일어나는 돌연변이들을 포함할 수 있으나, 이에 한정되는 것은 아니다. 추가의 돌연변이들이 특성규명되었으며, 이 돌연변이들은 본 발명의 구조체들에 이용될 수 있다. 본 발명의 일 양태에서, 돌연변이된 Cas9 효소는 단백질 도메인, 예를 들어 전사 활성화 도메인에 융합될 수 있다. 일 양태에서, 전사 활성화 도메인은 VP64일 수 있다. 본 발명의 다른 양태들은, 전사 억제인자, 재조합효소, 전위효소, 히스톤 리모델러(histone remodeler), DNA 메틸트랜스퍼라제, 크립토크롬, 광 유도성/제어가능 도메인 또는 화학 유도성/제어가능 도메인을 포함하되 이에 한정되는 것은 아닌 도메인들에 융합된 돌연변이 Cas9 효소에 관한 것이다.

추가 구현예에서, 본 발명은 세포에서 이들 RNA의 성능을 향상시키는 돌연변이체 tracr RNA 및 직접 반복 서열 또는 돌연변이체 키메라 가이드 서열을 생성하는 방법을 제공한다. 본 발명의 양태는 또한 상기 서열의 선택을 제공한다.

본 발명의 다른 양태는 또한 CRISPR 복합체의 구성성분들의 클로닝 및 전달을 간편하게 만들기 위한 방법도 제공한다. 본 발명의 바람직한 구현예에서, 적당한 프로모터, 예를 들어 U6 프로모터는 DNA 올리고머와 함께 증폭되고, 가이드 RNA를 암호화하는 서열과 연속하여 이 서열의 상류에 위치한다. 이로부터 생성된 PCR 생성물은 이후 세포로 트랜스펙션하게 되고, 그 결과 가이드 RNA의 발현이 구동된다. 본 발명의 양태들은 또한 시험관 내에서 전사되거나, 또는 합성 업체로부터 주문되어 직접 트랜스펙션되는 가이드 RNA에 관한 것이기도 하다.

일 양태에서, 본 발명은 활성이 더욱 큰 중합효소가 사용됨으로써 활성을 개선하기 위한 방법을 제공한다. 일 양태에서, T7 프로모터는 가이드 RNA를 암호화하는 서열과 연속하여 이 서열의 상류에 삽입될 수 있다. 바람직한 구현예에서, T7 프로모터의 제어하에 있는 가이드 RNA의 발현은, 세포 내에서의 T7 중합효소의 발현에 의해 구동된다. 유리한 구현예에서, 세포는 진핵 세포다. 바람직한 구현예에서, 진핵 세포는 인간 세포이다. 더욱 바람직한 구현예에서, 인간 세포는 환자 특이 세포이다.

일 양태에서, 본 발명은 Cas 효소의 독성을 감소시키는 방법을 제공한다. 임의의 양태들에서, Cas 효소는 본원에 개시된 바와 같은 임의의 Cas9으로서, 예를 들어 임의의 천연 발생 박테리아 Cas9과 임의의 키메라, 돌연변이체, 상동체 또는 오솔로그(otholog)이다. 일 양태에서, Cas 효소는 닉카아제이다. 하나의 구현예에서, Cas9는 mRNA의 형태로서 세포에 전달된다. 이를 통하여 효소의 일시적 발현이 가능해지고, 이로써 독성이 감소된다. 다른 구현예에서, Cas9는, Cas9 효소를 암호화 및 발현하는 뉴클레오티드 구조체로서 세포에 전달된다. 다른 구현예에서, 본 발명은 또한 구조체들이 사용되어, 유도성 프로모터의 제어하에서 Cas9를 발현하기 위한 방법도 제공한다.

다른 양태에서, 본 발명은 CRISPR-Cas 시스템의 생체내 적용을 개선하는 방법을 제공한다. 바람직한 구현예에서, Cas 효소는 야생형 Cas9, 또는 임의의 자연적으로 생기는 박테리아 Cas9뿐만 아니라 임의의 키메라, 돌연변이체, 상동체 또는 오솔로그를 포함하는 본 명세서에 기재된 임의의 변형된 형태이다. 일 양태에서, Cas 효소는 닉카아제이다. 본 발명의 유리한 양태는 전달을 위해 바이러스 벡터 내로 용이하게 패키징되는 Cas9 상동체의 선택을 제공한다. Cas9 오솔로그는 통상적으로 3-4 RuvC 도메인 및 HNH 도메인의 일반적 조직화를 공유한다. 5' 대부분의 RuvC 도메인은 비상보적 가닥을 절단하고, HNH 도메인은 상보적 가닥을 절단한다. 모든 표기는 가이드 서열을 참조한다.

5' RuvC 도메인 내 촉매적 잔기는 Cas9 오솔로그(스트렙토코커스 피오게네스 II형 CRISPR 유전자좌, 스트렙토코서스 써모필루스 CRISPR 유전자좌 1, 스트렙토코서스 써모필루스 CRISPR 유전자좌 3, 및 프란시스실라 노비시다 II형 CRISPR 유전자좌로부터의) 다른 Cas9 오솔로그와 관심 대상의 Cas9의 상동성 비교를 통해 동정되고, 보존된 Asp 잔기는 알라닌으로 돌연변이되어 상보성 가닥 닉카아제로 전환시킨다. 유사하게, HNH 도메인 내에 보존된 His 및 Asn 잔기는 알라닌으로 돌연변이되어 Cas9를 비상보성 가닥 닉킹 효소로 전환시킨다.

일부 구현예에서, CRISPR 효소는 I형 또는 III형 CRISPR 효소, 바람직하게는 II형 CRISPR 효소이다. 이 II형 CRISPR 효소는 임의의 Cas 효소일 수 있다. Cas 효소는, 이것이 II형 CRISPR 시스템으로부터의 다중 뉴클레아제 도메인을 지니는 가장 큰 뉴클레아제에 대해 상동성을 공유하는 일반적 효소 부류를 지칭할 수 있기 때문에 Cas9로서 동정될 수 있다. 가장 바람직하게는, Cas9 효소는 spCas9 또는 saCas9로부터 생기거나 또는 유래된다. 본 발명자들은 유래는, 유래된 효소가 야생형 효소와 높은 정도의 서열 동일성을 갖는 의미에서 야생형 효소에 크게 기반하지만, 이들은 본 명세서에 기재된 바와 같은 일부 방법에서 돌연변이(변형)되는 것을 의미한다.

용어 "Cas" 및 "CRISPR"효소는, 달리 명백히 규정되어있지 않는 한, 일반적으로 본원에서 호환되어 사용됨이 이해될 것이다. 전술된 바와 같이, 본원에서 사용된 잔기 번호매김 다수는, 스크렙토코커스 피오제네스(Streptococcus pyogenes) 내 타입 II CRISPR 유전자 좌로부터 유래한 Cas9 효소(대안적으로 SpCas9 또는 spCas9가라고도 칭하여짐)를 기준으로 한다. 그러나, 본 발명은, 예를 들어 에스.피오제네스로부터 유래하는 SpCas9, 에스.아우레우스(S.aureus)로부터 유래하는 SaCas9, 에스.서모필러스(S.thermophilus)로부터 유래하는 StlCas9 등과 같이 다른 미생물 종으로부터 유래하는 더 많은 Cas9들을 포함함이 이해될 것이다. 추가의 예들이 본원에 제공되어 있다.

코돈 최적화 서열의 예(이 경우에는 인간에 대해 최적화된(즉 인간에서의 발현에 최적화된) 코돈 최적화 서열)가 본원에 제공되어 있는데, 'SaCas9 인간 코돈 최적화 서열'을 참조한다. 이와 같은 예가 바람직하긴 하나, 다른 예들도 사용될 수 있으며, 인간을 제외한 숙주 종들에 대한 코돈 최적화나, 특정 장기, 예를 들어 뇌에 대한 코돈 최적화도 알려져 있다.

추가 구현예에서, 본 발명은 키메라 Cas9 단백질을 생성함으로써 Cas9의 기능을 향상시키는 방법을 제공한다. 이들 방법은 다른 Cas9 상동체의 C-말단 단편을 지니는 하나의 Cas9 상동체의 N-말단 단편을 융합시키는 단계를 포함할 수 있다. 이들 방법은 또한 키메라 단백질에 의해 보여지는 새로운 특성의 선택을 고려한다.

본 방법에서 유기체가 동물 또는 식물인 경우, 변형은 생체외에서 또는 시험관내에서, 예를 들어 세포 배양물에서 및 생체내가 아닌 일부 예에서 일어날 수 있다는 것이 인식될 것이다. 다른 구현예에서, 이는 생체내에서 일어날 수 있다.

일 양태에서, 본 발명은 관심 대상의 게놈 유전자좌에서 표적 서열의 조작에 의해 유기체 또는 비인간 유기체를 변형시키는 방법으로서,

A) - I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 상기 폴리뉴클레오티드 서열은,

(a) 진핵 세포에서 표적 서열에 혼성화할 수 있는 가이드 서열,

(b) tracr 메이트 서열, 및

(c) tracr 서열을 포함하는, 폴리뉴클레오티드 서열, 및

II. 적어도 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열

(여기서, (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고,

전사될 때, tracr 메이트 서열은 tracr 서열에 혼성화하며, 가이드 서열은 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 지시하고,

CRISPR 복합체는 (1) 표적 서열에 혼성화할 수 있는 가이드 서열 및 (2) tracr 서열에 혼성화된 tracr 메이트 서열에 복합체화되는 CRISPR 효소를 포함하고, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA임),

또는

(B) I. (a) 원핵 세포 내 표적 서열에 혼성화할 수 있는 가이드 서열, 및

(b) 적어도 하나 이상의 tracr 메이트 서열을 포함하는, 폴리뉴클레오티드,

II. CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 및

III. tracr 서열을 포함하는 폴리뉴클레오티드 서열,

(여기서, 전사될 때, tracr 메이트 서열은 tracr 서열에 혼성화하고, 가이드 서열은 표적 서열에 대한 CRISPR 복합체의 서열 특이적 결합을 지시하며,

CRISPR 복합체는 (1) 표적 서열에 혼성화할 수 있는 가이드 서열 및 (2) tracr 서열에 혼성화된 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함하고, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA임)

을 포함하는 비자연적으로 생기는 또는 유전자 조작된 조성물을 전달하는 단계를 포함하는 방법을 제공한다.

CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 가이드 서열, tracr 메이트 서열 또는 tracr 서열 중 임의의 것 또는 전부는 RNA, DNA, 또는 RNA와 DNA의 조합일 수 있다. 일 양태에서, CRISPR 효소를 암호화하는 서열, 가이드 서열, tracr 메이트 서열 또는 tracr 서열을 포함하는 폴리뉴클레오티드들은 RNA이다. 일 양태에서, CRISPR 효소를 암호화하는 서열, 가이드 서열, tracr 메이트 서열 또는 tracr 서열을 포함하는 폴리뉴클레오티드는 DNA이다. 일 양태에서, 폴리뉴클레오티드들은 DNA와 RNA의 조합인데, 여기서 CRISPR 효소 중 1 개 이상을 암호화하는 서열, 가이드 서열, tracr 메이트 서열 또는 tracr 서열을 포함하는 폴리뉴클레오티드들 중 일부는 DNA이고, 이와 같은 폴리뉴클레오티드들 중 일부는 RNA이다. 일 양태에서, CRISPR 효소를 암호화하는 서열을 포함하는 폴리뉴클레오티드는 DNA이고, 가이드 서열, tracr 메이트 서열 또는 tracr 서열은 RNA 서열이다. CRISPR 효소를 암호화하는 서열, 가이드 서열, tracr 메이트 서열 또는 tracr 서열을 포함하는 폴리뉴클레오티드 1 개 이상은 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달될 수 있다.

폴리뉴클레오티드가 언급되는 경우, 해당 폴리뉴클레오티드가 RNA이고, 특징, 예를 들어 tracr 메이트 서열을 '포함한다'라고 기술되는 경우, 이 RNA 서열은 상기 특징을 포함함이 이해될 것이다. 폴리뉴클레오티드가 DNA이고, 특징, 예를 들어 tracr 메이트 서열을 '포함한다'라고 기술되는 경우, 이 DNA 서열은 상기 언급된 특징을 포함하는 RNA로 전사되거나 전사될 수 있다. 특징이 단백질, 예를 들어 CRISPR 효소인 경우, 언급된 DNA 또는 RNA 서열은 번역되거나 번역될 수 있다(DNA인 경우 전사가 우선 이루어짐). 뿐만 아니라, CRISPR 효소를 암호화하는 RNA가 세포에 제공되는 경우, 이 RNA는 해당 RNA가 전달된 세포에 의해 번역될 수 있음이 이해된다.

그러므로 특정 구현예들에서, 본 발명은, 바이러스 또는 플라스미드 벡터들 자체를 발현시키기 위한 조성물을 암호화하는 바이러스 또는 플라스미드 벡터들 1 개 이상을 작동 가능하도록 포함하는 바이러스 또는 플라스미드 벡터 시스템을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 것을 포함하는, 관심이 있는 게놈상 유전자 좌에 있는 표적 서열을 조작함으로써 유기체, 예를 들어 원핵생물 유기체 또는 진핵생물 유기체, 예를 들어 식물 또는 동물, 예를 들어 포유류, 예를 들어 인간 또는 인간 이외의 포유류 또는 유기체를 변형하는 방법을 제공하는데, 여기서 상기 조성물은

(A) I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동 가능하도록 결합하고 있는 제1 조절 요소(단, 상기 폴리뉴클레오티드 서열은 (a) 진핵 세포 내 표적 서열에 혼성화될 수 있는 가이드 서열, (b) tracr 메이트 서열 및 (c) tracr 서열을 포함함)와, II. 0 개 또는 1 개 이상의 핵 국소화 서열(nuclear localization sequence)을 포함하는(또는 선택적으로 일부 구현예들로서 1 개 이상의 핵 국소화 서열은 NLS를 포함하지 않을 수도 있음) CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제2 조절 요소를 포함하는 벡터 1 개 이상을 포함하는 벡터 시스템을 포함하는 비 천연 발생 또는 조작 조성물(여기서 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고, 구성성분 I 및 II는 시스템의 동일하거나 상이한 벡터상에 위치하며, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되고, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하며, 혼성화 가능한 복합체는 (1) 표적 서열에 혼성화될 수 있는 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함함); 또는

(B) I. (a) 원핵 세포 내에서 표적 서열에 혼성화될 수 있는 가이드 서열과, (b) 1 개 이상의 tracr 메이트 서열에 작동 가능하도록 결합하고 있는 제1 조절 요소, II. CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제2 조절 요소, 그리고 III. tracr 서열에 작동 가능하도록 결합하고 있는 제3 조절 요소를 포함하는 벡터 1 개 이상을 포함하는 벡터 시스템을 포함하는 비 천연 발생 또는 조작 조성물(여기서, 상기 구성성분 I, II 및 III은 시스템의 동일하거나 상이한 벡터상에 위치하고, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되고, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하며, CRISPR 복합체는 (1) 표적 서열에 혼성화될 수 있는 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함함)

를 포함한다. 일 양태에서, CRISPR 효소는 촉매적 도메인들 중 1 개에 1 개 이상의 돌연변이를 포함한다. 일 양태에서, CRISPR 효소는 닉카아제이다.

바람직하게는, 벡터는 바이러스 벡터, 예컨대 렌티- 또는 바큘로- 또는 바람직하게는 아데노-바이러스/아데노-연관 바이러스 벡터이지만, 다른 전달 수단(예컨대, 효모 시스템, 미세소포, 유전자총/금 나노입자에 벡터를 부착하는 수단)이 공지되며, 제공된다. 일부 구현예에서, 바이러스 또는 플라스미드 벡터 중 하나 이상은 나노입자, 엑소좀, 미세소포, 또는 유전자총을 통해 전달될 수 있다.

표적 서열의 조작에 의해, 출원인은 또한 표적 서열의 후성적 조작을 의미한다. 이는 예컨대 표적 서열에 대한 접근성을 증가 또는 감소시키는, 표적 서열의 메틸화 상태의 변형(즉, 메틸화 또는 메틸화 패턴 또는 CpG 섬의 추가 또는 제거), 히스톤 변형에 의해, 또는 3D 폴딩을 촉진 또는 감소시키는 것에 의해 표적 서열의 염색질 상태를 가질 수 있다.

관심대상의 게놈 유전자좌에서 표적 서열의 조작에 의해, 식물 또는 동물, 예를 들어 인간 또는 비인간 포유류를 포함하는 포유류 또는 유기체와 같은 원핵 유기체 또는 진핵 유기체를 포함하는 유기체를 변형시키는 방법이 언급되는 경우, 이는 유기체로부터 전체 또는 단지 단일 세포 또는 세포의 집단으로서 유기체(또는 포유류)에 적용될 수 있다(유기체가 다세포라면)는 것이 인식될 것이다. 인간의 경우에, 예를 들어, 출원인은 특히 단일 세포 또는 세포의 집단을 생각하며, 이들은 바람직하게는 생체외에서 변형된 다음 재도입될 수 있다. 이 경우에, 생검 또는 다른 조직 또는 생물학적 유체 샘플이 필요할 수 있다. 이와 관련하여 줄기 세포가 또한 특히 바람직하다. 그러나, 물론 생체내 구현예가 또한 생각된다.

특정 구현예들에서, 본 발명은 대상체(예를 들어, 포유류 또는 인간) 또는 인간 이외의 대상체(예를 들어, 포유류) 내 관심 있는 게놈상 유전자 좌 중 표적 서열에서의 결함에 의해 유발된 병태의 치료 또는 억제를 필요로 하는 대상체에서 해당 병태를 치료 또는 억제하는 방법을 제공하는데, 이 방법은 표적 서열의 조작에 의해 인간 대상체 또는 인간 이외의 대상체를 변형하는 단계를 포함하고, 상기 병태는, AAV 벡터 자체의 발현을 위한 조성물을 암호화하도록 이 AAV 벡터 1 개 이상이 작동 가능하게 포함된 AAV 벡터 시스템을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함하는 치료법을 제공하는 것을 포함하는, 표적 서열의 조작에 의한 치료 또는 억제에 감수성이며, 상기 표적 서열은 발현될 때 상기 조성물에 의해 조작되고, 이 조성물은 다음과 같은 것들을 포함한다:

(A) I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동 가능하도록 결합하고 있는 제1 조절 요소(여기서, 상기 폴리뉴클레오티드 서열은 (a) 진핵 세포 내 표적 서열에 혼성화될 수 있는 가이드 서열, (b) tracr 메이트 서열 및 (c) tracr 서열을 포함함), 그리고 II. 0 개 또는 1 개 이상의 핵 국소화 서열을 포함하는(또는 선택적으로 일부 구현예들로서 1 개 이상의 핵 국소화 서열은 NLS를 포함하지 않을 수도 있음) CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제2 조절 요소(여기서 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고, 구성성분 I 및 II는 시스템의 동일하거나 상이한 벡터상에 위치하며, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되고, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하며, 상기 CRISPR 복합체는 (1) 표적 서열에 혼성화될 수 있는 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함함); 또는

(B) I. (a) 원핵 세포 내에서 표적 서열에 혼성화될 수 있는 가이드 서열과, (b) 1 개 이상의 tracr 메이트 서열에 작동 가능하도록 결합하고 있는 제1 조절 요소, II. CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제2 조절 요소, 그리고 III. tracr 서열에 작동 가능하도록 결합하고 있는 제3 조절 요소(여기서, 상기 구성성분 I, II 및 III은 시스템의 동일하거나 상이한 벡터상에 위치하고, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되며, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하고, CRISPR 복합체는 (1) 표적 서열에 혼성화될 수 있는 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함함).

본 발명의 일부 방법들은 유도성 발현을 포함할 수 있다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 진핵생물, 예를 들어 식물 또는 동물(예를 들어, 포유류, 예를 들어 인간) 또는 인간 이외의 진핵생물 또는 인간 이외의 동물 또는 인간 이외의 포유류다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 식물이다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 포유류 또는 인간 이외의 포유류다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 조류이다. 본 발명의 일부 방법들에 있어서, 바이러스 벡터는 AAV이다. 본 발명의 일부 방법들에 있어서, 바이러스 벡터는 렌티바이러스 유래 벡터이다. 본 발명의 일부 방법들에 있어서, 바이러스 벡터는 식물에 사용되는 아그로박테리움(Agrobacterium) Ti 또는 Ri 플라스미드이다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 Cas9이다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함한다. 본 발명의 일부 방법들에서, CRISPR 효소는 Cas9 닉카아제이다. 본 발명의 일부 방법들에 있어서, 가이드 서열의 발현은 T7 중합효소의 발현에 의해 구동되는 T7 프로모터의 제어하에 있다. 본 발명의 일부 방법들에 있어서, 가이드 서열의 발현은 U6 프로모터의 제어하에 있다.

본 발명의 출원인들에 따르면, 표적 서열의 조작이란 표적 서열의 후성적 조작을 포함할 수 있는, 표적 서열의 변경을 의미한다. 이와 같은 후성적 조작은, 예를 들어 표적 서열의 메틸화 상태의 변형(즉 메틸화 또는 메틸화 패턴 또는 CpG 섬들의 부가 또는 제거), 히스톤 변형, 표적 서열에 대한 접근성의 증가 또는 감소, 또는 3D 폴딩(3D folding)의 촉진 또는 감소에 의한 표적 서열의 염색질 상태의 조작일 수 있다.

관심 있는 게놈상 유전자 좌에 있는 표적 서열을 조작함으로써 유기체 또는 인간 이외의 유기체를 변형하는 방법이 언급되는 경우, 이는 (유기체가 다세포 유기체라면) 해당 유기체로부터 유래하는 전 세포 또는 단지 하나의 세포 또는 세포들의 군집에 적용될 수 있음이 이해될 것이다. 인간의 경우 본 발명의 출원인들은, 예를 들어 무엇보다도 하나의 세포 또는 세포들의 군집을 생각하며, 이와 같은 하나의 세포 또는 세포들의 군집은 세포 외에서 변형된 다음 다시 도입되는 것이 바람직할 수 있다. 이러한 경우에 있어서, 생검편 또는 기타 조직이나 생물학적 유체 시료가 필요할 수 있다. 이와 같은 관점에서 줄기 세포들이 특히 바람직하다. 그러나, 생체내 구현예들도 물론 생각된다.

특정 구현예들에서, 본 발명은 대상체 또는 인간 이외의 대상체 내 관심 있는 게놈상 유전자 좌 중 표적 서열에서의 결함에 의해 유발된 병태의 치료 또는 억제를 필요로 하는 대상체 또는 인간 이외의 대상체에서 해당 병태를 치료 또는 억제하는 방법을 제공하는데, 이 방법은 표적 서열의 조작에 의해 인간 대상체 또는 인간 이외의 대상체를 변형하는 단계를 포함하고, 상기 병태는, 벡터 자체의 발현을 위한 조성물을 암호화하도록 이 벡터 1 개 이상이 작동 가능하게 포함된 벡터 시스템을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함하는 치료법을 제공하는 것을 포함하는, 표적 서열의 조작에 의한 치료 또는 억제에 감수성이며, 상기 표적 서열은 발현될 때 상기 조성물에 의해 조작되고, 이 조성물은 다음과 같은 것들을 포함한다:

(A) I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동 가능하도록 결합하고 있는 제1 조절 요소(여기서, 상기 chiRNA 폴리뉴클레오티드 서열은 (a) 진핵 세포 내 표적 서열에 혼성화될 수 있는 가이드 서열, (b) tracr 메이트 서열 및 (c) tracr 서열을 포함함), 그리고 II. 0 개 또는 1 개 이상의 핵 국소화 서열을 포함하는(또는 선택적으로 일부 구현예들로서 1 개 이상의 핵 국소화 서열은 NLS를 포함하지 않을 수도 있음) CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제2 조절 요소(여기서 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고, 구성성분 I 및 II는 시스템의 동일하거나 상이한 벡터상에 위치하며, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되고, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하며, 상기 CRISPR 복합체는 (1) 표적 서열에 혼성화될 수 있는 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함함); 또는

(B) I. (a) 원핵 세포 내에서 표적 서열에 혼성화될 수 있는 가이드 서열과, (b) 1 개 이상의 tracr 메이트 서열에 작동 가능하도록 결합하고 있는 제1 조절 요소, II. CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제2 조절 요소, 그리고 III. tracr 서열에 작동 가능하도록 결합하고 있는 제3 조절 요소(여기서, 상기 구성성분 I, II 및 III은 시스템의 동일하거나 상이한 벡터상에 위치하고, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되며, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하며, CRISPR 복합체는 (1) 표적 서열에 혼성화될 수 있는 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함함). 진핵 세포 내에서 사용되는 하나의 구현예에서, 벡터 시스템은 바이러스 벡터 시스템, 예를 들어 AAV 벡터 또는 AAV 벡터 시스템 또는 렌티바이러스 유래 벡터 시스템 또는 담배 모자이크 바이러스 유래 시스템을 포함한다.

본 발명의 일부 방법들은 발현을 유도하는 단계를 포함할 수 있다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 진핵생물, 예를 들어 식물 또는 동물(예를 들어, 포유류, 예를 들어 인간) 또는 인간 이외의 진핵생물 또는 인간 이외의 동물이다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 식물이다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 포유류 또는 인간 이외의 포유류다. 본 발명의 일부 방법들에 있어서, 유기체 또는 대상체는 조류이다. 본 발명의 일부 방법들에 있어서, 바이러스 벡터는 AAV이다. 본 발명의 일부 방법들에 있어서, 바이러스 벡터는 렌티바이러스 벡터이다. 본 발명의 일부 방법들에 있어서, 바이러스 벡터는 담배 모자이크 바이러스 벡터이다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 Cas9이다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함한다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 Cas9 닉카아제이다. 본 발명의 일부 방법들에 있어서, 가이드 서열의 발현은 T7 중합효소의 발현에 의해 구동되는 T7 프로모터의 제어하에 있다. 본 발명의 일부 방법들에 있어서, 가이드 서열의 발현은 U6 프로모터의 제어하에 있다.

본 발명은 일부 구현예에서 CRISPR 효소를 암호화하는 mRNA를 세포에 전달하는 단계를 포함하는 CRISPR 효소를 전달하는 방법을 포함한다. 일부의 이들 방법에서, CRISPR 효소는 Cas9이다.

본 발명은 일부 구현예에서 AAV에 대한 핵산 분자(들)의 암호를 함유하거나 또는 이로 본질적으로 이루어지는 하나 이상의 플라스미드(들)를 AAV-감염가능 세포에 트렌스펙션시키는 단계, 및 AAV의 복제 및 패키징에 필수적인 AAV rep 및/또는 cap을 공급하는 단계를 포함하는 AAV 벡터를 제조하는 방법을 포함한다. 일부 구현예에서 AAV의 복제 및 패키징에 필수적인 AAV rep 및/또는 cap은 헬퍼 플라스미드(들) 또는 헬퍼 바이러스(들)를 이용하여 세포를 트렌스펙션시킴으로써 공급된다. 일부 구현예에서 헬퍼 바이러스는 폭스바이러스, 아데노바이러스, 헤르페스바이러스 또는 바큘로바이러스이다.

식물들에 있어서, 병원체들은 종종 숙주 특이적이다. 예를 들어 푸사리움 옥시스포럼 에프.종 라이코퍼시시(Fusarium oxysporum f. sp. lycopersici)는 토마토를 시들게 하지만, 오로지 토마토만을 공격하며, 에프 옥시스포럼 에프.디안티이 푸시니아 그라미니스 에프.종 트리티시(F. oxysporum f. dianthii Puccinia graminis f. sp. tritici)는 오로지 밀을 공격한다. 식물은 대부분의 병원체를 견뎌내기 위해 기존의 방어책과 유도된 방어책을 가진다. 식물 세대들에 걸쳐서 일어나는 돌연변이와 재조합 현상들은, 특히 병원체들이 식물보다 더욱 빈번히 증식할 때 취약성을 드러내는 유전적 다양성을 초래한다. 식물에 있어서, 비 숙주 내성이 있을 수 있는데, 예를 들어 숙주 및 병원체가 양립 불가능할 수 있다. 뿐만 아니라, 통상 다수의 유전자에 의해 제어되는 수평적 내성(Horizontal Resistance), 예를 들어 모든 병원체 종에 대한 부분 내성과, 통상 소수의 유전자에 의해 제어되는 수직적 내성(Vertical Resistance), 예를 들어 병원체의 일부 종들에만 완전히 나타나되, 다른 종들에 대해서는 내성을 나타내지 않는 내성도 있을 수 있다. 유전자를 위한 유전자 수준(Gene-for-Gene level)에서 식물 및 병원체는 함께 진화하고, 식물과 병원체 중 어느 하나에서의 유전적 변이들은 다른 하나에서의 변이들과 균형을 맞추어 진행된다. 그러므로 육종자들은 천연적 다양성을 이용하여 수확량, 품질, 균일성, 강인성 및 내성에 가장 유용한 유전자들을 조합한다. 내성 유전자들의 공급원들로서는 원산 또는 외래 다양성, 조상 전래의 다양성, 야생 식물 공통계통성 및 유도성 돌연변이들(예를 들어, 식물 재료를 돌연변이유발 제제로 처리함으로써 유도된 돌연변이들)을 포함한다. 본 발명이 사용될 때, 식물 육종자들은 돌연변이를 유도하기 위한 신규 도구를 제공받게 된다. 그러므로 당 업자는 내성 유전자 공급원들의 게놈을 분석할 수 있으며, 원하는 특징들 또는 형질들을 가지게 된 변종들에 있어서 본 발명이 이용될 때, 내성 유전자들의 발생은 기존의 돌연변이유발 제제가 이용될 때보다 더욱 정확하게 유도되므로, 식물 육종 프로그램들이 가속화 및 개선된다.

본 발명은 추가로 의학에서 사용하기 위한 본 발명의 조성물 또는 이의 CRISPR 효소(CRISPR 효소를 암호화하는 mRNA를 포함하거나 또는 대안적으로 포함함)를 포함한다. 일부 구현예에서 본 발명은 본 발명에 따른 조성물 또는 이의 본 발명에 따른 방법에서 사용하기 위한 CRISPR 효소(CRISPR 효소를 암호화하는 mRNA를 포함하거나 또는 대안적으로 포함함)를 포함한다. 일부 구현예에서 본 발명은 생체외 유전자 또는 게놈 편집에서 본 발명의 조성물 또는 이의 CRISPR 효소(CRISPR 효소를 암호화하는 mRNA를 포함하거나 또는 대안적으로 포함함)의 용도를 제공한다. 특정 구현예에서 본 발명은 생체외 유전자 또는 게놈 편집을 위한 의약의 제조에서 본 발명에 따른 방법에서 사용하기 위한 본 발명의 조성물 또는 이의 CRISPR 효소(CRISPR 효소를 암호화하는 mRNA를 포함하거나 또는 대안적으로 포함함)의 용도를 포함한다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함한다. 본 발명의 일부 방법들에 있어서, CRISPR 효소는 Cas9 닉카아제이다. 일부 구현예들에서, 본 발명은 본 발명의 조성물 또는 이에 포함된 CRISPR 효소를 포함하는데(대안적으로 CRISPR 효소를 암호화하는 mRNA 포함), 여기서 표적 서열은, 특히 Cas9가 에스.피오제네스 또는 에스.아우레우스 Cas9인 경우(또는 이로부터 유래하는 경우), 자체의 3' 말단에서 5'-모티프(프로토-스페이서 인접 모티프(Proto-spacer Adjacent Motif; PAM)라고 칭하여짐)와 측접하게 된다. 예를 들어 이하에 각각 언급된 바와 같은 SpCas9 또는 SaCas9 효소(또는 유도 효소)에 적당한 PAM은 5'-NRG 또는 5'-NNGRR(여기서, N은 임의의 뉴클레오티드임)이다.

SpCas9 또는 SaCas9는 에스.피오제네스 또는 에스.아우레우스 Cas9으로부터 얻어진 것 또는 이로부터 유래된 것이다.

본 발명의 양태들은 CRISPR 효소의 특이성, 예를 들어 Cas9 매개 유전자 표적화의 특이성을 개선하고, CRISPR 효소, 예를 들어 Cas9에 의한 탈 표적 변형(off-target modification)의 가능성을 감소시키는 것을 포함한다. 일부 구현예들에서, 본 발명은 세포 내 관심 있는 게놈상 유전자 좌에서 DNA 듀플렉스의 반대 가닥들에 존재하는 제1 및 제2 표적 서열을 조작하여 탈 표적 변형을 최소화함으로써 유기체 또는 인간 이외의 유기체를 변형하는 방법을 포함하는데, 이 방법은 다음과 같은 것들을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함한다:

I. 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 이 제1 폴리뉴클레오티드 서열은

(a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열;

(b) 제1 tracr 메이트 서열; 및

(c) 제1 tracr 서열

을 포함하는 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열,

II. 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열로서, 이 제2 폴리뉴클레오티드 서열은

(a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열;

(b) 제2 tracr 메이트 서열; 및

(c) 제2 tracr 서열

을 포함하는 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열, 그리고

III. 0 개 또는 1 개 이상의 핵 국소화 서열을 포함하고, CRISPR 효소에 돌연변이 1 개 이상이 포함되도록, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열

(여기서, 상기 I 및 II의 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고, 전사가 진행될 때 제1 및 제2 tracr 메이트 서열은 각각 제1 및 제2 tracr 서열에 혼성화되고, 제1 및 제2 가이드 서열은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며, 제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고, 제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고, 제1 가이드 서열은 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하며, 제2 가이드 서열은 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 반대쪽 가닥의 절단을 지시하여 DNA에서 파괴를 유도하고, 이로 말미암아 탈 표적 변형들은 최소화되어 유기체 또는 인간 이외의 유기체의 변형이 초래). 일 양태에서, DNA 내 제1 닉(nick)과 제2 닉은 듀플렉스의 1 개 이상의 염기쌍만큼 서로에 대해 상대적으로 상쇄 관계에 있다. 일 양태에서, 제1 닉과 제2 닉은 서로에 대해 상대적으로 상쇄 관계에 있어서, 생성되는 DNA 파괴 부는 3' 돌출부(3'overhang)를 가지게 된다. 일 양태에서, 제1 닉과 제2 닉은 서로에 대해 상대적으로 상쇄 관계에 있어서, 생성되는 DNA 파괴 부는 5' 돌출부(5'overhang)를 가지게 된다. 일 양태에서, 제1 닉과 제2 닉은 서로에 대해 상대적으로 위치하므로, 돌출부는 1 개 이상의 뉴클레오티드, 10 개 이상의 뉴클레오티드, 15 개 이상의 뉴클레오티드, 26 개 이상의 뉴클레오티드, 30 개 이상의 뉴클레오티드, 50 개 이상의 뉴클레오티드로 이루어져 있다. 이로부터 생성된 상쇄적 이중 닉 형성 DNA 가닥을 포함하는 본 발명의 추가의 양태들은 당 업자에 의해 이해될 수 있으며, 이중 닉 시스템의 예시적 용도들은 본원에 제공되어 있다.

본 발명의 일부 방법들에 있어서, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열들, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA이다. 본 발명의 추가의 구현예에서, CRISPR 효소를 암호화하는 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열을 포함하는 폴리뉴클레오티드는 RNA이고, 이 폴리뉴클레오티드는 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달된다. 본 발명의 특정 구현예들에서, 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하고/공유하거나, 제1 및 제2 tracr 서열은 100% 동일성을 공유한다. 본 발명의 바람직한 구현예들에서, CRISPR 효소는 Cas9 효소, 예를 들어 SpCas9이다. 본 발명의 일 양태에서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함하는데, 여기서 상기 돌연변이 1 개 이상은 RuvC 도메인 내 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 상기 돌연변이 1 개 이상은 HNH 도메인 내 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 매우 바람직한 구현예에서, CRISPR 효소는 D10A 돌연변이 또는 H840A 돌연변이를 가진다.

본 발명의 바람직한 방법들에 있어서, 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 DNA 듀플렉스의 반대쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부를 생성한다. 본 발명의 구현예들에서, 5' 돌출부는 200 개 이하의 염기쌍들, 바람직하게는 100 개 이하의 염기쌍들, 또는 더욱 바람직하게 50 개 이하의 염기쌍들로 이루어져 있다. 본 발명의 구현예들에서, 5' 돌출부는 26 개 이상의 염기쌍들, 바람직하게는 30 개 이상의 염기쌍들, 또는 더욱 바람직하게 34 개 내지 50 개의 염기쌍들 또는 1 개 내지 34 개의 염기쌍들로 이루어져 있다. 본 발명의 기타 바람직한 방법들에 있어서, 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 평활 절단부, 또는 3' 돌출부를 생성한다. 본 발명의 구현예들에서, 3' 돌출부는 150 개 이하, 100 개 이하 또는 25 개 이하의 염기쌍들, 또는 15 개 이상, 10 개 이상 또는 1 개 이상의 염기쌍들로 이루어져 있다. 바람직한 구현예들에서, 3' 돌출부는 1 개 내지 100 개의 염기쌍들로 이루어져 있다.

본 발명은 일부 구현예에서 세포에서 관심 대상의 게놈 유전자좌 내 DNA 듀플렉스의 마주하는 가닥에 대한 제1 및 제2 표적 서열의 조작에 의해 표적외 변형을 최소화함으로써 유기체 또는 비인간 유기체를 변형시키는 방법으로 이해되며, 상기 방법은

I. (a) 제1 표적 서열에 혼성화할 수 있는 제1 가이드 서열, 및

(b) 적어도 하나 이상의 tracr 메이트 서열에, 작동 가능하게 연결된 제1 조절 구성요소 ,

II. (a) 제2 표적 서열에 혼성화할 수 있는 제2 가이드 서열, 및

(b) 적어도 하나 이상의 tracr 메이트 서열에, 작동 가능하게 연결된 제2 조절 구성요소,

III. CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하게 연결된 제3 조절 구성요소, 및

IV. tracr 서열에 작동 가능하게 연결된 제4 조절 구성요소

를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템을 포함하는 비자연적으로 생기는 또는 유전자 조작된 조성물을 전달하는 단계를 포함하되, 구성성분 I, II, III 및 IV는 시스템의 동일 또는 상이한 벡터 상에 위치되고, 전사될 때, tracr 메이트 서열은 tracr 서열에 혼성화하며, 제1 및 제2 가이드 서열은 제1 및 제2 표적 서열에 대해 각각 제1 및 제2 CRISPR 복합체의 서열 특이적 결합을 지시하고, 제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화할 수 있는 제1 가이드 서열 및 (2) 제1 tracr 서열에 혼성화된 제1 tracr 메이트 서열에 복합체화되는 CRISPR 효소를 포함하고, 제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화할 수 있는 제2 가이드 서열 및 (2) tracr 서열에 혼성화된 tracr 메이트 서열에 복합체화되는 CRISPR 효소를 포함하고, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이며, 제1 가이드 서열은 제1 표적 서열 근처의 DNA 듀플렉스의 한 가닥의 절단을 지시하고, 제2 가이드 서열은 이중 가닥 파손을 유도하는 제2 표적 서열 근처의 다른 가닥의 절단을 지시함으로써 표적외 변형을 최소화하여 유기체 또는 비인간 유기체를 변형시킨다.

본 발명의 일부 방법들에 있어서, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA이다. 본 발명의 추가의 구현예들에서, 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하고/공유하거나 제1 및 제2 tracr 서열은 100% 동일성을 공유한다. 본 발명의 바람직한 구현예에서, CRISPR 효소는 Cas9 효소, 예를 들어 SpCas9이다. 본 발명의 일 양태에서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함하는데, 여기서 상기 돌연변이 1 개 이상은 RuvC 도메인 내 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 상기 돌연변이 1 개 이상은 HNH 도메인 내 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 매우 바람직한 구현예에서, CRISPR 효소는 D10A 돌연변이 또는 H840A 돌연변이를 가진다. D10A 돌연변이 또는 H840A 돌연변이 중 어느 하나를 가지는 CRISPR 효소들 또는 Cas 단백질들은 잔여 NHEJ 활성을 여전히 촉진할 수 있고, 본 출원 전체에 걸쳐 본 발명은, CRISPR 효소 또는 Cas 단백질에 다수 개의 돌연변이를 도입함으로써 NHEJ 활성을 추가로 감소시키는, 더더욱 정밀한 닉카아제를 제조하는 것을 포함한다. 성능이 더욱 우수한 D10A 닉카아제는 돌연변이 D10A, E762A 및 D986A(또는 이것들의 일부 하위 세트)를 포함할 수 있고, 성능이 더욱 우수한 H840A 닉카아제는 돌연변이 H840A, N854A 및 N863A(또는 이것들의 일부 하위 세트)를 포함할 수 있다.

본 발명의 추가의 구현예에서, 바이러스 벡터들 중 1 개 이상은 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통하여 전달된다.

본 발명의 바람직한 방법들에 있어서, 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부를 생성한다. 본 발명의 구현예들에서, 5' 돌출부는 200 개 이하의 염기쌍들, 바람직하게는 100 개 이하의 염기쌍들, 또는 더욱 바람직하게 50 개 이하의 염기쌍들로 이루어져 있다. 본 발명의 구현예들에서, 5' 돌출부는 26 개 이상의 염기쌍들, 바람직하게는 30 개 이상의 염기쌍들, 또는 더욱 바람직하게 34 개 내지 50 개의 염기쌍 또는 1 개 내지 34 개의 염기쌍들로 이루어져 있다. 본 발명의 기타 바람직한 방법들에 있어서, 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 평활 절단부, 또는 3' 돌출부를 생성한다. 본 발명의 구현예들에서, 3' 돌출부는 150 개 이하, 100 개 이하 또는 25 개 이하의 염기쌍들, 또는 15 개 이상, 10 개 이상 또는 1 개 이상의 염기쌍들로 이루어져 있다. 바람직한 구현예들에서, 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어져 있다.

본 발명은 일부 구현예에서, 하나 이상의 돌연변이를 갖는 Cas 단백질 및 RNA 분자의 제1 및 제2 가닥을 각각 표적화하는 2 개의 가이드 RNA를 포함하는 유전자 조작된, 비자연적으로 생기는 CRISPR-Cas 시스템을 유전자 산물을 암호화하는 이중 가닥 DNA 분자를 함유 및 발현시키는 세포 내로 도입함으로써 표적외 변형을 최소화하고, 이에 의해 가이드 RNA는 유전자 산물을 암호화하는 DNA 분자를 표적화하고, Cas 단백질은 유전자 산물을 암호화하는 DNA 분자의 각각의 제1 가닥 및 제2 가닥의 틈을 냄으로써, 유전자 산물의 발현이 변용되되; Cas 단백질 및 2 개의 가이드 RNA는 자연적으로 함께 생기지 않는, 관심 대상의 게놈 유전자좌를 변형시키는 방법을 포함한다.

본 발명의 바람직한 방법들에 있어서, 유전자 생산물을 암호화하는 DNA 분자의 제1 가닥과 제2 가닥 각각에 닉을 형성하는 Cas 단백질은 5' 돌출부를 생성한다. 본 발명의 구현예들에서, 5' 돌출부는 200 개 이하의 염기쌍, 바람직하게는 100 개 이하의 염기쌍, 또는 더욱 바람직하게 50 개 이하의 염기쌍으로 이루어져 있다. 본 발명의 구현예들에서, 5' 돌출부는 26 개 이상의 염기쌍들, 바람직하게는 30 개 이상의 염기쌍들, 또는 더욱 바람직하게 34 개 내지 50 개의 염기쌍 또는 1 개 내지 34 개의 염기쌍들로 이루어져 있다. 본 발명의 기타 바람직한 방법들에 있어서, 유전자 생산물을 암호화하는 DNA 분자의 제1 가닥과 제2 가닥 각각에 닉을 형성하는 Cas 단백질은 3' 돌출부를 생성하는데, 여기서 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어져 있다.

본 발명의 구현예들은 또한 tracr 메이트 서열과 tracr 서열에 융합된 가이드 서열을 포함하는 가이드 RNA를 포함하기도 한다. 본 발명의 일 양태에서, Cas 단백질은 포유류 세포 또는 인간 세포일 수 있는 진핵 세포 내에서의 발현에 최적화된 코돈이다. 본 발명의 추가의 구현예들에서, Cas 단백질은 타입 II CRISPR-Cas 단백질, 예를 들어 Cas9 단백질이다. 매우 바람직한 구현예에서, Cas 단백질은 Cas9 단백질, 예를 들어 SpCas9이다. 본 발명의 양태들에서, Cas 단백질은 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 가지는데, 돌연변이 1 개 이상은 RuvC 도메인 내 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 상기 돌연변이 1 개 이상은 HNH 도메인 내 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 매우 바람직한 구현예에서, Cas 단백질은 D10A 돌연변이 또는 H840A 돌연변이를 가진다.

본 발명의 양태는 감소될 유전자 산물의 발현 또는 유전자 산물을 암호화하는 DNA 분자 내로 추가로 도입될 주형 폴리뉴클레오티드 또는 2 개의 5' 돌출부를 다시 아닐링 및 결찰시킴으로써 정확하게 절단되는 개재 서열 또는 변용되는 유전자 산물의 활성 또는 기능 또는 증가될 유전자 산물의 발현에 관한 것이다. 본 발명의 구현예에서, 유전자 산물은 단백질이다.

본 발명은 또한 세포 내 유전자 산물을 암호화하는 이중 가닥 DNA 분자의 제1 가닥 및 제2 가닥을 각각 표적화하는 2 개의 가이드 RNA 및 하나 이상의 돌연변이를 갖는 Cas 단백질을 포함하고, 이에 의해 가이드 RNA 는 유전자 산물을 암호화하는 DNA 분자를 표적화하고 Cas 단백질은 유전자 산물을 암호화하는 DNA 분자의 각각의 제1 가닥 및 제2 가닥의 틈을 만들어서 유전자 산물의 발현이 변용되되; Cas 단백질 및 2 개의 가이드 RNA는 함께 자연적으로 생기지 않는, 유전자 조작된, 비자연적으로 생기는 CRISPR-Cas 시스템을 포함한다.

본 발명의 양태들에서, 가이드 RNA는 tracr 메이트 서열과 tracr 서열에 융합되어 있는 가이드 서열을 포함할 수 있다. 본 발명의 하나의 구현예에서, Cas 단백질은 타입 II CRISPR-Cas 단백질이다. 본 발명의 일 양태에서, Cas 단백질은 포유류 세포 또는 인간 세포일 수 있는 진핵 세포 내에서의 발현에 최적화된 코돈이다. 본 발명의 추가의 구현예들에서, Cas 단백질은 타입 II CRISPR-Cas 단백질, 예를 들어 Cas9 단백질이다. 매우 바람직한 구현예에서, Cas 단백질은 Cas9 단백질, 예를 들어 SpCas9이다. 본 발명의 양태들에서, Cas 단백질은 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 가지는데, 돌연변이 1 개 이상은 RuvC 도메인 내 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 상기 돌연변이 1 개 이상은 HNH 도메인 내 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 매우 바람직한 구현예에서, Cas 단백질은 D10A 돌연변이 또는 H840A 돌연변이를 가진다.

본 발명의 양태는 감소될 유전자 산물의 발현 또는 유전자 산물을 암호화하는 DNA 분자 내로 추가 도입될 주형 폴리뉴클레오티드 또는 2 개의 5' 또는 3' 돌출부를 다시 아닐링 및 결찰시킴으로써 정확하게 절단되는 개재 서열 또는 변용되는 유전자 산물의 활성 또는 기능 또는 증가될 유전자 산물의 발현에 관한 것이다. 본 발명의 구현예에서, 유전자 산물은 단백질이다.

본 발명은 또한:

a) 유전자 산물을 암호화하는 이중 가닥 DNA 분자의 제1 가닥 및 제2 가닥을 각각 표적화하는 각각의 2 개 CRISPR-Cas 시스템 가이드 RNA에 작동 가능하게 연결된 제1 조절 구성요소,

b) Cas 단백질에 작동 가능하게 연결된 제2 조절 구성요소를 포함하는 유전자 조작된, 비자연적으로 생기는 하나 이상의 벡터를 포함하는 벡터 시스템을 포함하되,

구성성분 (a) 및 (b)는 시스템의 동일 또는 상이한 벡터 상에 위치되며, 이에 의해 가이드 RNA는 유전자 산물을 암호화하는 DNA 분자를 표적화하고, Cas 단백질은 유전자 산물을 암호화하는 DNA 분자의 각각의 제1 가닥 및 제2 가닥의 틈을 내어서, 유전사 산물의 발현은 변형되되; Cas 단백질 및 2 개의 가이드 RNA는 자연적으로 함께 생기지 않는다.

본 발명의 양태에서 가이드 RNA는 tracr 메이트 서열 및 tracr 서열에 융합된 가이드 서열을 포함할 수 있다. 본 발명의 구현예에서, Cas 단백질은 II형 CRISPR-Cas 단백질이다. 본 발명의 양태에서, Cas 단백질은 진핵 세포에서 발현을 위해 코돈 최적화되며, 여기서 상기 진핵 세포는 포유류 세포 또는 인간 세포일 수 있다. 본 발명의 추가 구현예에서, Cas 단백질은 II형 CRISPR-Cas 단백질, 예를 들어 Cas 9 단백질이다. 고도로 바람직한 구현예에서, Cas 단백질은 Cas9 단백질, 예를 들어 SpCas9이다. 본 발명의 양태에서, Cas 단백질은 촉매적 도메인 중 하나에 하나 이상의 돌연변이를 가지며, 여기서 하나 이상의 돌연변이는 RuvC 도메인에서 D10A, E762A, 및 D986A로 이루어진 군으로부터 선택되거나 하낭 이상의 돌연변이는 HNH 도메인에서 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 고도로 바람직한 구현예에서, Cas 단백질은 D10A 돌연변이 또는 H840A 돌연변이를 가진다.

본 발명의 양태는 감소될 유전자 산물의 발현 또는 유전자 산물을 암호화하는 DNA 분자 내로 추가 도입될 주형 폴리뉴클레오티드 또는 2 개의 5' 또는 3' 돌출부를 다시 아닐링 및 결찰시킴으로써 정확하게 절단되는 개재 서열 또는 변용되는 유전자 산물의 활성 또는 기능 또는 증가될 유전자 산물의 발현에 관한 것이다. 본 발명의 구현예에서, 유전자 산물은 단백질이다. 본 발명의 바람직한 구현예에서, 시스템의 벡터는 바이러스 벡터이다. 추가 구현예에서, 시스템의 벡터는 나노입자, 엑소좀, 미세소포, 또는 유전자총을 통해 전달된다.

본 발명의 양태들은, 상동성 배향 수선을 촉진함으로써 세포 내 관심 있는 게놈상 유전자 좌에서 DNA 듀플렉스의 마주보는 가닥들에 제1 및 제2 표적 서열을 포함하는 유기체를 변형하는 방법을 제공하는데, 이 방법은 다음과 같은 것들을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함할 수 있다:

(a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열;

(b) 제1 tracr 메이트 서열; 및

(c) 제1 tracr 서열

(a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열;

(b) 제2 tracr 메이트 서열; 및

(c) 제2 tracr 서열

을 포함하는 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열,

III. 핵 국소화 서열 1 개 이상을 포함하고, 돌연변이 1 개 이상을 포함하는 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 그리고

IV. 합성 또는 조작된 단일 가닥 올리고뉴클레오티드를 포함하는 수선 주형

(여기서, 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고, 전사가 진행될 때 제1 및 제2 tracr 메이트 서열은 각각 제1 및 제2 tracr 서열에 혼성화되고, 제1 및 제2 가이드 서열은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며, 제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고, 제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고, 제1 가이드 서열은 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하며, 제2 가이드 서열은 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하여 이중 가닥 파괴를 유도하고, 수선 주형은 상동성 재조합에 의해 DNA 듀플렉스에 도입되며, 이로 말미암아 유기체는 변형됨).

본 발명의 구현예들에 있어서, 수선 주형은 제한 엔도뉴클레아제 제한 위치를 추가로 포함할 수 있다. 추가의 구현예들에서, 제1 표적 서열 근처에 있는 DNA 듀플렉스의 하나의 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 또는 3' 돌출부를 생성한다. 본 발명의 바람직한 구현예들에서, 5' 돌출부는 1 개 내지 200 개의 염기쌍들로 이루어져 있으며, 3' 돌출부는 1 개 내지 100 개의 염기쌍들로 이루어져 있다. 다른 양태에서, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA이다. 또 다른 양태들에서, CRISPR 효소를 암호하하는 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열을 포함하는 폴리뉴클레오티드는 RNA이고, 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달된다. 본 발명의 추가의 구현예들에서, 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하고/공유하거나, 제1 및 제2 tracr 서열은 100% 동일성을 공유한다. 본 발명의 바람직한 구현예들에서, CRISPR 효소는 Cas9 효소, 예를 들어 SpCas9이다. 본 발명의 일 양태에서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함하는데, 여기서 상기 돌연변이 1 개 이상은 RuvC 도메인 내 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 상기 돌연변이 1 개 이상은 HNH 도메인 내 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 매우 바람직한 구현예에서, CRISPR 효소는 D10A 돌연변이 또는 H840A 돌연변이를 가진다.

본 발명의 양태들은 또한 비 상동성 말단 접합(Non Homologous End Joining; NHEJ) 매개 결찰을 촉진함으로써 세포 내에서 관심 있는 게놈상 유전자 좌의 DNA 듀플렉스의 마주보는 가닥들 상에 있는 제1 및 제2 표적 서열을 포함하는 유기체를 변형하는 방법을 제공하는데, 이 방법은 다음과 같은 것들을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함한다:

(a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열;

(b) 제1 tracr 메이트 서열; 및

(c) 제1 tracr 서열

(a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열;

(b) 제2 tracr 메이트 서열; 및

(c) 제2 tracr 서열

IV. 돌출부들의 제1 세트를 포함하는 수선 주형

(여기서, 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고, 전사가 진행될 때 제1 및 제2 tracr 메이트 서열은 각각 제1 및 제2 tracr 서열에 혼성화되고, 제1 및 제2 가이드 서열은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며, 제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고, 제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고, 제1 가이드 서열은 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하며, 제2 가이드 서열은 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하여, 돌출부들의 제2 세트를 가지는 이중 가닥 파괴를 유도하고, 돌출부들의 제1 세트는 돌출부들의 제2 세트와 양립가능하면서 매치하며, 수선 주형은 결찰에 의해 DNA 듀플렉스에 도입되고, 이로 말미암아 유기체는 변형됨).

본 발명의 일부 구현예들에서, 수선 주형은 합성 또는 조작된 이중 가닥 올리고뉴클레오티드 듀플렉스이거나, 아니면 다른 구현예들에서, 수선 주형은 세포에 도입되어 효소 가공되는 DNA 조각으로부터 제조된다. 이 효소 가공은 내인성 효소, 또는 세포에 도입된 효소(예를 들어, 제한 엔도뉴클레아제, 뉴클레아제 또는 한쌍의 닉카아제)에 의해 수행될 수 있으며, 그 결과 양립 가능한 돌출부들이 수선 주형상에 생성된다.

추가의 구현예들에서, 제1 표적 서열 근처에 있는 DNA 듀플렉스의 하나의 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부 또는 3' 돌출부를 생성한다. 본 발명의 바람직한 구현예들에서, 5' 돌출부는 1 개 내지 200 개의 염기쌍으로 이루어져 있으며, 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어져 있다. 다른 양태들에서, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA이다. 또 다른 양태들에서, CRISPR 효소를 암호화하는 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열을 포함하는 폴리뉴클레오티드는 RNA이고, 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달된다. 본 발명의 추가의 구현예들에서, 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하고/공유하거나, 제1 및 제2 tracr 서열은 100% 동일성을 공유한다. 본 발명의 바람직한 구현예들에서, CRISPR 효소는 Cas9 효소, 예를 들어 SpCas9이다. 본 발명의 일 양태에서, CRISPR 효소는 촉매적 도메인들 중 1 개에 돌연변이 1 개 이상을 포함하는데, 여기서 상기 돌연변이 1 개 이상은 RuvC 도메인 내 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 상기 돌연변이 1 개 이상은 HNH 도메인 내 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 매우 바람직한 구현예에서, CRISPR 효소는 D10A 돌연변이 또는 H840A 돌연변이를 가진다.

일 양태에서, 본 발명은 진핵 세포에서의 표적 폴리뉴클레오티드의 변경 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하게 하여, 상기 표적 폴리뉴클레오티드의 절단을 초래하여, 표적 폴리뉴클레오티드를 변경시키는 단계를 포함하며, 여기서, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화된 CRISPR 효소를 포함하며, 상기 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다. 일부 구현예에서, 상기 절단은 상기 CRISPR 효소에 의한, 표적 서열의 위치에서의 1 개 또는 2 개의 가닥의 절단을 포함한다. 일부 구현예에서, 상기 절단은 감소된 표적 유전자의 전사를 야기한다. 일부 구현예에서, 상기 방법은 외인성 주형 폴리뉴클레오티드와의 상동성 재조합에 의해 상기 절단된 표적 폴리뉴클레오티드를 수복하는 단계를 더 포함하며, 상기 수복은 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터 발현되는 단백질의 하나 이상의 아미노산 변화를 야기한다. 일부 구현예에서, 상기 방법은 하나 이상의 벡터를 상기 진핵 세포로 전달하는 단계를 더 포함하며, 하나 이상의 벡터는 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도한다. 일부 구현예에서, 상기 벡터는 대상체 내의 진핵 세포로 전달된다. 일부 구현예에서, 상기 변경은 세포 배양물 중의 상기 진핵 세포에서 발생한다. 일부 구현예에서, 상기 방법은 상기 변경 전에 상기 진핵 세포를 대상체로부터 분리하는 단계를 더 포함한다. 일부 구현예에서, 상기 방법은 상기 진핵 세포 및/또는 그로부터 유래된 세포를 상기 대상체로 복귀시키는 단계를 더 포함한다.

일 양태에서, 본 발명은 진핵 세포에서의 폴리뉴클레오티드의 발현의 변경 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 폴리뉴클레오티드에 결합하게 하여, 상기 결합이 상기 폴리뉴클레오티드의 증가되거나 감소된 발현을 야기하도록 하는 단계를 포함하며; 여기서, CRISPR 복합체는 상기 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화된 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열에 연결되고, tracr 메이트 서열은 차례로 tracr 서열로 혼성화된다. 일부 구현예에서, 상기 방법은 하나 이상의 벡터를 상기 진핵 세포로 전달하는 단계를 더 포함하며, 여기서, 하나 이상의 벡터는 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도한다.

일 양태에서, 본 발명은 돌연변이된 질병 유전자를 포함하는 모델 진핵 세포의 생성 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 질병이 발생할 위험의 증가와 관련된 임의의 유전자이다. 일부 구현예에서, 상기 방법은 (a) 하나 이상의 벡터를 진핵 세포로 도입하는 단계로서, 하나 이상의 벡터는 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도하는 단계; 및 (b) CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하게 하여, 상기 질병 유전자 내의 표적 폴리뉴클레오티드의 절단을 야기하여, 돌연변이된 질병 유전자를 포함하는 모델 진핵 세포를 생성하는 단계로서, CRISPR 복합체가 (1) 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화할 수 있는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하는 단계를 포함한다. 일부 구현예에서, 상기 절단은 상기 CRISPR 효소에 의한, 표적 서열의 위치에서의 1 개 또는 2 개의 가닥의 절단을 포함한다. 일부 구현예에서, 상기 절단은 표적 유전자의 감소된 전사를 야기한다. 일부 구현예에서, 상기 방법은 외인성 주형 폴리뉴클레오티드와의 상동성 재조합에 의해 상기 절단된 표적 폴리뉴클레오티드를 수복하는 단계를 더 포함하며, 상기 수복은 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터의 단백질 발현의 하나 이상의 아미노산 변화를 야기한다.

일 양태에서, 본 발명은 하나 이상의 돌연변이를 하나 이상의 원핵 세포(들) 내의 유전자에 도입함에 의한 하나 이상의 원핵 세포(들)의 선택 방법을 제공하며, 상기 방법은 하나 이상의 벡터를 원핵 세포(들)로 도입하는 단계로서, 하나 이상의 벡터가 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열, tracr 서열 및 교정 주형 중 하나 이상의 발현을 유도하고; 교정 주형이 CRISPR 효소 절단을 없애는 하나 이상의 돌연변이를 포함하는 단계; 선택될 세포(들)에서 교정 주형과 표적 폴리뉴클레오티드의 상동성 재조합을 가능하게 하는 단계; CRISPR 복합체가 표적 폴리뉴클레오티드에 결합되게 하여, 상기 유전자 내의 표적 폴리뉴클레오티드의 절단을 초래하는 단계로서, CRISPR 복합체는 (1) 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화할 수 있는 가이드 서열 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하고, 표적 폴리뉴클레오티드로의 CRISPR 복합체의 결합이 세포사를 유도하여, 하나 이상의 돌연변이가 도입된 하나 이상의 원핵 세포(들)가 선택되게 하는 단계를 포함한다. 바람직한 구현예에서, CRISPR 효소는 Cas9이다. 본 발명의 다른 양태에서 선택될 세포는 진핵 세포일 수 있다. 본 발명의 양태는 선택 마커 또는 반대-선택 시스템을 포함할 수 있는 2-단계 과정을 필요로 하지 않고 특정 세포의 선택을 가능하게 한다.

일 양태에서, 본 발명은 진핵 세포 내 표적 폴리뉴클레오티드를 변형시키는 방법을 제공한다. 일부 구현예에서, 상기 방법은 표적 폴리뉴클레오티드에 CRISPR 복합체를 결합시켜 상기 표적 폴리뉴클레오티드의 절단을 달성함으로써 표적 폴리뉴클레오티드를 변형시키는 단계를 포함하되, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열에 연결되어, 이는 결국 tracr 서열과 혼성화한다.

다른 구현예에서, 본 발명은 진핵 세포 내 폴리뉴클레오티드의 발현을 변형시키는 방법을 제공한다. 방법은 폴리뉴클레오티드에 결합하는 CRISPR 복합체를 사용함으로써 표적 폴리뉴클레오티드의 발현을 증가 또는 감소시키는 단계를 포함한다.

원한다면, 세포 내 발현의 변형을 달성하기 위해, tracr 서열, tracr 메이트 서열에 연결된 가이드 서열, CRISPR 효소를 암호화하는 서열을 포함하는 하나 이상의 벡터는 세포에 전달된다. 일부 방법에서, 하나 이상의 벡터는 핵 국소화 서열을 포함하는 상기 CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하게 연결된 조절 구성요소; 및 tracr 메이트 서열에 작동 가능하게 연결된 조절 구성요소 및 tracr 메이트 서열 상류에 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위를 포함한다. 발현될 때, 가이드 서열은 세포 내 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 지시한다. 통상적으로, CRISPR 복합체는 (1) 표적 서열에 혼성화할 수 있는 가이드 서열, 및 (2) tracr 서열에 혼성화된 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함한다.

일부 방법에서, 표적 폴리뉴클레오티드는 불활성화되어 세포 내 발현의 변형을 달성할 수 있다. 예를 들어, 세포 내 표적 서열에 대한 CRISPR 복합체의 결합 시, 표적 폴리뉴클레오티드는 서열이 전사되지 않고, 암호 단백질이 생성되지 않도록, 또는 서열이 야생형 서열과 같이 작용하지 않도록 불활성화된다. 예를 들어, 단백질 또는 마이크로RNA 암호화 서열은 단백질이 생성되지 않도록 불활성화될 수 있다.

특정 구현예들에서, CRISPR 효소는 1 개 이상의 돌연변이, 즉 D10A, E762A, H840A, N854A, N863A 또는 D986A를 포함하고/포함하거나, 1 개 이상의 돌연변이는 CRISPR 효소의 RuvC1 도메인 또는 HNH 도메인 내에 있거나, 또는 그렇지 않을 경우 본원에 논의된 바와 같은 돌연변이이다. 일부 구현예들에서, CRISPR 효소는 촉매적 도메인 내에 돌연변이 1 개 이상을 가지고, 전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되고, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열 특이적 결합을 지시하며, 효소는 기능성 도메인을 추가로 포함한다. 일부 구현예들에서, 돌연변이된 Cas9 효소는 단백질 도메인, 예를 들어 전사 활성화 도메인에 융합될 수 있다. 일 양태에서, 전사 활성화 도메인은 VP64이다. 일부 구현예들에서, 전사 억제 도메인은 KRAB이다. 일부 구현예들에서, 전사 억제 도메인은 SID 또는 SID의 연쇄동일서열(concatemer)(즉 SID4X)이다. 일부 구현예들에서, 후성적 변형 효소가 제공된다. 일부 구현예들에서, P65 활성화 도메인일 수 있는 활성화 도메인이 제공된다.

일부 구현예에서, CRISPR 효소는 I형 또는 III형 CRISPR 효소이지만, 바람직하게는 II형 CRISPR 효소이다. 이II형 CRISPR 효소는 임의의 Cas 효소일 수 있다. Cas 효소는, II형 CRISPR 시스템으로부터의 다중 뉴클레아제 도메인을 지니는 가장 큰 뉴클레아제에 대해 상동성을 공유하는 일반적 효소 부류를 지칭할 수 있는 Cas9로서 동정될 수 있다. 가장 바람직하게는, Cas9 효소는 spCas9 또는 saCas9로부터 생기거나 또는 유래된다. 본 발명자들은 유래는, 유래된 효소가 야생형 효소와 높은 정도의 서열 동일성을 갖는 의미에서 야생형 효소에 크게 기반하지만, 이들은 본 명세서에 기재된 바와 같은 일부 방법에서 돌연변이(변형)되는 것을 의미한다.

본 발명은 또한 세포 내 관심 있는 유전자 좌에서 DNA 듀플렉스를 변형시키는 방법을 제공하기도 하는데, 이 방법은

I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열,

(b) 제1 tracr 메이트 서열, 그리고

(c) 제1 tracr 서열

을 포함하는 제1 폴리뉴클레오티드;

II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열,

(b) 제2 tracr 메이트 서열, 그리고

(c) 제2 tracr 서열

을 포함하는 제2 폴리뉴클레오티드; 그리고

III. CRISPR 효소를 암호화하는 서열과, 핵 국소화 서열 1 개 이상을 포함하는 제3 폴리뉴클레오티드

를 세포에 전달하는 단계를 포함하는데, 여기서 상기 제1 및 제2 폴리뉴클레오티드 내 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고;

상기 제1 표적 서열은 DNA 듀플렉스의 제1 가닥상에 존재하며, 제2 표적 서열은 DNA 듀플렉스의 반대쪽 가닥 상에 존재하며, 제1 및 제2 가이드 서열이 상기 듀플렉스 내 표적 서열들에 혼성화될 때, 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들은 듀플렉스의 염기쌍 1 개 이상만큼 서로에 대해 상대적으로 상쇄 관계에 있고;

전사가 진행될 때 제1 및 제2 tracr 메이트 서열들은 각각 제1 및 제2 tracr 서열들에 혼성화되며, 제1 및 제2 가이드 서열들은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며;

제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고;

제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며;

상기 DNA 듀플렉스의 제1 가닥은 상기 제1 표적 서열의 근처에서 절단되고, 상기 DNA 듀플렉스의 반대쪽 가닥은 상기 제2 표적 서열의 근처에서 절단되어, 5' 돌출부 또는 3' 돌출부가 생성되면서 이중 가닥 파괴가 초래된다.

본 발명은 또한 세포 내 관심 있는 유전자 좌에서 DNA 듀플렉스를 변형하는 방법도 제공하는데, 이 방법은

I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과

(b) tracr 메이트 서열 1 개 이상

에 작동 가능하도록 결합하고 있는 조절 요소를 포함하는 제1 폴리뉴클레오티드 서열,

II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과

(b) tracr 메이트 서열 1 개 이상

에 작동 가능하도록 결합하고 있는 제2 조절 요소를 포함하는 제2 폴리뉴클레오티드 서열,

III. CRISPR 효소를 암호화하는 서열에 작동 가능하도록 결합하고 있는 제3 조절 요소를 포함하는 제3 폴리뉴클레오티드 서열, 그리고

IV. tracr 서열에 작동 가능하도록 결합하고 있는 제4 조절 요소를 포함하는 제4 폴리뉴클레오티드 서열

을 포함하는 벡터 1 개 이상을 포함하는 벡터 시스템을 세포에 전달하는 단계를 포함하는데,

여기서 구성성분 I, II, III 및 IV는 시스템의 동일하거나 상이한 벡터들 상에 위치하고,

제1 표적 서열은 DNA 듀플렉스의 제1 가닥 상에 존재하고, 제2 표적 서열은 DNA 듀플렉스의 반대쪽 가닥 상에 존재하며, 제1 및 제2 가이드 서열들이 상기 듀플렉스 내 표적 서열들에 혼성화될 때, 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들은 듀플렉스를 구성하는 염기쌍 1 개 이상만큼 서로에 대해 상대적으로 상쇄 관계에 있고;

전사가 진행될 때 제1 및 제2 tracr 메이트 서열들은 tracr 서열에 혼성화되며, 제1 및 제2 가이드 서열들은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며;

제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고;

제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며;

상기 DNA 듀플렉스의 제1 가닥은 상기 제1 표적 서열의 근처에서 절단되고, 상기 DNA 듀플렉스의 반대쪽 가닥은 상기 제2 표적 서열의 근처에서 절단되어, 5' 돌출부 또는 3' 돌출부를 생성하면서 이중 가닥 파괴가 초래된다.

본 발명의 방법들에 있어서, CRISPR 효소는 유리하게 촉매적 도메인 내 돌연변이를 1 개 이상 포함하는 닉카아제 효소, 선택적으로는 Cas9 효소이다. 예를 들어 RuvC 도메인에는 돌연변이가 1 개 이상 존재할 수 있고, 선택적으로 이때의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 HNH 도메인에도 돌연변이가 1 개 이상 존재할 수 있으며, 선택적으로 이때의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택된다. 본 발명의 방법들에 있어서, 유리하게 제1 폴리뉴클레오티드의 5' 말단과 제2 폴리뉴클레오티드의 5' 말단 간 상쇄 관계는 -8 bp보다 크거나, 또는 -278 bp에서 +58 bp까지, 또는 -200 bp에서 +200 bp 또는 이보다 작거나, 아니면 100 bp, 또는 -4 bp에서 20 bp, 즉 +23 bp, 또는 +16 bp, 또는 +20 bp, 또는 +16 bp에서 +20 bp까지, 또는 -3 bp에서 +18 bp까지의 범위에 걸쳐 있을 수 있는데; 적당한 경우 용어 뉴클레오티드 또는 nt는 bp 대신에 사용될 수 있음이 이해되고 있다. 유리하게 본 발명의 방법들에 있어서, 상기 DNA 듀플렉스의 제1 가닥의 절단과 이의 반대쪽 가닥의 절단은, 각각의 가닥 상 3'에서 일어나 PAM(프로토스페이서 인접 모티프)쪽으로 진행되고, 이때 상기 제1 가닥 상 PAM은 상기 반대쪽 가닥상의 PAM과 30 염기쌍 내지 150 염기쌍만큼 떨어져 있다. 본 발명의 방법들에 있어서, 돌출부는 200 개 이하의 염기, 100 개 이하의 염기 또는 50 개 이하의 염기로 이루어질 수 있고; 예를 들어 돌출부는 1 개 이상의 염기, 10 개 이상의 염기, 15 개 이상의 염기, 26 개 이상의 염기, 또는 30 개 이상의 염기로 이루어질 수 있거나; 또는 돌출부는 34 개 내지 50 개 염기, 또는 1 개 내지 34 개 염기로 이루어질 수 있다. 유리하게 본 발명의 방법들에서, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA이고, 선택적으로 I, II 및 III 중 임의의 것 또는 전부는 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달된다. 본 발명의 방법들에 있어서, 유리하게 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유할 수 있고/있거나, 제1 및 제2 tracr 서열은 100% 동일성을 공유한다. 예를 들어 I, II 및 III 각각은 벡터에 제공될 수 있으며, 선택적으로 상기 I, II 및 III 각각은 동일하거나 상이한 벡터 내에 제공된다. 본 발명의 방법에 있어서 관심 있는 유전자 좌는 유전자를 포함할 수 있으며, 상기 방법을 통해서는 상기 유전자 발현에 변화가 초래되거나, 또는 유전자 산물의 활성 또는 기능에 변화가 초래된다. 예를 들어 유전자 산물은 단백질일 수 있으며/있거나 상기 발현, 활성 또는 기능상의 변화는 상기 발현, 활성 또는 기능의 감소이다. 본 발명의 방법들은 다음과 같은 단계들을 추가로 포함할 수 있다: (a) 상기 이중 가닥 파괴를 통해 생성된 돌출부들에 상보적인 돌출부들을 포함하는 이중 가닥 올리고데옥시뉴클레오티드(dsODN)를 세포에 전달하는 단계로서, 상기 dsODN은 관심 있는 유전자 좌에 통합되는 단계; 또는 (b) 단일 가닥 올리고데옥시뉴클레오티드(ssODN)를 세포에 전달하는 단계로서, 상기 ssODN은 상기 이중 가닥 파괴의 상동성 배향 수선에 대한 주형으로서 작용을 하는 단계. 본 발명의 방법들은 개체에서 질병을 예방 또는 치료하기 위한 것일 수 있으며, 선택적으로 상기 질병은 상기 관심 있는 유전자 좌에 발생한 결함에 의해 유발된다. 본 발명의 방법들은 개체에서 생체 내 수행될 수 있거나, 아니면 개체로부터 채취된 세포에서 생체 외 수행될 수 있고, 선택적으로 상기 세포는 개체로 다시 주입된다.

본 발명은 또한 다음과 같은 것들을 포함하는 조성물 또는 키트를 제공하기도 한다:

I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열,

(b) 제1 tracr 메이트 서열, 그리고

(c) 제1 tracr 서열

을 포함하는 제1 폴리뉴클레오티드;

II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열,

(b) 제2 tracr 메이트 서열, 그리고

(c) 제2 tracr 서열

을 포함하는 제2 폴리뉴클레오티드; 그리고

III. CRISPR 효소를 암호화하는 서열과, 1 개 이상의 핵 국소화 서열을 포함하는 제3 폴리뉴클레오티드.

(여기서, 상기 제1 및 제2 폴리뉴클레오티드에 있어서 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고;

상기 제1 표적 서열은 DNA 듀플렉스의 제1 가닥 상에 존재하며, 제2 표적 서열은 DNA 듀플렉스의 반대쪽 가닥 상에 존재하며, 제1 및 제2 가이드 서열들이 상기 듀플렉스 내 표적 서열들에 혼성화될 때, 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들은 듀플렉스를 구성하는 염기쌍 1 개 이상만큼 서로에 대해 상대적으로 상쇄 관계에 있고;

선택적으로 상기 I, II 및 III 각각은 동일 벡터 또는 상이한 벡터 내에 제공됨).

본 발명은 또한 본 발명에 따른 키트 또는 조성물의, 본 발명의 방법에서의 용도도 제공한다. 본 발명은 또한 의약품 제조에 있어서 본 발명의 키트 또는 조성물의 용도도 제공하는데, 선택적으로 상기 의약품은 관심 있는 상기 유전자 좌에 발생한 결함에 의해 유발되는 질병의 예방 또는 치료를 위한 것이다.

용어 Cas 및 CRISPR 효소는 달리 명확하지 않다면 본 명세서에서 일반적으로 상호호환적으로 사용될 것으로 인식될 것이다. 상기 언급한 바와 같이, 본 명세서에서 사용된 다수의 잔기 넘버링은 스트렙토코커스 피오게네스 내 II형 CRISPR 유전자좌로부터의 Cas9 효소를 지칭한다. 그러나, 본 발명은 SpCas9, SaCa9, St1Cas9 등과 같은 다른 미생물 종으로부터의 다수의 Cas9를 포함하는 것으로 인식될 것이다.

이 예에서 인간에 대해 최적화된(즉, 인간에서의 발현을 위해 최적화됨), 코돈 최적화된 서열의 예가 본 명세서에 제공되며, SaCas9 인간 코돈 최적화된 서열을 참조한다. 이것이 바람직하지만, 다른 예가 가능하고 인간 이외의 숙주종에 대한 코돈 최적화, 또는 뇌와 같은 특정 장기에 대한 코돈 최적화가 공지되어 있다는 것이 인식될 것이다.

일 양태에서, 전달은 벡터의 형태로 된다. 일 양태에서, 벡터는 바이러스 벡터, 예컨대 렌티- 또는 바큘로- 또는 바람직하게는 아데노-바이러스/아데노-연관 바이러스 벡터일 수 있지만, 다른 전달 수단(예컨대, 효모 시스템, 미세소포, 유전자총/금 나노입자에 벡터를 부착하는 수단)이 공지되고, 제공된다. 벡터는 바이러스 또는 효모 시스템(예를 들어, 관심대상의 핵산이 프로모터에 작동 가능하게 연결되거나 또는 (궁극적으로 가공 RNA를 제공하는 것과 같은 발현에 대해) 프로모터의 제어하에 있을 수 있는 경우)뿐만 아니라 숙주 세포 내로의 핵산의 직접 전달을 의미한다. 본 명세서의 방법에서 벡터는 바이러스 벡터일 수 있고, 이는 유리하게는 AAV이지만, 본 명세서에서 논의된 바와 같은 다른 바이러스 벡터가 사용될 수 있다. 예를 들어, 바큘로바이러스는 곤충 세포 내 발현을 위해 사용될 수 있다. 이들 곤충 세포는 결국 본 발명의 전달에 적합한 AAV 벡터와 같은 다량의 추가 벡터를 생성하는데 유용할 수 있다. 또한 CRISPR 효소를 암호화하는 mRNA를 세포에 전달하는 단계를 포함하는 본 CRISPR 효소를 전달하는 방법이 생각된다. CRISPR 효소는 절단되고, 1000 개 미만의 아미노산 또는 4000 개 미만의 아미노산을 포함하고, 뉴클레아제 또는 닉카아제이고, 코돈 최적화되고, 하나 이상의 돌연변이를 포함하고/포함하거나, 키메라 CRISPR 효소 또는 본 명세서에 논의되는 다른 선택사항을 포함하는 것이 인식될 것이다. AAV 바이러스 벡터가 바람직하다.

특정 구현예에서, 표적 서열은 그의 3' 말단에서 CRISPR 효소, 통상적으로 Cas 및 특히 Cas9에 적합한 PAM에 측접하거나 또는 뒤에 온다.

예를 들어, 적합한 PAM은 SpCas9 또는 SaCas9 효소(또는 유래 효소) 각각에 대해 5'-NRG 또는 5'-NNGRR이다.

SpCas9 또는 SaCas9는 스트렙토코커스 피오게네스 또는 스태필로코커스 아우레우스 Cas9로부터 생기거나 또는 유래된 것임이 인식될 것이다.

따라서, 임의의 이전에 공지된 산물, 산물의 제조방법 또는 산물의 사용 방법을 본 발명 내에 포함하지 않는 것이 본 발명의 목적이므로 출원인은 권리를 보존하며 이로써 임의의 이전에 공지된 산물, 공정 또는 방법에 대한 권리 포기를 드러낸다. 본 발명은 USPTO(35 U.S.C. §112, 제1항) 또는 EPO(EPC의 83항)의 기재된 설명 및 실시가능요건을 충족하지 않는 본 발명의 임의의 산물, 공정 또는 산물의 제조 또는 산물을 사용하는 방법의 범주 내에 포함하는 것으로 의도되지 않는다는 것이 추가로 언급되므로 출원인은 권리를 보존하고 이로써 임의의 이전에 기재된 산물, 산물의 제조방법 또는 산물을 사용하는 방법에 대한 권리 포기를 드러낸다.

본 개시내용 및 특히 청구범위 및/또는 단락에서, "함유한다", "함유된", "함유하는" 등과 같은 용어가 미국 특허법에 귀속되는 의미를 가질 수 있고; 예를 들어, "포함한다", "포함된", "포함하는" 등을 의미할 수 있으며; "본질적으로 이루어지는" 및 "본질적으로 이루어진다"와 같은 용어가 미국 특허법에 귀속되는 의미를 갖고, 예를 들어, 명백하게 열거되지 않는 구성요소를 허용하지만, 선행 기술에서 발견되거나 본 발명의 기본적인 또는 새로운 특징에 영향을 미치는 구성요소를 배제함이 주목된다.

상기 및 기타 구현예는 하기 상세한 설명으로부터 개시되거나, 그로부터 명백하고 그에 의해 포함된다.

본 발명의 신규의 특징은 특히 첨부된 청구범위에 개시되어 있다. 본 발명의 원리가 이용된 예시적인 구현예에 기재되어 있는 하기의 상세한 설명을 참조함으로써 본 발명의 특징 및 장점을 더욱 잘 이해할 것이며, 첨부된 도면은 다음과 같다:
도 1은 CRISPR 시스템의 개략적 모델을 보여준다. 스트렙토코커스 피오게네스 유래의 Cas9 뉴클레아제(황색)는 20-nt 가이드 서열(청색) 및 스캐폴드(적색)로 이루어진 합성 가이드 RNA(sgRNA)에 의해 게놈 DNA에 표적화된다. 가이드 서열은 필수 5'-NGG 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM; 진홍색)의 인접 상류의 DNA 표적(청색)과 염기쌍을 형성하며, Cas9는 PAM의 약 3 bp 상류(적색 삼각형)에서 이중 가닥 파단(DSB)을 매개한다.
도 2a 내지 도 2f는, 스트렙토코커스 피오제네스로부터 유래한 Cas9의 절단 특이성을 평가하기 위해 수행된 분석법을 도식적으로 표시한 것을 보여주고 있다. 가이드 RNA 서열과 표적 DNA 간 하나의 염기쌍 미스매치들은 절단 효율(%)에 대해 지도가 그려진다.
도 3a 내지 도 3d는, Cas 유전자들의 원형 계통수이다.
도 4a 내지 도 4f는, 대형 Cas9(약 1400 개의 아미노산)들의 군 3 개와, 소형 Cas9(약 1100 개의 아미노산)들의 군 2 개를 포함하여 Cas9의 군 5 개를 규명하는 선형 계통 분석법을 보여주는 것이다.
도 5는 Cas9 오솔로그의 길이 분포를 나타내는 그래프를 나타낸다.
도 6a 내지 도 6m은 돌연변이 지점이 SpCas9 유전자 내에 위치된 서열을 나타낸다.
도 7a는 조건적 Cas9, Rosa26 표적화 벡터 맵을 나타낸다.
도 7b는 Cas9, Rosa26 표적화 벡터 맵을 나타낸다.
도 8은 구성적 및 조건적 Cas9 작제물 내 개략적인 중요한 구성요소를 나타낸다.
도 9는 전달 및 생체내 마우스 뇌 Cas9 발현 데이터를 나타낸다.
도 10은 세포 내로 Cas9 및 키메라 RNA의 RNA 전달 (A) Neuro-2A 세포 내로 DNA 또는 mRNA로서 GFP의 전달을 나타낸다. (B) RNA로서 Icam2 유전자에 대한 Cas9 및 키메라 RNA의 전달은 시험한 2 개의 스페이서 중 하나에 대한 절단을 초래한다. (C) RNA로서 F7 유전자에 대한 Cas9 및 키메라 RNA의 전달은 시험한 2 개의 스페이서 중 하나에 대한 절단을 초래한다.
도 11은 DNA 이중 가닥 파단(DSB) 수복이 유전자 교정을 촉진하는 방법을 보여준다. 오류-유발(error-prone) 비상동성 말단 연결(NHEJ) 경로에서, DSB의 말단을 내인성 DNA 수복 기구에 의해 가공하고, 함께 재연결하는데, 이는 연접 부위에서 무작위 삽입-결실(indel) 돌연변이를 야기할 수 있다. 유전자의 코딩 영역 내에서 발생한 삽입-결실 돌연변이는 해독틀 이동 및 조기 종결 코돈을 야기하여, 유전자 녹아웃을 유발할 수 있다. 대안적으로, 플라스미드 또는 단일-가닥 올리고데옥시뉴클레오티드(ssODN)의 형태의 수복 주형을 공급하여, 상동성-유도 수복(HDR) 경로를 활용할 수 있으며, 이는 높은 충실도와 정밀한 교정을 가능하게 한다.
도 12a 내지 도 12c는 HEK 및 HUES9 세포에서 HDR에 대해 예상한 결과를 나타낸다. (a) 표적화 플라스미드 또는 상동성 암(arm)을 지니는 ssODN(센스 또는 안티센스) 중 하나를 사용하여 Cas9(적색 삼각형)에 의해 절단된 표적 게놈 유전자좌에서 서열을 편집할 수 있다. HDR의 효율을 분석하기 위해, 본 발명자들은 상동성 영역 밖에서 아닐링된 프라이머에 의해 PCR-증폭된 표적 유전자좌 내로 HindIII 부위(적색 막대)를 도입하였다. HindIII을 이용한 PCR 산물의 분해는 HDR 사건의 발생을 나타낸다. (b) 관심대상의 유전자좌에 대해 센스 또는 안티센스(s 또는 a) 방향 중 하나로 방향화된 ssODN은 Cas9와 조합으로 사용되어 표적 유전자좌에서 효율적인 HDR-매개 편집을 달성할 수 있다. 40 bp, 및 바람직하게는 90 bp의 최소 상동성 영역이 변형측 중 하나에서 권고된다(적색 막대). (c) EMX1 유전자좌 내 HDR에 대한 ssODN 효과의 예는 야생형 Cas9와 Cas9 닉카아제(D10A)를 사용하여 나타낸다. 각각의 ssODN은 2 개의 제한 부위의 12-bp 삽입에 측접하는 90 bp의 상동성 암을 함유한다.
도 13A 내지 도 13C는 낭성 섬유증 델타 F508 돌연변이에 대한 수선 전략을 나타낸다.
도 14a 내지 도 14b는 (a) FXN 인트론 1에서 개략적 GAA 반복부 확장을 나타내고, (b) CRISPR/Cas 시스템을 사용하여 GAA 확장 영역을 절단하도록 채택된 개략적 전략을 나타낸다.
도 15는 Tet1-3 및 Dnmt1, 3a 및 3b 유전자좌의 효율적 SpCas9 매개 표적화를 위한 선별을 나타낸다. 트렌스펙션된 N2A 세포로부터의 DNA에 대한 서베이어 분석은 상이한 gRNA를 사용함으로써 효율적인 DNA 절단을 입증한다.
도 16은 AAV1/2 전달 시스템에서 2-벡터 시스템을 사용하여 표적화하는 다중복합체 게놈의 전략을 나타낸다. U6 프로모터의 제어 하의 Tet1-3 및 Dnmt1, 3a 및 3b gRNA. 인간 시냅신 프로모터의 제어 하의 GFP-KASH. 제한측은 서브클로닝에 의한 단순한 gRNA 대체 전략을 나타낸다. 2 개의 핵 국소화 신호(NLS)에 측접한 HA-태그된 SpCas9를 나타낸다. 벡터는둘 다 1:1 비로 AAV1/2 바이러스에 의해 뇌에 전달된다.
도 17은 서베이어 분석을 사용하는 다중 DNMT 표적화 벡터 #1 작용성의 확인을 나타낸다. N2A 세포를 DNMT 유전자 패밀리 좌의 SpCas9 매개 절단을 시험하기 위해 DNMT 표적화 벡터 #1(+) 및 SpCas9 암호화 벡터에 의해 공동 트렌스펙션시켰다. gRNA는 단지(-) 음성 대조군이다. 트렌스펙션의 48 시간 후 DNA 정제 및 하류의 가공을 위해 세포를 채취하였다.
도 18은 서베이어 분석을 사용하는 다중 DNMT 표적화 벡터 #2 작용성의 확인을 나타낸다. N2A 세포를 DNMT 유전자 패밀리 좌의 SpCas9 매개 절단을 시험하기 위해 DNMT 표적화 벡터 #1 (+) 및 SpCas9 암호화 벡터로 공동 트렌스펙션시켰다. gRNA는 단지(-) 음성 대조군이다. 트렌스펙션의 48 시간 후 DNA 정제 및 하류의 가공을 위해 세포를 채취하였다.
도 19는 생체내 HA-SpCas9 발현을 위해 사용한 짧은 프로모터 및 짧은 폴리A 형태의 개략적 개요를 나타낸다. L-ITR로부터 R-ITR까지의 암호화 영역의 크기를 우측에 나타낸다.
도 20은 생체내 HA-SaCas9 발현에 대해 사용한 짧은 프로모터 및 짧은 폴리A 형태의 개략적 개요를 나타낸다. L-ITR로부터 R-ITR까지의 암호화 영역의 크기를 우측에 나타낸다.
도 21은 N2A 세포 내 SpCas9 및 SaCas9의 발현을 나타낸다. 상이한 짧은 프로모터의 제어 하의 그리고 짧은 폴리A(spA) 서열에 의한 HA-태그 SpCas9 및 SaCas9 형태의 대표적 웨스턴 블롯. 튜불린은 장입 대조군이다. mCherry(mCh)는 트렌스펙션 대조군이다. 세포를 채취하고 트렌스펙션의 48 시간 후에 웨스턴 블롯팅에 대해 추가로 처리하였다.
도 22는 Tet3 유전자좌의 효율적 SaCas9 매개 표적화에 대한 선별을 나타낸다. 트렌스펙션 N2A 세포로부터 DNA에 대한 서베이어 분석은 NNGGGT PUM 서열을 지니는 상이한 gRNA를 사용함으로써 효율적인 DNA 절단을 입증한다. GFP 트렌스펙션 세포 및 SaCas9만을 발현시키는 세포는 대조군이다.
도 23은 마우스 뇌에서 HA-SaCas9의 발현을 나타낸다. 동물을 인간 시냅신 프로모터의 제어 하에서 HA-SaCas9의 바이러스 구동 발현을 지니는 치아이랑(dentate gyri) 내로 주사하였다. 수술 2 주 후에 동물을 희생시켰다. 토끼 단클론성 항체 C29F4(세포 신호처리)를 사용하여 HA 태그를 검출하였다. 세포핵을 DAPI 염색에 의해 푸른색으로 염색하였다.
도 24는 트렌스펙션 후 7 일 배양에서 뇌 1 차 뉴런 내 SpCas9 및 SaCas9의 발현을 나타낸다. 상이한 프로모터의 제어 하에서 bgh 또는 짧은 폴리A(spA) 서열을 지니는 HA-태그 SpCas9 및 SaCas9 형태의 대표적 웨스턴 블롯. 튜블린은 장입 대조군이다.
도 25는 상이한 프로모터 및 다중 gRNA 작제물(DNMT에 대한 최종 패널 상에 나타낸 예)을 지니는 SpCas9를 운반하는 AAV1 입자를 이용하여 형질도입하고 7 일 후에 1 차 뇌 뉴런의 LIVE/DEAD 염색을 나타낸다. AAV 형질도입 후 뉴런을 대조군 비형질도입 뉴런과 비교하였다. 적색 핵은 침투되고 사멸된 세포(패널의 두 번째 줄)를 나타낸다. 살아있는 세포는 녹색으로 표시한다(패널의 세 번째 줄).
도 26은 상이한 프로모터를 지니는 SpCas9를 운반하는 AAV1 입자를 이용하여 형질도입하고 7 일 후에 1 차 뇌 뉴런의 LIVE/DEAD 염색을 나타낸다. 적색 핵은 침투되고 사멸된 세포(패널의 두 번째 줄)를 나타낸다. 살아있는 세포는 녹색으로 표시한다(패널의 세 번째 줄).
도 27은 TET 및 DNMT 유전자좌에 대해 SpCas9 및 gRNA 다중 복합체를 운반하는 AAV1 바이러스를 이용한 형질도입 후 뉴런 형상의 비교를 나타낸다. 형질도입이 없는 뉴런을 대조군으로서 나타낸다.
도 28은 1 차 뇌 뉴런에서의 서베이어 분석을 사용하는 다중복합 DNMT 표적화 벡터 #1 기능성의 확인을 나타낸다. DNMT 유전자 패밀리 좌의 SpCas9 매개 절단을 시험하기 위해 상이한 프로모터를 지니는 DNMT 표적화 벡터 #1 및 SpCas9로 세포에 공동형질도입하였다.
도 29는 뇌에서 SpCas9 절단의 생체내 효율을 나타낸다. 마우스에 2 개의 상이한 프로모터: 마우스 Mecp2 및 래트 Map1b의 제어 하에 SpCas9와 함께 DNMT 패밀리 유전자좌를 표적화하는 gRNA 다중복합체를 운반하는 AAV1/2 바이러스를 주사하였다. 주사하고 2 주 후, 뇌 조직을 추출하고 나서 핵을 준비하였고, gRNA 다중복합체 작제물로부터의 시냅신 프로모터에 의해 구동되는 GFP 발현에 기반하여 FACS를 사용하여 분류하였다. gDNA 추출 후에 서베이어 분석을 실행하였다. +는 GFP 양성핵을 나타내고, -는 대조군, 동일한 동물로부터의GFP-음성핵을 나타낸다. 겔 상의 번호는 평가한 SpCas9 효율을 나타낸다.
도 30은 해마 뉴런으로부터의 GFP-KASH 표지 세포핵의 정제를 나타낸다. 세포핵막의 외부 핵막(outer nuclear membrane: ONM)을 GFP와 KASH 단백질 막관통영역의 융합으로 태그한다. 주촉성 수술 및 AAV1/2 주사의 일주일 후 뇌에서의 강한 GFP 발현. 무결함 뇌로부터 세포핵을 정제하기 위한 밀도 구배 원심분리 단계. 정제 핵이 도시되어 있다. Vybrant® DyeCycle™ Ruby Stain에 의한 염색질 염색은 적색으로 나타나고, GFP 표지 핵은 녹색이다. GFP+ 및 GFP- 세포핵의 대표적인 FACS 프로파일(마젠타: Vybrant® DyeCycle™ Ruby Stain, 녹색: GFP).
도 31은 마우스 뇌에서 SpCas9 절단의 효율을 나타낸다. 마우스에 2 개의 상이한 프로모터: 마우스 Mecp2 및 래트 Map1b의 제어 하에 SpCas9 바이러스와 함께 TET 패밀리 유전자좌를 표적화하는 gRNA 다중복합체를 운반하는 AAV1/2 바이러스를 주사하였다. 주사하고 3 주 후, 뇌 조직을 추출하고 나서 핵을 준비하였고, gRNA 다중복합체 작제물로부터의 시냅신 프로모터에 의해 구동되는 GFP 발현에 기반하여 FACS를 사용하여 분류하였다. gDNA 추출 후에 서베이어 분석을 실행하였다. +는 GFP 양성핵을 나타내고, -는 대조군, 동일한 동물로부터의 GFP-음성핵을 나타낸다. 겔 상의 번호는 평가한 SpCas9 효율을 나타낸다.
도 32는 배양물 내 피질 뉴런에서의 GFP-KASH 발현을 나타낸다. TET 유전자좌를 표적화하는 AAV1 바이러스 운반 gRNA 다중복합체 작제물에 의해 뉴런을 형질도입하였다. 가장 강한 신호는 KASH 도메인 국소화에 기인하여 세포핵 주위에서 국소화된다.
도 33은 (상부) 가이드 RNA의 쌍 사이의 간격의 목록(2 개의 PAM 서열에 대한 배열 패턴에 의해 표시한 바와 같음)을 나타낸다. 패턴 1, 2, 3, 4를 충족하는 가이드 RNA 쌍만이 SpCas9(D10A) 닉카아제와 함께 사용될 때 삽입결실을 나타내었다. (하부) 패턴 1, 2, 3, 4를 충족하는 가이드 RNA의 쌍과 SpCas9(D10A)의 조합을 나타내는 겔 이미지는 표적 부위 내 삽입결실의 형성을 야기한다.
도 34는 U6-가이드 RNA 발현 카세트를 생성하기 위해 사용되는 U6 역방향 프라이머 서열의 목록을 나타낸다. 각각의 프라이머는 U6 및 목적으로 하는 가이드 RNA를 함유하는 앰플리콘을 생성하기 위해 U6 정방향 프라이머 "gcactgagggcctatttcccatgattc"와 짝지어질 필요가 있다.
도 35는 도 33에서 열거한 24 개 패턴의 위치를 나타내는 인간 Emx1 좌로부터의 게놈 서열 맵을 나타낸다.
도 36은 (우측) 상이한 쌍의 가이드 RNA에 의해 표적화된 Cas9 닉카아제에 의한 절단 후 가변 5' 돌출부가 존재할 때 표적에서 삽입결실의 형성을 나타내는 겔 이미지를 나타낸다. (좌측) 표는 우측에서 겔의 레인 수 및 사용한 가이드 RNA 쌍 및 Cas9 닉카아제에 의한 절단 후 존재하는 5' 돌출부의 길이를 동정하는 것을 포함하는 다양한 파라미터를 나타낸다.
도 37은 도 36(우측)의 겔 패턴을 초래하고 실시예 30에서 추가로 기재되는 상이한 쌍의 가이드 RNA의 위치를 나타내는 인간 Emx1 유전자좌로부터의 게놈 서열 맵을 나타낸다.
도 38a 내지 도 38c는, 가이드 서열 연장이 Cas9 활성에 미치는 영향력을 보여주는 것이다. 도 38a는, 인간 EMX1 유전자 내 유전자 좌(표적 1)를 표적화하는 sgRNA 서열들과 매치하였을 때와 미스매치하였을 때의 Cas9 활성을 보여주는 도식이다. 도 38b는, 길이 20 nt 내지 30 nt인 가이드 서열들을 보유하는 sgRNA들에 의해 표적 1이 거의 동일하게 변형되었음을 보여주는 서베이어(SURVEYOR) 분석법 겔을 보여주는 것이다. 도 38c는, 연장된 sgRNA들 대부분이 HEK293FT 세포들 내에서 길이 20 nt인 가이드 sgRNA들로 복귀되는 것을 보여주는 노던 블롯(Northern blot) 결과이다.
도 39a 내지 도 39c는, 이중 닉 형성(double nicking)이 인간 세포 내 효율적인 게놈 편집을 촉진함을 보여주는 것이다. 도 39a는, Cas9 D10A 닉카아제(Cas9n)를 가이드하는 sgRNA 한 쌍이 이용되었을 때의 DNA 이중 가닥 파괴를 보여주는 도식이다. D10A 돌연변이는 Cas9가 오로지 sgRNA에 상보성인 가닥만을 절단할 수 있도록 만들고; sgRNA-Cas9n 복합체 한 쌍은 동시에 양쪽 가닥에 닉을 형성할 수 있다. sgRNA 상쇄 부는 소정의 sgRNA 쌍의 가이드 서열의 PAM 원위(5') 말단부 간 길이로서 정의되고; 포지티브 상쇄에서는 윗 가닥(sgRNAa)에 상보성인 sgRNA가 아래 가닥(sgRNAb)에 상보성인 sgRNA의 5' 말단이 되어야 한다(이로 말미암아 항상 5' 돌출부가 생성됨). 도 39b는, 이중 닉 형성 유도 NHEJ의 효율을 2 개의 sgRNA들 사이 상쇄 길이에 대한 함수로서 보여주는 것이다. 사용된 모든 sgRNA들에 대한 서열들은 표 S1에서 발견될 수 있다(n = 3; 오차 바(error bar)들은 평균 ±s.e.m을 보임). 도 39c는, Cas9n에 의해 표적화되는 인간 EMX1 유전자 좌의 대표적인 서열들을 보여주는 것이다. sgRNA 표적 위치들과 PAM들은 청색 바 및 마젠타색 바로 각각 표시되어 있다. 밑에 선택된 서열들은 대표적인 삽입-결실 부(indel)를 보인다. 또한 도 44a 내지 44f 및 도 45a 내지 도 45d도 참조한다.
도 40a 내지 도 40e는, 이중 닉 형성이 인간 세포 내에서 효율적인 게놈 편집을 촉진함을 보여주는 것이다. 도 40a는, 인간 EMX1 유전자 좌에서의 Cas9n 이중 닉 형성(빨간색 화살표)을 보여주는 도식이다. EMX1 표적 1과의 서열 상동성을 가지는 탈 표적 유전자 좌 5 개가 선택되어 Cas9n 특이성에 대해 스크리닝되었다. 도 40b는, sgRNA 한 쌍과 Cas9n에 의한 표적 상 변형률은 야생형 Cas9과 sgRNA 하나에 의해 매개되는 표적 상 변형률과 거의 동일함을 보여주는 것이다(좌측 패널). Cas9-sgRNA 1의 복합체들은 유의적인 탈 표적 돌연변이유발을 진행시키는 반면, 탈 표적 유전자 좌 변형은 Cas9n이 사용되었을 때에는 확인되지 않는다(우측 패널). 도 40c는, 트랜스펙션된 HEK 293T 세포들의 딥 시퀀싱(deep sequencing)에 의해 삽입-결실 변형에 대한 sgRNA 1의 탈 표적 유전자 좌 5 개가 확인됨을 보여주는 것이다(n = 3; 오차 바들은 평균 ±s.e.m을 보임). 도 40d는, 탈 표적 위치들에서 Cas9n과 이중 닉 형성 간 특이성, 그리고 야생형 Cas9와 sgRNA 1(단독) 간 특이성의 비교 결과를 보여주는 것이다. 특이성 비율(specificity ratio)은 표적 상 변형률/탈 표적 변형률로서 산정된다(n = 3; 오차 바들은 평균 ±s.e.m을 보임). 도 40e 및 도 40f는, 인간 VEGFA의 추가 유전자 좌 2 개에서 이중으로 닉이 형성되면 탈 표적 변형을 최소화하면서 특이성(표적 상 변형률/탈 표적 변형률; n = 3; 오차 바들은 평균 ±s.e.m을 보임)은 높게 유지됨을 보여주는 것이다.
도 41a 내지 도 41d는, 이중 닉 형성이 인간 세포들 내에서 HDR을 통한 게놈으로의 삽입이 이루어질 수 있도록 만듦을 보여주는 것이다. 도 41a는, Cas9n 효소 한 쌍에 의해 생성된 DSB에서 단일 가닥 올리고데옥시뉴클레오티드(ssODN) 주형을 통해 매개되는 HDR이 도시된 도식이다. HindIII 제한 위치를 포함하는 12 nt 서열(빨간색)은 회색 빗금 친 선들로 표시된 위치의 EMX1 유전자 좌로 삽입되고; HDR 삽입 위치로부터 Cas9n 매개 닉들 간 길이는 이탤릭체로 위쪽에 표시되어 있다. 도 41b는, HEK 293FT 세포들 내에서 이중 닉 형성 매개 HDR을 통해 HindIII 절단 위치들이 성공적으로 삽입되었음을 보여주는 제한 분해 분석 겔을 보여주는 것이다. 위쪽 밴드들은 변형되지 않은 주형이고; 아래쪽 밴드들은 HindIII 절단 생성물이다. 도 41c는, 이중 닉 형성이 HUES62 인간 배 줄기 세포주에서 HDR을 촉진함을 보여주는 것이다. 딥 시퀀싱을 통하여 HDR 출현빈도가 측정된다(n = 3; 오차 바들은 평균 ±s.e.m을 보임). 도 41d는, HDR 효율은 Cas9 또는 Cas9n 매개 닉들의 배열에 좌우됨을 보여주는 것이다. HDR은 닉이 ssODN 상동성 팔의 중앙부(HDR 삽입 위치) 근처에 형성될 때 촉진되고, 이로 말미암아 5' 돌출부가 생성된다. 닉 형성 배열들은 돌출부의 길이(검정색 선들)와 위치 및 가닥(빨간색)로 주석이 달아진다(좌측 패널). HDR 삽입 위치로부터 각각의 닉의 길이(bp)는 이탤릭체로 검정 색 선들의 말단에 표시되어 있으며, sgRNA들의 위치들은 EMX1 유전자 좌 도식에 굵은 글씨로 표시되어 있다. 쌍을 이루는 sgRNA들이 이용되는 이중 닉 형성에 의해 매개되는 HDR 효율(위 패널), 또는 Cas9 또는 Cas9n 중 어느 하나와 sgRNA 하나가 이용되는 sgRNA 매개 HDR 효율(아래 패널; 도 45a~도 45d; n = 3; 오차 바들은 평균 ±s.e.m을 보임)이 보인다.
도 42a 및 도 42b는, 다중 진행 닉 형성(multiplexed nicking)이 비 HR 매개 유전자 통합과 게놈 결실을 촉진함을 보여주는 것이다. 도 42a는, Cas9 이중 닉 형성에 의해 생성된 5' 돌출부에 상보성인 돌출부를 보유하는 이중 가닥 올리고데옥시뉴클레오티드(dsODN) 공여 단편의 삽입을 보여주는 도식이다. dsODN은 원산 EMX1 종결 코돈이 빠지고, HA 태그, 3X FLAG 태그, HindIII 제한 위치, Myc 에피토프 태그 및 종결 코돈이 틀 안에 포함되도록(총 길이 148 bp) 디자인되었다. 성공적 삽입은 보인 바와 같이 생거(Sanger) 서열결정법에 의해 확인되었다(37 개 클론들 중 1 개가 스크리닝됨). 변형된 유전자 좌의 아미노산 번역은 밑에 DNA 서열로서 보인다. 도 42b는, sgRNA 4 개와 Cas9n이 함께 전달되면, DYRK1A 유전자 좌에 길이가 긴(넓은 범위의)(0.5 kb로부터 6kb까지) 게놈 결실부가 생성됨을 보여주는 것이다. 결실은 표적 영역에 확장되어 존재하는 프라이머들(표 S6)이 사용됨으로써 확인되었다.
도 43a 및 도 43b는, Cas9 이중 닉 형성이 마우스 배에서 효율적인 삽입-결실부 형성을 매개함을 보여주는 것이다. 도 43a는, Cas9n이 마우스 Mecp2 유전자 좌에 이중으로 닉을 형성함을 보여주는 도식이다. 대표적인 삽입-결실부는, 시험관 내 전사된 Cas9n 암호화 mRNA, 및 표적 92 및 93과 매치하는 sgRNA 쌍들과 함께 주입된 마우스 미분화 세포에 대해 보인다. 도 43b는, 여러 농도의 sgRNA(1.5 ng/uL 내지 50 ng/uL)와 여러 농도의 야생형 Cas9 또는 Cas9n(3 ng/uL 내지 100 ng/uL)가 사용될 때 효율적인 미분화 세포 변형이 달성됨을 보여주는 것이다.
도 44a 내지 도 44f는, 도 39a~도 39c와 관련하여, 다수의 유전자에 대해 이중 닉 형성에 최적인 표적 위치의 공간 배치를 확인하기 위해 Cas9 닉카아제(D10A)와 함께 사용되는 sgRNA 쌍들의 목록을 보여주는 것이다. N.D.: 확인되지 않음. N.T.: 테스트되지 않음.
도 45a 내지 도 45d는, 도 39a 내지 도 39c와 관련하여, 실시예 31에 사용된 sgRNA들의 목록을 보여주는 것이다.

CRISPR-Cas 시스템에 대한 일반적 정보와 관련하여, 2013년 1월 30일, 2013년 3월 15일, 2013년 3월 28일, 2013년 4월 20일, 2013년 5월 6일 및 2013년 5월 28일에 각각 출원된 미국 가출원 61/758,468호, 61/802,174호, 61/806,375호, 61/814,263호, 61/819,803호 및 61/828,130호가 참조된다. 각각 2013년 6월 17일, 2013년 7월 17일, 2013년 8월 5일 및 2013년 8월 28일에 출원된 미국 가출원 61/836,123호, 61/847,537호, 61/862,355호 및 61/871,301호가 또한 참조된다. 2012년 12월 12일 및 2013년 1월 2일에 각각 출원된 미국 가출원 61/736,527호 및 61/748,427호가 또한 참조된다. 2013년 3월 15일에 출원된 미국 가출원 61/791,409호가 추가적으로 참조된다. 2013년 3월 15일에 출원된 미국 가출원 61/799,800호가 또한 참조된다. 2013년 6월 17일에 각각 출원된 미국 가출원 61/835,931호, 61/835,936호, 61/836,127호, 61/836,101호, 61/836,123호, 61/836,080호 및 61/835,973호가 또한 참조된다. 이들 출원 각각, 및 상기 출원에 또는 상기 출원의 절차 중에 인용된 모든 문헌("출원 인용 문헌") 및 상기 출원 인용 문헌에 인용되거나 참고된 모든 문헌과 함께 본원에 언급되거나 본원의 임의의 문헌 및 본원에 참조로서 포함된 임의의 문헌에서의 임의의 제품에 대한 임의의 지침서, 설명서, 제품 명세서, 및 제품 시이트(sheet)는 참조로서 본원에 포함되며, 본 발명의 실시에 이용될 수 있다. 모든 문헌(예를 들어, 이들 출원 및 출원 인용 문헌)은 각각의 개별적 문헌이 참조로서 포함하는 것이 구체적으로 그리고 개별적으로 표시된 것과 동일한 정도로 참조로서 본원에 포함된다.

또한, CRISPR-Cas 시스템에 대한 일반적 정보와 관련하여, 하기가 언급된다:

이들 각각은 참조로서 본원에 포함되고, 하기에 간략히 논의된다:

■ 콩 등(Cong et al.)은 스트렙토코커스 써모필루스(Streptococcus thermophilus) Cas9 및 또한 스트렙토코커스 피오게네스(Streptoccocus pyogenes) Cas9 둘 모두를 기초로 한 진핵 세포에서 사용하기 위한 타입 II CRISPR/Cas 시스템을 유전자 조작하였고, Cas9 뉴클레아제가 짧은 RNA에 의해 지시되어 인간 및 마우스 세포에서 DNA의 정확한 절단을 유도할 수 있는 것을 입증하였다. 이들의 연구는 닉킹 효소로 전환된 바와 같은 Cas9가 최소의 돌연변이유발 활성으로 진핵 세포에서 상동성-지시된 복구를 촉진하는데 이용될 수 있음을 추가로 나타내었다. 또한, 이들의 연구는 다수의 가이드 서열이 단일 CRISPR 어레이로 암호화되어 포유동물 게놈 내의 내인성 게놈 유전자좌 부위에서 여러 동시 편집을 가능케 할 수 있음을 입증하였으며, 이는 RNA-가이드된 뉴클레아제 기술의 용이한 프로그램성 및 폭넓은 응용가능성을 입증한다. 세포에서 서열 특이적 DNA 절단을 프로그램화하는 RNA를 이용하는 이러한 능력은 게놈 유전자 조작된 도구의 새로운 부류를 규정하였다. 이들 연구는 다른 CRISPR 유전자좌가 포유동물 세포로 이식될 수 있고, 또한 포유동물 게놈 절단을 매개할 수 있음을 추가로 나타내었다. 중요하게는, CRISPR/Cas 시스템의 여러 양태가 이의 효능 및 다능성을 증가시키기 위해 추가로 개선될 수 있음이 예견될 수 있다.

■ 지앙 등(Jiang et al.)은 스트렙토코커스 뉴모니에 및 에스케리키아 콜라이의 게놈에서 정확한 돌연변이를 도입시키기 위해 이중-RNA와 복합체화된 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-회합된 Cas9 엔도뉴클레아제를 이용하였다. 상기 접근법은 돌연변이되지 않은 세포를 사멸시키기 위해 표적화된 게놈 부위에서의 이중-RNA:Cas9-지시된 절단에 의존하며, 선택 마커 또는 반대-선택 시스템의 필요를 회피한다. 상기 연구는 편집 주형에서 수행된 단일- 및 멀티뉴클레오티드 변화를 제조하기 위해 짧은 CRISPR RNA (crRNA)의 서열을 변화시킴으로써 재프로그램화 이중-RNA:Cas9 특이성을 보고하였다. 상기 연구는 2개의 crRNA의 동시 사용이 다중복합체 돌연변이유발을 가능케 한 것을 나타내었다. 또한, 상기 접근법이 리컴비니어링(recombineering)과 조합하여 이용된 경우, S. 뉴모니에에서, 기재된 접근법을 이용하여 회수된 세포의 거의 100%가 요망되는 돌연변이를 함유하였고, E. 콜라이에서, 회수된 65%가 돌연변이를 함유하였다.

■ 코너만 등(Konermann et al.)은 DNA-결합 도메인 기반 CRISPR Cas9 효소 및 또한 전사 활성인자 유사 이펙터의 광학적 및 화학적 조절을 가능케 하는 다능성이고 강한 기술에 대한 당 분야에서의 필요성을 다루었다.

■ 본 명세서에서 논의된 바와 같이, 미생물 CRISPR-Cas 시스템으로부터의 Cas9 뉴클레아제는 20 nt 가이드 서열에 의해 특정 게놈 유전자좌로 표적화되며, 이는 DNA 표적에 대한 특정 미스매치를 용인할 수 있고, 이에 의해 요망되지 않는 표적외 돌연변이유발을 촉진할 수 있다. 이를 다루기 위해, 란 등(Ran et al.)은 표적화된 이중-가닥 파손을 도입시키기 위해 쌍을 이룬 가이드 RNA와 Cas9 닉카아제 돌연변이를 조합한 접근법을 기재하였다. 게놈 내의 개별적 닉은 높은 정확도로 복구되므로, 적절한 오프셋 가이드 RNA를 통한 동시 닉킹이 이중-가닥 파손에 필요하고, 표적 절단을 위한 특별히 인지된 염기의 수를 연장시킨다. 상기 저자는 쌍을 이룬 닉킹을 이용하는 것이 세포주에서 50 내지 1,500배까지 표적외 활성을 감소시킬 수 있고, 표적에 대한 절단 효율을 희생시키지 않고 마우스 접합체에서 유전자 녹아웃을 촉진하는 것을 입증하였다. 이러한 다능성 전략은 높은 특이성을 필요로 하는 매우 다양한 게놈 편집 적용을 가능케 한다.

■ 슈 등(Hsu et al.)은 표적 부위의 선택을 알리고, 표적외 효과를 피하기 위해 인간 세포에서 SpCas9 표적화 특이성을 특성규명하였다. 상기 연구는 293T 및 293FT 세포에서 100개 초과의 예측 게놈 표적외 유전자좌에서 700개 초과의 가이드 RNA 변이체 및 SpCas9-유도된 삽입-결실 돌연변이 수준을 평가하였다. 상기 저자는 SpCas9가 미스매치의 수, 위치 및 분포에 민감한 서열-의존성 방식으로 다양한 위치에서 가이드 RNA와 표적 DNA 사이의 미스매치를 용인하는 것을 나타내었다. 상기 저자는 SpCas9-매개 절단이 DNA 메틸화에 의해 영향을 받지 않고, SpCas9 및 sgRNA의 투여량이 적정되어 표적외 변형을 최소화시킬 수 있음을 추가로 나타내었다. 또한, 포유동물 게놈 유전자 조작 적용을 촉진하기 위해, 상기 저자는 표적 서열의 선택 및 확인뿐만 아니라 표적외 분석을 가이드하기 위해 웹-기반 소프트웨어 도구를 제공한 것을 보고하였다.

■ 란 등(Ran et al.)은 포유동물 세포에서 비-상동성 말단 연결(NHEJ) 또는 상동성-지시 복구(HDR)뿐만 아니라 하류 기능성 연구를 위한 변형된 세포주의 생성을 통한 Cas9-매개 게놈 편집을 위한 한 세트의 도구를 기재하였다. 표적외 절단을 최소화시키기 위해, 상기 저자는 쌍을 이룬 가이드 RNA와 함께 Cas9 닉카아제 돌연변이를 이용한 이중-닉킹 전략을 추가로 기재하였다. 상기 저자에 의해 제공된 프로토콜은 표적 부위의 선택, 절단 효율의 평가 및 표적외 활성의 분석을 위한 가이드라인을 실험적으로 유래하였다. 상기 연구는 표적 설계로 시작하여, 유전자 변형은 1-2주만큼 적은 기간 내에 달성될 수 있고, 변형된 클로날 세포주가 2-3주 내에 유래될 수 있음을 나타내었다.

■ 샬렘 등(Shalem et al.)은 게놈-범위에 걸친 규모의 유전자 기능을 질의하기 위한 새로운 방식을 기재한다. 이들의 연구는 64,751개의 독특한 가이드 서열을 이용한 게놈-규모의 CRISPR-Cas9 녹아웃(GeCKO) 라이브러리 표적화된 18,080개 유전자의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능케 한 것을 나타내었다. 먼저, 상기 저자는 암 및 다능성 줄기 세포에서 세포 생활력에 필수적인 유전자를 확인하기 위해 GeCKO 라이브러리의 사용을 나타내었다. 다음으로, 흑색종 모델에서, 상기 저자는 상실이 돌연변이 단백질 키나제 BRAF를 억제하는 치료제인 베무라페니브(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 이들의 연구는 가장 높은 순위의 후보자가 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트 NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.

■ 니시마스 등(Nishimasu et al.)은 2.5 A°해상도로 sgRNA 및 이의 표적 DNA와의 복합체에서 스트렙토코커스 피오게네스 Cas9의 결정 구조를 보고하였다. 상기 구조는 계면에서 양성으로 하전된 홈에서 sgRNA:DNA 헤테로듀플렉스를 수용하는 표적 인지 및 뉴클레아제 엽으로 구성된 두엽 구조를 나타내었다. 인지 엽이 sgRNA 및 DNA 결합에 필수적인 반면, 뉴클레아제 엽이 표적 DNA의 상보적 및 비-상보적 가닥의 절단을 위해 적절하게 위치된 HNH 및 RuvC 뉴클레아제 도메인을 각각 함유한다. 뉴클레아제 엽은 또한 프로토스페이서 인접 모티프(PAM)와의 상호작용을 담당하는 카르복실-말단 도메인을 함유한다. 이러한 고-해상도 구조 및 수반하는 기능 분석은 Cas9에 의한 RNA-가이드된 DNA 표적화의 분자 메커니즘을 나타내었고, 이에 따라 새로운 다능성 게놈-편집 기술의 합리적 설계를 수월케 한다.

■ 우 등(Wu et al.)은 마우스 배아 줄기 세포(mESCs)에서 단일 가이드 RNA(sgRNAs)가 적하된 스트렙토코커스 피오게네스로부터 촉매적으로 비활성인 Cas9(dCas9)의 게놈 범위에 걸친 결합 부위를 맵핑하였다. 저자는 4개의 sgRNA 각각이 sgRNA 및 NGG 프로토스페이서 인접 모티프(PAM) 내의 5-뉴클레오티드 시드 영역을 종종 특징으로 하는 수십 내지 수천개의 게놈 부위에 대한 표적 dCas9를 시험한 것을 나타내었다. 염색질 비접근성은 시드 서열과 일치하는 다른 부위로의 dCas9 결합을 감소시키고, 따라서 표적외 부위의 70%가 유전자와 관련된다. 상기 저자는 촉매적으로 활성인 Cas9로 트랜스펙션된 mESC 내의 295개의 dCas9 결합 부위의 표적화된 시퀀싱이 백그라운드 수준 초과로 돌연변이된 단지 하나의 부위를 확인한 것을 나타내었다. 상기 저자는 시드 매치가 결합을 촉발하나, 표적 DNA와의 광범위한 페어링이 절단에 필요한 Cas9 결합 및 절단을 위한 2-상태 모델을 제안하였다.

■ 슈(Hsu 2014)는 세포의 유전적 스크리닝을 포함하는 게놈 편집을 위한 요거트 기원의 CRISPR-Cas9를 일반적으로 논의하는 리뷰 기사이며, 이는 2014년 6월 5일 이전에 출원된 본 명세서 계통의 출원의 정보, 데이터 및 결과에 속한다. 슈(Hsu 2014)의 전반적 교시내용은 본 출원의 특정 모델, 동물을 포함하지 않는다.

본 발명은 CRISPR-Cas 시스템 및 이의 구성성분에 관한 서열 표적화를 수반하는 유전자 발현의 제어, 예컨대 게놈 교란(perturbation) 또는 유전자 편집을 위해 사용되는 시스템, 방법 및 조성물의 유전자 조작 및 최적화에 관한 것이다. 유리한 구현예에서, Cas 효소는 Cas9이다.

본 방법의 이점은 CRISPR 시스템이 표적외 결합 및 그 결과의 부작용을 회피하는 것이다. 이는 표적 DNA에 대한 높은 정도의 서열 특이성을 갖도록 배열된 시스템을 사용하여 달성된다.

Cas9 최적화는 기능을 향상시키거나 또는 새로운 기능을 개발하기 위해 사용될 수 있으며, 키메라 Cas9 단백질을 생성할 수 있다. 출원인이 생성한 예는 실시예 6에 제공된다. 키메라 Cas9 단백질은 상이한 Cas9 상동체로부터의 단편, 예를 들어, 본 명세서에 기재된 Cas9로부터의 2 개 예시적인 키메라 Cas9 단백질을 합함으로써 만들어질 수 있다. 예를 들어, 본 발명자들은 St1Cas9의 N-말단(이 단백질로부터의 단편은 볼드체임)을 SpCas9의 C-말단에 융합시켰다. 키메라 Cas9의 제조이점은, 감소된 독성; 진핵 세포 내 개선된 발현; 향상된 특이성; 단백질의 감소된 분자량(상이한 Cas9 상동체로부터의 가장 작은 도메인을 합함으로써 더 작은 단백질을 만듦); 및/또는 PAM 서열 필요를 변용시키는 것 중 임의의 또는 모든 것을 포함한다.

Cas9는 일반적 DNA 결합 단백질로서 사용될 수 있다. 예를 들어, 실시예 7에 나타내는 바와 같이, DNA 표적의 가닥 둘 다의 절단을 초래하는 2 개의 촉매적 도메인(D10 및 H840)을 돌연변이시킴으로써 일반적 DNA 결합 단백질로서 Cas9를 사용하였다. 표적 유전자좌에서 유전자 전사를 상향조절하기 위해, 본 발명자들은 전사 활성화 도메인(VP64)을 Cas9에 융합시켰다. 다른 전사 활성화 도메인이 공지되어 있다. 실시예 11에서 나타낸 바와 같이, 전사 활성화가 가능하다. 또한 실시예 11에서 나타낸 바와 같이, 유전자 억제(베타-카테닌 유전자의 이 경우에)는 표적 유전자 서열에 결합하는 Cas9 리프레서(DNA-결합 도메인)을 사용하는 것이 가능하고, 따라서 그의 활성을 나타낸다.

유전자 이식 동물들도 제공된다. 바람직한 예들로서는 Cas9 또는 자체의 단백질을 암호화하는 폴리뉴클레오티드의 관점에서, Cas9를 포함하는 동물들을 포함한다. 마우스, 래트 및 토끼가 바람직하다. 본원에 예시된 바와 같은 구조체들이 사용되어 유전자 이식 마우스가 제조되기 위해서는 가 임신 암컷, 예를 들어 CB56 암컷으로부터 유래한 접합자의 전핵으로 순수한 선형 DNA가 주입되어야 한다. 이후, 시조 개체가 동정 및 유전자형 분석된 후, CB57 마우스와 역 교배될 수 있다. 그 다음 구조체들은, 예를 들어 생거 서열결정법에 의해 클로닝될 수 있을뿐더러, 선택적으로는 검증될 수도 있다. 예를 들어 모델 내에서 유전자 1 개 이상이 녹-아웃(knock out)되는 경우, 녹-아웃 개체들의 출현이 예상된다. 그러나, 녹-인(knock in) 개체들도 (단독으로 또는 녹-아웃 개체들과 함께) 출현이 예상되는 바이다. 전형적인 녹-인 Cas9 마우스가 제조 및 예시되는데, Cas9 녹-인 개체들이 바람직하다. 본원에 기술된 바와 같이, 마우스 내에서 Cas9가 녹-아웃되기 위해서는 Rosa26 유전자 좌에 동일한 구성적 구조체들과 조건적 구조체들이 표적화될 수 있다(도 7a, 도 7b 및 도 8 참조). CRISPR-Cas 시스템은 유전자 이식 마우스를 제조하는데 사용될 수 있는데, 이 유전자 이식 마우스는 또한 본원에 전체로서 참고문헌으로 포함된 논문[" One-step generation of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering." by Wang et al. Cell. 2013 May 9;153(4):910-8. doi: 10.1016/j.cell.2013.04.025. Epub 2013 May 2]에 제공되어 있으며, 이 논문은, CRISPR/Cas 매개 유전자 편집이 마우스 배 줄기 세포들 내 5 개의 유전자의 자발적 파괴를 높은 효율로 달성할 수 있음을 입증한다.

조건적 Cas9 마우스의 효용: 본 발명자들은 Cas9 조건적 발현 작제물이 Cre와 공동발현에 의해 활성화될 수 있다는 것을 293 세포에서 나타내었다. 본 발명자들은 또한 Cre가 발현될 때 정확하게 표적화된 R1 mESC가 활성 Cas9를 가질 수 있다는 것을 나타낸다. Cas9 다음에 P2A 펩타이드 절단 서열 그 다음에 EGFP가 오기 때문에, 본 발명자들은 EGFP를 관찰함으로써 성공적 발현을 동정한다. 본 출원인은 mESC에서 Cas9 활성화를 나타내었다. 이 동일한 개념은 상당히 유용한 조건적 Cas9 마우스를 만드는 것이다. 본 발명자들은 그들의 조건적 Cas9 마우스를 Cre(ACTB-Cre 계통)를 편재하여 발현시키는 마우스와 교배시킬 수 있고, 세포마다 Cas9를 발현시키는 마우스에 도달할 수 있다. 배아 또는 성체 마우스에서 게놈 편집을 유발하기 위해서는 키메라 RNA만을 전달해야 한다. 흥미롭게도, 조건적 Cas9 마우스가 조직 특이적 프로모터 하에 Cre를 발현하는 마우스와 교배된다면, 또한 Cre를 발현시키는 조직에 Cas9만 있어야 한다. 이 접근은 동일 조직에 키메라 RNA를 전달함으로써 정확한 조직에서만 게놈을 편집하는데 사용될 수 있다.

전술된 바와 같이, 유전자 이식 동물들뿐만 아니라, 유전자 이식 식물, 특히 농작물 및 조류도 제공된다. 유전자 이식체는 질병 모델을 제공하는 이외의 분야들에서도 유용할 수 있다. 이와 같은 분야로서는, 예를 들어 단백질, 탄수화물, 영양소 또는 비타민의 발현 수준을, 야생형의 경우에서 관찰되는 발현 수준보다 높게 만들어 사료를 제조하는 식품 분야를 포함한다. 이러한 관점에서, 유전자 이식 식물, 특히 두류 및 구근류와, 유전자 이식 동물, 특히 포유류, 예를 들어 가축(소, 양, 염소 및 돼지)뿐만 아니라 가금류 및 식용 곤충이 바람직하다.

유전자 이식 조류 또는 기타 식물, 예를 들어 유채가 식물성 오일 또는 생물 연료, 예를 들어 알코올(특히 메탄올 및 에탄올)을 제조하는데 특히 유용할 수 있다. 이와 같은 유전자 이식 조류 또는 기타 식물은 석유 산업 또는 생물연료 산업에 사용되도록 오일 또는 알코올을 높은 수준으로 과발현하거나 발현하도록 조작될 수 있다.

생체내 전달에 대해, AAV는 몇 가지 이유로 다른 바이러스 벡터 이상으로 유리하다:

저독성(이는 면역 반응을 활성화할 수 있는 세포입자의 초원심분리를 필요로 하지 않는 정제 방법에 기인할 수 있다)

숙주 게놈 내로 통합하지 않기 때문에 삽입 돌연변이유발을 야기할 낮은 확률.

AAV는 4.5 또는 4.75 Kb의 패키징 제한을 가진다. 이는 Cas9뿐만 아니라 프로모터 및 전사 종결자가 모두 동일한 바이러스 벡터에 적합하게 된다는 것을 의미한다. 4.5 또는 4.75 Kb보다 큰 작제물은 상당히 감소된 바이러스 생산을 야기할 것이다. SpCas9는 상당히 크며, 유전자 그 자체는 4.1 Kb 이상인데, 이는 그것이 AAV 내로 패키징되는 것을 어렵게 만든다. 따라서 본 발명의 구현예는 더 짧은 Cas9의 상동체를 이용하는 것을 포함한다. 예를 들어:

따라서 이들 종은 일반적으로 Cas9 종이 바람직하다. 본 발명자들은 전달 및 생체내 마우스 뇌 Cas9 발현 데이터를 나타내었다.

생체내 게놈 변형을 매개하기 위해 Cas9 암호화 핵산 분자, 예를 들어, DNA를 바이러스 벡터 내로 패키징하는 2 가지 방법이 바람직하다:

NHEJ-매개 유전자 녹아웃을 달성하기 위해:

단일 바이러스 벡터:

2 이상의 발현 카세트를 함유하는 벡터:

프로모터-Cas9 암호화 핵산 분자 -종결자

프로모터-gRNA1-종결자

프로모터-gRNA2-종결자

프로모터-gRNA(N)-종결자 (벡터의 크기 제한까지)

이중 바이러스 벡터:

Cas9의 발현을 구동하기 위한 하나의 발현 카세트를 함유하는 벡터 1

프로모터-Cas9 암호화 핵산 분자-종결자

하나 이상의 가이드RNA의 발현을 구동하기 위한 하나 이상의 발현 카세트를 함유하는 벡터 2

프로모터-gRNA1-종결자

프로모터-gRNA(N)-종결자(벡터의 크기 제한까지)

상동체-관련 수선을 매개하는 것. 상기 기재한 단일 및 이중 바이러스 벡터 접근에 추가로, 추가적인 벡터를 사용하여 상동체-관련 수선 주형을 전달한다.

Cas9 암호화 핵산 분자 발현을 구동시키기 위해 사용되는 프로모터는 하기를 포함할 수 있다:

AAV ITR은 프로모터로서 작용할 수 있다: 이는 추가적인 프로모터 구성요소(벡터 내 공간을 취할 수 있음)에 대한 필요를 제거하는데 유리하다. 추가적인 공간 개방은 추가적인 구성요소(gRNA 등)의 발현을 구동하는데 사용될 수 있다. 또한, ITR 활성은 상대적으로 더 약하고, 따라서 Cas9의 과발현에 기인하는 독성을 감소시키기 위해 사용될 수 있다.

편재하는 발현에 대해, 다음의 프로모터를 사용할 수 있다: CMV, CAG, CBh, PGK, SV40, 페리틴 중쇄 또는 경쇄 등.

뇌 발현에 대해, 다음의 프로모터를 사용할 수 있다: 모든 뉴런에 대해 시냅신I(SynapsinI), 흥분성 뉴런에 대해CaMKII알파, 가바성(GABAergic) 뉴런에 대해 GAD67 또는 GAD65 또는 VGAT 등.

간 발현에 대해, 알부민 프로모터를 사용할 수 있다

폐 발현에 대해 SP-B를 사용할 수 있다

내피세포에 대해 ICAM을 사용할 수 있다

조혈모세포에 대해 IFN베타 또는 CD45를 사용할 수 있다

조골세포에 대해 OG-2를 사용할 수 있다

가이드 RNA를 구동하기 위해 사용되는 프로모터는:

U6 또는 H1과 같은 Pol III 프로모터를 포함할 수 있다.

gRNA를 발현시키기 위한 Pol II 프로모터 및 인트론 카세트의 사용

AAV에 관해, AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적화될 세포와 관련하여 AAV의 AAV를 선택할 수 있으며; 예를 들어, 뇌 또는 신경세포를 표적화하기 위해 AAV 혈청형 1, 2, 5 또는 혼성체 또는 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있으며; 심장 조직을 표적화하기 위한 AAV4를 선택할 수 있다. AAV8은 간에 대한 전달에 유용하다. 상기 프로모터 및 벡터는 개별적으로 바람직하다.

RNA 전달은 또한 유용한 생체내 전달방법이다. 도 9는 전달 및 생체내 마우스 뇌 Cas9 발현 데이터를 나타낸다. 리포좀 또는 나노입자를 사용하여 Cas9 및 gRNA(예를 들어, HR 수선 주형)을 세포 내로 전달할 수 있다. 따라서 Cas9와 같은 CRISPR 효소의 전달 및/또는 본 발명의 RNA의 전달은 RNA 형태일 수 있고 미세소포, 리포좀 또는 나노입자를 통할 수 있다. 예를 들어, Cas9 mRNA 및 gRNA는 생체내 전달을 위해 리포좀 입자 내로 패키징될 수 있다. Life Technologies사제의 인비보펙타민(Invivofectamine)과 같은 리포좀 트렌스펙션 시약 및 시판 중인 다른 시약은 RNA 분자를 간에 효과적으로 전달할 수 있다.

NHEJ 또는 HR 효율을 향상시키는 것은 또한 전달에 도움을 준다. NHEJ 효율은 Trex2와 같은 최종 가공 효소를 공동발현시킴으로써 향상되는 것이 바람직하다(Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). HR 효율은 Ku70 및 Ku86과 같은 NHEJ 기작을 일시적으로 저해함으로써 증가되는 것이 바람직하다. HR 효율은 또한 RecBCD, RecA와 같은 원핵 또는 진핵 상동성 재조합 효소를 공동발현시킴으로써 증가될 수 있다.

다양한 전달 수단이 본 명세서에 기재되고, 이 부문에서 추가로 논의된다.

바이러스 전달: CRISPR 효소, 예를 들어 Cas9, 및/또는 임의의 본 발명의 RNA, 예를 들어 가이드 RNA는 아데노 연관 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 다른 바이러스 벡터 유형, 또는 이들의 조합을 사용하여 전달될 수 있다. Cas9 및 하나 이상의 가이드 RNA는 하나 이상의 바이러스 벡터 내로 패키징될 수 있다. 일부 구현예에서, 바이러스 벡터는, 예를 들어 근육내 주사에 의해 관심대상의 조직에 전달되는 한편, 바이러스 전달은 정맥내, 경피, 비강내, 구강, 점막 또는 다른 전달방법을 통한다. 이러한 전달은 단일 용량 또는 다회 용량을 통한 것일 수 있다. 당업자는 본 명세서에 전달될 실제 투약량이 다양한 인자, 예컨대 선택된 벡터, 표적 세포, 유기체 또는 조직, 치료될 대상체의 일반적 질환, 추구되는 형질전환/변형 정도, 투여 경로, 투여 방식, 추구되는 형질전환/변형 유형 등에 따라서 크게 다를 수 있다는 것을 이해한다.

이와 같은 투여량은, 예를 들어 담체(물, 염수, 에탄올, 글리세롤, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 아가, 펙틴, 땅콩 오일, 참깨 오일 등), 희석제, 약학적으로 허용 가능한 담체(예를 들어, 인산염 완충 염수), 약학적으로 허용 가능한 부형제, 항원성을 향상하기 위한 보조제, 면역자극성 화합물 또는 분자, 및/또는 기타 당 업계에 알려진 화합물을 추가로 함유할 수 있다. 본원의 보조제는 항원이 흡착된 무기물(백반, 수산화알루미늄, 인산알루미늄)의 현탁액을 함유할 수 있거나; 아니면 항원 용액이 오일 중에 유화된 유중수 에멀전(MF-59, 프룬트(Freund) 불완전 보조제)를 함유할 수 있고, 종종 (항원의 분해가 억제되고/억제되거나 대식 세포들의 유입을 유발함으로써) 항원성이 더욱 향상되도록, 사멸된 마이코박테리아를 함께 함유할 수도 있다(프룬트 완전 보조제). 보조제는 또한 면역자극성 분자, 예를 들어 시토킨, 공자극 분자, 예를 들어 면역자극성 DNA 또는 RNA 분자, 예를 들어 CpG 올리고뉴클레오티드를 포함할 수도 있다. 이러한 투약량 제형은 당업자에 의해 용이하게 확인될 수 있다. 투약은 하나 이상의 약제학적으로 허용가능한 염, 예를 들어 무기염, 예컨대 염산, 브롬화수소산, 인산염, 황산염 등; 및 유기산의 염, 예컨대 아세트산염, 프로피온산염, 말론산염, 벤조산염 등을 추가로 함유할 수 있다. 추가적으로, 보조 물질, 예컨대 습윤제 또는 유화제, pH 완충 물질, 겔 또는 겔화 물질, 향미제, 착색제, 미소구체, 중합체, 현탁제 등은 또한 본 명세서에 존재할 수 있다. 추가로, 특히 제형이 재구성가능한 형태라면 하나 이상의 다른 통상적인 약제학적 성분, 예컨대 보존제, 습윤제, 현탁제, 계면활성제, 항산화제, 고화방지제, 충전제, 킬레이트제, 코팅제, 화학적 안정제 등이 또한 존재할 수 있다. 적합한 예시적 성분은 미정질 셀룰로스, 카복시메틸셀룰로스 나트륨, 폴리솔베이트 80, 페닐에틸 알코올, 클로로부탄올, 솔브산칼륨, 솔브산, 이산화황, 갈산프로필, 파라벤, 에틸 바닐린, 글리세린, 페놀, 파라클로로페놀, 젤라틴, 알부민 및 이들의 조합을 포함한다. 약제학적으로 허용가능한 부형제의 철저한 논의는 본 명세서에 참고로 포함되는 문헌[REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991)]에서 이용가능하다.

본 명세서의 구현예에서, 전달은 아데노바이러스 벡터의 적어도 1 x 10⁵ 개 입자(또한 단위 입자로서 지칭됨, pu)를 함유하는 단일 부스터 용량에 있을 수 있는 아데노바이러스를 통한다. 본 명세서의 구현예에서, 용량은 바람직하게는 적어도 약 1 x 10⁶ 개 입자(예를 들어, 약 1 x 10⁶-1 x 10¹² 개 입자), 더 바람직하게는 적어도 약 1 x 10⁷ 개 입자, 더 바람직하게는 적어도 약 1 x 10⁸ 개 입자(예를 들어, 약 1 x 10⁸-1 x 10¹¹ 개 입자 또는 약 1 x 10⁸-1 x 10¹² 개 입자), 및 가장 바람직하게는 적어도 약 1 x 10⁰ 개 입자(예를 들어, 약 1* x 10⁹-1 x 10¹⁰ 개 입자 또는 약 1 x 10⁹-1 x 10¹² 개 입자), 또는 심지어 적어도 약 1 x 10¹⁰ 개 입자(예를 들어, 약 1 x 10¹⁰-1 x 10¹² 개 입자)의 아데노바이러스 벡터이다. 대안적으로, 용량은 1 x 10¹⁴ 개 이하의 입자, 바람직하게는 약 1 x 10¹³ 개 이하의 입자, 훨씬 더 바람직하게는 약 1 x 10¹² 개 이하의 입자, 훨씬 더 바람직하게는 약 1 x 10¹¹ 개 이하의 입자, 및 가장 바람직하게는 약 1 x 10¹⁰ 개 이하의 입자(예를 들어, 약 1 x 10⁹ 개 이하의 입자)를 포함한다. 따라서, 용량은, 예를 들어 약 1 x 10⁶ 개 입자 단위(pu), 약 2 x 10⁶ pu, 약 4 x 10⁶ pu, 약 1 x 10⁷ pu, 약 2 x 10⁷ pu, 약 4 x 10⁷ pu, 약 1 x 10⁸ pu, 약 2 x 10⁸ pu, 약 4 x 10⁸ pu, 약 1 x 10⁹ pu, 약 2 x 10⁹ pu, 약 4 x 10⁹ pu, 약 1 x 10¹⁰ pu, 약 2 x 10¹⁰ pu, 약 4 x 10¹⁰ pu, 약 1 x 10¹¹ pu, 약 2 x 10¹¹ pu, 약 4 x 10¹¹ pu, 약 1 x 10¹² pu, 약 2 x 10¹² pu, 또는 약 4 x 10¹² pu의 아데노바이러스 벡터에 의한 단일 용량의 아데노바이러스 벡터를 함유할 수 있다. 예를 들어, 본 명세서에 참고로 포함되는 2013년 6월 4일 등록된 Nabel 등의 미국 특허 제8,454,972 B2호에서의 아데노바이러스 벡터, 및 이의 29 칼럼, 36 내지 58줄에서의 투약량을 참조한다. 본 명세서의 구현예에서, 아데노바이러스는 다회용량을 통해 전달된다.

본 명세서의 구현예에서, 전달은 AAV를 통한다. 인간에 대한 AAV의 생체내 전달을 위한 치료적 유효량은 약 1 x 10¹⁰ 내지 약 1 x 10¹⁰ 기능성 AAV/㎖ 용액을 함유하는 식염수 용액의 약 20 내지 약 50 ㎖의 범위에 있는 것으로 믿어진다. 투약량은 임의의 부작용에 대해 치료적 이점의 균형을 맞추도록 조절될 수 있다. 본 명세서의 구현예에서, AAV 용량은 일반적으로 약 1 x 10⁵ 내지 1 x 10⁵⁰ 개 게놈 AAV, 약 1 x 10⁸ 개 내지 1 x 10²⁰ 개 게놈 AAV, 약 1 x 10¹⁰ 내지 약 1 x 10¹⁶ 개 게놈, 또는 약 1 x 10¹¹ 내지 약 1 x 10¹⁶ 개 게놈 AAV의 농도 범위에 있다. 인간 투약량은 약 1 x 10¹³ 개 게놈 AAV일 수 있다. 이러한 농도는 약 0.001 ㎖ 내지 약 100 ㎖, 약 0.05 내지 약 50 ㎖, 또는 약 10 내지 약 25 ㎖의 담체 용액으로 전달될 수 있다. 다른 유효한 투약량은 용량 반응 곡선을 확립하는 일상적 시도를 통해 당업자에 의해 용이하게 확립될 수 있다. 예를 들어, 2013년 3월 26일 등록된 Hajjar 등의 미국 특허 제8,404,658 B2호, 27 칼럼 45 내지 60줄.

본 명세서의 구현예에서, 전달은 플라스미드를 통한다. 이러한 플라스미드 조성물에서, 투약량은 반응을 유발하는데 충분한 양의 플라스미드여야한다. 예를 들어, 플라스미드 조성물 중의 플라스미드 DNA의 적합한 양은 약 0.1 내지 약 2 ㎎, 또는 약 1 ㎍ 내지 약 10 ㎍일 수 있다.

본원에 있어서 투여량은 체중이 평균 70 ㎏인 개체를 기준으로 한다. 투여 횟수는 의료 분야나 수의학 분야의 실무자(예를 들어, 전문의, 수의사) 또는 업계의 숙련된 과학자의 소관 안에 있다.

Cas9 및 1 개 이상의 가이드 RNA는, 예를 들어 미국 특허 제8,454,972호(아데노바이러스에 대한 제형 및 투여량), 제8,404,658호(AAV에 대한 제형 및 투여량), 그리고 제5,846,946호(DNA 플라스미드에 대한 제형 및 투여량)에 개시되어 있으며, 렌티바이러스, AAV 및 아데노바이러스가 사용되는 임상 실험들과 이러한 임상 실험들에 관한 공표 문헌들로부터 알려진 제형들과 투여량들이 적용될 때, 아데노 연관 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 기타 플라스미드나 바이러스 벡터 류가 사용되어 전달될 수 있다. 예를 들어 AAV에 있어서, 투여 경로, 제형 및 투여량은 미국 특허 제8,454,972호에 개시된 바와 같을 수 있으며, AAV가 사용된 임상 실험들에서와 같을 수 있다. 아데노바이러스에 있어서, 투여 경로, 제형 및 투여량은 미국 특허 제8,404,658호에 개시된 바와 같을 수 있으며, 아데노바이러스가 사용된 임상 실험들에서와 같을 수 있다. 플라스미드 전달을 위한 투여 경로, 제형 및 투여량은 미국 특허 제5,846,946호에 개시된 바와 같을 수 있으며, 플라스미드가 사용된 임상 실험들에서와 같을 수 있다. 투여량은 체중이 평균 70 ㎏인 개체를 기준으로 결정될 수 있거나, 아니면 이러한 개체에 대해 외삽되어 결정될 수 있으며, 체중과 종이 상이한 포유류, 대상체 또는 환자에 따라 조정될 수 있다. 투여 횟수는, 통상의 인자들, 예를 들어 환자나 대상체의 나이, 성별, 전체적인 건강 상태 및 기타 조건들과, 다루어질 특정 병태 또는 증상들에 따라서, 의료 분야나 수의학 분야의 실무자(예를 들어, 전문의, 수의사)의 소관으로 결정될 수 있다.

바이러스 벡터는 관심있는 조직에 주입될 수 있다. 세포 유형 특이적 게놈 변형을 위해서 Cas9 발현은 세포 유형 특이적 프로모터에 의해 구동될 수 있다. 예를 들어 간 특이적 발현에서는 알부민 프로모터가 사용될 수 있으며, 뉴런 특이적 발현에서는 시냅신 I 프로모터가 사용될 수 있다.

RNA 전달: CRISPR 효소, 예를 들어 Cas9, 및/또는 밍의의 본 발명의 RNA, 예를 들어 가이드 RNA는 또한 RNA의 형태로 전달될 수 있다. Cas9 mRNA는 시험관내 전사를 사용하여 생성될 수 있다. 예를 들어, Cas9 mRNA는 다음의 구성요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: 베타 글로빈-폴리A 꼬리(일련의 120개 이상의 아데닌)로부터의 T7_프로모터-코작 서열(GCCACC)-Cas9-3' UTR. 카세트는 T7 중합효소의 전사를 위해 사용될 수 있다. 가이드 RNA는 또한 T7_프로모터-GG-가이드 RNA 서열을 함유하는 카세트로부터의 시험관내 전사를 사용하여 전사될 수 있다.

발현을 향상시키고 독성을 감소시키기 위해, CRISPR 효소 및/또는 가이드 RNA는 슈도-U 또는 5-메틸-C를 사용하여 변형될 수 있다.

CRISPR 효소 mRNA 및 가이드 RNA는 나노입자 또는 지질 외피를 사용하여 동시에 전달될 수 있다.

예를 들어, Su X, Fricke J, Kavanagh DG, Irvine DJ의 문헌["In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive 중합체 nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. Epub 2011 Apr 1]은 인지질 이중층 껍질에 의해 둘러싸인 폴리(β-아미노에스터)(PBAE) 코어를 지니는 생분해성 코어 껍질 구조의 나노입자를 기재한다. 이들은 생체내 mRNA 전달을 위해 개발되었다. pH-반응성 PBAE 구성성분은 엔도솜 파괴를 촉진하도록 선택되는 한편, 지질표면층은 폴리양이온 코어의 독성을 최소화하도록 선택되었다. 따라서 본 발명의 RNA를 전달하는 것이 바람직하다.

뿐만 아니라 문헌[Michael S D Kormann et al., "Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157 (2011) Published online 09 January 2011]에는, RNA를 전달하기 위해 지질 외피가 사용되는 것이 개시되어 있다. 지질 외피들의 사용도 본 발명에 바람직하다.

mRNA 전달 방법들은 현재 간 전달에 특히 촉망된다.

CRISPR 효소 mRNA 및 가이드 RNA는 또한 별개로 전달될 수 있다. CRISPR 효소 mRNA는 가이드 RNA 전에 전달되어 CRISPR 효소가 발현될 시간을 제공할 수 있다. CRISPR 효소 mRNA는 가이드 RNA의 투여 전 1 내지 12 시간(바람직하게는 약 2 내지 6 시간)에 투여될 수 있다.

대안적으로, CRISPR 효소 mRNA 및 가이드 RNA는 함께 투여될 수 있다. 유리하게는, 가이드 RNA의 제2 부스터 용량은 CRISPR 효소 mRNA + 가이드 RNA의 초기 투여 후 1 내지 12 시간(바람직하게는 약 2 내지 6 시간)에 투여될 수 있다.

CRISPR 효소 mRNA 및/또는 가이드 RNA의 추가 투여는 가장 효율적인 게놈 변형 수준을 달성하는데 유용할 수 있다.

독성 및 표적외 효과의 최소화를 위해, 전달되는 CRISPR 효소 mRNA 및 가이드 RNA의 농도를 제어하는 것은 중요할 것이다. 최적의 농도의 CRISPR 효소 mRNA 및 가이드 RNA는 세포 또는 동물 모델에서 상이한 농도를 시험함으로써, 그리고 잠재적인 표적외 게놈 유전자좌에서의 변형 정도를 분석하는 심층 시퀀싱(deep sequencing)을 사용함으로써 결정될 수 있다. 예를 들어, 인간 게놈의 EMX1 유전자에서 5'-GAGTCCGAGCAGAAGAAGAA-3'을 표적화하는 가이드 서열에 대해, 심층 시퀀싱은 다음의 2 개의 표적외 유전자좌, 즉 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' 및 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'에서 변형 수준을 평가하기 위해 사용될 수 있다. 표적 상의 변형의 가장 높은 수준을 제공하는 한편 표적외 변형의 수준을 최소화하는 농도가 생체내 전달을 위해 선택되어야 한다.

대안적으로, 독성 수준 및 표적외 효과를 최소화하기 위해, CRISPR 효소 닉카아제 mRNA(예를 들어 D10A 또는 H840A 돌연변이를 지니는 스트렙토코커스 피오게네스 Cas9)는 관심 대상의 부위를 표적화하는 가이드 RNA의 쌍에 의해 전달될 수 있다. 2 개의 가이드 RNA는 다음과 같이 이격될 필요가 있다. 각각 적색(단일 밑줄) 및 청색(이중 밑줄)의 가이드 서열(이들 예는 스트렙토코커스 피오게네스 Cas9에 대한 PAM 필요조건에 기반함).

시스템의 추가적 의문은 5' 돌출부의 출원인 증거로 주어졌다(예를 들어, 문헌[Ran et al., Cell. 2013 Sep 12;154(6):1380-9] 및 2013년 8월 28일자로 출원된 미국 가출원 특허 일련번호 제61/871,301호). 출원인은 2 개의 가이드 RNA와 조합될 때 Cas9 닉카아제 돌연변이체에 의한 효율적인 절단에 관한 파라미터를 추가로 동정하였고, 이들 파라미터는 5' 돌출부의 길이를 포함하지만, 이것으로 제한되지 않는다. 본 발명의 구현예에서, 5' 돌출부는 200 개 이하의 염기쌍, 바람직하게는 100 개 이하의 염기쌍, 또는 더 바람직하게는 50 개 이하의 염기쌍이다. 본 발명의 구현예에서, 5' 돌출부는 적어도 26 개의 염기쌍, 바람직하게는 적어도 30 개의 염기쌍 또는 더 바람직하게는 34 내지 50 개의 염기쌍 또는 1 내지 34 개의 염기쌍이다. 본 발명의 다른 바람직한 방법에서, 제1 표적 서열 근처의 DNA 듀플렉스의 한 개 가닥의 절단을 지시하는 제1 가이드 서열 및 제2 표적 서열 근처의 다른 가닥의 절단을 지시하는 제2 가이드 서열은 평활 절단 또는 3' 돌출부를 초래한다. 본 발명의 구현예에서, 3' 돌출부는 150, 100 또는 25 개 이하의 염기쌍 또는 적어도 15, 10 또는 1 개의 염기쌍이다. 바람직한 구현예에서, 3' 돌출부는 1 내지 100 개의 염기쌍이다.

본 발명의 양태는 감소될 유전자 산물의 발현 또는 유전자 산물을 암호화하는 DNA 분자 내로 추가로 도입될 주형 폴리뉴클레오티드 또는 2개의 5' 돌출부가 재아닐링 및 결찰되게 함으로써 정확하게 절단될 개재 서열 또는 변용될 유전자 산물의 활성 또는 작용 또는 증가될 유전자 산물의 발현에 관한 것이다. 본 발명의 구현예에서, 유전자 산물은 단백질이다.

가이드 서열 사이에 8 bp 미만의 중복(-8 bp 초과의 상쇄)을 지니는 5' 돌출부를 생성하는 sgRNA 쌍만이 검출가능한 삽입결실 형성을 매개할 수 있었다. 중요하게는, 이들 분석에서 사용되는 각각의 가이드는 야생형 Cas9와 짝지어질 때 삽입결실을 효율적으로 유발할 수 있는데, 이는 가이드 쌍의 상대적 위치가 이중 닉카아제 활성을 예측함에 있어 가장 중요한 파라미터가 된다는 것을 나타낸다.

Cas9n 및 Cas9H840A는 DNA의 마주하는 가닥의 틈을 만들기 때문에, 주어진 sgRNA를 지니는 Cas9H840A로의 Cas9n의 치환은 돌출부 유형의 역위를 초래해야만 한다. 예를 들어, Cas9n을 지니는 5' 돌출부를 생성할 sgRNA의 쌍은 대신에 원칙적으로 대응하는 3' 돌출부를 생성하여야 한다. 따라서, Cas9n를 지니는 3' 돌출부의 생성을 야기하는 sgRNA 쌍은 Cas9H840A와 함께 사용되어 5' 돌출부를 생성할 수 있었다. 예상치 못하게, 본 발명자들은 5'와 3' 돌출부를 둘 다 생성하도록 설계된 sgRNA 쌍의 세트를 지니는(-278 내지 +58 bp 범위에 있는 상쇄) Cas9H840A를 시험하였지만, 삽입결실 형성을 관찰할 수 없었다. sgRNA 쌍이 Cas9H840A에 의한 이중 틈내기를 허용하는데 필요한 설계 규칙을 동정하기 위한 추가적인 작업이 필요할 수 있다.

뇌에 대한 추가적인 전달 선택사항은 리포좀 내로 DNA 또는 RNA 중 하나 형태로 CRISPR 효소 및 가이드 RNA의 캡슐화 및 트랜스-혈액뇌장벽(BBB) 전달을 위한 분자 트로이목마에 대한 컨쥬게이팅을 포함한다. 분자 트로이목마는 비인간 영장류의 뇌 내로 B-gal 발현 벡터의 전달에 효과적인 것으로 나타났다. 동일한 접근이 CRISPR 효소 및 가이드 RNA를 함유하는 벡터를 전달하는데 사용될 수 있다. 예를 들어, Xia CF and Boado RJ, Pardridge WM ("Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology." Mol Pharm. 2009 May-Jun;6(3):747-51. doi: 10.1021/mp800194)은 배양물에서 및 생체내에서 세포에 대한 짧은 간섭 RNA(siRNA)의 전달 방법이 수용체-특이적 단클론성 항체(mAb) 및 아비딘-바이오틴 기술의 조합된 사용에 의해 가능하다는 것을 기재한다. 저자는 또한 표적화 mAb와 siRNA 간의 결합이 아비딘-바이오틴 기술에 의해 안정하기 때문에, 뇌와 같은 먼 부위에서 RNAi 효과가 표적화된 siRNA의 정맥내 투여 후 생체내에서 관찰되었다는 것을 보고한다.

Zhang Y, Schlachetzki F, Pardridge WM("Global non-viral gene transfer to the primate brain following intravenous administration." Mol Ther. 2003 Jan;7(1):11-8.)은 루시퍼라제와 같은 리포터를 암호화하는 발현 플라스미드가 인간 인슐린 수용체(HIR)에 대해 단클론성 항체(MAb)를 지니는 생체내 레서스 원숭이 뇌에 대해 표적화된, 85 nm 페길화 면역리포좀을 포함하는 "인공 바이러스"의 내부에서 캡슐화되는 방법을 기재한다. HIRMAb는 리포좀이 혈액-뇌 장벽을 가로지르는 통과세포배출 및 정맥내 주사 후 신경 혈장막을 가로지르는 내포작용을 겪는 외인성 유전자를 운반하는 것을 가능하게 한다. 뇌에서 루시퍼라제 유전자 발현의 수준은 래트와 비교하여 레서스 원숭이에서 50 배 더 높았다. 영장류 뇌에서 베타-갈락토시다제 유전자의 널리 퍼진 신경 발현은 조직화학과 공초점 현미경 둘 다에 의해 입증되었다. 저자는 이 접근이 24 시간에 가역적 성체 유전자이식을 실현가능하게 만든다는 것을 나타낸다. 따라서, 면역리포좀의 사용이 바람직하다. 이들은 특이적 표적 또는 세포 표면 단백질을 표적화하는 항체와 함께 사용될 수 있다.

나노입자(Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010) 또는 엑소좀(Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641)을 통하는 것과 같은 다른 전달 수단 또는 RNA가 또한 바람직하다. 사실, 엑소좀은 CRISPR 시스템과 일부 병용되는 시스템인 전달 siRNA에서 특히 유용한 것으로 나타났다. 예를 들어, El-Andaloussi S, 등("exosomes-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. Epub 2012 Nov 15.)은 엑소좀이 상이한 생물학적 장벽을 가로질러 약물을 전달하기 위한 촉망받는 도구가 되고 시험관내 및 생체내 siRNA의 전달을 위해 이용될 수 있는 방법을 기재한다. 그들의 접근은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하는 발현 벡터의 트렌스펙션을 통해 표적화된 엑소좀을 생성하는 것이다. 이어서, 엑소좀은 트렌스펙션된 세포 상청액으로부터 정제 및 특성규명된 다음, siRNA는 엑소좀에 장입된다.

유전자의 표적화된 결실이 바람직하다. 예는 실시예 12에서 예시된다. 따라서, 콜레스테롤 생합성, 지방산 생합성 및 다른 대사 장애에 수반된 유전자, 아밀로이드 및 다른 질환에 수반된 미스-폴딩 단백질을 암호화하는 유전자, 세포 형질전환을 야기하는 발암유전자, 잠재 바이러스 유전자, 및 특히 우성-음성 장애를 야기하는 유전자가 바람직하다. 본 명세서에 예시하는 바와 같이, 본 발명자들은 바이러스 또는 나노입자 전달 시스템 중 하나를 사용하는, 대사 장애, 아밀로이드증 및 단백질 응집 관련 질환, 유전자 돌연변이 및 전좌로부터 생기는 세포 형질전환, 유전자 돌연변이의 우성 음성 효과, 잠재 바이러스 감염 및 다른 관련된 증상으로 고통받는 치료가 필요한 대상체 또는 환자의 간, 뇌, 눈, 상피, 조혈, 또는 다른 조직에 CRISPR-Cas 시스템에 대한 유전자 전달을 선호한다.

CRISPR-Cas 시스템의 치료적 적용은 녹내장, 아밀로이드증, 및 헌팅턴병을 포함한다. 이들은 실시에 14에서 예시되며, 그에 기재된 특징은 단독으로 또는 조합으로 선호된다.

예로서, HIV-1에 의한 만성 감염은 치료 또는 예방될 수 있다. 이것을 달성하기 위해, 대다수의 HIV-1 게놈을 표적화하는 한편 최대 범위 및 유효성에 대해 HIV-1 균주 변이체를 고려하는 CRISPR-Cas 가이드 RNA를 생성할 수 있다. 숙주 면역 시스템의 전통적인 아데노 바이러스 또는 렌티 바이러스-매개 감염에 의한 CRISPR-Cas 시스템의 전달을 달성할 수 있다. 접근에 따라서, 숙주 면역 세포는 a) 단리, CRISPR-Cas로 형질도입, 선택 및 숙주에 재도입될 수 있거나, 또는 b) CRISPR-Cas 시스템의 전신 전달에 의해 생체내로 형질도입된다. 제1 접근은 내성 면역 집단을 생성시키는 반면, 제2 접근은 숙주 내에서 잠재 바이러스 저장소를 표적화할 가능성이 있다. 이는 실시예 부문에서 더 상세하게 논의된다.

또한 본 발명은 유전자 녹아웃 세포 라이브러리를 생성하는 것으로 생각된다. 각각의 세포는 단일 유전자 녹아웃을 가질 수 있다. 이는 실시예 17에서 예시된다.

각각의 세포가 단일 유전자 녹아웃을 갖는 ES 세포의 라이브러리를 만들 수 있으며, ES 세포의 전체 라이브러리는 모든 단일 유전자 녹아웃을 가질 것이다. 이 라이브러리는 세포 처리뿐만 아니라 질환에서 유전자 기능을 선별에 유용하다. 이 세포 라이브러리를 제조하기 위해, ES 세포 내로 유도성 프로모터(예를 들어, 독시사이클린 유도성 프로모터)에 의해 구동되는 Cas9를 통합할 수 있다. 추가로, 특이적 유전자를 표적화하는 단일 가이드 RNA를 ES 세포 내로 통합할 수 있다. ES 세포 라이브러리를 제조하기 위해, 인간 게놈 내 각각의 유전자를 표적화하는 가이드 RNA를 암호화하는 유전자의 라이브러리와 ES 세포를 단순히 혼합할 수 있다. 인간 ES 세포의 AAVS1 유전자좌 내로 단일 BxB1 attB 부위를 처음 도입할 수 있다. 이어서, AAVS1 유전자좌 내 BxB1 attB 부위 내로 개개 가이드 RNA 유전자의 통합을 용이하게 하기 위해 BxB1 인터그라제를 사용할 수 있다. 통합을 용이하게 하기 위해, 각각의 가이드 RNA 유전자는 단일 attP 부위를 운반하는 플라스미드 상에 함유될 수 있다. 이 방법의 BxB1은 게놈 내 attB 부위를 가이드 RNA 함유 플라스미드 상의 attP 부위와 재조합할 수 있다. 세포 라이브러리를 생성하기 위해, 통합된 단일 가이드 RNA를 가지고 Cas9 발현을 유도하는 세포의 라이브러리를 취할 수 있다. 유도 후, Cas9는 가이드 RNA에 의해 구체화된 부위에서 이중 가닥 파손을 매개한다.

단백질 치료제의 만성 투여는 특이적 단백질에 대한 허용되지 않는 면역 반응을 유발할 수 있다. 단백질 약물의 면역원성은 소수의 면역우성 헬퍼 T 림프구(HTL) 에피토프 탓일 수 있다. 이들 단백질 내에 함유된 이들 HTL 에피토프의 MHC 결합 친화도를 감소시키는 것은 더 낮은 면역원성을 지니는 약물을 생성할 수 있다(Tangri S, 등의 문헌["Rationally engineered therapeutic proteins with reduced immunogenicity" J Immunol. 2005 Mar 15;174(6):3187-96.]). 본 발명에서, 특히 CRISPR 효소의 면역원성은 에리트로포이에틴에 관해 문헌[Tangri et al]에서 처음 제시된 접근에 따라 감소될 수 있고, 후속적으로 발행될 수 있다. 따라서, 방향 진화(directed evolution) 또는 합리적 설계는 숙주 종(인간 또는 다른 종)에서 CRISPR 효소(예를 들어, Cas9)의 면역원성을 감소시키기 위해 사용될 수 있다.

실시예 28에서, 본 발명자들은 관심대상의 3개의 가이드 RNA를 사용하였고, 세포의 작은 서브세트에서만 생기는 생체내 효율적인 DNA 절단을 시각화할 수 있다. 본질적으로, 출원인은 본 명세서에서 나타낸 것은 표적화된 생체내 절단이다. 특히, 이는 포유류와 같은 더 고등의 유기체에서 특이적 표적화가 또한 달성될 수 있다는 개념의 증거를 제공한다. 또한 다중 가이드 서열(즉, 별개의 표적)이 동시에(공동 전달의 의미에서) 사용될 수 있다는 점에서 다중복합 양태를 강조한다. 다시 말해서, 본 발명자들은 동시에 그러나 독립적으로 표적화된 몇몇 상이한 서열에 의한 다중 접근을 사용하였다.

AAV에 대한 프로토콜의 적합한 예로서, 본 발명의 바람직한 벡터가 실시예 29에 제공된다.

트리뉴클레오티드 반복 장애는 치료될 바람직한 질환이다. 이들은 또한 본 명세서에서 예시된다.

다른 양태에 따르면, CFTR 유전자에서 돌연변이를 갖는 대상체의 치료를 위한 유전자 요법의 방법이 제공되며, 선택적으로 생체에 적합한 약제학적 담체를 통해 대상체의 세포에 치료적 유효량의 CRISPR-Cas 유전자 요법 입자를 투여하는 단계를 포함한다. 바람직하게는, 표적 DNA는 돌연변이 델타F508를 포함한다. 일반적으로, 돌연변이는 야생형으로 수선되는 것이 바람직하다. 이 경우에, 돌연변이는 위치 508에서 페닐알라닌(F)의 코돈을 포함하는 3 개 뉴클레오티드의 결실이다. 따라서, 이 예에서 수선은 돌연변이체 내로 상실 코돈의 재도입을 필요로 한다.

이 유전자 수선 전략을 실행하기 위해, 아데노바이러스/AAV 벡터 시스템이 숙주 세포, 세포들 또는 환자에게 도입되는 것이 바람직하다. 바람직하게는, 시스템은 F508 잔기를 함유하는 상동성 수선 주형을 포함하는 아데노바이러스/AAV 벡터 시스템과 함께 Cas9(또는 Cas9 닉카아제) 및 가이드 RNA를 포함한다. 이는 앞서 논의한 전달 방법 중 하나를 통해 대상체에게 도입될 수 있다. CRISPR-Cas 시스템은 CFTR델타 508 키메라 가이드 RNA에 의해 가이드될 수 있다. 이는 틈내기 또는 절단될 CFTR 게놈 유전자좌의 특이적 부위를 표적화한다. 절단 후에, 수선 주형은 낭포성 섬유증을 초래하거나 또는 낭포성 섬유증 관련 증상을 야기하는 결실을 보정하는 상동성 재조합을 통해 절단 부위에 삽입된다. 적절한 가이드 RNA를 지니는 CRISPR 시스템의 전신 도입을 제공하고 전달을 지시하기 위한 이 전략은 표 B에서와 같은 대사적, 간, 신장 및 단백질 질환 및 장애를 야기하는 유전자를 편집 또는 달리 조작하기 위한 유전자 돌연변이를 표적화하는데 사용될 수 있다.

CFTR델타508 키메라 가이드 RNA의 예에 대해, 아데노-연관 바이러스(AAV)를 사용하여, 낭포성 섬유증 또는 낭포성 섬유증(CF) 관련 증상으로 고통받는 치료가 필요한 대상체 또는 환자의 기도에서 CRISPR-Cas 시스템의 유전자 이동 또는 유전자 전달을 입증하는 실시예를 참조한다. 특히, 그들은 낭포성 섬유증 델타 F508 돌연변이에 대한 수선 전략을 예시한다. 이 유형의 전략은 모든 유기체에 걸쳐 적용되어야 한다. 특히 CF와 관련하여, 적합한 환자는 인간, 비영장류 인간, 개, 고양이, 소, 말 및 다른 가축 동물을 포함할 수 있다. 이 예에서, 본 발명자들은 델타F508 또는 다른 CFTR-유발 돌연변이를 표적화하기 위해 Cas9 효소를 포함하는 CRISPR-Cas 시스템을 이용하였다.

이 예에서 치료되는 대상체는 폐에 대해 기관지로 전달되는 한편 자발적으로 호흡하여 약제학적 유효량의 에어로졸 AAV 벡터 시스템을 받는다. 이와 같이, 에어로졸화된 전달은 일반적으로 AAV 전달에 바람직하다. 아데노바이러스 또는 AAV 입자가 전달을 위해 사용될 수 있다. 하나 이상의 조절 서열에 각각 작동 가능하게 연결된 적합한 유전자 작제물은 전달 벡터 내로 클로닝될 수 있다. 이 예에서, 다음의 작제물은 예로서 제공된다: Cas9에 대해 Cbh 또는 EF1a 프로모터, 키메라 가이드 RNA에 대해 U6 또는 H1 프로모터),: 바람직한 배열은 선택적으로 하나 이상의 핵 국소화 신호 또는 서열(들)(NLS(들)), 예를 들어, 두 개의(2) NLS를 이용하는 델타 F508 돌연변이 및 코돈 최적화된 Cas9 효소(바람직한 Cas9는 뉴클레아제 또는 닉카아제 활성을 지니는 것임)에 대한 수선 주형인 CFTR델타508 표적화 키메라 가이드를 사용하는 것이다. NLS가 없는 작제물이 또한 생각된다.

Cas9 표적 부위를 동정하기 위해, 본 발명자는 인간 CFTR 게놈 유전자좌를 분석하였고, Cas9 표적 부위를 동정하였다. 바람직하게는, 일반적으로 및 이 CF 경우에, PAM은 NGG 또는 NNAGAAW 모티프를 함유할 수 있다.

따라서, CF의 경우에, 본 방법은 하기 단계를 포함하는 관심 대상의 게놈 유전자좌에서의 표적 서열의 조작을 포함한다:

조성물을 작동 가능하게 암호화하는 하나 이상의 바이러스 벡터를 포함하는 바이러스 벡터 시스템을 포함하는 비자연적으로 생기는 또는 유전자 조작된 조성물을 이의 발현을 위해 전달하는 단계로서, 상기 조성물은:

I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동 가능하게 연결된 제1 조절 구성요소로서, 폴리뉴클레오티드 서열은

(a) 적합한 포유류 세포에서 CF 표적 서열에 혼성화될 수 있는 가이드 서열,

(b) tracr 메이트 서열, 및

(c) tracr 서열을 포함하는, 제1 조절 구성요소, 및

II. 적어도 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하게 연결된 제2 조절 구성요소,

를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템을 포함하는 비자연적으로 생기거나 또는 유전자 조작된 조성물을 포함하되,

(a), (b) 및 (c)는 5'에서 3' 방향으로 배열되며,

구성성분 I 및 II는 시스템의 동일 또는 상이한 벡터 상에 위치되고,

CRISPR 복합체는 (1) 표적 서열에 혼성화할 수 있는 가이드 서열 및 (2) tracr 서열에 혼성화된 tracr 메이트 서열에 복합체화되는 CRISPR 효소를 포함함)을 포함한다. CF에 대해, 바람직한 표적 DNA 서열은 CFTR델타508 돌연변이를 포함한다. 바람직한 PAM은 상기 기재되어 있다. 바람직한 CRISPR 효소는 임의의 Cas(본 명세서에 기재되어 있지만, 특히 실시예 16에 기재되어 있다.

CF에 대한 대안은 임의의 유전적 장애를 포함하며, 이들의 예는 잘 알려져 있다. 본 발명의 다른 바람직한 방법 또는 용도는 라포라병과 관련된 것으로 동정된 EMP2A 및 EMP2B 유전자에서의 결함을 보정하기 위한 것이다.

일부 구현예에서, "가이드 서열"은 "가이드 RNA"과 별개일 수 있다. 가이드 서열은 표적 부위를 구체화하는 가이드 RNA 내의 대략 20 bp 서열을 지칭할 수 있다.

일부 구현예에서, Cas9는 SpCas9이다(또는 이로부터 유래된다). 이러한 구현예에서, 바람직한 돌연변이는 SpCas9의 임의의 또는 모든 또는 위치 10, 762, 840, 854, 863 및/또는 986에 또는 다른 Cas9에서 대응하는 위치에 있다(예를 들어, 표준 서열 비교 도구에 의해 확인될 수 있다). 특히, SpCas9에서 임의의 또는 모든 다음의 돌연변이: D10A, E762A, H840A, N854A, N863A 및/또는 D986A가 바람직할 뿐만 아니라; 임의의 대체 아미노산에 대한 보존적 치환이 또한 생각된다. 다른 Cas9에서 대응하는 위치에서 동일한 돌연변이(또는 이들 돌연변이의 보존적 치환)이 또한 바람직하다. SpCas9에서 D10 및 H840이 특히 바람직하다. 그러나, 다른 Cas9에서, SpCas9 D10 및 H840에 대응하는 잔기가 또한 바람직하다. 이들은 그들이 닉카아제 활성을 제공하기 때문에 유리하다.

다른 질환의 숙주도 유사한 방식으로 치료될 수 있다는 것이 자명할 것이다. 돌연변이에 의해서 야기되는 유전 질환의 일부 예들이 여기 제공되며, 더 많은 것들이 알려져 있다. 상기 전략은 이들 질환에 적용될 수 있다.

본 발명은 표적 DNA 서열과 결합할 수 있는 핵산을 사용한다. 이것은 핵산이 훨씬더 용이하고 저렴하게 생산될 수 있고, 상동성이 추구되는 신장 길이에 따라 특이성이 변화될 수 있기 때문에 유익하다. 다중 핑거의 복합체 3-D 배치는 예를 들어 필요하지 않다.

용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환가능하게 사용된다. 그것들은 임의의 길이의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나, 또는 그의 유사체의 중합체 형태를 말한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 다음은 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머. 이 용어는 또한 합성 백본을 가진 핵산-유사 구조를 포괄하며, 예를 들어 Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211호; WO 96/39154호; Mata, 1997; Strauss-Soukup, 1997; 및 Samstag, 1996을 참조한다. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드, 예를 들어, 메틸화 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 단속될 수 있다. 폴리뉴클레오티드는 중합화 후에, 예를 들어, 표지화 성분과의 컨쥬게이션에 의해 추가로 변형될 수 있다.

본원에 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 해당 분야의 용어이며, 그것이 돌연변이체 또는 변이체로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 유기체, 균주, 유전자 또는 특징을 의미한다.

본원에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특성의 표현을 의미하는 것으로 이해해야 한다.

용어 "비-천연 발생" 또는 "조작된"은 상호교환가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 언급되는 경우, 핵산 분자 또는 폴리펩티드에 천연에서 천연적으로 관련되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다.

"상보성"은 통상의 왓슨-크릭(Watson-Crick) 염기 쌍형성 또는 기타 비-통상적 유형에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기 쌍형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다(예를 들어, 10 개 중 5, 6, 7, 8, 9, 10 개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성임). "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 동일한 수의 제2 핵산 서열 내의 연속 잔기와 수소 결합할 것임을 의미한다. 본원에 사용되는 바와 같이, "실질적인 상보성"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%인 상보성 정도를 지칭하거나, 엄격한 조건 하에서 혼성화하는 2개의 핵산을 지칭한다.

본원에 사용되는 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 대하여 상보성을 갖는 핵산 서열이 대개 표적 서열과 혼성화하며, 비-표적 서열에는 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록, 서열이 그의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비제한적인 예는 문헌[Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y.]에 상세히 기재되어 있다. 폴리뉴클레오티드 서열이 언급될 때, 상보성 또는 부분 상보성 서열도 생각된다. 이들은 바람직하게 고 긴축 조건에서 기준 서열과 혼성화할 수 있다. 일반적으로, 혼성화 비율을 최대화하기 위해서, 상대적으로 저-긴축 혼성화 조건이 선택된다: 열 용융점 (T _m)보다 약 20 내지 25℃ 낮은 온도. T _m은 특정 표적 서열의 50%가 규정된 이온 강도와 pH에서 용액 중에서 완전히 상보성인 프로브와 혼성화하는 온도이다. 일반적으로, 혼성화된 서열의 적어도 약 85% 뉴클레오티드 상보성을 요구하기 위해서, 고 긴축 세척 조건은 T _m보다 약 5 내지 15℃ 낮은 온도가 되도록 선택된다. 혼성화된 서열의 적어도 약 70% 뉴클레오티드 상보성을 요구하기 위해서, 중도-긴축 세척 조건은 T _m보다 약 15 내지 30℃ 낮은 온도가 되도록 선택된다. 아주 관대한 (초저 긴축) 세척 조건은 T _m보다 50℃ 정도 낮은 온도일 수 있으며, 이것은 혼성화된 서열들 간에 높은 수준의 미스매칭을 허용한다. 당업자는 표적 서열과 프로브 서열 간 상동성의 특정 수준으로부터 검출가능한 혼성화 신호의 결과에 영향을 미치기 위해서 혼성화 및 세척 단계에서 다른 물리화학적 변수들도 변경될 수 있다는 것을 인정할 것이다. 바람직한 고 긴축 조건은 42℃에서 50% 포름아미드, 5×SSC, 및 1% SDS 인큐베이션, 또는 65℃에서 5×SSC 및 1% SDS 인큐베이션과 65℃에서 0.2×SSC 및 0.1% SDS 세척을 포함한다.

"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기 쌍형성, 후그스타인(Hoogstein) 결합 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 복합체는 듀플렉스 구조를 형성하는 2 개의 가닥, 다중 가닥 복합체를 형성하는 3 개 이상의 가닥, 단일의 자가 혼성화 가닥 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR의 개시 또는 효소에 의한 폴리뉴클레오티드의 절단과 같은 보다 광범위한 과정에서 하나의 단계를 이룰 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "상보물"로 지칭된다.

본원에서 사용된 용어 "게놈 유전자좌" 또는 "유전자좌"(복수 유전자좌)는 염색체에서 유전자 또는 DNA 서열의 특정 위치이다. "유전자"는 유기체에서 활동하는 기능적 역할을 가진 폴리펩티드 또는 RNA 사슬을 암호화하는 DNA 또는 RNA의 신축체로서, 살아있는 유기체에서 유전의 분자 단위를 말한다. 본 발명의 목적을 위해서, 유전자는 이러한 조절 서열이 코딩 서열 및/또는 전사된 서열에 인접하든 아니든 유전자 산물의 생성을 조절하는 영역을 포함하는 것으로 간주될 수 있다. 따라서, 반드시 제한되는 것은 아니지만, 유전자는 프로모터 서열, 터미네이터, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 번역 조절 서열, 인핸서, 사일런서, 인슐레이터, 경계 요소, 복제 기원, 바탕질 부착 부위 및 유전자좌 제어 영역을 포함한다.

본원에서 사용된 "게놈 유전자좌의 발현" 또는 "유전자 발현"은 유전자로부터의 정보가 기능적 유전자 산물의 합성에서 사용되는 과정이다. 유전자 발현의 산물은 주로 단백질이지만, rRNA 유전자 또는 tRNA 유전자와 같은 비-단백질 코딩 유전자에서는 이 산물은 기능적 RNA이다. 유전자 발현 과정은 생존을 위한 기능적 산물들을 생성하기 위해서 모든 알려진 생명체, 즉 진핵생물 (다세포 유기체 포함), 원핵생물 (박테리아 및 고세균) 및 바이러스에 의해서 사용된다. 본원에서 사용된 유전자 또는 핵산의 "발현"은 세포 유전자 발현뿐만 아니라 클로닝 시스템 및 어떤 다른 맥락에서 핵산(들)의 전사 및 번역을 포괄한다. 본원에서 사용된 "발현"은 또한 폴리뉴클레오티드가 DNA 주형으로부터 전사되는 과정 (예컨대 mRNA 또는 다른 RNA 전사체로) 및/또는 전사된 mRNA가 이어서 펩티드, 폴리펩티드, 또는 단백질로 번역되는 과정을 말한다. 전사체 및 암호화된 폴리펩티드는 집합적으로 "유전자 산물"이라고 언급될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된다면, 발현은 진핵세포에서 mRNA의 스플라이싱을 포함할 수 있다.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 본원에서 임의의 길이의 아미노산의 중합체를 지칭하기 위해 상호교환가능하게 사용된다. 중합체는 선형 또는 분지형일 수 있으며, 그것은 변형된 아미노산을 포함할 수 있고, 그것은 비-아미노산에 의해 단속될 수 있다. 또한, 상기 용어는 변형된 아미노산 중합체, 예를 들어, 이황화 결합 형성, 글리코실화, 지질화(lipidation), 아세틸화, 인산화 또는 임의의 기타 조작, 예를 들어, 표지화 성분과의 컨쥬게이션을 포함한다. 본원에 사용되는 바와 같이, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 및 아미노산 유사체 및 펩티도미메틱을 포함하는 천연 및/또는 비천연 또는 합성 아미노산을 포함한다.

본원에서 사용된 용어 "도메인" 또는 "단백질 도메인"은 단백질 가닥의 나머지 부분과 독립적으로 존재하며 기능할 수 있는 단백질 서열의 일부분을 말한다.

본 발명의 양태들에서 설명된 대로, 서열 동일성은 서열 상동성과 관련된다. 상동성 비교는 눈으로, 또는 더 일반적으로는 쉽게 이용가능한 서열 비교 프로그램의 도움하에 수행될 수 있다. 이들 상업적으로 이용가능한 컴퓨터 프로그램은 둘 이상의 서열 사이의 상동성 퍼센트(%)를 계산할 수 있고, 또한 둘 이상의 아미노산 또는 핵산 서열에 의해서 공유된 서열 동일성을 계산할 수 있다. 일부 바람직한 구현예에서, 여기 설명된 dTALE의 봉쇄 영역은 여기 제공된 봉쇄 영역 아미노산 서열과 적어도 95% 동일하거나 동일성을 공유하는 서열을 가진다.

서열 상동성은 본 분야에 알려진 다수의 컴퓨터 프로그램, 예를 들어 BLAST 또는 FASTA 등의 어느 것에 의해서 생성될 수 있다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG Wisconsin Bestfit 패키지이다(University of Wisconsin, U.S.A; 문헌[Devereux et al., 1984, Nucleic Acids Research 12:387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 제한은 아니지만, BLAST 패키지(Ausubel et al., 1999 상기 참조 - Chapter 18 참조), FASTA(Atschul et al., 1990, J. Mol. Biol., 403-410) 및 GENEWORKS 비교 도구 일습을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색으로 이용할 수 있다(Ausubel et al., 1999 ibid, pages 7-58 내지 7-60 참조). 그러나, GCG Bestfit 프로그램을 사용하는 것이 바람직하다.

서열 상동성 퍼센트(%)는 연속 서열에 걸쳐서 계산될 수 있는데, 즉 하나의 서열이 다른 서열과 정렬되고, 하나의 서열에서 각 아미노산 또는 뉴클레오티드가 다른 서열에서 상응하는 아미노산 또는 뉴클레오티드와 한번에 하나의 잔기씩 직접 비교된다. 이것은 "비갭방식"(ungapped) 정렬이라고 불린다. 통상적으로, 이러한 비갭방식 정렬은 상대적으로 짧은 수의 잔기에 걸쳐서만 수행된다.

이것은 매우 간단하고 일관된 방법이지만, 예를 들어 다른 동일한 쌍의 서열에서, 하나의 삽입 또는 결실이 이후의 아미노산 잔기를 정렬되지 않도록 할 수 있다는 것을 고려하지 않으므로, 전반적 정렬이 수행될 때는 상동성 %에 잠재적으로 상당한 감소가 있게 된다. 결론적으로, 대부분의 서열 비교 방법은 전체 상동성 또는 동일성 점수에 지나친 벌점부과 없이 가능한 삽입과 결실을 고려하여 최적 정렬을 생성하도록 설계된다. 이것은 서열 정렬에 "갭"을 삽입함으로써 달성되며, 이로써 국소 상동성 또는 동일성을 최대화하도록 시도할 수 있다.

그러나, 이런 더 복잡한 방법은 정렬시 생긴 각 갭에 "갭 패널티"를 배정하며, 이로써 동일한 수의 동일한 아미노산에 대해, 가능한 적은 갭을 가진 서열 정렬 - 비교된 두 서열의 더 높은 관련성 반영 - 이 많은 갭을 가진 것보다 더 높은 점수를 달성할 수 있다. "친화성 갭 코스트"가 통상적으로 사용되는데, 이것은 갭의 존재에는 상대적으로 높은 코스트를 매기고, 갭의 각 연속 잔기에는 더 적은 패널티를 매긴다. 이것은 가장 흔히 사용되는 갭 점수배정 시스템이다. 높은 갭 패널티는 당연히 갭이 적을수록 최적화된 정렬을 생성할 수 있다. 대부분의 정렬 프로그램은 갭 패널티의 변형을 허용한다. 그러나, 서열 비교에 이러한 소프트웨어를 사용할 때는 디폴트 값을 사용하는 것이 바람직하다. 예를 들어, GCG Wisconsin Bestfit 패키지를 사용할 때, 아미노산 서열에 대한 디폴트 갭 패널티는 갭 당 -12, 각 연장 당 -4이다.

따라서, 최대 상동성 %의 계산은 갭 패널티를 고려한 최적 정렬의 생성을 요구한다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG Wisconsin Bestfit 패키지이다(Devereux et al., 1984 Nuc . Acids Research 12 p387). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 제한은 아니지만, BLAST 패키지(Ausubel et al., 1999 Short Protocols in Molecular Biology, 4^th Ed. Chapter 18 참조), FASTA (Altschul et al., 1990 J. Mol . Biol. 403-410) 및 GENEWORKS 비교 도구 일습을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색으로 이용할 수 있다(Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 내지 7-60 참조). 그러나, 일부 용도에서, GCG Bestfit 프로그램을 사용하는 것이 바람직하다. BLAST 2 서열이라고 불리는 새로운 도구도 단백질 및 뉴클레오티드를 비교하는데 이용할 수 있다(FEMS Microbiol Lett . 1999 174(2): 247-50; FEMS Microbiol Lett . 1999 177(1): 187-8 및 National Institutes for Health 웹사이트에서 National Center for Biotechnology 웹사이트의 정보 참조).

최종 상동성%는 동일성 항목으로 측정될 수 있지만, 통상적으로 정렬 과정 자체는 모두-아니면-전부 쌍 비교에 기초하지 않는다. 대신, 축척된 유사성 점수 행렬이 일반적으로 사용되는데, 이것은 화학적 유사성 또는 진화적 거리에 기초하여 각 쌍-방식 비교에 점수를 배정한다. 흔히 사용되는 이러한 행렬의 예는 BLOSUM62 행렬로서, 이것은 BLAST 프로그램 일습의 디폴트 행렬이다. GCG Wisconsin 프로그램은 일반적으로 공개된 디폴트 값이나 제공되는 경우에는 사용자 지정 기호비교표 (추가의 상세한 설명을 위한 사용자 매뉴얼 참조)를 사용한다. 일부 용도에서, GCG 패키지에 대한 공개된 디폴트 값을 사용하거나, 또는 다른 소프트웨어의 경우에는 BLOSUM62와 같은 디폴트 행렬을 사용하는 것이 바람직하다.

또는 달리, 상동성 퍼센트는 CLUSTAL와 유사한 알고리즘에 기초한, DNASIS^TM(Hitachi Software)의 다중 정렬 특징을 사용하여 계산될 수 있다(Higgins DG & Sharp PM (1988), Gene 73(1), 237-244). 일단 소프트웨어가 최적 정렬을 생성하면, 상동성 %, 바람직하게는 서열 동일성 %를 계산하는 것이 가능하다. 이 소프트웨어는 통상적으로 서열 비교의 일부로서 이것을 행하고, 수치 결과를 생성한다.

서열은 또한 침묵성 변화를 야기하여 기능적으로 동등한 물질을 가져오는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있다. 아미노산 특성(예컨대 잔기의 극성, 전하, 용해성, 소수성, 친수성 및/또는 양친매성)의 유사성을 기초로 의도적인 아미노산 치환이 만들어질 수 있으며, 따라서 이것은 아미노산을 기능적 그룹으로 함께 그룹화하는데 유용하다. 아미노산은 그것의 측쇄만의 특성에 기초하여 그룹화될 수 있다. 그러나, 돌연변이 데이터를 포함하는 것도 역시 더 유용하다. 이렇게 유도된 아미노산 세트는 구조적 이유로 보존될 수 있다. 이들 세트는 벤다이어그램의 형태로 설명될 수 있다(Livingstone C.D. and Barton G.J. (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput . Appl . Biosci. 9: 745-756) (Taylor W.R. (1986) "The classification of amino acid conservation" J. Theor . Biol . 119; 205-218). 보존적 치환은, 예를 들어 일반적으로 용인된 벤다이어그램 아미노산 그룹화를 설명한 아래 표에 따라서 만들어질 수 있다.

본 발명의 구현예는, 아미노산의 경우 유사한 것으로의 치환, 예컨대 염기성을 염기성으로, 산성을 산성으로, 극성을 극성으로 등등의 치환을 일으킬 수 있는 상동성 치환(치환 및 대체는 모두 본원에서 기존 아미노산 잔기 또는 뉴클레오티드의 다른 잔기 또는 뉴클레오티드로의 교환을 의미하기 위해서 사용된다)을 포함할 수 있는 서열(폴리뉴클레오티드 또는 폴리펩티드 모두)을 포함한다. 비-상동성 치환, 즉 한 부류의 잔기로부터 다른 부류의 잔기로의 치환이 일어날 수 있거나, 또는 달리 이것은 오르니틴(이후 Z로 언급), 디아미노부티르산 오르니틴(이후 B로 언급), 노르류신 오르니틴(이후 O로 언급), 피리일알라닌, 티엔일알라닌, 나프틸알라닌 및 페닐글리신과 같은 비천연 아미노산의 포함을 의 잔기로의 치환을 수반할 수 있다.

변이체 아미노산 서열은 글리신 또는 β-알라닌 잔기와 같은 아미노산 스페이서에 더하여 메틸, 에틸 또는 프로필 기와 같은 알킬 기를 포함하는 서열의 임의의 두 아미노산 잔기 사이에 삽입될 수 있는 적합한 스페이서 기를 포함할 수 있다. 펩토이드 형태로 하나 이상의 아미노산 잔기의 존재를 포함하는 추가의 형태의 변형도 당업자에게 잘 이해될 수 있다. 의심을 피하기 위해서, "펩토이드 형태"는 α-탄소 치환체 기가 α-탄소가 아니라 잔기의 질소 원자에 존재하는 변이체 아미노산 잔기를 말하기 위해서 사용된다. 펩토이드 형태로 펩티드를 제조하는 과정은 본 분야에, 예를 들어 문헌[Simon RJ et al., PNAS (1992) 89(20), 9367-9371 및 Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134]에 공지되어 있다.

본 발명의 실시는 달리 나타내지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상의 기술을 사용한다. 문헌[Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989)]; 문헌[CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987))]; 시리즈 문헌[METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987))]을 참조한다.

일 양태에서, 본 발명은 CRISPR-Cas 시스템의 조작 및 최적화에 사용되는 벡터를 제공한다.

본원에서 사용된 "벡터"는 하나의 환경에서 다른 환경으로 어떤 독립체의 전달을 허용하거나 촉진하는 도구이다. 그것은 레플리콘, 예컨대 플라스미드, 파지, 또는 코스미드이며, 여기에 다른 DNA 세그먼트가 삽입될 수 있고, 이로써 삽입된 세그먼트의 복제가 이루어질 수 있다. 일반적으로, 벡터는 적절한 제어 요소와 관련되었을 때 복제가 가능하다. 일반적으로, 용어 "벡터"는 결합된 다른 핵산을 수송할 수 있는 핵산 분자를 말한다. 벡터는, 제한은 아니지만, 단일가닥, 이중가닥, 또는 부분적으로 이중가닥인 핵산 분자; 하나 이상의 자유 단부를 포함하는 핵산 분자, 자유 단부가 없는 핵산 분자(예를 들어, 원형); DNA를 포함하거나, RNA를 포함하거나 또는 둘 다 포함하는 핵산 분자; 및 본 분야에 공지된 폴리뉴클레오티드의 다른 변종들을 포함한다. 벡터의 한 가지 종류는 "플라스미드"인데, 이것은 원형 이중가닥 DNA 루프를 말하며, 여기에 예컨대 표준 분자 클로닝 기술에 의해서 추가의 DNA 세그먼트가 삽입될 수 있다. 벡터의 다른 종류는 바이러스 벡터로서, 바이러스-유래된 DNA 또는 RNA 서열이 바이러스에 봉입되는 벡터에 존재한다(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-관련 바이러스(AAV)). 바이러스 벡터는 또한 숙주 세포에 트랜스펙션되는 바이러스에 의해서 보유된 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다(예를 들어, 박테리아 복제 기원을 가진 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포에 도입시 숙주 세포의 게놈에 통합되며, 이로써 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본원에서 "발현 벡터"라고 언급된다. 재조합 DNA 기술에서 활용되는 통상적인 발현 벡터는 주로 플라스미드의 형태이다.

재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이것은 재조합 발현 벡터가 하나 이상의 조절 구성요소를 포함한다는 것을 의미하며, 하나 이상의 조절 구성요소는 발현에 사용될 숙주 세포에 기초하여 선택될 수 있고, 발현될 핵산 서열에 작동 가능하게 연결된다. 재조합 발현 벡터에서 "작동 가능하게 연결된"은 관심대상의 뉴클레오티드 서열이 그 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 구성요소(들)에 연결된 것을 의미한다(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입되었을 때는 숙주 세포에서). 재조합 및 클로닝 방법과 관련하여, US 2004-0171156 A1으로 2004년 9월 2일자 공개된 미국 특허출원 10/815,730을 참조하며, 이것의 내용은 그 전체가 여기 참고로 포함된다.

본 발명의 양태는 키메라 RNA 및 Cas9에 대한 바이시스트로닉 벡터에 관한 것이다. 키메라 RNA 및 Cas9에 대한 바이시스트로닉 발현 벡터가 바람직하다. 일반적으로 그리고 특히 이 구현예에서, Cas9는 바람직하게 CBh 프로모터에 의해서 유래된다. 키메라 RNA는 바람직하게 U6 프로모터에 의해서 유래된다. 이상적으로 이 두 개가 조합된다. 키메라 가이드 RNA는 통상적으로 20bp 가이드 서열(Ns)로 구성되며, 이것은 tracr 서열과 이어질 수 있다 (아래 가닥의 첫 번째 "U"에서 전사체의 끝까지 이어진다). tracr 서열은 나타낸 대로 다양한 위치에서 트렁케이트될 수 있다. 가이드 서열과 tracr 서열은 tracr-메이트 서열에 의해서 분리되는데, tracr-메이트 서열은 GUUUUAGAGCUA일 수 있다. 이것 다음에는 나타낸 대로 루프 서열 GAAA가 올 수 있다. 이들은 모두 바람직한 예들이다. 출원인은 서베이어 분석에 의해서 인간 EMX1 및 PVALB 유전자좌에서 Cas-9-매개 삽입결실부를 증명했다. ChiRNA는 "+n" 칭호에 의해서 나타내며, crRNA는 가이드 서열과 tracr 서열이 다른 전사체들로서 발현되는 혼성체 RNA를 말한다. 본 출원 전체에서, 키메라 RNA는 또한 단일 가이드, 또는 합성 가이드 RNA(sgRNA)라고 칭해질 수 있다. 이 루프는 바람직하게 GAAA이지만, 이 서열에만 제한되는 것은 아니며, 실제로 단지 4 bp 길이에만 제한되는 것도 아니다. 실제로, 헤어핀 구조에서 사용되는 바람직한 루프 형성 서열은 4 뉴클레오티드 길이이고, 가장 바람직하게 서열 GAAA를 가진다. 그러나, 더 길거나 짧은 루프 서열도 사용될 수 있으며, 대용 서열들도 사용될 수 있다. 서열은 바람직하게 뉴클레오티드 트리플(예를 들어, AAA), 및 추가의 뉴클레오티드(예를 들어, C 또는 G)를 포함한다. 루프 형성 서열의 예들은 CAAA 및 AAAG를 포함한다.

용어 "조절 구성요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(IRES), 및 다른 발현 제어 요소들(예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)을 포함하도록 의도된다. 이러한 조절 구성요소는, 예를 들어 Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)에 설명된다. 조절 구성요소는 많은 종류의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 것들과 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 것들을 포함한다(예를 들어, 조직-특이적 조절 서열). 조직-특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특정 장기(예를 들어, 간, 췌장)와 같은 관심 대상의 바람직한 조직, 또는 특정한 세포 타입(예를 들어, 림프구)에서 주로 발현을 지시할 수 있다. 또한, 조절 구성요소는 시간-의존적 방식으로, 예컨대 세포-주기 의존적 또는 발생 단계 의존적 방식으로 발현을 지시할 수 있으며, 이것은 조직 특이적이거나 세포-타입 특이적일 수도 있고 아닐 수도 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터(예를 들어, 1, 2, 3, 4, 5, 또는 그 이상의 pol I 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5, 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5, 또는 그 이상의 pol I 프로모터), 또는 이들의 조합을 포함한다. pol III 프로모터의 예들은, 제한은 아니지만, U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예들은, 제한은 아니지만, 레트로바이러스 Rous 육종 바이러스(RSV) LTR 프로모터(선택적으로 RSV 인핸서와 함께), 시토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서와 함께)[예를 들어, Boshart et al, Cell, 41:521-530 (1985) 참조], SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 또한, 용어 "조절 구성요소"는 인핸서 요소, 예컨대 WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 세그먼트(Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); SV40 인핸서; 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981)도 포함된다. 발현 벡터의 디자인은 형질전환될 숙주 세포의 선택, 원하는 발현 수준 등의 요인들에 따를 수 있다는 것이 당업자에 의해서 인정될 것이다. 벡터는 숙주 세포에 도입될 수 있고, 이로써 본원에 설명된 대로 핵산에 의해서 암호화된, 융합 단백질 또는 펩티드를 포함하는, 전사체, 단백질, 또는 펩티드가 생성될 수 있다(예를 들어, 군락화된 규칙적으로 산재된 짧은 팔린드롬형 반복부 (CRISPR) 전사체, 단백질, 효소, 이들의 돌연변이 형태, 이들의 융합 단백질 등). 조절 서열과 관련하여, 미국 특허출원 10/491,026을 참조하며, 이것의 내용은 그 전체가 여기 참고로 포함된다. 프로모터와 관련하여, PCT 공보 WO 2011/028929 및 미국 출원 12/511,940을 참조하며, 이들의 내용은 그 전체가 여기 참고로 포함된다.

벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어, 에스케리키아 콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포 또는 포유동물 세포에서 발현될 수 있다. 적절한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는 예를 들어, T7 프로모터 조절 서열 및 T7 중합효소를 사용하여 시험관내에서 전사되고 번역될 수 있다.

벡터는 원핵생물, 또는 원핵생물 세포에 도입되고, 그에서 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵 세포로 도입되거나 또는 진핵 세포로 도입되는 벡터의 생성에서 중간체 벡터(예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드 증폭)로서 벡터의 카피를 증폭시키기 위해서 사용될 수 있다. 일부 구현예에서, 원핵생물은 벡터의 카피를 증폭시키고, 하나 이상의 핵산을 발현하기 위해, 예를 들어, 숙주 세포 또는 숙주 유기체로의 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다. 원핵생물에서의 단백질의 발현은 자주 융합 또는 비-융합 단백질 중 어느 하나의 발현을 유도하는 구성성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 에스케리키아 콜라이에서 수행된다. 융합 벡터는 거기에 인코딩된 단백질로, 예를 들어, 재조합 단백질의 아미노 말단으로 수많은 아미노산을 부가한다. 이러한 융합 벡터는 다음과 같은 하나 이상의 목적을 제공할 수 있다: (i) 재조합 단백질의 발현의 증가; (ii) 재조합 단백질의 용해도의 증가; 및 (iii) 친화성 정제에서 리간드로 작용함으로써 재조합 단백질의 정제의 보조. 종종, 융합 발현 벡터에서, 단백질분해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부에 도입되어, 융합 단백질의 정제 이후에 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 효소 및 그들의 동족 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌[Smith and Johnson, 1988. Gene 67: 31-40]), pMAL(미국 매사추세츠주 비벌리 소재의 뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 pRIT5(미국 뉴저지주 피스카타웨이 소재의 파마시아(Pharmacia))를 포함하며, 이는 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A를 표적 재조합 단백질에 융합시킨다.

적절한 유도성 비-융합 에스케리키아 콜라이 발현 벡터의 예는 pTrc(문헌[Amrann et al., (1988) Gene 69:301-315]) 및 pET 11d(문헌[Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89])를 포함한다.

일부 구현예에서, 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비지애에서의 발현을 위한 벡터의 예에는 pYepSec1(문헌[Baldari, et al., 1987. EMBO J. 6: 229-234]), pMFa(문헌[Kuijan and Herskowitz, 1982. Cell 30: 933-943]), pJRY88(문헌[Schultz et al., 1987. Gene 54: 113-123]), pYES2(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션) 및 picZ(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션)가 포함된다.

일부 구현예에서, 벡터는 배큘로바이러스 발현 벡터를 사용하여 곤충 세포에서 단백질 발현을 유도한다. 배양된 곤충 세포(예를 들어, SF9 세포)에서 단백질의 발현에 이용가능한 배큘로바이러스 벡터는 pAc 시리즈(문헌[Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165]) 및 pVL 시리즈(문헌[Lucklow and Summers, 1989. Virology 170: 31-39])를 포함한다.

일부 구현예에서, 벡터는 포유동물 발현 벡터를 사용하여 포유동물 세포에서 하나 이상의 서열의 발현을 유도할 수 있다. 포유동물 발현 벡터의 예는 pCDM8(문헌[Seed, 1987. Nature 329: 840]) 및 pMT2PC(문헌[Kaufman, et al., 1987. EMBO J. 6: 187-195])를 포함한다. 포유동물 세포에서 사용되는 경우, 발현 벡터의 조절 기능은 통상적으로 하나 이상의 조절 요소에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 유인원 바이러스 40 및 본원에 개시되고 당업계에 공지되어 있는 기타의 것으로부터 유래된다. 원핵 및 진핵 세포 둘 모두를 위한 다른 적절한 발현 시스템에 대하여, 예를 들어, 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]의 16 및 17장을 참조한다.

일부 구현예에서, 재조합 포유동물 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다(예를 들어, 핵산을 발현하기 위하여 조직-특이적 조절 요소가 사용됨). 조직-특이적 조절 요소가 해당 분야에 공지되어 있다. 적절한 조직-특이적 프로모터의 비제한적인 예에는 알부민 프로모터(간-특이적; 문헌[Pinkert, et al., 1987. Genes Dev. 1: 268-277]), 림프-특이적 프로모터(문헌[Calame and Eaton, 1988. Adv. Immunol. 43: 235-275]), 특히, T 세포 수용체(문헌[Winoto and Baltimore, 1989. EMBO J. 8: 729-733]) 및 면역글로불린의 프로모터(문헌[Baneiji, et al., 1983. Cell 33: 729-740]; 문헌[Queen and Baltimore, 1983. Cell 33: 741-748]), 뉴런-특이적 프로모터(예를 들어, 신경섬유 프로모터; 문헌[Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477]), 췌장-특이적 프로모터(문헌[Edlund, et al., 1985. Science 230: 912-916]) 및 유선-특이적 프로모터(예를 들어, 유장(milk whey) 프로모터; 미국 특허 제4,873,316호 및 유럽 출원 공개 제264,166호)가 포함된다. 발생-조절 프로모터, 예를 들어, 쥣과 hox 프로모터(문헌[Kessel and Gruss, 1990. Science 249: 374-379]) 및 α-태아단백질 프로모터(문헌[Campes and Tilghman, 1989. Genes Dev. 3: 537-546])도 또한 포함된다. 원핵세포 및 진핵세포 벡터와 관련하여, 미국특허 6,750,059를 참조하며, 이것의 내용은 그 전체가 여기 참고로 포함된다. 본 발명의 다른 구현예들은 바이러스 벡터의 사용에 관한 것일 수 있으며, 이것과 관련해서는 미국 특허출원 13/092,085를 참조하고, 이것의 내용은 그 전체가 여기 참고로 포함된다. 조직-특이적 조절 구성요소는 본 분야에 공지이며, 이것과 관련하여 미국특허 7,776,321을 참조하고, 이것의 내용은 그 전체가 여기 참고로 포함된다.

일부 구현예에서, 조절 요소는 CRISPR 시스템의 하나 이상의 요소에 작동 가능하게 연결되어 CRISPR 시스템의 하나 이상의 요소의 발현을 유도한다. 일반적으로, SPIDR(스페이서 산재 직접 반복부)로도 공지되어 있는 CRISPR(클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부)은 통상 특정 박테리아 종에 특이적인 DNA 유전자좌의 과를 구성한다. CRISPR 유전자좌는 에스케리키아 콜라이에서 인식되는 별개의 부류의 산재된 짧은 서열 반복부(SSR) 및 관련 유전자를 포함한다(문헌[Ishino et al., J. Bacteriol., 169:5429-5433 [1987]]; 및 문헌[Nakata et al., J. Bacteriol., 171:3553-3556 [1989]]). 유사한 산재된 SSR이 할로페락스 메디테라네이(Haloferax mediterranei), 스트렙토코커스 피오게네스, 아나바에나(Anabaena) 및 마이코박테리움 튜베르큘로시스(Mycobacterium tuberculosis)에서 확인되었다(문헌[Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]]; 문헌[Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]]; 문헌[Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]]; 및 문헌[Mojica et al., Mol. Microbiol., 17:85-93 [1995]] 참조). CRISPR 유전자좌는 통상적으로 SRSR(규칙적으로 산재된 짧은 반복부(short regularly spaced repeats))로 명명된 반복부의 구조가 다른 SSR과 상이하다(문헌[Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]]; 및 문헌[Mojica et al., Mol. Microbiol., 36:244-246 [2000]]). 일반적으로, 반복부는 실질적으로 고정된 길이를 갖는 독특한 개재 서열에 의해 규칙적으로 산재된 클러스터에 존재하는 짧은 요소이다(상기 문헌[Mojica et al., [2000]]). 반복 서열이 균주들 간에 고도로 보존되어 있지만, 산재된 반복부의 수와 스페이서 영역의 서열은 통상적으로 균주마다 상이하다(문헌[van Embden et al., J. Bacteriol., 182:2393-2401 [2000]]). CRISPR 유전자좌는 아에로피룸(Aeropyrum), 피로바쿨룸(Pyrobaculum), 술폴로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로카르쿨라(Halocarcula), 메타노박테리움(Methanobacterium), 메타노코커스(Methanococcus), 메타노사르시나(Methanosarcina), 메타노피러스(Methanopyrus), 피로코커스(Pyrococcus), 피크로필러스(Picrophilus), 써모플라스마(Thermoplasma), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobacterium), 스트렙토마이세스(Streptomyces), 아퀴펙스(Aquifex), 포르피로모나스(Porphyromonas), 클로로비움(Chlorobium), 써머스(Thermus), 바실러스(Bacillus), 리스테리아(Listeria), 스태필로코커스(Staphylococcus), 클로스트리디움(Clostridium), 써모아나에로박터(Thermoanaerobacter), 마이코플라스마(Mycoplasma), 푸소박테리움(Fusobacterium), 아자쿠스(Azarcus), 크로모박테리움(Chromobacterium), 네이세리아(Neisseria), 니트로소모나스(Nitrosomonas), 데설포비브리오(Desulfovibrio), 게오박터(Geobacter), 믹소코커스(Myxococcus), 캄필로박터(Campylobacter), 볼리넬라(Wolinella), 아시네토박터(Acinetobacter), 에르위니아(Erwinia), 에스케리키아, 레지오넬라(Legionella), 메틸로코커스(Methylococcus), 파스퇴렐라(Pasteurella), 포토박테리움(Photobacterium), 살모넬라(Salmonella), 잔토모나스(Xanthomonas), 예르시니아(Yersinia), 트레포네마(Treponema) 및 써모토가(Thermotoga)를 포함하나 이들에 한정되지 않는 40개 초과의 원핵생물에서 확인되었다(예를 들어, 문헌[Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]]; 및 문헌[Mojica et al., [2005]] 참조).

일반적으로, "CRISPR 시스템"은 집합적으로 Cas 유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭) 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련("Cas") 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 본 발명의 구현예에서, 용어 가이드 서열과 가이드 RNA는 상호 교환하여 사용된다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피오게네스로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다.

일부 구현예에서, 직접 반복부는 다음의 기준을 일부 또는 전부 만족하는 반복 모티프를 검색함으로써 인실리코 방식으로 확인될 수 있다:

1. 타입 II CRISPR 유전자좌가 측접한 게놈 서열의 2 Kb 창에서 발견됨;

2. 20 내지 50 bp에 걸쳐 있음;

3. 20 내지 50 bp에 산재되어 있음.

일부 구현예에서, 이들 기준 중 두 가지가 사용될 수 있으며, 예를 들어 1과 2, 2와 3, 또는 1과 3이 사용될 수 있다. 일부 구현예에서, 세 가지 기준이 모두 사용될 수 있다.

일부 구현예에서, 후보 tracrRNA가 다음의 기준을 일부 또는 전부 만족하는 서열에 의해서 연속하여 예측될 수 있다:

1. 직접 반복부에 상동성인 서열(최대 18-bp 미스매치를 가진 Geneious에서 모티프 검색);

2. 전사 방향으로 예측된 Rho-독립적 전사 터미네이터의 존재;

3. tracr RNA와 직접 반복부 사이에 안정한 헤어핀 2차 구조.

일부 구현예에서, 키메라 합성 가이드 RNA (sgRNA) 디자인은 직접 반복부와 tracr RNA 사이에 적어도 12 bp의 듀플렉스 구조를 통합할 수 있다.

본 발명의 바람직한 구현예에서, CRISPR 시스템은 타입 II CRISPR 시스템이고, Cas 효소는 Cas9이며, 이것은 DNA 절단을 촉매한다. Streptococcus pyogenes로부터 유래된 Cas9 또는 어떤 밀접하게 관련된 Cas9에 의한 효소 작용은 20 뉴클레오티드의 가이드 서열과 혼성화하는 표적 부위 서열에 이중가닥 브레이크를 생성하며, 표적 부위 서열은 20 뉴클레오티드의 표적 서열 뒤에 프로토스페이서-인접 모티프(PAM) 서열(예들은 여기 설명된 대로 결정될 수 있는 NGG/NRG 또는 PAM을 포함한다)을 가진다. 부위-특이적 DNA 인식 및 절단에 대한 Cas9를 통한 CRISPR 활성은 가이드 서열, 가이드 서열과 부분적으로 혼성화하는 tracr 서열 및 PAM 서열에 의해서 한정된다. CRISPR 시스템의 더 이상의 양태들이 Karginov and Hannon, The CRISPR System: small RNA-guided defence in bacteria and archaea, Mole Cell 2010, January 15; 37(1):7에 설명된다.

Streptococcus pyogenes SF370으로부터의 타입 II CRISPR 유전자좌는 4 개 유전자 Cas9, Cas1, Cas2 및 Csn1의 클러스터뿐만 아니라 2개의 비-코딩 RNA 요소, tracr RNA 및 비-반복 서열의 짧은 스트레 (스페이서, 각각 약 30bp) 가 개재된 반복 서열(직접 반복부)의 특징적인 어레이를 함유한다. 이 시스템에서, 표적화된 DNA 이중가닥 브레이크 (DSB)가 순차적 4 단계에서 생성된다(도 2a). 먼저, 2 개의 비-코딩 RNA, 예비-crRNA 어레이 및 tracr RNA가 CRISPR 유전자좌로부터 전사된다. 두 번째로, tracr RNA가 예비-crRNA의 직접 반복부와 혼성화하고, 이것은 이어서 개별적 스페이서 서열을 함유하는 성숙한 crRNA로 가공된다. 세 번째로, 성숙한 crRNA:tracr RNA 복합체가 Cas9를 crRNA의 스페이서 영역과 프로토스페이서 DNA 간의 헤테로듀플렉스 형성을 통해 프로토스페이서와 상응하는 PAM으로 구성된 DNA 표적으로 보낸다. 마지막으로, Cas9가 PAM의 상류에서 표적 DNA의 절단을 매개하여 프로토스페이서 내에 DSB를 생성한다(도 2a). 도 2b는 코돈 최적화된 Cas9의 핵 위치를 증명한다. 정확한 전사 개시를 촉진하기 위해서, RNA 폴리머라제 III-기반 U6 프로모터가 tracr RNA의 발현을 유도하기 위해 선택되었다(도 2c). 유사하게, U6 프로모터-기반 작제물이 2 개의 직접 반복부 (DRs, 용어 "tracr-메이트 서열"에 의해서도 포함된다; 도 2c)가 측접된 단일 스페이서로 구성된 예비-crRNA 어레이를 발현하도록 개발되었다. 초기 스페이서는 대뇌피질의 발생시 핵심 유전자인 인간 EMX1 유전자좌(도 2c)에서 33-염기쌍 (bp) 표적 부위(Cas9의 NGG 인식 모티프를 만족하는 30-bp 프로토스페이서 더하기 3-bp CRISPR 모티프(PAM) 서열)를 표적화하도록 설계되었다.

통상적으로, 내인성 CRISPR 시스템의 맥락에서, CRISPR 복합체(표적 서열에 혼성화되고, 하나 이상의 Cas 단백질과 복합체화되는 가이드 서열을 포함)의 형성은 표적 서열 내의 또는 그 근처의(예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 개 이상의 염기쌍 내의) 하나 또는 두 가닥 모두의 절단을 야기한다. 이론에 구속되지 않으면서, 야생형 tracr 서열의 전부 또는 그의 일부(예를 들어, 야생형 tracr 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85 개 이상의 뉴클레오티드)를 포함하거나 그로 이루어질 수 있는 tracr 서열은 또한, 가이드 서열에 작동 가능하게 연결된 tracr 메이트 서열의 전부 또는 일부로의 tracr 서열의 적어도 일부분에 따른 혼성화에 의해서와 같이 CRISPR 복합체의 일부를 형성할 수 있다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소의 발현을 유도하는 하나 이상의 벡터는 CRISPR 시스템의 요소의 발현이 하나 이상의 표적 부위에서 CRISPR 복합체의 형성을 유도하도록 숙주 세포 내로 도입된다. 예를 들어, Cas 효소, tracr-메이트 서열에 연결된 가이드 서열 및 tracr 서열은 각각 개별 벡터 상의 개별 조절 요소에 작동 가능하게 연결될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현되는 요소 중 둘 이상은 단일의 벡터에서 조합될 수 있으며, 하나 이상의 추가의 벡터는 제1 벡터에 포함되지 않은 CRISPR 시스템의 임의의 성분을 제공한다. 단일의 벡터에서 조합되는 CRISPR 시스템 요소는 임의의 적절한 방향으로 배열될 수 있으며, 예를 들어, 하나의 요소는 제2 요소에 대하여 5'에(그의 "상류"에) 위치하거나 그에 대하여 3'에(그의 "하류"에) 위치한다. 하나의 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일한 가닥 또는 마주하는 가닥에 위치할 수 있으며, 동일하거나 반대 방향으로 방향화될 수 있다. 일부 구현예에서, 단일의 프로모터는 CRISPR 효소를 인코딩하는 전사물 및 하나 이상의 인트론 서열 내에(예를 들어, 각각이 상이한 인트론 내에, 2 개 이상이 적어도 하나의 인트론 내에 또는 전부가 단일의 인트론 내에) 매립된 가이드 서열, tracr 메이트 서열(선택적으로 가이드 서열에 작동 가능하게 연결), 및 tracr 서열 중 하나 이상의 발현을 유도한다. 일부 구현예에서, CRISPR 효소, 가이드 서열, tracr 메이트 서열 및 tracr 서열이 동일한 프로모터에 작동 가능하게 연결되고, 그로부터 발현된다.

일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예를 들어, 제한 엔도뉴클레아제 인식 서열("클로닝 부위"로도 지칭)을 포함한다. 일부 구현예에서, 하나 이상의 삽입 부위(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 삽입 부위)는 하나 이상의 벡터의 하나 이상의 서열 요소의 상류 및/또는 하류에 위치한다. 일부 구현예에서, 벡터는 tracr 메이트 서열의 상류에 있고, 선택적으로 tracr 메이트 서열에 작동 가능하게 연결된 조절 요소의 하류에 있는 삽입 부위를 포함하여, 삽입 부위로의 가이드 서열의 삽입 후에, 그리고 발현 시에, 가이드 서열이 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하게 한다. 일부 구현예에서, 벡터는 2 개 이상의 삽입 부위를 포함하며, 각각의 삽입 부위는 2 개의 tracr 메이트 서열 사이에 위치하여, 각 부위에서 가이드 서열의 삽입을 가능하게 한다. 이러한 배열에서, 2 개 이상의 가이드 서열은 단일의 가이드 서열의 2 개 이상의 카피, 2 개 이상의 상이한 가이드 서열 또는 이들의 조합을 포함할 수 있다. 다중의 상이한 가이드 서열이 사용되는 경우, 단일의 발현 작제물을 사용하여 세포 내의 다중의 상이한 상응하는 표적 서열에 CRISPR 활성을 표적화할 수 있다. 예를 들어, 단일의 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 개 이상의 가이드 서열을 포함할 수 있다. 일부 구현예에서, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 이러한 가이드-서열-함유 벡터가 제공될 수 있으며, 선택적으로 세포로 전달될 수 있다.

일부 구현예에서, 벡터는 CRISPR 효소, 예를 들어, Cas 단백질을 인코딩하는 효소-코딩 서열에 작동 가능하게 연결된 조절 요소를 포함한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 일부 구현예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다. 일부 구현예에서, CRISPR 효소는 표적 서열 내 및/또는 표적 서열의 상보물 내에서와 같은 표적 서열의 위치에서 1개 또는 2 개의 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소는 표적 서열의 처음 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기쌍에서 1 개 또는 2 개의 가닥의 절단을 유도한다. 일부 구현예에서, 벡터는 상응하는 야생형 효소에 대하여 돌연변이되어, 돌연변이된 CRISPR 효소에 표적 서열을 함유하는 표적 폴리뉴클레오티드의 1 개 또는 2 개 모두의 가닥의 절단 능력이 결여되게 한 CRISPR 효소를 인코딩한다. 예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9의 RuvC I 촉매 도메인 내에서의 아스파르트산에서 알라닌으로의 치환(D10A)은 Cas9를 두 가닥 모두를 절단하는 뉴클레아제에서 닉카아제(단일 가닥 절단)로 전환시킨다. Cas9가 닉카아제가 되게 하는 돌연변이의 다른 예는 제한 없이, H840A, N854A 및 N863A를 포함한다. 추가의 예로서, Cas9의 2개 이상의 촉매 도메인(RuvC I, RuvC II 및 RuvC III 또는 HNH 도메인)을 돌연변이시켜, 모든 DNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas9를 생성할 수 있다. 일부 구현예에서, D10A 돌연변이를 H840A, N854A 또는 N863A 돌연변이 중 하나 이상과 조합하여, 모든 DNA 절단 활성이 실질적으로 결여된 Cas9 효소를 생성한다. 일부 구현예에서, CRISPR 효소는 돌연변이된 효소의 DNA 절단 활성이 비-돌연변이 형태에 대하여 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하인 경우 모든 DNA 절단 활성이 실질적으로 결여된 것으로 여겨진다.

SpCas9의 RuvC I 촉매 도메인에서 아스파르테이트-알라닌 치환 (D10A)은 이 뉴클레아제를 닉카아제(SpCas9n)로 전환하기 위하여 유전자 조작되었고(예를 들어, 문헌[Sapranauskas et al., 2011, Nucleic Acis Research, 39: 9275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109:E2579] 참조), 이로써 흉터형성된 게놈 DNA가 고-충실도 상동성-지정 수선 (HDR)을 겪게 된다. 서베이어 분석이 SpCas9n이 EMX1 프로토스페이서 표적에 삽입결실부를 생성하지 않는다는 것을 확인했다. EMX1-표적화 키메라 crRNA (tracr RNA 구성성분도 가짐)와 SpCas9의 공-발현은 표적 부위에 삽입결실부를 생성했지만, SpCas9n과의 공-발현은 그렇지 않았다(n=3). 더욱이, 327 앰플리콘의 시퀀싱은 SpCas9n에 의해서 유도된 어떤 삽입결실부도 검출하지 않았다. HEK 293FT 세포와 키메라 RNA 표적화 EMX1, hSpCas9 또는 hSpCas9, 뿐만 아니라 프로토스페이서 근처에 한 쌍의 제한 부위(HindIII 및 NheI)를 도입하기 위한 HR 주형을 공-트랜스펙션함으로써 CRISPR-매개 HR을 시험하기 위해서 동일한 유전자좌가 선택되었다.

바람직한 오솔로그가 여기 설명된다. Cas 효소는 Cas9로 확인될 수 있으며, 이것은 타입 II CRISPR 시스템으로부터의 다중 뉴클레아제 도메인을 가진 가장 큰 뉴클레아제에 대한 상동성을 공유하는 일반적인 효소 부류를 말한다. 가장 바람직하게, Cas9 효소는 spCas9 또는 saCas9로부터의 것이거나, 또는 그로부터 유래된다. 출원인에 의하면, 유래된다는 것은 그 유래된 효소가 높은 정도의 서열 상동성을 가진다는 의미에서 야생형 효소에 상당히 기초하지만, 그것이 여기 설명된 대로 어떤 방식으로 돌연변이 (변형)되었다는 것을 의미한다.

명백히 다르지 않다면 용어 Cas 및 CRISPR 효소는 여기서 일반적으로 상호교환하여 사용된다는 것이 인정될 것이다. 상기 언급된 대로, 여기 사용된 잔기 넘버링은 대부분 Streptococcus pyogenes에서 타입 II CRISPR 유전자좌로부터의 Cas9 효소를 말한다. 그러나, 본 발명은 SpCas9, SaCa9, St1Cas9 등과 같은 다른 미생물 종들로부터의 더 많은 Cas9를 포함한다는 것이 인정될 것이다.

코돈 최적화된 서열의 예가, 이 예에서는 인간에 대해 최적화된 예가 여기 제공되며 (즉, 인간에서의 발현을 위해 최적화됨), SaCas9 인간 코돈 최적화된 서열을 참조한다. 이것이 바람직하지만, 다른 예들도 가능하며, 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 뇌와 같은 특정 장기에 대한 코돈 최적화가 공지되어 있다는 것이 인정될 것이다.

일부 구현예에서, CRISPR 효소를 암호화하는 효소 암호화 서열이 진핵 세포와 같은 특정 세포에서의 발현에 대해 코돈 최적화된다. 진핵 세포는, 제한은 아니지만, 인간, 마우스, 래트, 토끼, 개, 또는 비인간 포유류 또는 영장류와 같은 특정 유기체의 것들이거나, 또는 그로부터 유래될 수 있다. 일부 구현예에서, 사람이나 동물에 어떤 실질적인 의학적 유익 없이 그들을 고통스럽게 할 수 있는 인간의 생식계열 유전자 동일성을 변형하기 위한 과정 및/또는 동물의 유전자 동일성을 변형하기 위한 과정과 또한 이러한 과정으로부터 생긴 동물은 배제될 수 있다.

일반적으로, 코돈 최적화는 고유 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상의 코돈)을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노산 서열을 유지함으로써 대상 숙주 세포에서의 발현의 증진을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 나타낸다. 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 전령 RNA(mRNA)의 번역의 효율과 상호관련되며, 이는 차례로, 다른 것들 중에, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는 예를 들어, "코돈 사용 데이터베이스"(www.kazusa.orjp/codon/에서 이용가능함(2002년 7월 9일 방문))에서 용이하게 이용가능하며, 이들 표는 다수의 방식으로 적합하게 될 수 있다. 문헌[Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)]을 참조한다. 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘도 또한 이용가능하며, 예를 들어, 진 포르지(Gene Forge)(압타젠(Aptagen); 미국 펜실베니아주 야코부스)도 또한 이용가능하다. 일부 구현예에서, CRISPR 효소를 인코딩하는 효소 내의 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 상응한다.

일부 구현예에서, 벡터는 하나 이상의 핵 국소화 서열(NLS), 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 NLS를 포함하는 CRISPR 효소를 인코딩한다. 일부 구현예에서, CRISPR 효소는 아미노-말단에 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 NLS, 카르복시-말단에 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 NLS, 또는 이들의 조합(예를 들어, 아미노 말단에 하나 이상의 NLS 및 카르복시 말단에 하나 이상의 NLS)을 포함한다. 1 개 초과의 NLS가 존재하는 경우, 각각은 단일의 NLS가 1 개 초과의 카피로 존재하고/존재하거나 1 개 이상의 카피로 존재하는 하나 이상의 다른 NLS와 함께 존재할 수 있도록 다른 것들로부터 독립적으로 선택될 수 있다. 본 발명의 바람직한 구현예에서, CRISPR 효소는 최대 6개의 NLS를 포함한다. 일부 구현예에서, NLS는 NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 개 이상의 아미노산 내에 존재하는 경우 N- 또는 C-말단 근처에 있는 것으로 여겨진다. NLS의 비제한적인 예는 하기로부터 유래된 NLS 서열을 포함한다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK.

일반적으로, 하나 이상의 NLS는 진핵 세포의 핵에서 검출가능한 양의 CRISPR 효소의 축적을 유도하기에 충분한 세기의 것이다. 일반적으로, 핵 국소화 활성의 세기는 CRISPR 효소 내의 NLS의 수, 사용되는 특정 NLS(들) 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵에서의 축적의 검출은 임의의 적절한 기술에 의해 수행될 수 있다. 예를 들어, 검출가능한 마커는 예를 들어, 핵의 위치를 검출하기 위한 수단(예를 들어, 핵에 특이적인 염색제, 예를 들어, DAPI)과 함께 세포 내의 위치가 가시화될 수 있도록 CRISPR 효소에 융합될 수 있다. 또한, 세포 핵을 세포로부터 분리할 수 있으며, 그 다음, 그의 내용물을 단백질을 검출하기 위한 임의의 적절한 과정, 예를 들어, 면역조직화학, 웨스턴 블롯 또는 효소 활성 검정에 의해 분석할 수 있다. 또한, 핵에서의 축적은 예를 들어, CRISPR 효소 또는 복합체에 노출되지 않거나, 하나 이상의 NLS가 결여된 CRISPR 효소에 노출된 대조군과 비교하여, 간접적으로, 예를 들어, CRISPR 복합체 형성의 영향에 대한 검정(예를 들어, 표적 서열에서의 DNA 절단 또는 돌연변이에 대한 검정, 또는 CRISPR 복합체 형성 및/또는 CRISPR 효소 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 검정)에 의해 결정될 수 있다.

일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인(Novoalign)(노보크라프트 테크놀로지즈(Novocraft Technologies)(www.novocraft.com에서 이용가능함), ELAND(일루미나(Illumina), 미국 캘리포니아주 샌 디에고), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드 길이이다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적절한 검정에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은 예를 들어, CRISPR 서열의 성분을 인코딩하는 벡터로의 트랜스펙션 후에, 예를 들어, 본원에 기술된 바와 같은 서베이어 검정에 의한 표적 서열 내의 우선적인 절단의 평가에 의해서와 같이, 상응하는 표적 서열을 갖는 숙주 세포로 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다. 다른 검정이 가능하며, 당업자에게 떠오를 것이다.

가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다. 예시적인 표적 서열은 표적 게놈에서 독특한 것들을 포함한다. 예를 들어, 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGG(N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGG(N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 써모필러스 CRISPR1 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXXAGAAW의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXXAGAAW의 스트렙토코커스 써모필러스 CRISPR1 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGGXG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGGXG(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGGXG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGGXG(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 이들 서열 각각에서, "M"은 A, G, T 또는 C일 수 있으며, 서열을 독특한 것으로 확인하는데 고려될 필요는 없다.

일부 구현예에서, 가이드 서열은 가이드 서열 내의 2차 구조의 정도를 감소시키기 위해 선택된다. 일부 구현예에서, 가이드 서열의 뉴클레오티드의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1%, 또는 그 이하, 또는 미만이 최적으로 폴딩되었을 때 자기-상보성 염기쌍을 만드는데 참여한다. 최적 폴딩은 어떤 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해서 결정될 수 있다. 일부 프로그램은 최소 깁스 자유 에너지를 계산하는 것에 기초한다. 한 이러한 알고리즘의 예는 mFold로서, Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148)에서 설명되었다. 폴딩 알고리즘의 다른 예는 온라인 웹서버인 RNAfold인데, 이것은 도심 구조 예측 알고리즘을 사용하며, University of Vienna의 Institute for Theoretical Chemistry에서 개발되었다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24; 및 PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조).

일반적으로, tracr 메이트 서열은 다음 중 하나 이상을 증진시키기에 충분한, tracr 서열과의 상보성을 갖는 임의의 서열을 포함한다: (1) 상응하는 tracr 서열을 함유하는 세포에서 tracr 메이트 서열이 측부 배치된 가이드 서열의 절제; 및 (2) 표적 서열에서의 CRISPR 복합체의 형성으로서, CRISPR 복합체가 tracr 서열에 혼성화되는 tracr 메이트 서열을 포함하는 표적 서열에서의 CRISPR 복합체의 형성. 일반적으로, 상보성의 정도는 2 개의 서열 중 더 짧은 서열의 길이에 따른 tracr 메이트 서열과 tracr 서열의 최적의 정렬을 참조한다. 최적의 정렬은 임의의 적절한 정렬 알고리즘에 의해 결정될 수 있으며, tracr 서열 또는 tracr 메이트 서열 중 어느 하나에서의 자가-상보성과 같이 2차 구조를 추가로 설명할 수 있다. 일부 구현예에서, 2개 중 보다 짧은 것의 길이를 따른 tracr 서열과 tracr 메이트 서열 간의 상보성의 정도는 최적으로 정렬되는 경우, 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 이상이다. 일부 구현예에서, tracr 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, tracr 서열 및 tracr 메이트 서열은 2 개 간의 혼성화가 헤어핀과 같은 2차 구조를 갖는 전사물을 생성하도록 단일의 전사물 내에 함유된다. 본 발명의 일 구현예에서, 전사물 또는 전사된 폴리뉴클레오티드 서열은 적어도 2 개 이상의 헤어핀을 갖는다. 바람직한 구현예에서, 전사물은 2, 3, 4 또는 5 개의 헤어핀을 갖는다. 본 발명의 추가의 구현예에서, 전사물은 최대 5 개의 헤어핀을 갖는다. 헤어핀 구조에서, 루프의 상류 및 마지막 "N"의 5' 서열의 부분은 tracr 메이트 서열에 상응하며, 루프의 3' 서열의 부분은 tracr 서열에 상응한다. 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함하는 단일의 폴리뉴클레오티드의 추가의 비제한적인 예는 하기와 같으며(5'에서 3'으로 표기), 여기서, "N"은 가이드 서열의 염기를 나타내고, 소문자의 제1 블록은 tracr 메이트 서열을 나타내며, 소문자의 제2 블록은 tracr 서열을 나타내고, 마지막 폴리-T 서열은 전사 종결자를 나타낸다: (1) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (2) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (3) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT; (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT; (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT; 및 (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT. 일부 구현예에서, 서열 (1) 내지 (3)은 스트렙토코커스 써모필러스 CRISPR1 유래의 Cas9와 함께 사용된다. 일부 구현예에서, 서열 (4) 내지 (6)은 스트렙토코커스 피오게네스 유래의 Cas9와 함께 사용된다. 일부 구현예에서, tracr 서열은 tracr 메이트 서열을 포함하는 전사물과 별개의 전사물이다.

일부 구현예에서, 재조합 주형도 또한 제공된다. 재조합 주형은 개별 벡터에 포함되거나, 개별 폴리뉴클레오티드로서 제공되는 본원에 기술된 바와 같은 다른 벡터의 성분일 수 있다. 일부 구현예에서, 재조합 주형은 상동성 재조합에서, 예를 들어, CRISPR 복합체의 일부로서 CRISPR 효소에 의해 닉이 생기거나 절단되는 표적 서열 내 또는 그 근처에서 주형으로 소용되도록 설계된다. 주형 폴리뉴클레오티드는 임의의 적절한 길이, 예를 들어, 약 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 개 이상의 뉴클레오티드 길이의 것일 수 있다. 일부 구현예에서, 주형 폴리뉴클레오티드는 표적 서열을 포함하는 폴리뉴클레오티드의 부분에 상보적이다. 최적으로 정렬되는 경우, 주형 폴리뉴클레오티드는 표적 서열의 하나 이상의 뉴클레오티드(예를 들어, 약 1, 5, 10, 15, 20 개 이상의 뉴클레오티드)와 중첩할 수 있다. 일부 구현예에서, 주형 서열 및 표적 서열을 포함하는 폴리뉴클레오티드가 최적으로 정렬되는 경우, 주형 폴리뉴클레오티드의 가장 가까운 뉴클레오티드는 표적 서열로부터 약 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 개 이상의 뉴클레오티드 이내이다.

일부 구현예에서, CRISPR 효소는 하나 이상의 이종 단백질 도메인(예를 들어, CRISPR 효소에 더하여 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 도메인)을 포함하는 융합 단백질의 부분이다. CRISPR 효소 융합 단백질은 임의의 추가의 단백질 서열 및 선택적으로 임의의 2 개 도메인 사이의 링커 서열을 포함할 수 있다. CRISPR 효소에 융합될 수 있는 단백질 도메인의 예는 비제한적으로 에피토프 태그, 리포터 유전자 서열 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는 글루타티온-S-트랜스퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나 이들에 한정되지 않는다. CRISPR 효소는 DNA 분자에 결합하거나, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합체, GAL4 DNA 결합 도메인 융합체 및 단순 포진 바이러스(HSV) BP16 단백질 융합체를 포함하나 이들에 한정되지 않는 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 인코딩하는 유전자 서열에 융합될 수 있다. CRISPR 효소를 포함하는 융합 단백질의 부분을 형성할 수 있는 추가의 도메인은 본원에 참조로 포함되는 US20110059502호에 기술되어 있다. 일부 구현예에서, 태그가 부착된 CRISPR 효소를 사용하여 표적 서열의 위치를 확인한다.

일부 구현예에서, CRISPR 효소는 유도성 시스템의 구성성분을 형성할 수 있다. 이 시스템의 유도성 성질은 에너지 형태를 사용하여 유전자 편집이나 유전자 발현의 시공간적 제어를 허용할 것이다. 에너지 형태는, 제한은 아니지만, 전자기선, 소리 에너지, 화학 에너지 및 열 에너지를 포함할 수 있다. 유도성 시스템의 예들은 테트라사이클린 유도성 프로모터(Tet-On 또는 Tet-Off), 소 분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등) 또는 광 유도성 시스템(피토크롬, LOV 도메인 또는 크립토크롬)을 포함한다. 일 구현예에서, CRISPR 효소는 서열-특이적 방식으로 전사 활성에 변화를 지시할 수 있는 광 유도성 전사 이펙터(LITE)의 일부일 수 있다. 광의 구성성분은 CRISPR 효소, 광-반응성 시토크롬 헤테로다이머(예를 들어, Arabidopsis thaliana로부터), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질의 추가의 예들과 이들의 사용을 위한 방법은 US 61/736465 및 US 61/721,283에 제공되며, 이들은 그 전체가 여기 참고로 포함된다.

일부 양태에서, 본 발명은 하나 이상의 폴리뉴클레오티드, 예를 들어, 본원에 기술된 바와 같은 하나 이상의 벡터, 그의 하나 이상의 전사물 및/또는 그로부터 전사된 하나의 단백질 또는 단백질들을 숙주 세포에 전달하는 단계를 포함한다. 일부 양태에서, 본 발명은 이러한 방법에 의해 생성된 세포, 및 이러한 세포를 포함하거나 이로부터 생성된 동물을 추가로 제공한다. 일부 구현예에서, 가이드 서열과 조합된(선택적으로 복합체화된) CRISPR 효소는 세포로 전달된다. 통상의 바이러스 및 비-바이러스 기반의 유전자 운반 방법을 사용하여 핵산을 포유동물 세포 또는 표적 조직에 도입할 수 있다. 이러한 방법을 사용하여 CRISPR 시스템의 성분을 인코딩하는 핵산을 배양물 중의 또는 숙주 유기체 내의 세포로 투여할 수 있다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들어, 본원에 기술된 벡터의 전사물), 네이키드(naked) 핵산 및 전달 비히클, 예를 들어, 리포좀과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이는 세포로의 전달 후에 에피솜 또는 통합된 게놈을 갖는다. 유전자 치료법 절차의 개요에 대해서는 문헌[Anderson, Science 256:808-813 (1992)]; 문헌[Nabel & Felgner, TIBTECH 11:211-217 (1993)]; 문헌[Mitani & Caskey, TIBTECH 11:162-166 (1993)]; 문헌[Dillon, TIBTECH 11:167-175 (1993)]; 문헌[Miller, Nature 357:455-460 (1992)]; 문헌[Van Brunt, Biotechnology 6(10):1149-1154 (1988)]; 문헌[Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995)]; 문헌[Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995)]; 문헌[Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Boehm (eds) (1995)]; 및 문헌[Yu et al., Gene Therapy 1:13-26 (1994)]을 참조한다.

핵산의 비-바이러스 전달 방법은 리포펙션(lipofection), 미세주입, 비올리스틱스(biolistics), 비로좀(virosome), 리포좀, 면역리포좀, 다가양이온 또는 지질:핵산 컨쥬게이트, 네이키드 DNA, 인공 비리온 및 작용제-증진된 DNA의 흡수를 포함한다. 리포펙션은 예를 들어, 미국 특허 제5,049,386호, 제4,946,787호; 및 제4,897,355호에 기술되어 있으며, 리포펙션 시약은 상업적으로 시판된다(예를 들어, 트랜스펙탐(Transfectam)™ 및 리포펙틴(Lipofectin)™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적절한 양이온 및 중성 지질은 펠그너(Felgner)의 WO 91/17424호; WO 91/16024호의 것들을 포함한다. 전달은 세포로(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직으로(예를 들어, 생체내 투여) 이루어질 수 있다.

표적화된 리포좀, 예를 들어, 면역지질 복합체를 포함하는 지질:핵산 복합체의 제제는 당업자에게 널리 공지되어 있다(예를 들어, 문헌[Crystal, Science 270:404-410 (1995)]; 문헌[Blaese et al., Cancer Gene Ther. 2:291-297 (1995)]; 문헌[Behr et al., Bioconjugate Chem. 5:382-389 (1994)]; 문헌[Remy et al., Bioconjugate Chem. 5:647-654 (1994)]; 문헌[Gao et al., Gene Therapy 2:710-722 (1995)]; 문헌[Ahmad et al., Cancer Res. 52:4817-4820 (1992)]; 미국 특허 제4,186,183호, 제4,217,344호, 제4,235,871호, 제4,261,975호, 제4,485,054호, 제4,501,728호, 제4,774,085호, 제4,837,028호 및 제4,946,787호 참조).

핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반의 시스템의 사용은 바이러스를 체내의 특정 세포에 표적화하고, 바이러스 페이로드(payload)를 핵에 수송하기 위한 고도로 발달된 과정을 이용한다. 바이러스 벡터를 환자에게 직접 투여하거나(생체내), 그들을 사용하여 시험관내에서 세포를 처리할 수 있으며, 변형된 세포가 선택적으로 환자에게 투여될 수 있다(생체외). 통상의 바이러스 기반의 시스템에는 유전자 운반을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 단순 포진 바이러스 벡터가 포함될 수 있다. 레트로바이러스, 렌티바이러스 및 아데노-관련 바이러스 유전자 운반 방법을 사용하여 숙주 게놈으로의 통합이 가능하며, 종종 삽입된 트랜스유전자의 장기간 발현을 야기한다. 또한, 높은 형질도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.

레트로바이러스의 편향성은 외래 외피 단백질을 혼입시키고, 잠재적 표적 집단의 표적 세포를 증식시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분열 세포에 형질도입할 수 있거나, 그를 감염시킬 수 있으며, 통상적으로 높은 바이러스 역가를 생성하는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 운반 시스템의 선택은 표적 조직에 따라 달라질 것이다. 레트로바이러스 벡터는 최대 6 내지 10 kb의 외래 서열에 대하여 패키징 능력을 갖는 시스-작용성 긴 말단 반복부로 이루어진다. 최소 시스-작용성 LTR은 벡터의 복제 및 패키징에 충분하며, 이는 이어서, 치료적 유전자를 표적 세포로 통합시켜, 영구적인 트랜스유전자 발현을 제공하는데 사용된다. 널리 사용되는 레트로바이러스 벡터는 쥣과 백혈병 바이러스(MuLV), 긴팔원숭이 유인원 백혈병 바이러스(GaLV), 원숭이 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV) 및 그들의 조합에 기초한 것들을 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739 (1992)]; 문헌[Johann et al., J. Virol. 66:1635-1640 (1992)]; 문헌[Sommnerfelt et al., Virol. 176:58-59 (1990)]; 문헌[Wilson et al., J. Virol. 63:2374-2378 (1989)]; 문헌[Miller et al., J. Virol. 65:2220-2224 (1991)]; PCT/US94/05700호 참조).

일시적 발현이 바람직한 출원에서, 아데노바이러스 기반의 시스템이 사용될 수 있다. 아데노바이러스 기반의 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있으며, 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 발현 수준이 수득된다. 이러한 벡터는 비교적 간단한 시스템에서 대량 생성될 수 있다.

예를 들어, 핵산 및 펩티드의 시험관내 생성에서, 그리고 생체내 및 생체외 유전자 치료법 절차를 위하여, 아데노-관련 바이러스("AAV") 벡터를 사용하여, 표적 핵산으로 세포를 형질도입시킬 수도 있다(예를 들어, 문헌[West et al., Virology 160:38-47 (1987)]; 미국 특허 제4,797,368호; WO 93/24641호; 문헌[Kotin, Human Gene Therapy 5:793-801 (1994)]; 문헌[Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참조). 재조합 AAV 벡터의 작제는 미국 특허 제5,173,414호; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985)]; 문헌[Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984)]; 문헌[Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)]; 및 문헌[Samulski et al., J. Virol. 63:03822-3828 (1989)]을 포함하는 수많은 간행물에 기술되어 있다.

패키징 세포는 통상적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하기 위해 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에 사용되는 바이러스 벡터는 통상적으로 생산자에 의해 핵산 벡터를 바이러스 입자로 패키징하는 세포주가 생성된다. 벡터는 통상적으로 패키징 및 이후의 숙주로의 통합에 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트로 대체된다. 소실 바이러스 기능은 통상적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에 사용되는 AAV 벡터는 통상적으로 패키징 및 숙주 게놈으로의 통합에 필요한 AAV 게놈 유래의 ITR 서열만을 갖는다. 바이러스 DNA는 다른 AAV 유전자, 즉, rep 및 cap을 인코딩하나 ITR 서열이 결여된 헬퍼 플라스미드를 함유하는 세포주에서 패키징된다. 또한, 세포주는 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 충분한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은 예를 들어, 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다.

따라서, AAV가 형질도입 벡터로서 사용하기 위한 이상적인 후보로 고려된다. 이러한 AAV 형질도입 벡터는 트랜스로 제공된 아데노바이러스 또는 헤르페스바이러스 또는 폭스바이러스(예를 들어, 백시니아바이러스) 헬퍼 기능의 존재하에 복제할 수 있는 충분한 시스-작용 기능을 포함할 수 있다. 재조합 AAV (rAAV)는 다양한 계통의 세포에 외인성 유전자를 전달하기 위해서 사용될 수 있다. 이들 벡터에서, AAV cap 및/또는 rep 유전자가 바이러스 게놈으로부터 결실되고 선택된 DNA 세그먼트로 대체된다. 현재 AAV 벡터는 최대 4300 염기의 삽입된 DNA를 수용할 수 있다.

rAAV를 생성하기 위한 많은 방식이 있으며, 본 발명은 rAAV 및 rAAV의 제조 방법을 제공한다. 예를 들어, 원하는 바이러스 작제물을 함유하거나 필수적으로 구성된 플라스미드(들)이 AAV-감염된 세포에 트랜스펙션된다. 게다가, 제2 또는 추가의 헬퍼 플라스미드가 이들 세포에 공-트랜스펙션되며, 이로써 재조합 바이러스 작제물의 복제 및 패키징에 의무적인 AAV rep 및/또는 cap 유전자를 제공한다. 이들 조건에서, AAV의 rep 및/또는 cap 단백질은 rAAV 작제물의 복제 및 패키징을 자극하기 위하여 트랜스로 작용한다. 트랜스펙션 후 2-3일 뒤에 rAAV가 수거된다. 전통적으로, rAAV는 아데노바이러스와 함께 세포로부터 수거된다. 다음에, 오염된 아데노바이러스가 열처리에 의해서 비활성화된다. 본 발명에서, rAAV는 세포 자체로부터 수거되지 않고 세포 상청액으로부터 수거되는 것이 유익하다. 따라서, 초기 양태에서, 본 발명은 rAAV의 제조를 위해 제공되며, 전술한 것에 더하여, rAAV는 발현을 위한 DNA를 포함하는 외인성 DNA, 및 헬퍼 바이러스(예를 들어, 아데노바이러스, 헤르페스바이러스, 폭스바이러스, 예컨대 백시니아바이러스)를 함유하는 rAAV로 감수성 세포를 감염시키는 단계 (여기서 rAAV는 cap 및/또는 rep 기능을 결여하며, 헬퍼 바이러스(예를 들어, 아데노바이러스, 헤르페스바이러스, 폭스바이러스, 예컨대 백시니아바이러스)가 rAAV가 결여한 cap 및/또는 rev 기능을 제공한다); 또는 발현을 위한 DNA를 포함하는 외인성 DNA를 함유하는 rAAV로 감수성 세포를 감염시키고(여기서 재조합체는 cap 및/또는 rep 기능을 결여한다), 상기 세포를 rAAV가 결여한 cap 및/또는 rep 기능을 공급하는 플라스미드로 트랜스펙션하는 단계; 또는 발현을 위한 DNA를 포함하는 외인성 DNA를 함유하는 rAAV로 감수성 세포를 감염시키는 단계 (여기서 재조합체는 cap 및/또는 rep 기능을 결여하고, 상기 세포가 재조합체가 결여한 cap 및/또는 rep 기능을 공급한다); 또는 cap 및/또는 rep 기능을 결여한 AAV와 재조합체에 외인성 DNA를 삽입하기 위한 플라스미드로 감수성 세포를 트랜스펙션하는 단계를 포함하거나 필수적으로 구성되는 방법에 의해서 제조될 수 있으며, 이로써 외인성 DNA가 재조합에 의해서 발현되고, rep 및/또는 cap 기능을 공급함으로써 트랜스펙션의 결과 cap 및/또는 rep 기능을 결여한 발현을 위한 DNA를 포함하는 외인성 DNA를 함유하는 rAAV가 생성된다.

rAAV는 여기 설명된 AAV로부터의 것일 수 있으며, 유익하게는 AAV1, AAV2, AAV5 또는 이들의 어떤 조합을 포함할 수 있는 하이브리드 또는 캡시드를 가진 rAAV1, rAAV2, AAV5 또는 rAAV일 수 있다. rAAV에 의해서 표적화될 세포와 관련하여 rAAV들 중 AAV를 선택할 수 있는데, 예를 들어 뇌 또는 뉴런 세포를 표적화하기 위해 AAV 혈청형 1, 2, 5 또는 하이브리드 또는 캡시드 AAV1, AAV2, AAV5 또는 이들의 어떤 조합을 선택할 수 있고, 심장 조직을 표적화하기 위해 AAV4를 선택할 수 있다.

293 세포에 더해서, 본 발명의 실시에서 사용될 수 있는 다른 세포 및 이들 세포에 대한 특정 AAV 혈청형의 시험관내 상대적 감염성은 다음과 같다(Grimm, D. et al, J. Virol. 82: 5887-5911 (2008) 참조):

본 발명은 CRISPR (군락화된 규칙적으로 산재된 짧은 팔린드롬형 반복부) 시스템을 암호화하는 외인성 핵산 분자를 함유하거나 필수적으로 구성되는 rAAV를 제공하며, 예를 들어 복수의 카세트는 프로모터, CRISPR-관련(Cas) 단백질(뇌하수체 뉴클레아제 또는 헬리카아제 단백질), 예를 들어 Cas9를 암호화하는 핵산 분자 및 터미테이터를 포함하거나 필수적으로 구성되는 제1 카세트를 포함하고, 2 이상의, 유익하게는 벡터의 패키징 크기 제한 이하의, 예를 들어 총(제1 카세트를 포함하여) 5 개의 카세트가 프로모터, 가이드 RNA (gRNA) 및 터미네이터를 포함하거나 필수적으로 구성되고(예를 들어, 각 카세트는 프로모터-gRNA1-터미네이터, 프로모터-gRNA2-터미네이터 ... 프로모터-gRNA(N)-터미네이터로 도식적으로 표현된다(여기서 N은 삽입될 수 있는 수로서, 벡터의 패키징 크기 제한의 상한이다), 또는 2 이상의 개별 rAAV가 각각 CRISPR 시스템의 하나 이상의 카세트를 함유하는데, 예를 들어 제1 rAAV는 프로모터, Cas, 예를 들어 Cas9를 암호화하는 핵산 분자 및 터미테이터를 포함하거나 필수적으로 구성되는 제1 카세트를 함유하고, 제2 rAAV는 프로모터, 가이드 RNA (gRNA)를 암호화하는 핵산 분자 및 터미네이터를 포함하거나 필수적으로 구성되는 복수의, 4 개의 카세트를 함유한다(예를 들어, 각 카세트는 프로모터-gRNA1-터미네이터, 프로모터-gRNA2-터미네이터 ... 프로모터-gRNA(N)-터미네이터로 도식적으로 표현된다(여기서 N은 삽입될 수 있는 수로서, 벡터의 패키징 크기 제한의 상한이다). rAAV가 DNA 바이러스이기 때문에, AAV 또는 rAAV와 관련하여 여기서 논의된 핵산 분자는 DNA인 것이 유익하다. 프로모터는 일부 구현예에서 인간 시냅신 I 프로모터(hSyn)인 것이 유익하다.

세포로의 핵산의 전달을 위한 추가의 방법은 당업자에게 공지되어 있다. 예를 들어, 본원에 참조로 포함되는 US20030087817호를 참조한다.

일부 구현예에서, 숙주 세포는 본원에 기술된 하나 이상의 벡터로 일시적으로 또는 비-일시적으로 트랜스펙션된다. 일부 구현예에서, 세포는 그것이 대상체에서 천연적으로 발생한 대로 트랜스펙션된다. 일부 구현예에서, 트랜스펙션되는 세포는 대상체로부터 취해진다. 일부 구현예에서, 세포는 세포주와 같이 대상체로부터 취해진 세포로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 공지되어 있다. 세포주의 예는 C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피, BALB/3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR 및 그의 트랜스제닉 변이형을 포함하나 이들에 한정되지 않는다. 세포주는 당업자에게 공지되어 있는 다양한 공급원으로부터 입수가능하다(예를 들어, 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; ATCC)(미국 버지니아주 머내서스 소재) 참조). 일부 구현예에서, 본원에 기술된 하나 이상의 벡터로 트랜스펙션된 세포를 사용하여 하나 이상의 벡터-유래 서열을 포함하는 신규 세포주를 확립한다. 일부 구현예에서, 본원에 기술된 바와 같은 CRISPR 시스템의 성분이 일시적으로 트랜스펙션되고(예를 들어, 하나 이상의 벡터의 일시적 트랜스펙션 또는 RNA로의 트랜스펙션에 의해), CRISPR 복합체의 활성을 통해 변형된 세포를 사용하여, 변형을 포함하나 임의의 다른 외인성 서열이 결여된 세포를 포함하는 신규 세포주를 확립한다. 일부 구현예에서, 일시적으로 또는 비-일시적으로 본원에 기술된 하나 이상의 벡터로 트랜스펙션된 세포 또는 이러한 세포로부터 유래된 세포주가 하나 이상의 시험 화합물의 평가에서 사용된다.

일부 구현예에서, 본원에 기술된 하나 이상의 벡터를 사용하여 비-인간 트랜스제닉 동물 또는 트랜스제닉 식물을 생성한다. 일부 구현예에서, 트랜스제닉 동물은 포유동물, 예를 들어, 마우스, 랫트 또는 토끼이다. 트랜스제닉 식물 및 동물의 생성 방법은 당업계에 공지되어 있으며, 일반적으로 본원에 기술된 바와 같은 세포 트랜스펙션 방법으로 시작한다.

최근 농작물 유전체학이 발달함에 따라서, CRISPR-Cas 시스템이 사용되어 효율적이고 비용 효과적인 유전자 편집 및 조작을 수행할 수 있는 능력은, 생산의 개선 및 유전 형질의 향상을 위해 게놈들이 형질 전환되도록 만드는 단일 진행 및 다중 진행 유전자 조작 결과의 신속한 비교 및 기술의 선택을 가능하게 할 것이다. 이와 같은 관점에서, 각각의 내용들과 개시 사항 전부가 본원에 전체로서 참고문헌으로 포함되어 있는 미국 특허들 및 특허공보들[미국 특허 제6,603,061호 " Agrobacterium-Mediated Plant Transformation Method"; 제7,868,149호 "Plant Genome Sequences and Uses Thereof" 및 미국 특허 출원 US 2009/0100536호 "Transgenic Plants with Enhanced Agronomic Traits"]이 참고된다. 본 발명이 실시됨에 있어서, 문헌[Morrell et al "Crop genomics: advances and applications" Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용과 이에 개시된 사항도 그 전체가 본원에 참고문헌으로 포함되어 있다. 본 발명의 유리한 구현예에서, CRISPR/Cas9 시스템은 미세조류를 조작하는데 사용된다. 상기 CRISPR-Cas 시스템은, 전체가 본원에 참고문헌으로 포함되어 있는 문헌으로서, 조작된 CRISPR/Cas 복합체들은 쌍떡잎 식물과 외떡잎 식물 둘 다에 있어서 표적화된 게놈 변형들을 달성하기 위해 식물 게놈의 특정 위치들에 이중 가닥 파괴 부들을 생성하는데 사용될 수 있음이 입증되어 있는 문헌["Efficient Genome Editing in Plants using a CRISPR/Cas System", Feng et al. Cell Res. 2013 Aug 20. doi: 10.1038/cr.2013.114(인쇄전 전자 출판됨)]에 개시된 식물 시스템에서 사용될 수 있다. 그러므로 달리 명확히 기술되어 있지 않은 한, 본원에 있어서 동물 세포들에 대한 참고문헌의 개시 사항도 필요한 부분만 약간 수정되어 식물 세포들에 적용될 수 있다.

일 양태에서, 본 발명은 진핵 세포에서 표적 폴리뉴클레오티드를 변형하는 방법을 제공하며, 이것은 생체내, 생체외 또는 시험관내 방식으로 이루어질 수 있다. 일부 구현예에서, 방법은 인간 또는 비인간 동물, 또는 식물(미세조류를 포함함)로부터 세포 또는 세포 집단을 샘플링하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외 방식으로 어떤 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물, 또는 식물(미세조류를 포함함)에 재도입될 수 있다. 재도입된 세포의 경우, 세포는 줄기세포인 것이 특히 바람직하다.

일부 구현예에서, 방법은 상기 표적 폴리뉴클레오티드의 절단을 행하기 위하여 CRISPR 복합체를 표적 폴리뉴클레오티드와 결합시키는 단계를 포함하며, 이로써 표적 폴리뉴클레오티드가 변형되고, 여기서 CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열과 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함하며, 상기 가이드 서열은 tracr 메이트 서열과 결합되고, 이어서 tracr 서열과 혼성화된다.

일 양태에서, 본 발명은 진핵 세포에서 폴리뉴클레오티드의 발현을 변형하는 방법을 제공한다. 일부 구현예에서, 방법은 결합이 상기 폴리뉴클레오티드의 증가된 또는 감소된 발현을 가져오도록 CRISPR 복합체를 폴리뉴클레오티드와 결합시키는 단계를 포함하며, 여기서 CRISPR 복합체는 상기 폴리뉴클레오티드 내의 표적 서열과 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열과 결합되고, 이어서 tracr 서열과 혼성화된다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형하는 방법에 대해 상기 설명된 것과 같이 적용된다. 실제로 이들 샘플링, 배양 및 재도입 옵션은 본 발명의 전 양태에 적용된다.

실제로, 본 발명의 어떤 양태에서, CRISPR 복합체는 표적 서열과 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함하며, 여기서 상기 가이드 서열은 tracr 메이트 서열과 결합되고, 이어서 tracr 서열과 혼성화될 수 있다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형하는 방법에 대해 상기 설명된 것과 같이 적용된다.

일 양태에서, 본 발명은 상기 방법 및 조성물에서 개시된 요소들 중 어느 하나 이상을 함유하는 키트를 제공한다. 요소들은 개별적으로 또는 조합하여 제공될 수 있으며, 어떤 적합한 용기, 예컨대 바이알, 보틀 또는 튜브에 제공될 수 있다. 일부 구현예에서, 키트는 하나 이상의 언어로 된, 예를 들어 둘 이상의 언어로 된 설명서를 포함한다.

일부 구현예에서, 키트는 본원에 기술된 요소 중 하나 이상을 사용하는 과정에 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적절한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 저장 완충제를 제공할 수 있다. 시약은 특정 검정에 사용가능한 형태 또는 사용 전에 하나 이상의 다른 성분의 첨가를 필요로 하는 형태(예를 들어, 농축물 또는 동결건조 형태)로 제공될 수 있다. 완충제는 탄산나트륨 완충제, 중탄산나트륨 완충제, 붕산염 완충제, 트리스(Tris) 완충제, MOPS 완충제, HEPES 완충제 및 그들의 조합을 포함하나 이들에 한정되지 않는 임의의 완충제일 수 있다. 일부 구현예에서, 완충제는 알칼리성이다. 일부 구현예에서, 완충제는 약 7 내지 약 10의 pH를 갖는다. 일부 구현예에서, 키트는 가이드 서열과 조절 요소를 작동 가능하게 연결하도록, 벡터에 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다.

일 양태에서, 본 발명은 CRISPR 시스템의 하나 이상의 요소의 사용 방법을 제공한다. 본 발명의 CRISPR 복합체는 효율적인 표적 폴리뉴클레오티드의 변형 수단을 제공한다. 본 발명의 CRISPR 복합체는 다수의 세포 유형에서 표적 폴리뉴클레오티드를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 불활성화시키는, 활성화시키는) 것을 포함하는 매우 다양한 유용성을 갖는다. 이와 같이, 본 발명의 CRISPR 복합체는 예를 들어, 유전자 치료법, 약물 스크리닝, 질병 진단 및 예후에서 넓은 스펙트럼의 응용을 갖는다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화되는 CRISPR 효소를 포함한다. 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.

일 구현예에서, 본 발명은 표적 뉴클레오티드를 절단하는 방법을 제공한다. 방법은 표적 폴리뉴클레오티드와 결합하여 상기 표적 폴리뉴클레오티드의 절단을 행하는 CRISPR 복합체를 사용하여 표적 폴리뉴클레오티드를 변형하는 단계를 포함한다. 통상적으로, 본 발명은 CRISPR 복합체는 세포에 도입되었을 때 게놈 서열에 브레이크(예를 들어, 단일가닥 또는 이중가닥 브레이크)를 생성한다. 예를 들어, 방법은 세포에서 질환 유전자를 절단하기 위하여 사용될 수 있다.

CRISPR 복합체에 의해서 생성된 브레이크는 에러 경향 비-상동성 단부 연결 (NHEJ) 경로 또는 고 충실도 상동성-지정 수선 (HDR)과 같은 수선 과정에 의해서 수선될 수 있다(도 11). 이들 수선 과정 동안, 외인성 폴리뉴클레오티드 주형이 게놈 서열에 도입될 수 있다. 일부 방법에서, HDR 과정은 게놈 서열을 변형하기 위해서 사용된다. 예를 들어, 상류 서열과 하류 서열이 측접된 통합될 서열을 포함하는 외인성 폴리뉴클레오티드 주형이 세포에 도입된다. 상류 서열과 하류 서열은 염색체에의 통합 부위의 어느 사이드와 서열 유사성을 공유한다.

바람직한 경우, 도너 폴리뉴클레오티드는 DNA, 예를 들어 DNA 플라스미드, 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 바이러스 벡터, DNA의 선형 조각, PCR 단편, 네이키드 핵산, 또는 리포솜 또는 폴록사머와 같은 전달 부형제와 복합체화된 핵산일 수 있다.

외인성 폴리뉴클레오티드 주형은 통합될 서열을 포함한다(예를 들어, 돌연변이된 유전자). 통합 서열은 세포에 대해 내인성 또는 외인성인 서열일 수 있다. 통합될 서열의 예들은 단백질 또는 비-코딩 RNA(예를 들어, 마이크로RNA)를 암호화하는 폴리뉴클레오티드를 포함한다. 따라서, 통합 서열은 적절한 제어 서열 또는 서열들에 작동 가능하게 연결될 수 있다. 또는 달리, 통합될 서열은 조절 기능을 제공할 수 있다.

외인성 폴리뉴클레오티드 주형에서 상류 및 하류 서열은 관심대상의 염색체 서열과 도너 폴리뉴클레오티드 사이의 재조합을 촉진하도록 선택된다. 상류 서열은 통합을 위해 표적화된 부위의 상류 염색체 서열과 서열 유사성을 공유하는 핵산 서열이다. 유사하게, 하류 서열은 통합 표적화된 부위의 하류 염색체 서열과 서열 유사성을 공유하는 핵산 서열이다. 외인성 폴리뉴클레오티드 주형의 상류 및 하류 서열은 표적화된 게놈 서열과 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성을 가질 수 있다. 바람직하게, 외인성 폴리뉴클레오티드 주형의 상류 및 하류 서열은 표적화된 게놈 서열과 약 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 가진다. 일부 방법에서, 외인성 폴리뉴클레오티드 주형의 상류 및 하류 서열은 표적화된 게놈 서열과 약 99% 또는 100% 서열 동일성을 가진다.

상류 또는 하류 서열은 약 20bp 내지 약 2500bp, 예를 들어, 약 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 또는 2500 bp를 포함할 수 있다. 일부 방법에서, 예시적인 상류 또는 하류 서열은 약 200 bp 내지 약 2000 bp, 약 600 bp 내지 약 1000 bp, 또는 더 구체적으로 약 700 bp 내지 약 1000 bp를 가진다.

일부 방법에서, 외인성 폴리뉴클레오티드 주형은 마커를 더 포함할 수 있다. 이러한 마커는 표적화된 통합의 스크리닝을 용이하게 할 수 있다. 적합한 마커의 예들은 제한 부위, 형광 단백질, 또는 선택성 마커를 포함한다. 본 발명의 외인성 폴리뉴클레오티드 주형은 재조합 기술을 사용하여 구성될 수 있다(예를 들어, 문헌[Sambrook et al., 2001 및 Ausubel et al., 1996] 참조).

외인성 폴리뉴클레오티드 주형을 통합함으로써 표적 폴리뉴클레오티드를 변형하는 예시적인 방법에서, 이중가닥 브레이크가 CRISPR 복합체에 의해서 게놈 서열에 도입되며, 이 브레이크는 주형이 게놈에 통합되도록 외인성 폴리뉴클레오티드 주형의 상동성 재조합을 통해서 수선된다. 이중가닥 브레이크의 존재는 주형의 통합을 촉진한다.

다른 구현예에서, 본 발명은 진핵 세포에서 폴리뉴클레오티드의 발현을 변형하는 방법을 제공한다. 방법은 폴리뉴클레오티드와 결합하는 CRISPR 복합체를 사용하여 표적 폴리뉴클레오티드의 발현을 증가시키거나 감소시키는 단계를 포함한다.

일부 방법에서, 표적 폴리뉴클레오티드는 세포에서 발현의 변형을 행하는데 비활성화될 수 있다. 예를 들어, 세포에서 CRISPR 복합체와 표적 서열의 결합시, 표적 폴리뉴클레오티드가 비활성화되며, 이로써 서열이 번역되지 않거나, 코딩된 단백질이 생성되지 않거나, 또는 서열이 야생형 서열처럼 기능하지 않는다. 예를 들어, 단백질 또는 마이크로RNA 암호화 서열은 단백질이 생성되지 않도록 비활성화될 수 있다.

일부 방법에서, 제어 서열이 더 이상 조절 서열로서 기능하지 않도록 비활성화될 수 있다. 본원에서 사용된 "제어 서열"은 전사, 번역 또는 핵산 서열의 접근성을 행하는 어떤 핵산 서열을 말한다. 제어 서열의 예들은 프로모터, 전사 터미네이터, 및 인핸서를 포함하며 이들이 제어 서열이다.

비활성화된 표적 서열은 결실 돌연변이 (즉, 하나 이상의 뉴클레오티드의 결실), 삽입 돌연변이 (즉, 하나 이상의 뉴클레오티드의 삽입), 또는 논센스 돌연변이 (즉, 중단 코돈이 도입되도록 단일 뉴클레오티드의 다른 뉴클레오티드로의 치환)를 포함할 수 있다. 일부 방법에서, 표적 서열의 비활성화는 표적 서열의 "녹아웃"을 가져온다.

본 발명의 방법은 질환 모델로서 사용될 수 있는 식물, 동물 또는 세포를 생성하기 위해서 사용될 수 있다. 본원에서 사용된 "질환"은 대상체에서의 질환, 장애 또는 징후를 말한다. 예를 들어, 본 발명의 방법은 질환과 관련된 하나 이상의 핵산 서열에 변형을 포함하는 동물이나 세포, 또는 질환과 관련된 하나 이상의 핵산 서열의 발현이 변경된 식물, 동물 또는 세포를 생성하기 위해서 사용될 수 있다. 이러한 핵산 서열은 질환 관련 단백질 서열을 암호화할 수 있거나, 또는 질환 관련 대조군 서열일 수 있다. 따라서, 본 발명의 구현예에서, 식물, 대상체, 환자, 유기체 또는 세포는 비인간 대상체, 환자, 유기체 또는 세포일 수 있다는 것이 이해된다. 따라서, 본 발명은 본 방법에 의해서 생성된 식물, 동물 또는 세포, 또는 그것의 자손을 제공한다. 자손은 생성된 식물 또는 동물의 클론일 수 있거나, 또는 바람직한 특성이 자손으로 유전자 이입되도록 동일한 종의 다른 개체와의 교배에 의한 유성생식의 결과일 수 있다. 세포는 다세포 유기체, 특히 동물 또는 식물의 경우 생체내 또는 생체외 방식일 수 있다. 세포가 배양중인 경우, 적절한 배양 조건이 충족된다면, 바람직하게 세포가 이 목적을 위해 적절히 개조된다면 세포주가 확립될 수 있다(예를 들어, 줄기세포). 본 발명에 의해 제조된 박테리아 세포주들도 생각된다. 따라서, 세포주가 또한 고려된다.

일부 방법에서, 질환 모델은 동물 또는 세포에서 돌연변이의 효과 및 질환 연구에 통상 사용되는 척도를 사용하여 질환의 발생 및/또는 진행을 연구하기 위해서 사용될 수 있다. 또는 달리, 이러한 질환 모델은 질환에 대한 제약학적으로 활성인 화합물의 효과를 연구하는데 유용하다.

일부 방법에서, 질환 모델은 잠재적 유전자 요법 전략의 효율을 평가하기 위해서 사용될 수 있다. 즉, 질환-관련 유전자 또는 폴리뉴클레오티드는 질환 발생 및/또는 진행이 억제되거나 감소되도록 변형될 수 있다. 특히, 방법은 변경된 단백질이 생성되고, 결과적으로 동물 또는 세포가 변경된 반응을 가지도록 질환-관련 유전자 또는 폴리뉴클레오티드를 변형하는 단계를 포함한다. 따라서, 일부 방법에서, 유전자 변형된 동물이 질환 발생 소인이 있는 동물과 비교될 수 있으며, 이로써 유전자 요법 사건의 효과가 평가될 수 있다.

다른 구현예에서, 본 발명은 질환 유전자와 관련된 세포 신호화 사건을 조절하는 생물학적 활성제를 개발하는 방법을 제공한다. 방법은 시험 화합물을 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도하는 하나 이상의 벡터를 포함하는 세포와 접촉시키는 단계; 및 예를 들어 세포에 함유된 질환 유전자의 돌연변이와 관련된 세포 신호화 사건의 감소 또는 증강의 표시인 판독결과의 변화를 검출하는 단계를 포함한다.

세포 모델, 또는 동물 모델은 세포 기능 변화를 스크리닝하기 위하여 본 발명의 방법과 조합하여 구성될 수 있다. 이러한 모델은 관심대상의 세포 기능에 대한 본 발명의 CRISPR 복합체에 의해서 변형된 게놈 서열의 효과를 연구하기 위해서 사용될 수 있다. 예를 들어, 세포 기능 모델은 세포내 신호화 또는 세포외 신호화에 대한 변형된 게놈 서열의 효과를 연구하기 위해서 사용될 수 있다. 또는 달리, 세포 기능 모델은 감각 인식에 대한 변형된 게놈 서열의 효과를 연구하기 위해서 사용될 수 있다. 일부 이러한 모델에서, 모델에서의 신호화 생화학적 경로와 관련된 하나 이상의 게놈 서열이 변형된다.

몇 가지 질환 모델이 구체적으로 조사되었다. 이들은 새로운 자폐 위험 유전자 CHD8, KATNAL2, 및 SCN2A; 및 증후군성 자폐(앤젤만 증후군) 유전자 UBE3A를 포함한다. 이들 유전자와 결과의 자폐 모델이 물론 바람직하지만, 이들은 유전자 및 상응하는 모델 전체적으로 본 발명의 광범한 적용성을 나타내기 위해서 사용된다.

신호화 생화학적 경로와 관련된 하나 이상의 게놈 서열의 변경된 발현은 후보 제제와 접촉되었을 때 시험 모델 세포와 대조군 세포 사이에 상응하는 유전자의 mRNA 수준의 차이를 분석함으로써 결정될 수 있다. 또는 달리, 신호화 생화학적 경로와 관련된 서열들의 차등적 발현이 암호화된 폴리펩티드 또는 유전자 생성물의 수준 차이를 검출함으로써 결정된다.

mRNA 전사체 또는 상응하는 폴리뉴클레오티드의 수준에서 제제-유도 변경을 분석하기 위하여, 샘플에 함유된 핵산이 먼저 본 분야의 표준 방법에 따라서 추출된다. 예를 들어, mRNA는 문헌[Sambrook et al. (1989)]에 제시된 과정에 따라서 다양한 세포용해 효소 또는 화학 용액을 사용하여 분리될 수 있거나, 또는 제조자에 의해서 제공된 첨부된 설명서에 따라서 핵산-결합 수지에 의해서 추출될 수 있다. 다음에, 추출된 핵산 샘플에 함유된 mRNA가 본 분야에 널리 공지된 방법에 따라서 또는 여기 예시된 방법에 기초하여 증폭 과정 또는 종래의 혼성화 분석(예를 들어, 노던 블롯 분석)에 의해서 검출된다.

본 발명의 목적에 있어서, 증폭 수단은 합당한 충실도로 표적 서열을 복제할 수 있는 프라이머와 폴리머라제를 이용하는 어떤 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예컨대 TaqGold™, T7 DNA 폴리머라제, 이콜라이 DNA 폴리머라제의 Klenow 단편, 및 역전사효소에 의해서 수행될 수 있다. 바람직한 증폭 방법은 PCR이다. 특히, 분리된 RNA는 정량적 폴리머라제 연쇄 반응(RT-PCR)과 결합된 역전사 분석을 거칠 수 있고, 이로써 신호화 생화학적 경로와 관련된 서열의 발현 수준을 정량할 수 있다.

유전자 발현 수준의 검출은 증폭 분석으로 실시한 수행될 수 있다. 일 양태에서, 증폭된 생성물은, 제한은 아니지만 DNA 인터칼레이터 및 DNA 그로브 바인더를 포함하는 형광 DNA-결합제로 직접 시각화될 수 있다. 이중가닥 DNA 분자에 통합된 인터칼레이터의 양은 통상적으로 증폭된 DNA 생성물의 양에 비례하기 때문에, 본 분야의 종래의 광학 시스템을 사용하여 인터칼레이트된 염료의 형광을 정량함으로써 증폭된 생성물의 양을 편리하게 결정할 수 있다. 본 출원에 적합한 DNA-결합 염료는 SYBR 그린, SYBR 블루, DAPI, 프로피듐 요오드, Hoeste, SYBR 골드, 에티듐 브로마이드, 아크리딘, 프로플라빈, 아크리딘 오렌지, 아크리플라빈, 플루오르쿠마닌, 엘립티신, 다우노마이신, 클로로퀸, 디스타마이신 D, 크로모마이신, 호미듐, 미스라마이신, 루테늄 폴리피리딜, 안트라마이신 등을 포함한다.

다른 양태에서, 서열 특이적 프로브와 같은 다른 형광 표지가 증폭된 생성물의 검출 및 정량을 촉진하기 위해서 증폭 반응에 이용될 수 있다. 프로브-기반 정량 증폭은 원하는 증폭된 생성물의 서열-특이적 검출에 의존한다. 그것은 형광, 표적-특이적 프로브(예를 들어, TaqMan® 프로브)를 이용하며, 그 결과 특이성 및 감도가 증가된다. 프로브-기반 정량 증폭을 수행하는 방법은 본 분야에 잘 확립되어 있으며, 미국특허 No. 5,210,015에 교시된다.

또 다른 양태에서, 신호화 생화학적 경로와 관련된 서열과 서열 상동성을 공유하는 혼성화 프로브를 사용한 종래의 혼성화 분석이 수행될 수 있다. 통상적으로, 프로브는 혼성화 반응에서 시험 대상체로부터 유래된 생물학적 샘플에 함유된 신호화 생화학적 경로와 관련된 서열과 안정한 복합체를 형성하게 된다. 안티센스가 프로브 핵산으로 사용된 경우, 샘플에 제공되는 표적 폴리뉴클레오티드는 안티센스 핵산의 서열에 상보성이도록 선택된다는 것이 당업자에게 인정될 것이다. 반대로, 뉴클레오티드 프로브가 센스 핵산인 경우, 표적 폴리뉴클레오티드는 센스 핵산에 상보성이도록 선택된다.

혼성화는 다양한 긴축도 조건에서 수행될 수 있다. 본 발명의 실시를 위한 적합한 혼성화 조건은 신호화 생화학적 경로와 관련된 서열과 프로브 사이의 인식 상호작용이 충분히 특이적이며 충분히 안정하게 되는 조건이다. 혼성화 반응의 긴축도를 증가시키는 조건은 본 분야에 널리 알려져 있으며 공개되어 있다(예를 들어, 문헌[Sambrook, et al., (1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition] 참조). 혼성화 분석은, 제한은 아니지만, 니트로셀룰로스, 유리, 규소 및 다양한 유전자 어레이를 포함하는 어떤 고체 지지체 상에 고정된 프로브를 사용하여 형성될 수 있다. 바람직한 혼성화 분석은 미국특허 No. 5,445,934에 설명된 고밀도 유전자 칩에서 수행된다.

혼성화 분석 동안 형성된 프로브-표적 복합체의 편리한 검출을 위하여, 뉴클레오티드 프로브는 검출가능한 표지와 콘쥬게이트된다. 본 발명에서 사용하기에 적합한 검출가능한 표지는 광화학, 생화학, 분광학, 면역화학, 전기, 광학 또는 화학적 수단에 의해서 검출될 수 있는 어떤 조성물을 포함한다. 광범한 다양한 적합한 검출가능한 표지가 본 분야에 알려져 있으며, 이들은 형광 또는 화학발광 표지, 방사성활성 동위원소 표지, 효소 또는 다른 리간드들을 포함한다. 바람직한 구현예에서, 당업자는 형광 표지 또는 효소 태그, 예컨대 디옥시게닌, β-갈락토시다제, 유레아제, 알칼리성 포스파타제 또는 퍼옥시다제, 아비딘/바이오틴 복합체를 이용하는 것을 주로 원할 것이다.

혼성화 강도를 검출하거나 정량하기 위해서 사용되는 검출 방법은 통상적으로 상기 선택된 표지에 따를 것이다. 예를 들어, 방사성표지는 사진 필름 또는 포스포이미저를 사용하여 검출될 수 있다. 형광 마커는 방출된 광을 검출할 수 있는 포토디텍터를 사용하여 검출 및 정량될 수 있다. 효소 표지는 통상적으로 기질에 효소를 제공하고, 기질 에 대한 효소의 작용에 의해서 생성된 반응 생성물을 측정함으로써 검출되며; 마지막으로, 비색 표지는 착색된 표지를 간단히 시각화함으로써 검출된다.

신호화 생화학적 경로와 관련된 서열의 발현에서 제제-유도 변화는 또한 상응하는 유전자 생성물을 검사함으로써 결정될 수 있다. 단백질 수준의 결정은 통상적으로 (a) 생물학적 샘플에 함유된 단백질을 신호화 생화학적 경로와 관련된 단백질과 특이적으로 결합하는 제제와 접촉시키는 단계; 및 (b) 이렇게 형성된 어떤 제제:단백질 복합체를 확인하는 단계를 수반한다. 이 구현예의 일 양태에서, 신호화 생화학적 경로와 관련된 단백질과 특이적으로 결합하는 제제는 항체, 바람직하게 단클론 항체이다.

반응은 제제를, 신호화 생화학적 경로와 관련된 단백질과 제제 사이에 복합체가 형성될 수 있는 조건에서 시험 샘플로부터 유래된 신호화 생화학적 경로와 관련된 단백질의 샘플과 접촉시킴으로써 수행된다. 복합체의 형성은 본 분야의 표준 과정에 따라서 직접적으로 또는 간접적으로 검출될 수 있다. 직접 검출 방법에서, 제제는 검출가능한 표지와 함께 공급되고, 반응되지 않는 제제는 복합체로부터 제거될 수 있다. 이로써 남은 표지의 양이 형성된 복합체의 양을 나타낸다. 이러한 방법의 경우, 긴축 세척 조건 동안에도 제제에 부착된 상태를 유지하는 표지를 선택하는 것이 바람직하다. 표지는 결합 반응을 방해하지 않는 것이 바람직하다. 또는 대안적으로, 간접 검출 과정은 화학적으로 또는 효소적으로 도입된 표지를 함유하는 제제를 사용할 수 있다. 바람직한 표지는 일반적으로 결과의 제제:폴리펩티드 복합체의 결합 또는 안정성을 방해하지 않는다. 그러나, 표지는 통상적으로 유효한 결합을 위해 항체에 접근하여 검출가능한 신호를 생성하도록 설계된다.

단백질 수준을 검출하는데 적합한 광범위한 다양한 표지가 본 분야에 알려져 있다. 비제한적 예들은 방사성동위원소, 효소, 콜로이드 금속, 형광 화합물, 생물발광 화합물, 및 화학발광 화합물을 포함한다.

결합 반응 동안 형성된 제제:폴리펩티드 복합체의 양은 표준 정량 분석에 의해서 정량될 수 있다. 상기 예시된 대로, 제제:폴리펩티드 복합체의 형성은 결합 부위에 남은 표지의 양에 의해서 직접 측정될 수 있다. 또는 달리, 신호화 생화학적 경로와 관련된 단백질이 특정 제제에서 결합 부위에 대해 표지된 유사체와 경쟁하는 능력에 대해 시험된다. 이 경쟁 분석에서, 포착된 표지의 양은 시험 샘플에 존재하는 신호화 생화학적 경로와 관련된 단백질 서열의 양에 역비례한다.

상기 개략된 일반적인 원리에 기초한 단백질 분석을 위한 다수의 기술이 본 분야에서 이용될 수 있다. 이들은 제한은 아니지만 방사성면역분석, ELISA(효소 결합 면역방사성측정 분석), "샌드위치" 면역분석, 면역방사성측정 분석, 인시튜 면역분석(예를 들어, 콜로이드 금, 효소 또는 방사성동위원소 표지를 사용하는), 웨스턴 블롯 분석, 면역침전 분석, 면역형광 분석, 및 SDS-PAGE를 포함한다.

신호화 생화학적 경로와 관련된 단백질을 특이적으로 인식하거나 그것과 결합하는 항체가 상기 언급된 단백질 분석을 수행하는데 바람직하다. 바람직한 경우, 특정 타입의 번역 후 변형(예를 들어, 신호화 생화학적 경로 유도성 변형)을 인식하는 항체가 사용될 수 있다. 번역 후 변형은, 제한은 아니지만 글리코실화, 지질화, 아세틸화 및 포스포릴화를 포함한다. 이들 항체는 상업적 판매자로부터 구입될 수 있다. 예를 들어, 티로신-포스포릴화된 단백질을 특이적으로 인식하는 항-포스포티로신 항체는 Invitrogen 및 Perkin Elmer를 포함하는 다수의 판매자로부터 입수할 수 있다. 항-포스포티로신 항체는 ER 스트레스에 반응하여 티로신 잔기에서 차등적으로 포스포릴화된 단백질들을 검출하는데 특히 유용하다. 이러한 단백질은, 제한은 아니지만 진핵생물 번역 개시 인자 2 알파(eIF-2α)를 포함한다. 또는 달리, 이들 항체는 종래의 다클론 또는 단클론 항체 기술을 사용하여 숙주 동물 또는 항체-생성 세포를 원하는 번역 후 변형을 나타내는 표적 단백질로 면역화함으로써 생성될 수 있다.

본 방법을 실시하는데 있어서, 상이한 체조직, 상이한 세포 타입 및/또는 상이한 아세포 구조에서 신호화 생화학적 경로와 관련된 단백질의 발현 패턴을 조사하는 것이 바람직할 수 있다. 이들 연구는 특정 조직, 세포 타입 또는 아세포 구조에서 우선적으로 발현되는 단백질 마커와 결합할 수 있는 조직-특이적, 세포-특이적 또는 아세포 구조 특이적 항체의 사용에 의해서 수행될 수 있다.

신호화 생화학적 경로와 관련된 유전자의 변경된 발현은 또한 대조군 세포에 비해서 유전자 생성물의 활성의 변화를 검사함으로써 결정될 수 있다. 신호화 생화학적 경로와 관련된 단백질의 활성에서 제제-유도 변화의 분석은 조사중인 신호전달 경로 및/또는 생물학적 활성에 따를 것이다. 예를 들어, 단백질이 키나제인 경우, 하류 기질(들)을 포스포릴화하는 능력의 변화가 본 분야에 공지된 다양한 분석에 의해서 결정될 수 있다. 대표적인 분석은, 제한은 아니지만 포스포릴화된 단백질을 인식하는 항-포스포티로신 항체와 같은 항체를 사용한 면역블롯팅 및 면역침전을 포함한다. 게다가, 키나제 활성이 AlphaScreen™(Perkin Elmer에서 입수가능) 및 eTag™ 분석(Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174)과 같은 고-처리량 화학발광 분석에 의해서 검출될 수 있다.

신호화 생화학적 경로와 관련된 단백질이 세포내 pH 조건의 변동을 초래하는 연쇄반응의 일부인 경우, 형광 pH 염료와 같은 pH 감응성 분자가 리포터 분자로서 사용될 수 있다. 신호화 생화학적 경로와 관련된 단백질이 이온 채널인 다른 예에서, 막 전위 및/또는 세포내 이온 농도의 변동이 모니터될 수 있다. 다수의 상업적 키트 및 고-처리량 장치가 이온 채널의 조절인자에 대한 신속하고 확실한 스크리닝에 특히 적합하다. 대표적인 기기는 FLIPRTM(Molecular Devices, Inc.)와 VIPR(Aurora Biosciences)을 포함한다. 이들 기기는 동시에 마이크로플레이트의 1000개 샘플 웰 이상에서 반응을 검출하고, 실시간 측정 및 1 초 안에 또는 미니세컨드 안에 기능적 데이터를 제공할 수 있다.

여기 개시된 방법 중 어느 것을 실시하는데 있어서, 적합한 벡터가, 제한은 아니지만 마이크로인젝션, 전기천공, 소노포레이션, 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포솜 트랜스펙션, 덴드리머 트랜스펙션, 열충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포솜, 면역리포솜, 비로솜 또는 인공 비리온을 통한 전달을 포함하는 본 분야에 공지된 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 마이크로인젝션에 의해서 배아에 도입된다. 벡터 또는 벡터들은 배아의 핵 또는 세포질에 마이크로인젝션될 수 있다. 일부 방법에서, 벡터 또는 벡터들은 뉴클레오펙션에 의해서 세포에 도입될 수 있다.

CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내인성이거나 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 산물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크(junk) DNA)일 수 있다.

표적 폴리뉴클레오티드의 예는 신호전달 생화학 경로와 관련된 서열, 예를 들어, 신호전달 생화학적 경로-관련 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 관련 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-관련" 유전자 또는 폴리뉴클레오티드는 질병이 없는 대조군의 조직 또는 세포와 비교하여, 질병-발생 조직으로부터 유래된 세포에서 비정상적인 수준 또는 비정상적인 형태로 전사 또는 번역 산물을 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자일 수 있으며; 그것은 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있고, 여기서 변경된 발현은 질병의 발생 및/또는 진행과 관련이 있다. 또한, 질병-관련 유전자는 질병의 병인에 직접적인 원인이 있거나, 그에 원인이 있는 유전자(들)와 연관 불균형이 있는 돌연변이(들) 또는 유전적 변이를 갖는 유전자를 지칭한다. 전사 또는 번역된 산물은 공지된 것이거나 미공지된 것일 수 있으며, 정상 또는 비정상 수준으로 존재할 수 있다.

CRISPR 복합체의 표적 폴리뉴클레오티드는 모두의 내용이 본원에 참조로 포함되는, 각각 브로드 참조번호 BI-2011/008/WSGR 사건 번호 44063-701.101 및 BI-2011/008/WSGR 사건 번호 44063-701.102를 갖고, 둘 모두 명칭이 SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION이고, 각각 2012년 12월 12일 및 2013년 1월 2일에 출원된 미국 가출원 제61/736,527호 및 제61/748,427호에 열거된 바와 같은 다수의 질병-관련 유전자 및 폴리뉴클레오티드, 및 신호전달 생화학 경로-관련 유전자 및 폴리뉴클레오티드를 포함할 수 있다.

표적 폴리뉴클레오티드의 예는 신호전달 생화학 경로와 관련된 서열, 예를 들어, 신호전달 생화학적 경로-관련 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 관련 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-관련" 유전자 또는 폴리뉴클레오티드는 질병이 없는 대조군의 조직 또는 세포와 비교하여, 질병-발생 조직으로부터 유래된 세포에서 비정상적인 수준 또는 비정상적인 형태로 전사 또는 번역 산물을 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자일 수 있으며; 그것은 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있고, 여기서, 변경된 발현은 질병의 발생 및/또는 진행과 관련이 있다. 또한, 질병-관련 유전자는 질병의 병인에 직접적인 원인이 있거나, 그에 원인이 있는 유전자(들)와 연관 불균형이 있는 돌연변이(들) 또는 유전적 변이를 갖는 유전자를 지칭한다. 전사 또는 번역된 산물은 공지된 것이거나 미공지된 것일 수 있으며, 정상 또는 비정상 수준으로 존재할 수 있다.

질병-관련 유전자 및 폴리뉴클레오티드의 예는 표 A 및 B에 열거되어 있다. 질병 특이적 정보는 맥쿠식-네이선스 유전의학연구소, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 미국 국립생물공학정보센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용가능하며, 월드 와이드 웹에서 이용가능하다. 신호전달 생화학 경로-관련 유전자 및 폴리뉴클레오티드의 예는 표 C에 열거되어 있다.

이들 유전자 및 경로의 돌연변이는 기능에 영향을 미치는 부적절한 단백질 또는 부적절한 양의 단백질의 생성을 야기할 수 있다. 유전자, 질병 및 단백질의 추가의 예는 2012년 12월 12일에 출원된 미국 가출원 제61/736,527호 및 2013년 1월 2일에 출원된 제61/748,427호로부터 본원에 참고로 포함된다. 이러한 유전자, 단백질 및 경로는 CRISPR 복합체의 표적 폴리뉴클레오티드일 수 있다.

표 A

표 B:

표 C:

또한, 본 발명의 구현예는 유전자의 녹아웃, 유전자의 증폭 및 DNA 반복부 불안정성 및 신경계 장애와 관련된 특정 돌연변이의 수복에 관한 방법 및 조성물에 관한 것이다(문헌[Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical]). 연쇄 반복(tandem repeat) 서열의 특정 양태는 20 개 초과의 인간 질병의 원인이 되는 것으로 관찰되었다(반복부 불안정성의 새로운 이해: RNA·DNA 하이브리드의 역할. 문헌[McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8]). CRISPR-Cas 시스템은 이들 게놈 불안정성의 결함을 교정하도록 이용될 수 있다.

본 발명의 추가의 양태는 라포라 질병(Lafora disease)과 관련이 있는 것으로 확인된 EMP2A 및 EMP2B 유전자의 결함을 교정하기 위하여 CRISPR-Cas 시스템을 사용하는 것에 관한 것이다. 라포라 질병은 청소년기에 간질성 발작으로 시작할 수 있는 진행성 간대성근경련 간질을 특징으로 하는 상염색체 열성 질환이다. 소수의 경우의 질병이 아직 확인되지 않은 유전자의 돌연변이에 의해 유발될 수 있다. 질병은 발작, 근육연축, 보행곤란, 치매 및 결국에는 사망을 야기한다. 질병 진행에 대하여 효율적인 것으로 입증된 치료법이 현재 존재하지 않는다. 또한, 간질과 관련된 다른 유전자 이상은 CRISPR-Cas 시스템에 의해 표적화될 수 있으며, 근본이 되는 유전학은 문헌[Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009]에 추가로 기술되어 있다.

본 발명의 또 다른 양태에서, CRISPR-Cas 시스템은, 문헌[Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012]에 추가로 기술되어 있는 일부 유전자 돌연변이로 말미암아 발생하는 시각상 결함들을 교정하는데 사용될 수 있다.

본 발명의 몇몇 추가의 양태는 토픽 세부항목 유전 장애하에 국립보건원의 웹사이트(health.nih.gov/topic/GeneticDisorders의 웹사이트)에 추가로 기술된 매우 다양한 유전 질병과 관련된 결함을 교정하는 것에 관한 것이다. 유전적 뇌 질병은 부신백질이영양증, 뇌들보 무발생, 에카르디 증후군, 알퍼스병, 알츠하이머병, 바르트 증후군, 배튼병, CADASIL, 소뇌변성, 파브리병, 게르스트만 슈투로이슬러 샤잉커 병, 헌팅톤병 및 기타 3중 반복 장애, 라이병, 레슈-니한 증후군, 멘케스 질병, 사립체성 근병증 및 NINDS 거대후두각을 포함할 수 있으나 이들에 한정되지 않는다. 이들 질병은 세부항목 유전 뇌 장애하에 국립보건원의 웹사이트에 추가로 기술되어 있다.

일부 구현예에서, 질환은 신생물일 수 있다. 일부 구현예에서, 질환이 신생물인 경우, 표적화될 유전자는 표 A에 열거된 것들 중 임의의 것이다(이러한 경우에, PTEN 등). 일부 구현예에서, 질환은 연령-관련 황반 변성일 수 있다. 일부 구현예에서, 질환은 정신분열 장애일 수 있다. 일부 구현예에서, 질환은 트리뉴클레오티드 반복 장애일 수 있다. 일부 구현예에서, 질환은 유약 X 증후군일 수 있다. 일부 구현예에서, 질환은 세크레타제 관련 장애일 수 있다. 일부 구현예에서, 질환은 프리온-관련 장애일 수 있다. 일부 구현예에서, 질환은 ALS일 수 있다. 일부 구현예에서, 질환은 약물 중독일 수 있다. 일부 구현예에서, 질환은 자폐증일 수 있다. 일부 구현예에서, 질환은 알츠하이머병일 수 있다. 일부 구현예에서, 질환은 염증일 수 있다. 일부 구현예에서, 질환은 파킨슨병일 수 있다.

파킨슨병과 관련된 단백질의 예는 α-시누클레인, DJ-1, LRRK2, PINK1, Parkin, UCHL1, 신필린(Synphilin)-1 및 NURR1을 포함하나 이들에 한정되지 않는다.

중독 관련 단백질의 예는 예를 들어, ABAT를 포함할 수 있다.

염증-관련 단백질의 예는 예를 들어, Ccr2 유전자에 의해 인코딩된 단핵구 화학주성 단백질-1(MCP1), Ccr5 유전자에 의해 인코딩된 C-C 케모카인 수용체 5형(CCR5), Fcgr2b 유전자에 의해 인코딩된 IgG 수용체 IIB(FCGR2b, CD32로도 명명) 또는 Fcer1g 유전자에 의해 인코딩된 Fc 엡실론(epsilon) R1g(FCER1g) 단백질을 포함할 수 있다.

심혈관 질병 관련 단백질의 예는 예를 들어, IL1B(인터류킨 1, 베타), XDH(잔틴 데하이드로게나제), TP53(종양 단백질 p53), PTGIS(프로스타글란딘 I2(프로스타사이클린(prostacyclin)) 신타제), MB(미오글로빈), IL4(인터류킨 4), ANGPT1(안지오포이에틴 1), ABCG8(ATP-결합 카세트, 하위-과 G(WHITE), 구성원 8) 또는 CTSK(카텝신 K)를 포함할 수 있다.

알츠하이머병 관련 단백질의 예는 예를 들어, VLDLR 유전자에 의해 인코딩되는 극저밀도 리포단백질 수용체 단백질(VLDLR), UBA1 유전자에 의해 인코딩되는 유비퀴틴-유사 변형 활성화 효소(UBA1) 또는 UBA3 유전자에 의해 인코딩되는 NEDD8-활성화 효소 E1 촉매 서브유닛 단백질(UBE1C)을 포함할 수 있다.

황반 변성과 관련된 단백질의 예는 예를 들어, ABCR 유전자에 의해 인코딩되는 ATP-결합 카세트, 하위과 A(ABC1) 구성원 4 단백질(ABCA4), APOE 유전자에 의해 인코딩되는 아포리포단백질 E 단백질(APOE) 또는 CCL2 유전자에 의해 인코딩되는 케모카인(C-C 모티프) 리간드 2 단백질(CCL2)을 포함할 수 있다.

정신분열증 관련 단백질의 예는 NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B 및 그들의 조합을 포함할 수 있다.

종양 저해에 수반되는 단백질의 예는 예를 들어, ATM(돌연변이된 혈관확장성 운동실조증), ATR(혈관확장성 운동실조증 및 Rad3 관련), EGFR(상피 성장 인자 수용체), ERBB2(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 2), ERBB3(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 3), ERBB4(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 4), Notch 1, Notch2, Notch 3 또는 Notch 4를 포함할 수 있다.

세크레타제 장애와 관련된 단백질의 예는 예를 들어, PSENEN(프레세닐린 인핸서 2 상동체(C. 엘레간스(C. elegans)), CTSB(카텝신 B), PSEN1(프레세닐린 1), APP(아밀로이드 베타(A4) 전구체 단백질), APH1B(앞인두 결함 1 상동체 B(C. 엘레간스)), PSEN2(페레세닐린 2(알츠하이머병 4)) 또는 BACE1(베타-부위 APP-절단 효소 1)을 포함할 수 있다.

근위축성 측삭경화증과 연관된 단백질의 예들로서는 SOD1(과산화물 제거효소 1), ALS2(근위축성 측삭경화증 2), FUS(육종 내 융합체(fused in sarcoma)), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장 인자 A), VAGFB(혈관 내피 성장 인자 B) 및 VAGFC(혈관 내피 성장 인자 C), 그리고 이것들의 임의의 조합을 포함할 수 있다.

근위축성 측삭경화증과 관련된 단백질의 예들은 SOD1(수퍼옥사이드 디스뮤타제 1), ALS2(근위축성 측삭경화증 2), FUS(육종 융합형), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장인자 A), VAGFB(혈관 내피 성장인자 B), 및 VAGFC(혈관 내피 성장인자 C), 및 이들의 어떤 조합을 포함할 수 있다.

예를 들어, 미국 특허 공개 제20110023144호는 근위축성 측삭경화증 (ALS) 질환과 관련된 세포, 동물 및 단백질을 유전자 변형시키기 위한 징크 핑거 뉴클레아제의 사용을 설명한다. ALS는 수의 운동에 수반되는 뇌 피질, 뇌 줄기, 및 척수에서 특정 신경 세포의 점진적인 꾸준한 변성을 특징으로 한다.

운동 뉴런 장애 및 이들 장애와 관련된 단백질은 운동 뉴런 장애 발생에 대한 감수성, 운동 뉴런 장애의 존재, 운동 뉴런 장애의 중증도, 또는 이들의 어떤 조합에 영향을 미치는 다양한 세트의 단백질이다. 본 개시는 특정한 운동 뉴런 장애인 ALS 질환과 관련된 단백질을 암호화하는 어떤 염색체 서열의 편집을 포함한다. ALS와 관련된 단백질은 통상적으로 ALS-관련 단백질과 ALS의 실험적 연관성에 기초하여 선택된다. 예를 들어, ALS 와 관련된 단백질의 혈중 농도나 생성 비율이 ALS가 없는 집단에 비해 ALS를 가진 집단에서 상승되거나 억제될 수 있다. 단백질 수준의 차이는, 제한은 아니지만, 웨스턴 블롯, 면역조직화학적 염색, 효소 결합 면역흡착 분석 (ELISA), 및 질량분광법을 포함하는 프로테오믹 기술을 사용하여 평가될 수 있다. 또는 달리, ALS 와 관련된 단백질은, 제한은 아니지만, DNA 마이크로어레이 분석, 연속 유전자 발현 분석 (SAGE), 및 정량적 실시간 폴리머라제 연쇄 반응 (Q-PCR)을 포함하는 게놈 기술을 사용하여 단백질을 암호화하는 유전자의 유전자 발현 프로파일을 얻음으로써 확인될 수 있다.

비제한적 예로서, ALS와 관련된 단백질은, 제한은 아니지만 다음의 단백질들을 포함한다: SOD1 수퍼옥사이드 디스뮤타제 1, ALS3 근위축성 측삭 가용성 경화증 3 SETX 세나탁신 ALS5 근위축성 측삭경화증 5 FUS 융합 육종 ALS7 근위축성 측삭경화증 7 ALS2 근위축성 측삭 DPP6 디펩티딜-펩티다제 6 경화증 2 NEFH 신경세사, 중질 PTGS1 프로스타글란딘-폴리펩티드 엔도퍼옥사이드 신타제 1 SLC1A2 용질 캐리어 패밀리 1 TNFRSF10B 종양 괴사 인자(신경교 고 친화성 수용체 수퍼패밀리, 글루타메이트 수송인자), 멤버 10b 멤버 2 PRPH 페리페린 HSP90AA1 열충격 단백질 90kDa 알파 (시토졸), 부류 A 멤버 1 GRIA2 글루타메이트 수용체, IFNG 인터페론, 감마 이온성, AMPA 2 S100B S100 칼슘 결합 FGF2 섬유아세포 성장 인자 2 단백질 B AOX1 알데하이드 옥시다제 1 CS 시트레이트 신타제 TARDBP TAR DNA 결합 단백질 TXN 티오레독신 RAPH1 Ras 관련 MAP3K5 미토겐-활성화 단백질(RaIGDS/AF-6) 및 키나제 5 플렉스트린 상동체 도메인 1 NBEAL1 뉴로비친-유사 1 GPX1 글루타티온 퍼옥시다제 1 ICA1L 소섬 세포 자가항원 RAC1 ras-관련 C3 보툴리넘 1.69 kDa-유사 톡신 기질 1 MAPT 미세소관-관련 ITPR2 이노시톨 1,4,5- 단백질 tau 트리포스페이트 수용체, 타입 2 ALS2CR4 근위축성 측삭 GLS 글루타미나제 경화증 2(소아) 염색체 영역, 후보 4 ALS2CR8 근위축성 측삭 CNTFR 섬모성 신경영양 인자 경화증 2(소아) 수용체 염색체 영역, 후보 8 ALS2CR11 근위축성 측삭 FOLH1 폴레이트 하이드롤라제 1 경화증 2(소아) 염색체 영역, 후보 11 FAM117B 패밀리 서열 P4HB 프롤릴 4-하이드록실라제, 유사성 117, 멤버 B 베타 폴리펩티드 CNTF 섬모성 신경영양 인자 SQSTM1 시퀘스토솜 1 STRADB STE20-관련 키나제 NAIP NLR 패밀리, 세포자멸사 어댑터 베타 억제 단백질 YWHAQ 티로신 3- SLC33A1 용질 캐리어 패밀리 33 모노옥시게나제/트립토프(아세틸-CoA 수송인자), 5-모노옥시게나제 멤버 1 활성화 단백질, 세타 폴리펩티드 TRAK2 트래픽킹 단백질, 도 4 도 4 상동체, SAC1 키네신 결합 2 지질 포스파타제 도메인 함유 NIF3L1 NIF3 NGG1 상호작용 INA 인터넥신 뉴런 인자 3-유사 1 중간체 세사 단백질, 알파 PARD3B par-3 분배 COX8A 시토크롬 c 옥시다제 결함 3 상동체 B 서브유닛 VIIIA CDK15 사이클린-의존성 키나제 HECW1 HECT, C2 및 WW 15 도메인 함유 E3 유비퀴틴 단백질 리가아제 1 NOS1 산화질소 신타제 1 MET 메트 프로토-암유전자 SOD2 수퍼옥사이드 디스뮤타제 2, HSPB1 열충격 27 kDa 미토콘드리아 단백질 1 NEFL 신경세사, 경질 CTSB 카텝신 B 폴리펩티드 ANG 안지오게닌, HSPA8 열충격 70 kDa 리보뉴클레아제, RNase A 단백질 8 패밀리, 5 VAPB VAMP (소포- ESR1 에스트로겐 수용체 1 관련 막 단백질)-관련 단백질 B 및 C SNCA 시누클레인, 알파 HGF 간세포 성장 인자 CAT 카탈라제 ACTB 액틴, 베타 NEFM 신경세사, 중간 TH 티로신 하이드록실라제 폴리펩티드 BCL2 B-세포 CLL/림프종 2 FAS 파스(TNF 수용체 수퍼패밀리, 멤버 6) CASP3 카스파아제 3, 세포자멸사- CLU 클러스테린 관련 시스테인 펩티다제 SMN1 생존 운동 뉴런 G6PD 글루코오스-6-포스페이트 1, 텔로머 디하이드로게나제 BAX BCL2-관련 X HSF1 열충격 전사 단백질 인자 1 RNF19A 링 핑거 단백질 19A JUN 준 암유전자 ALS2CR12 근위축성 측삭 HSPA5 열충격 70kDa 경화증 2(소아) 단백질 5 염색체 영역, 후보 12 MAPK14 미토겐-활성화 단백질 IL10 인터류킨 10 키나제 14 APEX1 APEX 뉴클레아제 TXNRD1 티오레독신 환원효소 1 (다기능 DNA 수선 효소) 1 NOS2 산화질소 신타제 2, TIMP1 TIMP 메탈로펩티다제 유도성 저해제 1 CASP9 카스파아제 9, 세포자멸사- XIAP X-결합 저해제 관련된 시스테인 세포자멸사 펩티다제 GLG1 골지 글리코단백질 1 EPO 에리트로포이에틴 VEGFA 혈관 내피 ELN 엘라스틴 성장 인자 A GDNF 신경교 세포 유래 NFE2L2 핵 인자(적혈구-신경영양 인자 유래 2)-유사 2 SLC6A3 용질 캐리어 패밀리 6 HSPA4 열충격 70 kDa (신경전달물질 단백질 4 수송인자, 도파민), 멤버 3 APOE 아포지방단백질 E PSMB8 프로테아솜 (프로솜, 매크로페인) 서브유닛, 베타 타입, 8 DCTN1 디낙틴 1 TIMP3 TIMP 메탈로펩티다제 저해제 3 KIFAP3 키네신-관련 SLC1A1 용질 캐리어 패밀리 1 단백질 3 (뉴런/상피 고 친화성 글루타메이트 수송인자, 시스템 Xag), 멤버 1 SMN2 생존 운동 뉴런 CCNC 사이클린 C 2, 동심체 MPP4 막 단백질, STUB1 STIP1 상동체 및 U-팔미토일화 4 박스 함유 단백질 1 ALS2 아밀로이드 베타 (A4) PRDX6 퍼옥시레독신 6 전구체 단백질 SYP 시냅토피신 CABIN1 칼시뉴린 결합 단백질 1 CASP1 카스파아제 1, 세포자멸사- GART 포스포리보실글리신아미드 관련 시스테인 포르밀트랜스페라제, 펩티다제 포스포리보실글리신아미드 신세타제, 포스포리보실아미노이미다졸 신세타제 CDK5 사이클린-의존성 키나제 5 ATXN3 아탁신 3 RTN4 레티쿨론 4 C1QB 보체 구성성분 1, q 하위구성성분, B 가닥 VEGFC 신경성장인자 HTT 헌팅틴 수용체 PARK7 파킨슨병 7 XDH 잔틴 디하이드로게나제 GFAP 신경교 섬유질 산성 MAP2 미세소관-관련 단백질 단백질 2 CYCS 시토크롬 c, IgG의 체세포 FCGR3B Fc 단편, 저 친화성 IIIb, CCS 구리 샤페롱 UBL5 유비퀴틴-유사 5 수퍼옥사이드 디스뮤타제 MMP9 바탕질 메탈로펩티다제 SLC18A3 용질 캐리어 패밀리 18 9(혈관 아세틸콜린), 멤버 3 TRPM7 일시 수용체 HSPB2 열충격 27 kDa 잠재적 양이온 채널, 단백질 2 서브패밀리 M, 멤버 7 AKT1 v-akt 뮤린 흉선종 DERL1 Der1-유사 도메인 패밀리, 바이러스 암유전자 상동체 1 멤버 1 CCL2 케모카인 (C--C 모티프) NGRN 뉴그린, 뉴라이트 리간드 2 돌기 관련 GSR 글루타티온 환원효소 TPPP3 튜불린 중합-촉진 단백질 패밀리 멤버 3 APAF1 세포자멸사 펩티다제 BTBD10 BTB (POZ) 도메인 활성화 인자 1 함유 10 GLUD1 글루타메이트 CXCR4 케모카인 (C--X--C 모티프) 디하이드로게나제 1 수용체 4 SLC1A3 용질 캐리어 패밀리 1 FLT1 fms-관련 티로신 (신경교 고 친화성 글루타메이트 수송인자), 멤버 3 키나제 1 PON1 파라옥소나제 1 AR 안드로겐 수용체 LIF 백혈병 억제 인자 ERBB3 v-erb-b2 적아세포 백혈병 바이러스 암유전자 상동체 3 LGALS1 렉틴, 갈락토시드-CD44 CD44 분자 결합, 가용성, 1 TP53 종양 단백질 p53 TLR3 톨-유사 수용체 3 GRIA1 글루타메이트 수용체, GAPDH 글리세르알데하이드-3-이온성, AMPA 1 포스페이트 디하이드로게나제 GRIK1 글루타메이트 수용체, DES 데스민 이온성, 카이네이트 1 CHAT 콜린 아세틸트랜스페라제 FLT4 fms-관련 티로신 키나제 4 CHMP2B 크로마틴 변형 BAG1 BCL2-관련 단백질 2B 안타노젠 MT3 메탈로티오네인 3 CHRNA4 콜린성 수용체, 니코틴성, 알파 4 GSS 글루타티온 신세타제 BAK1 BCL2-길항제/킬러 1 KDR 키나제 삽입 도메인 GSTP1 글루타티온 S-트랜스페라제 수용체 (a 타입 III 파이 1 수용체 티로신 키나제) OGG1 8-옥소구아닌 DNA IL6 인터류킨 6 (인터페론, 글리코실라제 베타 2).

동물 또는 세포는 ALS 와 관련된 단백질을 암호화하는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 파괴된 염색체 서열 및 ALS 와 관련된 파괴된 단백질을 암호화하는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 염색체 통합 서열을 포함할 수 있다. ALS와 관련된 바람직한 단백질은 SOD1 (수퍼옥사이드 디스뮤타제 1), ALS2(근위축성 측삭경화증 2), FUS (육종 융합형), TARDBP (TAR DNA 결합 단백질), VAGFA(혈관 내피 성장인자 A), VAGFB(혈관 내피 성장인자 B), 및 VAGFC(혈관 내피 성장인자 C), 및 이들의 어떤 조합을 포함한다.

프리온 질병과 관련된 단백질의 예는 SOD1(슈퍼옥시드 디스뮤타제 1), ALS2(근위축성 측삭 경화증 2), FUS(육종에서 융합), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장 인자 A), VAGFB(혈관 내피 성장 인자 B) 및 VAGFC(혈관 내피 성장 인자 C) 및 그들의 임의의 조합을 포함할 수 있다.

프리온 장애에서의 신경변성 질환과 관련된 단백질의 예는 예를 들어, A2M(알파-2-마크로글로불린), AATF(아폽토시스 길항작용 전사 인자), ACPP(전립선 산 포스파타제), ACTA2(액틴 알파 2 평활근 대동맥), ADAM22(ADAM 메탈로펩티다제 도메인), ADORA3(아데노신 A3 수용체) 또는 ADRA1D(알파-1D 아드레노수용체에 대한 알파-1D 아드레날린 작용성 수용체)를 포함할 수 있다.

면역결핍과 관련된 단백질의 예는 예를 들어, A2M[알파-2-마크로글로불린]; AANAT[아릴알킬아민 N-아세틸트랜스퍼라제]; ABCA1[ATP-결합 카세트, 하위과 A(ABC1), 구성원 1]; ABCA2[ATP-결합 카세트, 하위과 A(ABC1), 구성원 2]; 또는 ABCA3[ATP-결합 카세트, 하위과 A(ABC1), 구성원 3];을 포함할 수 있다.

트리뉴클레오티드 반복 장애와 관련된 단백질의 예는 예를 들어, AR(안드로겐 수용체), FMR1(유약 X 정신 지체 1), HTT(헌팅틴) 또는 DMPK(근긴장성 이영양증-단백질 키나제), FXN(프라탁신(frataxin)), ATXN2(아탁신(ataxin) 2)를 포함한다.

신경전달 장애와 관련된 단백질의 예는 예를 들어, SST(소마토스타틴), NOS1(산화질소 신타제 1(뉴런)), ADRA2A(아드레날린 작용성, 알파-2A-, 수용체), ADRA2C(아드레날린 작용성, 알파-2C-, 수용체), TACR1(타키키닌 수용체 1) 또는 HTR2c(5-하이드록시트립타민(세로토닌) 수용체 2C)를 포함한다.

신경발달-관련 서열의 예는 예를 들어, A2BP1[아탁신 2-결합 단백질 1], AADAT[아미노아디페이트 아미노트랜스퍼라제], AANAT[아릴알킬아민 N-아세틸트랜스퍼라제], ABAT[4-아미노부티레이트 아미노트랜스퍼라제], ABCA1[ATP-결합 카세트, 하위과 A(ABC1), 구성원 1] 또는 ABCA13[ATP-결합 카세트, 하위과 A(ABC1), 구성원 13]을 포함한다.

본 발명의 시스템으로 치료가능한 바람직한 질환의 추가의 예는 에카르디 고우티에레스(Aicardi-Goutieres) 증후군; 알렉산더병; 알란-헌든-두들리(Allan-Herndon-Dudley) 증후군; POLG-관련 장애; 알파-만노시도시스(Alpha-Mannosidosis)(II 및 III형); 알스트스트롬(Alstrom) 증후군; 안젤만(Angelman); 증후군; 혈관확장성 운동실조증; 신경 세로이드 리포푸신증; 베타-지중해빈혈; 양쪽성 시신경위축 및 (영아) 1형 시신경위축; 망막모세포종(양쪽성); 캐너번병; 뇌-눈-얼굴-골격 증후군 1[COFS1]; 뇌힘줄황색종증; 코넬리아디란지 증후군; MAPT-관련 장애; 유전적 프리온 질병; 드라벳 증후군; 조기-발병 가족성 알츠하이머병; 프리드리히 운동실조[FRDA]; 프린스 증후군; 푸코시드 축적증; 후쿠야마형 선천성 근이영양증; 갈락토시알리도시스; 고셰병; 유기 산혈증; 혈구탐식성 림프조직구증; 허친슨-길포오드 조로증 증후군; II형 뮤코리피드증; 유아 유리 시알산 축적병; PLA2G6-관련 신경변성; 제벨 랑쥐-닐슨 증후군; 연접부 수포성 표피박리증; 헌팅톤병; 크라베병(유아); 미토콘드리아 DNA-관련 레이 증후군 및 NARP; 레슈-니한 증후군; LIS1-관련 뇌회결손; 로우 증후군; 단풍시럽뇨병; MECP2 중복 증후군; ATP7A-관련 구리 수송 장애; LAMA2-관련 근이영양증; 아릴설파타제 A 결핍; I, II 또는 III형 점액다당류증; 퍼옥시좀 생물발생 장애; 젤웨거 증후군 스펙트럼; 뇌 철 축적 장애가 있는 신경변성; 산 스핑고미엘리나제 결핍; C형 니만 픽병; 글리신 뇌병증; ARX-관련 장애; 요소 사이클 장애; COL1A1/2-관련 불완전골형성; 미토콘드리아 DNA 결실 증후군; PLP1-관련 장애; 페리(Perry) 증후군; 펠란-맥더미드 증후군; II형 글리코겐 축적병(폼페병)(유아); MAPT-관련 장애; MECP2-관련 장애; 1형 어깨엉덩관절 점상 연골형성이상; 로버츠 증후군; 샌드호프병; 쉰들러병 - 1형; 아데노신 탈아미노효소 결핍; 스미스-렘리-오피츠 증후군; 척수성 근위축; 유아-발병 척수소뇌성 실조증; 헥소사미니다제 A 결핍; 1형 치사성 이형성증; VI형 콜라겐-관련 장애; I형 어셔 증후군; 선천성 근이영양증; 월프-허쉬호른 증후군; 리소좀산 리파제 결핍; 및 색소성 건피증으로부터 선택될 수 있다.

명백한 바와 같이, 본 발명의 시스템이 임의의 대상 폴리뉴클레오티드 서열을 표적화하기 위해 사용될 수 있음이 예상된다. 본 발명의 시스템을 사용하여 유용하게 치료될 수 있는 질환 또는 질병의 일부 예는 상기 표에 포함되어 있으며, 그들 질환과 현재 관련되어 있는 유전자의 예도 또한 거기에 제공된다. 그러나, 예시된 유전자는 배타적인 것은 아니다.

예를 들어, "야생형 StCas9"는 스트렙토코커스 써모필루스로부터의 야생형 Cas9를 말하며, 이것의 단백질 서열은 승인번호 G3ECR1로서 SwissProt 데이터베이스에 주어진다. 유사하게, S. pyogenes Cas9도 승인번호 Q99ZW2로서 SwissProt에 포함된다.

CRISPR-Cas 시스템이 사용되어 효율적이고 비용 효과적인 유전자 편집 및 조작을 수행할 수 있는 능력은, 생산의 개선 및 유전 형질의 향상을 위해 게놈들이 형질 전환되도록 만드는 단일 진행 및 다중 진행 유전자 조작 결과의 신속한 비교 및 기술의 선택을 가능하게 할 것이다. 이와 같은 관점에서, 각각의 내용들과 개시 사항 전부가 본원에 전체로서 참고문헌으로 포함되어 있는 미국 특허들 및 특허공보들[미국 특허 제6,603,061호 " Agrobacterium-Mediated Plant Transformation Method"; 제7,868,149호 "Plant Genome Sequences and Uses Thereof" 및 미국 특허 출원 제2009/0100536호 "Transgenic Plants with Enhanced Agronomic Traits"]이 참고된다. 본 발명이 실시됨에 있어서, 문헌[Morrell et al "Crop genomics: advances and applications" Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용과 이에 개시된 사항도 전체로서 본원에 참고문헌으로 포함되어 있다.

실시예

하기의 실시예는 본 발명의 다양한 구현예를 예시할 목적으로 제공되며, 어떠한 방식으로든 본 발명을 제한하고자 하지 않는다. 본원에 기술된 방법과 함께 본 발명의 실시예는 본원에서 바람직한 구현예를 대표하는 것이며, 예시적이고, 본 발명의 범주에 대한 제한으로 의도되지 않는다. 거기에서의 변화 및 다른 용도는 청구범위의 범주에 의해 정의되는 바와 같은 본 발명의 목적에 포함되며, 당업자에게 수행될 것이다.

실시예 1: 클로닝 및 전달을 단순화하기 위한 방법론적 개선

플라스미드 상에서 U6-프로모터와 가이드 RNA를 암호화하는 것보다 출원인은 가이드 RNA 상에 덧붙이기 위해 DNA 올리고와 함께 U6 프로모터를 증폭시켰다. 결과의 PCR 생성물은 가이드 RNA의 발현을 유도하기 위해 세포에 트랜스펙션될 수 있다.

U6-프로모터:: 인간 Emx1 유전자좌를 표적화하는 가이드 RNA 로 구성된 PCR 생성물의 생성을 허용하는 프라이머 쌍의 예:

정방향 프라이머: AAACTCTAGAgagggcctatttcccatgattc

역방향 프라이머 (가이드 RNA 보유, 밑줄로 표시된다):

acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTTGTTTCCAAAACAGCATAGCTCTAAAACCCCTAGTCATTGGAGGTGACGGTGTTTCGTCCTTTCCACaag

실시예 2: 활성을 개선하기 위한 방법론적 개선:

pol3 프로모터, 특히 RNA 폴리머라제 III(예를 들어, U6 또는 H1 프로모터)를 사용하는 것보다, 진핵 세포에서 가이드 RNA를 발현하기 위해서, 출원인은 T7 프로모터를 사용하여 가이드 RNA의 발현을 유도하기 위해 진핵 세포에서 T7 폴리머라제를 발현시킨다.

이 시스템의 일례는 세 조각의 DNA의 도입을 수반할 수 있다:

1. Cas9를 위한 발현 벡터

2. T7 폴리머라제에 대한 발현 벡터

3. T7 프로모터에 융합된 가이드 RNA를 함유하는 발현 벡터

실시예 3: Cas9의 독성을 감소시키기 위한 방법론적 개선: mRNA 형태로 Cas9의 전달

mRNA의 형태로 Cas9를 전달하는 것은 세포에서 Cas9의 일시적 발현을 가능하게 함으로써 독성을 감소시킨다. 예를 들어, 인간화된 SpCas9가 다음의 프라이머 쌍을 사용하여 증폭할 수 있다:

정방향 프라이머 (시험관내 번역을 위해서 T7 프로모터에 부가):

TAATACGACTCACTATAGGAAGTGCGCCACCATGGCCCCAAAGAAGAAGCGG

역방향 프라이머 (폴리A 테일에 부가):

GGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTttcttaCTTTTTCTTTTTTGCCTGGCCG

출원인은 진핵 세포에서 가이드 RNA 발현을 유도하기 위해 RNA 또는 DNA의 형태로 가이드 RNA로 세포에 Cas9 mRNA를 트랜스펙션한다.

실시예 4: Cas9의 독성을 감소시키기 위한 방법론적 개선: 유도성 프로모터의 사용

출원인은 게놈 변형을 수행하기 위해 필요할 때만 Cas9를 일시적으로 변화시킨다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소 분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등), 또는 경질 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬)을 포함한다.

실시예 5: 생체내 적용을 위한 Cas9 시스템의 개선

출원인은 작은 분자량을 가진 Cas9에 대한 메타 게놈 검색을 수행했다. 대부분의 Cas9 상동체는 꽤 크다. 예를 들어, SpCas9는 대략 1368aa 길이이며, 이것은 전달을 위해 바이러스 벡터에 쉽게 패키지되기에는 너무 크다. Cas9 상동체의 길이 분포를 나타내는 그래프가 GenBank에 기탁된 서열로부터 생성된다(도 5). 서열의 일부는 잘못 해석되었으며, 따라서 각 길이에 대한 정확한 빈도는 반드시 정확하지 않을 수 있다. 그렇지만, 그것은 Cas9 단백질의 분포에 일견을 제공하며, 이것은 더 짧은 Cas9 상동체가 있다는 것을 시사한다.

컴퓨터 분석을 통해서 출원인은 박테리아 균주 캄필로박터에 1000 아미노산 미만의 2 개의 Cas9 단백질이 있다는 것을 발견했다. 캄필로박터 제주니로부터의 하나의 Cas9의 서열이 아래 제시된다. 이 길이에서는 CjCas9가 1차 세포 및 동물 모델에 생체내 확실한 전달을 위해 AAV, 렌티바이러스, 아데노바이러스, 및 다른 바이러스 벡터에 쉽게 패키징될 수 있다. 본 발명의 바람직한 구현예에서, 스태필로코커스 아우레우스로부터의 Cas9 단백질을 사용한다.

>캄필로박터 제주니 Cas9 (CjCas9)

이 CjCas9에 대한 잠정적 tracrRNA 요소는 다음과 같다:

직접 반복부 서열은 다음과 같다:

CjCas9에 대한 키메라 가이드 RNA의 예는 다음과 같다:

실시예 6: Cas9최적화

증진된 기능이나 새로운 기능을 개발하기 위해서, 출원인은 상이한 Cas9 상동체로부터의 단편들을 조합하여 키메라 Cas9 단백질을 생성한다. 예를 들어, 키메라 Cas9 단백질의 2 개의 예는 다음과 같다:

예를 들어, 출원인은 St1Cas9의 N-말단 (이 단백질로부터의 단편은 굵은 글씨로 표시된다)과 SpCas9의 C 말단 (이 단백질로부터의 단편은 밑줄로 표시된다)을 융합했다.

>St1(N)Sp(C)Cas9

>Sp(N)St1(C)Cas9

키메라 Cas9를 제조하는 것의 이점은 다음을 포함한다:

독성 감소

진핵 세포에서의 발현 개선

특이성 증진

단백질의 분자량 감소, 상이한 Cas9 상동체로부터 가장 작은 도메인들을 조합함으로써 더 작은 단백질 제조.

PAM 서열 요건 변경

실시예 7: 일반적인 DNA 결합 단백질로서 Cas9의 활용

출원인은 DNA 표적의 양쪽 가닥의 절단을 초래하는 2개의 촉매 도메인 (D10 및 H840)을 돌연변이시킴으로써 일반적인 DNA 결합 단백질로서 Cas9를 사용했다. 표적 유전자좌에서 유전자 전사를 상향조절하기 위해서, 출원인은 전사 활성화 도메인 (VP64)과 Cas9를 융합했다. 출원인은 전사 인자 활성화 강도가 표적에서 소모되는 시간의 함수이기 때문에 Cas9-VP64 융합 단백질의 강한 핵 위치를 아는 것이 중요할 것이라는 가설을 세웠다. 따라서, 출원인은 일련의 Cas9-VP64-GFP 작제물을 클로닝하고, 이들을 293 세포에 트랜스펙션하고, 트랜스펙션 12 시간 후에 형광 현미경 아래서 이들의 국소화를 평가했다.

방해하기 위해 존재하는 벌키한 GFP 없이 작제물을 기능적으로 시험하기 위해서 동일한 작제물이 직접 융합이 아니라 2A-GFP로서 클로닝되었다. 출원인은 세포 리프로그램에 유용할 수 있기 때문에 Cas9 트랜스활성인자를 가진 Sox2 유전자좌를 표적화하도록 선택했으며, 이 유전자좌는 TALE-TF 매개 전사 활성화에 대한 표적으로서 이미 검증되었다. Sox2 유전자좌에 대해, 출원인은 전사 시작 부위(TSS) 근처에서 8 개의 표적을 선택했다. 각 표적은 20 bp 길이였고, 이웃한 NGG 프로토스페이서 인접 모티프(PAM)를 가진다. 각 Cas9-VP64 작제물이 293 세포에서 각 PCR 생성된 키메라 crispr RNA (chiRNA)로 공동 트랜스펙션시켰다. 트랜스펙션 72시간 후 전화 활성화를 RT-qPCR을 사용하여 평가하였다.

전사 활성인자를 더 최적화하기 위하여, 출원인은 Cas9 (NLS-VP64-NLS-hSpCas9-NLS-VP64-NLS)에 대한 chiRNA (Sox2.1 및 Sox2.5)의 비율을 적정하고, 293 세포에 트랜스펙션하고, RT-qPCR을 사용하여 정량했다. 이들 결과는 Cas9가 표적 유전자좌에서 유전자 전사를 상향조절하기 위한 일반적인 DNA 결합 도메인으로서 사용될 수 있음을 나타낸다.

출원인은 제2 세대의 작제물을 설계했다(아래 목록을 참조).

출원인은 이들 작제물을 사용하여 RT-qPCR에 의해서 전사 활성화 (VP64 융합 작제물) 및 억제(Cas9 단독)를 평가한다. 출원인은 항-His 항체를 사용하여 각 작제물의 세포 국소화, 서베이어 뉴클레아제 분석을 사용하여 뉴클레아제 활성, 그리고 겔 이동 분석을 사용하여 DNA 결합 친화성을 평가한다.

실시예 8: Cas9 유전자이식 및 녹인 마우스

Cas9 뉴클레아제를 발현하는 마우스를 생성하기 위해서, 출원인은 두 가지 일반적인 전략을 제시하는데, 유전자이식과 녹인이다. 이들 전략은, 예를 들어 래트의 경우, 관심대상의 어떤 다른 모델 유기체를 생성하기 위해 적용될 수 있다. 일반적인 전략의 각각의 경우, 출원인은 구성적으로 활성인 Cas9와 조건적으로 발현되는 Cas9를 제작했다(Cre 재조합효소 의존적). 구성적으로 활성인 Cas9 뉴클레아제는 다음의 맥락에서 발현된다: pCAG-NLS-Cas9-NLS-P2A-EGFP-WPRE-bGH폴리A. pCAG는 프로모터, NLS는 핵 위치 신호, P2A는 펩티드 절단 서열, EGFP는 증진된 녹색 형광 단백질, WPRE는 우드처크 간염 바이러스 전사 후 조절 구성요소, bGHpolyA는 소 성장 호르몬 폴리-A 신호 서열이다(도 7a 내지 도 7b). 조건적 버전은 프로모터 뒤와 NLS-Cas9-NLS 앞에 하나의 추가적 중단 카세트 요소로서 loxP-SV40폴리A x3-loxP를 가진다(즉, pCAG-loxP-SV40폴리Ax3-loxP-NLS-Cas9-NLS-P2A-EGFP-WPRE-bGH폴리A). 중요한 발현 요소는 도 8과 같이 시각화될 수 있다. 구성적 작제물은 발생을 통해서 모든 세포 타입에서 발현되지만, 조건적 작제물은 동일한 세포가 Cre 재조합효소를 발현할 때만 Cas9 발현을 허용할 것이다. 후자의 TBG 은 Cre가 조직 특이적 프로모터의 발현하에 있을 때 Cas9의 조직 특이적 발현을 허용할 것이다. 더욱이, Cas9 발현은 TET-온 또는 -오프 시스템과 같은 유도성 프로모터의 발현하에 Cre를 둠으로써 성체 마우스에서 유도될 수 있다.

Cas9 작제물의 확인: 각 플라스미드는 세 가지 방식으로 기능적으로 검증되었다: 1) 293 세포에서의 일시적 트랜스펙션 후 GFP 발현의 확인; 2) 293 세포에서의 일시적 트랜스펙션 후 P2A 서열을 인식하는 항체를 사용한 면역형광; 및 3) 일시적 트랜스펙션 후 서베이어 뉴클레아제 분석. 293 세포는 관심대상인 세포에 따라 293FT 또는 293 T 세포일 수 있다. 바람직한 구현예에서, 세포는 293FT 세포이다. 서베이어의 결과는 조건적 작제물과 구성적 작제물에 대해 각각 겔의 위와 아래에서 판독하였다. 각각은 hEMX1 유전자좌(키메라 RNA hEMX1.1)에 표적화된 키메라 RNA의 존재 또는 부재하에 시험되었다. 결과는 이 작제물이 키메라 RNA (및 조건적인 경우에는 Cre)가 존재할 때만 hEMX1 유전자좌를 성공적으로 표적화할 수 있음을 나타낸다. 겔이 정량화하며, 그 결과를 세 샘플의 평균 절단 효율 및 표준 편차로서 제시한다.

유전자이식 Cas9 마우스: 작제물을 사용하여 유전자이식 마우스를 생성하기 위해서, 출원인은 거짓 임신 CB56 암컷으로부터의 접합체의 전핵에 순수한 선형 DNA를 주입한다. 시조가 확인되고, 제노타이핑되고, CB57 마우스에 다시 교배시킨다. 작제물은 성공적으로 클로닝하였고, 생어(Sanger) 시퀀싱에 의해서 검증하였다.

녹인 Cas9 마우스: Cas9 녹인 마우스를 생성하기 위해서, 출원인은 Rosa26 유전자좌에 일부 구성적 및 조건적 작제물을 표적화한다. 출원인은 이것을 각 작제물을 다음의 요소를 가진 벡터를 표적화하는 Rosa26에 클로닝함으로써 행했다: Rosa26 짧은 상동체 암 - 구성적/조건적 Cas9 발현 카세트 - pPGK-Neo-Rosa26 긴 상동체 암 - pPGK-DTA. pPGK는 네오마이신에 대한 내성을 부여하는 양성 선택 마커 Neo, 1 kb 짧은 팔, 4.3 kb 긴 팔, 및 PGK에 의해서 유도되는 음성 선택 초파리 독소 (DTA)에 대한 프로모터이다.

두 작제물을 R1 mESC에 전기천공하고, 네오마이신 선택이 적용되기 전에 2 일 동안 성장시켰다. 5-7 일까지 생존한 각 콜로니를 선별하고 개별 웰에서 성장시켰다. 5-7 일 후 콜로니를 수거하고, 절반을 냉동시키고, 나머지 절반은 제노타이핑에 사용했다. 제노타이핑은 게놈 PCR에 의해서 수행하였는데, 여기서는 하나의 프라이머는 도너 플라스미드 (AttpF) 내에서 아닐링되고, 나머지 프라이머는 짧은 상동체 암(Rosa26-R) 밖에서 아닐링되었다. 조건적 경우에 수거된 22 개의 콜로니 중 7 개가 양성이었다(왼쪽). 구성적 경우에 수거된 27 개의 콜로니 중 양성은 하나도 없었다(오른쪽). Cas9는 mESC에서 어떤 수준의 독성을 야기하고, 이 이유 때문에 양성 클론은 없었을 수 있다. 이것을 시험하기 위해서, 출원인은 정확히 표적화된 조건적 Cas9 세포에 Cre 발현 플라스미드를 도입했고, 수 일 배양 후에 매우 낮은 독성을 발견했다. 정확히 표적화된 조건적 Cas9 세포에서 Cas9의 감소된 복제수(세포당 1 내지 2 복제)는 안정한 발현을 허용하기에 충분하며, 세포독성은 비교적 없는 편이다. 더욱이, 이 데이터는 Cas9 복제수가 독성을 결정한다는 것을 나타낸다. 전기천공 후, 각 세포는 Cas9의 몇 개의 복제를 얻는데, 이것은 구성적 Cas9 작제물에서 양성 콜로니가 발견되지 않은 이유일 수 있다. 이것은 조건적, Cre-의존적 전략을 이용하는 것이 감소된 독성을 나타낸다는 것의 강력한 증거를 제공한다. 출원인은 정확히 표적화된 세포를 배반포에 주입해서 암컷 마우스에 이식한다. 키메라가 확인되고 역교배된다. 시조가 확인되고 제노타이핑된다.

조건적 Cas9 마우스의 활용: 출원인은 293 세포에서 Cas9 조건적 발현 작제물이 Cre와의 공-발현에 의해서 활성화될 수 있다는 것을 나타냈다. 출원인은 또한 정확하게 표적화된 R1 mESC는 Cre가 발현될 때 활성 Cas9를 가질 수 있다는 것을 나타낸다. Cas9 뒤에는 P2A 펩티드 절단 서열이 오고 다음에 EGFP가 이어지기 때문에, 출원인은 EGFP를 관찰함으로써 성공적인 발현을 확인한다. 동일한 개념은 조건적 Cas9 마우스를 아주 유용하게 만드는 것이다. 출원인은 조건적 Cas9 마우스를 Cre를 편재적으로 발현하는 마우스(ACTB-Cre 계통)와 교배시킬 수 있고, 모든 세포에서 Cas9를 발현하는 마우스에 이를 수 있다. 배아 또는 성체 마우스에서 게놈 편집을 유도하기 위하여 키메라 RNA의 전달을 고려해야 한다. 흥미롭게도, 조건적 Cas9 마우스가 조직 특이적 프로모터 하에 Cre를 발현하는 마우스와 교배된다면, 또한 Cre를 발현하는 조직에 Cas9만 있어야 한다. 이 접근법은 동일한 조직에 키메라 RNA를 전달함으로써 정확한 조직에서만 게놈을 편집하기 위해서 사용될 수 있다.

실시예 9: Cas9 전달 및 키메라 RNA

CRISPR-Cas 시스템은 박테리아 및 고세균류를 통틀어서 다양한 종들에 의해서 이용되는 침입한 외인성 DNA에 대한 후천 면역 메커니즘이다. 타입 II CRISPR-Cas 시스템은 CRISPR 유전자좌에 외래 DNA의 "획득"을 책임지는 단백질을 암호화하는 일련의 유전자와 DNA 절단 메커니즘의 "실행"을 암호화하는 일련의 유전자로 구성되며; 이들은 DNA 뉴클레아제(Cas9), 비-코딩 트랜스활성화 cr-RNA(tracrRNA), 및 직접 반복부(crRNA)가 측접된 외래 DNA-유래 스페이서 어레이를 포함한다. Cas9에 의한 성숙시, tracrRNA와 crRNA 듀플렉스는 스페이서 가이드 서열에 의해서 특정된 표적 DNA 서열로 Cas9 뉴클레아제를 가이드하고, 절단에 필요하며 각 CRISPR-Cas 시스템에 특이적인 표적 DNA의 짧은 서열 모티브 근처에서 DNA에 이중가닥 브레이크를 매개한다. 타입 II CRISPR-Cas 시스템은 박테리아 계 전체에서 발견되며, Cas9 단백질 서열 및 크기, tracr RNA 및 crRNA 직접 반복부 서열, 이들 요소들의 게놈 조직, 및 표적 절단을 위한 모티프 요건은 매우 다양하다. 하나의 종이 다수의 상이한 CRISPR-Cas 시스템을 가질 수 있다.

출원인은 Cas9로 알려진 서열 상동체와 HNH 엔도뉴클레아제 도메인 및 RuvC 엔도뉴클레아제 도메인을 포함하는 서브 도메인에 오솔로그인 구조들에 기초하여 확인된, 박테리아 종들로부터의 207 개의 잠정적 Cas9를 평가했다 [Eugene Koonin and Kira Makarova로부터의 정보]. 이 세트의 단백질 서열 보존에 기초한 계통발생적 분석은 세 그룹의 큰 Cas9 (약 1400 아미노산)와 두 그룹의 작은 Cas9 (약 1100 아미노산)을 포함하는 다섯 개의 Cas9 패밀리를 드러냈다(도 3a 내지 도 3d 및 도 4a 내지 도 4f).

출원인은 또한 시험관내 방법을 사용하여 Cas9 가이드 RNA를 최적화했다.

실시예 10: Cas9 돌연변이

이러한 실시예에서, 본 발명자들은 하기의 돌연변이가 SpCas9를 닉킹 효소로 전환시킬 수 있음을 보여준다: D10A, E762A, H840A, N854A, N863A, D986A.

출원인은 돌연변이 점이 SpCas9 유전자 내에 위치하는 곳을 보여주는 서열을 제공한다(도 6a 내지 도 6m). 또한, 본 발명자들은 닉카아제가 여전히 상동성 재조합을 매개할 수 있음을 보여준다. 추가로, 본 발명자들은 이들 돌연변이가 있는 SpCas9(개별적으로)가 이중 가닥 파단을 유도하지 않음을 보여준다.

Cas9 오솔로그는 모두 3-4 RuvC 도메인과 HNH 도메인의 일반적인 조직을 공유한다. 5' 최단부 RuvC 도메인은 비-상보적 가닥을 절단하고, HNH 도메인은 상보적 가닥을 절단한다. 모든 표시법은 가이드 서열을 참조한다.

5' RuvC 도메인의 촉매 잔기는 관심대상의 Cas9와 다른 Cas9 오솔로그 (S. pyogenes 타입 II CRISPR 유전자좌, 스트렙토코커스 써모필루스 CRISPR 유전자좌 1, 스트렙토코커스 써모필루스 CRISPR 유전자좌 3, 및 Franciscilla novicida 타입 II CRISPR 유전자좌로부터의)의 상동성 비교를 통해서 확인되고, 보존된 Asp 잔기가 알라닌으로 돌연변이되며, 이로써 Cas9가 상보성-가닥 흉터형성 효소로 전환된다. 유사하게, HNH 도메인에서 보존된 His 및 Asn 잔기가 알라닌으로 돌연변이되어 Cas9가 비-상보성-가닥 흉터형성 효소로 전환된다.

실시예 11: Cas9 전사 활성화 및 Cas9 억제인자

Cas9 전사 활성화

제2 세대 작제물이 설계되었으며, 시험될 파이프라인에 있다(표 1). 이들 작제물을 사용하여 RT-qPCR에 의해서 전사 활성화 (VP64 융합 작제물) 및 억제(Cas9 단독)를 평가할 것이다. 출원인은 또한 항-His 항체를 사용하여 각 작제물의 세포 국소화, 서베이어 뉴클레아제 분석을 사용하여 뉴클레아제 활성, 그리고 겔 이동 분석을 사용하여 DNA 결합 친화성을 평가할 것이다.

Cas 억제인자

dCas9가 유전자 발현을 억제하기 위한 일반적인 DNA 결합 도메인으로 사용될 수 있다는 것은 이미 밝혀졌다. 출원인은 개선된 dCas9 디자인뿐만 아니라 억제인자 도메인 KRAB 및 SID4x와 dCas9 융합을 보고한다. 표 1에서 Cas9를 사용하여 전사를 조절하기 위해 생성된 플라스미드 라이브러리로부터 다음의 억제인자 플라스미드들, pXRP27, pXRP28, pXRP29, pXRP48, pXRP49, pXRP50, pXRP51, pXRP52, pXRP53, pXRP56, pXRP58, pXRP59, pXRP61, 및 pXRP62가 qPCR에 의해서 기능적으로 특성화되었다.

각 dCas9 억제인자 플라스미드는 베타-카테닌 유전자의 코딩 가닥에 표적화된 2 개의 가이드 RNA와 공-트랜스펙션되었다. 트랜스펙션 72 시간 후 RNA가 분리되었고, RT-qPCR에 의해서 유전자 발현이 정량되었다. 내인성 대조군 유전자는 GAPDH였다. 양성 대조군으로서 2 개의 검증된 shRNA가 사용되었다. 음성 대조군은 gRNA 없이 트랜스펙션된 특정 플라스미드였으며, 이들은 "pXRP## 대조군"으로 표시된다. 플라스미드 pXRP28, pXRP29, pXRP48, 및 pXRP49는 명시된 표적화 전략을 사용할 때 베타-카테닌 유전자를 억제할 수 있었다. 이들 플라스미드는 기능적 도메인이 없는 dCas9 (pXRP28 및 pXRP28) 및 SID4x와 융합된 dCas9 (pXRP48 및 pXRP49)에 상응한다.

추가 연구 조사: 상기 실험을 반복하고, 상이한 유전자를 표적화하고, 다른 gRNA들을 이용하여 최적 표적화 위치를 결정하고, 복합적인 억제를 달성한다.

표 1

실시예 12: 콜레스테롤 생합성, 지방산 생합성 및 다른 대사 장애에 수반된 유전자, 아밀로이드 및 다른 질환에 수반된 미스- 폴딩 단백질을 암호화하는 유전자, 세포 형질전환을 초래하는 암유전자 , 잠복 바이러스 유전자, 및 특히 우성-음성 장애를 초래하는 유전자의 표적화된 결실

출원인은 바이러스 또는 나노입자 전달 시스템을 사용하여, 대사 장애, 아밀로이드증 및 단백질-응집 관련 질환, 유전자 돌연변이 및 전위로 인해 발생한 세포 형질전환, 유전자 돌연변이의 우성 음성 효과, 잠복 바이러스 감염, 및 다른 관련된 증상으로 고통받는, 필요한 대상체나 환자의 간, 뇌, 안구, 상피, 조혈, 또는 다른 조직에서 CRISPR-Cas 시스템의 유전자 전달을 증명한다.

연구 설계: 대사 장애, 아밀로이드증 및 단백질-응집 관련 질환으로 고통받는 치료가 필요한 대상체 또는 환자는, 제한은 아니지만, 인간, 비-영장류 인간, 개, 고양이, 소, 말, 다른 가축 및 관련 포유류를 포함한다. CRISPR-Cas 시스템은 키메라 가이드 RNA에 의해서 가이드되어 절단될 인간 게놈 유전자좌의 특정 부위를 표적화한다. 절단 및 비-상동성 단부-연결 매개 수선 후, 프레임-이동 돌연변이는 유전자의 녹아웃을 가져온다.

출원인은 최소한의 표적외 활성으로 내인성 유전자좌에 특이적이 되는 상기 언급된 장애들에 수반되는 가이드-RNA 표적화 유전자를 선택한다. 둘 이상의 가이드 RNA가 단일 CRISPR 어레이에 암호화될 수 있으며, 이로써 DNA에 이중가닥 브레이크가 동시에 유도됨으로써 질환에 걸린 유전자 또는 염색체 영역의 미소-결실이 초래된다.

유전자 표적의 확인 및 설계

각 후보 질환 유전자에 대해, 출원인은 단백질-코딩 엑손, 기지의 우성 음성 돌연변이 부위를 포함하며 측접한 서열, 병리적 반복 서열을 포함하며 측접한 서열을 포함하는 관심대상의 DNA 서열을 선택한다. 유전자-녹아웃 접근법을 위해, 시작 코돈에 가장 가까운 조기 코딩 엑손이 완전한 녹아웃을 달성하고 일부 기능을 보유한 말단절단된 단백질 생성물의 가능성을 최소화하기 위한 최상의 옵션을 제공한다.

출원인은 NGG 모티프(SpCas9 시스템의 경우) 또는 NNAGAAW (St1Cas9 시스템의 경우)에 대해 바로 5'에 있는 모든 가능한 표적화가능한 20-bp 서열에 대해 관심대상의 서열을 분석한다. 출원인은 특이성을 결정하기 위한 컴퓨터 알고리즘에 기초하여 표적외 효과를 최소화하기 위해서 게놈에서 특유의 단일 RNA-가이드된 Cas9 인식을 위해 서열을 선택했다.

전달 시스템에 가이드 서열의 클로닝

이중가닥 20-24 bp 올리고뉴클레오티드로서 가이드 서열이 합성된다. 올리고의 5'포스포릴화 처리 및 듀플렉스를 형성하기 위한 아닐링 후, 전달 방법에 따라서 올리고가 적합한 벡터에 결찰된다:

바이러스-기반 전달 방법

AAV-기반 벡터(PX260, 330, 334, 335)는 다른 곳에 설명되었다.

렌티바이러스-기반 벡터는 가이드 서열을 U6 프로모터-유도된 키메라 RNA 스캐폴드와 EF1a 프로모터-유도된 Cas9 또는 Cas9 닉카아제를 지닌 단일 벡터에 직접 결찰하는 유사한 클로닝 전략을 사용한다.

바이러스 생성은 다른 곳에 설명된다.

나노입자-기반 RNA 전달 방법

1. 가이드 서열은 T7 프로모터-가이드 서열-키메라 RNA를 암호화하는 올리고뉴클레오티드 듀플렉스로서 합성된다. T7 프로모터는 PCR 방법에 의해서 Cas9의 5'에 부가된다.

2. T7-유도된 Cas9 및 가이드-키메라 RNA가 시험관내 전사되고, Cas9 mRNA가 더 봉쇄되며, 상업적 키트를 사용하여 A-테일 형식으로 된다. RNA 생성물을 키트 설명서에 따라서 정제한다.

유체역학적 꼬리 정맥 전달 방법 (마우스의 경우)

가이드 서열을 본 출원에서 다른 곳에 상기 설명된 대로 AAV 플라스미드에 클로닝한다.

시험관내 세포주 검증

트랜스펙션

1. DNA 플라스미드 트랜스펙션

가이드 서열을 지닌 플라스미드가 지질-, 화학적- 또는 전기천공-기반 방법을 사용하여 인간 배아 신장 (HEK293T) 또는 인간 배아 줄기 (hES) 세포, 다른 관련 세포 타입에 트랜스펙션된다. HEK293T 세포의 24-웰 트랜스펙션을 위해 (약 260,000 세포), 총 500 ng의 DNA가 리포펙타민 2000을 사용하여 각 단일 웰에 트랜스펙션된다. hES 세포의 12-웰 트랜스펙션을 위해, 총 1 ㎍의 DNA는 Fugene HD를 사용하여 단일 웰에 트랜스펙션한다.

2. RNA 트랜스펙션

상기 설명된 정제된 RNA가 HEK293T 세포에의 트랜스펙션에 사용된다. 1-2 ㎍의 RNA가 제조자의 지시에 따라서 리포펙타민 2000을 사용하여 약 260,000에 트랜스펙션될 수 있다. Cas9 및 키메라 RNA의 RNA 전달이 도 10에 도시한다.

시험관내 삽입결실부 형성 분석

트랜스펙션 72 시간 후 세포가 수거되고, 이중가닥 브레이크의 표지로서 삽입결실부 형성에 대해 분석된다.

간단히 말해서, 표적 서열 근처의 게놈 영역이 고 충실도 폴리머라제를 사용하여 PCR 증폭된다(약 400-600bp 앰플리콘 크기). 생성물이 정제되고, 동등한 농도로 표준화되고, 95℃에서 4℃까지 서서히 아닐링되며, 이로써 DNA 헤테로듀플렉스가 형성된다. 아닐링 후, Cel-I 효소를 사용하여 헤테로듀플렉스가 절단되고, 결과의 생성물이 폴리아크릴아미드 겔에서 분리되며, 삽입결실부 효율이 계산된다.

동물에서 생체내 원리 입증

전달 메커니즘

AAV 또는 렌티바이러스 제조는 다른 곳에 설명된다.

나노입자 제제: RNA가 나노입자 제제에 혼합된다.

마우스에 DNA 플라스미드의 유체역학적 꼬리 정맥 주사가 상업적 키트를 사용하여 수행된다.

Cas9 및 가이드 서열이 바이러스, 나노입자-코팅된 RNA 혼합물, 또는 DNA 플라스미드로서 전달되고, 대상체 동물에 주사된다. 병행하는 세트의 대조군 동물에는 멸균 식염수, Cas9 및 GFP, 또는 단독 가이드 서열 및 GFP가 주사된다.

주사 3 주 후, 동물은 증상의 완화에 대해 시험되고 죽임을 당한다. 관련된 장기 시스템이 삽입결실부 형성에 대해 분석된다. 표현형 분석은 HDL, LDL, 지질의 혈중 수준을 포함한다.

삽입결실부 형성 분석

DNA가 상업적 키트를 사용하여 조직으로부터 추출된다; 삽입결실부 분석은 시험관내 증명에 대해 설명된 대로 수행될 것이다.

CRISPR-Cas 시스템의 치료적 적용은 후보 질환 유전자의 조직-특이적이며 일시적으로 제어된 표적화된 결실을 달성하는 것을 잘 수행한다. 예들은 특히 콜레스테롤 및 지방산 대사, 아밀로이드 질환, 우성 음성 질환, 잠복 바이러스 감염에 수반되는 유전자를 포함한다.

유전자 유전자좌에 표적화된 삽입결실부를 도입하기 위한 단일 가이드-RNA의 예들

유전자 유전자좌에 염색체 미소결실을 도입하기 위한 한 쌍의 가이드-RNA의 예들

실시예 13: 질환-원인 돌연변이를 지닌 유전자에 대한 수선의 표적화된 통합; 효소 결핍의 복구 및 다른 관련 질환

연구 설계

I. 유전자 표적의 확인 및 설계

· 실시예 16에 설명됨

II. 전달 시스템에 가이드 서열 및 수선 주형의 클로닝

· 실시예 16에 설명됨

· 출원인은 질환형 대립유전자를 가진 상동체 암과 야생형 수선 주형을 포함하도록 DNA 수선 주형을 클로닝한다.

III. 시험관내 세포주 검증

a. 트랜스펙션은 상기 실시예 16에 설명된다; Cas9, 가이드 RNA, 및 수선 주형이 관련 세포 타입에 공-트랜스펙션된다.

b. 시험관내 수선 분석

i. 출원인은 트랜스펙션 72 시간 후 세포를 수거하고 수선에 대해 분석한다

ii. 간단히 말해서, 출원인은 고 충실도 폴리머라제 PCR을 사용하여 수선 주형 근처의 게놈 영역을 증폭한다. 서열 생성물은 돌연변이 대립유전자의 발생이 감소된다.

IV. 동물에서 생체내 원리 입증

a. 전달 메커니즘은 상기 실시예 16 및 29에 설명된다.

b. 생체내 수선 분석

i. 출원인은 시험관내 증명세서 설명된 대로 수선 분석을 수행한다.

V. 치료적 적용

CRISPR-Cas 시스템은 후보 질환 유전자의 조직-특이적이며 일시적으로 제어된 표적화된 결실을 달성하는 것을 잘 수행한다. 예들은 특히 콜레스테롤 및 지방산 대사, 아밀로이드 질환, 우성 음성 질환, 잠복 바이러스 감염에 수반되는 유전자를 포함한다.

수선 주형을 가진 하나의 단일 미스센스 돌연변이의 예들:

실시예 14: 녹내장, 아밀로이드증 및 헌팅턴병에서 CRISPR - Cas 시스템의 치료적 적용

녹내장: 출원인은 미실린 (MYOC) 유전자의 제1 엑손을 표적화하기 위한 가이드 RNA를 설계한다. 출원인은 Cas9와 MYOC 유전자를 표적화하는 가이드 RNA를 모두 패키지하기 위해 아데노바이러스 벡터(Ad5)를 사용한다. 출원인은 아데노바이러스 벡터를 녹내장의 병리생리학에서 세포가 이식된 섬유주대에 주사한다. 출원인은 이들이 시각의 선명함을 개선하고 안압을 감소시키는지의 여부를 알기 위해서 처음에 이것을 돌연변이된 MYOC 유전자를 지닌 마우스 모델에서 시험한다. 인간에서 치료적 적용도 유사한 전략을 이용한다.

아밀로이드증: 출원인은 간에서 트랜스티레틴 (TTR) 유전자의 제1 엑손을 표적화하기 위한 가이드 RNA를 설계한다. 출원인은 Cas9와 TTR 유전자의 제1 엑손을 표적화하는 가이드 RNA를 패키지하기 위해 AAV8을 사용한다. AAV8는 간을 효과적으로 표적화하는 것으로 나타났으며, 정맥내 투여될 것이다. Cas9는 알부민 프로모터와 같은 간 특이적 프로모터를 사용하거나, 또는 구성적 프로모터를 사용하여 유도될 수 있다. pol3 프로모터는 가이드 RNA를 유도한다.

또는 달리, 출원인은 TTR 유전자를 녹아웃시키기 위해 플라스미드 DNA의 유체역학적 전달을 이용한다. 출원인은 Cas9를 암호화하는 플라스미드와 TTR의 엑손1을 표적화하는 가이드 RNA를 전달한다.

추가의 대안적 접근법으로서, 출원인은 RNA의 조합을 투여한다(Cas9의 경우 mRNA, 및 가이드 RNA). RNA는 Life Technologies로부터의 인비보펙타민을 사용하여 패키지되어 정맥내 전달될 수 있다. RNA-유도 면역원성을 감소시키고, Cas9 발현의 수준 및 가이드 RNA 안정성을 증가시키기 위해서, 출원인은 5' 봉쇄를 사용하여 Cas9 mRNA를 변형한다. 출원인은 또한 Cas9 mRNA 및 가이드 RNA에 변형된 RNA를 통합하며, 이로써 이들의 안정성이 증가하고 면역원성이 감소한다(예를 들어, TLR의 활성화). 효율을 증가시키기 위해서, 출원인은 바이러스, DNA 또는 RNA의 다수 용량을 투여한다.

헌팅턴병: 출원인은 환자의 HTT 유전자에서 대립유전자 특이적 돌연변이에 기초하여 가이드 RNA를 설계한다. 예를 들어, 확장된 CAG 반복부를 가진 HTT에 대해 이형접합성인 환자에서, 출원인은 돌연변이 HTT 대립유전자에 특유한 뉴클레오티드 서열을 확인하며, 이것을 사용하여 가이드 RNA를 설계한다. 출원인은 돌연변이 염기가 가이드 RNA의 마지막 9 bp 안에 위치되는 것을 보장한다(출원인은 표적 크기와 가이드 RNA 사이에 단일 DNA 염기 미스매치를 구별할 수 있는 능력을 갖는 것을 확인했다).

출원인은 돌연변이 HTT 대립유전자 특이적 가이드 RNA와 Cas9를 AAV9에 패키지해서 헌팅턴 환자의 선조체에 전달한다. 바이러스는 개두를 통해서 선조체에 주촉성 방식으로 주사된다. AAV9는 뉴런을 효과적으로 변환하는 것으로 알려져 있다. 출원인은 인간 시냅신 I과 같은 뉴런 특이적 프로모터를 사용하여 Cas9를 유도한다.

실시예 15: HIV에서 CRISPR - Cas 시스템의 치료적 적용

만성 바이러스 감염은 유의한 사망률 및 유병율의 근원이다. 이들 바이러스 중 대부분에 대해 바이러스 복제의 다양한 양태를 효과적으로 표적화하는 종래의 항바이러스 요법이 존재하지만, 현재 치료 양식은 보통 "바이러스 잠복"으로 인해서 실제로는 비-치유적이다. 그 성질 때문에 바이러스 잠복은 활성 바이러스 생성 없는 바이러스 수명 주기의 휴면기로 특정된다. 이 기간 동안 바이러스는 면역 감시와 종래의 치료를 상당히 피할 수 있어서, 숙주 내에 장기적인 바이러스 저장소를 확립할 수 있고, 이로부터 후속 재활성화가 바이러스의 계속된 증식 및 전달을 허락할 수 있다. 바이러스 잠복에 대한 열쇠는 바이러스 게놈을 안정적으로 유지하는 능력인데, 이것은 세포질에 바이러스 게놈을 저장하거나 그것을 숙주 게놈에 통합하는 에피솜 또는 프로바이러스 잠복을 통해서 달성된다. 일차 감염을 방지하는 효과적인 백신접종이 없을 때는 잠복 저장소 및 세포용해 활성 사건에 의해서 특정된 만성 바이러스 감염이 유의한 결과를 가질 수 있다: 인간 유두종 바이러스(HPV)는 자궁경부암을 가져올 수 있고, C형 간염 바이러스(HCV)는 간세포 암종의 소인이며, 인간 면역결핍 바이러스는 궁극적으로 숙주 면역 시스템을 파괴하여 기회 감염에 대한 감수성을 가져온다. 이와 같이, 이들 감염은 현재 이용가능한 항바이러스 치료법의 일생동안의 사용을 필요로 한다. 더 나아가, 복잡한 문제로서 이들 바이러스 게놈의 대부분의 높은 변동성이 있는데, 이것은 효과적인 요법이 존재하지 않는 내성 균주의 발달을 초래한다.

CRISPR-Cas 시스템은 박테리아 후천 면역 시스템으로서, 복합적이며 서열-특이적 방식으로 이중가닥 DNA 브레이크 (DSB)를 유도할 수 있고, 최근에는 포유류 세포 시스템에서 재구성되었다. 하나 또는 다수의 가이드-RNA로 DNA를 표적화하는 것은 개재 서열의 삽입결실부와 결실을 각각 모두 가져올 수 있는 것으로 나타났다. 이와 같이, 이 신규 기술은 표적화된 복합적인 DNA 돌연변이유발이 높은 효율 및 특이성으로 단일 세포 내에서 달성될 수 있는 수단이다. 결과적으로, 바이러스 DNA 서열에 대해 지정된 CRISPR-Cas 시스템의 전달은 진행중인 바이러스 생성이 없을 때조차도 잠복 바이러스 게놈의 표적화된 파괴 및 결실을 허용할 수 있었다.

예로서, HIV-1에 의한 만성적 감염은 전세계적 건강 문제로서, 3300만 명의 개체가 감염된 상태이며, 260만 건의 감염이 연간 발생한다. 바이러스 복제의 다수 양태를 동시에 표적화하는 다양식 고 활성 항레트로바이러스 요법 (HAART)의 사용은 만성적인 끝이 없는 질병으로서 HIV 감염이 상당히 관리될 수 있도록 했다. 치료하지 않으면 HIV의 AIDS로의 진행은 보통 9 내지 10 년 내에 일어나고, 결과적으로 숙주 면역 시스템이 고갈되며, 기회 감염이 발생하여 이후 곧 사망에 이르게 된다. 바이러스 잠복에 수반하여, HAART의 중단은 언제나 바이러스 복귀를 초래한다. 더욱이, 요법의 일시적 중단도 이용가능한 수단에 의해서 제어불가능한 HIV의 내성 균주에 대해 선택할 수 있다. 추가로, HAART 요법의 비용은 상당한데, 미국에서 년간 1 인당 $10,000 내지 15,0000가 소요된다. 이와 같이, 바이러스 복제 과정이 아니라 HIV 게놈을 직접 표적화하는 치료 접근법은 잠복 저장소의 박멸이 치유적 치료 옵션을 허용하는 수단이다.

HIV-1 표적화된 CRISPR-Cas 시스템의 개발 및 전달은 표적화된 DNA 돌연변이유발에 대한 기존 수단, 즉 ZFN 및 TALEN과는 차별화되는 독특한 접근법이며, 수많은 치료적 용도를 가진다. HAART와 함께 CRISPR-매개 DSB 및 삽입결실부에 의한 HIV-1 게놈의 표적화된 파괴 및 결실은 숙주에서 활성 바이러스 생성의 예방뿐만 아니라 잠복 바이러스 저장소의 고갈을 동시에 허용할 수 있었다.

일단 숙주 면역 시스템에 통합되면, CRISPR-Cas 시스템은 완전한 바이러스 박멸의 없을 때조차도 HIV-1 내성 하위집단의 생성을 허용하고, 숙주 면역 활성의 유지와 재구성을 허용할 수 있다. 이것은 바이러스 게놈의 파괴에 의해 바이러스 생성 및 통합을 방지하여 1 차 감염을 방지하며, "백신접종"을 의미한다. CRISPR-Cas 시스템의 복합적 성질은 개별 세포에 동시에 게놈의 다수 양태를 표적화하는 것을 허용한다.

HAART에서와 같이, 돌연변이유발에 의한 바이러스 탈출은 다중 후천 돌연변이의 동시 획득을 요구함으로써 최소화된다. HIV-1의 다수의 균주가 동시에 표적화될 수 있으며, 이것은 수퍼감염의 기회를 최소화하고, 새로운 재조합 균주의 후속 생성을 방지한다. CRISPR-Cas 시스템의 단백질이 아니라 뉴클레오티드-매개된 서열 특이성은 전달 메커니즘의 유의한 변경의 필요 없이 치료제의 신속한 생성을 허용한다.

이것을 달성하기 위해서, 출원인은 최대 커버리지 및 효율을 위해서 HIV-1 균주 변이체를 이용하여 거의 대부분의 HIV-1 게놈을 표적화하는 CRISPR-Cas 가이드 RNA를 생성한다. HIV-1 서브타입과 변이체 사이에 게놈 보존의 서열 분석은 개재된 바이러스 서열의 결실 또는 프레임-이동 돌연변이의 유도를 목표로 게놈의 측접한 보존된 영역의 표적화를 허용해야 하며, 이것은 바이러스 유전자 기능을 파괴할 것이다.

출원인은 숙주 면역 시스템의 종래의 아데노바이러스 또는 렌티바이러스-매개 감염에 의해서 CRISPR-Cas 시스템의 전달을 달성한다. 접근법에 따라서, 숙주 면역 세포는 a) 분리되고, CRISPR-Cas로 형질도입되고, 선택되고, 숙주에 재도입되거나, 또는 b) CRISPR-Cas 시스템의 전신 전달에 의해서 생체내 형질도입될 수 있었다. 처음 접근법은 내성 면역 집단의 생성을 허용하고, 두 번째 접근법은 숙주 내에서 잠복 바이러스 저장소를 더 잘 표적화한다.

실시예 16: 낭포성 섬유증에서 델타F508 또는 다른 돌연변이의 표적화된 보정

본 발명의 양태는 CRISPR-Cas 유전자 요법 입자와 생체적합성 제약학적 담체를 포함할 수 있는 제약 조성물을 제공한다. 다른 양태에 따라서, CFTR 유전자에 돌연변이를 가진 대상체의 치료를 위한 유전자 요법의 방법은 CRISPR-Cas 요법 입자의 치료적 유효량을 대상체의 세포에 투여하는 단계를 포함한다.

이 실시예는 아데노-연관 바이러스(AAV) 입자를 사용한, 낭포성 섬유증 또는 낭포성 섬유증 관련 증상으로 고통받는, 필요한 대상체 또는 환자의 기도에 CRISPR-Cas 시스템의 유전자 전달 또는 유전자 전달을 증명한다.

연구 설계: 필요한 대상체 또는 환자: 인간, 비-영장류 인간, 개, 고양이, 소, 말 및 다른 관련된 가축. 이 연구는 AAV 벡터에 의한 CRISPR-Cas 시스템의 유전자 전달의 효율을 시험한다. 출원인은 유전자 발현에 충분한 트랜스젠 수준을 결정하고, 델타508 또는 다른 CFTR-유도 돌연변이를 표적화하기 위해 Cas9 효소를 포함하는 CRISPR-Cas 시스템을 이용한다.

관련된 대상체는 자발 호흡을 하는 동안 기관지내 전달된 폐에 대한 에어로졸화된 AAV 벡터 시스템의 제약학적 유효량을 수용한다. 대조군 대상체는 내부 대조군 유전자를 가진 거짓 타입 dAAV 벡터 시스템의 등량을 수용한다. 벡터 시스템은 제약학적으로 허용되는 또는 생체적합성 제약학적 담체와 함께 전달될 수 있다. 벡터 투여 후 3주 뒤에 또는 적절한 시간 간격으로, 치료된 대상체가 낭포성 섬유증 관련 증상의 완화에 대해 시험된다.

출원인은 아데노바이러스 또는 AAV 입자를 사용한다.

출원인은 하나 이상의 아데노바이러스 또는 AAV 벡터 또는 어떤 다른 양립성 벡터에, 하나 이상의 조절 서열(Cas9의 경우 Cbh 또는 EF1a 프로모터, 키메라 가이드 RNA의 경우 U6 또는 H1 프로모터)에 각각 작동 가능하게 연결된, 다음의 유전자 작제물을 클로닝한다: CFTR델타508 표적화 키메라 가이드 RNA (도 13B), 델타508 돌연변이를 위한 수선 주형 (도 13C) 및 선택적으로 하나 이상의 핵 위치 신호 또는 서열(들)을 가진 코돈 최적화된 Cas9 효소 (NLS(들)), 예를 들어 두(2) 개의 NLS).

Cas9 표적 부위의 확인

출원인은 인간 CFTR 게놈 유전자좌를 분석했고, Cas9 표적 부위를 확인했다(도 13A). (PAM은 NGG 또는 NNAGAAW 모티프를 함유할 수 있다).

유전자 수선 전략

출원인은 앞서 논의된 전달 방법 중 하나를 통해서 대상체에 F508 잔기를 함유하는 상동체 수선 주형을 포함하는 아데노바이러스/AAV 벡터 시스템과 함께 Cas9 (또는 Cas9 닉카아제) 및 가이드 RNA를 포함하는 아데노바이러스/AAV 벡터 시스템을 도입한다. CRISPR-Cas 시스템은 CFTR델타508 키메라 가이드 RNA에 의해서 가이드되고, 흉터가 형성되거나 절단될 CFTR 게놈 유전자좌의 특정 부위를 표적화한다. 절단 후, 수선 주형이 낭포성 섬유증을 가져오거나 낭포성 섬유증 관련 증상을 야기하는 결실을 보정하는 상동성 재조합을 통해서 절단 부위에 삽입된다. 적절한 가이드 RNA에 의해 CRISPR 시스템의 전달을 지정하고 전신 도입을 제공하기 위한 이 전략은 표 B의 것들과 같은 대사성, 간, 신장 및 단백질 질환 및 장애를 야기하는 유전자를 편집하거나 조작하기 위해 유전자 돌연변이를 표적화하는데 이용한 수 있다.

실시예 17: 유전자 녹아웃 세포 라이브러리 생성

이 실시예는 각 세포가 단일 유전자 녹아웃을 가진 세포들의 라이브러리를 생성하는 방법을 증명한다:

출원인은 각 세포가 단일 유전자 녹아웃을 가진 ES 세포들의 라이브러리를 제작하며, 전체 ES 세포 라이브러리는 모든 단일 유전자 녹아웃을 가질 것이다. 이 라이브러리는 세포 과정뿐만 아니라 질환에서 유전자 기능의 스크리닝에 유용하다.

이 세포 라이브러리를 제작하기 위해서, 출원인은 유도성 프로모터(예를 들어, 독시사이클린 유도성 프로모터)에 의해서 유도된 Cas9를 ES 세포에 통합한다. 게다가, 출원인은 ES 세포의 특정 유전자를 표적화하는 단일 가이드 RNA를 통합한다. ES 세포 라이브러리를 제작하기 위해서, 출원인은 ES 세포를 인간 게놈에서 각 유전자를 표적화하는 가이드 RNA를 암호화하는 유전자의 라이브러리와 간단히 혼합한다. 출원인은 먼저 단일 BxB1 attB 부위를 인간 ES 세포의 AAVS1 유전자좌에 도입한다. 다음에, 출원인은 BxB1 인테그라제를 사용하여 AAVS1 유전자좌에서 BxB1 attB 부위에 각 가이드 RNA 유전자의 통합을 촉진한다. 통합을 촉진하기 위해서, 각 가이드 RNA 유전자는 단일 attP 부위를 지닌 플라스미드 상에 함유된다. 이 방식에서, BxB1은 게놈의 attB 부위와 플라스미드를 함유하는 가이드 RNA 상의 attP 부위를 조합할 것이다.

세포 라이브러리를 생성하기 위해서, 출원인은 통합된 단일 가이드 RNA를 가진 세포들의 라이브러리를 선택하여 Cas9 발현을 유도한다. 유도 후, Cas9는 가이드 RNA에 의해서 특정된 부위에 이중가닥 브레이크를 매개한다. 이 세포 라이브러리의 다양성을 검증하기 위해서, 출원인은 전체 엑솜 시퀀싱을 수행하며, 이로써 출원인이 모든 단일 표적화된 유전자에서 돌연변이를 관찰할 수 있도록 보장한다. 이 세포 라이브러리는 전체 라이브러리-기반 스크린을 포함하는 다양한 용도에 사용될 수 있거나, 또는 개별 인간 유전자 녹아웃을 가진 클론성 세포주의 신속한 생성을 촉진하기 위해서 개별 세포 클론으로 정렬할 수 있다.

실시예 18: Cas9를 사용한 미세조류의 조작

Cas9의 전달 방법

방법 1: 본 발명자들은 구성성 프로모터, 예를 들어, Hsp70A-Rbc S2 또는 베타2-투불린의 제어 하에 Cas9를 발현하는 벡터를 사용하여 Cas9 및 가이드 RNA를 전달한다.

방법 2: 본 발명자들은 구성성 프로모터, 예를 들어, Hsp70A-Rbc S2 또는 베타2-투불린의 제어 하에 Cas9 및 T7 중합효소를 발현하는 벡터를 사용하여 Cas9 및 T7 중합효소를 전달한다. 가이드 RNA는 가이드 RNA를 유도하는 T7 프로모터를 함유하는 벡터를 사용하여 전달될 것이다.

방법 3: 본 발명자들은 Cas9 mRNA 및 시험관내 전사된 가이드 RNA를 조류 세포로 전달한다. RNA는 시험관내 전사될 수 있다. Cas9 mRNA는 Cas9에 대한 코딩 영역, 및 Cop1으로부터의 3'UTR로 구성되어, Cas9 mRNA의 안정화를 보장할 것이다.

상동성 재조합을 위하여, 본 발명자들은 추가의 상동성 유도 수복 주형을 제공한다.

베타-2 투불린 프로모터에 이어서 Cop1의 3' UTR의 제어 하에 Cas9의 발현을 유도하는 카세트에 대한 서열

베타-2 투불린 프로모터에 이어서 Cop1의 3' UTR의 제어 하에 T7 중합효소의 발현을 유도하는 카세트에 대한 서열:

T7 프로모터(T7 프로모터, Ns는 표적 부위를 나타냄)에 의해 유도되는 가이드 RNA의 서열:

유전자 전달:

클라미도모나스(Chlamydomonas) 자원 센터로부터의 클라미도모나스 라인하르티이(Chlamydomonas reinhardtii) 균주 CC-124 및 CC-125는 전기천공법을 위해 사용될 것이다. 전기천공법 프로토콜은 진아트(GeneArt) 클라미도모나스 조작 키트로부터의 표준 권고 프로토콜을 따른다.

또한, 본 발명자들은 Cas9를 구성적으로 발현하는 클로미도모나스 라인하르티이의 세포주를 생성한다. 이는 pChlamy1(PvuI을 사용하여 선형화)을 사용하고, 하이그로마이신 내성 콜로니를 선택하여 행해질 수 있다. Cas9를 함유하는 pChlamy1에 대한 서열은 하기에 나타나 있다. 이러한 방식으로 유전자 낙아웃을 달성하기 위하여, 간단하게 가이드 RNA를 위해 RNA를 전달할 필요가 있다. 상동성 재조합을 위하여, 본 발명자들은 가이드 RNA 및 선형화된 상동성 재조합 주형을 전달한다.

pChlamy1-Cas9:

모든 변형된 클로미도모나스 라인하르티이 세포에 있어서, 본 발명자들은 PCR, 서베이어 뉴클레아제 검정 및 DNA 시퀀싱을 사용하여, 성공적인 변형을 확인하였다.

실시예 19: 다양한 질환 타입을 표적화하기 위한 Cas9의 사용

단백질 암호화 서열에 돌연변이를 포함하는 질환:

우성 질환은 우성 음성 대립유전자를 비활성화함으로써 표적화될 수 있다. 출원인은 우성 음성 대립유전자에서 특유의 서열을 표적화하고 NHEJ를 통해 돌연변이를 도입하기 위해서 Cas9를 사용한다. NHEJ-유도된 삽입결실부는 우성 음성 대립유전자에 프레임-이동 돌연변이를 도입하고, 우성 음성 단백질을 제거할 수 있다. 이것은 유전자가 하프로-충분인 경우 수행할 수 있다(예를 들어, MYOC 돌연변이 유도된 녹내장 및 헌팅턴병).

열성 장애는 두 대립유전자에서 질환 돌연변이를 수선함으로써 표적화될 수 있다. 분열하는 세포의 경우, 출원인은 돌연변이 부위 근처에 이중가닥 브레이크를 도입하기 위해 Cas9를 사용하고, 외인성 재조합 주형을 사용하여 상동성 재조합의 비율을 증가시킨다. 분열하는 세포의 경우, 이것은 복합적인 닉카아제 활성을 사용하여 달성될 수 있으며, 이로써 상보성 돌출부를 지닌 외인성 DNA 단편의 NHEJ-매개 결찰을 통해서 두 대립유전자에서 돌연변이 서열의 치환을 촉매할 수 있다.

또한, 출원인은 보호 돌연변이를 도입하기 위해 Cas9를 사용한다(예를 들어, HIV 감염을 방지하기 위한 CCR5의 비활성화, 콜레스테롤 감소를 위한 PCSK9의 비활성화, 또는 알츠하이머병의 가능성을 감소시키기 위한 APP에 A673T의 도입).

비-암호화 서열을 수반하는 질환

출원인은 프로모터 영역에서 비-암호화 서열을 파괴하고, 전사 인자 결합 부위를 변경하고, 인핸서 또는 억제인자 요소를 변경하기 위해서 Cas9를 사용한다. 예를 들어, Cas9는 조혈 줄기세포에서 Klf1 인핸서 EHS1을 삭제하기 위해 사용될 수 있으며, 이로써 BCL11a 수준이 감소하고, 분화된 적혈구에서 글로빈 유전자 발현을 재활성화할 수 있다.

출원인은 또한 5' 또는 3' 미번역 영역에서 기능적 모티프를 파괴하기 위해서 Cas9를 사용한다. 예를 들어, 근긴장 디스트로피의 치료를 위해, Cas9는 DMPK 유전자에서 CTG 반복부 확장을 제거하기 위해서 사용될 수 있다.

실시예 20: 복합화된 닉카아제

본 출원에서 상세히 설명된 Cas9의 최적화 및 교시의 양태는 또한 Cas9 닉카아제를 생성하기 위해서 사용될 수 있다. 출원인은 규정된 돌출부를 가진 DNA 이중가닥 브레이크를 생성하기 위해서 가이드 RNA의 쌍과 조합하여 Cas9 닉카아제를 사용한다. 두 쌍의 가이드 RNA가 사용되는 경우, 개재 DNA 단편을 삭제하는 것이 가능하다. DNA의 외인성 조각이 두 쌍의 가이드 RNA에 의해서 절단되어 게놈 DNA를 가진 양립성 돌출부가 생성된다면, 삭제된 단편을 대체하기 위해서 외인성 DNA 단편이 게놈 DNA와 결찰될 수 있다. 예를 들어, 이것은 헌팅턴병을 치료하기 위해 헌팅틴 (HTT) 유전자에서 트리뉴클레오티드 반복부 확장을 제거하는데 사용될 수 있다.

소수의 CAG 반복부를 지닌 외인성 DNA가 제공된다면, 그것은 동일한 돌출부를 지닌 DNA의 단편을 생성할 수 있고, HTT 게놈 유전자좌에 결찰되어 삭제된 단편을 대체할 수 있다.

게놈에 외인성 DNA 단편의 결찰은 상동성 재조합 기구를 필요로 하지 않으며, 따라서 이 방법은 뉴런과 같은 유사분열 후 세포에 사용될 수 있다.

실시예 21: CRISPR 시스템의 전달

Cas9 및 그것의 키메라 가이드 RNA, 또는 tracr RNA와 crRNA의 조합은 DNA 또는 RNA로서 전달될 수 있다. 둘 다 RNA (정상 또는 염기 또는 백본 변형을 함유하는) 분자로서 Cas9 및 가이드 RNA의 전달은 Cas9 단백질이 세포에 체류하는 시간량을 감소시키기 위해서 사용될 수 있다. 이것은 표적 세포에서 표적외 절단 활성의 수준을 감소시킬 수 있다. mRNA로서 Cas9의 전달은 단백질로 번역되는데 시간이 걸리므로, Cas9 mRNA의 전달 수시간 후에 가이드 RNA를 전달하는 것이 유익할 수 있으며, 이로써 Cas9 단백질과의 상호작용에 이용할 수 있는 가이드 RNA의 수준을 최대화할 수 있다.

가이드 RNA 양이 제한된 상황에서, Cas9는 mRNA로서, 가이드 RNA는 가이드 RNA의 발현을 추진하는 프로모터를 가진 DNA 발현 카세트의 형태로서 도입하는 것이 바람직할 수 있다. 이 방식으로, 이용할 수 있는 가이드 RNA의 양이 전사를 통해 증폭될 것이다.

다양한 전달 시스템이 숙주 세포에 Cas9 (DNA 또는 RNA) 및 가이드 RNA (DNA 또는 RNA)를 도입하기 위해서 소개될 수 있다. 이들은 리포좀, 바이러스 벡터, 전기천공, 나노입자, 나노와이어(Shalek et al., Nano Letters, 2012), 엑소좀의 사용을 포함한다. 분자 트로잔 호스 리포좀(Pardridge et al., Cold Spring Harb Protoc; 2010; doi:10.1101/pdb.prot5407)이 혈액 뇌 장벽을 가로질러 Cas9와 가이드 RNA를 전달하기 위해서 사용될 수 있다.

실시예 22: Cas9 오솔로그

본 출원인들은 상관 있는 PAM 서열들과 상응하는 키메라 가이드 RNA들을 동정하기 위해 Cas9 오솔로그들을 분석하였다(도 3a 내지 도 3d 및 도 4a 내지 도 4f). PAM의 증폭된 세트들은 게놈 전체에 걸쳐 더욱 광범위한 표적화를 제공할 수 있으며, 또한 유일무이한 표적 위치들의 수를 유의적으로 증가시킬 수 있을 뿐만 아니라, 게놈 내 특이성 수준을 높이면서 신규 Cas9들을 동정할 잠재성을 제공한다. 출원인들은 스타필로코커스 아우레우스 종 아우레우스 Cas9에 대한 PAM이 NNGRR임을 확인하였다. 스타필로코커스 아우레우스 종 아우레우스 Cas9는 또한 SaCas9로도 알려져 있다.

Cas9 오솔로그들의 특이성은, 각각의 Cas9가 가이드 RNA와 이의 DNA 표적 사이에 생기는 미스매치를 관용하는 능력이 테스트됨으로써 평가될 수 있다. 예를 들어 SpCas9의 특이성은, 가이드 RNA 내 돌연변이들의 절단 효율에 대한 영향력이 테스트됨으로써 특성규명되었다. 가이드 서열과 표적 DNA 사이의 단일 또는 다수 미스매치를 포함하는 가이드 RNA 라이브러리들이 제조되었다. 이와 같은 발견들이 기반이 되었을 때, SpCas9에 대한 표적 위치들은 다음의 지침들에 따라서 선택될 수 있다:

특정 유전자 편집에 대한 SpCas9의 특이성이 최대화되기 위해서는, 관심 있는 유전자 좌 내 표적 위치가 선택되어야 하므로, 잠재적 '탈 표적' 게놈 서열들은 다음과 같은 4 가지 제약 조건들을 준수한다: 첫 번째 제약 조건으로서 가장 우선되어야 하는 것은, 상기 잠재적 '탈 표적' 게놈 서열들은 5'-NGG 또는 NAG 서열들 중 어느 하나를 가지는 PAM이 뒤따르지 않아야 한다는 것이다. 두 번째 제약 조건은, 상기 잠재적 '탈 표적' 게놈 서열들의 표적 서열에 대한 전반적 서열 유사성이 최소화되어야 한다는 것이다. 세 번째 제약 조건은, 최대 수의 미스매치들이 탈 표적 위치의 PAM 근위 영역 내에 있어야 한다는 것이다. 마지막 제약 조건은, 최대 수의 미스매치들은 연속으로 존재하거나 4 개 미만의 염기들을 간격으로 두고 배치되어야 한다는 것이다.

다른 Cas9 오솔로그들의 특이성을 평가하고, 표적 종들의 게놈들 내에 존재하는 특이 표적 위치들을 선택하기 위한 기준을 확립하기 위해서, 유사한 방법들이 사용될 수 있다.

실시예 23: 트리뉴클레오티드 반복부 장애를 위한 치료 전략

본 출원에서 앞서 언급된 대로, CRISPR 복합체의 표적 폴리뉴클레오티드는 다수의 질환-관련 유전자 및 폴리뉴클레오티드를 포함할 수 있고, 이들 질환 관련 유전자의 일부는 트리뉴클레오티드 반복부 장애라고 하는 일련의 유전적 장애에 속할 수 있다(트리뉴클레오티드 반복부 확장 장애, 삼중 반복부 확장 장애 또는 코돈 반복 장애라고도 한다).

이들 질환은 특정 유전자의 트리뉴클레오티드 반복부가 정상적인 안정한 역치를 초과하는 돌연변이에 의해서 야기되며, 이것은 보통 유전자마다 상이할 수 있다. 더 많은 반복부 확장 장애의 발견은 기본적인 유사한 특징에 기초하여 다수의 범주로 이들 장애를 분류하는 것을 허용했다. 특정 유전자의 단백질-코딩 부분에서 CAG 반복부 확장에 의해서 야기되는 헌팅턴병 (HD)과 척수소뇌성 실조증은 범주 I에 포함된다. 표현형적으로 다양해지는 경향이 있으며 보통 규모가 작고 유전자의 엑손에서 발견되는 확장을 포함하는 확장을 가진 질환 또는 장애는 범주 III에 포함된다. 범주 III는 범주 I 또는 II보다 훨씬 더 큰 반복부 확장에 의해서 특정되며, 일반적으로 단백질 코딩 영역 밖에 위치된 질환 또는 장애를 포함한다. 범주 III 질환 또는 장애의 예들은, 제한은 아니지만 취약 X 증후군, 근긴장 디스트로피, 두 가지의 척수소뇌성 실조증, 소아 근간대성 간질, 및 프리드라이히 운동실조를 포함한다.

아래 프리드라이히 운동실조에 대해서 언급한 것과 같은 유사한 치료 전략이 다른 트리뉴클레오티드 반복부 또는 확장 장애를 다루기 위해서 또한 채택될 수 있다. 예를 들어, 거의 동일한 전략을 사용하여 치료될 수 있는 다른 삼중 반복부 질환은 근긴장 디스트로피 1 (DM1)인데, 이 경우 3' UTR에 확장된 CTG 모티프가 있다. 프리드라이히 운동실조에서, 이 질환은 프라탁신 (FXN)의 제1 인트론에서 GAA 트리뉴클레오티드의 확장의 결과이다. CRISPR을 사용한 한 가지 치료 전략은 제1 인트론으로부터 GAA 반복부를 삭제하는 것이다. 확장된 GAA 반복부는 DNA 구조에 영향을 미치는 것으로 생각되며, 프라탁신 유전자로 바뀌는 헤테로크로마틴의 형성을 초래한다(도 14a).

다른 치료 전략을 능가하는 경쟁적 이점이 아래 열거된다:

질환이 프라탁신의 감소된 발현으로 인한 것이므로 siRNA 녹다운은 이 경우 적용될 수 없다. 바이러스 유전자 요법이 현재 조사중이다. HSV-1-기반 벡터가 동물 모델에 프라탁신 유전자를 전달하기 위해 사용되었고 치료 효과를 나타냈다. 그러나, 바이러스-기반 프라탁신 전달의 장기적 효율은 몇 가지 문제를 가지는데, 첫째 건강한 개체에서의 자연적 수준과 일치하도록 프라탁신의 발현을 조절하는 것이 어렵고, 둘째 프라탁신의 장기간 발현은 세포 사멸을 초래한다.

뉴클레아제는 건강한 유전자형을 회복하기 위하여 GAA 반복부를 삭제하기 위해서 사용될 수 있지만, 징크 핑거 뉴클레아제 및 TALEN 전략은 전달과 뉴클레아제 조작에서 모두 상이한 두 쌍의 고 효율 뉴클레아제의 전달을 필요로 한다(ZFN 또는 TALEN에 의한 게놈 DNA의 효과적인 삭제는 달성하는 것이 어렵다).

상기 전략과 달리, CRISPR-Cas 시스템은 명백한 이점을 가진다. Cas9 효소는 더 효과적이며 더 복합적인데, 이것은 하나 이상의 표적이 동시에 설정될 수 있다는 의미이다. 지금까지 인간 세포에서 Cas9에 의한 30%를 초과하는 게놈 DNA의 유효 정확도는 30%만큼 높을 수 있으며, 향후 개선될 수 있다. 또한, 헌팅턴병(HD)과 같은 특정 트리뉴클레오티드 반복부 장애와 관련해서, 코딩 영역의 트리뉴클레오티드 반복부는 두 대립유전자에 차이가 있는 경우 다뤄질 수 있다. 구체적으로, HD 환자가 돌연변이 HTT에 이형접합성이고, wt과 야생형 HTT 대립유전자 사이에 SNP와 같은 뉴클레오티드 차이가 있는 경우, 돌연변이 HTT 대립유전자를 특이적으로 표적화하기 위해서 Cas9가 사용될 수 있다. ZFN 또는 TALEN은 단일 염기 차이에 기초하여 두 대립유전자를 구별할 수 있는 능력을 갖지 않을 것이다.

프리드라이히 운동실조를 다루기 위해 CRISPR-Cas9 효소를 사용한 전략을 채택하는데 있어서, 출원인은 GAA 확장이 측접한 부위를 표적화하는 다수의 가이드 RNA를 설계하고, 가장 효과적이며 특이적인 것이 선택된다(도 14b).

출원인은 GAA 확장 영역의 정확성을 매개하기 위해서 Cas9와 함께 FXN의 인트론 1을 표적화하는 가이드 RNA의 조합을 전달한다. 척수에서 Cas9의 효과적인 전달을 매개하기 위해서 AAV9가 사용될 수 있다.

Gaa 확장에 인접한 Alu 요소가 중요하다고 고려된다면, 표적화될 수 있는 부위의 수에 제약이 있을 수 있지만, 출원인은 그것의 파괴를 피하기 위해서 전략을 수정할 수 있다.

대안적 전략:

Cas9를 사용하여 게놈을 변형하는 것이 아니라, 출원인은 또한 FXN 유전자에 전사 활성화 도메인을 표적화하기 위해서 Cas9 (뉴클레아제 활성 결핍)-기반 DNA 결합 도메인을 사용하여 FXN 유전자를 직접 활성화할 수 있다. 출원인들은 Cas9 매개 인위적 전사 활성화가, 다른 방법들과 비교되었을 때 충분히 활발하게 이루어지는 것을 보장하기 위해, 상기 Cas9 매개 인위적 전사 활성화의 활발함을 다루어야만 할지도 모른다[Tremblay et al., Transcription Activator-Like Effector Proteins Induce the Expression of the Frataxin Gene; Human Gene Therapy. August 2012, 23(8): 883-890].

실시예 24: Cas9 닉카아제를 사용한 표적외 절단을 최소화하기 위한 전략

본 출원에서 앞서 언급된 대로, Cas9는 다음의 돌연변이 중 하나 이상을 통해서 단일가닥 절단을 매개하기 위해 돌연변이될 수 있다: D10A, E762A, 및 H840A.

NHEJ를 통한 유전자 녹아웃을 매개하기 위해서, 출원인은 두 가이드 RNA와 함께 Cas9의 닉카아제 버전을 사용한다. 각 개별 가이드 RNA에 의한 표적외 흉터형성은 일차적으로 돌연변이 없이 수선될 수 있고, 이중가닥 브레이크 (이것은 NHEJ를 통해 돌연변이를 초래할 수 있다)는 표적 부위가 서로 인접해 있을 때만 발생한다. 이중 흉터형성에 의해서 도입된 이중가닥 브레이크는 블런트 형태가 아니므로, TREX1과 같은 단부-가공 효소의 공-발현이 NHEJ 활성의 수준을 증가시킬 것이다.

표에서 다음의 표적 리스트는 다음의 질환에 수반되는 유전자에 대한 것이다:

라포라병 - 뉴런에서 글리코겐을 감소시키기 위한 표적 GSY1 또는 PPP1R3C (PTG)

고콜레스테롤혈증 - 표적 PCSK9

표적 서열은 스페이서에 상이한 수의 뉴클레오티드 (0 내지 3 bp)를 가진 쌍들 (L 및 R)로 열거된다. 표적 유전자좌에 이중가닥 브레이크를 도입하기 위해 각 스페이스는 또한 단독으로 야생형 Cas9와 사용될 수 있다.

가이드 RNA의 안정성을 개선하고 특이성을 증가시키기 위한 다른 전략

1. 가이드 RNA의 5'의 뉴클레오티드는 천연 RNA에서와 같이 포스포에스테르 결합이 아니라 티오에스테르 결합을 통해서 연결될 수 있다. 티오에스테르 결합은 가이드 RNA가 내인성 RNA 분해 기구에 의해서 소화되는 것을 방지할 수 있다.

2. 가이드 RNA의 가이드 서열(5' 20 bp)의 뉴클레오티드는 결합 특이성을 개선하기 위해 염기로서 브릿지 핵산 (BNA)을 사용할 수 있다.

실시예 25: 신속하며 복합적인 게놈 편집을 위한 CRISPR - Cas

본 발명의 양태는 유전자 변형의 효율 및 특이성이 표적 설계 후 3-4일 내에 시험될 수 있고, 변형된 클론성 세포주가 2-3주 내에 유도될 수 있는 프로토콜 및 방법에 관한 것이다.

프로그램가능한 뉴클레아제는 높은 정확도로 게놈 변경을 매개하기 위한 강력한 기술이다. 미생물 CRISPR 후천 면역 시스템으로부터의 RNA-가이드된 Cas9 뉴클레아제는 그것의 가이드 RNA에서 20-nt 표적화 서열을 간단히 특정함으로써 진핵 세포에서의 효과적인 게놈 편짐을 촉진하는데 사용될 수 있다. 출원인은 포유류 세포에서 게놈 편집을 촉진하고, 하류 기능 연구를 위한 세포주를 생성하기 위해 Cas9를 적용하는 일련의 프로토콜을 설명한다. 표적 설계에서 시작하여 효과적이며 특이적인 유전자 변형이 3-4 일 내에 달성될 수 있고, 변형된 클론성 세포주가 2-3 주 내에 유도될 수 있다.

생물학적 시스템과 유기체를 조작하는 능력은 기초과학, 의학 및 생물기술 분야에서의 용도에서 상당한 잠재력을 보유한다. 내인성 게놈 유전자좌의 정확한 편집을 촉진하는 프로그램가능한 서열-특이적 엔도 뉴클레아제가 이전에 유전적으로 다룰 수 없었던 것들을 포함해서 광범위한 종들에서 유전자 요소 및 결과적인 변형에 대한 현재 가능한 체계적 의제이다. 징크 핑거 뉴클레아제(ZFN), 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 및 RNA-가이드 CRISPR-Cas 뉴클레아제 시스템을 포함하여 많은 게놈 편집 기술이 최근 몇년간 출몰했다. 처음의 두 가지 기술은 특이적 게놈 유전자좌에 표적화된 DNA 이중가닥 브레이크 (DSB)를 유도하기 위해서 모듈형 DNA-결합 단백질에 엔도뉴클레아제 촉매 도메인을 매다는 공통된 전략을 사용한다. 반대로, Cas9는 표적 DNA와의 왓슨-크릭 염기쌍을 통해서 작은 RNA에 의해 가이드된 뉴클레아제로서, 설계가 쉽고 효과적이며 다양한 세포 타입과 유기체에 대한 고-처리량 및 복합적 유전자 편집에 아주 적합한 시스템을 제시한다. 여기서 출원인은 포유류 세포에서 효과적인 게놈 편집을 촉진하고, 하류 기능 연구를 위한 세포주를 생성하기 위해 최근 개발된 Cas9 뉴클레아제를 적용하기 위한 일련의 프로토콜을 설명한다.

ZFN 및 TALEN와 마찬가지로, Cas9는 표적 게놈 유전자좌에서 DSB를 자극함으로써 게놈 편집을 촉진한다. Cas9에 의한 절단시 표적 유전자좌는 DNA 손상 수선을 위한 두 가지 주요 경로, 즉 에러-경향 비-상동성 단부 연결 (NHEJ) 또는 고 충실도 상동체 지정 수선 (HDR) 경로 중 하나를 거친다. 두 경로 모두 바람직한 편집 결과를 달성하기 위해서 이용할 수 있다.

NHEJ: 수선 주형의 부재하에, NHEJ 과정은 DSB를 재결찰하며, 이것은 삽입결실부 돌연변이 형태의 흉터를 남길 수 있다. 이 과정은 유전자 녹아웃을 달성하기 위해서 활용할 수 있으며, 코딩 엑손 내에 발생한 삽입결실부는 프레임시프트 돌연변이와 조기성숙 중단 코돈을 초래할 수 있다. 다중 DBS가 또한 게놈에 더 큰 결실을 매개하기 위해서 이용될 수 있다.

HDR: 상동체 지정 수선은 NHEJ의 대안인 중요한 DNA 수선 경로이다. HDR은 통상적으로 NHEJ보다 낮은 빈도로 일어나지만, 그것은 외인성 도입된 수선 주형의 존재하에 표적 유전자좌에 정확하며 한정된 변형을 생성하기 위해서 이용될 수 있다. 수선 주형은 삽입 서열이 측접된 상동체 암을 가진 종래의 DNA 표적화 작제물과 유사하게 설계된, 이중가닥 DNA의 형태이거나, 또는 단일가닥 DNA 올리고뉴클레오티드 (ssODN)일 수 있다. 후자는 결과적인 유전자 변형을 검사하기 위한 단일 뉴클레오티드 돌연변이의 도입과 같은, 게놈에 작은 편집부를 만들기 위한 효과적이며 간단한 방법을 제공한다. NHEJ와는 달리, HDR는 일반적으로 분열하는 세포에서만 활성이고, 그것의 효율은 세포 타입 및 상태에 따라 다양하다.

CRISPR의 개요: 반대로, CRISPR-Cas 시스템은 Cas9 뉴클레아제 및 짧은 가이드 RNA로 구성된 최소 2-구성성분 시스템이다. 상이한 유전자좌에 Cas9의 재표적화 또는 다중 유전자의 동시 편집은 단순히 상이한 20-bp 올리고뉴클레오티드의 클로닝을 필요로 한다. Cas9 뉴클레아제의 특이성은 더 충분히 해명되어야 하지만, CRISPR-Cas 시스템의 간단한 왓슨-크릭 염기쌍이 ZFN 또는 TALEN 도메인보다 더 잘 예측할 수 있을 것 같다.

타입 II CRISPR-Cas (군락화된 규칙적으로 산재된 짧은 팔린드롬형 반복부)는 외래 유전자 요소를 절단하기 위해 Cas9를 사용하는 박테리아 후천 면역 시스템이다. Cas9는 한 쌍의 비-코딩 RNA, 가변 crRNA 및 필요한 보조 tracr RNA에 의해서 가이드된다. crRNA는 20-nt 가이드 서열을 함유하고, 왓슨-크릭 염기쌍을 통해 표적 DNA를 위치시킴으로써 특이성을 결정한다. 자생 박테리아 시스템에서, 다중 crRNA는 다양한 표적에 대해 Cas9를 지정하기 위해서 공-전사된다. Streptococcus pyogenes 로부터 유래된 CRISPR-Cas 시스템에서, 표적 DNA는 5'-NGG/NRG 프로토스페이서 인접 모티프(PAM) 바로 앞에 선행해야 하며, 이것은 다른 CRISPR 시스템의 경우 변할 수 있다.

CRISPR-Cas는 인간 코돈-최적화된 Cas9와 필수 RNA 구성성분의 이종성 발현을 통해서 포유류 세포에서 재구성된다. 또한, crRNA와 tracrRNA가 키메라 합성 가이드 RNA (sgRNA)를 생성하기 위해서 융합될 수 있다. 따라서, Cas9는 sgRNA 내에서 20-nt 가이드 서열을 변경함으로써 관심대상의 어떤 표적을 향해 재지정될 수 있다.

실시 용이성과 복합적 능력이 주어진 경우, Cas9는 NHEJ와 HDR 모두를 통해 특이적 돌연변이를 지닌 유전자 조작된 진핵 세포를 생성하기 위해 사용되었다. 게다가, 배아에 sgRNA 및 Cas9를 암호화하는 mRNA의 직접 주입은 다수의 변형된 대립유전자를 가진 유전자이식 마우스의 신속한 발생을 가능하게 했으며, 이들 결과는 유전적으로 다루기 어려운 유기체를 편집하는 것에 대한 가능성을 가진다.

촉매 도메인 중 하나가 파괴된 돌연변이 Cas9는 DNA를 절단하는 것이 아니라 흠집을 내도록 유전자 조작되었으며, 이것은 단일가닥 브레이크와 HDR을 통한 우선적 수선을 허용하고, 잠재적으로 표적외 DSB로부터의 원치않는 삽입결실부 돌연변이를 완화한다. 추가로, DNA-절단 촉매 잔기가 둘 다 돌연변이된 Cas9 돌연변이는 이콜라이에서의 전사 조절을 가능하게 하도록 개조되었으며, 이것은 다양한 용도에 대한 기능화된 Cas9의 잠재성을 증명한다. 본 발명의 특정 양태는 인간 세포의 복합적인 편집을 위한 Cas9의 구성 및 적용에 관한 것이다.

출원인은 진핵생물 유전자 편집을 촉진할 수 있는 인간 코돈-최적화된, 핵 위치 서열-측접된 Cas9를 제공했다. 출원인은 20-nt 가이드 서열의 설계를 위한 고려사항, sgRNA의 신속한 구성 및 기능적 검증을 위한 프로토콜, 및 마지막으로 인간 배아 신장 (HEK-293FT) 및 인간 줄기세포 (HUES9) 계통에서 NHEJ- 및 HDR-기반 게놈 변형을 모두 매개하기 위한 Cas9 뉴클레아제의 사용을 설명한다. 이 프로토콜은 다른 세포 타입 및 유기체에도 마찬가지로 적용될 수 있다.

sgRNA를 위한 표적 선택: 유전자 표적화를 위한 20-nt 가이드 서열의 선택에는 두 가지 중요한 고려사항이 있다: 1) S. pyogenes Cas9의 경우 표적 서열이 5'-NGG PAM 앞에 와야 하고, 2) 가이드 서열은 표적외 활성을 최소화하도록 선택되어야 한다. 출원인은 관심대상의 투입 서열을 취해서 적합한 표적 부위를 확인하는 온라인 Cas9 표적화 디자인 툴을 제공했다. 각 sgRNA에 대한 표적외 변형을 실험적으로 평가하기 위해서, 출원인은 또한 각 의도된 표적에 대한 표적외 부위를 컴퓨터로 예측하고, 출원인의 정량적 특이성 분석에 따라서 염기쌍 미스매치 확인, 위치 및 분포의 영향에 순서를 매겼다.

컴퓨터로 예측된 표적외 부위에 대한 상세한 정보는 다음과 같다:

표적외 절단 활성을 위한 고려사항: 다른 뉴클레아제와 유사하게, Cas9는 감소된 빈도로 게놈에서 표적외 DNA 표적을 절단할 수 있다. 주어진 가이드 서열이 표적외 활성을 나타내는 정도는 효소 농도, 이용된 특정 가이드 서열의 열역학, 및 표적 게놈에서 유사한 서열의 풍부성을 포함하는 요인들의 조합에 따른다. Cas9의 통상적 용도에서, 표적외 절단 정도를 최소화하고, 또한 표적외 절단의 존재를 검출할 수 있는 방식을 고려하는 것이 중요하다.

표적외 활성 최소화: 세포주에서의 용도를 위해서, 출원인은 표적외 게놈 변형의 정도를 감소시키기 위해 다음의 두 단계를 추천했다. 먼저, 우리의 온라인 CRISPR 표적 선택 도구를 사용하여 주어진 가이드 서열이 표적외 부위를 가질 가능성을 컴퓨터로 평가하는 것이 가능하다. 이들 분석은 가이드 서열과 유사한 서열인 표적외 서열에 대해 게놈에서 철저한 검색을 통해 수행된다. sgRNA와 그것의 표적 DNA 사이에 미스매칭 염기의 효과에 대한 포괄적인 실험적 조사는 미스매치 용인성이 1) 위치 의존적 (가이드 서열의 3' 단부에서 8-14 bp는 5' 염기보다 미스매치에 덜 용인성이다), 2) 양 의존적(일반적으로 3 개를 초과하는 미스매치는 용인되지 않는다), 3) 가이드 서열 의존적(일부 가이드 서열은 다른 것보다 미스매치에 덜 용인성이다), 및 4) 농도 의존적 (표적외 절단은 트랜스펙션된 DNA의 양에 매우 민감하다)이라는 것을 드러냈다. 출원인의 표적 부위 분석 웹 도구(웹사이트 genome-engineering.org/tools에서 이용가능)는 표적 게놈에서 가능성 있는 표적외 부위에 대한 예측을 제공하기 위해 이들 기준을 통합한다. 두 번째, 출원인은 표적외 활성을 최소화하기 위해서 Cas9 및 sgRNA 발현 플라스미드의 양을 적정할 것을 추천했다.

표적외 활성의 검출: 출원인의 CRISPR 표적화 웹 도구를 사용하여 가장 가능성 있는 표적외 부위와 이들 부위의 서베이어 또는 시퀀싱 분석을 수행하는 프라이머의 리스트를 생성하는 것이 가능하다. Cas9를 사용하여 생성된 동질유전자 클론의 경우, 출원인은 어떤 바람직하지 않은 돌연변이를 점검하기 위해 이들 후보 표적외 부위를 시퀀싱할 것을 강력하게 추천했다. 예측된 후보 리스트에 포함되지 않은 부위에 표적외 변형이 있을 수 있으며, 표적외 부위의 부재를 완벽히 검증하기 위해 완전한 게놈 서열에 대해 수행되어야 한다는 것은 그럴만하다. 또한, 몇 개의 DSB가 동일한 게놈 내에 유도되는 복합적 분석에서, 전위 사건은 낮은 비율로 있을 수 있으며, 심층 시퀀싱과 같은 다양한 기술을 사용하여 평가될 수 있다.

온라인 툴은 1) sgRNA 작제물을 제조하고, 2) 표적 변형 효율을 분석하고, 3) 잠재적 표적외 부위에서 절단을 평가하는데 필요한 모든 올리고 및 프라이머의 서열을 제공한다. sgRNA를 발현하는데 사용된 U6 RNA 폴리머라제 III 프로모터는 그것의 전사체의 제1 염기로서 구아닌 (G) 뉴클레오티드를 선호하기 때문에, 20-nt 가이드 서열이 G로 시작하지 않는 경우 가외의 G가 sgRNA의 5'에 덧붙는 것이 좋다.

sgRNA 구성 및 전달을 위한 접근법: 원하는 용도에 따라서, sgRNA는 다음과 같이 전달될 수 있다: 1) 발현 카세트를 함유하는 PCR 앰플리콘 또는 2) sgRNA-발현 플라스미드. PCR-기반 sgRNA 전달은 U6 프로모터 주형을 증폭하는데 사용된 역 PCR 프라이머 상에 맞춤된 sgRNA 서열을 덧붙인다. 결과의 앰플리콘은 Cas9를 함유하는 플라스미드 (PX165)와 공-트랜스펙션될 수 있다. 이 방법은 다수의 후보 sgRNA의 신속한 스크리닝에 최적인데, 기능 시험을 위한 세포 트랜스펙션이 sgRNA-암호화 프라이머를 얻은 후 단지 수 시간 내에 수행될 수 있기 때문이다. 이 간단한 방법은 플라스미드-기반 클로닝 및 서열 검증에 대한 필요성을 배제하기 때문에, 대형 녹아웃 라이브러리를 생성하기 위해 상당수의 sgRNA를 시험하거나 공-트랜스펙션하는 경우나 다른 규모-민감성 용도에 아주 적합하다. sgRNA-암호화 프라이머는 플라스미드-기반 sgRNA 전달에 필요한 약 20-bp 올리고와 비교하여 100-bp를 넘는다는 것이 주지된다.

sgRNA를 위한 발현 플라스미드의 구성도 역시 간단하고 신속하며, 부분적으로 상보성인 올리고뉴클레오티드 쌍을 사용한 단일 클로닝 단계를 수반한다. 올리고 쌍의 아닐링 후, 결과의 가이드 서열이 Cas9를 지닌 플라스미드와 sgRNA 서열의 나머지를 지닌 비변이 스캐폴드 (PX330)에 삽입될 수 있다. 트랜스펙션 플라스미드도 생체내 전달을 위한 바이러스 생산을 가능하게 하도록 변형될 수 있다.

PCR 및 플라스미드-기반 전달 방법에 더하여, Cas9와 sgRNA는 둘 다 RNA로서 세포에 도입될 수 있다.

수선 주형 설계: 전통적으로, 표적화된 DNA 변형은 변경 부위의 측접한 상동체 암을 함유하는 플라스미드-기반 도너 수선 주형의 사용이 필요했다. 각 사이드에서 상동체 암은 길이가 다양할 수 있지만, 통상적으로 500 bp를 초과한다. 이 방법은 형광 단백질 또는 항생물질 내성 마커와 같은 리포터 유전자의 삽입을 포함하여 큰 변형을 생성하기 위해서 사용될 수 있다. 표적화 플라스미드의 설계 및 구성은 다른 곳에서 설명되었다.

더 최근에는, 단일가닥 DNA 올리고뉴클레오티드 (ssODN)가 클로닝 없이 한정된 유전자좌 내에서 짧은 변형을 위해 표적화 플라스미드 대신 사용되었다. 높은 HDR 효율을 달성하기 위해서, ssODN는 각 사이드에 적어도 40 bp의 측면 서열을 함유하며, 이들은 표적 영역에 상동성이고, 표적 유전자좌에 대해 센스 또는 안티센스 방향으로 방향화될 수 있다.

기능 시험

서베이어 뉴클레아제 분석: 출원인은 서베이어 뉴클레아제 분석 또는 PCR 앰플리콘 시퀀싱에 의해서 삽입결실부 돌연변이를 검출했다. 출원인의 온라인 CRISPR 표적 디자인 툴은 두 접근법을 위해 추천된 프라이머를 제공한다. 그러나, 서베이어 또는 시퀀싱 프라이머는 또한 게놈 DNA로부터 관심대상의 영역을 수동으로 증폭하고, NCBI 프라이머-BLAST를 사용하여 비-특이적 앰플리콘을 피할 수 있도록 설계될 수 있다. 서베이어 프라이머는 Cas9 표적의 어느 사이드에서 300-400 bp (총 600-800 bp 앰플리콘의 경우)를 증폭하도록 설계되어야 하며, 이로써 겔 전기영동에 의해서 절단 밴드의 분명한 시각화가 허용된다. 과도한 프라이머 다이머 형성을 방지하기 위해서, 서베이어 프라이머는 통상적으로 25-nt 길이 이하가 되고, 용융 온도는 약 60℃이도록 설계되어야 한다. 출원인은 특정 PCR 앰플리콘뿐만 아니라 서베이어 뉴클레아제 소화 과정 동안 비-특이적 절단의 존재에 대해 후보 프라이머의 각 쌍을 시험할 것을 추천했다.

플라스미드- 또는 ssODN-매개 HDR: HDR은 변형된 영역의 PCR-증폭 및 시퀀싱을 통해서 검출될 수 있다. 이 목적을 위한 PCR 프라이머는 잔류 수선 주형의 거짓 검출을 피하기 위해서 상동체 암으로 걸쳐진 영역 밖에서 아닐링되어야 한다(HDR Fwd 및 Rev, 도 12). ssODN-매개 HDR의 경우, 서베이어 PCR 프라이머가 사용될 수 있다.

시퀀싱에 의한 삽입결실부 또는 HDR의 검출: 출원인은 Sanger 또는 차세대 심층 시퀀싱 (NGS)에 의해서 표적화된 게놈 변형을 검출했다. 전자의 경우, 변형된 영역으로부터의 게놈 DNA가 서베이어 또는 HDR 프라이머를 사용하여 증폭될 수 있다. 앰플리콘은 형질전환을 위해 pUC19와 같은 플라스미드에 서브클로닝되어야 하며, 클론 유전자형을 드러내기 위해서 개별 콜로니가 시퀀싱될 수 있다.

출원인은 통상적으로 100-200 bp 크기 범위로 더 짧은 앰플리콘을 위해 차세대 시퀀싱 (NGS) 프라이머를 설계했다. NHEJ 돌연변이 검출을 위해서, 프라이밍 영역과 Cas9 표적 부위 사이에 적어도 10-20 bp가 있는 프라이머를 설계함으로써 더 긴 삽입결실부의 검출을 허용하는 것이 중요하다. 출원인은 복합적인 심층 시퀀싱을 위해 바코드 어댑터를 부착하기 위한 2-단계 PCR 방법을 위한 가이드라인을 제공한다. 출원인은 일반적으로 거짓 양성 삽입결실부 수준이 낮기 때문에 Illumina 플랫폼을 추천했다. 다음에, 표적외 분석 (앞서 설명된)이 ClustalW, Geneious, 또는 간단한 서열 분석 스크립트와 같은 판독 정렬 프로그램을 통해서 수행될 수 있다.

재료 및 시약

sgRNA 제조 :

UltraPure DNaseRNase-무함유 증류수(Life Technologies, 카탈로그 번호 10977-023)

허큘라제 II 융합 폴리머라제(Agilent Technologies, 카탈로그 번호 600679)

CRITICAL. 표준 Taq 폴리머라제, 이것은 3'-5' 엑소뉴클레아제 교정 활성을 결여하고, 낮은 충실도를 가지며, 증폭 에러를 초래할 수 있다. 허큘라제 II는 최소한의 최적화로 PCR 생성물을 높은 수율로 생성하는 고 충실도 폴리머라제(Pfu와 동등한 충실도)이다. 다른 고 충실도 폴리머라제가 치환될 수 있다.

허큘라제 II 반응 완충제(5x; Agilent Technologies, 폴리머라제와 함께 포함된다)

dNTP 용액 믹스(25 mM 각각; Enzymatics, 카탈로그 번호 N205L)

MgCl₂ ₍25mM; ThermoScientific, 카탈로그 번호 R0971)

QIAquick 겔 추출 키트(Qiagen, 카탈로그 번호 28704)

QIAprep 스핀 미니프렙 키트(Qiagen, 카탈로그 번호 27106)

UltraPure TBE 완충제(10X; Life Technologies, 카탈로그 번호 15581-028)

SeaKem LE 아가로스(Lonza, 카탈로그 번호 50004)

SYBR Safe DNA 염색(10,000x; Life Technologies, 카탈로그 번호 S33102)

1-kb Plus DNA 래더(Life Technologies, 카탈로그 번호 10787-018)

TrackIt CyanOrange 로딩 완충제(Life Technologies, 카탈로그 번호 10482-028)

FastDigest BbsI(BpiI)(Fermentas/ThermoScientific, 카탈로그 번호 FD1014)

Fermentas 탄고 완충제(Fermentas/ThermoScientific, 카탈로그 번호 BY5)

DL-디티오트레이톨(DTT; Fermentas/ThermoScientific, 카탈로그 번호 R0862)

T7 DNA 리가아제(Enzymatics, 카탈로그 번호 L602L)

주: 더 흔히 사용되는 T4 리가아제로는 치환하지 않는다. T7 리가아제는 블런트 단부보다 점착성 단부에 대해 1,000-배 더 높은 활성을 가지고, 상업적으로 이용가능한 농축 T4 리가아제보다 높은 전체적 활성을 가진다.

T7 2X 신속 결찰 완충제(T7 DNA 리가아제와 함께 포함된다, Enzymatics, 카탈로그 번호 L602L)

T4 폴리뉴클레오티드 키나제(New England Biolabs, 카탈로그 번호 M0201S)

T4 DNA 리가아제 반응 완충제(10X; New England Biolabs, 카탈로그 번호 B0202S)

아데노신 5'-트리포스페이트(10 mM; New England Biolabs, 카탈로그 번호 P0756S)

PlasmidSafe ATP-의존성 DNase (Epicentre, 카탈로그 번호 E3101K)

원샷 Stbl3 화학적 컴페턴트 Escherichia coli (E. coli) (Life Technologies, 카탈로그 번호 C7373-03)

SOC 배지(New England Biolabs, 카탈로그 번호 B9020S)

LB 배지(Sigma, 카탈로그 번호 L3022)

LB 아가 배지(Sigma, 카탈로그 번호 L2897)

암피시린, 멸균 여과(100 ㎎㎖-1; Sigma, 카탈로그 번호 A5354)

포유류 세포 배양물:

HEK293FT 세포(Life Technologies, 카탈로그 번호 R700-07)

듈베코 최소 이글 배지(DMEM, 1X, 고 글루코오스; Life Technologies, 카탈로그 번호 10313-039)

듈베코 최소 이글 배지(DMEM, 1X, 고 글루코오스, 페놀 레드 없음; Life Technologies, 카탈로그 번호 31053-028)

듈베코 포스페이트-완충 식염수(DPBS, 1X; Life Technologies, 카탈로그 번호 14190-250)

태아 소 혈청, 정성적으로 열 불활성화됨 (Life Technologies, 카탈로그 번호 10438-034)

Opti-MEM I 감소된-혈청 배지(FBS; Life Technologies, 카탈로그 번호 11058-021)

페니실린-스트렙토마이신 (100x; Life Technologies, 카탈로그 번호 15140-163)

TrypLE™ Express(1X, 페놀 레드 없음; Life Technologies, 카탈로그 번호 12604-013)

리포펙타민 2000 트랜스펙션 시약(Life Technologies, 카탈로그 번호 11668027)

Amaxa SF 세포주 4D-Nucleofector® X 키트 S (32 RCT; Lonza, 카탈로그 번호 V4XC-2032)

HUES 9 세포주(HARVARD STEM CELL SCIENCE)

Geltrex LDEV-무함유 감소된 성장인자 기저막 바탕질(Life Technologies, 카탈로그 번호 A1413201)

mTeSR1 배지(Stemcell Technologies, 카탈로그 번호 05850)

아큐타제 세포 탈착 용액(Stemcell Technologies, 카탈로그 번호 07920)

ROCK 저해제(Y-27632; Millipore, 카탈로그 번호 SCM075)

Amaxa P3 1차 세포 4D-Nucleofector® X 키트 S (32 RCT; Lonza 카탈로그 번호 V4XP-3032)

제노타이핑 분석:

QuickExtract DNA 추출 용액(Epicentre, 카탈로그 번호 QE09050)

서베이어, RFLP 분석, 또는 시퀀싱용 PCR 프라이머(프라이머 표 참조)

주: 서베이어 분석은 단일-염기 미스매치에 민감하므로, 고 충실도 폴리머라제를 사용하는 것이 특히 중요하다. 다른 고 충실도 폴리머라제가 치환될 수 있다.

dNTP 용액 믹스(25 mM 각각; Enzymatics, 카탈로그 번호 N205L)

QIAquick 겔 추출 키트(Qiagen, 카탈로그 번호 28704)

Taq 완충제(10x; Genscript, 카탈로그 번호 B0005)

표준 겔 전기영동을 위한 서베이어 돌연변이 검출 키트(Transgenomic, 카탈로그 번호 706025)

UltraPure TBE 완충제(10x; Life Technologies, 카탈로그 번호 15581-028)

SeaKem LE 아가로스(Lonza, 카탈로그 번호 50004)

4 내지 20% TBE 겔 1.0 mm, 15-웰(Life Technologies, 카탈로그 번호 EC62255BOX)

Novex® Hi-Density TBE 샘플 완충제(5X; Life Technologies, 카탈로그 번호 LC6678)

SYBR 금 핵산 겔 염색(SYBR Gold Nucleic Acid Gel Stain)(10,000X; Life Technologies, 카탈로그 번호 S-11494)

1-kb Plus DNA 래더(Life Technologies, 카탈로그 번호 10787-018)

FastDigest HindIII(Fermentas/ThermoScientific, 카탈로그 번호 FD0504)

장비:

멸균 여과 피펫 팁(Corning)

표준 1.5 ㎖ 미소원심분리 튜브(Eppendorf, 카탈로그 번호 0030 125.150)

Axygen 96-웰 PCR 플레이트(VWR, 카탈로그 번호 PCR-96M2-HSC)

Axygen 8-스트립 PCR 튜브(Fischer Scientific, 카탈로그 번호 14-222-250)

팔콘 튜브, 폴리프로필렌, 15 ㎖(BD Falcon, 카탈로그 번호 352097)

팔콘 튜브, 폴리프로필렌, 50 ㎖(BD Falcon, 카탈로그 번호 352070)

세포 스트레이너 캡을 가진 둥근-바닥 튜브, 5 ㎖(BD Falcon, 카탈로그 번호 352235)

페트리 디쉬(60 mm × 15 mm; BD Biosciences, 카탈로그 번호 351007)

조직 배양 플레이트(24-웰; BD Falcon, 카탈로그 번호 353047)

조직 배양 플레이트(96-웰, 편평 바닥; BD Falcon, 카탈로그 번호 353075)

조직 배양 디쉬(100 mm; BD Falcon, 353003)

프로그램가능한 온도 단차 기능을 가진 96-웰 써모사이클러(Applied Biosystems Veriti, 카탈로그 번호 4375786).

데스크탑 미소원심분리 5424, 5804 (Eppendorf)

겔 전기영동 시스템(PowerPac 기본 전원, Bio-Rad, 카탈로그 번호 164-5050, 및 Sub-Cell GT 시스템 겔 트레이, Bio-Rad, 카탈로그 번호 170-4401)

Novex XCell SureLock 미니-셀(Life Technologies, 카탈로그 번호 EI0001)

디지털 겔 영상화 시스템(GelDoc EZ, Bio-Rad, 카탈로그 번호 170-8270, 및 청색 샘플 트레이, Bio-Rad, 카탈로그 번호 170-8273)

청색광 트랜스일루미네이터 및 오렌지 필터 고글(SafeImager 2.0; Invitrogen, 카탈로그 번호 G6600)

겔 정량 소프트웨어(Bio-Rad, ImageLab, GelDoc EZ과 함께 포함됨, 또는 National Institutes of Health로부터의 공개 출처 ImageJ, 웹사이트 rsbweb.nih.gov/ij/에서 이용가능) UV 분광광도계(NanoDrop 2000c, Thermo Scientific)

시약 셋업

트리스-보레이트 EDTA(TBE) 전기영동 용액 - 아가로스 겔 캐스팅과 겔 전기영동의 완충제로 사용하기 위해 1X 작동 용액으로 증류수 중에 TBE 완충제를 희석한다. 완충제는 적어도 1 년 동안 실온에서 보관될 수 있다(18-22℃).

· ATP, 10 mM - 10 mM ATP를 50 ㎕ 알리쿼트로 나누고, 최대 1 년까지 -20℃에 보관한다; 반복적인 냉동-해동 사이클은 피한다.

· DTT, 10 mM - 증류수 중에 10 mM DTT 용액을 제조하고, 20 ㎕ 알리쿼트로 최대 2 년 동안 -70℃에 보관한다; DTT는 쉽게 산화되므로 각 반응마다 새로운 알리쿼트를 사용한다.

· D10 배양 배지 - HEK293FT 세포의 배양을 위해서, DMEM을 1X GlutaMAX 및 10% (vol/vol) 태아 소 혈청으로 보충하여 D10 배양 배지를 제조한다. 프로토콜에 나타낸 대로, 이 배지는 또한 1X 페니실린-스트렙토마이신으로 보충될 수 있다. D10 배지는 미리 제조될 수 있으며, 최대 1 개월 동안 4℃에 보관될 수 있다.

· mTeSR1 배양 배지 - 인간 배아 줄기세포의 배양을 위해서, 5X 보충액(mTeSR1 기본 배지와 함께 포함된다), 및 100 ㎍/㎖ 노모신을 보충함으로써 mTeSR1을 제조한다.

과정

표적 구성성분 설계 및 온라인 툴의 사용 · 시기 1d

1| 표적 게놈 DNA 서열 투입. 출원인은 관심대상의 투입 서열을 취하고 적합한 표적 부위를 확인하여 순위를 정하며, 각 의도된 표적에 대해 표적외 부위를 컴퓨터로 예측하는 온라인 Cas9 표적화 설계 도구를 제공한다. 또는 달리, 어떤 5'-NGG의 바로 상류에서 20-bp 서열을 확인함으로써 가이드 서열을 손수 선택할 수 있다.

2| 온라인 툴에 의해서 특정된 필요한 올리고머 및 프라이머 순서. 부위가 손수 선택된다면, 올리고머 및 프라이머가 설계되어야 한다.

sgRNA 발현 작제물의 제조

3| sgRNA 발현 작제물을 생성하기 위해서 PCR- 또는 플라스미드-기반 프로토콜이 사용될 수 있다.

(A) PCR 증폭을 통한 방법 · 시기 2h

(i) 출원인은 희석된 U6 PCR 주형을 제조한다. 출원인은 PCR 주형으로서 PX330을 추천했지만, 어떤 U6-함유 플라스미드도 PCR 주형으로서 똑같이 사용될 수 있다. 출원인은 10 ng/㎕의 농도까지 ddH₂O를 사용하여 주형을 희석했다. U6-유도된 sgRNA를 이미 함유하는 플라스미드 또는 카세트가 주형으로 사용된다면 생성물이 의도된 sgRNA만을 함유하고 주형으로부터 운반된 미량의 sgRNA는 함유하지 않도록 보장하기 위해서 겔 추출을 수행할 필요가 있다는 것을 주의한다.

(ii) 출원인은 희석된 PCR 올리고를 제조했다. U6-Fwd 및 U6-sgRNA-Rev 프라이머가 ddH₂O 중에 10 uM의 최종 농도로 희석된다 (90 ㎕ ddH₂O에 100 uM 프라이머 10㎕ 첨가).

(iii) U6-sgRNA PCR 반응. 출원인은 각 U6-sgRNA-Rev 프라이머와 필요한 마스터믹스에 따라 다음의 반응을 설정했다:

(iv) 출원인은 다음의 사이클링 조건을 사용하여 단계 (iii)으로부터의 반응물에 대해 PCR 반응을 수행했다:

(v) 반응이 완료된 후, 출원인은 성공적인 단일-밴드 증폭을 검증하기 위해 겔 상에 생성물을 전개시켰다. 1X SYBR 안전 염료를 가진 1X TBE 완충제 중 2% (wt/vol) 아가로스 겔을 캐스트한다. PCR 생성물 5 ㎕를 겔에 15V cm-1에서 20-30 분간 전개시킨다. 성공적인 앰플리콘은 하나의 단일 370-bp 생성물을 제공해야 하고, 주형은 보이지 않아야 한다. PCR 앰플리콘의 겔 추출이 반드시 필요한 것은 아니다.

(vi) 출원인은 PCR 생성물을 제조자의 지시에 따라서 QIAquick PCR 정제 키트를 사용하여 정제했다. 35㎕의 완충제 EB 또는 물에서 DNA를 용출시킨다. 정제된 PCR 생성물은 4℃ 또는 -20℃에 보관될 수 있다.

(B) Cas9 -함유 바이시스트로닉 발현 벡터에 sgRNA 클로닝 · 시기 3d

(i) sgRNA 올리고 삽입체 제조. 출원인은 100 uM의 최종 농도까지 각 sgRNA 디자인에 대한 올리고의 상부 및 하부 가닥을 재현탁했다. 올리고의 포스포릴화 및 아닐링은 다음과 같다:

(ii) 다음의 변수를 사용하여 서모사이클러에서 아닐링:

(iii) 출원인은 포스포릴화되고 아닐링된 올리고를 199 ㎕ 실온 ddH₂O에 1 ㎕ 올리고를 참가하여 1:200까지 희석했다.

(iv) PX330에 sgRNA 올리고 클로닝 . 출원인은 각 sgRNA에 대해 골든 게이트 반응을 설정했다. 출원인은 또한 음성 대조군인 비삽입체 PX330의 설정을 추천했다.

(v) 총 1h 동안 골든 게이트 반응을 인큐베이션:

(vi) 출원인은 어떤 잔류 선형 DNA를 소화시키기 위해서 PlasmidSafe 엑소뉴클레아제로 골든 게이트 반응물을 처리했다. 이 단계는 선택적이지만 강력히 추천된다.

(vii) 출원인은 30 분 동안 37℃에서 PlasmidSafe 반응물을 인큐베이션하고, 이어서 30 분 동안 70℃에서 비활성화했다. 유의점: 완료 후, 반응물은 냉동되어 이후 계속될 수 있다. 원형 DNA는 적어도 1 주 동안 안정해야 한다.

(viii) 형질전환. 출원인은 세포와 함께 공급된 프로토콜에 따라서 컴페턴트 E. coli에 Plasmidsafe-처리된 플라스미드를 형질전환했다. 출원인은 신속한 형질전환을 위해 Stbl3을 추천했다. 간단히 말해서, 출원인은 단계 (vii)로부터의 생성물 5 ㎕를 20 ㎕의 얼음-냉각된 화학적 컴페턴트 Stbl3 세포에 첨가했다. 다음에, 이것은 10 m 동안 얼음 위에서 인큐베이션되고, 30 s 동안 42℃에서 열충격을 가하고, 2 m 동안 얼음에 즉시 돌려보내고, SOC 배지 100 ㎕가 첨가되고, 100 ㎍/㎖ 암피실린을 함유하는 LB 평판 위에 평판되어 37℃에서 하룻밤 인큐베이션된다.

(ix) 제2 일: 출원인은 콜로니 성장에 대해 평판을 조사했다. 전형적으로 음성 대조군 평판에는 콜로니가 없고(BbsI-digested PX330만 결찰, 아닐링된 sgRNA 올리고 없음), PX330-sgRNA 클로닝 평판에는 수십 내지 수백 개의 콜로니가 있다.

(x) 각 평판으로부터, 출원인은 sgRNA의 정확한 삽입을 점검하기 위해 2-3 개 콜로니를 선별했다. 출원인은 멸균 피펫 팁을 사용하여 단일 콜로니를 100 ㎍/㎖ 암피실린을 가진 LB 배지의 3 ㎖ 배양물에 접종했다. 인큐베이션하고 하룻밤 37℃에서 흔들었다.

(xi) 제3 일: 출원인은 제조자의 지시에 따라서 QiAprep 스핀 미니프렙 키트를 사용하여 하룻밤 배양물로부터 플라스미드 DNA를 분리했다.

(xii) CRISPR플라스미드 서열 검증. 출원인은 U6-Fwd 프라이머를 사용하여 U6 프로모터로부터 시퀀싱함으로써 각 콜로니의 서열을 검증했다. 선택사항: 다음의 프라이머 표에 열거된 프라이머를 사용하여 Cas9 유전자를 시퀀싱한다.

출원인은 20 bp 가이드 서열이 U6 프로모터와 sgRNA 스캐폴드의 나머지 부분 사이에 삽입되었는지 점검하기 위해서 PX330 클로닝 벡터 서열에 대한 시퀀싱 결과를 참조했다. PX330 맵의 상세한 내용 및 서열은 GenBank 백터 맵 형식 (*.gb 파일)으로 웹사이트 crispr.genome-engineering.org에서 찾을 수 있다.

(선택사항) ssODN 주형의 설계 · 시기 3d 먼저 계획

3| ssODN 설계 및 순서. 센스 또는 안티센스 ssODN은 공급자로부터 구입될 수 있다. 출원인은 어느 한 사이드에 적어도 40 bp의 상동체 암과 최적 HDR 효율을 위 해 90 bp를 설계할 것을 추천했다. 출원인의 경험으로는 안티센스 올리고가 약간 더 높은 변형 효율을 가진다.

4| 출원인은 10 uM의 최종 농도까지 ssODN 울트라머를 재현탁하고 희석했다. 센스와 안티센스 ssODN은 조합하거나 아닐링하지 않는다. -20℃에 보관한다.

5| 주: HDR 적용의 경우, 출원인은 PX330 플라스미드에 sgRNA를 클로닝할 것을 추천했다.

sgRNA의 기능적 검증: 세포 배양물 및 트랜스펙션 · 시기 3-4d

CRISPR-Cas 시스템은 다수의 포유류 세포주에 사용되었다. 조건은 각 세포주마다 다양할 수 있다. 아래 프로토콜은 HEK239FT 세포에 대한 트랜스펙션 조건을 상세히 설명한다. ssODN-매개 HDR 트랜스펙션의 경우 Amaxa SF 세포주 뉴클레오펙터 키트가 ssODN의 최적 전달을 위해 사용된다는 것을 유의한다. 이것은 다음 섹션에서 설명된다.

7| HEK293FT 유지. 세포는 제조자의 추천에 따라서 유지된다. 간단히 말해서, 출원인은 세포를 D10 배지(10% 태아 소 혈청으로 보충된 GlutaMax DMEM)에서 37℃ 및 5% CO₂에서 배양했다.

8| 계대를 위해, 출원인은 배지를 제거하고 세포가 손실되지 않도록 용기 사이드에 DPBS를 부드럽게 가해서 한번 헹궜다. 출원인은 TrypLE 2 ㎖를 T75 플라스크에 첨가하고, 5 m 동안 37℃에서 인큐베이션했다. 따뜻한 D10 배지 10 ㎖를 가하여 비활성화하고 50 ㎖ 팔콘 튜브로 옮겼다. 출원인은 부드럽게 분쇄해서 세포를 해리하고, 필요에 따라 새로운 플라스크에 재파종했다. 출원인은 전형적으로 세포를 2-3 d마다 1:4 또는 1:8의 분할비로 계대하며, 절대 세포가 70%를 초과하는 컨플루언시에 도달하지 않도록 한다. 계대수 15에 도달하면 세포주가 재시작된다.

9| 트랜스펙션을 위한 세포를 제조한다. 출원인은 웰 당 1.3 x 10⁵ 세포의 파종 밀도로 트랜스펙션 16-24 h 전에 항생물질 없이 D10 배지에서 24-웰 플레이트 위에 잘-해리된 세포를 평판했으며, 파종 부피는 500 ㎕이다. 필요에 따라 제조자의 매뉴얼에 따라서 규모를 증가시키거나 감소시킨다. 추천된 밀도보다 많은 세포를 평판하는 것은 제안되지 않으며, 그렇게 하면 트랜스펙션 효율이 감소할 수 있다.

10| 트랜스펙션 일에 세포는 70-90% 컨플루언시에서 최적이다. 세포는 제조자의 프로토콜에 따라서 리포펙타민 2000 또는 Amaxa SF 세포주 뉴클레오펙터 키트로 트랜스펙션될 수 있다.

(A) PX330에 클로닝된 sgRNA의 경우, 출원인은 서열-검증된 CRISPR 플라스미드 500ng을 트랜스펙션했다; 하나보다 많은 플라스미드를 트랜스펙션하는 경우, 등몰 비율로 혼합하고 총 500ng을 넘지 않도록 한다.

(B) PCR에 의해서 증폭된 sgRNA의 경우, 출원인은 다음을 혼합했다:

출원인은 신뢰성 있는 정량을 위한 3 번 중복 기술로 트랜스펙션하고, 트랜스펙션 효율의 모니터링을 위해 트랜스펙션 대조군 (에를 들어, GFP 플라스미드)을 포함시킬 것을 추천했다. 게다가, PX330 클로닝 플라스미드 및/또는 sgRNA 앰플리콘이 하류 기능 분석을 위한 음성 대조군으로서 단독으로 트랜스펙션될 수 있다.

11| HEK293FT 세포가 평판으로부터 쉽게 탈착될 수 있기 때문에 출원인은 리포펙타민 복합체를 세포에 부드럽게 가했으며, 낮은 트랜스펙션 효율이 얻어진다.

12| 출원인은 형광 현미경을 사용하여 대조군(예를 들어, GFP) 트랜스펙션에서 형광 세포의 비율을 추산함으로써 트랜스펙션 24 h 후 효율에 대해 세포를 점검했다. 전형적으로, 70%를 초과하는 세포가 트랜스펙션된다.

13| 출원인은 배양 배지를 따뜻한 D10 배지 500 ㎕로 더 보충했다. 세포는 쉽게 탈착될 수 있으므로 웰의 사이드에 아주 서서히 D10를 가하며, 차가운 배지를 사용하지 않는다.

14| 삽입결실부 분석을 위한 수거 전에 트랜스펙션 후 세포가 총 48-72 h 동안 인큐베이션된다. 삽입결실부 효율은 48 h 후에는 눈에 띄게 증가하지 않는다.

(선택사항) HR을 위한 CRISPR 플라스미드와 ssODN 또는 표적화 플라스미드의 공-트랜스펙션 · 시기 3-4d

15| 표적화 플라스미드의 선형화. 가능하다면 상동체 암 중 하나 근처의 벡터 백본의 제한 부위에서 또는 어느 한 상동체 암의 원단부에서 한번 절단함으로써 표적화 벡터가 선형화된다.

16| 출원인은 0.8-1% 아가로스 겔 상에 절단되지 않은 플라스미드와 나란히 소량의 선형화된 플라스미드를 전개시켜 성공적인 선형화를 점검했다. 선형화된 플라스미드는 수퍼코일형 플라스미드 위에 전개되어야 한다.

17| 출원인은 QIAQuick PCR 정제 키트로 선형화된 플라스미드를 정제했다.

18| 트랜스펙션을 위한 세포를 제조한다. 출원인은 T75 또는 T225 플라스크에서 HEK293FT를 배양했다. 트랜스펙션 1 일 전에 충분한 세포 계수가 계획된다. Amaxa 스트립-큐벳 형식의 경우, 2 x 10⁶ 세포가 트랜스펙션 당 사용된다.

19| 트랜스펙션을 위한 평판을 준비한다. 출원인은 12-웰 플레이트의 각 웰에 따뜻한 D10 배지 1 ㎖를 첨가했다. 평판은 배지를 따뜻하게 유지하기 위해 인큐베이터에 놓아 둔다.

20| 뉴틀레오펙션. 출원인은Amaxa SF 세포주 뉴클레오펙터 4D 키트 제조자의 지시에 따라서 HEK293FT 세포를 트랜스펙션했으며, 이것은 아래 단계들처럼 개조된다.

a. ssODN와 CRISPR 공-트랜스펙션을 위하여, PCR 튜브에 다음의 DNA를 예비 혼합한다:

b. HDR 표적화 플라스미드와 CRISPR 공-트랜스펙션을 위하여, PCR 튜브에 다음의 DNA를 예비 혼합한다:

트랜스펙션 대조군에 대해서는 이전 섹션을 참조한다. 게다가, 출원인은 음성 대조군으로서 ssODN을 트랜스펙션하거나 플라스미드만을 표적화할 것을 추천했다.

21| 단일 세포로 해리한다. 출원인은 배지를 제거하고, 세포가 손실되지 않도록 주의하면서 DPBS로 부드럽게 한번 헹궜다. TrypLE 2 ㎖를 T75 플라스크에 첨가하고, 5 m 동안 37℃에서 인큐베이션했다. 비활성화하기 위해 따뜻한 D10 배지 10 ㎖가 첨가되고, 50 ㎖ 팔콘 튜브에서 부드럽게 분쇄된다. 세포가 부드럽게 분쇄되어 단일 세포로 해리되는 것이 추천된다. 큰 덩어리는 트랜스펙션 효율을 감소시킬 것이다. 출원인은 현탁액으로부터 10 ㎕ 알리쿼트를 취해서 계수를 위해 D10 배지 90 ㎕로 희석했다. 출원인은 세포를 계수하고, 트랜스펙션에 필요한 세포의 수와 현탁액의 부피를 계산했다. 출원인은 전형적으로 Amaxa 뉴클레오큐벳 스트립을 사용하여 조건 당 2 x 10⁵ 세포를 트랜스펙션했으며, 후속 피펫팅 단계에서 부피 손실을 조정하기 위해서 필요한 것보다 20% 더 많은 세포에 대해 계산할 것을 추천했다. 필요한 부피가 새로운 팔콘 튜브로 옮겨진다.

23| 출원인은 새로운 튜브를 5 m 동안 200 x g에서 하강 회전시킨다.

출원인은 Amaxa에 의해서 추천된 대로 SF 용액과 S1 보충물을 혼합함으로써 트랜스펙션 용액을 제조했다. Amaxa 스트립-큐벳의 경우, 총 20 ㎕의 보충된 SF 용액이 트랜스펙션 당 요구된다. 마찬가지로, 출원인은 필요한 것의 20%를 넘는 부피에 대해 계산할 것을 추천한다.

25| 출원인은 단계 23으로부터의 펠릿화된 세포로부터 배지를 완전히 제거하고, S1-보충된 SF 용액의 적절한 부피 (2 x 10⁵ 세포 당 20 ㎕)에 부드럽게 재현탁했다. 오랜 시간 기간 동안 SF 용액에 세포를 남겨두지 않는다.

26| 재현탁된 세포 20 ㎕가 단계 20으로부터의 각 DNA 프레-믹스에 피펫팅된다. 피펫으로 부드럽게 혼합해서 뉴클레오큐벳 스트립 챔버로 옮긴다. 이것은 각 트랜스펙션 조건마다 반복된다.

Amaxa에 의해서 추천된 뉴클레오펙터 4D 프로그램 CM-130을 사용하여 세포를 전기천공한다.

28| 출원인은 각 뉴클레오큐벳 스트립 챔버에 따뜻한 D10 배지 100 ㎕를 부드럽게 서서히 피펫팅하고, 모든 부피를 단계 19로부터의 미리 가온된 평판으로 옮겼다. 주: 이 단계에서 세포는 매우 취약하며, 가혹한 피펫팅은 세포 사멸을 야기할 수 있다. 24 h 동안 인큐베이션한다. 이 지점에서, 트랜스펙션 효율은 양성 트랜스펙션 대조군에서 형광 세포의 비율로부터 추산될 수 있다. 뉴클레오펙션은 전형적으로 70 내지 80%를 초과하는 트랜스펙션 효율을 가져온다. 출원인은 세포의 손실 없이 각 웰에 따뜻한 D10 배지 1 ㎖를 서서히 첨가했다. 총 72 h 동안 세포를 인큐베이션한다.

인간 배아 줄기세포 (HUES 9) 배양 및 트랜스펙션 · 시기 3-4d

hESC (HUES9) 계통 유지. 출원인은 mTesR1 배지를 사용하여 피더-프리 조건에서 HUES9 세포주를 통상적으로 유지한다. 출원인은 기본 배지에 포함된 5X 보충물과 100 ㎍/㎖ 노모신을 첨가함으로써 TeSR1 배지를 제조했다. 출원인은 10 uM Rock 저해제로 더 보충된 mTeSR1 배지의 10㎖ 알리쿼트를 제조했다. 조직 배양 평판을 코팅한다. 냉각된 DMEM 중에 냉각된 GelTrex을 1:100으로 희석하고, 100 mm 조직 배양 평판의 전체 표면을 코팅한다.

37℃에서 적어도 30 m 동안 인큐베이터 안에 평판을 놓아 둔다. 15 ㎖ 팔콘 튜브에 37℃에서 세포 바이알을 해동하고, mTeSR1 배지 5 ㎖를 첨가하고,5 m 동안 200 x g에서 펠릿화한다. GelTrex 코팅을 흡인하여 없애고, Rock 저해제 를 함유하는 10 ㎖ mTeSR1 배지와 함께 약 1 x 106 세포를 파종한다. 트랜스펙션 24 h 후 정규 mTeSR1 배지로 교환하고 매일 재공급한다. 세포를 계대한다. 세포에 신선한 mTeSR1 배지를 매일 재공급하고, 70% 컨플루언시에 도달하기 전에 계대한다. mTeSR1 배지를 흡인하여 없애고, 세포를 DPBS로 한번 세척한다. 2 ㎖ 아큐타제에 의해서 세포를 해리하고, 3-5 m 동안 37℃에서 인큐베이션한다. 탈착된 세포에 10 ㎖ mTeSR1 배지를 첨가하고, 15 ㎖ 팔콘 튜브로 옮기고, 부드럽게 재현탁한다. 10 uM Rock 저해제 와 함께 mTeSR1 배지에서 GelTrex-코팅된 평판 위에 재평판한다. 평판 24 h 후 정규 mTeSR1 배지로 교환한다.

트랜스펙션. 출원인은 Amaxa P3 1차 세포 4-D 뉴클레오펙터 키트(Lonza)를 사용하여 트랜스펙션 전 해동 후 적어도 1 주 동안 세포를 배양할 것을 추천했다. 트랜스펙션 2 h 전에 신선한 배지를 로그상 성장중인 세포에 재공급한다. 아큐타제로 부드럽게 재현탁해서 단일 세포 또는 10 세포 미만의 작은 클러스터로 해리한다. 뉴클레오펙션에 필요한 세포수를 계수하고, 5 m 동안 200 x g에서 하강 회전시킨다. 배지를 완전히 제거하고, S1-보충된 P3 뉴클레오펙션 용액의 추천된 부피에 재현탁한다. 전기천공된 세포를 1X Rock 저해제 의 존재하에 코팅된 평판에 부드럽게 평판한다.

트랜스펙션 성공을 점검하고, 뉴클레오펙션 24 h 후 시작해서 mTeSR1 배지를 규칙적으로 매일 재공급한다. 전형적으로, 출원인은 Amaxa 뉴클레오펙션으로 70%를 초과하는 트랜스펙션 효율을 관찰한다. DNA를 수거한다. 트랜스펙션 48-72 h 후, 세포를 아큐타제를 사용하여 해리하고, 5x 부피의 mTeSR1을 첨가함으로써 비활성화한다. 세포를 5 m 동안 200 x g에서 하강 회전시킨다. 펠릿화된 세포는 QuickExtract 용액으로 DNA 추출을 위해 직접 가공될 수 있다. 아큐타제 없이 기계적으로 세포를 해리하지 않는 것을 추천한다. 비활성화 아큐타제 없이 추천된 속도 이상으로 세포를 하강 회전시키지 않는 것을 추천하며, 그렇게 하면 세포 용해를 야기할 수 있다.

FACS에 의한 클론성 세포주의 분리. 시기 · 2-3h 수동; 2-3주 확장

FACS 또는 연속 희석에 의해서 트랜스펙션 24 h 후 클론 분리가 수행될 수 있다.

54| FACS 완충제 제조. 착색된 형광을 사용하여 정렬될 필요가 없는 세포는 1X 페니실린/스트렙토마이신으로 보충된 정규 D10 배지에서 정렬될 수 있다. 착색된 형광 정렬이 또한 요구된다면, 페놀-무함유 DMEM 또는 DPBS가 정규 DMEM 대신 치환된다. 1X 페니실린/스트렙토마이신으로 보충하고, .22um Steriflip 필터를 통해 여과한다.

55| 96웰 플레이트 준비. 출원인은 웰당 1X 페니실린/스트렙토마이신으로 보충된 D10 배지 100 ㎕를 첨가하고, 원하는 수의 클론에 대해 필요에 따라 다수의 플레이트를 준비했다.

56| FACS를 위한 세포 제조. 출원인은 배지를 완전히 흡인해서 세포를 해리하고, 24웰 플레이트의 웰당 100 ㎕ TrypLE를 첨가했다. 5 분 동안 인큐베이션하고, 따뜻한 D10 배지 400 ㎕를 첨가한다.

57| 재현탁된 세포를 15 ㎖ 팔콘 튜브로 옮겨서 20 회 부드럽게 분쇄했다. 단일 세포의 해리를 보장하기 위해서 현미경 아래서 조사할 것이 추천된다.

58| 5 분 동안 200 x g에서 세포를 하강 회전시켰다.

59| 출원인은 배지를 흡인했고, FACS 배지 200 ㎕에 세포를 재현탁했다.

60| 세포가 표지된 FACS 튜브에 35 um 메시 필터를 통해 여과된다. 출원인은 세포 스트레이터 캡을 가진 BD 팔콘 12 x 75 mm 튜브를 사용할 것을 추천했다. 정렬할 때까지 세포는 얼음 위에 놓아 둔다.

61| 출원인은 단계 55로부터 준비된 96웰 플레이트에 단일 세포를 정렬시켰다. 출원인은 각 플레이트에서 하나의 지정된 웰에 양성 대조군으로서 100 세포를 정렬할 것을 추천했다.

주: 나머지 세포는 유지될 수 있고, 전체 변형 효율을 가늠하기 위한 집단 수준의 제토타이핑에 사용될 수 있다.

62| 출원인은 세포를 인큐베이터로 돌려보내고, 이들을 2-3 주 동안 확장시켰다. 따뜻한 D10 배지 100 ㎕가 정렬 5 d 후에 첨가된다. 필요에 따라 3-5 d마다 배지 100 ㎕를 교환한다.

63| 정렬 1주 후 콜로니가 "클론" 출현에 대해 조사된다: 원형 콜로니가 중심점으로부터 방사상으로 형성되었다. 빈 웰과 이중 또는 다중 파종된 웰을 표시한다.

64| 세포가 60% 초과의 컨플루언트에 도달했을 때, 출원인은 계대를 위하여 한 세트의 복제 평판을 준비했다. D10 배지 100 ㎕이 복제 평판의 각 웰에 첨가된다. 출원인은 20 회 격렬히 하방 피펫팅하여 세포를 직접 해리시켰다. 클론 계통을 유지하기 위하여 현탁된 부피의 20%가 준비된 복제 평판에 평판되었다. 이후 2-3 d마다 배지를 교환하고 그에 따라 계대한다.

65| 세포의 나머지 80%를 DNA 분리 및 제노타이핑에 사용한다.

선택사항: 희석에 의한 클론성 세포주의 분리. 시기 · 2-3h 수동; 2-3주 확장

66| 출원인은 상기 설명된 대로 24웰 플레이트로부터의 세포를 해리했다. 단일 세포로 해리되도록 확실히 했다. 세포가 뭉치는 것을 방지하기 위해서 세포 스트레이너가 사용될 수 있다.

67| 각 조건에서 세포의 수가 계수된다. 100 ㎕ 당 0.5 세포의 최종 농도로 D10 배지에서 각 조건을 연속 희석한다. 각 96웰 플레이트에 대해, 출원인은 D10 12 ㎖에 60 세포의 최종 계수로 희석할 것을 추천했다. 적합한 클론 희석을 위해서 세포수의 정확한 계수가 권장된다. 세포는 정확성을 보장하기 위해서 중간 연속 희석 단계에서 다시 계수될 수 있다.

68| 멀티채널 피펫을 사용하여 희석된 세포 100 ㎕가 96웰 플레이트의 각 웰에 피펫팅되었다.

69| 출원인은 콜로니를 평판 약 1 주 후에 "클론성"에 대해 조사했다: 원형 콜로니가 중심점으로부터 방사상으로 형성되었다. 이중 또는 다중 파종된 웰을 표시한다.

70| 출원인은 세포를 인큐베이터로 돌려보내고, 이들을 2-3주 동안 확장시켰다. 필요에 따라 앞의 섹션에서 상세히 설명한 대로 세포를 다시 공급했다.

CRISPR 절단 효율에 대한 서베이어 분석. 시기 · 5-6h

트랜스펙션된 세포의 절단 효율을 분석하기 전에, 출원인은 아래 설명된 프로토콜을 사용하여 서베이어 뉴클레아제 소화 단계를 통해 음성 (트랜스펙션되지 않은) 대조군 샘플에 대해 각 새로운 서베이어 프라이머를 시험할 것을 추천했다. 때로, 단일 밴드 클린 서베이어 PCR 생성물조차도 비-특이적 서베이어 뉴클레아제 절단 밴드를 제공할 수 있으며, 잠재적으로 정확한 삽입결실부 분석을 방해할 수 있다.

71| DNA를 위한 세포 수거. 세포를 해리하고 5 m 동안 200 x g에서 하강 회전시킨다. 주: 이 단계에서 필요에 따라 평판을 복제하여 트랜스펙션된 세포주를 유지한다.

72| 상청액을 완전히 흡인한다.

73| 출원인은 제조자의 지시에 따라서 QuickExtract DNA 추출 용액을 사용했다. 출원인은 전형적으로 24웰 플레이트의 각 웰에 50 ㎕의 용액을 사용했고, 96웰 플레이트에는 10 ㎕의 용액을 사용했다.

74| 출원인은 추출된 DNA를 최종 농도 100-200 ng/㎕까지 ddH₂O로 표준화했다. 유의점: 추출된 DNA는 수 개월 동안 -20℃에 보관될 수 있다.

75| 서베이어 PCR 설정. 출원인의 온라인/컴퓨터 알고리즘 툴에 의해서 제공된 서베이어 프라이머를 사용하여 다음의 마스터 믹스를 제조한다:

76| 출원인은 각 반응에 단계 74로부터의 표준화된 게놈 DNA 주형 100-200 ng을 첨가했다.

77| PCR 반응이 다음의 사이클링 조건을 사용하여 30 증폭 사이클을 초과하여 수행되었다:

78| 출원인은 단일 밴드 생성물을 점검하기 위해 2-5 ㎕의 PCR 생성물을 1% 겔 상에 전개시켰다. 이들 PCR 조건은 서베이어 프라이머의 대부분의 쌍에서 작동하도록 설계되지만, 일부 프라이머는 주형 농도, MgCl₂ 농도 및/또는 아닐링 온도를 조정함에 의한 추가의 최적화를 필요로 할 수 있다.

79| 출원인은 PCR 반응물을 QIAQuick PCR 정제 키트를 사용하여 정제하고, 용출액을 20ng/㎕로 표준화했다. 유의점: 정제된 PCR 생성물은 -20℃에 보관될 수 있다.

80| DNA 헤테로듀플렉스 형성. 아닐링 반응이 다음과 같이 설정되었다:

81| 다음의 조건을 사용한 반응물 아닐링:

82| 서베이어 뉴클레아제 S 소화. 출원인은 마스터-믹스를 제조하고, 다음의 구성성분을 얼음 위에서 총 25 ㎕의 최종 부피가 되도록 단계 81로부터의 아닐링된 헤테로듀플렉스에 첨가했다:

83| 웰을 와동시키고 하강 회전시킨다. 반응물을 42℃에서 1 h 동안 인큐베이션한다.

84| 선택사항: 서베이어 키트로부터 2 ㎕의 중단 용액이 첨가될 수 있다. 유의점: 소화된 PCR 생성물은 다음번 분석을 위해 -20℃에 보관될 수 있다.

85| 서베이어반응물의 시각화. 서베이어 뉴클레아제 소화 생성물은 2% 아가로스 겔에서 시각화될 수 있다. 보다 나은 분해능을 위해서, 생성물은 4-20% 구배 폴리아크릴아미드 TBE 겔 상에서 전개될 수 있다. 출원인은 10 ㎕ 생성물을 추천된 로딩 완충제와 함께 로딩하고, 제조자의 지시에 따라서 겔을 전개시켰다. 전형적으로, 출원인은 브로모페놀 청색 염료가 겔의 바닥으로 이동할 때까지 전개시켰다. 동일한 겔에 DNA 래더와 음성 대조군을 포함시킨다.

86| 출원인은 겔을 TBE에 희석된 1X SYBR 골드 염료로 겔을 염색했다. 겔을 15 m 동안 부드럽게 흔들었다.

87| 출원인은 밴드의 과다노출 없이 정량적 영상화 시스템을 사용하여 겔을 이미지화했다. 음성 대조군은 PCR 생성물의 크기에 상응하는 단지 하나의 밴드만을 가져야 하지만, 때로 다른 크기의 비-특이적 절단 밴드를 가질 수도 있다. 이들은 표적 절단 밴드와 크기가 상이한 경우 분석을 방해하지 않을 것이다. 출원인의 온라인/컴퓨터 알고리즘 툴에 의해서 제공되는 표적 절단 밴드 크기의 합계는 PCR 생성물의 크기와 동일해야 한다.

88| 절단 강도 추산. 출원인은 ImageJ 또는 다른 겔 정량 소프트웨어를 사용하여 각 밴드의 적분된 강도를 정량했다.

89| 각 레인에 대해, 출원인은 다음의 식을 사용하여 PCR 생성물 절단 분획 (f _cut )을 계산했다: f _cut = (b + c) / (a + b + c), 여기서 a는 소화되지 않은 PCR 생성물의 적분된 강도이고, b 및 c는 각 절단 생성물의 적분된 강도이다. 90| 절단 효율은 듀플렉스 형성의 이항식 확률 분포에 기초한 다음 식을 사용하여 추산될 수 있다:

91|

CRISPR 절단 효율을 평가하기 위한 Sanger 시퀀싱. 시기 · 3d

초기 단계는 서베이어 분석의 단계 71-79와 동일하다. 주: 서베이어 프라이머는 적절한 제한 부위가 정방향 및 역방향 프라이머에 덧붙은 경우 Sanger 시퀀싱에 사용될 수 있다. 추천된 pUC19 백본에 클로닝하는 경우, EcoRI이 Fwd 프라이머로, HindIII이 Rev 프라이머로 사용될 수 있다.

92| 앰플리콘 소화. 소화 반응을 다음과 같이 설정한다:

93| pUC19 백본 소화. 소화 반응을 다음과 같이 설정한다:

94| 출원인은 소화 반응물을 QIAQuick PCR 정제 키트를 사용하여 정제했다. 유의점: 정제된 PCR 생성물은 -20℃에 보관될 수 있다.

95| 출원인은 소화된 pUC19 백본과 Sanger 앰플리콘을 다음과 같이 1:3 벡터:삽입체의 비율로 결찰했다:

96| 형질전환. 출원인은 컴패턴트 이콜라이 균주에 PlasmidSafe-처리된 플라스미드를 세포와 함께 공급된 프로토콜에 따라서 형질전환했다. 출원인은 신속한 형질전환을 위해 Stbl3을 추천했다. 간단히 말해서, 단계 95로부터의 생성물 5 ㎕를 얼음 냉각된 화학적 컴패턴트 Stbl3 세포 20 ㎕에 첨가하고, 10 분 동안 얼음 위에서 인큐베이션하고, 30 s 동안 42℃에서 열충격을 가하고, 곧바로 2 m 동안 얼음에 돌려보내고, 100 ㎕ SOC 배지를 첨가하고, 100 ㎍/㎖ 암피실린을 함유하는 LB 평판 위에 평판했다. 이것은 37℃에서 하룻밤 인큐베이션된다.

97| 제2 일: 출원인은 콜로니 성장에 대해 평판을 조사했다. 전형적으로, 음성 대조군 평판에는 콜로니가 없으며(EcoRI-HindIII 소화된 pUC19만의 결찰, Sanger 앰플리콘 삽입체 없음), pUC19-Sanger 앰플리콘 클로닝 평판에는 수백 개의 콜로니가 나타나는 경향이 있다.

98| 제3 일: 출원인은 제조자의 지시에 따라서 QIAprep 스핀 미니프렙 키트를 사용하여 하룻밤 배양물로부터 플라스미드 DNA를 분리했다.

99| Sanger 시퀀싱. 출원인은 pUC19-For 프라이머를 사용하여 pUC19 백본으로부터 시퀀싱에 의해서 각 콜로니의 서열을 검증했다. 출원인은 Cas9-유도된 NHEJ 돌연변이의 존재를 점검하기 위해서 예상된 게놈 DNA에 대한 시퀀싱 결과를 참조했다. 편집 효율 % = (# 변형된 클론)/(# 합계 클론). 정확한 변형 효율을 생성하기 위해서는 합당한 수의 클론 (>24)을 선별하는 것이 중요하다.

미소결실에 대한 제노타이핑 . 시기 · 2-3d 수동; 2-3 주 확장

100| 세포가 결실될 영역을 표적화하는 한 쌍의 sgRNA로 상기 설명된 대로 트랜스펙션되었다.

101| 트랜스펙션 24 h 후, 클론 계통이 상기 설명된 대로 FACS 또는 연속 희석에 의해서 분리된다.

102| 세포가 2-3 주 동안 확장된다.

103| 출원인은 10㎕ QuickExtract 용액을 사용하여 상기 설명된 대로 클론 계통으로부터 DNA를 수거하고, 50-100 ng/㎕의 최종 농도까지 ddH₂O로 게놈 DNA를 표준화했다.

104| 변형된 영역의 PCR 증폭. PCR 반응이 다음과 같이 설정된다:

주: 결실 크기가 1 kb를 초과하면, wt 대립유전자의 존재를 스크리닝하기 위해서 In-Fwd 및 In-Rev 프라이머로 병행 세트의 PCR 반응을 설정한다.

105| 반전을 스크리닝하기 위해서 PCR 반응이 다음과 같이 설정된다:

주: 프라이머는 Out-Fwd + In Fwd, 또는 Out-Rev + In-Rev로서 쌍을 이룬다.

106| 출원인은 각 반응에 단계 103으로부터의 표준화된 게놈 DNA 100-200 ng을 첨가했다.

107| PCR 반응이 다음의 사이클링 조건을 사용하여 수행되었다:

108| 출원인은 생성물의 점검을 위해 1-2% 겔 상에 PCR 생성물 2-5 ㎕를 전개시켰다. 이들 PCR 조건은 대부분의 프라이머에서 작동하도록 설계되지만, 일부 프라이머는 주형 농도, MgCl₂ 농도 및/또는 아닐링 온도를 조정함에 의한 추가의 최적화를 필요로 할 수 있다.

HDR을 통한 표적화된 편형을 위한 제노타이핑 . 시기 · 2-3d, 2-3h 수동

109| 출원인은 QuickExtract 용액을 사용하여 상기 설명된 대로 DNA를 수거하고, 100-200 ng/㎕의 최종 농도까지 TE로 게놈 DNA를 표준화했다.

110| 변형된 영역의 PCR 증폭. PCR 반응이 다음과 같이 설정된다:

111| 출원인은 각 반응에 대해 단계 109로부터의 게놈 DNA 주형 100-200 ng을 첨가하고, 다음의 프로그램을 수행했다.

112| 출원인은 5 ㎕의 PCR 생성물을 0.8-1% 겔 상에서 전개시켜 단일 밴드 생성물을 점검했다. 프라이머는 주형 농도, MgCl₂ 농도 및/또는 아닐링 온도를 조정함에 의한 추가의 최적화를 필요로 할 수 있다.

113| 출원인은 PCR 반응물을 QIAQuick PCR 정제 키트를 사용하여 정제했다.

114| HDR 실시예에서, HindIII 제한 부위가 EMX1 유전자에 삽입된다.

들은 PCR 앰플리콘의 제한 소화에 의해서 검출된다:

i. DNA는 37℃에서 10m 동안 소화된다:

ii. 출원인은 소화된 생성물 10 ㎕를 로딩 염료와 함께 4-20% 구배 폴리아크릴아미드 TBE 겔 상에서 자일렌 시아놀 밴드가 겔의 바닥으로 이동할 때까지 전개시켰다.

iii. 출원인은 겔을 1X SYBR 골드 염료로 15 m 동안 흔들면서 염색했다.

iv. 절단 생성물은 서베이어 분석 섹션에서 상기 설명된 대로 이미지화되고 정량된다. HDR 효율이 식 (b + c)/(a + b + c)에 의해서 추산되며, 여기서 a는 소화되지 않은 HDR PCR 생성물의 적분된 강도이고, b 및 c는 HindIII-절단 단편의 적분된 강도이다.

115| 또는 달리, Sanger 시퀀싱 또는 NGS를 사용하여 단계 113으로부터의 정제된 PCR 앰플리콘이 클로닝되고 제노타이핑될 수 있다.

심층 시퀀싱 및 표적외 분석 · 시기 제1일 내지 제2일

온라인 CRISPR 표적 설계 도구는 각 확인된 표적 부위에 대해 후보 게놈 표적외 부위를 생성한다. 이들 부위에서 표적외 분석은 서베이어 뉴클레아제 분석, Sanger 시퀀싱, 또는 차세대 심층 시퀀싱에 의해서 수행될 수 있다. 이들 부위의 대부분에서 낮거나 검출불가능한 변형 비율의 가능성이 주어진다면, 출원인은 높은 감도 및 정확도를 위해서 Illumina Miseq 플랫폼에 의한 심층 시퀀싱을 추천했다. 프로토콜은 시퀀싱 플랫폼에 따라 변할 것이며; 여기서 출원인은 간단히 시퀀싱 어댑터를 부착하기 위한 융합 PCR 방법을 설명한다.

116| 프라이머 설계 심층 시퀀싱. 차세대 시퀀싱 (NGS) 프라이머가 전형적으로 100-200 bp 크기 범위의 더 짧은 앰플리콘에 대해 설계된다. 프라이머는 NCBI 프라이머-블라스트를 사용하여 수동으로 설계되거나, 또는 온라인 CRISPR 표적 설계 도구로 생성될 수 있다(웹사이트 genome-engineering.org/tools).

117| Cas9-표적화된 세포로부터 게놈 DNA 수거. QuickExtract 게놈 DNA를 ddH₂O로 100-200 ng/㎕까지 표준화한다.

118| 초기 라이브러리 제조 PCR. 단계 116으로부터의 NGS 프라이머를 사용하여 초기 라이브러리 제조 PCR을 준비한다.

119| 각 반응에 표준화된 게놈 DNA 주형 100-200 ng을 첨가한다.

120| 20 증폭 사이클을 넘지 않게 다음의 사이클링 조건을 사용하여 PCR 반응을 수행한다:

121| 단일 밴드 생성물을 점검하기 위해 1% 겔 상에 PCR 생성물 2-5 ㎕를 전개시킨다. 모든 게놈 DNA PCR과 마찬가지로, NGS 프라이머는 주형 농도, MgCl₂ 농도 및/또는 아닐링 온도를 조정함에 의한 추가의 최적화를 필요로 할 수 있다.

122| QIAQuick PCR 정제 키트를 사용하여 PCR 반응물을 정제하고, 용출액을 20 ng/㎕까지 표준화한다. 유의점: 정제된 PCR 생성물은 -20℃에 보관될 수 있다.

123| Nextera XT DNA 샘플 제조 키트 . 제조자의 프로토콜에 따라서, 각 샘플에 대해 특유의 바코드를 가진 Miseq 시퀀싱-즉시이용 라이브러리를 생성한다.

124| 시퀀싱 데이터 분석. 표적외 분석이 ClustalW, Geneious, 또는 간단한 서열 분석 스트립트와 같은 판독 정렬 프로그램을 통해서 수행될 수 있다.

시기

단계 1 - 2 sgRNA 올리고 및 ssODN의 설계 및 합성: 1-5 d, 공급자에 따라 가변적

단계 3 - 5 CRISPR 플라스미드 또는 PCR 발현 카세트의 구성: 2 h 내지 3 d

단계 6 - 53 세포주에 트랜스펙션: 3 d (1 h 체험 시간)

단계 54 - 70 클론 계통의 선택적 유도: 1-3 주, 세포 타입에 따라 가변적

단계 71 - 91 서베이어를 통한 NHEJ의 기능적 검증: 5-6 h

단계 92 - 124 Sanger 또는 차세대 심층 시퀀싱을 통한 제노타이핑: 2-3 d (3-4 h 체험 시간)

실시예와 관련한 상황 취급

고찰

CRISPR-Cas는 몇 개 유전자의 동시 변형을 촉진하고 염색체 미소결실을 높은 효율로 매개하기 위해서 쉽게 복합화될 수 있다. 출원인은 HEK293FT 세포에서 최대 68%의 효율로 인간 GRIN2B 및 DYRK1A 유전자좌의 동시 표적화를 증명하기 위하여 2 개의 sgRNA를 사용했다. 마찬가지로, 한 쌍의 sgRNA가 엑손의 삭제와 같은 미소결실을 매개하기 위해 사용될 수 있으며, 이것은 클론 수준으로 PCR에 의해서 제노타이핑될 수 있다. 엑손 접합부의 정확한 위치는 변할 수 있다는 것을 유의한다. 출원인은 또한 HEK293 및 HUES9 세포에서 Cas9의 야생형과 닉카아제 돌연변이를 모두 가진 HDR을 매개하기 위한 ssODN 및 표적화 벡터의 사용을 증명했다(도 12). 출원인은 Cas9 닉카아제를 사용하여 HUES9 세포에서 HDR을 검출할 수 없었다는 것을 유의하며, 이것은 HUES9 세포에서 낮은 효율 또는 수선 활성의 잠재적 차이로 인한 것일 수 있다. 이들 값은 전형적이지만, 주어진 sgRNA의 절단 효율에 일부 가변성이 있으며, 특정 sgRNA가 아직 밝혀지지 않은 이유로 작동하지 않는 경우는 거의 없다. 출원인은 각 유전자좌에 대해 2개의 sgRNA를 설계하고, 의도된 세포 타입에서 이들의 효율을 시험할 것을 추천했다.

실시예 26: NLS

Cas9 전사 모듈레이터: 출원인은 Cas9/gRNA CRISPR 시스템을 DNA 절단을 넘어서는 기능이 실행될 수 있는 일반적인 DNA 결합 시스템으로 바꾸는 것을 제시했다. 예를 들어, 촉매 비활성 Cas9 위에 기능적 도메인(들)을 융합함으로써, 출원인은 전사 활성화/억제, 메틸화/탈메틸화, 또는 크로마틴 변형과 같은 새로운 기능을 부여했다. 이 목표를 달성하기 위해서, 출원인은 뉴클레아제 활성에 필수적인 두 잔기, 즉 D10과 H840을 알라닌으로 바꿈으으로써 촉매 비활성 Cas9 돌연변이를 제작했다. 이들 두 잔기를 돌연변이함으로써, 표적 DNA와 결합하는 능력을 유지한 채로 Cas9의 뉴클레아제 활성이 폐기된다. 출원인이 출원인의 가설을 시험하는데 중요하다고 결정한 기능적 도메인은 전사 활성인자 VP64와 전사 억제인자 SID 및 KRAB이다.

Cas9 핵 위치: 출원인은 가장 효과적인 Cas9 전사 모듈레이터는 핵에 강력히 국소화되며, 여기서 전사에 대해 최대 영향을 미칠 것이라는 가설을 세웠다. 더욱이, 세포질에서 어떤 잔류 Cas9는 원치않는 효과를 가질 수 있다. 출원인은 야생형 Cas9가 다중 핵 위치 신호 (NLS)를 포함하지 않고는 핵에 국소화되지 않는다는 것을 결정했다(CRISPR 시스템은 하나 이상의 NLS를 가질 필요가 없지만, 적어도 하나 이상의 NLS(들)를 갖는 것이 유익하다). 다중 NLS 서열이 요구되었기 때문에, 핵 위치를 파괴할 수 있는, Cas9와 융합되는 핵 및 어떤 추가의 도메인에 Cas9를 넣는 것이 어려운 이유가 되었다. 따라서, 출원인은 상이한 NLS 서열을 가진 4개의 Cas9-VP64-GFP 융합 작제물을 제작했다(pXRP02- p렌티2-EF1a-NLS-hSpCsn1(10A,840A)-NLS-VP64-EGFP, pXRP04- p렌티2-EF1a-NLS-hSpCsn1(10A,840A)-NLS-VP64-2A-EGFP-NLS, pXRP06- p렌티2-EF1a-NLS-EGFP-VP64-NLS-hSpCsn1(10A,840A)-NLS, pXRP08- p렌티2-EF1a-NLS-VP64-NLS-hSpCsn1(10A,840A)-NLS-VP64-EGFP-NLS). 이들 작제물은 인간 EF1a 프로모터의 발현하에 렌티 백본에 클로닝되었다. WPRE 요소가 또한 더욱 확실한 단백질 발현을 위채 첨가되었다. 각 작제물은 리포펙탐 2000을 사용하여 HEK 293FT 세포에 트랜스펙션되고 트랜스펙션 24 시간 후 이미지화되었다. 최상의 핵 위치는 융합 단백질이 융합 단백질의 N- 및 C-말단에 모두 NLS 서열을 가질 때 얻어진다. 최고로 관찰된 핵 위치는 4 개의 NLS 요소를 가진 작제물에서 발생된다.

Cas9에 대한 NlS 요소의 영향을 더 확실히 이해하기 위해서, 출원인은 0 내지 3 개 텐덤 반복부를 고려하여 N- 또는 C-말단에 동일한 알파 임포틴 NLS 서열을 첨가함으로써 16 개의 Cas9-GFP 융합체를 제작했다. 각 작제물은 리포펙탐 2000을 사용하여 HEK 293FT 세포에 트랜스펙션되고 트랜스펙션 24 시간 후 이미지화되었다. 주목할 점은 NLS 요소의 수가 핵 위치의 범위와 직접 상관되지 않는다는 것이다. C-말단에 NLS를 부가하는 것은 N-말단에 부가하는 것보다 핵 위치에 더 많은 영향을 미친다.

Cas9 전사 활성인자: 출원인은 Sox2 유전자좌를 표적화하고 RT-qPCR에 의해서 전사 활성화를 정량함으로써 Cas9-VP64 단백질을 기능적으로 시험했다. 8 개의 DNA 표적 부위가 Sox2의 프로모터에 걸쳐 놓이도록 선택되었다. 각 작제물은 리포펙탐 2000을 사용하여 HEK 293FT 세포에 트랜스펙션되었고, 트랜스펙션 72 시간 후 총 RNA가 세포로부터 추출되었다. 1 ㎍의 RNA가 40 ㎕ 반응물에서 cDNA로 역전사되었다(qScript 수퍼믹스). 2 ㎕의 반응 생성물이 TaqMan 분석 qPCR 반응물의 단일 20 ㎕에 첨가되었다. 각 실험은 생물학적 및 기술적으로 3 번 중복 수행되었다. RT 대조군 및 주형 대조군 반응물은 증폭을 나타내지 않았다. 강한 핵 위치를 나타내지 않은 작제물인 pXRP02 및 pXRP04는 활성화를 가져오지 않는다. 강한 핵 위치를 나타낸 작제물인 pXRP08의 경우, 중도의 활성화가 관찰되었다. 통계적으로 유의한 활성화가 가이드 RNAs Sox2.4 및 Sox2.5에서 관찰되었다.

실시예 27: 생체내 마우스 데이터

재료 및 시약

10x NE완충제 4 (NEB, 카탈로그 번호 B7004S)

BsaI HF (NEB, 카탈로그 번호 R3535S)

T7 DNA 리가아제(Enzymatics, 카탈로그 번호 L602L)

FastDigest 완충제, 10X (ThermoScientific, 카탈로그 번호 B64)

FastDigest NotI(ThermoScientific, 카탈로그 번호 FD0594)

FastAP 알칼리성 포스파타제(ThermoScientific, 카탈로그 번호 EF0651)

리포펙타민 2000 (Life Technologies, 카탈로그 번호 11668-019)

트립신(Life Technologies, 카탈로그 번호 15400054)

겸자 #4(Sigma, 카탈로그 번호 Z168777-1EA)

겸자 #5(Sigma, 카탈로그 번호 F6521-1EA)

10x 행크 균형 염 용액(Sigma, 카탈로그 번호 H4641-500ML)

페니실린/스트렙토마이신 용액(Life Technologies, 카탈로그 번호 P4333)

뉴로베이셜(Life Technologies, 카탈로그 번호 21103049)

B27 보충액(Life Technologies, 카탈로그 번호 17504044)

L-글루타민(Life Technologies, 카탈로그 번호 25030081)

글루타메이트(Sigma, 카탈로그 번호 RES5063G-A7)

β-메르캅토에탄올(Sigma, 카탈로그 번호 M6250-100ML)

HA 토끼 항체(Cell Signaling, 카탈로그 번호 3724S)

LIVE/DEAD® 세포 이미징 키트(Life Technologies, 카탈로그 번호 R37601)

30G World Precision Instrument 주사기(World Precision Instruments, 카탈로그 번호 NANOFIL)

정위고정 장치 (Kopf Instruments)

UltraMicroPump3 (World Precision Instruments, 카탈로그 번호 UMP3-4)

수크로스(Sigma, 카탈로그 번호 S7903)

염화칼슘(Sigma, 카탈로그 번호 C1016)

마그네슘 아세테이트(Sigma, 카탈로그 번호 M0631)

Tris-HCl(Sigma, 카탈로그 번호 T5941)

EDTA (Sigma, 카탈로그 번호 E6758)

NP-40 (Sigma, 카탈로그 번호 NP40)

페닐메탄설포닐 플루오라이트(Sigma, 카탈로그 번호 78830)

염화마그네슘(Sigma, 카탈로그 번호 M8266)

염화칼륨(Sigma, 카탈로그 번호 P9333)

β-글리세로포스페이트(Sigma, 카탈로그 번호 G9422)

글리세롤 (Sigma, 카탈로그 번호 G9012)

Vybrant® DyeCycle™ Ruby Stain (Life technologies, 카탈로그 번호 S4942)

FACS Aria Flu-act-세포 정렬기 (Koch Institute of MIT, Cambridge US)

DNAeasy 혈액 & 조직 키트(Qiagen, 카탈로그 번호 69504)

과정

뇌에서 생체내 사용하기 위한 gRNA 다중복합체의 구성

출원인은 마우스 TET 및 DNMT 패밀리 멤버를 표적화하는 단일 gRNA를 설계하고 PCR 증폭했다(본 명세서에 설명된 대로). 표적화 효율이 N2a 세포주에서 평가되었다(도 15). 몇 개 유전자의 생체내 동시 변형을 얻기 위하여, 효과적인 gRNA가 AAV-패키징 벡터에서 다중복합체화되었다(도 16). 시스템 효율의 추가 분석을 촉진하기 위해서, 출원인은 시스템에 인간 시냅신 I 프로모터의 제어하에 GFP-KASH 도메인 융합 단백질로 구성된 발현 카세트를 첨가했다(도 16). 이 변형은 뉴런 집단에서 시스템 효율의 추가 분석을 허용한다(더 상세한 과정은 핵 정렬 및 생체내 결과 섹션 참조).

시스템의 모든 4 부분이 다음의 프라이머를 사용하여 허큘라제 II 융합 폴리머라제를 사용해서 PCR 증폭되었다:

출원인은 단일 단계 반응에서 시스템의 모든 부분을 조립하기 위해 골든 게이트 전략을 사용했다(1:1 분자비):

1^st U6_gRNA 18 ng

2^nd U6_gRNA 18 ng

3^rd U6_gRNA 18 ng

Syn_GFP-kash 100 ng

10x NE완충제 4 1.0 ㎕

10x BSA 1.0 ㎕

10 mM ATP 1.0 ㎕

BsaI HF 0.75 ㎕

T7 리가아제 0.25 ㎕

ddH ₂ O 10 ㎕

사이클 수 조건

1-50 37℃, 5m 및 21℃, 5m

골든 게이트 반응 생성물은 허큘라제 II 융합 폴리머라제 및 다음의 프라이머를 사용하여 PCR 증폭되었다:

PCR 생성물은 NotI 제한 부위를 사용하여 ITR 서열 사이에서 AAV 백본에 클로닝되었다:

PCR 생성물 소화:

37℃에서 20분 인큐베이션 후, 샘플이 QIAQuick PCR 정제 키트를 사용하여 정제되었다. 표준화된 샘플이 다음과 같이 1:3 벡터:삽입체 비로 결찰되었다:

소화된 pUC19 50 ng

소화된 삽입체 1:3 벡터:삽입체 몰비

T7 리가아제 1 ㎕

2X 신속 결찰 완충제 5 ㎕

ddH ₂ O 최대 10 ㎕

결찰 반응 생성물로 박테리아의 형질전환 후, 출원인은 Sanger 시퀀싱에 의해서 얻어진 클론을 확인했다.

양성 DNA 클론이 Cas9 작제물과 공-트랜스펙션 후 N2a 세포에서 시험되었다(도 17 및 18).

AAV 전달을 위한 신규 Cas9 작제물의 설계

AAV 전달 시스템은 그것의 독특한 특징에도 불구하고 팩킹 제한을 가지는데, 발현 카세트를 생체내에 성공적으로 전달하기 위해서는 그것이 4.7 kb 미만의 크기를 가져야 한다. SpCas9 발현 카세트의 크기를 감소시키고 전달을 촉진하기 위해서, 출원인은 몇 가지 변경을 시험했다: 상이한 프로모터, 짧은 폴리A 신호 및 마지막으로 Staphylococcus aureus (SaCas9)로부터의 더 작은 버전의 Cas9 (도 19 및 20). 모든 시험된 프로모터는 마우스 Mecp2 (Gray et al., 2011), 래트 Map1b 및 말단절단된 래트 Map1b (Liu and Fischer, 1996)를 포함하는 뉴런에서 활성인 것으로 이미 시험되고 공개되었다. 대안적인 합성 폴리A 서열도 역시 기능적인 것으로 이미 밝혀졌다(Levitt et al., 1989; Gray et al., 2011). 모든 클로닝된 작제물은 리포펙타민 2000에 의한 트랜스펙션 후 N2a 세포에서 발현되었고, 웨스턴 블롯팅 방법으로 시험되었다(도 21).

1차 뉴런에서 AAV다중복합체 시스템의 시험

뉴런에서 개발된 시스템의 기능성을 확인하기 위하여, 출원인은 시험관내 1차 뉴런 배양물을 사용한다. 마우스 피질 뉴런이 Banker and Goslin (Banker and Goslin, 1988)에 의해서 이미 공개된 프로토콜에 따라서 제조되었다.

뉴런 세포는 16 일 배아로부터 얻어진다. 안락사시킨 임신한 암컷으로부터 배아를 추출하고 절두한 다음, 머리를 얼음 냉각된 HBSS에 넣어 두었다. 다음에, 겸자(4# 및 #5)를 사용하여 두개골로부터 뇌를 추출하고, 다른 교체된 얼음 냉각된 HBSS에 옮긴다. 얼음 냉각된 HBSS로 채워진 페트리 디쉬에서 #5 겸자를 사용하여 입체 현미경의 도움하에 추가의 단계를 수행한다. 각 다른 쪽 뇌줄기에서 뇌의 반구를 분리하며, 뇌척수막은 없다. 다음에, 해마가 주의깊게 절개되어 얼음 냉각된 HBSS로 채운 15㎖ 원뿔형 튜브에 넣는다. 해마 절개 후 남은 피질은 뇌줄기 잔류물과 후 신경구 제거 후 유사한 프로토콜을 사용하여 추가의 세포 분리에 사용될 수 있다. 분리된 해마는 10 ㎖ 얼음-냉각된 HBSS로 3번 세척하고, 37℃에서 HBSS (해마 당 10 ㎕ 2.5% 트립신 첨가된 4 ㎖ HBSS) 중에서 트립신과 함께 15분 인큐베이션하여 해리시킨다. 트립신화 후, 해마는 37℃로 예열된 HBSS로 어떤 미량의 트립신을 제거하기 위해서 매우 주의깊게 3 번 세척되고, 따뜻한 HBSS에서 해리된다. 출원인은 일반적으로 1 ㎖ 피펫 팁을 사용하여 1 ㎖ HBSS에서 10-12 개 배아로부터 얻어진 세포를 해리하고, 해리된 세포를 최대 4 ㎖로 희석한다. 세포는 250 세포/mm²의 밀도로 평판되고, 최대 3 주 동안 37℃ 및 5% CO₂에서 배양된다.

HBSS

435 ㎖ H₂O

50 ㎖ 10x 행크 균형 염 용액

16.5 ㎖ 0.3M HEPES pH 7.3

5 ㎖ 페니실린-스트렙토마이신 용액

여과(0.2 μm) 및 4℃ 보관

뉴런 평판 배지 (100 ㎖)

97 ㎖ 뉴로베이셜

2 ㎖ B27 보충액

1 ㎖ 페니실린-스트렙토마이신 용액

250 ㎕ 글루타민

125 ㎕ 글루타메이트

뉴런은 배양물에서 4 내지 7 일 사이에 HEK293FT 세포의 여과된 배지로부터의 농축된 AAV1/2 바이러스 또는 AAV1 바이러스로 형질도입되고, 형질도입 후 적어도 1 주 동안 배양물에 유지되며, 이로써 전달된 유전자 발현이 허용된다.

시스템의 AAV -유도된 발현

출원인은 웨스턴 블롯 방법을 사용하여 AAV 전달 후 뉴런 배양물에서 SpCas9 및 SaCas9의 발현을 확인했다(도 24). 형질도입 1 주 후에 뉴런이 β-메르캅토에탄올을 가진 NuPage SDS 로딩 완충제에 수집하였고, 5 분 동안 95℃에서 단백질 분해되었다. 샘플을 SDS PAGE 겔에서 분리하였고, WB 단백질 검출을 위해 PVDF 막으로 옮겼다. Cas9 단백질이 HA 항체로 검출되었다.

gRNA 다중복합체 AAV로부터 Syn-GFP-kash의 발현이 형광 현미경으로 확인되었다(도 32).

독성

CRISPR 시스템을 가진 AAV의 독성을 평가하기 위해서, 출원인은 바이러스 형질도입 1주 후에 뉴런의 전체 형태를 시험했다(도 27). 추가로, 출원인은 LIVE/DEAD® 세포 이미징 키트를 사용하여 설계된 시스템의 잠재적 독성을 시험했으며, 이것은 배양물에서 살아 있는 세포와 죽은 세포의 구별을 허용한다. 그것은 세포내 에스테라제 활성의 존재에 기초한다(비-형광 칼세인 AM의 짙은 녹색 형광 칼세인으로의 효소 전환에 의해서 결정된다). 한편, 키트의 적색, 세포-불침투 구성성분은 손상된 막을 가진 세포로 진입하여 DNA와 결합해서 죽은 세포에서 형광을 생성한다. 플루오로포어는 모두 형광 현미경을 사용하여 살아 있는 세포에서 쉽게 시각화될 수 있다. 일차 피질 뉴런에서 Cas9 단백질과 다중복합체 gRNA 작제물의 AAV-유도된 발현은 잘 용인되었으며 독성은 없었는데 (도 25 및 26), 이것은 설계된 AAV 시스템이 생체내 시험에 적합하다는 것을 나타낸다.

바이러스 제조

McClure et al., 2011에 설명된 방법에 따라서 농축 바이러스가 제조되었다. 상청액 바이러스 제조는 HEK293FT 세포에서 발생했다.

뇌 수술

바이러스 벡터 주사의 경우, 10-15 주령 수컷 C57BL/6N 마우스가 복강내 주사에 의해서 케타민/자일라진 칵테일로 마취시켰다(케타민 용량 100 ㎎/㎏ 및 자일라진 용량 10 ㎎/㎏). Buprenex의 복강내 투여가 예비-선취 마취제로서 사용되었다(1㎎/㎏). 동물은 두개골을 움직이지 않도록 유지하기 위해서 이내 배치 스터드 및 투스 바를 사용하여 Kopf 정위고정 장치에 고정되었다. 해마의 CA1 영역에 주사하기 위해 핸드헬드 드릴을 사용하여 브레그마에서 앞쪽 -3.0 mm, 측면 3.5 mm에 구멍 (1-2 mm)을 만들었다. 2.5 mm 깊이의 30G World Precision Instrument 주사기를 사용하여 AAV 바이러스 입자 용액이 총 1 ㎕ 부피가 주사되었다. 주사는 조직 손상을 방지하기 위하여 0.5 ㎕/분의 유속의 'World Precision Instruments UltraMicroPump3' 주입 펌프에 의해서 모니터링되었다. 주입이 완료되었을 때, 0.5 mm/분의 속도로 주사 바늘이 서서히 제거되었다. 주사 후, 피부가 6-0 Ethilon 봉합실로 봉합되었다. 동물은 1 ㎖ 락테이트 링거액으로 수술 후 수화되었고(피하), 보행 회복을 달성할 때까지 온도 제어 (37℃) 환경에 수용되었다. 수술 3 주 후 동물은 깊은 마취에 의해서 안락사되었고, 이후 핵 정렬을 위해 조직이 제거되거나, 면역화학을 위해 4% 파라포름알데하이드로 관류되었다.

핵 정렬 및 생체내 결과

출원인은 표지된 세포 핵의 형광 활성화 세포 정렬 (FACS) 및 DNA, RNA 및 핵 단백질의 하류 가공을 위해 GFP로 gRNA 표적화된 뉴런 세포 핵을 특이적으로 유전적으로 태그화하는 방법을 설계했다. 이 목적을 위해서, 출원인의 다중복합체 표적화 벡터는 GFP와 마우스 핵 막 단백질 도메인 KASH (Starr DA, 2011, Current biology) 의 융합 단백질과 관심대상의 특정 유전자 유전자좌를 표적화하기 위한 3 gRNA를 모두 발현하도록 설계되었다(도 16). GFP-KASH는 인간 시냅신 프로모터의 제어하에 발현되었으며, 이로써 뉴런을 특이적으로 표적화할 수 있다. 융합 단백질 GFP-KASH의 아미노산은 다음과 같았다:

뇌에 AAV1/2 매개 전달 후 1 주 뒤에 GFP-KASH의 확실한 발현이 관찰되었다. FACS 및 표지된 핵의 하류 가공을 위해서, 수술 3주 후 해마가 절개되고, 구배 원심분리 단계를 사용한 세포 핵 정제를 위해 가공되었다. 이 목적을 위해서, 조직은 320 mM 수크로스, 5 mM CaCl, 3 mM Mg(Ac)₂, 10 mM 트리스 pH 7.8, 0.1 mM EDTA, 0.1% NP40, 0.1 mM 페닐메탄설포닐 플루오라이드 (PMSF), 1 mM β-메르캅토에탄올에서 2 ㎖ Dounce 균질화장치 (Sigma)를 사용하여 균질화되었다. 균질화물은 4℃에서 3,500 rpm에서 30 분 동안 제조자의 프로토콜에 따라서 25% 내지 29% Optiprep® 구배에서 원심분리되었다. 핵 펠릿이 340 mM 수크로스, 2 mM MgCl₂, 25 mM KCl, 65 mM 글리세로포스페이트, 5% 글리세롤, 0.1 mM PMSF, 1 mM β-메르캅토에탄올에 재현탁되고, 세포 핵을 표지하기 위해 Vybrant® DyeCycle™ Ruby Stain(Life technologies)이 첨가되었다(DNA에 대해 근적외선 방출을 제공한다). 표지되고 정제된 핵은 FACS에 의해서 Aria Flu-act-세포 정렬장치 및 BDFACS Diva 소프트웨어를 사용하여 정렬되었다. 정렬된 GFP+ 및 GFP- 핵은 최종적으로 표적화된 게놈 영역의 서베이어 분석을 위하여 DNAeasy 혈액 & 조직 키트(Qiagen)를 사용하여 게놈 DNA를 정제하는데 사용되었다. 하류 가공을 위해 표적화된 세포로부터 핵 RNA 또는 단백질을 정제하는데도 동일한 접근법이 쉽게 사용될 수 있다. 2-벡터 시스템(도 16)으로 인하여, 출원인은 이 접근법에서 효과적인 Cas9 매개 DNA 절단이 뇌에서 세포의 작은 하위세트에서만 발생할 것이라고 예상했다(다중복합체 표적화 벡터와 Cas9 암호화 벡터로 공-감염된 세포). 여기 설명된 방법은 출원인이 DNA, RNA 및 핵 단백질을 관심대상의 3 gRNA를 발현하는 세포 집단으로부터 특이적으로 정제할 수 있도록 하며, 따라서 Cas9 매개 DNA 절단을 겪을 것으로 추정된다. 이 방법을 사용함으로써 출원인은 세포의 작은 하위세트에서만 발생한 효과적인 생체내 DNA 절단을 시각화할 수 있었다.

본질적으로, 출원인이 여기 나타낸 것은 표적화된 생체내 절단이다. 또한, 출원인은 독립적이지만 동시에 몇 개의 상이한 서열이 표적화되는 다중 접근법을 사용했다. 제시된 시스템은 뇌 병리 상태 (유전자 녹아웃, 예를 들어 파킨슨 질환)를 연구하기 위해 적용될 수 있으며, 또한 뇌에서 게놈 편집 도구의 추가의 개발에 대한 분야도 열려 있다. 뉴클레아제 활성을 유전자 전사 조절인자 또는 후성적 조절인자로 대체함으로써 학습 및 기억 형성으로서 병리학적 상태뿐만 아니라 생리학적 과정에서도 유전자 조절 및 후성적 변호의 역할에 대한 전 범위의 과학적 질문에 답하는 것이 가능할 것이다. 마지막으로, 제시된 기술은 영장류와 같은 더 복잡한 포유류 시스템에 적용될 수 있으며, 현재 기술의 제한을 극복할 수 있다.

실시예 28: 모델 데이터

몇 가지 질환 모델이 구체적으로 조사되었다. 이들은 신규 자폐 위험 유전자들인 CHD8, KATNAL2, 및 SCN2A; 그리고 증후군성 자폐 (앤젤만 증후군) 유전자 UBE3A를 포함한다. 이들 유전자와 결과의 자폐 모델이 물론 바람직하지만, 본 발명은 어떤 유전자에도 적용될 수 있으며, 따라서 어떤 모델도 가능하다.

출원인은 인간 배아 줄기세포 (hESC)에서 Cas9 뉴클레아제를 사용하여 이들 세포주를 제작했다. 세포주는 Cbh-Cas9-2A-EGFP 및 pU6-sgRNA에 의한 hESC의 일시적 트랜스펙션에 의해서 생성되었다. 환자 논센스(녹아웃) 돌연변이가 자폐 환자의 전체 엑솜 시퀀싱 연구로부터 최근 설명된 동일한 엑손을 표적화하는 각 유전자에 대해 2개의 sgRNA가 설계된다. Cas9-2A-EGFP 및 pU6 플라스미드가 이 프로젝트를 위해 구체적으로 생성되었다.

실시예 29: AAV 생성 시스템 또는 프로토콜

고 처리량 스크리닝 사용을 위해 개발된, 특히 웰에서의 작업을 위한 AAV 생성 시스템 또는 프로토콜이 본원에서 제공되지만, 본 발명은 역시 더 ?은 적용성을 가진다. 내인성 유전자 발현의 조작은 다양한 난제를 나타내며, 발현의 비율은 조절 구성요소, mRNA 프로세싱, 및 전사체 안정성을 포함하는 많은 요인들에 따른다. 이 난제를 극복하기 위해서 출원인은 전달을 위한 아데노-연관 바이러스(AAV)-기반 벡터를 개발했다. AAV는 ssDNA-기반 게놈을 가지며, 따라서 재조합에 덜 민감하다.

AAV1/2(혈청형 AAV1/2, 즉 하이브리드 또는 모자이크 AAV1/AAV2 캡시드 AAV) 헤파린 정제된 농축된 바이러스 프로토콜

배지: D10 + HEPES

500 ㎖ 보틀 DMEM 고 글루코오스 + 글루타맥스(GIBCO)

50 ㎖ Hyclone FBS (열-비활성화) (Thermo Fischer)

5.5 ㎖ HEPES 용액 (1M, GIBCO)

세포: 저 계대 HEK293FT (계대 <10 바이러스 제조시, 바이러스 제조를 위해 계대 2-4의 새로운 세포 해동, 3-5 계대 동안 성장)

트랜스펙션 시약: 폴리에틸렌이민 ( PEI ) " 맥스 "

50 ㎎ PEI "맥스"를 50 ㎖ 멸균 Ultrapure H20에 용해

pH 7.1로 조정

0.22 um 플립탑 필터로 여과

튜브 밀봉 및 파라핀으로 래핑

-20℃에서 알리쿼트 냉동(보관의 경우, 즉시 사용될 수도 있다)

세포 배양

저 계대 HEK293FT를 D10 + HEPES에서 배양

1:2 내지 1:2.5 로 매일 계대

세포는 85%를 초과하는 컨플루언시에는 도달하지 않도록 하는 것이 유익하다.

T75의 경우

- 따뜻한 10㎖ HBSS (-Mg2+, -Ca2+, GIBCO) + 1㎖ TrypLE Express (GIBCO), 플라스크 당, 37℃ (수조)

배지를 완전히 흡인

- 10 ㎖ 따뜻한 HBSS를 부드럽게 첨가 (배지를 완전히 세척하기 위해)

- 플라스크 당 1 ㎖ TrypLE 첨가

- 1 분 동안 인큐베이터에 플라스크를 둔다(37℃)

- 세포가 탈착하도록 플라스크를 흔든다

- 9 ㎖ D10 + HEPES 배지 첨가 (37℃)

- 5번 위아래로 피펫팅해서 단일 세포 현탁액을 생성한다

- 1:2 - 1:2.5 (T75의 경우 12 ㎖ 배지) 비로 분할한다(세포가 더 서서히 성장중인 경우, 폐기하고 새로운 배치를 해동한다, 이들은 최적 성장 상태가 아니다)

- 충분한 세포가 존재하게 되면 곧 T225로 옮긴다(다량의 세포를 취급하는 경우)

AAV 제조 ( 작제물 당 5*15cm 디쉬 규모) :

21.5 ㎖ 배지 중의 1000만 세포를 15 cm 디쉬에 평판

37℃에서 18-22 시간 동안 인큐베이션

트랜스펙션은 평판 당 80% 컨플루언시에서 이상적이다.

평판 당

예비 가온된 22 ㎖ 배지(D10 + HEPES)

DNA 혼합물로 튜브 준비( 엔도프리 맥시프렙 DNA 사용):

관심대상 플라스미드의 벡터 5.2 ㎍

4.35 ㎍ AAV 1 혈청형 플라스미드

4.35 ㎍ AAV 2 혈청형 플라스미드

10.4 ㎍ pDF6 플라스미드 (아데노바이러스 헬퍼 유전자) 와동시켜 혼합

434 ㎕ DMEM 첨가 (혈청 없음!)

130 ㎕ PEI 용액 첨가

5 내지 10 초 와동

예비 가온된 배지에 DNA/DMEM/PEI 혼합물 첨가

간단히 와동시켜 혼합

15 cm 디쉬에서 배지를 DNA/DMEM/PEI 혼합물로 교체

37℃ 인큐베이터로 복귀

수거 전 48 h 인큐베이션 (배지가 너무 산성으로 변하지 않도록 보장한다)

바이러스 수거 :

1. 15 cm 디쉬로부터 배지를 주의깊게 흡인한다(세포가 손실되지 않는 것이 유익하다)

2. 각 평판에 25 ㎖ RT DPBS (Invitrogen)를 첨가하고, 세포 스크래퍼로 세포를 부드럽게 제거한다. 50 ㎖ 튜브에 현탁액을 수집한다.

3. 10 분 동안 800x g에서 세포를 펠릿화한다.

4. 상청액을 버린다.

유의점: 원한다면 -80C에서 세포 펠릿을 냉동시킨다

5. 펠릿을 150 mM NaCl, 20 mM Tris pH 8.0에 재현탁하고, 조직 배양 평판 당 10㎖를 사용한다.

6. dH₂O 중에 10% 나트륨 데옥시콜레이트의 신선한 용액을 준비한다. 0.5%의 최종 농도를 위해서 조직 배양 평판 당 이것을 1.25 ㎖ 첨가한다. ㎖ 당 50 유닛의 최종 농도로 벤조나제 뉴클레아제를 첨가한다. 튜브를 완전히 혼합한다.

7. 1시간 동안 37℃에서 인큐베이션(수조).

8. 세포 파편을 15 분 동안 3000 x g에서 원심분리하여 제거한다. 새 50 ㎖ 튜브로 옮겨서 모든 세포 파편이 제거된 것을 보장하여 헤파린 칼럼의 차단을 방지한다.

AAV1 /2의 헤파린 칼럼 정제 :

1. 분당 1㎖로 용액이 칼럼을 통해서 유동하도록 연동 펌프를 사용하여 HiTrap 헤파린 칼럼을 설정한다. 헤파린 칼럼에 기포가 도입되지 않도록 보정하는 것이 중요하다.

2. 연동 펌프를 사용하여 칼럼을 10 ㎖ 150 mM NaCl, 20 mM Tris, pH 8.0과 평형을 이루도록 한다.

3. 바이러스의 결합: 50 ㎖ 바이러스 용액을 칼럼에 적용하여 관통 유동시킨다.

4. 세척 단계 1: 20 ㎖ 100 mM NaCl, 20 mM Tris, pH 8.0로 칼럼 세척(연동 펌프 사용)

5. 세척 단계 2: 3 ㎖ 또는 5 ㎖ 주사기를 사용하여 1 ㎖ 200 mM NaCl, 20 mM Tris, pH 8.0로 칼럼 세척을 계속하고, 이어서 1 ㎖ 300 mM NaCl, 20 mM Tris, pH 8.0로 세척한다.

관통 유동시켜 버린다.

(상기 바이러스 용액의 50 분 관통 유동 동안 상이한 완충제를 사용하여 주사기를 준비한다)

6. 용출: 5 ㎖ 주사기를 사용하여 부드럽게 가압해서 칼럼으로부터 바이러스를 용출시킨다: 다음을 적용한다: (유속 < 1㎖/분)

1.5 ㎖ 400 mM NaCl, 20 mM Tris, pH 8.0

3.0 ㎖ 450 mM NaCl, 20 mM Tris, pH 8.0

1.5 ㎖ 500 mM NaCl, 20 mM Tris, pH 8.0

이들을 15 ㎖ 원심분리 튜브에 수집한다.

AAV1 /2의 농축 :

1. 농축 단계 1: 100,000 분자량 컷오프를 가진 Amicon ultra 15 ㎖ 원심분리 필터를 사용하여 용출된 바이러스를 농축한다. 칼럼 용출액을 농축장치에 로딩하고 2 분 동안 2000x g에서 원심분리한다(실온에서). 농축된 부피 점검 - 대략 500 ㎕가 되어야 한다. 필요하다면 정확한 부피에 도달할 때까지 1 분 간격으로 원심분리한다.

2. 완충제 교환: 여과 유닛에 1 ㎖ 멸균 DPBS를 첨가하고, 정확한 부피 (500 ㎕)에 도달할 때까지 1 분 간격으로 원심분리한다.

3. 농축 단계 2: Amicon Ultra 0.5 ㎖ 100K 필터 유닛에 500 ㎕ 농축물을 가한다. 2 분 동안 6000 g에서 원심분리한다. 농축된 부피 점검 - 대략 100 ㎕가 되어야 한다. 필요하다면 정확한 부피에 도달할 때까지 1 분 간격으로 원심분리한다.

4. 회수: 필터 삽입물을 뒤집어 반전시키고 새 수집관에 삽입한다. 2 분 동안 1000 g에서 원심분리한다.

알리쿼트 분할 및 -80℃에서 냉동

주사 부위 당 1 ㎕가 전형적으로 요구된다, 따라서 작은 알리쿼트(예를 들어, 5㎕)가 추천된다(바이러스의 냉동-해동은 피한다).

qPCR을 사용하여 DnaseI-내성 GC 입자 역가를 결정한다(별도 프로토콜 참조)

재료

Amicon Ultra, 0.5 ㎖, 100 K; MILLIPORE; UFC510024

Amicon Ultra, 15 ㎖, 100 K; MILLIPORE; UFC910024

벤조나제 뉴클레아제; Sigma-Aldrich, E1014

HiTrap 헤파린 카트리지; Sigma-Aldrich; 54836

나트륨 데옥시콜레이트; Sigma-Aldrich; D5670

AAV1 상청액 생성 프로토콜

배지: D10 + HEPES

500 ㎖ 보틀 DMEM 고 글루코오스 + 글루타맥스(GIBCO)

50 ㎖ Hyclone FBS (열-비활성화) (Thermo Fischer)

5.5 ㎖ HEPES 용액 (1 M, GIBCO)

세포: 저 계대 HEK293FT (계대 <10 바이러스 제조시)

바이러스 제조를 위해 계대 2-4의 새로운 세포 해동, 2-5 계대 동안 성장

트랜스펙션 시약: 폴리에틸렌이민 (PEI) "맥스"

50 ㎎ PEI "맥스"를 50 ㎖ 멸균 Ultrapure H20에 용해

pH 7.1로 조정

0.22 um 플립탑 필터로 여과

튜브 밀봉 및 파라핀으로 래핑

-20℃에서 알리쿼트 냉동 (보관의 경우, 즉시 사용될 수도 있다)

세포 배양

저 계대 HEK293FT를 D10 + HEPES에서 배양 1:2 내지 1:2.5 로 매일 계대

세포는 85%를 초과하는 컨플루언시에는 도달하지 않도록 하는 것이 유익하다

T75의 경우

- 따뜻한 10 ㎖ HBSS (-Mg2+, -Ca2+, GIBCO) + 1 ㎖ TrypLE Express (GIBCO), 플라스크 당, 37℃ (수조)

- 배지를 완전히 흡인

- 플라스크 당 1 ㎖ TrypLE 첨가

- 1 분 동안 인큐베이터에 플라스크를 둔다(37℃)

- 세포가 탈착하도록 플라스크를 흔든다

- 9 ㎖ D10 + HEPES 배지 첨가(37℃)

- 5 번 위아래로 피펫팅해서 단일 세포 현탁액을 생성한다

AAV 제조 (단일 15 cm 디쉬 규모)

21.5 ㎖ 배지 중의 1000만 세포를 15 cm 디쉬에 평판

37℃에서 18-22 시간 동안 인큐베이션

트랜스펙션은 평판 당 80% 컨플루언시에서 이상적이다

예비 가온된 22 ㎖ 배지(D10 + HEPES)

DNA 혼합물로 튜브 준비 (엔도프리 맥시프렙 DNA 사용):

관심대상 플라스미드의 벡터 5.2 ㎍

8.7 ㎍ AAV 1 혈청형 플라스미드

10.4 ㎍ DF6 플라스미드(아데노바이러스 헬퍼 유전자)

와동시켜 혼합

434 ㎕ DMEM 첨가 (혈청 없음!) 130 ㎕ PEI 용액 첨가

5-10 초 와동

예비 가온된 배지에 DNA/DMEM/PEI 혼합물 첨가

간단히 와동시켜 혼합

15 cm 디쉬에서 배지를 DNA/DMEM/PEI 혼합물로 교체

37℃ 인큐베이터로 복귀

수거 전 48 h 인큐베이션 (배지가 너무 산성으로 변하지 않도록 보장하기 위해 모니터링하는 것이 유익하다)

바이러스 수거:

15 cm 디쉬로부터 상청액을 제거한다

0.45 um 필터로 알리쿼트를 여과하고(낮은 단백질 결합), -80℃에서 냉동한다

형질도입 (24-웰 형식으로 일차 뉴런 배양, 5DIV)

신선한 뉴로베이셜로 전환되도록 뉴런의 각 웰에서 뉴로베이셜을 완전히 교체한다(일반적으로 웰 당 500 ㎕ 중 400 ㎕이 교체된다)

37℃ 수조에서 AAV 상청액을 해동한다

30 분 동안 인큐베이터에서 평형을 이루도록 둔다.

각 웰에 250 ㎕ AAV 상청액을 첨가한다

37℃에서 24h 인큐베이션한다

배지/상청액을 제거하고, 신선한 뉴로베이셜로 완전히 교체한다

발현은 48 시간 후 육안으로 볼 수 있게 되며, 감염 후 약 6-7 뒤에 포화된다

GOI를 가진 pAAV 플라스미드를 위한 작제물은 ITRS를 포함해서 4.8 kb를 초과하지 않아야 한다

인간 코돈 최적화된 서열(즉, 인간에서의 발현에 대해 최적화된): SaCas9의 예가 아래 제공된다:

실시예 30: Cas9 닉카아제 및 2 개의 가이드 RNA를 사용한 표적외 절단의 최소화

Cas9는 RNA-안내된 DNA 뉴클레아제로서, 20bp RNA 가이드의 도움을 받아 게놈의 특정 위치에 표적화될 수 있다. 그러나, 가이드 서열은 가이드 서열과 DNA-표적 서열 사이에 일부 미스매치를 허용할 수 있다. 가이드 RNA가 가이드 서열과 상이한 몇 개의 염기를 가진 표적외 서열에 Cas9를 표적화하는 경우인 표적외 절단에 대한 가능성으로 인하여 이런 유연성은 바람직하지 않다. 모든 실험 용도 (유전자 표적화, 작물 조작, 치료 용도 등)에서, Cas9 매개 유전자 표적화의 특이성을 개선하고, Cas9에 의한 표적외 변형의 가능성을 감소시킬 수 있는 것이 중요하다.

출원인은 표적외 변형 없이 게놈에 표적화된 이중가닥 브레이크를 촉진하기 위해서 2 개의 가이드 RNA와 조합하여 Cas9 닉카아제 돌연변이를 사용하는 방법을 개발했다. Cas9 닉카아제 돌연변이는 절단 활성을 불능화함으로써 Cas9 뉴클레아제로부터 생성될 수 있으며, 이로써 DNA 듀플렉스의 가닥이 둘 다 절단되는 대신 단지 하나의 가닥이 절단된다. Cas9 닉카아제는 Cas9 뉴클레아제의 하나 이상의 도메인에 돌연변이, 예를 들어 Ruvc1 또는 HNH를 유도함으로써 생성될 수 있다. 이들 돌연변이는, 제한은 아니지만, Cas9 촉매 도메인의 돌연변이를 포함할 수 있으며, 예를 들어 SpCas9에서 이들 돌연변이는 위치 D10 또는 H840에 있을 수 있다. 이들 돌연변이는, 제한은 아니지만, SpCas9에서는 D10A, E762A, H840A, N854A, N863A 또는 D986A를 포함할 수 있으며, 닉카아제는 다른 CRISPR 효소 또는 Cas9 오솔로그에서 상응하는 위치에 돌연변이를 유도함으로써 생성될 수 있다. 본 발명의 가장 바람직한 구현예에서, Cas9 닉카아제 돌연변이는 D10A 돌연변이를 가진 SpCas9 닉카아제다.

이 방식에서, 이 작업은 Cas9 닉카아제와 조합된 각 가이드 RNA가 듀플렉스 DNA 표적의 표적화된 단일가닥 브레이크를 유도할 것이다. 각 가이드 RNA는 하나의 가닥에 흉터를 형성하므로, 순 결과는 이중가닥 브레이크가 된다. 이 방법이 표적외 돌연변이를 제거하는 이유는 가이드 서열과 높은 정도의 유사성을 가진 표적외 부위를 갖는 것이 매우 어렵기 때문이다(20 bp+2 bp(PAM) = 22 bp, 각 가이드, 및 2 개의 가이드에 대한 특이성은 어떤 표적외 부위가 44 bp의 상동성 서열에 근접해야 한다는 의미이다). 여전히 개별 가이드는 표적외를 가질 수 있지만, 표적외에는 단지 흉터가 형성될 뿐일 테고, 이것은 돌연변이유발 NHEJ 과정에 의해서 잘 수선되지 않을 것이다. 따라서, DNA 이중가닥 흉터형성의 복합화는 표적외 돌연변이유발 효과 없이 표적화된 DNA 이중가닥 브레이크를 도입하는 강력한 방식을 제공한다.

출원인은 HEK293FT 세포와 Cas9(D10A) 닉카아제를 암호화하는 플라스미드 및 하나 이상의 가이드를 위한 DNA 발현 카세트의 공-트랜스펙션을 수반하는 실험을 수행했다. 출원인은 리포펙타민 2000을 사용하여 세포를 트랜스펙션했고, 트랜스펙션된 세포는 트랜스펙션 48 또는 72 시간 후에 수거되었다. 이중 흉터형성-유도 NHEJ가 앞서 설명된 서베이어 뉴클레아제 분석을 사용하여 검출되었다(도 33, 34 및 35).

출원인은 두 가이드 RNA와 조합되었을 때 Cas9 닉카아제 돌연변이에 의한 효과적인 절단에 관한 변수들을 더 확인했으며, 이들 변수들은, 제한은 아니지만 5' 돌출부의 길이를 포함한다. 효과적인 절단은 적어도 26 염기쌍의 5' 돌출부에서 보고된다. 본 발명의 바람직한 구현예에서, 5' 돌출부는 적어도 30 염기쌍, 더 바람직하게 적어도 34 염기쌍이다. 절단을 위해 200 염기쌍 이하의 돌출부가 허용될 수 있지만, 100 염기쌍 미만의 5' 돌출부가 바람직하며, 50 염기쌍 미만의 5' 돌출부가 가장 바람직하다(도 36 및 37).

실시예 31: 게놈 편집 특이성을 향상하기 위하여 RNA로 가이드되는 CRISPR Cas9에 의한 이중 닉 형성

표적화된 게놈 편집 기술들은 광범위한 연구와 의학적 적용을 가능하게 하였다. 미생물 CRISPR-Cas 시스템으로부터 유래하는 Cas9 뉴클레아제는 20 nt의 가이드 서열에 의해 게놈상 특이 유전자 좌로 표적화되는데, 이때 상기 Cas9 뉴클레아제는 DNA 표적에 대한 임의의 미스매치들을 관용할 수 있어서 원치않는 탈 표적 돌연변이유발을 촉진한다. 실시예 30에 간략하게 기술되어 있는 바와 같이, 본 실시예에서 출원인들은 Cas9 닉카아제 돌연변이체와 쌍 형성 가이드 RNA들을 합하여 표적화된 이중 가닥 파괴들을 도입하는 접근법을 추가로 기술하고자 한다. 게놈 내 각각의 닉들은 높은 신뢰도로 수선되므로, 적당히 상쇄 관계에 있는 가이드 RNA들을 통한 자발적 닉 형성은 이중 가닥 파괴들에 필요하고, 따라서 표적 절단을 위해 특이적으로 인지되는 염기들의 수는 효과적으로 증가한다. 출원인들은 쌍으로 닉이 형성되면, 세포주 내에서 탈 표적 활성이 50배 내지 1000배 감소할 수 있으며, 표적 상 절단 효율이 떨어지지 않고서 마우스 접합체 내 유전자 녹-아웃이 촉진됨을 입증하였다. 그러므로 이와 같이 다재다능한 전략은 높은 특이성을 필요로 하는 다양한 게놈 편집 적용을 가능하게 한다.

정밀하고 표적화된 방식으로 게놈을 교란하는 능력은 생물학과 질병에 대한 유전적 기여를 이해하는데 중요하다. 세포주 또는 동물 모델의 게놈 조작은 전통적으로 무작위 돌연변이유발법 또는 저 효율 유전자 표적화를 통해 달성되어 왔다. 프로그램화 가능한 서열 특이적 DNA 뉴클레아제 기술들은 게놈 편집을 촉진하기 위하여 내인성 게놈 서열들의 표적화 변형이, 특히 유전학적으로 다루기 힘든 것으로 판명된 종들에서 고효율로 달성될 수 있도록 만들어 왔다. RNA로 가이드되는 Cas9 뉴클레아제로서, 미생물 CRISPR(클러스터를 형성하며, 규칙적인 간격을 두고 배치된 짧은 앞뒤 역순상 동서열 반복부; Clustered Regularly Interspaced Short Palindromic Repeat)-Cas 시스템으로부터 유래하는 Cas9 뉴클레아제는 진핵 세포 내에서 표적화된 이중 가닥 DNA 파괴(DSB)들을 촉진하기 위한, 활발하고 다재다능한 도구들로서, 이로 인해 진행되는 세포 내 수선 기작들(비 상동성 말단 접합(NHEJ) 또는 상동성 배향 수선(HDR) 경로들)은 오류 유발 변경들 또는 한정된 변경들을 유도하는데 이용될 수 있다.

스트렙토코커스 피오제네스로부터 유래하는 Cas9 뉴클레아제는 키메라 단일 가이드 RNA(sgRNA)에 의해 5'-NGG 프로토스페이서 인접 모티프(PAM)의 앞에 위치하는 임의의 게놈상 유전자 좌로 지시될 수 있다. sgRNA 내 20 nt의 가이드 서열은, 왓슨-크릭 염기쌍 형성을 통해 Cas9를 게놈 표적으로 지시해주고, 원하는 게놈상 유전자 좌를 표적화하도록 용이하게 프로그램될 수 있다. Cas9 특이성에 관한 최근의 연구들은, 비록 20 nt 가이드 서열 내 각각의 염기가 전체적인 특이성에 기여하긴 하지만 가이드 RNA 서열과 이의 상보성 표적 DNA 서열 간 다수의 미스매치는 이 미스매치의 양, 위치 및 염기 동일성에 따라서 관용될 수 있고, 이로 말미암아 잠재적 탈 표적 DSB들과 삽입-결실의 형성이 초래될 수 있음을 입증하였다. 이와 같이 원치않는 돌연변이들은, 높은 수준의 정밀도를 필요로 하는 게놈 편집 적용시(예를 들어, 원인이 되는 유전자 변이들을 테스트하기 위한 동질 유전자 세포주들의 생산, 또는 생체 내 및 생체 외 게놈 편집 기반 치료법 적용시) Cas9의 유용성을 잠재적으로 제한할 수 있다.

본 출원의 출원인들은 Cas9 매개 게놈 편집의 특이성을 개선하기 위해서, Cas9의 D10A 닉카아제 돌연변이체(Cas9n)와, 표적 위치가 있는 가닥의 반대쪽 가닥에 상보성인 상쇄 sgRNA들 한 쌍을 합한 신규 전략을 개발하였다. 한 쌍의 Cas9 닉카아제가 사용되어 양 DNA 가닥들에 닉이 형성되면 위치 특이적 DSB들과 NHEJ가 생기는 반면에, 각각의 닉들은 높은 신뢰도를 가지는 염기 절제 수선 경로(BER)에 의해 우선적으로 수선된다. 탈 표적 활성을 감소시키기 위하여 시스템을 조작할 가능성과 관련될 수 있는 쌍 형성 닉카아제 전략은 말리(Mali)외 다수에 의한 논문(2013a; 제목 "CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering")이 참고될 수 있다. 이량체 아연 핑거 뉴클레아제(ZFN)들 및 전사 활성 인자 유사 효과기 뉴클레아제(TALEN)들이 작용하는 방식과 유사한 방식으로, DNA 절단은 FokI 뉴클레아제 단량체들을 지시하는 2 개의 독립된 특이성 암호화 DNA 결합 모듈의 상승적 상호 작용을 필요로 하고, 이와 같은 이중 닉 형성 전략은 야생형 Cas9의 표적 상 변형률과 유사하게 표적 상 변형률을 유지하면서 개별 Cas9n-sgRNA 복합체에 의한 탈 표적 돌연변이유발을 최소화한다. 본원에서 출원인들은 효과적인 이중 닉 형성을 촉진하는 sgRNA 쌍들을 선별하는데 중요한 매개변수들을 정의하고, 야생형 Cas9의 특이성을, 이중으로 닉을 형성하는 Cas9n의 특이성과 비교하여 세포 내에서뿐만 아니라 마우스 접합체 내에서 이중 닉 형성을 이용하여 달성될 수 있는 다양한 실험적 적용들을 입증하고 있다.

가이드 서열의 연장은 Cas9 표적화 특이성을 개선하지 않는다: Cas9 표적화는 sgRNA 내 20 nt 가이드 서열과 표적 DNA 간 염기 쌍 형성에 의해 촉진된다. 본 출원인들은, 절단 특이성은 가이드 RNA와 이의 표적 유전자 좌 사이의 염기 쌍 형성 길이를 증가시켰을 때 개선될 수 있음을 추론하였다. 본 출원인들은, 인간 EMX1 유전자 내 유전자 좌를 표적화하는 20 nt 가이드 서열(sgRNA 1) 또는 30 nt 가이드 서열들(sgRNA 2 및 3)이 이용되어 3 개의 sgRNA들을 발현시키기 위해 U6 구동 발현 카세트를 제조하였다(도 38a).

본 출원인들 외 다수는, 가이드 서열의 PAM 원위 영역과 표적 DNA 간 단일 염기 미스매치는 Cas9에 의해 널리 관용되는 반면, 이 영역 내 다수의 미스매치들은 표적 상 활성에 유의적으로 영향을 미칠 수 있음을 앞서 보인 바 있다. 본 출원인들은, 추가의 PAM 원위 염기들(21 개 내지 30 개)이 전체 표적화 특이성에 영향을 미칠 수 있는지 여부를 확인하기 위해, 완전히 매치하는 염기 10 개 또는 미스매치 염기 8 개(21번 내지 28번 염기) 중 어느 하나의 경우로 이루어진 추가 염기들 10 개가 sgRNA 2 및 sgRNA 3에 함유되도록 디자인하였다. 놀랍게도, 본 출원인들은 이와 같이 연장된 sgRNA들은 추가의 염기들이 게놈 표적에 상보성이었는지 여부와 상관없이, HEK 293FT 세포 내 표적 유전자 좌에서 유사한 수준의 변형을 매개하였음을 관찰하였다(도 38b). 후속 노던 블롯은 sgRNA 2 및 sgRNA 3 둘 다 대다수가 sgRNA 1(추가 염기들을 포함하지 않고 길이가 20 nt로 동일한 가이드 서열을 함유함)과 동일한 길이를 가지도록 가공되었음을 밝혔다(도 38c).

Cas9 닉카아제는 쌍을 이루고 상쇄 관계에 있는 가이드 RNA들과 함께 효율적인 NHEJ를 생성한다: 가이드 서열의 연장은 Cas9 표적화 특이성을 개선하는데에 실패했음이 고려될 때, 본 출원인들은 가이드 서열과 이의 DNA 표적 간 전체 염기 쌍 형성 길이를 증가시키기 위한 대안적인 전략을 구하였다. Cas9 효소들은 2 개의 보존된 뉴클레아제 도메인들, 즉 HNH와 RuvC를 함유하는데, 이 도메인들은 각각 가이드 RNA에 상보성인 DNA 서열과 상보성이 아닌 DNA 서열을 절단한다. 촉매 잔기들의 돌연변이들(RuvC 내 D10A 및 HNH 내 H840A)은 Cas9를 DNA 닉카아제로 전환한다. 단일 가닥 닉들은 고 신뢰도 BER 경로에 의해 바람직하게 수선되므로, 본 출원인들은, 표적 유전자 좌의 반대쪽 가닥들을 표적화하는 sgRNA들 한 쌍에 의해 지시되는 Cas9 닉 형성 효소 2 개가 탈 표적 활성을 최소화하면서 DSB를 매개할 수 있음을 추론하였다(도 39a).

다수의 인자는 삽입-결실 형성을 초래하는 협동적 닉 형성, 예를 들어 2 개의 인접 Cas9 분자들 또는 Cas9-sgRNA 복합체(돌출부 형태)와, 서열 구성 간 입체 장애에 영향을 미칠 수 있는데; 이와 같은 인자들 중 일부는 변별적 표적 서열들과 상쇄 부(소정의 sgRNA 쌍의 가이드 서열의 PAM 원위(5') 말단들 간 길이)를 이용하여 다수의 sgRNA 쌍들을 테스트함으로써 특징지어질 수 있다. 본 출원인들은 sgRNA 상쇄 부가 후속 수선 과정과 삽입-결실 생성에 어떻게 영향을 미치는지에 대해 체계적으로 평가하기 위하여, 우선 일정 범위의 상쇄 길이(약 -200 bp로부터 200 bp)만큼 떨어져 있는 인간 EMX1 게놈상 유전자 좌에 대해 표적화된 sgRNA 쌍들의 세트들을 디자인하여, 5'-돌출부 생성물과 3'-돌출부 생성물 둘 다가 생성되도록 만들었다(도 39a 및 도 44a 내지 도 44f). 그 다음, 출원인들은 각각의 sgRNA 쌍이 D10A Cas9 돌연변이체(Cas9n이라고 칭하여짐; H840A Cas9 돌연변이체는 Cas9H840A로 칭하여짐)와 함께 인간 HEK 293FT 세포들 내에서 삽입-결실 부를 형성하는 능력을 평가하였다. 활발한 NHEJ(40% 이하)가, -4 bp 내지 20 bp에 상쇄 부를 가지는 sgRNA 쌍들에 대해 관찰되었는데, 이때 상기 sgRNA 쌍들의 상쇄 부에 중간 길이(100 bp 이하)의 삽입-결실 부가 형성되었다(도 39b, 좌측 패널). 출원인들은 추후 다른 게놈상 유전자 좌 2 군데, 즉 DYRKIA 및 GRIN2B에서 상쇄 sgRNA 쌍들도 유사하게 테스트함으로써 이와 같은 발견들을 간략하게 뒷받침하였다(도 39b, 우측 패널). 주목될 점은, 관찰된 유전자 좌 3 개 모두에 걸쳐서 오로지 가이드 서열들 간에 8 bp 미만의 중첩 부(-8bp 보다 큰 상쇄 부)를 가지는 5' 돌출부를 생성하는 sgRNA 쌍들만이 확인 가능한 삽입-결실 부 형성을 매개할 수 있었다는 점이다(도 39c). 중요한 사실은, 이러한 분석법들에서 사용된 각각의 가이드가 야생형 Cas9과 쌍을 이룰 때 삽입-결실 부를 효율적으로 유도할 수 있다는 사실인데(도 44a 내지 도 44f), 이는 가이드 쌍들의 상대적 위치들은 이중 닉 형성 활성을 예측함에 있어서 가장 중요한 매개변수들임을 암시한다.

Cas9n과 Cas9H840A는 DNA의 반대쪽 가닥들에 닉을 형성하므로, Cas9n이 Cas9H840A으로 치환되고, 이 Cas9H840A와 소정의 sgRNA 쌍은 함께 돌출부 형태의 역전을 초래한다. 예를 들어 Cas9n과 함께 5' 돌출부를 생성할 한 쌍의 sgRNA들은 주로 5' 돌출부 대신에 이와 상응하는 3' 돌출부를 생성할 것이다. 그러므로 Cas9n과 함께 3' 돌출부를 생성하는 sgRNA 쌍들은 5' 돌출부를 생성하기 위해 Cas9H840A와 함께 사용될 수 있다. 예상외로, 출원인들은, 5' 돌출부와 3' 돌출부(상쇄 범위 -278 bp로부터 +58 bp까지) 둘 다를 생성하도록 디자인된 sgRNA 쌍들의 한 세트와 함께 Cas9H840A를 테스트하였지만, 삽입-결실 부가 형성되는 것은 관찰할 수 없었다. Cas9H840A에 의하여 이중 닉 형성이 달성될 수 있도록 하기 위해서는, sgRNA 짝 형성에 필요한 디자인 규칙을 확인하기 위한 추가의 작업이 필요할 수 있다.

이중 닉 형성은 효율적인 게놈 편집을 개선된 특이성으로 매개한다: 본 출원인들은 이중 닉 형성(DN)이 높은 효율로 NHEJ를 야생형 Cas9에 의해 유도되는 수준과 거의 동일한 수준으로 매개함을 확립하였으며, 그 다음에는 DN의 탈 표적 활성을 측정함으로써, 상기 DN이 야생형 Cas9에 의한 DN에 비하여 편집 특이성을 개선하였는지 여부를 연구하였다. 본 출원인들은 +23 bp 상쇄 부만큼 간격을 두고 떨어져 있는 sgRNA 1 및 sgRNA 9와 함께 Cas9n을 HEK 293FT 세포들에 전달하여, 이 HEK 293FT 세포들 내 인간 EMX1 유전자 좌를 표적화하였다(도 40a). 상기 DN 배열은 표적 상 삽입-결실 수준들을, 각각의 sgRNA(단독)와 쌍을 이루는 야생형 Cas9에 의해 달성되는 삽입-결실 수준들과 유사하게 만든다(도 40b, 좌측 패널). 눈에 띄는 점은, 야생형 Cas9가 함께 작용할 때와는 달리, 상기 DN은 이미 검증된 sgRNA 1 탈 표적 위치, 즉 OT-4에서 서베이어 분석법에 의해 확인 가능한 정도의 변형을 달성하지 못하였다는 점인데(도 40b, 우측 패널), 이는 DN이 탈 표적 변형의 달성 가능성을 잠재적으로 감소시킬 수 있음을 암시하는 것이다.

5 개의 상이한 sgRNA 1 탈 표적 유전자 좌에서의 변형을 평가하기 위해 딥 시퀀싱이 이용되었을 때(도 40a), 본 출원인들은 모든 위치에서 야생형 Cas9과 sgRNA 1이 함께 사용되었을 때 유의적으로 돌연변이가 유발되는 것을 관찰하였다(도 40c). 이와는 반대로, 테스트 된 5 개의 탈 표적 위치에서 이루어진 Cas9n에 의한 절단은 백그라운드 서열결정 오류 이상으로는 좀처럼 확인되지 않았다. 특이성에 대한 미터법으로서 표적 상 변형 수준 대 탈 표적 변형 수준의 비율이 사용될 때, 본 출원인들은 Cas9n은 한 쌍의 sgRNA들과 함께 작동될 때 그 특이성을, 야생형 Cas9가 sgRNA들 중 하나와 함께 작동될 때 보이는 특이성에 비하여 100배 이상 증가시킬 수 있었음을 파악하였다(도 40d). 본 출원인들은 VEGFA 유전자 좌를 표적화하는 2 개의 sgRNA 쌍들(상쇄 부 +16 bp 및 +20 bp)에 대한 딥 시퀀싱을 통해 추가의 탈 표적 분석을 수행하였는데, 이때 유사한 결과들이 얻어졌다(도 40e). 이와 같은 탈 표적 유전자 좌(표 4)에서의 DN은 야생형 Cas9가 사용되는 DN보다 특이성을 200 배 내지 1500 배 이상까지 증가시킬 수 있었다(도 40f, 도 44). 모두 종합하였을 때, 이와 같은 결과들은 Cas9 매개 이중 닉 형성이 탈 표적 돌연변이 유발을 최소화하고, 증가한 특이성으로 게놈 편집을 달성하는데 적당함을 입증한다.

이중 닉 형성은 고 효율 상동성 배향 수선, NHEJ 매개 DNA 삽입 및 게놈 미세결실을 촉진한다: DSB는 상동성 배향 수선(HDR)을 촉진하여, 게놈 표적 위치들의 고도로 정밀한 편집을 가능하게 할 수 있다. 본 출원인들은 DN-유도성 HDR을 평가하기 위해 인간 EMX1 유전자 좌를 sgRNA들의 상쇄 부 쌍들(-3 bp 및 +18 bp)(31 bp 및 52 bp 돌출부들을 생성함)로 각각 표적화하였으며, HindIII 제한 위치들을 보유하는 단일 가닥 올리고데옥시뉴클레오티드(ssODN)를 HDR 수선 주형으로서 도입하였다(도 41a). 각각의 DN sgRNA 쌍은, 단일 가이드 Cas9n 닉카아제의 빈도보다 높으면서, 야생형 Cas9의 빈도와 거의 동일한 빈도로 HDR을 성공적으로 유도하였다(도 41b). 뿐만 아니라, 배 줄기 세포들 또는 환자 유래 유도 만능 줄기 세포 내 게놈 편집은 새로운 질병 패러다임을 만들어 연구하고, 새로운 치료법들을 개발하는데 있어서 핵심 기회를 제시한다. 인간 배 줄기 세포(hESC)들에서 HDR을 유도하는 것에 대한 단일 닉 접근법은 제한적인 성공을 거두었던 관계로, 본 출원인들은 HUES62 hES 세포주 내 DN을 시도하였으며, 이로부터 성공적인 HDR이 이루어졌음을 관찰하였다(도 41c).

다음으로, 상쇄 sgRNA 공간 배치가 HDR의 효율에 어떻게 영향을 미치는지를 추가로 특성 규명하기 위해, 본 출원인들은 HEK 293FT 세포 내에서 sgRNA 쌍들의 한 세트를 테스트하였다(이때, 1 개 이상의 sgRNA의 절단 위치는 (HDR ssODN 공여 주형 팔과 중첩되는) 재조합 위치 근처에 위치함). 본 출원인들은, 5' 돌출부를 생성하면서 상동성 팔의 22 bp 범위 안에 닉이 1 개 이상 형성되는 sgRNA 쌍들은, 야생형 Cas9 매개 HDR의 수준과 거의 동일하고, 단일 Cas9N-sgRNA 닉 형성이 이루어졌을 때의 HDR 수준보다 훨씬 높은 수준으로 HDR을 유도할 수 있음을 관찰하였다. 반대로, 본 출원인들은 동일한 DNA 가닥의 3' 돌출부를 생성하였거나 이중 닉 형성을 진행시켰던 sgRNA 쌍들이 관여하는 HDR은 관찰하지 못하였다(도 41d).

한정된 돌출부들을 생성하는 능력은, NHEJ 매개 결찰을 통해 양립 가능한 돌출부들을 함유하는 공여 수선 주형들의 정밀한 삽입을 가능하게 할 수 있었다. 본 출원인들은 이와 같이 이식 유전자 삽입을 위한 대안적 전략을 탐구하기 위해, 종결 코돈 근처에 43 bp의 5' 돌출부를 생성하도록 디자인된 하나의 sgRNA 쌍과 Cas9n을 사용하여 EMX1 유전자 좌를 표적화하였으며, 돌출부들이 매치하는 이중 가닥 올리고뉴클레오티드(dsODN) 듀플렉스를 공급하였다(도 42a). 다수의 에피토프 태그들과 제한 위치를 함유하는, 어닐링된 dsODN 삽입체는 빈도 3%로(클로닝된 앰플리콘들이 생거 서열결정법으로 스크리닝된 37 개의 삽입체들 중 1 개의 삽입체 꼴로) 표적에 성공적으로 통합되었다. 그러므로, 상기와 같은 결찰 기반 전략은, 짧은 변형 부를 암호화하는 dsODN, 예를 들어 단백질 태그들 또는 재조합 위치들을 내인성 유전자 좌에 삽입하는데 효과적인 접근법을 예시하는 것이다.

또한 본 출원인들은 sgRNA 쌍들의 조합(조합 하나당 sgRNA 4 개)을, HEK 293FR 세포들의 DYRK1A 유전자 좌에 표적화하여 게놈 미세결실을 촉진하였다. 본 출원인들은 0.5 kb, 1 kb, 2 kb 및 6 kb 결실들을 매개하기 위해 sgRNA들 한 세트를 만들었으며(도 42b, 도 45a 내지 도 45d: sgRNA 32, 33, 54 내지 61), 예측된 결실 크기들의 PCR 스크리닝을 통해 이와 같은 범위들에 걸쳐 일어난 성공적 다중 진행 닉 형성 매개 결실을 검증하였다.

이중 닉 형성은 마우스 접합체 내에서 효율적인 게놈 변형을 가능하게 한다: 최근 연구는, 야생형 Cas9 mRNA가 다수의 sgRNA들과 함께 전달되면, 다수의 대립 유전자 변형들을 운반하는 유전자 이식 마우스가 하나의 단계로 제조될 수 있음을 입증하였다. 본 출원인들은, 수 개의 sgRNA들이 한 번에 사용되었을 때 생체 내 게놈 변형이 달성되는 능력을 고려하여, 마우스 접합체 내 Cas9n에 의한 다중 닉 형성 효율을 평가하고자 하였다. 야생형 Cas9 또는 Cas9n mRNA 및 sgRNA들의 단일 세포 마우스 접합체로의 세포질 공동 주입은, Mecp2 유전자 좌의 성공적인 표적화를 가능하게 하였다(도 43a). 본 출원인들은, 효율적 유전자 표적화에 최적인 Cas9n mRNA 및 sgRNA의 농도를 확인하기 위해, sgRNA 수준을 Cas9:sgRNA의 몰비 1:20으로 유지하면서 Cas9n mRNA를 100 ng/uL에서 3 ng/uL로 적정하였다. Cas9 이중 닉 형성에 대해 테스트된 모든 농도들은 스크리닝된 배들의 80% 이상에서의 변형을 매개하였는데, 상기 수준은 야생형 Cas9에 의해 달성된 수준들과 비슷하였다(도 43b). 종합하여 보았을 때, 이와 같은 결과들은 이중 닉 형성 기반 게놈 편집을 다수 회 적용할 것을 제안한다.

고찰: 게놈 변형의 영구적 성질이 고려되었을 때, 특이성은 감수성이 커야 하는 분야, 예를 들어 특이적 유전자 변이체들과 생물 처리들 또는 질병의 표현형들 및 유전자 요법을 연계시키는 것을 목적으로 하는 연구에 매우 중요하다. 본 출원인들은 Cas9의 표적화 특이성을 개선하기 위한 전략들을 탐구하였다. 비록 sgRNA의 가이드 서열의 길이가 단순히 연장되는 것만으로는 표적 특이성이 개선될 수 없었지만, 적당히 상쇄 관계를 이루는 sgRNA들 2 개와 Cas9n이 합하여지면, 원치않는 절단은 최소화되면서 삽입-결실 부가 효과적으로 형성되었는데, 그 이유는 개별 탈 표적 단일 가닥 닉들은 염기 절제 수선을 통해 높은 신뢰도로 수선되기 때문이다. 인간 세포들 내 Cas9 뉴클레아제에 대한 유의적 탈 표적 돌연변이유발이 이미 보고되었음이 고려될 때, DN 접근법은 신속하고 정확한 게놈 편집을 위하여 일반화된 해결책을 제공할 수 있었다. 성공적인 Cas9 이중 닉카아제 매개 유전자 표적화를 좌우하는 공간 배치 매개 변수들의 특성 규명은, 길이 100 bp에 걸쳐 존재하는 효과적 상쇄 윈도우를 규명하였는데, 이를 통하여 sgRNA 쌍들의 선별에 있어서 고도의 융통성이 허용될 수 있었다. 이전에 행하여졌던 연산 분석들은, 5'-NGG PAM을 기반으로 하는 인간 게놈 내 스트렙토코커스 피오제네스 Cas9에 있어서 매 12 bp마다의 평균 표적화 범위를 규명하였는데, 이는 적당한 sgRNA 쌍들은 게놈 내 대부분의 유전자 좌에 대하여 용이하게 동정될 수 있어야 함을 암시한다. 본 출원인들은 DN 매개 삽입-결실 부의 빈도는 인간 세포들과 마우스 세포들 두 가지 경우에서 다수의 유전자 및 유전자 좌에서의 야생형 Cas9 변형의 빈도와 거의 동일하다는 것을 추가로 입증하였는데, 이는 고 정밀 게놈 조작을 위한 이와 같은 전략의 재현성을 확인시켜주는 것이다(도 44a 내지 도 44f).

Cas9 이중 닉 형성 접근법은 대체로 ZFN 및 TALEN 기반 게놈 편집 시스템들과 유사한데, 이때 표적 위치에서의 이중 가닥 파괴가 달성되기 위해서는 2 개의 헤미-뉴클레아제 도메인(hemi-nuclease domain)들 사이의 협동이 필요하다. ZFN 및 TALEN 시스템들의 체계적 연구들은, 소정의 ZFN과 TALEN 쌍의 표적화 특이성이 뉴클레아제 구조(동종 이량체 뉴클레아제 또는 이종 이량체 뉴클레아제) 또는 표적 서열에 크게 좌우될 수 있으며, 일부 경우들에 있어서 TALEN들은 매우 특이적일 수 있음을 규명하였다. 비록 야생형 Cas9 시스템이 높은 수준의 탈 표적 돌연변이 유발을 보이는 것으로 파악되었지만, DN 시스템은 전도 유망한 해결책이면서, ZFN 및 TALEN의 특이성 수준과 유사한 특이성 수준으로 RNA 가이드 게놈 편집이 달성되도록 만들기도 한다.

뿐만 아니라, Cas9가 표적화를 진행할 수 있는 용이함과 그 효율은 DN 시스템을 특히 매력적으로 만들어준다. 그러나, DN이 사용되는 DNA 표적화는 ZFN 및 TALEN의 경우와 유사한 탈 표적 난제들을 직면하게 될 것이고, 이 경우, 그 가능성은 유의적으로 낮지만, 탈 표적 위치들에서의 협동적 닉 형성은 여전히 발생할 수 있다. Cas9 특이성의 대규모 특성규명과 sgRNA 돌연변이 분석, 그리고 이러한 연구에서 확인된 NHEJ 매개 sgRNA 상쇄 부 범위가 고려되었을 때, sgRNA들의 소정의 쌍에 대하여 있을 수 있는 탈 표적 위치들을 평가하기 위해 연산 접근법들이 사용될 수 있다. 본 출원인들은 sgRNA 쌍 선별을 촉진하기 위하여 이중 닉 형성 적용에 최적인 공간 배치를 가지는 sgRNA 조합들을 동정하는 온라인 웹 도구(웹 사이트 genome-engineering.org로부터 입수 가능함)를 개발하였다.

비록 Cas9n은 표적 상 위치들에서 HDR을 촉진한다고 이미 보인 바 있지만, 이 Cas9n의 효율은 야생형 Cas9의 효율보다 훨씬 낮다. 이와는 대조적으로, 이중 닉 형성 전략은 탈 표적 변형들의 수준을 백 그라운드 수준으로 감소시키면서 표적 상 효율을 높게 유지한다. 그럼에도 불구, (DN 접근법이 이용되어 얻어진) DN 탈 표적 활성의 추가 특성규명, 특히 세포 또는 전체 유기체의 표적화된 딥 시퀀싱과 전체 게놈 서열결정을 통한 추가 특성규명은, 초고도 정밀 게놈 편집 기술이 요구되는 생물공학적 적용들 또는 임상학적 적용들에 있어서 Cas9n DN의 유용성을 평가하는데 필요할 수 있다. 추가로 Cas9n은, 논문[Mali et al. "CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering" (2013)]에 개시되어 있는 바와 같이, 임의의 sgRNA들에 대하여 표적 상 위치들에서 삽입-결실을 낮은 수준으로 유도하는 것으로 파악된 바 있는데, 여기서 상기와 같이 삽입-결실이 낮은 수준으로 유도되는 것은 잔류 이중 가닥 파괴 활성들로 말미암을 수 있으며, 이는 Cas9 촉매 활성의 추가 구조-기능 연구를 통해 회피될 수 있다. 전반적으로, Cas9n 매개 다중 진행 닉 형성은, 표적화된 게놈을 매우 정밀하면서 효율적으로 조작하기 위하여 맞춤 제작된 플랫폼으로서의 역할을 하고, 생물공학, 기초 과학 및 의학 분야에서의 적용 범위를 넓히는 것을 보장한다.

실험 과정들

세포 배양 및 트랜스펙션: 인간 배 신장(HEK) 세포주 293FT(라이프 테크놀로지스(Life Technologies)사) 또는 마우스 뉴로 2a(Neuro 2a)(시그마-알드리치(Sigma-Aldrich)사) 세포주는, 37℃에서 5% CO₂ 항온 처리되면서 10% 소 태아 혈청(하이클론(HyClone)), 2 mM 글루타맥스(GlutaMAX)(라이프 테크놀로지스), 100 U/㎖ 페니실린 및 100 ㎍/㎖ 스트렙토마이신이 보충된 둘베코 개질 이글 배지(Dulbecco's modified Eagle's Medium; DMEM) 중에 유지되었다.

세포들은 24웰 평판(코닝(Corning)사)들 상에 120,000 개 세포/웰의 밀도로 접종된 다음, 트랜스펙션되었다. 세포들은, 제조자의 권고 프로토콜에 따라서, 리포펙타민 2000(Lipofectamine 2000)(라이프 테크놀로지스사)이 사용되어 80% 내지 90%의 합류도로 트랜스펙션되었다. 총 500 ng의 Cas9 플라스미드와 100 ng의 U6-sgRNA PCR 생성물이 트랜스펙션되었다.

인간 배 줄기 세포주 HUES62(하버드 스템 셀 인스티튜트 코어; Harvard Stem Cell Institute core)는 영양 공급이 없는 조건 하에서, 100 ug/㎖ 노르모신(Normocin)(인비보젠; InvivoGen)이 보충된 mTesR 배지(스템셀 테크놀로지스; Stemcell Technologies) 중 겔트렉스(GelTrex)(라이프 테크놀로지스) 상에 유지되었다. HUES62 세포들은, 제조자의 프로토콜에 따라서, 아막사 P3 1차 세포 4-D 뉴클레오펙터 키트(Amaxa P3 Primary Cell 4-D Nucleofector Kit(론자; Lonza))로 트랜스펙션되었다.

게놈 변형에 대한 서베이어 뉴클레아제 검정: 293FT 및 HUES62 세포를 상기 기재된 바와 같이 DNA로 트랜스펙션시켰다. 세포를 게놈 DNA 추출 전에 트랜스펙션 후 72시간 동안 37℃에서 인큐베이션하였다. 게놈 DNA를 제조업체의 프로토콜에 따라 QuickExtract DNA 추출 용액(Epicentre)을 이용하여 추출하였다. 간단히, 펠렛화된 세포를 QuickExtract 용액에 재현탁시키고, 15분 동안 65℃, 15분 동안 68℃, 및 10분 동안 98℃에서 인큐베이션하였다.

각각의 유전자에 대한 CRISPR 표적 부위의 측접한 게놈 영역을 PCR 증폭시키고(표 2), 생성물을 제조업체의 프로토콜에 따라 QiaQuick Spin Column(Qiagen)을 이용하여 정제하였다. 전체 400 ng의 정제된 PCR 생성물을 2 μl의 10X Taq DNA 폴리머라제 PCR 완충액(Enzymatics) 및 초순수와 20 μl의 최종 부피로 혼합하고, 헤테로듀플렉스 형성을 가능케 하기 위해 재-아닐링 과정에 적용시켰다: 10분 동안 95℃, -2℃/s로 95℃에서 85℃로 램핑, -0.25℃/s로 85℃에서 25℃로 램핑, 및 1분 동안 25℃에서 유지. 재-아닐링 후, 제조업체의 권장 프로토콜에 따라 생성물에 서베이어 뉴클레아제 및 서베이어 인핸서 S(Transgenomics)를 처리하고, 4 내지 20% Novex TBE 폴리아크릴아미드 겔(Life Technologies)에서 분석하였다. 겔을 30분 동안 SYBR Gold DNA 염색제(Life Technologies)로 염색하고, Gel Doc 겔 영상화 시스템(Bio-rad)으로 영상화하였다. 정량화는 상대 밴드 강도를 기초로 하였다. 삽입-결실 백분율을 식 100 x (1 - (1 - (b + c) / (a + b + c))¹ ^/ ²)에 의해 결정하였고, 상기 식에서 a는 분해되지 않은 PCR 생성물의 통합된 강도이고, b 및 c는 각각의 절단 생성물의 통합된 강도이다.

인간 세포 노던 블롯들에 있어서 tracr RNA 발현에 대한 노던 블롯 분석이 문헌[Cong et al., 2013]에 이미 개시된 바와 같이 수행되었다. 요약하면, mir프리미어 마이크로RNA 분리 키트(mirPremier microRNA Isolation kit)(시그마)가 사용되어 RNA들이 추출되었으며, 이 RNA들은 이후 5분 동안 95℃로 가열되었고, 그 다음 8% 변성 폴리아크릴아미드 겔(세쿼겔(SequaGel), 내셔널 다이아그노스틱스(National Diagnostics)사) 상에 로딩되었다. 이후, RNA는 예비 혼성화된 하이본드 N+ 막(Hybond N+ membrane)(GE 헬스케어; GE Healthcare)에 옮겨졌으며, 여기서 스트라타젠 UV 크로스링커(Stratagene UV Crosslinker)(스트라타젠; Stratagene)와 가교되었다. 프로브들은 T4 폴리뉴클레오티드 키나아제(뉴 잉글랜스 바이오랩스; New England Biolabs)와 함께 [감마-32P] ATP(퍼킨 엘머(Perkin Elmer))로 표지화되었다. 막이 세정된 다음, 이 막은 인광체 스크린에 1 시간 동안 노출된 후, 인광 물질 영상화 장치(타이푼; Typhoon)로 스캔되었다.

표적화 특성을 평가하기 위한 딥 시퀀싱: HEK 293FT 세포들은 도말된 후 전술된 바와 같이 트랜스펙션되었으며, 이로부터 72 시간 후 게놈 DNA 추출이 수행되었다. 각각의 유전자에 대한 CRISPR 표적 위치에 측접하는 게놈 영역은 융합 PCR 방법에 의해 증폭되었으며(프라이머 서열들에 관하여는 표 3 참조), 그 결과 일루미나 P5 어댑터(Illumina P5 adapter)들과 유일무이한 시료 특이적 바코드들이 표적에 부착되었다. PCR 생성물들은, 제조자의 권고 프로토콜에 따라서, 이코노스핀 96웰 필터 평판(EconoSpin 96-well Filter Plates)(이포크 라이프 사이언시스; Epoch Life Sciences)이 사용되어 정제되었다.

바코드 부착된 정제 DNA 시료들은 큐비트 2.0 형광 강도계(라이프 테크놀로지스)에 의해 정량되었으며, 동몰비로 풀링(pooling)되었다. 그 다음, 서열결정용 라이브러리들은 일루미나 미세크 퍼스널 시퀀서(Illumina MiSeq Personal Sequencer)(라이프 테크놀로지스)로 서열 결정되었다.

서열결정 데이터 분석, 삽입-결실 검출 및 상동성 재조합 검출: 미세크 판독 결과들은 평균 프레드(Phred) 품질(Q 스코어) 30 이상이면서 바코드 및 앰플리콘 정 프라이머들에 서열이 완전히 매치해야 하는 조건이 요구됨으로 말미암아 필터링되었다. 표적 상 유전자 좌 및 탈 표적 유전자 좌로부터 얻어진 판독 결과들은, 파이썬 디플립 모듈(Python difflib module)에서 수행되는 바와 같이, 표적 위치(총 80 bp)의 상류 및 하류(30 개 뉴클레오티드로 이루어짐)가 포함되는 유전자 좌 서열들에 대한 랫클리프-오버쉘프(Rarcliff-Obershelp) 문자열 비교에 의해 분석되었다. 결과의 편집 작업들이 분석되었으며, 판독 결과들은 (만일 삽입 또는 결실 작용들이 확인되었다면) 삽입-결실 부로서 계수되었다. 만일 표적 영역 정렬의 일부가 미세크 판독 결과에 포함되지 않거나, 또는 만일 5 개 이상의 염기가 읽히지 않는다면, 분석된 해당 표적 영역들은 제외되었다.

각각의 시료에 대한 음성 대조군들은, 삽입-결실 부의 포함 또는 배제 여부에 대한 게이지를 추정 절단 이벤트(putative cutting event)로서 제공하였다. 상동성 재조합의 정량을 위해, 판독 결과들은 우선 삽입-결실 확인 작업 흐름에서와 같이 처리된 다음, 상동성 재조합 주형 CCAGGCTTGG의 존재가 확인되었다.

마우스 접합체로의 미세주입: Cas9 mRNA 및 sgRNA 주형들은 T7 프로모터 서열 접합 프라이머와 함께 증폭되었다. Cas9 및 Cas9n이 겔 정제된 후, 이 Cas9 및 Cas9n은 m메세지 m머신 T7 울트라 키트(mMESSAGE mMACHINE T7 Ultra Kit; 라이프 테크놀로지스)가 사용되어 전사되었다. sgRNA들은 메가쇼트스크립트 T7 키트(MEGAshortscript T7 Kit; 라이프 테크놀로지스)가 사용되어 전사되었다. RNA들은 메가클리어 키트(MEGAclear Kit; 라이프 테크놀로지스)가 사용되어 정제된 후, -80℃로 동결되었다.

MII 단계 난모 세포는, PMSG(하버(Harbor), UCLA) 7.5 I.U. 및 hCG(밀리포어(Millipore))가 주입됨으로써, 8주령 과배란 BDF1 암컷으로부터 수집되었다. 상기 난모 세포는 10 ㎎/㎖ 소 혈청 알부민(BSA; 시그마-알드리치)이 보충된 HTF 배지로 옮겨진 후, 성체 C57BL/6 수컷 마우스의 꼬리 쪽 부고환으로부터 채취된 가능 정자(capacitated sperm)와 수정되었다. 수정 후 6 시간 경과시 피에조(Piezo) 충격 구동 현미 조작 기구(일본 이바라키현 소재, 프라임 테크 리미티드(Prime Tech Ltd.))가 사용되어 M2 배지(밀리포어) 중에서 접합체들에 mRNA들과 sgRNA들이 주입되었다. Cas9 및 Cas9n mRNA들과 sgRNA들의 농도는 본원의 내용과 도 6b에 표시되어 있다. 미세주입 후 접합체는 37℃에서 가습 대기(5% CO₂ 및 95% 공기) 중 KSOM(밀리포어) 중에서 배양되었다.

배반 포 배로부터의 게놈 추출: 6 일 동안 배들이 시험관 내 배양된 다음, 증식된 배반 포들은 PBS 중 0.01% BSA로 세정되었으며, 0.2 ㎖들이 튜브들에 별도로 수집되었다. 여기에 게놈 추출 용액(50 mM 트리스-HCl, pH 8.0, 0.5 % 트리톤-X100, 1 ㎎/㎖ 프로티나아제 K) 5㎕가 첨가되었으며, 이후 시료들은 65℃에서 3시간 동안 항온처리된 다음, 95℃에서 10 분 동안 항온처리되었다. 그 다음 시료들은, 전술된 바와 같이, 표적화된 딥 시퀀싱을 위해 증폭되었다.

모든 서열들은 5'에서 3' 방향으로 배열되어 있는 것이다. 밑줄친 T들로 이루어진 문자열들은 U6 전사에 있어서 전사 종결 인자로서의 역할을 한다.

> + 85 tracr RNA(스트렙토코커스 피오제네스 SF370)를 포함하는 sgRNA

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc TTTTTTT

(가이드 서열은 굵은 글씨 대문자 "N"의 긴 영역이고, tracr RNA 단편은 밑줄친 T들로 이루어진 문자열 앞에 표시된 굵은 글씨의 서열임)

> 3xFLAG-NLS-SpCas9-NLS

CACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAGCGTCCTGCTGCTACTAAGAAAGCTGGTCAAGCTAAGAAAAAGAAA

> 3xFLAG-NLS-SpCas9n-NLS(D10A 닉카아제 돌연변이는 굵은 글씨로 강조하여 표시됨)

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGCCTGGTCAAGCTAAGAAAAAGAAA

T7-SpCas9-NLS(T7 프로모터는 밑줄쳐 표시됨)

GCCaccggtTAATACGACTCACTATATACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACC

T7-SpCas9n-NLS(D10A 닉카아제 돌연변이는 긁은 글씨로 강조하여 표시되었으며; T7 프로모터는 밑줄쳐 표시됨)

GCCaccggtTAATACGACTCACTATAgggccaccATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGCCCGGCCAGGCAAAAAAGAAAAAGTAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACC

> dsODN 결찰 삽입 부(정 방향)

AGCAGGCCAATGGGGAGGACATCGATGTCACCTCCAATGACTAcTACCCATACGATGTTCCAGATTACGCTATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGaagcttgaaATGGCATCAATGCAGAAGCTGATCTCAGAGGAGGACCTGtaa

> dsODN 결찰 삽입 부(역 방향)

TAGTCATTGGAGGTGACATCGATGTCCTCCCCATTGGCCTGCTTTACAGGTCCTCCTCTGAGATCAGCTTCTGCATTGATGCCATTTCAAGCTTCTTATCGTCATCGTCTTTGTAATCAATATCATGATCCTTGTAGTCTCCGTCGTGGTCCTTATAGTCCATAGCGTAATCTGGAACATCGTATGGGTAG

실시예 32: RNA에 의해 가이드되는 CRISPR Cas9에 의한 이중 닉 형성의 추가 특성규명

이중 닉 형성 특이성: Cas9 다중 진행 닉 형성에 대한 표적화 공간은, 표적 DNA가 다수의 가이드 RNA(sgRNA)들에 의해 표적화될 때 Cas9 PAM 인지의 엄중도를 완화함으로써 증가할 수 있다. 실시예 31(Ran et al., Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity, Cell. 2013 Sep 12;154(6):1380-9)에서 본 출원인들은, 적당한 상쇄 관계에 있는 sgRNA 2 개가 특이적 'sgRNA 상쇄' 매개 변수 안에서 표적화될 수 있으며, 그 결과 삽입-결실 부가 생성될 수 있음을 입증하였다. 출원인들은, 상쇄 sgRNA들이 비 NGG PAM들(특히 NGN 및 NNG)로 표적화될 때, 효율적인 삽입-결실 부가 생성될 수 있음도 입증하였다. Cas9는 두 번째 또는 세 번째 PAM 염기 위치들에 G 뉴클레오티드 하나만이 삽입된 PAM 또는 이동된 PAM을 잠재적으로 관용할 수 있는 것으로 보인다.

이중 닉 형성을 위한 Cas9 돌연변이유발법: 출원인들은, 오로지 하나의 sgRNA만에 의해 표적화될 때 Cas9 닉카아제 돌연변이체가 삽입-결실 부를 형성할 수 있는 능력을 테스트하였다. 단일 가닥 DNA 파괴 부들은 높은 신뢰도의 비 NHEJ 수선 경로들을 통해 수선된다. 그러나 다른 그룹들에 의한 연구는 Cas9(D10A) 닉카아제 및 하나의 sgRNA에 의한 유의적 돌연변이유발법을 제안할 수 있다(Mali et al., Science 2013). 출원인들은 에스.피로제네스 Cas9에 존재하는 추가 RuvC 촉매적 도메인들 총 3 개 중 2 개에 돌연변이들을 유발하여, Cas9 3KO[Cas9(D10A, E762A, 및 D986A)]를 만들었으며, 이를 AAVS1 유전자 좌(sgRNA 가이드 서열: ggggccactagggacaggat)에 대해 테스트하였다. 출원인들은 Cas9 3KO에 의한 삽입-결실 돌연변이 발생률이, D10A 닉카아제 돌연변이체에 의한 삽입-결실 돌연변이 발생률보다 낮았음을 파악하였다(데이터는 생물학적 테스트를 3회 실시한 결과의 평균값인, 이하 표를 참조한다)

마우스 배의 특이적 편집: 출원인들은 마우스 접합체 내 Cas9 투여량을 10 ng/uL로부터 0.01 ng/uL으로 적정하여, 이중 닉 형성에 의한 특이적 Cas9 편집에 최적인 투여량을 결정하였다. 출원인들은, 투여량이 10 ng/uL인 조건에서 야생형 Cas9으로는 88%가 편집되었으며, D10A 이중 닉 형성에 의해서는 83%가 편집되었음을 입증하였다. D10A + L sgRNA는 10 ng/uL일 때 삽입-결실률 0%를 보였던 반면에, 야생형 Cas9는 1 ng/uL, 0.1 ng/uL 및 0.01 ng/uL인 조건에서 삽입-결실을 보이지 않았다.

본 실시예에 있어서 게놈 변형을 위한 세포 배양, 트랜스펙션 프로토콜 및 서베이어 뉴클레아제 분석법들과 관련된 실험에 관한 세부 사항은 실시예 31에 추가로 기술되어 있다.

본 발명의 바람직한 구현예가 본원에 제시되고 기재되었으나, 상기 구체예는 단지 예로 제공된 것이 당업자에게 명백할 것이다. 본 발명을 벗어나지 않고 다수의 변동, 변화, 및 치환이 당업자에 의해 이제 발생될 것이다. 본원에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명의 실시에서 이용될 수 있음이 이해되어야 한다.

참고문헌들

SEQUENCE LISTING <110> THE BROAD INSTITUTE INC. MASSACHUSETTS INSTITUTE OF TECHNOLOGY PRESIDENT AND FELLOWS OF HARVARD COLLEGE <120> OPTIMIZED CRISPR-CAS DOUBLE NICKASE SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION <130> 44790.99.2022 <140> PCT/US2014/041803 <141> 2014-06-10 <150> PCT/US2013/074667 <151> 2013-12-12 <150> 61/915,383 <151> 2013-12-12 <150> 61/871,301 <151> 2013-08-28 <150> 61/862,355 <151> 2013-08-13 <150> 61/836,123 <151> 2013-06-17 <150> 61/847,537 <151> 2013-06-17 <160> 480 <170> PatentIn version 3.5 <210> 1 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 1 gcactgaggg cctatttccc atgattc 27 <210> 2 <211> 20 <212> DNA <213> Homo sapiens <400> 2 gagtccgagc agaagaagaa 20 <210> 3 <211> 20 <212> DNA <213> Homo sapiens <400> 3 gagtcctagc aggagaagaa 20 <210> 4 <211> 20 <212> DNA <213> Homo sapiens <400> 4 gagtctaagc agaagaagaa 20 <210> 5 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(44) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (47)..(60) <223> a, c, u, g, unknown or other <400> 5 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnnnn nnnnggnnnn nnnnnnnnnn 60 <210> 6 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(14) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (17)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 6 nnnnnnnnnn nnnnccnnnn nnnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 7 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(43) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (46)..(60) <223> a, c, u, g, unknown or other <400> 7 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnnnn nnnggnnnnn nnnnnnnnnn 60 <210> 8 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (18)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 8 nnnnnnnnnn nnnnnccnnn nnnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 9 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(42) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (45)..(60) <223> a, c, u, g, unknown or other <400> 9 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnnnn nnggnnnnnn nnnnnnnnnn 60 <210> 10 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (18)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 10 nnnnnnnnnn nnnnnccnnn nnnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 11 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(41) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (44)..(60) <223> a, c, u, g, unknown or other <400> 11 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnnnn nggnnnnnnn nnnnnnnnnn 60 <210> 12 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(17) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (20)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 12 nnnnnnnnnn nnnnnnnccn nnnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 13 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(40) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (43)..(60) <223> a, c, u, g, unknown or other <400> 13 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnnnn ggnnnnnnnn nnnnnnnnnn 60 <210> 14 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(18) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (21)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 14 nnnnnnnnnn nnnnnnnncc nnnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 15 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(39) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (42)..(60) <223> a, c, u, g, unknown or other <400> 15 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnnng gnnnnnnnnn nnnnnnnnnn 60 <210> 16 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(19) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (22)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 16 nnnnnnnnnn nnnnnnnnnc cnnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 17 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 17 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 18 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 18 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 19 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(37) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (40)..(60) <223> a, c, u, g, unknown or other <400> 19 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnnggn nnnnnnnnnn nnnnnnnnnn 60 <210> 20 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(21) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (24)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 20 nnnnnnnnnn nnnnnnnnnn nccnnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 21 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(36) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (39)..(60) <223> a, c, u, g, unknown or other <400> 21 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnnggnn nnnnnnnnnn nnnnnnnnnn 60 <210> 22 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(22) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (25)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 22 nnnnnnnnnn nnnnnnnnnn nnccnnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 23 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 23 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnnggnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 24 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(23) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (26)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 24 nnnnnnnnnn nnnnnnnnnn nnnccnnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 25 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(34) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (37)..(60) <223> a, c, u, g, unknown or other <400> 25 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnnggnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 26 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(24) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (27)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 26 nnnnnnnnnn nnnnnnnnnn nnnnccnnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 27 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(33) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (36)..(60) <223> a, c, u, g, unknown or other <400> 27 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnnggnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 28 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(25) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (28)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 28 nnnnnnnnnn nnnnnnnnnn nnnnnccnnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 29 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(32) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (35)..(60) <223> a, c, u, g, unknown or other <400> 29 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nnggnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 30 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(26) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (29)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 30 nnnnnnnnnn nnnnnnnnnn nnnnnnccnn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 31 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(31) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (34)..(60) <223> a, c, u, g, unknown or other <400> 31 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn nggnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 32 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(27) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (30)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 32 nnnnnnnnnn nnnnnnnnnn nnnnnnnccn nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 33 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(30) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (33)..(60) <223> a, c, u, g, unknown or other <400> 33 nnnnnnnnnn nnnnnnnnnn ccnnnnnnnn ggnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 34 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(28) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (31)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 34 nnnnnnnnnn nnnnnnnnnn nnnnnnnncc nnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 35 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(29) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (32)..(60) <223> a, c, u, g, unknown or other <400> 35 nnnnnnnnnn nnnnnnnnnn ccnnnnnnng gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 36 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(29) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (32)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 36 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cnnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 37 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(28) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (31)..(60) <223> a, c, u, g, unknown or other <400> 37 nnnnnnnnnn nnnnnnnnnn ccnnnnnngg nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 38 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(30) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (33)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 38 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ccnnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 39 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(27) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (30)..(60) <223> a, c, u, g, unknown or other <400> 39 nnnnnnnnnn nnnnnnnnnn ccnnnnnggn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 40 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(31) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (34)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 40 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nccnnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 41 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(26) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (29)..(60) <223> a, c, u, g, unknown or other <400> 41 nnnnnnnnnn nnnnnnnnnn ccnnnnggnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 42 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(32) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (35)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 42 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnccnnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 43 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(25) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (28)..(60) <223> a, c, u, g, unknown or other <400> 43 nnnnnnnnnn nnnnnnnnnn ccnnnggnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 44 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(33) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (36)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 44 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnccnnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 45 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(24) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (27)..(60) <223> a, c, u, g, unknown or other <400> 45 nnnnnnnnnn nnnnnnnnnn ccnnggnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 46 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(34) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (37)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 46 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnccnngg nnnnnnnnnn nnnnnnnnnn 60 <210> 47 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (23)..(23) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (26)..(60) <223> a, c, u, g, unknown or other <400> 47 nnnnnnnnnn nnnnnnnnnn ccnggnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 48 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(38) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (41)..(60) <223> a, c, u, g, unknown or other <400> 48 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnccngg nnnnnnnnnn nnnnnnnnnn 60 <210> 49 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(21) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (26)..(60) <223> a, c, u, g, unknown or other <400> 49 nnnnnnnnnn nnnnnnnnnn nccggnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 50 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (40)..(60) <223> a, c, u, g, unknown or other <400> 50 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnccggn nnnnnnnnnn nnnnnnnnnn 60 <210> 51 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(23) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (26)..(60) <223> a, c, u, g, unknown or other <400> 51 nnnnnnnnnn nnnnnnnnnn nnnggnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 52 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(33) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 52 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnggccnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 53 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(22) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (26)..(60) <223> a, c, u, g, unknown or other <400> 53 nnnnnnnnnn nnnnnnnnnn nncggnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 54 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(32) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (35)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 54 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnggnccnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 55 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(31) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (34)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 55 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nggnnccnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 56 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(30) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (33)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 56 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ggnnnccnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 57 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(29) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (32)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 57 nnnnnnnnnn nnnnnnnnnn nnnnnnnnng gnnnnccnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 58 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(28) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (31)..(35) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (38)..(60) <223> a, c, u, g, unknown or other <400> 58 nnnnnnnnnn nnnnnnnnnn nnnnnnnngg nnnnnccnnn nnnnnnnnnn nnnnnnnnnn 60 <210> 59 <211> 12 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 59 guuuuagagc ua 12 <210> 60 <211> 7 <212> PRT <213> Simian virus 40 <400> 60 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 61 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Nucleoplasmin bipartite NLS sequence" <400> 61 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 62 <211> 9 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: c-myc NLS sequence" <400> 62 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 63 <211> 11 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: c-myc NLS sequence" <400> 63 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 64 <211> 38 <212> PRT <213> Homo sapiens <400> 64 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 65 <211> 42 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: IBB domain from importin-alpha sequence" <400> 65 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 66 <211> 8 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: myoma T protein sequence" <400> 66 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 67 <211> 8 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: myoma T protein sequence" <400> 67 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 68 <211> 8 <212> PRT <213> Homo sapiens <400> 68 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 69 <211> 12 <212> PRT <213> Mus musculus <400> 69 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 70 <211> 5 <212> PRT <213> Influenza virus <400> 70 Asp Arg Leu Arg Arg 1 5 <210> 71 <211> 7 <212> PRT <213> Influenza virus <400> 71 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 72 <211> 10 <212> PRT <213> Hepatitis delta virus <400> 72 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 73 <211> 10 <212> PRT <213> Mus musculus <400> 73 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 74 <211> 20 <212> PRT <213> Homo sapiens <400> 74 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 75 <211> 17 <212> PRT <213> Homo sapiens <400> 75 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 76 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t or g <220> <221> modified_base <222> (21)..(22) <223> a, c, t, g, unknown or other <400> 76 nnnnnnnnnn nnnnnnnnnn nnagaaw 27 <210> 77 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(12) <223> a, c, t or g <220> <221> modified_base <222> (13)..(14) <223> a, c, t, g, unknown or other <400> 77 nnnnnnnnnn nnnnagaaw 19 <210> 78 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t or g <220> <221> modified_base <222> (21)..(22) <223> a, c, t, g, unknown or other <400> 78 nnnnnnnnnn nnnnnnnnnn nnagaaw 27 <210> 79 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(11) <223> a, c, t or g <220> <221> modified_base <222> (12)..(13) <223> a, c, t, g, unknown or other <400> 79 nnnnnnnnnn nnnagaaw 18 <210> 80 <211> 137 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 80 nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60 gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120 tcgttattta atttttt 137 <210> 81 <211> 123 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 81 nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60 gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120 ttt 123 <210> 82 <211> 110 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 82 nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60 gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110 <210> 83 <211> 102 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 83 nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102 <210> 84 <211> 88 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 84 nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt gttttttt 88 <210> 85 <211> 76 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 85 nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcatt tttttt 76 <210> 86 <211> 32 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 86 aaactctaga gagggcctat ttcccatgat tc 32 <210> 87 <211> 153 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 87 acctctagaa aaaaagcacc gactcggtgc cactttttca agttgataac ggactagcct 60 tattttaact tgctatgctg ttttgtttcc aaaacagcat agctctaaaa cccctagtca 120 ttggaggtga cggtgtttcg tcctttccac aag 153 <210> 88 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 88 taatacgact cactatagga agtgcgccac catggcccca aagaagaagc gg 52 <210> 89 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 89 ggtttttttt tttttttttt tttttttttt ttttcttact ttttcttttt tgcctggccg 60 <210> 90 <211> 984 <212> PRT <213> Campylobacter jejuni <400> 90 Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp 1 5 10 15 Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe 20 25 30 Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg 35 40 45 Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg 50 55 60 Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr 65 70 75 80 Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly 85 90 95 Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu 100 105 110 Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg 115 120 125 Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala 130 135 140 Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln 145 150 155 160 Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu 165 170 175 Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu 180 185 190 Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe 195 200 205 Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu 210 215 220 Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser 225 230 235 240 His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro 245 250 255 Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile 260 265 270 Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys 275 280 285 Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu 290 295 300 Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu 305 310 315 320 Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys 325 330 335 Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu 340 345 350 Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu 355 360 365 Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser 370 375 380 Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala 385 390 395 400 Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu 405 410 415 Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys 420 425 430 Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr 435 440 445 Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn 450 455 460 Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu 465 470 475 480 Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys 485 490 495 Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys 500 505 510 Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg 515 520 525 Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile 530 535 540 Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile 545 550 555 560 Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu 565 570 575 Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu 580 585 590 Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala 595 600 605 Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr 610 615 620 Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr 625 630 635 640 Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp 645 650 655 Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln 660 665 670 Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser 675 680 685 Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His 690 695 700 Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser 705 710 715 720 Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser 725 730 735 Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys 740 745 750 Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp 755 760 765 Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser 770 775 780 Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln 785 790 795 800 Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys 805 810 815 Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg 820 825 830 Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro 835 840 845 Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val 850 855 860 Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu 865 870 875 880 Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile 885 890 895 Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe 900 905 910 Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe 915 920 925 Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu 930 935 940 Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe 945 950 955 960 Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe 965 970 975 Arg Gln Arg Glu Asp Phe Lys Lys 980 <210> 91 <211> 91 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 91 tataatctca taagaaattt aaaaagggac taaaataaag agtttgcggg actctgcggg 60 gttacaatcc cctaaaaccg cttttaaaat t 91 <210> 92 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 92 attttaccat aaagaaattt aaaaagggac taaaac 36 <210> 93 <211> 95 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <400> 93 nnnnnnnnnn nnnnnnnnnn guuuuagucc cgaaagggac uaaaauaaag aguuugcggg 60 acucugcggg guuacaaucc ccuaaaaccg cuuuu 95 <210> 94 <211> 1115 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 94 Met Ser Asp Leu Val Leu Gly Leu Asp Ile Gly Ile Gly Ser Val Gly 1 5 10 15 Val Gly Ile Leu Asn Lys Val Thr Gly Glu Ile Ile His Lys Asn Ser 20 25 30 Arg Ile Phe Pro Ala Ala Gln Ala Glu Asn Asn Leu Val Arg Arg Thr 35 40 45 Asn Arg Gln Gly Arg Arg Leu Ala Arg Arg Lys Lys His Arg Arg Val 50 55 60 Arg Leu Asn Arg Leu Phe Glu Glu Ser Gly Leu Ile Thr Asp Phe Thr 65 70 75 80 Lys Ile Ser Ile Asn Leu Asn Pro Tyr Gln Leu Arg Val Lys Gly Leu 85 90 95 Thr Asp Glu Leu Ser Asn Glu Glu Leu Phe Ile Ala Leu Lys Asn Met 100 105 110 Val Lys His Arg Gly Ile Ser Tyr Leu Asp Asp Ala Ser Asp Asp Gly 115 120 125 Asn Ser Ser Val Gly Asp Tyr Ala Gln Ile Val Lys Glu Asn Ser Lys 130 135 140 Gln Leu Glu Thr Lys Thr Pro Gly Gln Ile Gln Leu Glu Arg Tyr Gln 145 150 155 160 Thr Tyr Gly Gln Leu Arg Gly Asp Phe Thr Val Glu Lys Asp Gly Lys 165 170 175 Lys His Arg Leu Ile Asn Val Phe Pro Thr Ser Ala Tyr Arg Ser Glu 180 185 190 Ala Leu Arg Ile Leu Gln Thr Gln Gln Glu Phe Asn Pro Gln Ile Thr 195 200 205 Asp Glu Phe Ile Asn Arg Tyr Leu Glu Ile Leu Thr Gly Lys Arg Lys 210 215 220 Tyr Tyr His Gly Pro Gly Asn Glu Lys Ser Arg Thr Asp Tyr Gly Arg 225 230 235 240 Tyr Arg Thr Ser Gly Glu Thr Leu Asp Asn Ile Phe Gly Ile Leu Ile 245 250 255 Gly Lys Cys Thr Phe Tyr Pro Asp Glu Phe Arg Ala Ala Lys Ala Ser 260 265 270 Tyr Thr Ala Gln Glu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Thr 275 280 285 Val Pro Thr Glu Thr Lys Lys Leu Ser Lys Glu Gln Lys Asn Gln Ile 290 295 300 Ile Asn Tyr Val Lys Asn Glu Lys Ala Met Gly Pro Ala Lys Leu Phe 305 310 315 320 Lys Tyr Ile Ala Lys Leu Leu Ser Cys Asp Val Ala Asp Ile Lys Gly 325 330 335 Tyr Arg Ile Asp Lys Ser Gly Lys Ala Glu Ile His Thr Phe Glu Ala 340 345 350 Tyr Arg Lys Met Lys Thr Leu Glu Thr Leu Asp Ile Glu Gln Met Asp 355 360 365 Arg Glu Thr Leu Asp Lys Leu Ala Tyr Val Leu Thr Leu Asn Thr Glu 370 375 380 Arg Glu Gly Ile Gln Glu Ala Leu Glu His Glu Phe Ala Asp Gly Ser 385 390 395 400 Phe Ser Gln Lys Gln Val Asp Glu Leu Val Gln Phe Arg Lys Ala Asn 405 410 415 Ser Ser Ile Phe Gly Lys Gly Trp His Asn Phe Ser Val Lys Leu Met 420 425 430 Met Glu Leu Ile Pro Glu Leu Tyr Glu Thr Ser Glu Glu Gln Met Thr 435 440 445 Ile Leu Thr Arg Leu Gly Lys Gln Lys Thr Thr Ser Ser Ser Asn Lys 450 455 460 Thr Lys Tyr Ile Asp Glu Lys Leu Leu Thr Glu Glu Ile Tyr Asn Pro 465 470 475 480 Val Val Ala Lys Ser Val Arg Gln Ala Ile Lys Ile Val Asn Ala Ala 485 490 495 Ile Lys Glu Tyr Gly Asp Phe Asp Asn Ile Val Ile Glu Met Ala Arg 500 505 510 Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met 515 520 525 Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys 530 535 540 Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu 545 550 555 560 Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp 565 570 575 Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 580 585 590 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp 595 600 605 Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys 610 615 620 Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr 625 630 635 640 Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser 645 650 655 Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg 660 665 670 Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr 675 680 685 Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 690 695 700 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr 705 710 715 720 Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu 725 730 735 Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 740 745 750 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 755 760 765 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 770 775 780 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 785 790 795 800 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 805 810 815 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 820 825 830 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln 835 840 845 Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp 850 855 860 Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly 865 870 875 880 Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val 885 890 895 Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly 900 905 910 Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe 915 920 925 Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 930 935 940 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met 945 950 955 960 Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro 965 970 975 Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 980 985 990 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 995 1000 1005 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1010 1015 1020 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1025 1030 1035 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1040 1045 1050 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1055 1060 1065 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1070 1075 1080 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1085 1090 1095 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1100 1105 1110 Gly Asp 1115 <210> 95 <211> 1374 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 95 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Thr Asn 755 760 765 Glu Asp Asp Glu Lys Lys Ala Ile Gln Lys Ile Gln Lys Ala Asn Lys 770 775 780 Asp Glu Lys Asp Ala Ala Met Leu Lys Ala Ala Asn Gln Tyr Asn Gly 785 790 795 800 Lys Ala Glu Leu Pro His Ser Val Phe His Gly His Lys Gln Leu Ala 805 810 815 Thr Lys Ile Arg Leu Trp His Gln Gln Gly Glu Arg Cys Leu Tyr Thr 820 825 830 Gly Lys Thr Ile Ser Ile His Asp Leu Ile Asn Asn Ser Asn Gln Phe 835 840 845 Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp Asp Ser Leu 850 855 860 Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn Gln Glu Lys Gly Gln 865 870 875 880 Arg Thr Pro Tyr Gln Ala Leu Asp Ser Met Asp Asp Ala Trp Ser Phe 885 890 895 Arg Glu Leu Lys Ala Phe Val Arg Glu Ser Lys Thr Leu Ser Asn Lys 900 905 910 Lys Lys Glu Tyr Leu Leu Thr Glu Glu Asp Ile Ser Lys Phe Asp Val 915 920 925 Arg Lys Lys Phe Ile Glu Arg Asn Leu Val Asp Thr Arg Tyr Ala Ser 930 935 940 Arg Val Val Leu Asn Ala Leu Gln Glu His Phe Arg Ala His Lys Ile 945 950 955 960 Asp Thr Lys Val Ser Val Val Arg Gly Gln Phe Thr Ser Gln Leu Arg 965 970 975 Arg His Trp Gly Ile Glu Lys Thr Arg Asp Thr Tyr His His His Ala 980 985 990 Val Asp Ala Leu Ile Ile Ala Ala Ser Ser Gln Leu Asn Leu Trp Lys 995 1000 1005 Lys Gln Lys Asn Thr Leu Val Ser Tyr Ser Glu Asp Gln Leu Leu 1010 1015 1020 Asp Ile Glu Thr Gly Glu Leu Ile Ser Asp Asp Glu Tyr Lys Glu 1025 1030 1035 Ser Val Phe Lys Ala Pro Tyr Gln His Phe Val Asp Thr Leu Lys 1040 1045 1050 Ser Lys Glu Phe Glu Asp Ser Ile Leu Phe Ser Tyr Gln Val Asp 1055 1060 1065 Ser Lys Phe Asn Arg Lys Ile Ser Asp Ala Thr Ile Tyr Ala Thr 1070 1075 1080 Arg Gln Ala Lys Val Gly Lys Asp Lys Ala Asp Glu Thr Tyr Val 1085 1090 1095 Leu Gly Lys Ile Lys Asp Ile Tyr Thr Gln Asp Gly Tyr Asp Ala 1100 1105 1110 Phe Met Lys Ile Tyr Lys Lys Asp Lys Ser Lys Phe Leu Met Tyr 1115 1120 1125 Arg His Asp Pro Gln Thr Phe Glu Lys Val Ile Glu Pro Ile Leu 1130 1135 1140 Glu Asn Tyr Pro Asn Lys Gln Ile Asn Glu Lys Gly Lys Glu Val 1145 1150 1155 Pro Cys Asn Pro Phe Leu Lys Tyr Lys Glu Glu His Gly Tyr Ile 1160 1165 1170 Arg Lys Tyr Ser Lys Lys Gly Asn Gly Pro Glu Ile Lys Ser Leu 1175 1180 1185 Lys Tyr Tyr Asp Ser Lys Leu Gly Asn His Ile Asp Ile Thr Pro 1190 1195 1200 Lys Asp Ser Asn Asn Lys Val Val Leu Gln Ser Val Ser Pro Trp 1205 1210 1215 Arg Ala Asp Val Tyr Phe Asn Lys Thr Thr Gly Lys Tyr Glu Ile 1220 1225 1230 Leu Gly Leu Lys Tyr Ala Asp Leu Gln Phe Glu Lys Gly Thr Gly 1235 1240 1245 Thr Tyr Lys Ile Ser Gln Glu Lys Tyr Asn Asp Ile Lys Lys Lys 1250 1255 1260 Glu Gly Val Asp Ser Asp Ser Glu Phe Lys Phe Thr Leu Tyr Lys 1265 1270 1275 Asn Asp Leu Leu Leu Val Lys Asp Thr Glu Thr Lys Glu Gln Gln 1280 1285 1290 Leu Phe Arg Phe Leu Ser Arg Thr Met Pro Lys Gln Lys His Tyr 1295 1300 1305 Val Glu Leu Lys Pro Tyr Asp Lys Gln Lys Phe Glu Gly Gly Glu 1310 1315 1320 Ala Leu Ile Lys Val Leu Gly Asn Val Ala Asn Ser Gly Gln Cys 1325 1330 1335 Lys Lys Gly Leu Gly Lys Ser Asn Ile Ser Ile Tyr Lys Val Arg 1340 1345 1350 Thr Asp Val Leu Gly Asn Gln His Ile Ile Lys Asn Glu Gly Asp 1355 1360 1365 Lys Pro Lys Leu Asp Phe 1370 <210> 96 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 6xHis tag" <400> 96 His His His His His His 1 5 <210> 97 <211> 15 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 97 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 98 <211> 15 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 98 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys 1 5 10 15 <210> 99 <211> 18 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 99 Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 10 15 Gly Ser <210> 100 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 100 gccaaattgg acgaccctcg cgg 23 <210> 101 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 101 cgaggagacc cccgtttcgg tgg 23 <210> 102 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 102 cccgccgccg ccgtggctcg agg 23 <210> 103 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 103 tgagctctac gagatccaca agg 23 <210> 104 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 104 ctcaaaattc ataccggttg tgg 23 <210> 105 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 105 cgttaaacaa caaccggact tgg 23 <210> 106 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 106 ttcaccccgc ggcgctgaat ggg 23 <210> 107 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 107 accactacca gtccgtccac agg 23 <210> 108 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 108 agcctttctg aacacatgca cgg 23 <210> 109 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 109 cctgccatca atgtggccat gcatgtgttc agaaaggct 39 <210> 110 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 110 cctgccatca atgtggccgt gcatgtgttc agaaaggct 39 <210> 111 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 111 cactgcttaa gcctcgctcg agg 23 <210> 112 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 112 tcaccagcaa tattcgctcg agg 23 <210> 113 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 113 caccagcaat attccgctcg agg 23 <210> 114 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 114 tagcaacaga catacgctcg agg 23 <210> 115 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 115 gggcagtagt aatacgctcg agg 23 <210> 116 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 116 ccaattccca tacattattg tac 23 <210> 117 <211> 4677 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 117 tctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg 60 gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg gctgcatggg 120 cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg attgcaaaga 180 cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac ttctacacag 240 gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt cgtttcagtc 300 acaacccgca aacatgtacc catacgatgt tccagattac gcttcgccga agaaaaagcg 360 caaggtcgaa gcgtccgaca agaagtacag catcggcctg gacatcggca ccaactctgt 420 gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc aagaaattca aggtgctggg 480 caacaccgac cggcacagca tcaagaagaa cctgatcgga gccctgctgt tcgacagcgg 540 cgaaacagcc gaggccaccc ggctgaagag aaccgccaga agaagataca ccagacggaa 600 gaaccggatc tgctatctgc aagagatctt cagcaacgag atggccaagg tggacgacag 660 cttcttccac agactggaag agtccttcct ggtggaagag gataagaagc acgagcggca 720 ccccatcttc ggcaacatcg tggacgaggt ggcctaccac gagaagtacc ccaccatcta 780 ccacctgaga aagaaactgg tggacagcac cgacaaggcc gacctgcggc tgatctatct 840 ggccctggcc cacatgatca agttccgggg ccacttcctg atcgagggcg acctgaaccc 900 cgacaacagc gacgtggaca agctgttcat ccagctggtg cagacctaca accagctgtt 960 cgaggaaaac cccatcaacg ccagcggcgt ggacgccaag gccatcctgt ctgccagact 1020 gagcaagagc agacggctgg aaaatctgat cgcccagctg cccggcgaga agaagaatgg 1080 cctgttcggc aacctgattg ccctgagcct gggcctgacc cccaacttca agagcaactt 1140 cgacctggcc gaggatgcca aactgcagct gagcaaggac acctacgacg acgacctgga 1200 caacctgctg gcccagatcg gcgaccagta cgccgacctg tttctggccg ccaagaacct 1260 gtccgacgcc atcctgctga gcgacatcct gagagtgaac accgagatca ccaaggcccc 1320 cctgagcgcc tctatgatca agagatacga cgagcaccac caggacctga ccctgctgaa 1380 agctctcgtg cggcagcagc tgcctgagaa gtacaaagag attttcttcg accagagcaa 1440 gaacggctac gccggctaca ttgacggcgg agccagccag gaagagttct acaagttcat 1500 caagcccatc ctggaaaaga tggacggcac cgaggaactg ctcgtgaagc tgaacagaga 1560 ggacctgctg cggaagcagc ggaccttcga caacggcagc atcccccacc agatccacct 1620 gggagagctg cacgccattc tgcggcggca ggaagatttt tacccattcc tgaaggacaa 1680 ccgggaaaag atcgagaaga tcctgacctt ccgcatcccc tactacgtgg gccctctggc 1740 caggggaaac agcagattcg cctggatgac cagaaagagc gaggaaacca tcaccccctg 1800 gaacttcgag gaagtggtgg acaagggcgc ttccgcccag agcttcatcg agcggatgac 1860 caacttcgat aagaacctgc ccaacgagaa ggtgctgccc aagcacagcc tgctgtacga 1920 gtacttcacc gtgtataacg agctgaccaa agtgaaatac gtgaccgagg gaatgagaaa 1980 gcccgccttc ctgagcggcg agcagaaaaa ggccatcgtg gacctgctgt tcaagaccaa 2040 ccggaaagtg accgtgaagc agctgaaaga ggactacttc aagaaaatcg agtgcttcga 2100 ctccgtggaa atctccggcg tggaagatcg gttcaacgcc tccctgggca cataccacga 2160 tctgctgaaa attatcaagg acaaggactt cctggacaat gaggaaaacg aggacattct 2220 ggaagatatc gtgctgaccc tgacactgtt tgaggacaga gagatgatcg aggaacggct 2280 gaaaacctat gcccacctgt tcgacgacaa agtgatgaag cagctgaagc ggcggagata 2340 caccggctgg ggcaggctga gccggaagct gatcaacggc atccgggaca agcagtccgg 2400 caagacaatc ctggatttcc tgaagtccga cggcttcgcc aacagaaact tcatgcagct 2460 gatccacgac gacagcctga cctttaaaga ggacatccag aaagcccagg tgtccggcca 2520 gggcgatagc ctgcacgagc acattgccaa tctggccggc agccccgcca ttaagaaggg 2580 catcctgcag acagtgaagg tggtggacga gctcgtgaaa gtgatgggcc ggcacaagcc 2640 cgagaacatc gtgatcgaaa tggccagaga gaaccagacc acccagaagg gacagaagaa 2700 cagccgcgag agaatgaagc ggatcgaaga gggcatcaaa gagctgggca gccagatcct 2760 gaaagaacac cccgtggaaa acacccagct gcagaacgag aagctgtacc tgtactacct 2820 gcagaatggg cgggatatgt acgtggacca ggaactggac atcaaccggc tgtccgacta 2880 cgatgtggac catatcgtgc ctcagagctt tctgaaggac gactccatcg acaacaaggt 2940 gctgaccaga agcgacaaga accggggcaa gagcgacaac gtgccctccg aagaggtcgt 3000 gaagaagatg aagaactact ggcggcagct gctgaacgcc aagctgatta cccagagaaa 3060 gttcgacaat ctgaccaagg ccgagagagg cggcctgagc gaactggata aggccggctt 3120 catcaagaga cagctggtgg aaacccggca gatcacaaag cacgtggcac agatcctgga 3180 ctcccggatg aacactaagt acgacgagaa tgacaagctg atccgggaag tgaaagtgat 3240 caccctgaag tccaagctgg tgtccgattt ccggaaggat ttccagtttt acaaagtgcg 3300 cgagatcaac aactaccacc acgcccacga cgcctacctg aacgccgtcg tgggaaccgc 3360 cctgatcaaa aagtacccta agctggaaag cgagttcgtg tacggcgact acaaggtgta 3420 cgacgtgcgg aagatgatcg ccaagagcga gcaggaaatc ggcaaggcta ccgccaagta 3480 cttcttctac agcaacatca tgaacttttt caagaccgag attaccctgg ccaacggcga 3540 gatccggaag cggcctctga tcgagacaaa cggcgaaacc ggggagatcg tgtgggataa 3600 gggccgggat tttgccaccg tgcggaaagt gctgagcatg ccccaagtga atatcgtgaa 3660 aaagaccgag gtgcagacag gcggcttcag caaagagtct atcctgccca agaggaacag 3720 cgataagctg atcgccagaa agaaggactg ggaccctaag aagtacggcg gcttcgacag 3780 ccccaccgtg gcctattctg tgctggtggt ggccaaagtg gaaaagggca agtccaagaa 3840 actgaagagt gtgaaagagc tgctggggat caccatcatg gaaagaagca gcttcgagaa 3900 gaatcccatc gactttctgg aagccaaggg ctacaaagaa gtgaaaaagg acctgatcat 3960 caagctgcct aagtactccc tgttcgagct ggaaaacggc cggaagagaa tgctggcctc 4020 tgccggcgaa ctgcagaagg gaaacgaact ggccctgccc tccaaatatg tgaacttcct 4080 gtacctggcc agccactatg agaagctgaa gggctccccc gaggataatg agcagaaaca 4140 gctgtttgtg gaacagcaca agcactacct ggacgagatc atcgagcaga tcagcgagtt 4200 ctccaagaga gtgatcctgg ccgacgctaa tctggacaaa gtgctgtccg cctacaacaa 4260 gcaccgggat aagcccatca gagagcaggc cgagaatatc atccacctgt ttaccctgac 4320 caatctggga gcccctgccg ccttcaagta ctttgacacc accatcgacc ggaagaggta 4380 caccagcacc aaagaggtgc tggacgccac cctgatccac cagagcatca ccggcctgta 4440 cgagacacgg atcgacctgt ctcagctggg aggcgacagc cccaagaaga agagaaaggt 4500 ggaggccagc taaggatccg gcaagactgg ccccgcttgg caacgcaaca gtgagcccct 4560 ccctagtgtg tttggggatg tgactatgta ttcgtgtgtt ggccaacggg tcaacccgaa 4620 cagattgata cccgccttgg catttcctgt cagaatgtaa cgtcagttga tggtact 4677 <210> 118 <211> 3150 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 118 tctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg 60 gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg gctgcatggg 120 cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg attgcaaaga 180 cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac ttctacacag 240 gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt cgtttcagtc 300 acaacccgca aacatgccta agaagaagag gaaggttaac acgattaaca tcgctaagaa 360 cgacttctct gacatcgaac tggctgctat cccgttcaac actctggctg accattacgg 420 tgagcgttta gctcgcgaac agttggccct tgagcatgag tcttacgaga tgggtgaagc 480 acgcttccgc aagatgtttg agcgtcaact taaagctggt gaggttgcgg ataacgctgc 540 cgccaagcct ctcatcacta ccctactccc taagatgatt gcacgcatca acgactggtt 600 tgaggaagtg aaagctaagc gcggcaagcg cccgacagcc ttccagttcc tgcaagaaat 660 caagccggaa gccgtagcgt acatcaccat taagaccact ctggcttgcc taaccagtgc 720 tgacaataca accgttcagg ctgtagcaag cgcaatcggt cgggccattg aggacgaggc 780 tcgcttcggt cgtatccgtg accttgaagc taagcacttc aagaaaaacg ttgaggaaca 840 actcaacaag cgcgtagggc acgtctacaa gaaagcattt atgcaagttg tcgaggctga 900 catgctctct aagggtctac tcggtggcga ggcgtggtct tcgtggcata aggaagactc 960 tattcatgta ggagtacgct gcatcgagat gctcattgag tcaaccggaa tggttagctt 1020 acaccgccaa aatgctggcg tagtaggtca agactctgag actatcgaac tcgcacctga 1080 atacgctgag gctatcgcaa cccgtgcagg tgcgctggct ggcatctctc cgatgttcca 1140 accttgcgta gttcctccta agccgtggac tggcattact ggtggtggct attgggctaa 1200 cggtcgtcgt cctctggcgc tggtgcgtac tcacagtaag aaagcactga tgcgctacga 1260 agacgtttac atgcctgagg tgtacaaagc gattaacatt gcgcaaaaca ccgcatggaa 1320 aatcaacaag aaagtcctag cggtcgccaa cgtaatcacc aagtggaagc attgtccggt 1380 cgaggacatc cctgcgattg agcgtgaaga actcccgatg aaaccggaag acatcgacat 1440 gaatcctgag gctctcaccg cgtggaaacg tgctgccgct gctgtgtacc gcaaggacaa 1500 ggctcgcaag tctcgccgta tcagccttga gttcatgctt gagcaagcca ataagtttgc 1560 taaccataag gccatctggt tcccttacaa catggactgg cgcggtcgtg tttacgctgt 1620 gtcaatgttc aacccgcaag gtaacgatat gaccaaagga ctgcttacgc tggcgaaagg 1680 taaaccaatc ggtaaggaag gttactactg gctgaaaatc cacggtgcaa actgtgcggg 1740 tgtcgacaag gttccgttcc ctgagcgcat caagttcatt gaggaaaacc acgagaacat 1800 catggcttgc gctaagtctc cactggagaa cacttggtgg gctgagcaag attctccgtt 1860 ctgcttcctt gcgttctgct ttgagtacgc tggggtacag caccacggcc tgagctataa 1920 ctgctccctt ccgctggcgt ttgacgggtc ttgctctggc atccagcact tctccgcgat 1980 gctccgagat gaggtaggtg gtcgcgcggt taacttgctt cctagtgaaa ccgttcagga 2040 catctacggg attgttgcta agaaagtcaa cgagattcta caagcagacg caatcaatgg 2100 gaccgataac gaagtagtta ccgtgaccga tgagaacact ggtgaaatct ctgagaaagt 2160 caagctgggc actaaggcac tggctggtca atggctggct tacggtgtta ctcgcagtgt 2220 gactaagcgt tcagtcatga cgctggctta cgggtccaaa gagttcggct tccgtcaaca 2280 agtgctggaa gataccattc agccagctat tgattccggc aagggtctga tgttcactca 2340 gccgaatcag gctgctggat acatggctaa gctgatttgg gaatctgtga gcgtgacggt 2400 ggtagctgcg gttgaagcaa tgaactggct taagtctgct gctaagctgc tggctgctga 2460 ggtcaaagat aagaagactg gagagattct tcgcaagcgt tgcgctgtgc attgggtaac 2520 tcctgatggt ttccctgtgt ggcaggaata caagaagcct attcagacgc gcttgaacct 2580 gatgttcctc ggtcagttcc gcttacagcc taccattaac accaacaaag atagcgagat 2640 tgatgcacac aaacaggagt ctggtatcgc tcctaacttt gtacacagcc aagacggtag 2700 ccaccttcgt aagactgtag tgtgggcaca cgagaagtac ggaatcgaat cttttgcact 2760 gattcacgac tccttcggta cgattccggc tgacgctgcg aacctgttca aagcagtgcg 2820 cgaaactatg gttgacacat atgagtcttg tgatgtactg gctgatttct acgaccagtt 2880 cgctgaccag ttgcacgagt ctcaattgga caaaatgcca gcacttccgg ctaaaggtaa 2940 cttgaacctc cgtgacatct tagagtcgga cttcgcgttc gcgtaaggat ccggcaagac 3000 tggccccgct tggcaacgca acagtgagcc cctccctagt gtgtttgggg atgtgactat 3060 gtattcgtgt gttggccaac gggtcaaccc gaacagattg atacccgcct tggcatttcc 3120 tgtcagaatg taacgtcagt tgatggtact 3150 <210> 119 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (23)..(42) <223> a, c, t, g, unknown or other <400> 119 gaaattaata cgactcacta tannnnnnnn nnnnnnnnnn nngttttaga gctagaaata 60 gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 120 ttttt 125 <210> 120 <211> 8452 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 120 tgcggtattt cacaccgcat caggtggcac ttttcgggga aatgtgcgcg gaacccctat 60 ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagattat caaaaaggat 120 cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 180 gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 240 tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 300 gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 360 agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 420 tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 480 agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 540 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 600 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 660 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 720 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 780 tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 840 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 900 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 960 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 1020 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 1080 ttgaagcatt tatcagggtt attgtctcat gaccaaaatc ccttaacgtg agttttcgtt 1140 ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct 1200 gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 1260 ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 1320 aaatactgtt cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 1380 gcctacatac ctcgctctgc taatcctgtt accagtggct gttgccagtg gcgataagtc 1440 gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 1500 aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 1560 cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 1620 tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 1680 ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 1740 atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 1800 cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt 1860 ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga 1920 gcgcagcgag tcagtgagcg aggaagcggt cgctgaggct tgacatgatt ggtgcgtatg 1980 tttgtatgaa gctacaggac tgatttggcg ggctatgagg gcgggggaag ctctggaagg 2040 gccgcgatgg ggcgcgcggc gtccagaagg cgccatacgg cccgctggcg gcacccatcc 2100 ggtataaaag cccgcgaccc cgaacggtga cctccacttt cagcgacaaa cgagcactta 2160 tacatacgcg actattctgc cgctatacat aaccactcag ctagcttaag atcccatcaa 2220 gcttgcatgc cgggcgcgcc agaaggagcg cagccaaacc aggatgatgt ttgatggggt 2280 atttgagcac ttgcaaccct tatccggaag ccccctggcc cacaaaggct aggcgccaat 2340 gcaagcagtt cgcatgcagc ccctggagcg gtgccctcct gataaaccgg ccagggggcc 2400 tatgttcttt acttttttac aagagaagtc actcaacatc ttaaaatggc caggtgagtc 2460 gacgagcaag cccggcggat caggcagcgt gcttgcagat ttgacttgca acgcccgcat 2520 tgtgtcgacg aaggcttttg gctcctctgt cgctgtctca agcagcatct aaccctgcgt 2580 cgccgtttcc atttgcagga gattcgaggt accatgtacc catacgatgt tccagattac 2640 gcttcgccga agaaaaagcg caaggtcgaa gcgtccgaca agaagtacag catcggcctg 2700 gacatcggca ccaactctgt gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc 2760 aagaaattca aggtgctggg caacaccgac cggcacagca tcaagaagaa cctgatcgga 2820 gccctgctgt tcgacagcgg cgaaacagcc gaggccaccc ggctgaagag aaccgccaga 2880 agaagataca ccagacggaa gaaccggatc tgctatctgc aagagatctt cagcaacgag 2940 atggccaagg tggacgacag cttcttccac agactggaag agtccttcct ggtggaagag 3000 gataagaagc acgagcggca ccccatcttc ggcaacatcg tggacgaggt ggcctaccac 3060 gagaagtacc ccaccatcta ccacctgaga aagaaactgg tggacagcac cgacaaggcc 3120 gacctgcggc tgatctatct ggccctggcc cacatgatca agttccgggg ccacttcctg 3180 atcgagggcg acctgaaccc cgacaacagc gacgtggaca agctgttcat ccagctggtg 3240 cagacctaca accagctgtt cgaggaaaac cccatcaacg ccagcggcgt ggacgccaag 3300 gccatcctgt ctgccagact gagcaagagc agacggctgg aaaatctgat cgcccagctg 3360 cccggcgaga agaagaatgg cctgttcggc aacctgattg ccctgagcct gggcctgacc 3420 cccaacttca agagcaactt cgacctggcc gaggatgcca aactgcagct gagcaaggac 3480 acctacgacg acgacctgga caacctgctg gcccagatcg gcgaccagta cgccgacctg 3540 tttctggccg ccaagaacct gtccgacgcc atcctgctga gcgacatcct gagagtgaac 3600 accgagatca ccaaggcccc cctgagcgcc tctatgatca agagatacga cgagcaccac 3660 caggacctga ccctgctgaa agctctcgtg cggcagcagc tgcctgagaa gtacaaagag 3720 attttcttcg accagagcaa gaacggctac gccggctaca ttgacggcgg agccagccag 3780 gaagagttct acaagttcat caagcccatc ctggaaaaga tggacggcac cgaggaactg 3840 ctcgtgaagc tgaacagaga ggacctgctg cggaagcagc ggaccttcga caacggcagc 3900 atcccccacc agatccacct gggagagctg cacgccattc tgcggcggca ggaagatttt 3960 tacccattcc tgaaggacaa ccgggaaaag atcgagaaga tcctgacctt ccgcatcccc 4020 tactacgtgg gccctctggc caggggaaac agcagattcg cctggatgac cagaaagagc 4080 gaggaaacca tcaccccctg gaacttcgag gaagtggtgg acaagggcgc ttccgcccag 4140 agcttcatcg agcggatgac caacttcgat aagaacctgc ccaacgagaa ggtgctgccc 4200 aagcacagcc tgctgtacga gtacttcacc gtgtataacg agctgaccaa agtgaaatac 4260 gtgaccgagg gaatgagaaa gcccgccttc ctgagcggcg agcagaaaaa ggccatcgtg 4320 gacctgctgt tcaagaccaa ccggaaagtg accgtgaagc agctgaaaga ggactacttc 4380 aagaaaatcg agtgcttcga ctccgtggaa atctccggcg tggaagatcg gttcaacgcc 4440 tccctgggca cataccacga tctgctgaaa attatcaagg acaaggactt cctggacaat 4500 gaggaaaacg aggacattct ggaagatatc gtgctgaccc tgacactgtt tgaggacaga 4560 gagatgatcg aggaacggct gaaaacctat gcccacctgt tcgacgacaa agtgatgaag 4620 cagctgaagc ggcggagata caccggctgg ggcaggctga gccggaagct gatcaacggc 4680 atccgggaca agcagtccgg caagacaatc ctggatttcc tgaagtccga cggcttcgcc 4740 aacagaaact tcatgcagct gatccacgac gacagcctga cctttaaaga ggacatccag 4800 aaagcccagg tgtccggcca gggcgatagc ctgcacgagc acattgccaa tctggccggc 4860 agccccgcca ttaagaaggg catcctgcag acagtgaagg tggtggacga gctcgtgaaa 4920 gtgatgggcc ggcacaagcc cgagaacatc gtgatcgaaa tggccagaga gaaccagacc 4980 acccagaagg gacagaagaa cagccgcgag agaatgaagc ggatcgaaga gggcatcaaa 5040 gagctgggca gccagatcct gaaagaacac cccgtggaaa acacccagct gcagaacgag 5100 aagctgtacc tgtactacct gcagaatggg cgggatatgt acgtggacca ggaactggac 5160 atcaaccggc tgtccgacta cgatgtggac catatcgtgc ctcagagctt tctgaaggac 5220 gactccatcg acaacaaggt gctgaccaga agcgacaaga accggggcaa gagcgacaac 5280 gtgccctccg aagaggtcgt gaagaagatg aagaactact ggcggcagct gctgaacgcc 5340 aagctgatta cccagagaaa gttcgacaat ctgaccaagg ccgagagagg cggcctgagc 5400 gaactggata aggccggctt catcaagaga cagctggtgg aaacccggca gatcacaaag 5460 cacgtggcac agatcctgga ctcccggatg aacactaagt acgacgagaa tgacaagctg 5520 atccgggaag tgaaagtgat caccctgaag tccaagctgg tgtccgattt ccggaaggat 5580 ttccagtttt acaaagtgcg cgagatcaac aactaccacc acgcccacga cgcctacctg 5640 aacgccgtcg tgggaaccgc cctgatcaaa aagtacccta agctggaaag cgagttcgtg 5700 tacggcgact acaaggtgta cgacgtgcgg aagatgatcg ccaagagcga gcaggaaatc 5760 ggcaaggcta ccgccaagta cttcttctac agcaacatca tgaacttttt caagaccgag 5820 attaccctgg ccaacggcga gatccggaag cggcctctga tcgagacaaa cggcgaaacc 5880 ggggagatcg tgtgggataa gggccgggat tttgccaccg tgcggaaagt gctgagcatg 5940 ccccaagtga atatcgtgaa aaagaccgag gtgcagacag gcggcttcag caaagagtct 6000 atcctgccca agaggaacag cgataagctg atcgccagaa agaaggactg ggaccctaag 6060 aagtacggcg gcttcgacag ccccaccgtg gcctattctg tgctggtggt ggccaaagtg 6120 gaaaagggca agtccaagaa actgaagagt gtgaaagagc tgctggggat caccatcatg 6180 gaaagaagca gcttcgagaa gaatcccatc gactttctgg aagccaaggg ctacaaagaa 6240 gtgaaaaagg acctgatcat caagctgcct aagtactccc tgttcgagct ggaaaacggc 6300 cggaagagaa tgctggcctc tgccggcgaa ctgcagaagg gaaacgaact ggccctgccc 6360 tccaaatatg tgaacttcct gtacctggcc agccactatg agaagctgaa gggctccccc 6420 gaggataatg agcagaaaca gctgtttgtg gaacagcaca agcactacct ggacgagatc 6480 atcgagcaga tcagcgagtt ctccaagaga gtgatcctgg ccgacgctaa tctggacaaa 6540 gtgctgtccg cctacaacaa gcaccgggat aagcccatca gagagcaggc cgagaatatc 6600 atccacctgt ttaccctgac caatctggga gcccctgccg ccttcaagta ctttgacacc 6660 accatcgacc ggaagaggta caccagcacc aaagaggtgc tggacgccac cctgatccac 6720 cagagcatca ccggcctgta cgagacacgg atcgacctgt ctcagctggg aggcgacagc 6780 cccaagaaga agagaaaggt ggaggccagc taacatatga ttcgaatgtc tttcttgcgc 6840 tatgacactt ccagcaaaag gtagggcggg ctgcgagacg gcttcccggc gctgcatgca 6900 acaccgatga tgcttcgacc ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc 6960 gctccagggc gagcgctgtt taaatagcca ggcccccgat tgcaaagaca ttatagcgag 7020 ctaccaaagc catattcaaa cacctagatc actaccactt ctacacaggc cactcgagct 7080 tgtgatcgca ctccgctaag ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa 7140 catgacacaa gaatccctgt tacttctcga ccgtattgat tcggatgatt cctacgcgag 7200 cctgcggaac gaccaggaat tctgggaggt gagtcgacga gcaagcccgg cggatcaggc 7260 agcgtgcttg cagatttgac ttgcaacgcc cgcattgtgt cgacgaaggc ttttggctcc 7320 tctgtcgctg tctcaagcag catctaaccc tgcgtcgccg tttccatttg cagccgctgg 7380 cccgccgagc cctggaggag ctcgggctgc cggtgccgcc ggtgctgcgg gtgcccggcg 7440 agagcaccaa ccccgtactg gtcggcgagc ccggcccggt gatcaagctg ttcggcgagc 7500 actggtgcgg tccggagagc ctcgcgtcgg agtcggaggc gtacgcggtc ctggcggacg 7560 ccccggtgcc ggtgccccgc ctcctcggcc gcggcgagct gcggcccggc accggagcct 7620 ggccgtggcc ctacctggtg atgagccgga tgaccggcac cacctggcgg tccgcgatgg 7680 acggcacgac cgaccggaac gcgctgctcg ccctggcccg cgaactcggc cgggtgctcg 7740 gccggctgca cagggtgccg ctgaccggga acaccgtgct caccccccat tccgaggtct 7800 tcccggaact gctgcgggaa cgccgcgcgg cgaccgtcga ggaccaccgc gggtggggct 7860 acctctcgcc ccggctgctg gaccgcctgg aggactggct gccggacgtg gacacgctgc 7920 tggccggccg cgaaccccgg ttcgtccacg gcgacctgca cgggaccaac atcttcgtgg 7980 acctggccgc gaccgaggtc accgggatcg tcgacttcac cgacgtctat gcgggagact 8040 cccgctacag cctggtgcaa ctgcatctca acgccttccg gggcgaccgc gagatcctgg 8100 ccgcgctgct cgacggggcg cagtggaagc ggaccgagga cttcgcccgc gaactgctcg 8160 ccttcacctt cctgcacgac ttcgaggtgt tcgaggagac cccgctggat ctctccggct 8220 tcaccgatcc ggaggaactg gcgcagttcc tctgggggcc gccggacacc gcccccggcg 8280 cctgataagg atccggcaag actggccccg cttggcaacg caacagtgag cccctcccta 8340 gtgtgtttgg ggatgtgact atgtattcgt gtgttggcca acgggtcaac ccgaacagat 8400 tgatacccgc cttggcattt cctgtcagaa tgtaacgtca gttgatggta ct 8452 <210> 121 <211> 26 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 121 ccgtgccggg cgggagaccg ccatgg 26 <210> 122 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 122 ggcccggctg tggctgagga gc 22 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 123 cggtctcccg cccggcacgg 20 <210> 124 <211> 26 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 124 gctcctcagc cacagccggg ccgggt 26 <210> 125 <211> 12 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 125 cgaccctgga aa 12 <210> 126 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 126 ccccgccgcc accc 14 <210> 127 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 127 tttccagggt cgccatgg 18 <210> 128 <211> 10 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 128 ggcggcgggg 10 <210> 129 <211> 20 <212> DNA <213> Homo sapiens <400> 129 acccttgtta gccacctccc 20 <210> 130 <211> 20 <212> DNA <213> Homo sapiens <400> 130 gaacgcagtg ctcttcgaag 20 <210> 131 <211> 20 <212> DNA <213> Homo sapiens <400> 131 ctcacgccct gctccgtgta 20 <210> 132 <211> 20 <212> DNA <213> Homo sapiens <400> 132 ggcgacaact acttcctggt 20 <210> 133 <211> 20 <212> DNA <213> Homo sapiens <400> 133 ctcacgccct gctccgtgta 20 <210> 134 <211> 20 <212> DNA <213> Homo sapiens <400> 134 gggcgacaac tacttcctgg 20 <210> 135 <211> 20 <212> DNA <213> Homo sapiens <400> 135 cctcttcagg gccggggtgg 20 <210> 136 <211> 20 <212> DNA <213> Homo sapiens <400> 136 gaggacccag gtggaactgc 20 <210> 137 <211> 20 <212> DNA <213> Homo sapiens <400> 137 tcagctccag gcggtcctgg 20 <210> 138 <211> 20 <212> DNA <213> Homo sapiens <400> 138 agcagcagca gcagtggcag 20 <210> 139 <211> 20 <212> DNA <213> Homo sapiens <400> 139 tgggcaccgt cagctccagg 20 <210> 140 <211> 20 <212> DNA <213> Homo sapiens <400> 140 cagcagtggc agcggccacc 20 <210> 141 <211> 20 <212> DNA <213> Homo sapiens <400> 141 acctctcccc tggccctcat 20 <210> 142 <211> 20 <212> DNA <213> Homo sapiens <400> 142 ccaggaccgc ctggagctga 20 <210> 143 <211> 20 <212> DNA <213> Homo sapiens <400> 143 ccgtcagctc caggcggtcc 20 <210> 144 <211> 20 <212> DNA <213> Homo sapiens <400> 144 agcagcagca gcagtggcag 20 <210> 145 <211> 20 <212> DNA <213> Homo sapiens <400> 145 atgtgccaag caaagcctca 20 <210> 146 <211> 20 <212> DNA <213> Homo sapiens <400> 146 ttcggtcatg cccgtggatg 20 <210> 147 <211> 20 <212> DNA <213> Homo sapiens <400> 147 gtcgttgaaa ttcatcgtac 20 <210> 148 <211> 20 <212> DNA <213> Homo sapiens <400> 148 accacctgtg aagagtttcc 20 <210> 149 <211> 20 <212> DNA <213> Homo sapiens <400> 149 cgtcgttgaa attcatcgta 20 <210> 150 <211> 20 <212> DNA <213> Homo sapiens <400> 150 accacctgtg aagagtttcc 20 <210> 151 <211> 20 <212> DNA <213> Mus musculus <400> 151 gaacgcagtg cttttcgagg 20 <210> 152 <211> 20 <212> DNA <213> Mus musculus <400> 152 acccttgttg gccacctccc 20 <210> 153 <211> 20 <212> DNA <213> Mus musculus <400> 153 ggtgacaact actatctggt 20 <210> 154 <211> 20 <212> DNA <213> Mus musculus <400> 154 ctcacaccct gctccgtgta 20 <210> 155 <211> 20 <212> DNA <213> Mus musculus <400> 155 gggtgacaac tactatctgg 20 <210> 156 <211> 20 <212> DNA <213> Mus musculus <400> 156 ctcacaccct gctccgtgta 20 <210> 157 <211> 20 <212> DNA <213> Mus musculus <400> 157 cgagaacgca gtgcttttcg 20 <210> 158 <211> 20 <212> DNA <213> Mus musculus <400> 158 acccttgttg gccacctccc 20 <210> 159 <211> 20 <212> DNA <213> Mus musculus <400> 159 atgagccaag caaatcctca 20 <210> 160 <211> 20 <212> DNA <213> Mus musculus <400> 160 ttccgtcatg cccgtggaca 20 <210> 161 <211> 20 <212> DNA <213> Mus musculus <400> 161 cttcgttgaa aaccattgta 20 <210> 162 <211> 20 <212> DNA <213> Mus musculus <400> 162 ccacctctga agagtttcct 20 <210> 163 <211> 20 <212> DNA <213> Mus musculus <400> 163 cttcgttgaa aaccattgta 20 <210> 164 <211> 20 <212> DNA <213> Mus musculus <400> 164 accacctctg aagagtttcc 20 <210> 165 <211> 20 <212> DNA <213> Mus musculus <400> 165 cttccactca ctctgcgatt 20 <210> 166 <211> 20 <212> DNA <213> Mus musculus <400> 166 accatgtctc agtgtcaagc 20 <210> 167 <211> 20 <212> DNA <213> Mus musculus <400> 167 ggcggcaaca gcggcaacag 20 <210> 168 <211> 20 <212> DNA <213> Mus musculus <400> 168 actgctctgc gtggctgcgg 20 <210> 169 <211> 20 <212> DNA <213> Mus musculus <400> 169 ccgcagccac gcagagcagt 20 <210> 170 <211> 20 <212> DNA <213> Mus musculus <400> 170 gcacctctcc tcgccccgat 20 <210> 171 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 171 gagggcctat ttcccatgat tcc 23 <210> 172 <211> 126 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> modified_base <222> (84)..(102) <223> a, c, t, g, unknown or other <400> 172 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacnnnnnnn nnnnnnnnnn nnccggtgtt tcgtcctttc 120 cacaag 126 <210> 173 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> modified_base <222> (6)..(24) <223> a, c, t, g, unknown or other <400> 173 caccgnnnnn nnnnnnnnnn nnnn 24 <210> 174 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> modified_base <222> (5)..(23) <223> a, c, t, g, unknown or other <400> 174 aaacnnnnnn nnnnnnnnnn nnnc 24 <210> 175 <211> 126 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 175 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacccctagt cattggaggt gaccggtgtt tcgtcctttc 120 cacaag 126 <210> 176 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 176 caccgtcacc tccaatgact aggg 24 <210> 177 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 177 aaacccctag tcattggagg tgac 24 <210> 178 <211> 192 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 178 cagaagaaga agggctccca tcacatcaac cggtggcgca ttgccacgaa gcaggccaat 60 ggggaggaca tcgatgtcac ctccaatgac aagcttgcta gcggtgggca accacaaacc 120 cacgagggca gagtgctgct tgctgctggc caggcccctg cgtgggccca agctggactc 180 tggccactcc ct 192 <210> 179 <211> 192 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 179 agggagtggc cagagtccag cttgggccca cgcaggggcc tggccagcag caagcagcac 60 tctgccctcg tgggtttgtg gttgcccacc gctagcaagc ttgtcattgg aggtgacatc 120 gatgtcctcc ccattggcct gcttcgtggc aatgcgccac cggttgatgt gatgggagcc 180 cttcttcttc tg 192 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 180 ccatcccctt ctgtgaatgt 20 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 181 ggagattgga gacacggaga 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 182 ggctccctgg gttcaaagta 20 <210> 183 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 183 agaggggtct ggatgtcgta a 21 <210> 184 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 184 cgccagggtt ttcccagtca cgac 24 <210> 185 <211> 51 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 185 gagggtctcg tccttgcggc cgcgctagcg agggcctatt tcccatgatt c 51 <210> 186 <211> 133 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> modified_base <222> (95)..(114) <223> a, c, t, g, unknown or other <400> 186 ctcggtctcg gtaaaaaagc accgactcgg tgccactttt tcaagttgat aacggactag 60 ccttatttta acttgctatt tctagctcta aaacnnnnnn nnnnnnnnnn nnnnggtgtt 120 tcgtcctttc cac 133 <210> 187 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 187 gagggtctct ttaccggtga gggcctattt cccatgattc c 41 <210> 188 <211> 133 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> modified_base <222> (95)..(114) <223> a, c, t, g, unknown or other <400> 188 ctcggtctcc tcaaaaaagc accgactcgg tgccactttt tcaagttgat aacggactag 60 ccttatttta acttgctatt tctagctcta aaacnnnnnn nnnnnnnnnn nnnnggtgtt 120 tcgtcctttc cac 133 <210> 189 <211> 40 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 189 gagggtctct ttgagctcga gggcctattt cccatgattc 40 <210> 190 <211> 133 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> modified_base <222> (96)..(115) <223> a, c, t, g, unknown or other <400> 190 ctcggtctcg cgtaaaaaag caccgactcg gtgccacttt ttcaagttga taacggacta 60 gccttatttt aacttgctat ttctagctct aaaacnnnnn nnnnnnnnnn nnnnnggtgt 120 ttcgtccttt cca 133 <210> 191 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 191 gagggtctct tacgcgtgtg tctagac 27 <210> 192 <211> 98 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 192 ctcggtctca aggacaggga agggagcagt ggttcacgcc tgtaatccca gcaatttggg 60 aggccaaggt gggtagatca cctgagatta ggagttgc 98 <210> 193 <211> 30 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 193 cctgtccttg cggccgcgct agcgagggcc 30 <210> 194 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 194 cacgcggccg caaggacagg gaagggagca g 31 <210> 195 <211> 327 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 195 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Ser 225 230 235 240 Gly Leu Arg Ser Arg Glu Glu Glu Glu Glu Thr Asp Ser Arg Met Pro 245 250 255 His Leu Asp Ser Pro Gly Ser Ser Gln Pro Arg Arg Ser Phe Leu Ser 260 265 270 Arg Val Ile Arg Ala Ala Leu Pro Leu Gln Leu Leu Leu Leu Leu Leu 275 280 285 Leu Leu Leu Ala Cys Leu Leu Pro Ala Ser Glu Asp Asp Tyr Ser Cys 290 295 300 Thr Gln Ala Asn Asn Phe Ala Arg Ser Phe Tyr Pro Met Leu Arg Tyr 305 310 315 320 Thr Asn Gly Pro Pro Pro Thr 325 <210> 196 <211> 3243 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 196 accggtgcca ccatgtaccc atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc 60 aaggtcgaag cgtccatgaa aaggaactac attctggggc tggacatcgg gattacaagc 120 gtggggtatg ggattattga ctatgaaaca agggacgtga tcgacgcagg cgtcagactg 180 ttcaaggagg ccaacgtgga aaacaatgag ggacggagaa gcaagagggg agccaggcgc 240 ctgaaacgac ggagaaggca cagaatccag agggtgaaga aactgctgtt cgattacaac 300 ctgctgaccg accattctga gctgagtgga attaatcctt atgaagccag ggtgaaaggc 360 ctgagtcaga agctgtcaga ggaagagttt tccgcagctc tgctgcacct ggctaagcgc 420 cgaggagtgc ataacgtcaa tgaggtggaa gaggacaccg gcaacgagct gtctacaaag 480 gaacagatct cacgcaatag caaagctctg gaagagaagt atgtcgcaga gctgcagctg 540 gaacggctga agaaagatgg cgaggtgaga gggtcaatta ataggttcaa gacaagcgac 600 tacgtcaaag aagccaagca gctgctgaaa gtgcagaagg cttaccacca gctggatcag 660 agcttcatcg atacttatat cgacctgctg gagactcgga gaacctacta tgagggacca 720 ggagaaggga gccccttcgg atggaaagac atcaaggaat ggtacgagat gctgatggga 780 cattgcacct attttccaga agagctgaga agcgtcaagt acgcttataa cgcagatctg 840 tacaacgccc tgaatgacct gaacaacctg gtcatcacca gggatgaaaa cgagaaactg 900 gaatactatg agaagttcca gatcatcgaa aacgtgttta agcagaagaa aaagcctaca 960 ctgaaacaga ttgctaagga gatcctggtc aacgaagagg acatcaaggg ctaccgggtg 1020 acaagcactg gaaaaccaga gttcaccaat ctgaaagtgt atcacgatat taaggacatc 1080 acagcacgga aagaaatcat tgagaacgcc gaactgctgg atcagattgc taagatcctg 1140 actatctacc agagctccga ggacatccag gaagagctga ctaacctgaa cagcgagctg 1200 acccaggaag agatcgaaca gattagtaat ctgaaggggt acaccggaac acacaacctg 1260 tccctgaaag ctatcaatct gattctggat gagctgtggc atacaaacga caatcagatt 1320 gcaatcttta accggctgaa gctggtccca aaaaaggtgg acctgagtca gcagaaagag 1380 atcccaacca cactggtgga cgatttcatt ctgtcacccg tggtcaagcg gagcttcatc 1440 cagagcatca aagtgatcaa cgccatcatc aagaagtacg gcctgcccaa tgatatcatt 1500 atcgagctgg ctagggagaa gaacagcaag gacgcacaga agatgatcaa tgagatgcag 1560 aaacgaaacc ggcagaccaa tgaacgcatt gaagagatta tccgaactac cgggaaagag 1620 aacgcaaagt acctgattga aaaaatcaag ctgcacgata tgcaggaggg aaagtgtctg 1680 tattctctgg aggccatccc cctggaggac ctgctgaaca atccattcaa ctacgaggtc 1740 gatcatatta tccccagaag cgtgtccttc gacaattcct ttaacaacaa ggtgctggtc 1800 aagcaggaag agaactctaa aaagggcaat aggactcctt tccagtacct gtctagttca 1860 gattccaaga tctcttacga aacctttaaa aagcacattc tgaatctggc caaaggaaag 1920 ggccgcatca gcaagaccaa aaaggagtac ctgctggaag agcgggacat caacagattc 1980 tccgtccaga aggattttat taaccggaat ctggtggaca caagatacgc tactcgcggc 2040 ctgatgaatc tgctgcgatc ctatttccgg gtgaacaatc tggatgtgaa agtcaagtcc 2100 atcaacggcg ggttcacatc ttttctgagg cgcaaatgga agtttaaaaa ggagcgcaac 2160 aaagggtaca agcaccatgc cgaagatgct ctgattatcg caaatgccga cttcatcttt 2220 aaggagtgga aaaagctgga caaagccaag aaagtgatgg agaaccagat gttcgaagag 2280 aagcaggccg aatctatgcc cgaaatcgag acagaacagg agtacaagga gattttcatc 2340 actcctcacc agatcaagca tatcaaggat ttcaaggact acaagtactc tcaccgggtg 2400 gataaaaagc ccaacagaga gctgatcaat gacaccctgt atagtacaag aaaagacgat 2460 aaggggaata ccctgattgt gaacaatctg aacggactgt acgacaaaga taatgacaag 2520 ctgaaaaagc tgatcaacaa aagtcccgag aagctgctga tgtaccacca tgatcctcag 2580 acatatcaga aactgaagct gattatggag cagtacggcg acgagaagaa cccactgtat 2640 aagtactatg aagagactgg gaactacctg accaagtata gcaaaaagga taatggcccc 2700 gtgatcaaga agatcaagta ctatgggaac aagctgaatg cccatctgga catcacagac 2760 gattacccta acagtcgcaa caaggtggtc aagctgtcac tgaagccata cagattcgat 2820 gtctatctgg acaacggcgt gtataaattt gtgactgtca agaatctgga tgtcatcaaa 2880 aaggagaact actatgaagt gaatagcaag tgctacgaag aggctaaaaa gctgaaaaag 2940 attagcaacc aggcagagtt catcgcctcc ttttacaaca acgacctgat taagatcaat 3000 ggcgaactgt atagggtcat cggggtgaac aatgatctgc tgaaccgcat tgaagtgaat 3060 atgattgaca tcacttaccg agagtatctg gaaaacatga atgataagcg cccccctcga 3120 attatcaaaa caattgcctc taagactcag agtatcaaaa agtactcaac cgacattctg 3180 ggaaacctgt atgaggtgaa gagcaaaaag caccctcaga ttatcaaaaa gggctaagaa 3240 ttc 3243 <210> 197 <211> 10 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 197 ccaggcttgg 10 <210> 198 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 198 ggagctggtc tgttggagaa 20 <210> 199 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 199 tcccaatcca taatcccacg tt 22 <210> 200 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 200 caggagggcc aggagatttg 20 <210> 201 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 201 tgaaatcgag gatctgggcg 20 <210> 202 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 202 caaaggaccc cagtcactcc 20 <210> 203 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 203 gaggagggag caggaaagtg 20 <210> 204 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 204 gacacttccc aaaggacccc 20 <210> 205 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 205 tgagagccgt tccctctttg 20 <210> 206 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 206 gacaggggca aagtgagtga 20 <210> 207 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 207 ttcatggttt cggaggccc 19 <210> 208 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 208 tgagtgacct gcttttgggg 20 <210> 209 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 209 gttcatggtt tcggaggccc 20 <210> 210 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 210 ggaggacaaa gtacaaacgg c 21 <210> 211 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 211 atcgatgtcc tccccattgg 20 <210> 212 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 212 tgggagagag accccttctt 20 <210> 213 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 213 tcctgctctc acttagactt tctc 24 <210> 214 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 214 gacattcctc ctgagggaaa a 21 <210> 215 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 215 gataaaatgt attccttctc accattc 27 <210> 216 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 216 ccagactcag taaagcctgg a 21 <210> 217 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 217 tggccccagt ctctcttcta 20 <210> 218 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 218 cacggccttt gcaaatagag 20 <210> 219 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 219 catgacttgg cctttgtagg a 21 <210> 220 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 220 tggggttaca gaaagaatag gg 22 <210> 221 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 221 ttctgagggc tgctacctgt 20 <210> 222 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 222 tgaagcaact ccagtcccaa 20 <210> 223 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 223 cccggctctg gctaaagag 19 <210> 224 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 224 tgggtgtgca catctaagga 20 <210> 225 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 225 ccactgagtc aactgtaagc a 21 <210> 226 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 226 gcagaggaat atgtgacatg agg 23 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 227 tactccctgc tgtcctctcc 20 <210> 228 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 228 ttcctggcca agtcgattcc 20 <210> 229 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 229 ggataccagc atgggctacc 20 <210> 230 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 230 actcttgaga ttggaacggg a 21 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 231 ccacacttat ctacgcccca 20 <210> 232 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 232 agccagaaga gaacatccac g 21 <210> 233 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 233 agttgctctt tgttgagagg ga 22 <210> 234 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 234 tgaccgggga cctatgtatg a 21 <210> 235 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 235 acaagacttg ctcttactta cttga 25 <210> 236 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 236 ggatggaggg agtttgctcc tgg 23 <210> 237 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 237 cgccctcccc accccgcctc cgg 23 <210> 238 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 238 taccccccac accccgcctc tgg 23 <210> 239 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 239 gggcccctcc accccgcctc tgg 23 <210> 240 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 240 ctacccctcc accccgcctc cgg 23 <210> 241 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 241 aggttgttgc tgttgcttta ca 22 <210> 242 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 242 aggtttcacc tggtttgggg 20 <210> 243 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 243 agcacggtta atttgcatac atct 24 <210> 244 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 244 tccaggcagt tttcttctgg t 21 <210> 245 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 245 ccagagagcc agcattccaa 20 <210> 246 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 246 agggctccca ctagaagagg 20 <210> 247 <211> 352 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 247 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tt 352 <210> 248 <211> 4269 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 248 atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60 gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120 gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180 accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240 agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300 acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360 ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420 gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480 atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540 ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600 atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660 gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720 aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780 ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggcaacctg 840 attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900 gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960 atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020 ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080 atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140 cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200 tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260 aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320 cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380 attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440 aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500 ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560 gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620 ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680 aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740 ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800 aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860 ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920 aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980 accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040 ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100 ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160 ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220 ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280 gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340 aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400 gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460 aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520 gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580 atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640 gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700 aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760 tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820 aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880 gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940 aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000 ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060 caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120 cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180 atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240 atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300 ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360 accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420 acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480 agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540 tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600 gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660 ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720 tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780 aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840 tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900 cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960 ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020 atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080 gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140 gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200 ctgtctcagc tgggaggcga caagcgtcct gctgctacta agaaagctgg tcaagctaag 4260 aaaaagaaa 4269 <210> 249 <211> 4269 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 249 atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60 gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120 gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 180 accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240 agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300 acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360 ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420 gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480 atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540 ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600 atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660 gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720 aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780 ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggcaacctg 840 attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900 gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960 atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020 ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080 atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140 cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200 tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260 aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320 cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380 attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440 aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500 ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560 gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620 ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680 aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740 ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800 aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860 ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920 aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980 accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040 ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100 ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160 ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220 ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280 gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340 aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400 gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460 aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520 gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580 atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640 gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700 aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760 tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820 aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880 gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940 aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000 ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060 caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120 cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180 atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240 atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300 ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360 accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420 acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480 agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540 tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600 gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660 ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720 tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780 aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840 tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900 cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960 ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020 atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080 gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140 gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200 ctgtctcagc tgggaggcga caagcgtcct gctgctacta agaaagctgg tcaagctaag 4260 aaaaagaaa 4269 <210> 250 <211> 4341 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 250 gccaccggtt aatacgactc actatagggc caccatggac tataaggacc acgacggaga 60 ctacaaggat catgatattg attacaaaga cgatgacgat aagatggccc caaagaagaa 120 gcggaaggtc ggtatccacg gagtcccagc agccgacaag aagtacagca tcggcctgga 180 catcggcacc aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa 240 gaaattcaag gtgctgggca acaccgaccg gcacagcatc aagaagaacc tgatcggagc 300 cctgctgttc gacagcggcg aaacagccga ggccacccgg ctgaagagaa ccgccagaag 360 aagatacacc agacggaaga accggatctg ctatctgcaa gagatcttca gcaacgagat 420 ggccaaggtg gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga 480 taagaagcac gagcggcacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga 540 gaagtacccc accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga 600 cctgcggctg atctatctgg ccctggccca catgatcaag ttccggggcc acttcctgat 660 cgagggcgac ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca 720 gacctacaac cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc 780 catcctgtct gccagactga gcaagagcag acggctggaa aatctgatcg cccagctgcc 840 cggcgagaag aagaatggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc 900 caacttcaag agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac 960 ctacgacgac gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt 1020 tctggccgcc aagaacctgt ccgacgccat cctgctgagc gacatcctga gagtgaacac 1080 cgagatcacc aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca 1140 ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagagat 1200 tttcttcgac cagagcaaga acggctacgc cggctacatt gacggcggag ccagccagga 1260 agagttctac aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct 1320 cgtgaagctg aacagagagg acctgctgcg gaagcagcgg accttcgaca acggcagcat 1380 cccccaccag atccacctgg gagagctgca cgccattctg cggcggcagg aagattttta 1440 cccattcctg aaggacaacc gggaaaagat cgagaagatc ctgaccttcc gcatccccta 1500 ctacgtgggc cctctggcca ggggaaacag cagattcgcc tggatgacca gaaagagcga 1560 ggaaaccatc accccctgga acttcgagga agtggtggac aagggcgctt ccgcccagag 1620 cttcatcgag cggatgacca acttcgataa gaacctgccc aacgagaagg tgctgcccaa 1680 gcacagcctg ctgtacgagt acttcaccgt gtataacgag ctgaccaaag tgaaatacgt 1740 gaccgaggga atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga 1800 cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa 1860 gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc 1920 cctgggcaca taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggacaatga 1980 ggaaaacgag gacattctgg aagatatcgt gctgaccctg acactgtttg aggacagaga 2040 gatgatcgag gaacggctga aaacctatgc ccacctgttc gacgacaaag tgatgaagca 2100 gctgaagcgg cggagataca ccggctgggg caggctgagc cggaagctga tcaacggcat 2160 ccgggacaag cagtccggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa 2220 cagaaacttc atgcagctga tccacgacga cagcctgacc tttaaagagg acatccagaa 2280 agcccaggtg tccggccagg gcgatagcct gcacgagcac attgccaatc tggccggcag 2340 ccccgccatt aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt 2400 gatgggccgg cacaagcccg agaacatcgt gatcgaaatg gccagagaga accagaccac 2460 ccagaaggga cagaagaaca gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga 2520 gctgggcagc cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa 2580 gctgtacctg tactacctgc agaatgggcg ggatatgtac gtggaccagg aactggacat 2640 caaccggctg tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga 2700 ctccatcgac aacaaggtgc tgaccagaag cgacaagaac cggggcaaga gcgacaacgt 2760 gccctccgaa gaggtcgtga agaagatgaa gaactactgg cggcagctgc tgaacgccaa 2820 gctgattacc cagagaaagt tcgacaatct gaccaaggcc gagagaggcg gcctgagcga 2880 actggataag gccggcttca tcaagagaca gctggtggaa acccggcaga tcacaaagca 2940 cgtggcacag atcctggact cccggatgaa cactaagtac gacgagaatg acaagctgat 3000 ccgggaagtg aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt 3060 ccagttttac aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa 3120 cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta 3180 cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg 3240 caaggctacc gccaagtact tcttctacag caacatcatg aactttttca agaccgagat 3300 taccctggcc aacggcgaga tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg 3360 ggagatcgtg tgggataagg gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc 3420 ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat 3480 cctgcccaag aggaacagcg ataagctgat cgccagaaag aaggactggg accctaagaa 3540 gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga 3600 aaagggcaag tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga 3660 aagaagcagc ttcgagaaga atcccatcga ctttctggaa gccaagggct acaaagaagt 3720 gaaaaaggac ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggccg 3780 gaagagaatg ctggcctctg ccggcgaact gcagaaggga aacgaactgg ccctgccctc 3840 caaatatgtg aacttcctgt acctggccag ccactatgag aagctgaagg gctcccccga 3900 ggataatgag cagaaacagc tgtttgtgga acagcacaag cactacctgg acgagatcat 3960 cgagcagatc agcgagttct ccaagagagt gatcctggcc gacgctaatc tggacaaagt 4020 gctgtccgcc tacaacaagc accgggataa gcccatcaga gagcaggccg agaatatcat 4080 ccacctgttt accctgacca atctgggagc ccctgccgcc ttcaagtact ttgacaccac 4140 catcgaccgg aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca 4200 gagcatcacc ggcctgtacg agacacggat cgacctgtct cagctgggag gcgacaaaag 4260 gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa aagtaagaaa aaaaaaaaaa 4320 aaaaaaaaaa aaaaaaaaac c 4341 <210> 251 <211> 4341 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 251 gccaccggtt aatacgactc actatagggc caccatggac tataaggacc acgacggaga 60 ctacaaggat catgatattg attacaaaga cgatgacgat aagatggccc caaagaagaa 120 gcggaaggtc ggtatccacg gagtcccagc agccgacaag aagtacagca tcggcctggc 180 catcggcacc aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa 240 gaaattcaag gtgctgggca acaccgaccg gcacagcatc aagaagaacc tgatcggagc 300 cctgctgttc gacagcggcg aaacagccga ggccacccgg ctgaagagaa ccgccagaag 360 aagatacacc agacggaaga accggatctg ctatctgcaa gagatcttca gcaacgagat 420 ggccaaggtg gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga 480 taagaagcac gagcggcacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga 540 gaagtacccc accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga 600 cctgcggctg atctatctgg ccctggccca catgatcaag ttccggggcc acttcctgat 660 cgagggcgac ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca 720 gacctacaac cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc 780 catcctgtct gccagactga gcaagagcag acggctggaa aatctgatcg cccagctgcc 840 cggcgagaag aagaatggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc 900 caacttcaag agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac 960 ctacgacgac gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt 1020 tctggccgcc aagaacctgt ccgacgccat cctgctgagc gacatcctga gagtgaacac 1080 cgagatcacc aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca 1140 ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagagat 1200 tttcttcgac cagagcaaga acggctacgc cggctacatt gacggcggag ccagccagga 1260 agagttctac aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct 1320 cgtgaagctg aacagagagg acctgctgcg gaagcagcgg accttcgaca acggcagcat 1380 cccccaccag atccacctgg gagagctgca cgccattctg cggcggcagg aagattttta 1440 cccattcctg aaggacaacc gggaaaagat cgagaagatc ctgaccttcc gcatccccta 1500 ctacgtgggc cctctggcca ggggaaacag cagattcgcc tggatgacca gaaagagcga 1560 ggaaaccatc accccctgga acttcgagga agtggtggac aagggcgctt ccgcccagag 1620 cttcatcgag cggatgacca acttcgataa gaacctgccc aacgagaagg tgctgcccaa 1680 gcacagcctg ctgtacgagt acttcaccgt gtataacgag ctgaccaaag tgaaatacgt 1740 gaccgaggga atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga 1800 cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa 1860 gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc 1920 cctgggcaca taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggacaatga 1980 ggaaaacgag gacattctgg aagatatcgt gctgaccctg acactgtttg aggacagaga 2040 gatgatcgag gaacggctga aaacctatgc ccacctgttc gacgacaaag tgatgaagca 2100 gctgaagcgg cggagataca ccggctgggg caggctgagc cggaagctga tcaacggcat 2160 ccgggacaag cagtccggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa 2220 cagaaacttc atgcagctga tccacgacga cagcctgacc tttaaagagg acatccagaa 2280 agcccaggtg tccggccagg gcgatagcct gcacgagcac attgccaatc tggccggcag 2340 ccccgccatt aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt 2400 gatgggccgg cacaagcccg agaacatcgt gatcgaaatg gccagagaga accagaccac 2460 ccagaaggga cagaagaaca gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga 2520 gctgggcagc cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa 2580 gctgtacctg tactacctgc agaatgggcg ggatatgtac gtggaccagg aactggacat 2640 caaccggctg tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga 2700 ctccatcgac aacaaggtgc tgaccagaag cgacaagaac cggggcaaga gcgacaacgt 2760 gccctccgaa gaggtcgtga agaagatgaa gaactactgg cggcagctgc tgaacgccaa 2820 gctgattacc cagagaaagt tcgacaatct gaccaaggcc gagagaggcg gcctgagcga 2880 actggataag gccggcttca tcaagagaca gctggtggaa acccggcaga tcacaaagca 2940 cgtggcacag atcctggact cccggatgaa cactaagtac gacgagaatg acaagctgat 3000 ccgggaagtg aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt 3060 ccagttttac aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa 3120 cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta 3180 cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg 3240 caaggctacc gccaagtact tcttctacag caacatcatg aactttttca agaccgagat 3300 taccctggcc aacggcgaga tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg 3360 ggagatcgtg tgggataagg gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc 3420 ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat 3480 cctgcccaag aggaacagcg ataagctgat cgccagaaag aaggactggg accctaagaa 3540 gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga 3600 aaagggcaag tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga 3660 aagaagcagc ttcgagaaga atcccatcga ctttctggaa gccaagggct acaaagaagt 3720 gaaaaaggac ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggccg 3780 gaagagaatg ctggcctctg ccggcgaact gcagaaggga aacgaactgg ccctgccctc 3840 caaatatgtg aacttcctgt acctggccag ccactatgag aagctgaagg gctcccccga 3900 ggataatgag cagaaacagc tgtttgtgga acagcacaag cactacctgg acgagatcat 3960 cgagcagatc agcgagttct ccaagagagt gatcctggcc gacgctaatc tggacaaagt 4020 gctgtccgcc tacaacaagc accgggataa gcccatcaga gagcaggccg agaatatcat 4080 ccacctgttt accctgacca atctgggagc ccctgccgcc ttcaagtact ttgacaccac 4140 catcgaccgg aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca 4200 gagcatcacc ggcctgtacg agacacggat cgacctgtct cagctgggag gcgacaaaag 4260 gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa aagtaagaaa aaaaaaaaaa 4320 aaaaaaaaaa aaaaaaaaac c 4341 <210> 252 <211> 191 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 252 agcaggccaa tggggaggac atcgatgtca cctccaatga ctactaccca tacgatgttc 60 cagattacgc tatggactat aaggaccacg acggagacta caaggatcat gatattgatt 120 acaaagacga tgacgataag aagcttgaaa tggcatcaat gcagaagctg atctcagagg 180 aggacctgta a 191 <210> 253 <211> 191 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 253 tagtcattgg aggtgacatc gatgtcctcc ccattggcct gctttacagg tcctcctctg 60 agatcagctt ctgcattgat gccatttcaa gcttcttatc gtcatcgtct ttgtaatcaa 120 tatcatgatc cttgtagtct ccgtcgtggt ccttatagtc catagcgtaa tctggaacat 180 cgtatgggta g 191 <210> 254 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 254 ggggccacta gggacaggat 20 <210> 255 <211> 102 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 255 gttttagagc tatgctgttt tgaatggtcc caaaacggaa gggcctgagt ccgagcagaa 60 gaagaagttt tagagctatg ctgttttgaa tggtcccaaa ac 102 <210> 256 <211> 100 <212> DNA <213> Homo sapiens <400> 256 cggaggacaa agtacaaacg gcagaagctg gaggaggaag ggcctgagtc cgagcagaag 60 aagaagggct cccatcacat caaccggtgg cgcattgcca 100 <210> 257 <211> 50 <212> DNA <213> Homo sapiens <400> 257 agctggagga ggaagggcct gagtccgagc agaagaagaa gggctcccac 50 <210> 258 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 258 gaguccgagc agaagaagaa guuuuagagc 30 <210> 259 <211> 49 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 259 agctggagga ggaagggcct gagtccgagc agaagagaag ggctcccat 49 <210> 260 <211> 53 <212> DNA <213> Homo sapiens <400> 260 ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccatca cat 53 <210> 261 <211> 52 <212> DNA <213> Homo sapiens <400> 261 ctggaggagg aagggcctga gtccgagcag aagagaaggg ctcccatcac at 52 <210> 262 <211> 54 <212> DNA <213> Homo sapiens <400> 262 ctggaggagg aagggcctga gtccgagcag aagaaagaag ggctcccatc acat 54 <210> 263 <211> 50 <212> DNA <213> Homo sapiens <400> 263 ctggaggagg aagggcctga gtccgagcag aagaagggct cccatcacat 50 <210> 264 <211> 47 <212> DNA <213> Homo sapiens <400> 264 ctggaggagg aagggcctga gcccgagcag aagggctccc atcacat 47 <210> 265 <211> 4104 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(4104) <400> 265 atg gac aag aag tac agc atc ggc ctg gac atc ggc acc aac tct gtg 48 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 ggc tgg gcc gtg atc acc gac gag tac aag gtg ccc agc aag aaa ttc 96 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 aag gtg ctg ggc aac acc gac cgg cac agc atc aag aag aac ctg atc 144 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 gga gcc ctg ctg ttc gac agc ggc gaa aca gcc gag gcc acc cgg ctg 192 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 aag aga acc gcc aga aga aga tac acc aga cgg aag aac cgg atc tgc 240 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 tat ctg caa gag atc ttc agc aac gag atg gcc aag gtg gac gac agc 288 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 ttc ttc cac aga ctg gaa gag tcc ttc ctg gtg gaa gag gat aag aag 336 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 cac gag cgg cac ccc atc ttc ggc aac atc gtg gac gag gtg gcc tac 384 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 cac gag aag tac ccc acc atc tac cac ctg aga aag aaa ctg gtg gac 432 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 agc acc gac aag gcc gac ctg cgg ctg atc tat ctg gcc ctg gcc cac 480 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 atg atc aag ttc cgg ggc cac ttc ctg atc gag ggc gac ctg aac ccc 528 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 gac aac agc gac gtg gac aag ctg ttc atc cag ctg gtg cag acc tac 576 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 aac cag ctg ttc gag gaa aac ccc atc aac gcc agc ggc gtg gac gcc 624 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 aag gcc atc ctg tct gcc aga ctg agc aag agc aga cgg ctg gaa aat 672 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 ctg atc gcc cag ctg ccc ggc gag aag aag aat ggc ctg ttc ggc aac 720 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 ctg att gcc ctg agc ctg ggc ctg acc ccc aac ttc aag agc aac ttc 768 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 gac ctg gcc gag gat gcc aaa ctg cag ctg agc aag gac acc tac gac 816 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 gac gac ctg gac aac ctg ctg gcc cag atc ggc gac cag tac gcc gac 864 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 ctg ttt ctg gcc gcc aag aac ctg tcc gac gcc atc ctg ctg agc gac 912 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 atc ctg aga gtg aac acc gag atc acc aag gcc ccc ctg agc gcc tct 960 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 atg atc aag aga tac gac gag cac cac cag gac ctg acc ctg ctg aaa 1008 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 gct ctc gtg cgg cag cag ctg cct gag aag tac aaa gag att ttc ttc 1056 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 gac cag agc aag aac ggc tac gcc ggc tac att gac ggc gga gcc agc 1104 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 cag gaa gag ttc tac aag ttc atc aag ccc atc ctg gaa aag atg gac 1152 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 ggc acc gag gaa ctg ctc gtg aag ctg aac aga gag gac ctg ctg cgg 1200 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 aag cag cgg acc ttc gac aac ggc agc atc ccc cac cag atc cac ctg 1248 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 gga gag ctg cac gcc att ctg cgg cgg cag gaa gat ttt tac cca ttc 1296 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 ctg aag gac aac cgg gaa aag atc gag aag atc ctg acc ttc cgc atc 1344 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 ccc tac tac gtg ggc cct ctg gcc agg gga aac agc aga ttc gcc tgg 1392 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 atg acc aga aag agc gag gaa acc atc acc ccc tgg aac ttc gag gaa 1440 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 gtg gtg gac aag ggc gct tcc gcc cag agc ttc atc gag cgg atg acc 1488 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 aac ttc gat aag aac ctg ccc aac gag aag gtg ctg ccc aag cac agc 1536 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 ctg ctg tac gag tac ttc acc gtg tat aac gag ctg acc aaa gtg aaa 1584 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 tac gtg acc gag gga atg aga aag ccc gcc ttc ctg agc ggc gag cag 1632 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 aaa aag gcc atc gtg gac ctg ctg ttc aag acc aac cgg aaa gtg acc 1680 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 gtg aag cag ctg aaa gag gac tac ttc aag aaa atc gag tgc ttc gac 1728 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 tcc gtg gaa atc tcc ggc gtg gaa gat cgg ttc aac gcc tcc ctg ggc 1776 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 aca tac cac gat ctg ctg aaa att atc aag gac aag gac ttc ctg gac 1824 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 aat gag gaa aac gag gac att ctg gaa gat atc gtg ctg acc ctg aca 1872 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 ctg ttt gag gac aga gag atg atc gag gaa cgg ctg aaa acc tat gcc 1920 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 cac ctg ttc gac gac aaa gtg atg aag cag ctg aag cgg cgg aga tac 1968 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 acc ggc tgg ggc agg ctg agc cgg aag ctg atc aac ggc atc cgg gac 2016 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 aag cag tcc ggc aag aca atc ctg gat ttc ctg aag tcc gac ggc ttc 2064 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 gcc aac aga aac ttc atg cag ctg atc cac gac gac agc ctg acc ttt 2112 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 aaa gag gac atc cag aaa gcc cag gtg tcc ggc cag ggc gat agc ctg 2160 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 cac gag cac att gcc aat ctg gcc ggc agc ccc gcc att aag aag ggc 2208 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 atc ctg cag aca gtg aag gtg gtg gac gag ctc gtg aaa gtg atg ggc 2256 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 cgg cac aag ccc gag aac atc gtg atc gcc atg gcc aga gag aac cag 2304 Arg His Lys Pro Glu Asn Ile Val Ile Ala Met Ala Arg Glu Asn Gln 755 760 765 acc acc cag aag gga cag aag aac agc cgc gag aga atg aag cgg atc 2352 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 gaa gag ggc atc aaa gag ctg ggc agc cag atc ctg aaa gaa cac ccc 2400 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 gtg gaa aac acc cag ctg cag aac gag aag ctg tac ctg tac tac ctg 2448 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 cag aat ggg cgg gat atg tac gtg gac cag gaa ctg gac atc aac cgg 2496 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 ctg tcc gac tac gat gtg gac gcc atc gtg cct cag agc ttt ctg aag 2544 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 gac gac tcc atc gac gcc aag gtg ctg acc aga agc gac aag gcc cgg 2592 Asp Asp Ser Ile Asp Ala Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 850 855 860 ggc aag agc gac aac gtg ccc tcc gaa gag gtc gtg aag aag atg aag 2640 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 aac tac tgg cgg cag ctg ctg aac gcc aag ctg att acc cag aga aag 2688 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 ttc gac aat ctg acc aag gcc gag aga ggc ggc ctg agc gaa ctg gat 2736 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 aag gcc ggc ttc atc aag aga cag ctg gtg gaa acc cgg cag atc aca 2784 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 aag cac gtg gca cag atc ctg gac tcc cgg atg aac act aag tac gac 2832 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 gag aat gac aag ctg atc cgg gaa gtg aaa gtg atc acc ctg aag tcc 2880 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 aag ctg gtg tcc gat ttc cgg aag gat ttc cag ttt tac aaa gtg cgc 2928 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 gag atc aac aac tac cac cac gcc cac gcc gcc tac ctg aac gcc gtc 2976 Glu Ile Asn Asn Tyr His His Ala His Ala Ala Tyr Leu Asn Ala Val 980 985 990 gtg gga acc gcc ctg atc aaa aag tac cct aag ctg gaa agc gag ttc 3024 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 gtg tac ggc gac tac aag gtg tac gac gtg cgg aag atg atc gcc 3069 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 aag agc gag cag gaa atc ggc aag gct acc gcc aag tac ttc ttc 3114 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 tac agc aac atc atg aac ttt ttc aag acc gag att acc ctg gcc 3159 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 aac ggc gag atc cgg aag cgg cct ctg atc gag aca aac ggc gaa 3204 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 acc ggg gag atc gtg tgg gat aag ggc cgg gat ttt gcc acc gtg 3249 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 cgg aaa gtg ctg agc atg ccc caa gtg aat atc gtg aaa aag acc 3294 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 gag gtg cag aca ggc ggc ttc agc aaa gag tct atc ctg ccc aag 3339 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 agg aac agc gat aag ctg atc gcc aga aag aag gac tgg gac cct 3384 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 aag aag tac ggc ggc ttc gac agc ccc acc gtg gcc tat tct gtg 3429 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 ctg gtg gtg gcc aaa gtg gaa aag ggc aag tcc aag aaa ctg aag 3474 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 agt gtg aaa gag ctg ctg ggg atc acc atc atg gaa aga agc agc 3519 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 ttc gag aag aat ccc atc gac ttt ctg gaa gcc aag ggc tac aaa 3564 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 gaa gtg aaa aag gac ctg atc atc aag ctg cct aag tac tcc ctg 3609 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 ttc gag ctg gaa aac ggc cgg aag aga atg ctg gcc tct gcc ggc 3654 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 gaa ctg cag aag gga aac gaa ctg gcc ctg ccc tcc aaa tat gtg 3699 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 aac ttc ctg tac ctg gcc agc cac tat gag aag ctg aag ggc tcc 3744 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 ccc gag gat aat gag cag aaa cag ctg ttt gtg gaa cag cac aag 3789 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 cac tac ctg gac gag atc atc gag cag atc agc gag ttc tcc aag 3834 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 aga gtg atc ctg gcc gac gct aat ctg gac aaa gtg ctg tcc gcc 3879 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 tac aac aag cac cgg gat aag ccc atc aga gag cag gcc gag aat 3924 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 atc atc cac ctg ttt acc ctg acc aat ctg gga gcc cct gcc gcc 3969 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 ttc aag tac ttt gac acc acc atc gac cgg aag agg tac acc agc 4014 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 acc aaa gag gtg ctg gac gcc acc ctg atc cac cag agc atc acc 4059 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 ggc ctg tac gag aca cgg atc gac ctg tct cag ctg gga ggc gac 4104 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 266 <211> 1368 <212> PRT <213> Homo sapiens <400> 266 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Ala Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Ala Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Ala Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 267 <211> 15 <212> DNA <213> Homo sapiens <400> 267 cagaagaaga agggc 15 <210> 268 <211> 51 <212> DNA <213> Homo sapiens <400> 268 ccaatgggga ggacatcgat gtcacctcca atgactaggg tggtgggcaa c 51 <210> 269 <211> 15 <212> DNA <213> Homo sapiens <400> 269 ctctggccac tccct 15 <210> 270 <211> 52 <212> DNA <213> Homo sapiens <400> 270 acatcgatgt cacctccaat gacaagcttg ctagcggtgg gcaaccacaa ac 52 <210> 271 <211> 57 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(57) <400> 271 ggc acc att aaa gaa aat atc att ggt gtt tcc tat gat gaa tat aga 48 Gly Thr Ile Lys Glu Asn Ile Ile Gly Val Ser Tyr Asp Glu Tyr Arg 1 5 10 15 tac aga agc 57 Tyr Arg Ser <210> 272 <211> 19 <212> PRT <213> Homo sapiens <400> 272 Gly Thr Ile Lys Glu Asn Ile Ile Gly Val Ser Tyr Asp Glu Tyr Arg 1 5 10 15 Tyr Arg Ser <210> 273 <211> 99 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, u, g, unknown or other <400> 273 nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99 <210> 274 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> CDS <222> (1)..(48) <400> 274 att aaa gaa aat atc att ggc ttt gtt tcc tat gat gaa tat aga tac 48 Ile Lys Glu Asn Ile Ile Gly Phe Val Ser Tyr Asp Glu Tyr Arg Tyr 1 5 10 15 <210> 275 <211> 16 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 275 Ile Lys Glu Asn Ile Ile Gly Phe Val Ser Tyr Asp Glu Tyr Arg Tyr 1 5 10 15 <210> 276 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(48) <223> a, c, t, g, unknown or other <400> 276 ccnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnngg 50 <210> 277 <211> 46 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(44) <223> a, c, t, g, unknown or other <400> 277 ccnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnngg 46 <210> 278 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(40) <223> a, c, t, g, unknown or other <400> 278 ccnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gg 42 <210> 279 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(36) <223> a, c, t, g, unknown or other <400> 279 ccnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnngg 38 <210> 280 <211> 34 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(32) <223> a, c, t, g, unknown or other <400> 280 ccnnnnnnnn nnnnnnnnnn nnnnnnnnnn nngg 34 <210> 281 <211> 30 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(28) <223> a, c, t, g, unknown or other <400> 281 ccnnnnnnnn nnnnnnnnnn nnnnnnnngg 30 <210> 282 <211> 26 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(24) <223> a, c, t, g, unknown or other <400> 282 ccnnnnnnnn nnnnnnnnnn nnnngg 26 <210> 283 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(20) <223> a, c, t, g, unknown or other <400> 283 ccnnnnnnnn nnnnnnnnnn gg 22 <210> 284 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(16) <223> a, c, t, g, unknown or other <400> 284 ccnnnnnnnn nnnnnngg 18 <210> 285 <211> 16 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(14) <223> a, c, t, g, unknown or other <400> 285 ccnnnnnnnn nnnngg 16 <210> 286 <211> 15 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(13) <223> a, c, t, g, unknown or other <400> 286 ccnnnnnnnn nnngg 15 <210> 287 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(12) <223> a, c, t, g, unknown or other <400> 287 ccnnnnnnnn nngg 14 <210> 288 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(11) <223> a, c, t, g, unknown or other <400> 288 ccnnnnnnnn ngg 13 <210> 289 <211> 12 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(10) <223> a, c, t, g, unknown or other <400> 289 ccnnnnnnnn gg 12 <210> 290 <211> 11 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(9) <223> a, c, t, g, unknown or other <400> 290 ccnnnnnnng g 11 <210> 291 <211> 10 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(8) <223> a, c, t, g, unknown or other <400> 291 ccnnnnnngg 10 <210> 292 <211> 12 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (3)..(10) <223> a, c, t, g, unknown or other <400> 292 ggnnnnnnnn cc 12 <210> 293 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 293 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcacatc aaccggtggc gcaggtgttt cgtcctttcc 120 acaag 125 <210> 294 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 294 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcacatc aaccggtggc gcaggtgttt cgtcctttcc 120 acaag 125 <210> 295 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 295 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaggaca aagtacaaac ggcggtgttt cgtcctttcc 120 acaag 125 <210> 296 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 296 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaggaca aagtacaaac ggcggtgttt cgtcctttcc 120 acaag 125 <210> 297 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 297 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgtggcgc attgccacga agcggtgttt cgtcctttcc 120 acaag 125 <210> 298 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 298 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aaccgagggc agagtgctgc ttgggtgttt cgtcctttcc 120 acaag 125 <210> 299 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 299 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgagtccg agcagaagaa gaaggtgttt cgtcctttcc 120 acaag 125 <210> 300 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 300 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaggaca aagtacaaac ggcggtgttt cgtcctttcc 120 acaag 125 <210> 301 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 301 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacagcagaa gaagaagggc tccggtgttt cgtcctttcc 120 acaag 125 <210> 302 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 302 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcacatc aaccggtggc gcaggtgttt cgtcctttcc 120 acaag 125 <210> 303 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 303 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacccctggc ccaggtgaag gtgggtgttt cgtcctttcc 120 acaag 125 <210> 304 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 304 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactccctcc ctggcccagg tgaggtgttt cgtcctttcc 120 acaag 125 <210> 305 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 305 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaaccgg aggacaaagt acaggtgttt cgtcctttcc 120 acaag 125 <210> 306 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 306 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacaggtgaa ggtgtggttc cagggtgttt cgtcctttcc 120 acaag 125 <210> 307 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 307 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacggtgaag gtgtggttcc agaggtgttt cgtcctttcc 120 acaag 125 <210> 308 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 308 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaaccgg aggacaaagt acaggtgttt cgtcctttcc 120 acaag 125 <210> 309 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 309 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacccctggc ccaggtgaag gtgggtgttt cgtcctttcc 120 acaag 125 <210> 310 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 310 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacaggtgaa ggtgtggttc cagggtgttt cgtcctttcc 120 acaag 125 <210> 311 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 311 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaggaca aagtacaaac ggcggtgttt cgtcctttcc 120 acaag 125 <210> 312 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 312 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgggaggg aggggcacag atgggtgttt cgtcctttcc 120 acaag 125 <210> 313 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 313 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aaccaccttc acctgggcca gggggtgttt cgtcctttcc 120 acaag 125 <210> 314 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 314 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacaccctag tcattggagg tgaggtgttt cgtcctttcc 120 acaag 125 <210> 315 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 315 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aaccagagca gccactgggg cctggtgttt cgtcctttcc 120 acaag 125 <210> 316 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 316 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aaccaccttc acctgggcca gggggtgttt cgtcctttcc 120 acaag 125 <210> 317 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 317 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacccccatt ggcctgcttc gtgggtgttt cgtcctttcc 120 acaag 125 <210> 318 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 318 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacattggcc tgcttcgtgg caaggtgttt cgtcctttcc 120 acaag 125 <210> 319 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 319 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcctcct ccagcttctg ccgggtgttt cgtcctttcc 120 acaag 125 <210> 320 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 320 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aaccctccag cttctgccgt ttgggtgttt cgtcctttcc 120 acaag 125 <210> 321 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 321 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacattggcc tgcttcgtgg caaggtgttt cgtcctttcc 120 acaag 125 <210> 322 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 322 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgcagcaa gcagcactct gccggtgttt cgtcctttcc 120 acaag 125 <210> 323 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 323 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacttcttct tctgctcgga ctcggtgttt cgtcctttcc 120 acaag 125 <210> 324 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 324 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacaccggag gacaaagtac aaaggtgttt cgtcctttcc 120 acaag 125 <210> 325 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 325 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcttctt ctgctcggac tcaggtgttt cgtcctttcc 120 acaag 125 <210> 326 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 326 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgttgatg tgatgggagc cctggtgttt cgtcctttcc 120 acaag 125 <210> 327 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 327 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgggccag ggagggaggg gcaggtgttt cgtcctttcc 120 acaag 125 <210> 328 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 328 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgggaggg aggggcacag atgggtgttt cgtcctttcc 120 acaag 125 <210> 329 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 329 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacccggttc tggaaccaca cctggtgttt cgtcctttcc 120 acaag 125 <210> 330 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 330 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcacctg ggccagggag ggaggtgttt cgtcctttcc 120 acaag 125 <210> 331 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 331 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aactcacctg ggccagggag ggaggtgttt cgtcctttcc 120 acaag 125 <210> 332 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 332 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgttctgg aaccacacct tcaggtgttt cgtcctttcc 120 acaag 125 <210> 333 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 333 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgggaggg aggggcacag atgggtgttt cgtcctttcc 120 acaag 125 <210> 334 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 334 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgggccag ggagggaggg gcaggtgttt cgtcctttcc 120 acaag 125 <210> 335 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 335 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgttctgg aaccacacct tcaggtgttt cgtcctttcc 120 acaag 125 <210> 336 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 336 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacaggtgaa ggtgtggttc cagggtgttt cgtcctttcc 120 acaag 125 <210> 337 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 337 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgaaccgg aggacaaagt acaggtgttt cgtcctttcc 120 acaag 125 <210> 338 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 338 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aaccaaaccc acgagggcag agtggtgttt cgtcctttcc 120 acaag 125 <210> 339 <211> 125 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 339 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60 cttgctattt ctagctctaa aacgagtttc tcatctgtgc cccggtgttt cgtcctttcc 120 acaag 125 <210> 340 <211> 684 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(123) <220> <221> CDS <222> (127)..(159) <220> <221> CDS <222> (163)..(399) <220> <221> CDS <222> (403)..(684) <400> 340 aaa acc acc ctt ctc tct ggc cca ctg tgt cct ctt cct gcc ctg cca 48 Lys Thr Thr Leu Leu Ser Gly Pro Leu Cys Pro Leu Pro Ala Leu Pro 1 5 10 15 tcc cct tct gtg aat gtt aga ccc atg gga gca gct ggt cag agg gga 96 Ser Pro Ser Val Asn Val Arg Pro Met Gly Ala Ala Gly Gln Arg Gly 20 25 30 ccc cgg cct ggg gcc cct aac cct atg tag cct cag tct tcc cat cag 144 Pro Arg Pro Gly Ala Pro Asn Pro Met Pro Gln Ser Ser His Gln 35 40 45 gct ctc agc tca gcc tga gtg ttg agg ccc cag tgg ctg ctc tgg ggg 192 Ala Leu Ser Ser Ala Val Leu Arg Pro Gln Trp Leu Leu Trp Gly 50 55 60 cct cct gag ttt ctc atc tgt gcc cct ccc tcc ctg gcc cag gtg aag 240 Pro Pro Glu Phe Leu Ile Cys Ala Pro Pro Ser Leu Ala Gln Val Lys 65 70 75 gtg tgg ttc cag aac cgg agg aca aag tac aaa cgg cag aag ctg gag 288 Val Trp Phe Gln Asn Arg Arg Thr Lys Tyr Lys Arg Gln Lys Leu Glu 80 85 90 gag gaa ggg cct gag tcc gag cag aag aag aag ggc tcc cat cac atc 336 Glu Glu Gly Pro Glu Ser Glu Gln Lys Lys Lys Gly Ser His His Ile 95 100 105 110 aac cgg tgg cgc att gcc acg aag cag gcc aat ggg gag gac atc gat 384 Asn Arg Trp Arg Ile Ala Thr Lys Gln Ala Asn Gly Glu Asp Ile Asp 115 120 125 gtc acc tcc aat gac tag ggt ggg caa cca caa acc cac gag ggc aga 432 Val Thr Ser Asn Asp Gly Gly Gln Pro Gln Thr His Glu Gly Arg 130 135 140 gtg ctg ctt gct gct ggc cag gcc cct gcg tgg gcc caa gct gga ctc 480 Val Leu Leu Ala Ala Gly Gln Ala Pro Ala Trp Ala Gln Ala Gly Leu 145 150 155 tgg cca ctc cct ggc cag gct ttg ggg agg cct gga gtc atg gcc cca 528 Trp Pro Leu Pro Gly Gln Ala Leu Gly Arg Pro Gly Val Met Ala Pro 160 165 170 cag ggc ttg aag ccc ggg gcc gcc att gac aga ggg aca agc aat ggg 576 Gln Gly Leu Lys Pro Gly Ala Ala Ile Asp Arg Gly Thr Ser Asn Gly 175 180 185 ctg gct gag gcc tgg gac cac ttg gcc ttc tcc tcg gag agc ctg cct 624 Leu Ala Glu Ala Trp Asp His Leu Ala Phe Ser Ser Glu Ser Leu Pro 190 195 200 205 gcc tgg gcg ggc ccg ccc gcc acc gca gcc tcc cag ctg ctc tcc gtg 672 Ala Trp Ala Gly Pro Pro Ala Thr Ala Ala Ser Gln Leu Leu Ser Val 210 215 220 tct cca atc tcc 684 Ser Pro Ile Ser 225 <210> 341 <211> 41 <212> PRT <213> Homo sapiens <400> 341 Lys Thr Thr Leu Leu Ser Gly Pro Leu Cys Pro Leu Pro Ala Leu Pro 1 5 10 15 Ser Pro Ser Val Asn Val Arg Pro Met Gly Ala Ala Gly Gln Arg Gly 20 25 30 Pro Arg Pro Gly Ala Pro Asn Pro Met 35 40 <210> 342 <211> 11 <212> PRT <213> Homo sapiens <400> 342 Pro Gln Ser Ser His Gln Ala Leu Ser Ser Ala 1 5 10 <210> 343 <211> 79 <212> PRT <213> Homo sapiens <400> 343 Val Leu Arg Pro Gln Trp Leu Leu Trp Gly Pro Pro Glu Phe Leu Ile 1 5 10 15 Cys Ala Pro Pro Ser Leu Ala Gln Val Lys Val Trp Phe Gln Asn Arg 20 25 30 Arg Thr Lys Tyr Lys Arg Gln Lys Leu Glu Glu Glu Gly Pro Glu Ser 35 40 45 Glu Gln Lys Lys Lys Gly Ser His His Ile Asn Arg Trp Arg Ile Ala 50 55 60 Thr Lys Gln Ala Asn Gly Glu Asp Ile Asp Val Thr Ser Asn Asp 65 70 75 <210> 344 <211> 94 <212> PRT <213> Homo sapiens <400> 344 Gly Gly Gln Pro Gln Thr His Glu Gly Arg Val Leu Leu Ala Ala Gly 1 5 10 15 Gln Ala Pro Ala Trp Ala Gln Ala Gly Leu Trp Pro Leu Pro Gly Gln 20 25 30 Ala Leu Gly Arg Pro Gly Val Met Ala Pro Gln Gly Leu Lys Pro Gly 35 40 45 Ala Ala Ile Asp Arg Gly Thr Ser Asn Gly Leu Ala Glu Ala Trp Asp 50 55 60 His Leu Ala Phe Ser Ser Glu Ser Leu Pro Ala Trp Ala Gly Pro Pro 65 70 75 80 Ala Thr Ala Ala Ser Gln Leu Leu Ser Val Ser Pro Ile Ser 85 90 <210> 345 <211> 57 <212> DNA <213> Homo sapiens <400> 345 aagctggagg aggaagggcc tgagtccgag cagaagaaga agggctccca tcacatc 57 <210> 346 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 346 gaguccgagc agaagaagaa guuuuaga 28 <210> 347 <211> 38 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 347 ggaagggccu gaguccgagc agaagaagaa guuuuaga 38 <210> 348 <211> 38 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 348 ggccuccaag gaguccgagc agaagaagaa guuuuaga 38 <210> 349 <211> 77 <212> DNA <213> Homo sapiens <400> 349 agaagaaggg ctcccatcac atcaaccggt ggcgcattgc cacgaagcag gccaatgggg 60 aggacatcga tgtcacc 77 <210> 350 <211> 120 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 350 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 <210> 351 <211> 30 <212> DNA <213> Homo sapiens <400> 351 agaagaaggg ctcccatcat cgatgtcacc 30 <210> 352 <211> 41 <212> DNA <213> Homo sapiens <400> 352 agaagaaggg ctcccatcac agggaggaca tcgatgtcac c 41 <210> 353 <211> 41 <212> DNA <213> Homo sapiens <400> 353 agaagaaggg ctcccatcac atcaaccggt gggatgtcac c 41 <210> 354 <211> 69 <212> DNA <213> Homo sapiens <400> 354 agaagaaggg ctcccatcac atcaaccggt ggcgcattgc cacgaagcag gccaatgatc 60 gatgtcacc 69 <210> 355 <211> 72 <212> DNA <213> Homo sapiens <400> 355 agaagaaggg ctcccatcac atcaaccggt ggcgccacga agcaggccaa tggggaggac 60 atcgatgtca cc 72 <210> 356 <211> 74 <212> DNA <213> Homo sapiens <400> 356 agaagaaggg ctcccatctc aaccggtggc gcattgccac gaagcaggcc aatggggagg 60 acatcgatgt cacc 74 <210> 357 <211> 74 <212> DNA <213> Homo sapiens <400> 357 agaagaaggg ctcccatcac atcaaccggt ggcgcattgc cacgaagcag gccggggagg 60 acatcgatgt cacc 74 <210> 358 <211> 71 <212> DNA <213> Homo sapiens <400> 358 accggaggac aaagtacaaa cggcagaagc tggaggagga agggcctgag tccgagcaga 60 agaagaaggg c 71 <210> 359 <211> 23 <212> DNA <213> Homo sapiens <400> 359 gaggccgagc agaagaaaga cgg 23 <210> 360 <211> 23 <212> DNA <213> Homo sapiens <400> 360 aagtctgagc acaagaagaa tgg 23 <210> 361 <211> 23 <212> DNA <213> Homo sapiens <400> 361 gagtcctagc aggagaagaa gag 23 <210> 362 <211> 23 <212> DNA <213> Homo sapiens <400> 362 gagtctaagc agaagaagaa gag 23 <210> 363 <211> 23 <212> DNA <213> Homo sapiens <400> 363 gagttagagc agaagaagaa agg 23 <210> 364 <211> 64 <212> DNA <213> Homo sapiens <400> 364 ccaatgggga ggacatcgat gtcacctcca atgactaggg tgggcaacca caaacccacg 60 aggg 64 <210> 365 <211> 64 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 365 ccctcgtggg tttgtggttg cccaccgcta gcaagcttgt cattggaggt gacatcgatg 60 tcct 64 <210> 366 <211> 63 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> CDS <222> (1)..(63) <400> 366 att gcc acg aag cag gcc aat ggg gag gac atc gat gtc acc tcc aat 48 Ile Ala Thr Lys Gln Ala Asn Gly Glu Asp Ile Asp Val Thr Ser Asn 1 5 10 15 gac tac tac cca tac 63 Asp Tyr Tyr Pro Tyr 20 <210> 367 <211> 21 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 367 Ile Ala Thr Lys Gln Ala Asn Gly Glu Asp Ile Asp Val Thr Ser Asn 1 5 10 15 Asp Tyr Tyr Pro Tyr 20 <210> 368 <211> 63 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 368 ggacctgtaa agcaggccaa tggggaggac atcgatgtca cctccaatga ctagggtggg 60 caa 63 <210> 369 <211> 70 <212> DNA <213> Mus musculus <400> 369 gatgacccca ccttgcctga aggttggaca cgaaagctta aacaaaggaa gtctggccga 60 tctgctggaa 70 <210> 370 <211> 59 <212> DNA <213> Mus musculus <400> 370 gatgacccca ccttgcctga aggttggaca cgaaagctta aacaaaggat ctgctggaa 59 <210> 371 <211> 56 <212> DNA <213> Mus musculus <400> 371 gatgacccct tgcctgaagg ttggacacga aagcttaaac aaaggatctg ctggaa 56 <210> 372 <211> 54 <212> DNA <213> Mus musculus <400> 372 gatgacccca cctgaaggtt ggacacgaaa gcttaaacaa aggatctgct ggaa 54 <210> 373 <211> 44 <212> DNA <213> Mus musculus <400> 373 gatgacccca ccttgcctga aggtgtctgg ccgatctgct ggaa 44 <210> 374 <211> 65 <212> DNA <213> Mus musculus <400> 374 gatgacccca cctgaaggtt ggacacgaaa gcttaaacaa aggaagtctg gccgatctgc 60 tggaa 65 <210> 375 <211> 64 <212> DNA <213> Mus musculus <400> 375 gatgacccac ctgaaggttg gacacgaaag cttaaacaaa ggaagtctgg ccgatctgct 60 ggaa 64 <210> 376 <211> 67 <212> DNA <213> Mus musculus <400> 376 gatgacccct tgcctgaagg ttggacacga aagcttaaac aaaggaagtc tggccgatct 60 gctggaa 67 <210> 377 <211> 67 <212> DNA <213> Mus musculus <400> 377 gatgacccca tgcctgaagg ttggacacga aagcttaaac aaaggaagtc tggccgatct 60 gctggaa 67 <210> 378 <211> 67 <212> DNA <213> Mus musculus <400> 378 gatgacccct tgcctgaagg ttggacacga aagcttaaac aaaggaagtc tggccgatct 60 gctggaa 67 <210> 379 <211> 67 <212> DNA <213> Mus musculus <400> 379 gatgacccca ccttgcctga aggttggaca cgaaagctta aacaaaggtc tggccgatct 60 gctggaa 67 <210> 380 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 380 tgcgccaccg gttgatgtga tgg 23 <210> 381 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 381 actctgccct cgtgggtttg tgg 23 <210> 382 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 382 caaacggcag aagctggagg agg 23 <210> 383 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 383 aggccccagt ggctgctctg ggg 23 <210> 384 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 384 tgaaggtgtg gttccagaac cgg 23 <210> 385 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 385 gccgtttgta ctttgtcctc cgg 23 <210> 386 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 386 tcacctgggc cagggaggga ggg 23 <210> 387 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 387 ggggcacaga tgagaaactc agg 23 <210> 388 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 388 tcacctgggc cagggaggga ggg 23 <210> 389 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 389 ggggcacaca tgagaaactc agg 23 <210> 390 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 390 atctggtcag aatatgataa agg 23 <210> 391 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 391 gtcactgtac tgatgtgaat tgg 23 <210> 392 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 392 catctgaagg ccagcagcat tgg 23 <210> 393 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 393 tgataaggca gaaacctgtt tgg 23 <210> 394 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 394 gaagataagt gaggtttaaa agg 23 <210> 395 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 395 gtatcatttg acatatctaa tgg 23 <210> 396 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 396 cagcatggaa tgaaaatgac cgg 23 <210> 397 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 397 gcagcatgga atgaaaatga cgg 23 <210> 398 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 398 gtgcaagccg aacagatgaa agg 23 <210> 399 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 399 ggagtatcag aaatgactat tgg 23 <210> 400 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 400 ggtcactgta ctgatgtgaa tgg 23 <210> 401 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 401 tcactgtact gatgtgaatg ggg 23 <210> 402 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 402 gttccttaaa taagaacttt agg 23 <210> 403 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 403 tcctacaaga agataagtga agg 23 <210> 404 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 404 tatcatttga catatctaat tgg 23 <210> 405 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 405 aacttttcta actacaaaca agg 23 <210> 406 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 406 ccaacaccaa ccagaacttg ggg 23 <210> 407 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 407 acagcaatgc caatgctggg ggg 23 <210> 408 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 408 gtggaaatca tctttctcgt tgg 23 <210> 409 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 409 tctgctgcct gacacggcca agg 23 <210> 410 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 410 cgagctctgc tgcctgacac cgg 23 <210> 411 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 411 tccttgatgg ccacctcgtc cgg 23 <210> 412 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 412 atgacagcaa tgccaatgct tgg 23 <210> 413 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 413 agcaatgcca atgctggggg ggg 23 <210> 414 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 414 gccaacacca accagaactt tgg 23 <210> 415 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 415 ggagaacagc actccgctct tgg 23 <210> 416 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 416 tgacagcaat gccaatgctg ggg 23 <210> 417 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 417 ccggccaaga ccttgaagcc agg 23 <210> 418 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 418 tattacagaa tgagagactg tgg 23 <210> 419 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 419 aaaagaccta aacaaaagaa tgg 23 <210> 420 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 420 tcagagcttc ctgacaccca tgg 23 <210> 421 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 421 gagaacagca ctccgctctg ggg 23 <210> 422 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 422 ctgcctgaca cggccaggac cgg 23 <210> 423 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 423 gagtccgagc agaagaagaa ggg 23 <210> 424 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 424 cacgaagcag gccaatgggg agg 23 <210> 425 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 425 ggagcccttc ttcttctgct cgg 23 <210> 426 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 426 ggcagagtgc tgcttgctgc tgg 23 <210> 427 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 427 ttgccacgaa gcaggccaat ggg 23 <210> 428 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 428 aggtgtggtt ccagaaccgg agg 23 <210> 429 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 429 cggcagaagc tggaggagga agg 23 <210> 430 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 430 agggctccca tcacatcaac cgg 23 <210> 431 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 431 tgagtccgag cagaagaaga agg 23 <210> 432 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 432 tcacctccaa tgactagggt ggg 23 <210> 433 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 433 aacctcactt atcttcttgt agg 23 <210> 434 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 434 ctcacttatc ttcttgtagg agg 23 <210> 435 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 435 ccatgctgct ggccttcaga tgg 23 <210> 436 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 436 gccaaacata agtgaccaac agg 23 <210> 437 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 437 tgtcaaatga tacaaacatt agg 23 <210> 438 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 438 gctgctggcc ttcagatggc tgg 23 <210> 439 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 439 tcagcaacct ctaactaacc agg 23 <210> 440 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 440 tcattttcat tccatgctgc tgg 23 <210> 441 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 441 catgcaaacc ttcatctgtt cgg 23 <210> 442 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 442 ctggtagatg gagttgggtt tgg 23 <210> 443 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 443 agtgctgttc tcccaagttc tgg 23 <210> 444 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 444 ggcattgctg tcatcctcgt ggg 23 <210> 445 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 445 tcccaagttc tggttggtgt tgg 23 <210> 446 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 446 ttggccgtcc tggccgtgtc agg 23 <210> 447 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 447 ttccgacgag gtggccatca agg 23 <210> 448 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 448 tggcattgct gtcatcctcg tgg 23 <210> 449 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 449 cctcgtgggc acttccgacg agg 23 <210> 450 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 450 ctggttgtag gatttgagtt agg 23 <210> 451 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 451 ttatttctga agaatattaa agg 23 <210> 452 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 452 tgtgtgagga taaaagagtt ggg 23 <210> 453 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 453 aatacctagt tacaggcatt tgg 23 <210> 454 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 454 cagaagagcc cccccagcat tgg 23 <210> 455 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 455 cgtgggcact tccgacgagg tgg 23 <210> 456 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 456 tgatttccac catctctccg tgg 23 <210> 457 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 457 tgaccggaag atccaggggg tgg 23 <210> 458 <211> 32 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 458 ggaagggcct gagtccgagc agaagaagag gg 32 <210> 459 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 459 ggcctccaag gagtccgagc agaagaagaa ggg 33 <210> 460 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 460 gacatcgatg tcctccccat tgg 23 <210> 461 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 461 gtcacctcca atgactaggg tgg 23 <210> 462 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 462 gggcaaccac aaacccacga ggg 23 <210> 463 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 463 caagcagcac tctgccctcg tgg 23 <210> 464 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 464 ttcttcttct gctcggactc agg 23 <210> 465 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 465 ctccccattg gcctgcttcg agg 23 <210> 466 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 466 gaacttacct ggttagttag agg 23 <210> 467 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 467 ggtgatgatg ctctttgggt cgg 23 <210> 468 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 468 tctgtgatct catgtctgac cgg 23 <210> 469 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 469 cagcaatgcc aatgctgggg ggg 23 <210> 470 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 470 tttctcgtgg gcatccttga tgg 23 <210> 471 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 471 ggagaacagc actccgctct ggg 23 <210> 472 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 472 ctggttggtg ttggccgtcc tgg 23 <210> 473 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 473 gtccaacctt caggcaaggt ggg 23 <210> 474 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 474 gcgctgtttg ggggaagccg agg 23 <210> 475 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 475 gggtgggggg agtttgctcc tgg 23 <210> 476 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 476 gaccccctcc accccgcctc cgg 23 <210> 477 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 477 aagcttaaac aaaggaagtc tgg 23 <210> 478 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 478 ggctccatta tccgtgaccg ggg 23 <210> 479 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 479 tccctcttta gccagagccg ggg 23 <210> 480 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 480 gaaacttttc gtccaacttc tgg 23

Claims

세포 내 관심 있는 게놈상 유전자 좌에서 DNA 듀플렉스의 반대 가닥들에 존재하는 제1 및 제2 표적 서열을 조작하여 탈 표적 변형을 최소화함으로써 유기체 또는 인간 이외의 유기체를 변형하는 방법으로서, 다음과 같은 것들을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함하는 방법:
I. 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 이 제1 폴리뉴클레오티드 서열은
(a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열;
(b) 제1 tracr 메이트 서열; 및
(c) 제1 tracr 서열
을 포함하는 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열,
II. 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열로서, 이 제2 폴리뉴클레오티드 서열은
(a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열;
(b) 제2 tracr 메이트 서열; 및
(c) 제2 tracr 서열
을 포함하는 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열, 그리고
III. 1 개 이상의 핵 국소화 서열을 포함하고, CRISPR 효소에 돌연변이 1 개 이상이 포함되도록, CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열
(여기서, 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고,
전사가 진행될 때 제1 및 제2 tracr 메이트 서열은 각각 제1 및 제2 tracr 서열에 혼성화되고, 제1 및 제2 가이드 서열은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며,
제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고,
제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며,
CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고,
제1 가이드 서열은 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하며, 제2 가이드 서열은 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하여 이중 가닥의 파괴를 유도하고, 이로 말미암아 탈 표적 변형들은 최소화되어 유기체 또는 인간 이외의 유기체의 변형이 초래됨).
제1항에 있어서, 상기 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부를 생성하는 방법.
제2항에 있어서, 상기 5' 돌출부는 200 개 이하의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 100 개 이하의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 50 개 이하의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 26 개 이상의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 30 개 이상의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 34 개 내지 50 개의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 15 개 이상의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 10 개 이상의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 1 개 이상의 염기쌍으로 이루어진 방법.
제2항에 있어서, 상기 5' 돌출부는 1 개 내지 34 개의 염기쌍으로 이루어진 방법.
제1항에 있어서, 상기 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 상기 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 평활 절단부를 생성하는 방법.
제1항에 있어서, 상기 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 상기 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 3' 돌출부를 생성하는 방법.
제14항에 있어서, 상기 3' 돌출부는 150 개 이하의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 100 개 이하의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 50 개 이하의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 25 개 이하의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 15 개 이상의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 10 개 이상의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 1 개 이상의 염기쌍으로 이루어진 방법.
제14항에 있어서, 상기 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어진 방법.
제1항에 있어서, 상기 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA인 방법.
제1항에 있어서, 상기 CRISPR 효소를 암호화하는 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열을 포함하는 폴리뉴클레오티드는 RNA이고, 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달되는 방법.
제1항에 있어서, 상기 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하는 방법.
제1항에 있어서, 상기 제1 및 제2 tracr 서열은 100% 동일성을 공유하는 방법.
제1항에 있어서, 상기 CRISPR 효소는 Cas9 효소인 방법.
제27항에 있어서, 상기 CRISPR 효소는 SpCas9인 방법.
제28항에 있어서, 상기 CRISPR 효소는 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 방법.
제29항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 방법.
제30항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 방법.
제31항에 있어서, 상기 CRISPR 효소는 D10A 돌연변이를 가지는 방법.
제29항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 방법.
제33항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 방법.
제34항에 있어서, 상기 CRISPR 효소는 H840A 돌연변이를 가지는 방법.
세포 내 관심 있는 게놈상 유전자 좌에서 DNA 듀플렉스의 반대 가닥들에 존재하는 제1 및 제2 표적 서열을 조작하여 탈 표적 변형을 최소화함으로써 유기체 또는 인간 이외의 유기체를 변형하는 방법으로서, 다음과 같은 것들을 포함하는 벡터 1 개 이상을 포함하는 벡터 시스템을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함하는 방법:
I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과
(b) tracr 메이트 서열 1 개 이상
에 작동 가능하도록 결합하고 있는 제1 조절 요소,
II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과
(b) tracr 메이트 서열 1 개 이상
에 작동 가능하도록 결합하고 있는 제2 조절 요소,
III. CRISPR 효소를 암호화하는 효소 암호화 서열에 작동 가능하도록 결합하고 있는 제3 조절 요소, 그리고
IV. tracr 서열에 작동 가능하도록 결합하고 있는 제4 조절 요소
(여기서 구성성분 I, II, III 및 IV는 시스템의 동일하거나 상이한 벡터들 상에 위치하고,
전사가 진행될 때 tracr 메이트 서열은 tracr 서열에 혼성화되며, 제1 및 제2 가이드 서열들은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며;
제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고;
제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며;
CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고;
상기 제1 가이드 서열은 제1 표적 서열 근처에 있는 DNA 듀플렉스의 하나의 가닥의 절단을 지시하고, 제2 가이드 서열은 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하여 이중 가닥 파괴를 유도함으로써, 탈 표적 변형들이 최소화되어 유기체 또는 인간 이외의 유기체가 변형됨).
제36항에 있어서, 상기 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 상기 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부를 생성하는 방법.
제37항에 있어서, 상기 5' 돌출부는 200 개 이하의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 100 개 이하의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 50 개 이하의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 26 개 이상의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 30 개 이상의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 34 개 내지 50 개의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 15 개 이상의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 10 개 이상의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 1 개 이상의 염기쌍으로 이루어진 방법.
제37항에 있어서, 상기 5' 돌출부는 1 개 내지 34 개의 염기쌍으로 이루어진 방법.
제36항에 있어서, 상기 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 상기 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 평활 절단부를 생성하는 방법.
제36항에 있어서, 상기 제1 표적 서열 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 상기 제2 표적 서열 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 3' 돌출부를 생성하는 방법.
제49항에 있어서, 상기 3' 돌출부는 150 개 이하의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 100 개 이하의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 50 개 이하의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 25 개 이하의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 15 개 이상의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 10 개 이상의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 1 개 이상의 염기쌍으로 이루어진 방법.
제49항에 있어서, 상기 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어진 방법.
제36항에 있어서, 상기 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA인 방법.
제36항에 있어서, 상기 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하는 방법.
제36항에 있어서, 상기 제1 및 제2 tracr 서열은 100% 동일성을 공유하는 방법.
제36항에 있어서, 상기 CRISPR 효소는 Cas9 효소인 방법.
제61항에 있어서, 상기 CRISPR 효소는 SpCas9인 방법.
제62항에 있어서, 상기 CRISPR 효소는 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 방법.
제63항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 방법.
제64항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 방법.
제65항에 있어서, 상기 CRISPR 효소는 D10A 돌연변이를 가지는 방법.
제63항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 방법.
제67항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 방법.
제68항에 있어서, 상기 CRISPR 효소는 H840A 돌연변이를 가지는 방법.
제36항에 있어서, 상기 바이러스 벡터들 중 1 개 이상은 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통하여 전달되는 방법.
유전자 산물을 암호화하는 이중 가닥 DNA 분자를 포함하고, 이 이중 가닥 DNA 분자를 발현하는 세포에, DNA 분자의 제1 가닥 및 제2 가닥을 표적화하는 가이드 RNA 2 개와, 1 개 이상의 돌연변이를 가지는 Cas 단백질을 포함하는 조작된 비 천연 발생 CRISPR-Cas 시스템을 도입하여, 이 가이드 RNA들이 유전자 산물을 암호화하는 DNA 분자를 표적화하고, Cas 단백질은 이 유전자 산물을 암호화하는 DNA 분자의 제1 가닥 및 제2 가닥에 각각 닉을 형성하며, 이로 말미암아 유전자 산물의 발현이 변경되도록 만듦으로써, 탈 표적 변형들을 최소화하여 관심 있는 게놈상 유전자 좌를 변형하는 방법으로서, 상기 Cas 단백질과 상기 가이드 RNA 2 개는 함께 천연 발생하지 않는 방법.
제71항에 있어서, 상기 유전자 산물을 암호화하는 DNA 분자의 제1 가닥 및 제2 가닥 각각에 닉을 형성하는 Cas 단백질은 5' 돌출부를 생성하는 방법.
제71항에 있어서, 상기 5' 돌출부는 200 개 이하의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 100 개 이하의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 50 개 이하의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 26 개 이상의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 30 개 이상의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 34 개 내지 50 개의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 15 개 이상의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 10 개 이상의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 1 개 이상의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 5' 돌출부는 1 개 내지 34 개의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 유전자 산물을 암호화하는 DNA 분자의 제1 가닥 및 제2 가닥 각각에 닉을 형성하는 Cas 단백질은 평활 절단부를 생성하는 방법.
제71항에 있어서, 상기 유전자 산물을 암호화하는 DNA 분자의 제1 가닥 및 제2 가닥 각각에 닉을 형성하는 Cas 단백질은 3' 돌출부를 생성하는 방법.
제84항에 있어서, 상기 3' 돌출부는 150 개 이하의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 100 개 이하의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 50 개 이하의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 25 개 이하의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 15 개 이상의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 10 개 이상의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 1 개 이상의 염기쌍으로 이루어진 방법.
제84항에 있어서, 상기 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어진 방법.
제71항에 있어서, 상기 가이드 RNA들은 tracr 메이트 서열과 tracr 서열에 융합된 가이드 서열을 포함하는 방법.
제71항에 있어서, 상기 Cas 단백질은 진핵 세포 내 발현에 최적화된 코돈인 방법.
제94항에 있어서, 상기 진핵 세포는 포유류 세포인 방법.
제95항에 있어서, 상기 포유류 세포는 인간 세포인 방법.
제71항에 있어서, 상기 Cas 단백질은 타입 II CRISPR-Cas 단백질인 방법.
제97항에 있어서, 상기 Cas 단백질은 Cas9 단백질인 방법.
제98항에 있어서, 상기 Cas 단백질은 SpCas9인 방법.
제99항에 있어서, 상기 Cas 단백질은 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 방법.
제100항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 방법.
제101항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 방법.
제102항에 있어서, 상기 Cas 단백질은 D10A 돌연변이를 가지는 방법.
제100항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 방법.
제104항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 방법.
제105항에 있어서, 상기 Cas 단백질은 H840A 돌연변이를 가지는 방법.
제71항에 있어서, 상기 유전자 산물의 발현은 감소하는 방법.
제71항에 있어서, 상기 주형 폴리뉴클레오티드는 유전자 산물을 암호화하는 DNA 분자에 추가로 도입되거나, 개입 서열은 정밀하게 절제됨으로써 5' 돌출부가 다시 어닐링되어 결찰되도록 하는 방법.
제71항에 있어서, 상기 유전자 산물의 발현은 증가하거나, 또는 상기 유전자 산물의 활성 또는 기능은 변경되는 방법.
제71항에 있어서, 상기 유전자 산물은 단백질인 방법.
1 개 이상의 돌연변이를 가지는 Cas 단백질과, 세포 내에서 유전자 산물을 암호화하는 이중 가닥 DNA 분자의 제1 가닥 및 제2 가닥을 각각 표적화하는 가이드 RNA 2 개를 포함함으로 말미암아, 상기 가이드 RNA들이 유전자 산물을 암호화하는 DNA 분자를 표적화하고, 상기 Cas 단백질은 이 유전자 산물을 암호화하는 DNA 분자의 제1 가닥 및 제2 가닥에 각각 닉을 형성하며, 이로써 유전자 산물의 발현이 변경되도록 만드는, 조작된 비 천연 발생 CRISPR-Cas 시스템으로서; 여기서 상기 Cas 단백질 및 가이드 RNA 2 개는 함께 천연 발생하지 않는 조작된 비 천연 발생 CRISPR-Cas 시스템.
제111항에 있어서, 상기 가이드 RNA들은 tracr 메이트 서열과 tracr 서열에 융합된 가이드 서열을 포함하는 CRISPR-Cas 시스템.
제111항에 있어서, 상기 Cas 단백질은 타입 II CRISPR-Cas 단백질인 CRISPR-Cas 시스템.
제113항에 있어서, 상기 Cas 단백질은 Cas9 단백질인 CRISPR-Cas 시스템.
제114항에 있어서, 상기 Cas 단백질은 SpCas9인 CRISPR-Cas 시스템.
제115항에 있어서, 상기 Cas 단백질은 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 CRISPR-Cas 시스템.
제116항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 CRISPR-Cas 시스템.
제117항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 CRISPR-Cas 시스템.
제118항에 있어서, 상기 Cas 단백질은 D10A 돌연변이를 가지는 CRISPR-Cas 시스템.
제116항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 CRISPR-Cas 시스템.
제120항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 CRISPR-Cas 시스템.
제121항에 있어서, 상기 Cas 단백질은 H840A 돌연변이를 가지는 CRISPR-Cas 시스템.
제111항에 있어서, 상기 Cas 단백질은 진핵 세포 내 발현에 최적화된 코돈인 CRISPR-Cas 시스템.
제123항에 있어서, 상기 진핵 세포는 포유류 세포인 CRISPR-Cas 시스템.
제124항에 있어서, 상기 포유류 세포는 인간 세포인 CRISPR-Cas 시스템.
제111항에 있어서, 상기 유전자 산물의 발현은 감소하는 CRISPR-Cas 시스템.
제111항에 있어서, 상기 주형 폴리뉴클레오티드는 유전자 산물을 암호화하는 DNA 분자에 추가로 도입되거나, 개입 서열은 정밀하게 절제되어 5' 돌출부 또는 3' 돌출부가 다시 어닐링되어 결찰되는 CRISPR-Cas 시스템.
제111항에 있어서, 상기 유전자 산물의 발현은 증가하거나, 또는 상기 유전자 산물의 활성 또는 기능은 변경되는 CRISPR-Cas 시스템.
제111항에 있어서, 상기 유전자 산물은 단백질인 CRISPR-Cas 시스템.
(a) 유전자 산물을 암호화하는 이중 가닥 DNA 분자의 제1 가닥 및 제2 가닥을 각각 표적화하는, 2 개의 CRISPR-Cas 시스템 가이드 RNA들 각각에 작동 가능하도록 결합하고 있는 제1 조절 요소,
(b) Cas 단백질에 작동 가능하도록 결합하고 있는 제2 조절 요소
[단, 상기 구성성분 (a) 및 (b)는 상기 시스템의 동일하거나 상이한 벡터들 상에 위치함]
를 포함하는 벡터 1 개 이상을 포함함으로 말미암아, 상기 가이드 RNA들이 유전자 산물을 암호화하는 DNA 분자를 표적화하고, Cas 단백질은 이 유전자 산물을 암호화하는 DNA 분자의 제1 가닥 및 제2 가닥에 각각 닉을 형성하며, 이로써 유전자 산물의 발현이 변경되도록 만들고, Cas 단백질 및 2 개의 가이드 RNA는 함께 비자연적으로 생기지 않는, 조작된 비 천연 발생 벡터 시스템.
제130항에 있어서, 상기 가이드 RNA들은 tracr 메이트 서열 및 tracr 서열에 융합된 가이드 서열을 포함하는 벡터 시스템.
제130항에 있어서, 상기 Cas 단백질은 타입 II CRISPR-Cas 단백질인 벡터 시스템.
제132항에 있어서, 상기 Cas 단백질은 Cas9 단백질인 벡터 시스템.
제133항에 있어서, 상기 Cas 단백질은 SpCas9인 벡터 시스템.
제134항에 있어서, 상기 Cas 단백질은 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 벡터 시스템.
제135항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 벡터 시스템.
제136항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 벡터 시스템.
제137항에 있어서, 상기 Cas 단백질은 D10A 돌연변이를 가지는 벡터 시스템.
제135항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 벡터 시스템.
제139항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 벡터 시스템.
제140항에 있어서, 상기 Cas 단백질은 H840A 돌연변이를 가지는 벡터 시스템.
제130항에 있어서, 상기 Cas 단백질은 진핵 세포 내 발현에 최적화된 코돈인 벡터 시스템.
제142항에 있어서, 상기 진핵 세포는 포유류 세포인 벡터 시스템.
제143항에 있어서, 상기 포유류 세포는 인간 세포인 벡터 시스템.
제130항에 있어서, 상기 유전자 산물은 단백질인 벡터 시스템.
제130항에 있어서, 상기 유전자 산물의 발현은 감소하는 벡터 시스템.
제130항에 있어서, 상기 주형 폴리뉴클레오티드는 유전자 산물을 암호화하는 DNA 분자에 추가로 도입되거나, 개입 서열은 정밀하게 절제되어 5' 돌출부 또는 3' 돌출부가 다시 어닐링되어 결찰되도록 하는 벡터 시스템.
제130항에 있어서, 상기 유전자 산물의 발현은 증가하거나, 또는 상기 유전자 산물의 활성 또는 기능은 변경되는 벡터 시스템.
제130항에 있어서, 상기 시스템의 벡터들은 바이러스 벡터인 벡터 시스템.
제130항에 있어서, 상기 시스템의 벡터들은 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통하여 전달되는 벡터 시스템.
상동성 배향 수선을 촉진함으로써 세포 내 관심 있는 게놈상 유전자 좌에서 DNA 듀플렉스의 마주보는 가닥들에 제1 및 제2 표적 서열을 포함하는 유기체를 변형하는 방법으로서, 다음과 같은 것들을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함하는 방법:
I. 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 이 제1 폴리뉴클레오티드 서열은
(a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열;
(b) 제1 tracr 메이트 서열; 및
(c) 제1 tracr 서열
을 포함하는 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열,
II. 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열로서, 이 제2 폴리뉴클레오티드 서열은
(a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열;
(b) 제2 tracr 메이트 서열; 및
(c) 제2 tracr 서열
을 포함하는 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열,
III. 핵 국소화 서열 1 개 이상을 포함하고, 돌연변이 1 개 이상을 포함하는 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 그리고
IV. 합성 또는 조작된 단일 가닥 올리고뉴클레오티드를 포함하는 수선 주형
(여기서, 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고,
전사가 진행될 때 제1 및 제2 tracr 메이트 서열은 각각 제1 및 제2 tracr 서열에 혼성화되고, 제1 및 제2 가이드 서열은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며,
제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고,
제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며,
CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고,
제1 가이드 서열은 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하며, 제2 가이드 서열은 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하여 이중 가닥 파괴를 유도하고,
수선 주형은 상동성 재조합에 의해 DNA 듀플렉스에 도입되며, 이로 말미암아 유기체는 변형됨).
제151항에 있어서, 상기 수선 주형은 제한 엔도뉴클레아제 제한 위치를 추가로 포함하는 방법.
제151항에 있어서, 상기 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부 또는 3' 돌출부를 생성하는 방법.
제153항에 있어서, 상기 5' 돌출부는 1 개 내지 200 개의 염기쌍으로 이루어진 방법.
제153항에 있어서, 상기 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어진 방법.
제151항에 있어서, 상기 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA인 방법.
제151항에 있어서, 상기 CRISPR 효소를 암호화하는 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열을 포함하는 폴리뉴클레오티드는 RNA이고, 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달되는 방법.
제151항에 있어서, 상기 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하는 방법.
제151항에 있어서, 상기 제1 및 제2 tracr 서열은 100% 동일성을 공유하는 방법.
제151항에 있어서, 상기 CRISPR 효소는 Cas9 효소인 방법.
제160항에 있어서, 상기 CRISPR 효소는 SpCas9인 방법.
제161항에 있어서, 상기 CRISPR 효소는 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 방법.
제162항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 방법.
제163항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 방법.
제164항에 있어서, 상기 CRISPR 효소는 D10A 돌연변이를 가지는 방법.
제162항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 방법.
제166항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 방법.
제167항에 있어서, 상기 CRISPR 효소는 H840A 돌연변이를 가지는 방법.
비 상동성 말단 접합(Non Homologous End Joining; NHEJ) 매개 결찰을 촉진함으로써 세포 내에서 관심 있는 게놈상 유전자 좌의 DNA 듀플렉스의 마주보는 가닥들 상에 있는 제1 및 제2 표적 서열을 포함하는 유기체를 변형하는 방법으로서, 이 방법은 다음과 같은 것들을 포함하는 비 천연 발생 또는 조작 조성물을 전달하는 단계를 포함하는 방법:
I. 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 이 제1 폴리뉴클레오티드 서열은
(a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열;
(b) 제1 tracr 메이트 서열; 및
(c) 제1 tracr 서열
을 포함하는 제1 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열,
II. 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열로서, 이 제2 폴리뉴클레오티드 서열은
(a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열;
(b) 제2 tracr 메이트 서열; 및
(c) 제2 tracr 서열
을 포함하는 제2 CRISPR-Cas 시스템 chiRNA 폴리뉴클레오티드 서열,
III. 핵 국소화 서열 1 개 이상을 포함하고, 돌연변이 1 개 이상을 포함하는 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 그리고
IV. 돌출부들의 제1 세트를 포함하는 수선 주형
(여기서, 상기 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고,
전사가 진행될 때 제1 및 제2 tracr 메이트 서열은 각각 제1 및 제2 tracr 서열에 혼성화되고, 제1 및 제2 가이드 서열은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며,
제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고,
제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며,
CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열은 DNA 또는 RNA이고,
제1 가이드 서열은 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하며, 제2 가이드 서열은 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하여, 돌출부들의 제2 세트를 가지는 이중 가닥 파괴를 유도하고,
돌출부들의 제1 세트는 돌출부들의 제2 세트와 양립가능하면서 매치하며,
수선 주형은 결찰에 의해 DNA 듀플렉스에 도입되고, 이로 말미암아 유기체는 변형됨).
제169항에 있어서, 상기 수선 주형은 합성되거나 조작된 이중 가닥 올리고뉴클레오티드 듀플렉스인 방법.
제169항에 있어서, 상기 수선 주형은 세포에 도입된 DNA 조각으로부터 제조되고, 효소에 의해 가공되는 방법.
제169항에 있어서, 상기 제1 표적 서열의 근처에 있는 DNA 듀플렉스의 한쪽 가닥의 절단을 지시하는 제1 가이드 서열과, 제2 표적 서열의 근처에 있는 DNA 듀플렉스의 다른 쪽 가닥의 절단을 지시하는 제2 가이드 서열은 5' 돌출부 또는 3' 돌출부를 생성하는 방법.
제172항에 있어서, 상기 5' 돌출부는 1 개 내지 200 개의 염기쌍으로 이루어진 방법.
제172항에 있어서, 상기 3' 돌출부는 1 개 내지 100 개의 염기쌍으로 이루어진 방법.
제169항에 있어서, 상기 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA인 방법.
제169항에 있어서, 상기 CRISPR 효소를 암호화하는 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열을 포함하는 폴리뉴클레오티드는 RNA이고, 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달되는 방법.
제169항에 있어서, 상기 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하는 방법.
제169항에 있어서, 상기 제1 및 제2 tracr 서열은 100% 동일성을 공유하는 방법.
제169항에 있어서, 상기 CRISPR 효소는 Cas9 효소인 방법.
제179항에 있어서, 상기 CRISPR 효소는 SpCas9인 방법.
제180항에 있어서, 상기 CRISPR 효소는 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 방법.
제181항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하는 방법.
제182항에 있어서, 상기 1 개 이상의 돌연변이는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되는 방법.
제183항에 있어서, 상기 CRISPR 효소는 D10A 돌연변이를 가지는 방법.
제181항에 있어서, 상기 1 개 이상의 돌연변이는 HNH 도메인 내에 존재하는 방법.
제185항에 있어서, 상기 1 개 이상의 돌연변이는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 방법.
제186항에 있어서, 상기 CRISPR 효소는 H840A 돌연변이를 가지는 방법.
세포 내 관심 있는 유전자 좌에서 DNA 듀플렉스를 변형시키는 방법으로서, 이 방법은
I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열,
(b) 제1 tracr 메이트 서열, 그리고
(c) 제1 tracr 서열
을 포함하는 제1 폴리뉴클레오티드;
II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열,
(b) 제2 tracr 메이트 서열, 그리고
(c) 제2 tracr 서열
을 포함하는 제2 폴리뉴클레오티드; 그리고
III. CRISPR 효소를 암호화하는 서열과, 핵 국소화 서열 1 개 이상을 포함하는 제3 폴리뉴클레오티드
를 세포에 전달하는 단계를 포함하는 방법
(여기서 상기 제1 및 제2 폴리뉴클레오티드 내 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고;
상기 제1 표적 서열은 DNA 듀플렉스의 제1 서열상에 존재하며, 제2 표적 서열은 DNA 듀플렉스의 반대쪽 가닥 상에 존재하며, 제1 및 제2 가이드 서열이 상기 듀플렉스 내 표적 서열들에 혼성화될 때, 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들은 듀플렉스의 염기쌍 1 개 이상만큼 서로에 대해 상대적으로 상쇄 관계에 있고;
전사가 진행될 때 제1 및 제2 tracr 메이트 서열들은 각각 제1 및 제2 tracr 서열들에 혼성화되며, 제1 및 제2 가이드 서열들은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며;
제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) 제1 tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고;
제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) 제2 tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며;
상기 DNA 듀플렉스의 제1 가닥은 상기 제1 표적 서열의 근처에서 절단되고, 상기 DNA 듀플렉스의 반대쪽 가닥은 상기 제2 표적 서열의 근처에서 절단되어, 5' 돌출부 또는 3' 돌출부가 생성되면서 이중 가닥 파괴가 초래됨).
세포 내 관심 있는 유전자 좌에서 DNA 듀플렉스를 변형하는 방법으로서, 이 방법은
I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과
(b) tracr 메이트 서열 1 개 이상
에 작동 가능하도록 결합하고 있는 제1 조절 요소를 포함하는 제1 폴리뉴클레오티드 서열,
II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과
(b) tracr 메이트 서열 1 개 이상
에 작동 가능하도록 결합하고 있는 제2 조절 요소를 포함하는 제2 폴리뉴클레오티드 서열,
III. CRISPR 효소를 암호화하는 서열에 작동 가능하도록 결합하고 있는 제3 조절 요소를 포함하는 제3 폴리뉴클레오티드 서열, 그리고
IV. tracr 서열에 작동 가능하도록 결합하고 있는 제4 조절 요소를 포함하는 제4 폴리뉴클레오티드 서열
을 포함하는 벡터 1 개 이상을 포함하는 벡터 시스템을 세포에 전달하는 단계를 포함하는 방법
(여기서 구성성분 I, II, III 및 IV는 시스템의 동일하거나 상이한 벡터들 상에 위치하고,
제1 표적 서열은 DNA 듀플렉스의 제1 가닥 상에 존재하고, 제2 표적 서열은 DNA 듀플렉스의 반대쪽 가닥 상에 존재하며, 제1 및 제2 가이드 서열들이 상기 듀플렉스 내 표적 서열들에 혼성화될 때, 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들은 듀플렉스를 구성하는 염기쌍 1 개 이상만큼 서로에 대해 상대적으로 상쇄 관계에 있고;
전사가 진행될 때 제1 및 제2 tracr 메이트 서열들은 tracr 서열에 혼성화되며, 제1 및 제2 가이드 서열들은 각각 제1 및 제2 CRISPR 복합체의 제1 및 제2 표적 서열로의 서열 특이적 결합을 지시하며;
제1 CRISPR 복합체는 (1) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열과, (2) tracr 서열에 혼성화되는 제1 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하고;
제2 CRISPR 복합체는 (1) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열과, (2) tracr 서열에 혼성화되는 제2 tracr 메이트 서열과 복합체를 형성한 CRISPR 효소를 포함하며;
상기 DNA 듀플렉스의 제1 가닥은 상기 제1 표적 서열의 근처에서 절단되고, 상기 DNA 듀플렉스의 반대쪽 가닥은 상기 제2 표적 서열의 근처에서 절단되어, 5' 돌출부 또는 3' 돌출부를 생성하면서 이중 가닥 파괴가 초래됨).
제188항 또는 제189항에 있어서, 상기 CRISPR 효소는 촉매적 도메인에 1 개 이상의 돌연변이를 포함하는 닉카아제 효소, 선택적으로는 Cas9 효소인 방법.
제190항에 있어서, 상기 1 개 이상의 돌연변이는 RuvC 도메인 내에 존재하고, 선택적으로는 D10A, E762A 및 D986A로 이루어진 군으로부터 선택되거나, 또는 HNH 도메인 내에 존재하고, 선택적으로는 H840A, N854A 및 N863A로 이루어진 군으로부터 선택되는 방법.
제190항 또는 제191항에 있어서, 상기 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들 간 상쇄부는 -8 bp보다 크거나, 또는 -278 bp에서 +58 bp까지, 또는 -200 bp에서 +200 bp 또는 100 bp보다 작거나, 아니면 100 bp, 또는 -4 bp에서 20 bp, 즉 +23 bp 또는 +16 bp, 또는 +20 bp, 또는 +16 bp에서 +20 bp까지, 또는 -3 bp에서 +18 bp까지의 범위에 걸쳐 있는 방법.
제190항 내지 제192항 중 어느 하나의 항에 있어서, 상기 DNA 듀플렉스의 제1 가닥의 절단과 이의 반대쪽 가닥의 절단은, 각각의 가닥 상 3'에서 일어나 PAM(프로토스페이서 인접 모티프)쪽으로 진행되고, 이때 상기 제1 가닥 상 PAM은 상기 반대쪽 가닥상의 PAM과 30 염기쌍 내지 150 염기쌍만큼 떨어져 있는 방법.
제190항 내지 제193항 중 어느 하나의 항에 있어서, 상기 돌출부는 200 개 이하의 염기, 100 개 이하의 염기 또는 50 개 이하의 염기로 이루어진 방법.
제194항에 있어서, 상기 돌출부는 1 개 이상의 염기, 10 개 이상의 염기, 15 개 이상의 염기, 26 개 이상의 염기, 또는 30 개 이상의 염기로 이루어진 방법.
제194항에 있어서, 상기 돌출부는 34 개 내지 50 개 염기 또는 1 개 내지 34 개 염기로 이루어진 방법.
제188항 내지 제197항 중 어느 하나의 항에 있어서, 상기 CRISPR 효소를 암호화하는 폴리뉴클레오티드 서열, 제1 및 제2 가이드 서열, 제1 및 제2 tracr 메이트 서열, 또는 제1 및 제2 tracr 서열 중 임의의 것 또는 전부는 RNA이고, 선택적으로 상기 I, II 및 III 중 임의의 것 또는 전부는 나노입자, 엑소좀, 미세소포 또는 유전자 총을 통해 전달되는 방법.
제188항 내지 제198항 중 어느 하나의 항에 있어서, 상기 제1 및 제2 tracr 메이트 서열은 100% 동일성을 공유하고/공유하거나 상기 제1 및 제2 tracr 서열은 100% 동일성을 공유하는 방법.
제188항에 있어서, 상기 I, II 및 III 각각은 벡터 내에 제공되고, 선택적으로 이것들 각각은 동일하거나 상이한 벡터 내에 제공되는 방법.
제188항 내지 제200항 중 어느 하나의 항에 있어서, 상기 관심 있는 유전자 좌는 유전자를 포함하고, 상기 방법은 상기 유전자의 발현을 변화시키거나, 유전자 산물의 활성 또는 기능을 변화시키는 방법.
제201항에 있어서, 상기 유전자 산물은 단백질이고/단백질이거나 상기 발현, 활성 또는 기능의 변화는 상기 발현, 활성 또는 기능의 감소인 방법.
제188항 내지 제201항 중 어느 하나의 항에 있어서, 상기 방법은
- 상기 이중 가닥 파괴에 의해 생성된 돌출부들과 상보성인 돌출부들을 포함하는 이중 가닥 올리고데옥시뉴클레오티드(dsODN)를 세포에 전달하는 단계로서, 상기 dsODN은 관심 있는 유전자 좌에 통합되는 단계; 또는
- 단일 가닥 올리고데옥시뉴클레오티드(ssODN)를 세포에 전달하는 단계로서, 상기 ssODN은 상기 이중 가닥 파괴의 상동성 배향 수선에 대한 주형으로서의 역할을 하는 단계
를 추가로 포함하는 방법.
제188항 내지 제201항 중 어느 하나의 항에 있어서, 상기 방법은 개체 내 질병의 예방 또는 치료를 위한 것으로서, 선택적으로 상기 질병은 상기 관심 있는 유전자 좌에 발생한 결함에 의해 유발되는 방법.
제203항에 있어서, 상기 방법은 개체에서 생체 내 수행될 수 있거나, 아니면 개체로부터 채취된 세포에서 생체 외 수행될 수 있고, 선택적으로 상기 세포는 개체로 다시 주입되는 방법.
다음과 같은 것들을 포함하는 조성물 또는 키트:
I. (a) 제1 표적 서열에 혼성화될 수 있는 제1 가이드 서열,
(b) 제1 tracr 메이트 서열, 그리고
(c) 제1 tracr 서열
을 포함하는 제1 폴리뉴클레오티드;
II. (a) 제2 표적 서열에 혼성화될 수 있는 제2 가이드 서열,
(b) 제2 tracr 메이트 서열, 그리고
(c) 제2 tracr 서열
을 포함하는 제2 폴리뉴클레오티드; 그리고
III. CRISPR 효소를 암호화하는 서열과, 1 개 이상의 핵 국소화 서열을 포함하는 제3 폴리뉴클레오티드.
(여기서, 상기 제1 및 제2 폴리뉴클레오티드에 있어서 (a), (b) 및 (c)는 5'에서 3' 방향으로 배열되고;
상기 제1 표적 서열은 DNA 듀플렉스의 제1 가닥 상에 존재하며, 제2 표적 서열은 DNA 듀플렉스의 반대쪽 가닥 상에 존재하며, 제1 및 제2 가이드 서열들이 상기 듀플렉스 내 표적 서열들에 혼성화될 때, 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드의 5' 말단들은 듀플렉스를 구성하는 염기쌍 1 개 이상만큼 서로에 대해 상대적으로 상쇄 관계에 있고;
선택적으로 상기 I, II 및 III 각각은 동일 벡터 또는 상이한 벡터 내에 제공됨).
제188항 내지 제204항 중 어느 하나의 항에 의한 방법에 있어서 제205항에 의한 키트 또는 조성물의 용도.
의약품 제조에 있어서 제205항에 의한 키트 또는 조성물의 용도로서, 선택적으로 상기 의약품은 상기 관심 있는 유전자 좌에 일어난 결함에 의해 유발되는 질병의 예방 또는 치료를 위한 것인 용도.