ゲノム編集、ゲノムエンジニアリング並びに遺伝子及び/又は遺伝因子の発現の改変に用いることのできるCRISPR-Cas系の構成要素が本明細書で説明される。CRISPR-Cas系は、遺伝病の治療を含む様々な治療用途において有用であり得る。CRISPR-Cas9系のオフターゲット活性の低減を促進する、Cas9タンパク質の急速分解型変異体(「FaDe-Cas9」と称される場合もある)も本明細書で説明される。急速分解型Cas9タンパク質の更なる利点は、本明細書で説明され、野生型Cas9のオンターゲット効率と同等のオンターゲット効率及び/又は野生型Cas9と比較して低減した毒性を含むが、これらに限定されない。
定義
本明細書において使用される「1つの(a)」又は「1つの(an)」は、1つ以上を意味し得る。本明細書及び特許請求の範囲において本明細書で使用され、語「含む」と共に使用される場合、語「1つの(a)」又は「1つの(an)」は、1つ又は2つ以上を意味し得る。本明細書において使用される「別の」又は「更なる」は、少なくとも第2のもの以上を意味し得る。
本出願全体にわたり、用語「約」は、値が、その値を決定するために用いられている方法/装置についての誤差の固有の変動又は試験対象間で存在する変動を含むことを示すために使用される。典型的には、この用語は、状況に応じておよそ又は1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%又は20%未満の変動性を包含することを意味する。
特許請求の範囲における用語「又は」の使用は、代替物のみを指すと明示されない限り又はその代替物が相互に排他的でない限り、「及び/又は」を意味するために使用されるが、本開示は、代替物のみ及び「及び/又は」を指す定義を支持する。
本明細書及び特許請求の範囲において使用される場合、語「含んでいる」(並びに含んでいるの任意の形態、例えば、「含む(comprise)」及び「含む(comprises)」)、「有している」(並びに有しているの任意の形態、例えば、「有する(have)」及び「有する(has)」)、「包含している」(並びに包含しているの任意の形態、例えば、「包含する(includes)」及び「包含する(include)」)又は「含有している」(並びに含有しているの任意の形態、例えば、「含有する(contains)」及び「含有する(contain)」)は、包含的又はオープンエンドであり、追加の引用されない要素又は方法工程を除外するものではない。本明細書において考察される任意の実施形態は、本開示の任意の方法、系、宿主細胞、発現ベクター及び/又は組成物に関して実行できることが企図される。更に、本開示の組成物、系、宿主細胞及び/又はベクターを使用して本開示の方法及びタンパク質を達成することができる。
用語「例えば」及びその対応する略語「e.g.(イタリックであるか又はそうでないかを問わない)」の使用は、引用される特定の用語が、特に明示されない限り、参照又は引用される特定の例に限定されるものではない本開示の代表例及び実施形態であることを意味する。
「核酸」、「核酸分子」、「ヌクレオチド」、「ヌクレオチド配列」、「オリゴヌクレオチド」又は「ポリヌクレオチド」は、共有結合ヌクレオチドを含むポリマー化合物を意味する。用語「核酸」には、リボ核酸(RNA)及びデオキシリボ核酸(DNA)が含まれ、その両方とも一本鎖又は二本鎖であり得る。DNAとしては、限定されるものではないが、相補的DNA(cDNA)、ゲノムDNA、プラスミド又はベクターDNA及び合成DNAが挙げられる。いくつかの実施形態では、本開示は、本明細書に開示のポリペプチドのいずれか1つをコードするポリヌクレオチドを提供し、例えばCasタンパク質又はそのバリアントをコードするポリヌクレオチドを対象とする。「遺伝子」は、ポリペプチドをコードするヌクレオチドの集合体を指し、それにはcDNA及びゲノムDNA核酸分子が含まれる。「遺伝子」は、コード配列に先行(5’非コード配列)及び後行(3’非コード配列)する調節配列として作用し得る核酸フラグメントも指す。
核酸分子は、温度及び溶液イオン強度の適切な条件下で核酸分子の一本鎖形態が他の核酸分子にアニールし得る場合、別の核酸分子、例えばcDNA、ゲノムDNA又はRNAに「ハイブリダイズ可能である」又は「ハイブリダイズされる」。ハイブリダイゼーション及び洗浄条件は、既知であり、Sambrook et al.,Molecular Cloning:A Laboratory Manual、Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(1989)、特にその中の第11章及び表11.1に例示されている。温度及びイオン強度の条件は、ハイブリダイゼーションの「ストリンジェンシー」を決定する。ストリンジェンシー条件は、中程度に類似するフラグメント、例えば遠縁生物からの相同配列を、高度に類似するフラグメント、例えば密接に関連する生物からの機能的酵素を複製する遺伝子に対してスクリーニングするように調整することができる。相同核酸の予備スクリーニングのため、55℃のTmに対応する低ストリンジェンシーハイブリダイゼーション条件、例えば5×SSC、0.1%のSDS、0.25%のミルク及びホルムアミドなし;又は30%のホルムアミド、5×SSC、0.5%のSDSを使用することができる。中程度のストリンジェンシーハイブリダイゼーション条件は、より高いTm、例えば40%のホルムアミドと5×又は6×SCCに対応する。高いストリンジェンシーハイブリダイゼーション条件は、最大Tm、例えば50%のホルムアミド、5×又は6×SCCに対応する。ハイブリダイゼーションは、2つの核酸が相補的配列を含有することを要求するが、ハイブリダイゼーションのストリンジェンシーに応じて塩基間のミスマッチが考えられる。
用語「相補的」は、互いにハイブリダイズし得るヌクレオチド塩基間の関係を記載するために使用される。例えば、DNAに関して、アデノシンは、チミンに相補的であり、シトシンは、グアニンに相補的である。したがって、本開示には、本明細書で開示又は使用される完全配列に相補的な単離核酸フラグメント及びそれらと実質的に類似する核酸配列も含まれる。
DNA「コード配列」は、適切な調節配列の制御下で配置される場合、インビトロ又はインビボにおいて細胞中で転写され、ポリペプチドに翻訳される二本鎖DNA配列である。「好適な調節配列」は、コード配列の上流(5’非コード配列)、その中又はその下流(3’非コード配列)に局在し、転写、RNAプロセシング若しくは安定性又は関連するコード配列の翻訳に影響するヌクレオチド配列を指す。調節配列としては、プロモーター、翻訳リーダー配列、イントロン、ポリアデニル化認識配列、RNAプロセシング部位、エフェクター結合部位及びステムループ構造を挙げることができる。コード配列の境界は、5’(アミノ)末端における開始コドン及び3’(カルボキシル)末端における翻訳終止コドンにより決定される。コード配列としては、限定されるものではないが、原核生物配列、mRNAからのcDNA、ゲノムDNA配列及び更に合成DNA配列を挙げることができる。コード配列が真核細胞中での発現を目的とされる場合、ポリアデニル化シグナル及び転写終結配列は、通常、コード配列に対して3’に位置する。
「オープンリーディングフレーム」は、ORFと略され、翻訳開始シグナル又は開始コドン、例えばATG又はAUG及び終止コドンを含み、ポリペプチド配列に潜在的に翻訳され得る長さの核酸配列、DNA、cDNA又はRNAのいずれかを意味する。
用語「相同組換え」は、外来DNA配列の別のDNA分子中への挿入、例えば染色体中のベクターの挿入を指す。場合により、ベクターは、相同組換えについて特異的な染色体部位を標的化する。特異的相同組換えのため、ベクターは、典型的には、相補的結合及び染色体中へのベクターの組み込みを可能とするために染色体の配列と相同性の十分に長い領域を含有する。より長い相補性の領域及びより大きい配列類似性の程度は、相同組換えの効率を増加させ得る。
当技術分野において既知の方法を使用して、本明細書の開示に従ってポリヌクレオチドを伝播させることができる。好適な宿主系及び成長条件を確立したら、組換え発現ベクターを伝播させ、多量に調製することができる。本明細書で説明する通り、使用され得る発現ベクターとしては、以下のベクター又はその誘導体が挙げられるが、これらに限定されない:ヒト又は動物ウイルス、例えばワクシニアウイルス又はアデノウイルス、昆虫ウイルス、例えばバキュロウイルス、酵母ベクター、バクテリオファージベクター(例えば、ラムダ)並びにプラスミド及びコスミドDNAベクター。
本明細書で使用するとき、「操作可能に連結される」とは、目的のポリヌクレオチド、例えばCas9タンパク質をコードするポリヌクレオチドが、ポリヌクレオチド配列の発現を可能にするように調節エレメントに連結されることを意味する。いくつかの実施形態では、調節エレメントは、プロモーターである。いくつかの実施形態では、目的のポリヌクレオチドは、発現ベクター上でプロモーターに操作可能に連結されている。
本明細書で使用される場合、「プロモーター」、「プロモーター配列」又は「プロモーター領域」は、RNAポリメラーゼに結合し得、且つ下流のコード配列又は非コード配列の転写の開始に関与するDNA調節領域/配列を指す。本開示の一部の例において、プロモーター配列は、転写開始部位を含み、バックグラウンドを超えて検出可能なレベルにおいて転写を開始するために使用される最小数の塩基又はエレメントを含むように上流に伸びる。いくつかの実施形態では、プロモーター配列は、転写開始部位及びRNAポリメラーゼの結合を担うタンパク質結合ドメインを含む。真核生物プロモーターは、「TATA」ボックス及び「CAT」ボックスを含有することが多いが、常にではない。種々のプロモーター、例として誘導性プロモーターを使用して、本開示の種々のベクターを駆動することができる。
「ベクター」は、宿主細胞中に核酸をクローニングし、且つ/又は移行させる任意の手段である。ベクターは、別のDNAセグメントを付着させて付着セグメントの複製を生じさせることができるレプリコンであり得る。「レプリコン」は、インビボでDNA複製の自律的単位として機能する、すなわちそれ自体の制御下で複製し得る任意の遺伝子エレメント(例えば、プラスミド、ファージ、コスミド、染色体、ウイルス)である。本開示のいくつかの実施形態では、ベクターは、例えば、非対称分配により多数の細胞世代後に細胞の集団から除去/消失されるエピソーマルベクターである。用語「ベクター」には、インビトロ、エクスビボ又はインビボで細胞中に核酸を導入するためのウイルス及び非ウイルス手段の両方が含まれる。当技術分野で既知の多くのベクターを、核酸を操作し、応答エレメント及びプロモーターを遺伝子に組み込むなどのために用いることができる。可能なベクターとしては、例えば、ラムダ誘導体などのバクテリオファージ、又はPBR322若しくはpUCプラスミド誘導体などのプラスミド、又はブルースクリプトベクターなどを含むプラスミド又は修飾ウイルスが挙げられる。例えば、好適ベクター中への、応答エレメント及びプロモーターに対応するDNAフラグメントの挿入は、相補的粘着末端を有する選択ベクター中に適切なDNAフラグメントをライゲートすることにより達成することができる。代わりに、DNA分子の末端を酵素的に改変することができるか、又はヌクレオチド配列(リンカー)をDNA末端中にライゲートすることにより任意の部位を産生することができる。このようなベクターは、細胞ゲノム中にマーカーを組み込んだ細胞の選択を提供する選択マーカー遺伝子を含有するように改変することができる。このようなマーカーは、マーカーを組み込み、そのマーカーによりコードされるタンパク質を発現する宿主細胞の同定及び/又は選択を可能とする。
ウイルスベクター、特にレトロウイルスベクターは、細胞及び生存動物対象における広範な遺伝子送達用途において使用されている。使用することができるウイルスベクターとしては、限定されるものではないが、レトロウイルス、アデノ随伴ウイルス、ポックス、バキュロウイルス、ワクシニア、単純ヘルペス、エプスタインバール、アデノウイルス、ジェミニウイルス及びカリモウイルスベクターが挙げられる。非ウイルスベクターとしては、限定されるものではないが、プラスミド、リポソーム、荷電脂質、DNA-タンパク質複合体及び生体ポリマーが挙げられる。ベクターは、核酸に加え、核酸移行結果(移行する組織、発現の継続期間など)の選択、計測及びモニタリングにおいて有用な1つ以上の調節領域及び/又は選択マーカーも含み得る。
ベクターは、既知の方法、例として、限定されるものではないが、トランスフェクション、形質導入、細胞融合及びリポフェクションにより所望の宿主細胞中に導入することができる。ベクターは、種々の調節エレメント、例としてプロモーターを含み得る。いくつかの実施形態では、ベクター設計は、Mali et al.,“Cas9 as a versatile tool for engineering biology,”Nature Methods 10:957-63(2013)により設計された構築物をベースとすることができる。いくつかの実施形態では、本開示は、本明細書に記載のポリヌクレオチドのいずれかを含む発現ベクター、例えばCasタンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを提供する。いくつかの実施形態では、本開示は、Cas9タンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを提供する。
用語「プラスミド」は、細胞の中央代謝の一部でない遺伝子を担持することが多く、通常、環状二本鎖DNA分子の形態である外部染色体エレメントを指す。このようなエレメントは、任意の資源に由来する自律複製配列、ゲノム組込み配列、ファージ又はヌクレオチド配列、線状、環状又はスーパーコイルドの一本鎖又は二本鎖DNA又はRNAであり得、その中では、多数のヌクレオチド配列が、適切な3’非翻訳配列と共に、選択遺伝子産物についてのプロモーターフラグメント及びDNA配列を細胞中に導入し得るユニーク構築物中に結合するか又は組換えされている。
本明細書において使用される「トランスフェクション」は、細胞中への外因性核酸分子、例としてベクターの導入を意味する。「トランスフェクトされた」細胞は、細胞内部の外因性核酸分子を含み、「形質転換」細胞は、細胞内の外因性核酸分子が細胞の表現型変化を誘導する細胞である。トランスフェクトされた核酸分子は、宿主細胞のゲノムDNA中に組み込むことができ、且つ/又は一時的若しくは長期間にわたり染色体外で細胞により維持させることができる。外因性核酸分子又はフラグメントを発現する宿主細胞又は生物は、「組換え」、「形質転換」又は「トランスジェニック」生物と称される。いくつかの実施形態では、本開示は、本明細書に記載の発現ベクターのいずれか、例えばCasタンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを含む宿主細胞を提供する。いくつかの実施形態では、本開示は、Cas9タンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを含む宿主細胞を提供する。
用語「宿主細胞」は、組換え発現ベクターが導入された細胞を指す。用語「宿主細胞」とは、発現ベクターが導入された細胞(「親」細胞)のみでなく、こうした細胞の後代も指す。例えば、変異又は環境の影響により特定の修飾が後の世代に発生する場合があるため、そのような後代は、親細胞と同一ではない場合があるが、用語「宿主細胞」の範囲内に依然として含まれる。
用語「ペプチド」、「ポリペプチド」及び「タンパク質」は、本明細書において互換的に使用され、任意の長さのアミノ酸のポリマー形態を指し、それは、コード及び非コードアミノ酸、化学的若しくは生化学的改変又は誘導体化アミノ酸並びに改変ペプチド骨格を有するポリペプチドを含む。
タンパク質又はポリペプチドの始点は、「N末端」(又はアミノ末端、NH2末端、N末端部若しくはアミン末端)として知られ、これは、タンパク質又はポリペプチドの第1のアミノ酸残基の遊離アミン(-NH2)基を指す。タンパク質又はポリペプチドの終点は、「C末端」(又はカルボキシ末端、カルボキシル末端、C-末端部若しくはCOOH末端)として知られ、これは、タンパク質又はポリペプチドの最後のアミノ酸残基の遊離カルボキシル基(-COOH)を指す。
本明細書で使用するとき、「アミノ酸」は、カルボキシル(-COOH)及びアミノ(-NH2)基の両方を含有する化合物を指す。「アミノ酸」は、天然及び非天然(すなわち合成)のアミノ酸の両方を指す。3文字及び1文字の略記を有する天然アミノ酸としては、アラニン(Ala;A);アルギニン(Arg、R);アスパラギン(Asn;N);アスパラギン酸(Asp;D);システイン(Cys;C);グルタミン(Gln;Q);グルタミン酸(Glu;E);グリシン(Gly;G);ヒスチジン(His;H);イソロイシン(Ile;I);ロイシン(Leu;L);リジン(Lys;K);メチオニン(Met;M);フェニルアラニン(Phe;F);プロリン(Pro;P);セリン(Ser;S);トレオニン(Thr;T);トリプトファン(Trp;W);チロシン(Tyr;Y);及びバリン(Val;V)が挙げられる。
「アミノ酸置換」は、野生型又は天然発生アミノ酸の、その野生型又は天然発生アミノ酸に対して異なるアミノ酸によるそのアミノ酸残基における1つ以上の置換を含むポリペプチド又はタンパク質を指す。置換アミノ酸は、合成又は天然発生アミノ酸であり得る。いくつかの実施形態では、置換アミノ酸は、A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y及びVからなる群から選択される天然発生アミノ酸である。置換変異は、略語系を用いて記載され得る。例えば、5番目のアミノ酸残基が置換されている置換突然変異は、「X5Y」と略記することができ、「X」は、置き換えられる野生型又は天然発生アミノ酸であり、「5」は、タンパク質又はポリペプチドのアミノ酸配列内のアミノ酸残基位置であり、「Y」は、置換、又は非野生型、又は非天然発生アミノ酸である。
「単離」ポリペプチド、タンパク質、ペプチド又は核酸は、その天然環境から取り出された分子である。「単離」ポリペプチド、タンパク質、ペプチド又は核酸は、賦形剤、例えば希釈剤又は助剤と配合することができ、依然として単離されているとみなされることも理解すべきである。
用語「組換え」は、核酸分子、ペプチド、ポリペプチド又はタンパク質に関して使用される場合、天然に存在することが公知でない遺伝子材料の新たな組合せのそれら又はその組合せから生じるそれらを意味する。組換え分子は、組換え技術の分野において利用可能な周知技術のいずれか、例として、限定されるものではないが、ポリメラーゼ連鎖反応(PCR)、遺伝子スプライシング(例えば、制限エンドヌクレアーゼを使用)及び核酸分子、ペプチド又はタンパク質の固相合成により産生することができる。
用語「ドメイン」は、ポリペプチド又はタンパク質に関して使用される場合、タンパク質中の区別される機能的及び/又は構造的単位を意味する。ドメインは、タンパク質の全体的な役割に寄与する特定の機能又は相互作用を担う場合がある。ドメインは、種々の生物学的コンテクストで存在し得る。類似のドメインは、異なる機能を有するタンパク質中で見出すことができる。代わりに、低い配列同一性(すなわち約50%未満、約40%未満、約30%未満、約20%未満、約10%未満、約5%未満又は約1%未満の配列同一性)を有するドメインは、同一の機能を有し得る。いくつかの実施形態では、Cas9ドメインは、RuvCドメインである。いくつかの実施形態では、Cas9ドメインは、HNHドメインである。いくつかの実施形態では、Cas9ドメインは、Recドメインである。
ポリペプチド又はタンパク質に関して使用される場合、用語「モチーフ」は、一般的に、タンパク質の機能に重要であり得る、典型的には長さが20アミノ酸より短い保存アミノ酸残基を指す。特定の配列モチーフは、様々なタンパク質において、特定の細胞内位置に対するタンパク質の結合又は標的化などの一般的な機能を媒介することができる。モチーフの例としては、核局在化シグナル、マイクロボディ標的化モチーフ、分泌を防止又は促進するモチーフ並びにタンパク質の認識及び結合を促進するモチーフが挙げられるが、これらに限定されない。モチーフデータベース及び/又はモチーフ検索ツールは、当業者に既知であり、例えばPROSITE(expasy.ch/sprot/prosite.html)、Pfam(pfam.wustl.edu)、PRINTS(biochem.ucl.ac.uk/bsm/dbbrowser/PRINTS/PRINTS.html)及びMinimotif Miner(cse-mnm.engr.uconn.edu:8080/MNM/SMSSearchServlet)を含む。
本明細書で使用するとき、「改変」タンパク質とは、タンパク質中に所望の特性を達成するための1つ以上の修飾を含むタンパク質を意味する。例示的な修飾としては、挿入、欠失、置換又は別のドメイン若しくはタンパク質との融合が挙げられるが、これらに限定されない。本開示の改変タンパク質としては、改変Cas9タンパク質が挙げられる。
いくつかの実施形態では、改変タンパク質は、野生型タンパク質から生成される。本明細書で使用するとき、「野生型」タンパク質又は核酸は、天然発生の未修飾タンパク質又は核酸である。例えば、野生型Cas9タンパク質は、生物であるストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離することができ、また、これは、配列番号1のアミノ酸配列を含み得る。野生型は、「変異型」と対比され、変異型は、タンパク質又は核酸のアミノ酸及び/又はヌクレオチド配列中に1つ以上の修飾を含む。例えば、S.ピオゲネス(S.pyogenes)Cas9の突然変異体は、配列番号2のアミノ酸配列を含み得、これは、野生型のS.ピオゲネス(S.pyogenes)Cas9(配列番号1)と比較して単一のアミノ酸置換を有する。
用語「分解する」又は「分解」は、ポリペプチド又はタンパク質に関して用いられる場合、一般的に、一般にプロテオリシスと称されるプロセスを介して、タンパク質がより小さいペプチドフラグメント又は個々のアミノ酸に崩壊することを指す。タンパク質の細胞内分解は、リソソーム又はプロテアソームのいずれかの中で達成され得る。リソソーム分解は、例えば、本明細書で説明する選択的シャペロン介在性オートファジー経路などの経路を除いて、典型的には非選択的プロセスである。リソソーム分解中、サイトゾルタンパク質は、分解のためにリソソームにエンドサイトーシスされる。プロテアソーム分解は、典型的には、選択的であり、分解対象のタンパク質がユビキチンで標識される。プロテアソームタンパク質分解経路の概要については、例えば、Ciechanover,Cell 79(1):13-21(1994);Hasselgren et al.,Ann Surg 225(3):307-316(1997);Collins et al.,Cell 169(5):792-806(2017)を参照されたい。一般に、タンパク質の分解速度は、細胞及び生化学的特徴におけるその機能に関連している。例えば、プロリン、グルタミン酸、セリン及びスレオニン豊富なセグメントを含むタンパク質(PESTタンパク質と称される場合もある)は、短い半減期を有する(例えば、参照によりその全体が援用されるVoet&Voet,Biochemistry 2nd ed.John Wiley&Sons,pp.1010-1014(1995)を参照されたい)。タンパク質の分解速度に影響を及ぼす他の因子としては、グルタミン及びアスパラギンの脱アミノ化速度、システイン、ヒスチジン及びメチオニンの酸化速度、安定化リガンドの欠如、結合した炭水化物基又はリン酸基の存在、遊離αアミノ基の存在、タンパク質の電荷並びにタンパク質の柔軟性及び安定性が挙げられる(例えば、参照によりその全体が援用されるCreighton”Chapter10-Degradation”in Proteins:Structures and Molecular Properties 2nd ed.W H Freeman and Company,pp.463-473(1993)を参照されたい)。タンパク質の分解速度を測定する方法としては、例えば、アミノ酸同位体のパルスチェイス(例えば、細胞培養又はSILACにおけるアミノ酸を用いた安定同位体標識化)、合成後放射性同位元素標識化又は例えばGFPをレポータータンパク質として使用するグローバルタンパク質安定性プロファイリング(GPSP)などのレポーター依存性アプローチが挙げられる(例えば、Yewdell et al.,Cell Biol Int 35(5):457-462(2011)を参照されたい)。タンパク質の分解速度を測定する別の方法は、例えば、免疫ブロットの濃度測分析を用いて、異なる時点における細胞中のタンパク質の量を定量化することと、経時的なタンパク質レベルをプロットすることと、タンパク質レベル対時間プロットから分解速度を判定することとによるものである。タンパク質の分解速度を判定する方法は、当業者によって選択され得る。
本明細書において使用される用語「配列類似性」又は「%類似性」は、核酸配列間又はアミノ酸配列間の同一性又は対応性の程度を指す。本明細書において使用される「配列類似性」は、1つ以上のヌクレオチド塩基の変化が1つ以上のアミノ酸の置換をもたらすが、DNA配列によりコードされるタンパク質の機能的特性に影響しない核酸配列を指す。「配列類似性」は、得られる転写産物の機能的特性に実質的に影響しない核酸の修飾、例えば1つ以上のヌクレオチド塩基の欠失又は挿入も指す。したがって、本開示は、特定の例示的な配列よりも多くのものを包含することが理解される。ヌクレオチド塩基の置換を行う方法は、コードされた生成物の生物活性の保持の判定方法と同様に既知である。
更に、当業者は、本開示により包含される類似の配列が、ストリンジェントな条件下において、本明細書に例示される配列とハイブリダイズするそれらの能力によっても定義されることを認識する。本開示の類似の核酸配列は、DNA配列が本明細書に開示の核酸のDNA配列と少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%又は少なくとも99%同一である核酸である。本開示の類似の核酸配列は、DNA配列が本明細書に開示の核酸のDNA配列と約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約99%、少なくとも約99%又は約100%同一である核酸である。
本明細書において使用される「配列類似性」は、アミノ酸の約40%超が同一であるか、又はアミノ酸の約60%超が機能的に同一である2つ以上のアミノ酸配列を指す。機能的に同一又は機能的に類似のアミノ酸は、化学的に類似の側鎖を有する。例えば、アミノ酸は、機能的類似性に従って以下のようにグループ分けすることができる:
正電荷側鎖:Arg、His、Lys;
負電荷側鎖:Asp、Glu;
極性非電荷側鎖:Ser、Thr、Asn、Gln;
疎水性側鎖:Ala、Val、Ile、Leu、Met、Phe、Tyr、Trp;
その他:Cys、Gly、Pro。
いくつかの実施形態では、本開示の類似のアミノ酸配列は、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%又は少なくとも99%同一であるアミノ酸を有する。
いくつかの実施形態では、本開示の類似のアミノ酸配列は、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%又は少なくとも95%機能的に同一であるアミノ酸を有する。いくつかの実施形態では、本開示の類似のアミノ酸配列は、約40%、少なくとも約40%、約45%、少なくとも約45%、約50%、少なくとも約50%、約55%、少なくとも約55%、約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%又は約100%同一であるアミノ酸を有する。
いくつかの実施形態では、本開示の類似のアミノ酸配列は、約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%又は約100%機能的に同一であるアミノ酸を有する。
本明細書で使用するとき、用語「同じタンパク質」とは、比較タンパク質と同じ生化学的機能を実施する、比較タンパク質と実質的に同様の構造又はアミノ酸配列を有するタンパク質を指し、アミノ酸配列中の1つ以上の部位における1つ以上のアミノ酸の置換又は欠失、すなわち少なくとも約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%又は約100%同一のアミノ酸の欠失によって比較タンパク質と異なるタンパク質を含み得る。一態様では、「同じタンパク質」とは、比較タンパク質と同一のアミノ酸配列を備えるタンパク質を指す。
配列類似性は、当技術分野における定型的な方法を使用する配列アラインメント、例えばBLAST、MUSCLE、Clustal(例として、ClustalW及びClustalX)及びT-Coffee(変種、例えばM-Coffee、R-Coffee及びExpressoなどを含む)などにより決定され得る。
核酸配列又はアミノ酸配列に関する用語「配列同一性」又は「%同一性」は、配列を規定の比較窓にわたりアラインした場合に同一である比較配列中の残基の割合を指す。いくつかの実施形態では、2つ以上の配列の特定の一部のみをアラインして配列同一性が決定される。いくつかの実施形態では、2つ以上の配列の特定のドメインのみをアラインして配列類似性が決定される。比較窓は、配列をアラインし、比較することができる少なくとも10個~1000個超の残基、少なくとも20~約1000個の残基又は少なくとも50~500個の残基のセグメントであり得る。配列同一性の決定のためのアラインメントの方法は、周知であり、公的に利用可能なデータベース、例えばBLASTを使用して実施することができる。「パーセント同一性」又は「%同一性」は、アミノ酸配列を指す場合、当技術分野において公知の方法により決定することができる。例えば、いくつかの実施形態では、2つのアミノ酸配列の「パーセント同一性」は、Karlin and Altschul,Proc Nat Acad Sci USA 90:5873-5877(1993)の通り修正されたKarlin and Altschul,Proc Nat Acad Sci USA 87:2264-2268(1990)のアルゴリズムを用いて判定される。こうしたアルゴリズムは、BLASTプログラム、例えばAltschul et al.,Journal of Molecular Biology,215:403-410(1990)に記載のBLAST+又はNBLAST及びXBLASTプログラム中に組み込まれている。BLASTタンパク質検索は、プログラム、例えばXBLASTプログラム、スコア=50、ワード長さ=3などを用いて実施して、本開示のタンパク質分子と相同であるアミノ酸配列を得ることができる。2つの配列間のギャップが存在する場合、Gapped BLASTを、Altschul et al.,Nucleic Acids Research 25(17):3389-3402(1997)に記載の通り利用することができる。BLAST及びGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、XBLAST及びNBLAST)のデフォルトパラメータを使用することができる。
いくつかの実施形態では、ポリペプチド又は核酸分子は、それぞれ参照ポリペプチド又は核酸分子(又は参照ポリペプチド若しくは核酸分子のフラグメント)と70%、少なくとも70%、75%、少なくとも75%、80%、少なくとも80%、85%、少なくとも85%、90%、少なくとも90%、95%、少なくとも95%、97%、少なくとも97%、98%、少なくとも98%、99%又は少なくとも99%又は100%の配列同一性を有する。いくつかの実施形態では、ポリペプチド又は核酸分子は、それぞれ参照ポリペプチド又は核酸分子(又は参照ポリペプチド若しくは核酸分子のフラグメント)と約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%又は約100%の配列同一性を有する。
CRISPR-Cas系の概要
CRISPR関連タンパク質9(Cas9)は、バクテリアの中でもとりわけ、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)及びナイセリア・メニンギチジス(Neisseria meningitidis)が挙げられるが、これらに限定されないバクテリア中に見出される、II型CRISPR適応免疫系のRNA誘導エンドヌクレアーゼである。CRISPR-Cas9系の概要については、例えば、Sander et al.,Nature Biotechnology 32:347-355(2014)を参照されたい。一般に、CRISPR又はCRISPR-Cas系は、ガイドポリヌクレオチド及びCas9エンドヌクレアーゼ(本明細書では「Cas9タンパク質」又は「Cas9ヌクレアーゼ」と互換的に称される)など、標的配列の部位でCRISPR複合体の形成を促進する要素を特徴とする。天然発生のCRISPR-Cas系中では、外来DNAは、CRISPRアレイに組み込まれ、続いて、CRISPRアレイは、外来DNA部位と相補的な「プロトスペーサー」領域を有するcrRNA(CRISPR-RNA)を産生する。crRNAは、tracrRNA(CRISPR系によってコードもされる)にハイブリダイズし、このRNAのペアがCas9ヌクレアーゼと会合する。crRNA/tracrRNA/Cas9複合体は、プロトスペーサー配列を有する外来DNAを認識してこれを開裂させる。
いくつかの実施形態では、本開示は、改変CRISPR-Cas系を提供する。いくつかの実施形態では、改変CRISPR-Cas系は、改変Cas9タンパク質を含み、改変Cas9タンパク質は、野生型Cas9に対する1つ以上の修飾を含む。いくつかの実施形態では、改変Cas9タンパク質は、野生型Cas9中に存在しない1つ以上のモチーフを含む。野生型Cas9に導入される1つ以上のモチーフは、「改変」モチーフと称され得る。いくつかの実施形態では、Cas9タンパク質中の1つ以上の改変モチーフは、シャペロン介在性オートファジー(CMA)モチーフである。
いくつかの実施形態では、改変CRISPR-Cas系は、改変ガイドポリヌクレオチドを含み、改変ガイドポリヌクレオチドは、野生型crRNA及び/又はtracrRNAに対する1つ以上の修飾を含む。いくつかの実施形態では、改変CRISPR-Cas系は、crRNAとtracrRNA配列の一部との間の融合、すなわち単一のガイドポリヌクレオチドを用いる。したがって、この場合、複合体は、Cas9と単一のガイドポリヌクレオチドとの間で形成される。単一のガイドポリヌクレオチドは、Cas9と複合体を形成して、ガイドポリヌクレオチドの第1の(5’)20個のヌクレオチド(すなわちガイドポリヌクレオチドのガイド配列部分)に相補的であり、且つプロトスペーサー隣接モチーフ(PAM)配列に隣接する標的配列の開裂を媒介する。他の実施形態では、改変CRISPR-Cas系は、tracrRNA配列を含む別個のポリヌクレオチドを含み、すなわち、tracrRNAは、ガイド配列を含むガイドポリヌクレオチドの部分ではない。この場合、複合体がCas9、ガイドポリヌクレオチド及びtracrRNA間で形成される。いくつかの実施形態では、ガイドポリヌクレオチドのtracrRNA構成成分は、Cas9タンパク質を活性化させる。いくつかの実施形態では、Cas9タンパク質の活性化は、Cas9のヌクレアーゼ活性を活性化又は増加させる。いくつかの実施形態では、Cas9タンパク質は、これがcrRNA及びtracrRNAとの複合体を形成するまでは活性でない。
Cas9エンドヌクレアーゼは、標的配列のプロトスペーサー隣接モチーフ(PAM)の上流で二本鎖DNAの切断を生成する。二本鎖切断の修復は、二本鎖切断部位における挿入又は欠失をもたらし得る。いくつかの実施形態では、目的配列は、細胞の内因性DNA修復経路を使用して標的配列中に挿入される。内因性DNA修復経路としては、非相同末端結合(NHEJ)経路、マイクロホモロジー媒介末端結合(MMEJ)経路及び相同性配向型修復(HDR)経路が挙げられる。NHEJ、MMEJ及びHDR経路は、二本鎖DNA切断を修復する。NHEJにおいて、相同テンプレートは、DNA中の切断の修復に必要ではない。NHEJ修復は、エラープローンであり得るが、エラーは、DNA切断が適合性オーバーハングを含む場合に減少する。NHEJ及びMMEJは、それらのそれぞれに関与するDNA修復酵素の異なるサブセットにより機序的に区別されるDNA修復経路である。場合により正確であり得、場合によりエラープローンであり得るNHEJと異なり、MMEJは、常にエラープローンであり、修復中の部位における欠失及び挿入の両方をもたらす。MMEJ関連欠失は、二本鎖切断の両側におけるマイクロホモロジー(2~10塩基対)に起因する。対照的に、HDRは、修復を指示するために相同テンプレートを必要とするが、HDR修復は、典型的には、高フィデリティ且つ低エラープローンである。いくつかの実施形態では、NHEJ及びMMEJ修復のエラープローン性質を活用して、標的配列中の非特異的ヌクレオチド置換を導入する。
本明細書で説明する通り、一部のCRISPR-Cas系は、望ましくないオフターゲット活性又はオフターゲットゲノム編集を有する場合がある。ゲノム編集に関連して用いられる「オフターゲット」とは、非特異的且つ意図されたものでない遺伝子修飾を指し、これは、目的の遺伝子座での修飾を指す「オンターゲット」とは対照的である。オフターゲット修飾は、例えば、Cas9ヌクレアーゼがその目的の標的配列(すなわちガイドポリヌクレオチド上のガイド配列に対して相補的なゲノム配列)で結合しない場合に生じる場合があり、これは、相同配列及び/又はミスマッチ耐性によって生じ得る。オフターゲット修飾としては、意図されたものではない点突然変異、欠失、挿入、逆位及び転座が挙げられるが、これらに限定されない。いくつかの実施形態では、本開示の改変Cas9タンパク質は、野生型Cas9タンパク質と比較して低減されたオフターゲット活性を有する。いくつかの実施形態では、本開示の改変Cas9タンパク質は、野生型Cas9タンパク質と比較してオフターゲット活性が少なくとも約50%低減している。いくつかの実施形態では、本開示の改変Cas9タンパク質は、野生型Cas9と比較してオフターゲット活性が少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%又は少なくとも約100%低減している。オフターゲット修飾は、例えば、標的化配列決定、エキソーム配列決定、全ゲノム配列決定、BLESS(直接インサイチュの切断標識、ストレプトアビジン上での濃縮及び次世代配列決定)、GUIDE-seq(配列決定によって評価されるゲノムワイドで非バイアスのDSBの同定)、LAM-HTGTS(線形増幅媒介高スループットゲノムワイド転座配列決定)及びDigenome-seqインビトロCas9ダイジェスト全ゲノム配列決定)を用いて検出され得る。オフターゲット修飾の検出及び定量化方法は、例えば、Zhang et al.,Mol Ther Nucleic Acids 4:e264(2014);及びZischewski et al.,Biotechnol Adv 35:95-104(2017)に記載されている。
Cas9タンパク質
いくつかの実施形態では、Cas9タンパク質は、以下の種に由来する:ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、ストレプトコッカス・ディスガラクティエ(Streptococcus dysgalactiae)、ストレプトコッカス・ミュータンス(Streptococcus mutans)、リステリア・イノキュア(Listeria innocua)、スタフィロコッカス・アウレウス(Staphylococcus aureus)又はクレブシエラ・ニューモニエ(Klebisella pneumoniae)。いくつかの実施形態では、用語Cas9とは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)Cas9タンパク質(配列番号1)のアミノ酸配列を含むポリペプチドを指す。いくつかの実施形態では、用語Cas9とは、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)Cas9タンパク質(配列番号17)のアミノ酸配列を含むポリペプチドを指す。いくつかの実施形態では、用語Cas9とは、ストレプトコッカス・ディスガラクティエ(Streptococcus dysgalactiae)Cas9タンパク質(配列番号18)のアミノ酸配列を含むポリペプチドを指す。いくつかの実施形態では、用語Cas9とは、ストレプトコッカス・ミュータンス(Streptococcus mutans)Cas9タンパク質(配列番号19)のアミノ酸配列を含むポリペプチドを指す。いくつかの実施形態では、用語Cas9とは、リステリア・イノキュア(Listeria innocua)Cas9タンパク質(配列番号20)のアミノ酸配列を含むポリペプチドを指す。いくつかの実施形態では、用語Cas9とは、スタフィロコッカス・アウレウス(Staphylococcus aureus)Cas9タンパク質(配列番号21)のアミノ酸配列を含むポリペプチドを指す。いくつかの実施形態では、用語Cas9とは、クレブシエラ・ニューモニエ(Klebisella pneumoniae)Cas9タンパク質(配列番号22)のアミノ酸配列を含むポリペプチドを指す。
いくつかの実施形態では、用語Cas9とは、配列番号1を含むポリペプチドを指す。いくつかの実施形態では、Cas9タンパク質は、配列番号1のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%同一である。いくつかの実施形態では、Cas9タンパク質は、配列番号3と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するポリヌクレオチド配列によってコードされるポリペプチドである。
いくつかの実施形態では、用語Cas9とは、粘着末端を生成可能なCas9を指す。本明細書において使用される用語「粘着末端」、「段違い末端」又は「粘着末端」は、不均等の長さの鎖を有する核酸フラグメントを指す。「平滑末端」と対照的に、粘着末端は、核酸、典型的にはDNA上の段違い切断により産生される。付着又は粘着末端は、非対合ヌクレオチド又は「オーバーハング」、例えば3’又は5’オーバーハングを有する突出する一本鎖の鎖を有する。それぞれのオーバーハングは、別の相補的オーバーハングとアニールして塩基対を形成し得る。2つの相補的粘着末端は、相互作用、例えば水素結合を介して一緒にアニールし得る。アニールされる粘着末端の安定性は、対合オーバーハングの融解温度に依存する。2つの相補的粘着末端は、化学的又は酵素的ライゲーションにより、例えばDNAリガーゼにより一緒に結合させることができる。
いくつかの実施形態では、用語Cas9とは、例えば、Cas9ハイブリッドタンパク質などの変容した機能を有するCas9変異体を指す。例えば、Cas9の結合ドメイン又は不活性のDNA開裂ドメインを有するCas9タンパク質は、ガイドポリヌクレオチドを介して所望の標的配列に特異的に結合するための結合ドメインとして用いることができる。結合ドメイン(すなわち不活性Cas9)は、開裂ドメイン、例えばエンドヌクレアーゼFokIの開裂ドメインに融合又は共役されて、改変ハイブリッドヌクレアーゼを生成することができる。Cas9-FokIハイブリッドタンパク質は、例えば、米国特許出願公開第2015/0071899号明細書及びGuilinger et al.,Nature Biotechnology 32:577-582(2014)で更に説明されている。改変ハイブリッドヌクレアーゼの他の例は、例えば、Wah et al.,Proc Nat Acad Sci 95:10564-10569(1996);Li et al.,Nucl Acids Res 39(1):359-372(2011);及びKim et al.,Proc Nat Acad Sci 93:1156-1160(1996)で説明されている。
Cpf1(セントロメア及びプロモーター因子1)もII型CRISPR系のRNA誘導ヌクレアーゼである。Cpf1は、粘着末端を生成する。CRISPR/Cpf1系は、CRISPR/Cas9系と相似である。しかしながら、Cas9及びCpf1との間にいくらかの差が存在する。Cas9と異なり、Cpf1は、tracrRNAを利用しない。Cpf1タンパク質は、Cas9と異なるPAM配列を認識し、Cpf1は、Cas9と異なる部位で開裂する。Cas9は、PAMに隣接する配列において開裂する一方、Cpf1は、PAMから更に遠い配列において開裂する。Cpf1タンパク質は、例えば、外国の特許公報である英国特許出願公開第1506509.7号明細書、米国特許第9,580,701号明細書、米国特許出願公開第2016/0208243号明細書及びZetsche et al.,Cell 163(3):759-771(2015)で更に説明されている。Cpf1と機能的に類似する酵素を本開示に基づいて使用することができる。したがって、いくつかの実施形態では、本開示は、本明細書に記載されるアミノ酸修飾を含む組換えCpf1タンパク質を提供する。
例えば、S.ピオゲネス(S.pyogenes)由来のCas9タンパク質などの一部の野生型又は天然発生Cas9タンパク質は、6つのドメインを有する:Rec1、Rec2、Bridge Helix(BH)、PAM相互作用(PI)、HNH及びRuvC。Rec1ドメインは、ガイドポリヌクレオチドの結合を司る。BHドメインは、標的配列の結合時に開裂活性の開始を司る。PIドメインは、PAM特異性を付与し、標的配列への結合の開始を司る。HNH及びRuvCドメインは、DNAを切断するヌクレアーゼドメインである。Cas9タンパク質の構造的研究により、タンパク質は、BH、Rec1及びRec2ドメインを含む認識ローブ(「RECローブ」)と、RuvC(RuvC I、RuvC II及びRuvC IIIサブドメインに分けられる)、HNH及びPIドメインを含むヌクレアーゼローブ(「NUCローブ」)とを有することが明らかになった。図3及び4を参照されたい。タンパク質ドメインは、タンパク質のアミノ酸配列に基づき、例えばSMART(Letunic et al.,Nucleic Acids Research(2017),doi:10.1093/nar/gkx922)、PANDA(Wang et al.,Scientific Reports 8:3484(2018))又はInterPro(Finn et al.,Nucleic Acids Research(2017),doi:10.1093/nar/gkw1107)などのドメイン構造予測ツールを用いて同定することができる。タンパク質ドメインは、タンパク質構造に基づき、例えば目視検査又はPUU(Holm et al.,Proteins 19(3):256-268(1994))、RigidFinder(Abyzov et al.,Proteins 78(2):309-324(2010))若しくはPiSQRD(Aleksiev et al.,Bioinformatics 25(20):2743-2744(2009))などのアルゴリズムを用いることによって同定することもできる。構造特徴決定に基づくCas9ドメインの同定は、例えば、Jinek et al.,Science 337:816-821(2012);Nishimasu et al.,Cell 156(5):935-949(2014);Anders et al.,Nature 513:569-573(2014);及びSternberg et al.,Nature 507(7490):62-67(2014)に記載されている。
いくつかの実施形態では、本開示のCas9タンパク質は、配列番号5のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRECローブを含む。いくつかの実施形態では、本開示のCas9タンパク質は、配列番号6~7のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するNUCローブを含む。
いくつかの実施形態では、本開示のCas9タンパク質は、配列番号8のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するBHドメインを含む。いくつかの実施形態では、本開示のCas9タンパク質は、配列番号9~10のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRec1ドメインを含む。いくつかの実施形態では、本開示のCas9タンパク質は、配列番号11のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRec2ドメインを含む。いくつかの実施形態では、本開示のCas9タンパク質は、配列番号12~14のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRuvCドメインを含む。いくつかの実施形態では、本開示のCas9タンパク質は、配列番号15のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するHNHドメインを含む。いくつかの実施形態では、本開示のCas9タンパク質は、配列番号16のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するPIドメインを含む。
Cas9タンパク質の構造研究、例えば結晶構造により、表面露出したタンパク質の領域が明らかになり得る。本明細書で使用するとき、「表面露出領域」とは、周辺環境にアクセス可能なタンパク質の領域、すなわちタンパク質の外「表面」上の領域を指す。同様に、「表面露出残基」としては、表面露出領域内にあるタンパク質のアミノ酸残基が挙げられる。表面露出残基は、タンパク質の中心に向けて内側を向き、周辺環境によりアクセス不可能な「埋没領域」を形成する「埋没」残基と対照をなす。タンパク質上の表面露出残基は、例えば、他のタンパク質又は細胞組織などの他の分子との相互作用に重要な役割を果たすことができる。このため、いくつかの実施形態では、タンパク質、例えばCas9タンパク質上の特定の残基は、ある立体配座状態で表面露出しているが、異なる立体配座状態で表明露出していない。例えば、Cas9タンパク質は、ガイドRNAに結合すると、立体構造変化を受ける場合があり、その結果、Cas9タンパク質中の以前には露出していなかった領域は、ガイドRNAが結合すると、表面露出するようになるか又はその逆である(例えば、Fagerlund et al.,Proc Nat Acad Sci 114(26):E5211-E5128(2017)を参照されたい)。
表面露出残基は、タンパク質の物理的特性を判定し、タンパク質の折り畳み構造を強制することもできる。表面露出残基は、例えば、PyMOL(pymol.org)又はSwiss PDB Viewer(spdbv.vital-it.ch)などのプログラム中でタンパク質結晶構造を閲覧すると判定することができる。表面露出残基は、例えば、NACCESS(bioinf.manchester.ac.uk/naccess)などのプログラムを用いてコンピュータで計算することもできる。タンパク質の表面露出残基は、例えば、結晶構造が利用不可能である場合、コンピュータ予測によって判定することもできる。タンパク質配列中の表面露出残基のコンピュータ予測ツールとしては、例えば、SARpred(Garg et al.,Proteins 61:318-24(2005))、the JOY PackageからのPSA/TEM(Mizuguchi et al.,Bioinformatics 14:617-623(1998))及びRSARF(caps.ncbs.res.in/download/pugal/RSARF)が挙げられる。
シャペロン介在性オートファジーの概要
「シャペロン介在性オートファジー」又はCMAとは、サイトゾルタンパク質のシャペロン依存性選択、続いてタンパク質を分解のためにリソソームに標的化すること及びこれらをリソソーム膜全体にわたり転座させることを伴う選択的タンパク質分解プロセスを指す。CMAの例示的なシャペロンタンパク質は、70kDの熱ショック同族タンパク質又はHSC70である。「エンドソームミクロオートファジー」又はeMIとは、CMAと同様のタンパク質分解プロセスを指すが、eMIは、KFERQモチーフ又はKFERQ様モチーフを含むタンパク質を、分解のために、リソソームではなく、後期エンドソームに選択的に標的化する点が異なる。CMAと同様に、HSC70は、eMIのためのシャペロンタンパク質でもある。例えば、Kaushik et al.,Trends Cell Biol 22(8):407-417(2012);Tekirdag et al.,J Biol Chem 293:5414-5424(2018);及びPereira et al.,Int J Cell Biol 2012(4):931956(2012)を参照されたい。
本明細書で称される「KFERQモチーフ」とは、ペンタペプチド配列:Lys-Phe-Glu-Arg-Gln(配列番号24)である。本明細書で称される「KFERQ様モチーフ」とは、KFERQと生化学的に同様であるか、又は生化学的に関連したモチーフである。生化学的に同様であるか、又は生化学的に関連したモチーフとしては、本明細書で論じられる機能的に同等のアミノ酸残基が挙げられ得る。したがって、KFERQモチーフは、以下のパラメータを有する任意のペンタペプチドであり得る:正電荷残基(例えば、Lys又はArg)の1つ又は2つ;バルキーな疎水性残基(例えば、Phe、Ile、Leu又はVal)の1つ又は2つ;負電荷残基(例えば、Asp又はGlu);及びペンタペプチドのいずれかの側にフランキングするGln又はAsn。例えば、Dice et al.,Trends Biochem Sci 15(8):305-309(1990);及びKaushik et al.,Trends Cell Biol 22(8):407-417(2012)を参照されたい。KFERQ様モチーフの例としては、表1に列挙したモチーフが挙げられるが、これらに限定されない。
少なくとも1つのKFERQモチーフ又はKFERQ様モチーフを含むタンパク質は、CMA又はeMIの構成要素によって認識され得る。したがって、いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフは、シャペロン介在性オートファジー(CMA)標的モチーフである。いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフは、エンドソームミクロオートファジー(eMI)標的モチーフである。特定の理論に束縛されるものではないが、KFERQモチーフ又はKFERQ様モチーフは、他のタンパク質分解経路のための標的として機能することができ、また、他のコンセンサス配列又はモチーフ(本明細書で説明するKFERQモチーフ又はKFERQ様モチーフ以外)は、CMA又はeMI標的モチーフであるという理解のもと、CMA及びeMIは、本開示を例示する目的で本明細書に記載される。
HSC70は、タンパク質上で例えばKFERQモチーフ又はKFERQ様モチーフなどのCMA又はeMI標的モチーフを認識し、これと結合して、シャペロン-タンパク質複合体を形成する。続いて、シャペロン-タンパク質複合体は、リソソーム関連膜タンパク質2A型(LAMP-2A)受容体に結合する。タンパク質は、アンフォールドして、LAMP-2Aの多量体化をトリガする。アンフォールドしたタンパク質は、その後、Lamp-2Aを介してリソソーム膜全体にわたり転座され、最終的に、転座タンパク質は、分解する。例えば、Kaushik et al.,Trends Cell Biol 22(8):407-417(2012)を参照されたい。
組換えCas9タンパク質
本開示の組換えCas9タンパク質は、機能性Cas9ヌクレアーゼであり、野生型Cas9と比較して低減されたオフターゲット修飾を有する。「機能性Cas9ヌクレアーゼ」とは、組換えCas9タンパク質が、Cas9活性アッセイにより測定して、野生型Cas9タンパク質と少なくともほぼ同じレベルのヌクレアーゼ活性を有することを意味する。「機能性Cas9ヌクレアーゼ」とは、組換えCas9が、Cas9効率アッセイにより測定して、野生型Cas9タンパク質とほぼ同じレベルのオンターゲット修飾(すなわちゲノム編集効率)を有することも意味する。
いくつかの実施形態では、本開示の組換えCas9タンパク質は、Cas9活性アッセイにより測定して、野生型Cas9タンパク質の少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%又は少なくとも約100%のヌクレアーゼ活性を有する。いくつかの実施形態では、本開示の組換えCas9タンパク質は、Cas9活性アッセイにより測定して、野生型Cas9タンパク質よりも高いヌクレアーゼ活性を有する。Cas9活性アッセイの非限定例としては、T7エンドヌクレアーゼIアッセイ及びSURVEYORアッセイ(Vouillot et al.,G3(Bethesda)5(3):407-415(2015)で審査されている)が挙げられる。いくつかの実施形態では、本開示の組換えCas9タンパク質は、Cas9効率アッセイにより測定して、野生型Cas9タンパク質の少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%又は少なくとも約100%のオンターゲット修飾を有する。いくつかの実施形態では、本開示の組換えCas9タンパク質は、Cas9効率アッセイにより測定して、野生型Cas9タンパク質よりも高いオンターゲット修飾を有する。Cas9効率アッセイの非限定例としては、ミスマッチ検出アッセイ及び配列決定に基づくアッセイが挙げられる(Zischewski et al.,Biotechnol Adv 35:95-104(2017)で審査されている)。
いくつかの実施形態では、本開示は、改変KFERQモチーフ又はKFERQ様モチーフを含む組換えCas9タンパク質を提供する。
本明細書に記載される通り、KFERQモチーフ又はKFERQ様モチーフは、CMA又はeMIの構成要素によって認識される。したがって、いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、CMA又はeMIの構成要素によって認識される。いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフは、配列番号24~41のいずれか1つである。したがって、いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフは、KFERQ(配列番号24)、RKVEQ(配列番号25)、QDLKF(配列番号26)、QRFFE(配列番号27)、NRVVD(配列番号28)、QRDKV(配列番号29)、QKILD(配列番号30)、QKKEL(配列番号31)、QFREL(配列番号32)、IKLDQ(配列番号33)、DVVRQ(配列番号34)、QRIVE(配列番号35)、VKELQ(配列番号36)、QKVFD(配列番号37)、QELLR(配列番号38)、VDKLN(配列番号39)、RIKEN(配列番号40)又はNKKFE(配列番号41)である。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、VDKLN(配列番号39)である。
いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列KFERQ(配列番号24)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列RKVEQ(配列番号25)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QDLKF(配列番号26)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QRFFE(配列番号27)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列NRVVD(配列番号28)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QRDKV(配列番号29)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。
いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QKILD(配列番号30)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QKKEL(配列番号31)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QFREL(配列番号32)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列IKLDQ(配列番号33)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列DVVRQ(配列番号34)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QRIVE(配列番号35)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列VKELQ(配列番号36)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。
いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QKVFD(配列番号37)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列QELLR(配列番号38)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列VDKLN(配列番号39)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列RIKEN(配列番号40)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、アミノ酸配列NKKFE(配列番号41)を有する改変KFERQモチーフ又はKFERQ様モチーフを含む。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1の第1のアミノ酸残基の前にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1のアミノ酸残基1~100にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1のアミノ酸残基100~300にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1のアミノ酸残基300~700にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1のアミノ酸残基700~900にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1のアミノ酸残基900~1100にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1のアミノ酸残基1100~1300にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、配列番号1の最後のアミノ酸残基の後にある。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、Cas9タンパク質のRECローブ中にある。いくつかの実施形態では、Cas9タンパク質のRECローブは、BHドメイン、Rec1ドメイン及びRec2ドメインを含む。いくつかの実施形態では、RECローブは、配列番号5のアミノ酸配列を有する。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、RECローブのRec1ドメイン中にある。いくつかの実施形態では、Rec1ドメインは、配列番号9~10のアミノ酸配列を有する。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、RECローブのRec2ドメイン中にある。いくつかの実施形態では、Rec2ドメインは、配列番号11のアミノ酸配列を有する。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、RECローブのBHドメイン中にある。いくつかの実施形態では、BHドメインは、配列番号8のアミノ酸配列を有する。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、Cas9タンパク質のNUCローブ中にある。いくつかの実施形態では、Cas9タンパク質のNUCローブは、RuvCドメイン、HNHドメイン及びPIドメインを含む。いくつかの実施形態では、NUCローブは、配列番号6~7のアミノ酸配列を有する。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、Cas9タンパク質のRuvCドメイン、HNHドメイン又はPIドメイン中にある。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、RuvCドメイン中にある。いくつかの実施形態では、RuvCドメインは、配列番号12~14のアミノ酸配列を有する。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、HNHドメイン中にある。いくつかの実施形態では、HNHドメインは、配列番号15のアミノ酸配列を有する。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、PIドメイン中にある。いくつかの実施形態では、PIドメインは、配列番号16のアミノ酸配列を有する。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号5のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するローブを含む。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号6~7のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するローブを含む。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号8のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するBHドメインを含む。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号9~10のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRec1ドメインを含む。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号11のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRec2ドメインを含む。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号12~14のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するRuvCドメインを含む。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号15のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するHNHドメインを含む。いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフを含むCas9タンパク質は、配列番号16のアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は約100%の同一性を有するPIドメインを含む。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、組換えCas9タンパク質の表面露出領域中にある。本明細書に記載される通り、表面露出領域とは、周辺環境にアクセス可能である、例えばタンパク質分解経路の構成要素にアクセス可能であるCas9タンパク質の領域を指す。いくつかの実施形態では、組換えCas9タンパク質の表面露出領域は、Cas9タンパク質のRECローブ中にある。いくつかの実施形態では、組換えCas9タンパク質の表面露出領域は、Cas9タンパク質のNUCローブ中にある。いくつかの実施形態では、組換えCas9タンパク質の表面露出領域は、Cas9タンパク質のRec1ドメイン、Rec2ドメイン、BHドメイン、RuvCドメイン、HNHドメイン又はPIドメイン中にある。いくつかの実施形態では、組換えCas9タンパク質の表面露出領域は、Cas9タンパク質のアミノ酸残基150~250の間にある。
いくつかの実施形態では、改変KFERQモチーフ又はKFERQ様モチーフは、組換えCas9タンパク質のN末端又はC末端にある。本明細書に記載される通り、N末端は、タンパク質又はポリペプチドの「開始点」であり、C末端は、タンパク質又はポリペプチドの「終点」である。したがって、いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフは、Cas9タンパク質のN末端「開始点」にある。いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフは、Cas9タンパク質のC末端「終点」にある。いくつかの実施形態では、改変モチーフをタンパク質のN末端又はC末端に付加しても、タンパク質の折り畳み、構造又は動態に影響を及ぼさない。いくつかの実施形態では、Cas9のN末端は、表面露出している。いくつかの実施形態では、Cas9のC末端は、表面露出している。
いくつかの実施形態では、本開示は、野生型Cas9タンパク質の1つ以上のアミノ酸修飾を含む組換えCas9タンパク質であって、アミノ酸修飾は、Cas9タンパク質中にシャペロン介在性オートファジー(CMA)標的モチーフ又はエンドソームミクロオートファジー(eMI)標的モチーフを導入し、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも20%急速に分解する、組換えCas9タンパク質を提供する。いくつかの実施形態では、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも50%急速に分解する。いくつかの実施形態では、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも80%急速に分解する。
いくつかの実施形態では、本開示は、野生型Cas9タンパク質中に1つ以上のアミノ酸修飾を含む組換えCas9タンパク質であって、CMA標的モチーフ又はeMI標的モチーフを含む組換えCas9タンパク質を提供する。
本明細書に記載される通り、CMAモチーフ又はeMIモチーフを含有するタンパク質は、CMA又はeMIタンパク質分解経路の標的である。したがって、いくつかの実施形態では、CMA又はeMI標的モチーフを導入する1つ以上のアミノ酸修飾を含む本開示の組換えCas9タンパク質は、CMA又はeMIを介したタンパク質分解の標的となる。同様に、いくつかの実施形態では、CMA標的モチーフ又はeMI標的モチーフを含む本開示の組換えCas9タンパク質は、CMA又はeMIを介したタンパク質分解の標的となる。
いくつかの実施形態では、CMA又はeMI標的モチーフを含む組換えCas9タンパク質は、インビボで、免疫ブロッティング又はGFPレポーターアッセイにより測定して、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも20%急速に、少なくとも30%急速に、少なくとも40%急速に、少なくとも50%急速に、少なくとも60%急速に、少なくとも70%急速に、少なくとも80%急速に、少なくとも90%急速に、少なくとも100%急速に、少なくとも150%急速に、少なくとも200%急速に、少なくとも500%急速に分解する。いくつかの実施形態では、同じ細胞が、(a)CMA又はeMI標的モチーフを導入する1つ以上のアミノ酸修飾を含む組換えCas9、及び(b)野生型Cas9を発現する場合、組換えCas9は、完全に分解される一方、野生型Cas9の少なくとも50%は、細胞内に依然として残る。同様に、いくつかの実施形態では、同じ細胞が、(a)CMA又はeMI標的モチーフを導入する1つ以上のアミノ酸修飾を含む組換えCas9、及び(b)CMA又はeMI標的モチーフを含まないCas9タンパク質を発現する場合、組換えCas9は、完全に分解される一方、CMA又はeMI標的モチーフを含まないCas9タンパク質の少なくとも50%は、細胞内に依然として残る。いくつかの実施形態では、組換えCas9は、完全に分解される一方、野生型Cas9又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質の少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%又は少なくとも100%は、細胞内に依然として残る。いくつかの実施形態では、組換えCas9は、細胞に導入してから12時間以内、24時間以内、36時間以内、48時間以内又は72時間以内に完全に分解される。本明細書の実施形態で使用するとき、「完全に分解される」とは、GFPレポーターアッセイ又は免疫ブロッティング法の検出レベルを下回るタンパク質を指す。本明細書に記載される通り、タンパク質の分解速度を測定する方法としては、例えば、アミノ酸同位体のパルスチェイス(例えば、細胞培養又はSILACにおけるアミノ酸を用いた安定同位体標識化)、合成後放射性同位元素標識化又は例えばGFPをレポータータンパク質として使用するグローバルタンパク質安定性プロファイリング(GPSP)などのレポーター依存性アプローチが挙げられる(例えば、Yewdell et al.,Cell Biol Int 35(5):457-462(2011)を参照されたい)。いくつかの実施形態では、Cas9タンパク質の分解速度は、例えば、免疫ブロットの濃度測定分析を用いて、異なる時点におけるCas9細胞中のタンパク質の量を定量化することと、経時的なタンパク質レベルをプロットすることと、Cas9タンパク質レベル対時間プロットから分解速度を判定することとによって測定される。
いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置F185における変異が挙げられる。いくつかの実施形態では、変異は、F185Nである。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置A547及びI548における変異が挙げられる。いくつかの実施形態では、変異は、A547E及びI548Lである。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置T560及びV561における変異が挙げられる。いくつかの実施形態では、変異は、T560E及びV561Qである。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置D829及びI830における変異が挙げられる。いくつかの実施形態では、変異は、D829L及びI830Rである。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置L1087及びS1088における変異が挙げられる。いくつかの実施形態では、変異は、L1087E及びS1088Qである。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置P1199及びK1200における変異が挙げられる。いくつかの実施形態では、変異は、P1199D及びK1200Qである。
いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、本明細書に記載した変異のいずれかの組み合わせが挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、F185N、A547E、I548L及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、F185N、T560E、V561Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、F185N、D829L、I830R及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、F185N、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、F185N、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。
いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、T560E、V561Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、D829L、I830R及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、T560E、V561Q、D829L、I830R及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、T560E、V561Q、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、T560E、V561Q、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、D829L、I830R、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、D829L、I830R、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えCas9中の1つ以上のアミノ酸修飾としては、L1087E、S1088Q、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、本明細書に記載される通り、組換えCas9タンパク質中の1つ以上のアミノ酸修飾は、1つ以上のCMA標的モチーフ又はeMI標的モチーフをもたらす。
いくつかの実施形態では、組換えCas9タンパク質は、配列番号1と少なくとも50%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えCas9タンパク質は、配列番号1と少なくとも60%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えCas9タンパク質は、配列番号1と少なくとも70%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えCas9タンパク質は、配列番号1と少なくとも80%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えCas9タンパク質は、配列番号1と少なくとも90%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えCas9タンパク質は、配列番号1と少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。
いくつかの実施形態では、本開示は、配列番号1の位置F185、A547、I548、T560、V561、D829、I830、L1087、S1088、P1199、K1200又はこれらの組み合わせの1つ以上にアミノ酸修飾を含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)を提供する。
いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置F185における変異が挙げられる。いくつかの実施形態では、変異は、F185Nである。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置A547及びI548における変異が挙げられる。いくつかの実施形態では、変異は、A547E及びI548Lである。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置T560及びV561における変異が挙げられる。いくつかの実施形態では、変異は、T560E及びV561Qである。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置D829及びI830における変異が挙げられる。いくつかの実施形態では、変異は、D829L及びI830Rである。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置L1087及びS1088における変異が挙げられる。いくつかの実施形態では、変異は、L1087E及びS1088Qである。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、配列番号1の位置P1199及びK1200における変異が挙げられる。いくつかの実施形態では、変異は、P1199D及びK1200Qである。
いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、本明細書に記載した変異のいずれかの組み合わせが挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、F185N、A547E、I548L及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、F185N、T560E、V561Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、F185N、D829L、I830R及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、F185N、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、F185N、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。
いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、T560E、V561Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、D829L、I830R及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、A547E、I548L、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、T560E、V561Q、D829L、I830R及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、T560E、V561Q、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、T560E、V561Q、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、D829L、I830R、L1087E、S1088Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、D829L、I830R、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9中の1つ以上のアミノ酸修飾としては、L1087E、S1088Q、P1199D、K1200Q及びこれらの組み合わせから選択される変異が挙げられる。いくつかの実施形態では、組換えSpCas9タンパク質中の1つ以上のアミノ酸修飾は、1つ以上のCMA標的モチーフ又はeMI標的モチーフをもたらす。CMA標的モチーフ及びeMI標的モチーフは、本明細書で説明される。
いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1と少なくとも50%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1と少なくとも60%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1と少なくとも70%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1と少なくとも80%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1と少なくとも90%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1と少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一であり、本明細書に記載される1つ以上のアミノ酸修飾を含むアミノ酸配列を有する。
いくつかの実施形態では、本開示は、70kDの熱ショック同族タンパク質(HSC70)に結合することが可能な組換えCas9タンパク質を提供する。
本明細書に記載される通り、HSC70は、CMA及びeMIタンパク質分解経路の両方におけるシャペロンタンパク質である。HSC70は、分解の標的であるタンパク質に結合し、タンパク質を分解のためにリソソーム(CMAの場合)又は後期エンドソーム(eMIの場合)に輸送する。したがって、いくつかの実施形態では、HSC70に対してより高い結合親和性を有するタンパク質は、HSC70に対してより低い結合親和性を有するタンパク質と比較して急速に分解する。いくつかの実施形態では、タンパク質の結合能及び/又はHSC70に対する親和性は、タンパク質上のCMA又はeMI標的モチーフ、例えばKFERQモチーフ又はKFERQ様モチーフの存在によって判定される。
いくつかの実施形態では、本開示の組換えCas9タンパク質は、HSC70に結合することが可能である。本明細書で説明及び例示される通り、野生型Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9タンパク質は、HSC70に結合しない。いくつかの実施形態では、本開示の組換えCas9タンパク質は、野生型Cas9タンパク質又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9タンパク質よりも少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%又は少なくとも100%高い親和性でHSC70に結合することが可能である。タンパク質間の結合親和性を判定する方法は、当技術分野で既知であり、例えば共免疫沈降法、蛍光蛋白質再構成法、アフィニティー電気泳動法、プルダウンアッセイ法、ファージディスプレイ法、インビボ架橋法、タンデムアフィニティー精製、架橋後質量分析法及び近接ライゲーションアッセイなどの生化学的方法;生体層干渉法、動的光散乱法、表面プラズモン共鳴法、蛍光共鳴エネルギー移動法及び等温滴定熱量法などの生物物理学方法;並びに/又は酵母ツーハイブリッドスクリーニング法及び細菌ツーハイブリッドスクリーニング法などの遺伝的方法を含む。結合親和性の測定及びタンパク質相互作用の検出方法の概要に関しては、例えば、Meyerkord and Fu,Protein-Protein Interactions:Methods and Applications 2nd Ed.2015,Humana Pressを参照されたい。いくつかの実施形態では、本開示の組換えCas9は、HSC70を用いたインキュベーション期間後にHSC70抗体によって検出されることが可能である一方、野生型Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9タンパク質は、同じインキュベーション期間後にHSC70抗体によって検出されない。
いくつかの実施形態では、HSC70と組換えCas9との間の結合親和性は、HSC70と野生型Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9タンパク質との間の結合親和性よりも少なくとも2倍高い、少なくとも3倍高い、少なくとも4倍高い、少なくとも5倍高い、少なくとも6倍高い、少なくとも7倍高い、少なくとも8倍高い、少なくとも9倍高い、少なくとも10倍高い、少なくとも20倍高い、少なくとも30倍高い、少なくとも40倍高い、少なくとも50倍高い、少なくとも60倍高い、少なくとも70倍高い、少なくとも80倍高い、少なくとも90倍高い、少なくとも100倍高い、少なくとも500倍高い又は少なくとも1000倍高い。
いくつかの実施形態では、本開示は、配列番号1のアミノ酸位置185に改変KFERQモチーフ又はKFERQ様モチーフを含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)を提供する。
本明細書に記載される通り、配列番号1は、S.ピオゲネス(S.pyogenes)由来の野生型Cas9タンパク質(SpCas9)のアミノ酸配列を含む。配列番号1のアミノ酸位置185は、SpCas9のRec2ドメインに対応する領域中にある。いくつかの実施形態では、配列番号1の位置185におけるアミノ酸残基は、KFERQモチーフ又はKFERQ様モチーフを生成するために修飾される。いくつかの実施形態では、配列番号1の位置185におけるKFERQ様モチーフは、VDKLNである。いくつかの実施形態では、組換えSpCas9タンパク質は、配列番号1の位置185に変異を含む。いくつかの実施形態では、変異は、F185Nである。
いくつかの実施形態では、本開示の組換えCas9は、配列番号1の位置D10及び/又はH840における変異を更に含む。野生型Cas9の位置D10及び/又はH840における変異は、ニッカーゼ活性を有するCas9を生成し、これは、本明細書では「Cas9ニッカーゼ」とも称される。Cas9ニッカーゼは、二本鎖DNAの一方の鎖のみを開裂させ得る(すなわちDNAを「ニッキングする」)。Cas9ニッカーゼは、例えばCho et al.,Genome Res 24:132-141(2013)で説明される。いくつかの実施形態では、本開示の組換えCas9タンパク質は、配列番号1のアミノ酸位置D10における変異を更に含む。いくつかの実施形態では、本開示の組換えCas9タンパク質は、配列番号1のアミノ酸位置H840における変異を更に含む。いくつかの実施形態では、本開示の組換えCas9タンパク質は、配列番号1のアミノ酸位置D10に変異及びアミノ酸位置H840における変異を更に含む。いくつかの実施形態では、位置D10における変異は、D10Aである。いくつかの実施形態では、位置D10における変異は、D10Nである。いくつかの実施形態では、位置H840における変異は、H840Aである。いくつかの実施形態では、位置H840における変異は、H840Nである。いくつかの実施形態では、位置H840における変異は、H840Yである。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異及びD10A変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異及びD10N変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異及びH840Y変異を有する。
いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10A変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10A変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10A変異及びH840Y変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10N変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10N変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10N変異及びH840Y変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10A変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10A変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10A変異及びH840Y変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10N変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10N変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9タンパク質は、F185N変異、D10N変異及びH840Y変異を有する。
いくつかの実施形態では、本開示の組換えCas9タンパク質は、粘着末端を生成する。本明細書に記載される通り、粘着末端とは、不均等な長さの鎖を有する核酸フラグメントを指す。いくつかの実施形態では、粘着末端を生成する組換えCas9タンパク質は、組換えCas9-FokIハイブリッドタンパク質である。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異及びD10A変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異及びD10N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異及びH840Y変異を有する。
いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10A変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10A変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10A変異及びH840Y変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10N変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10N変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10N変異及びH840Y変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10A変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10A変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10A変異及びH840Y変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10N変異及びH840A変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10N変異及びH840N変異を有する。いくつかの実施形態では、組換えCas9-FokIハイブリッドタンパク質は、Cas9中にF185N変異、D10N変異及びH840Y変異を有する。
いくつかの実施形態では、粘着末端を生成する組換えCas9タンパク質は、野生型Cas9タンパク質上において、粘着末端を生成することが可能な改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、粘着末端を生成することが可能な野生型Cas9タンパク質は、フランシセラ・ノビサイダ(Francisella novicida)から単離される(FnCas9)(配列番号23)。いくつかの実施形態では、組換えCas9タンパク質は、配列番号23と少なくとも約90%配列同一性のアミノ酸配列を有し、また本明細書に記載される改変KFERQモチーフ又はKFERQ様モチーフを含む。いくつかの実施形態では、組換えCas9タンパク質は、配列番号23と少なくとも約90%配列同一性のアミノ酸配列を有し、またCMA標的モチーフ又はeMI標的モチーフを含む。いくつかの実施形態では、組換えCas9は、配列番号23と少なくとも約90%配列同一性のアミノ酸配列を有し、野生型Cas9よりも高い親和性でHSC70に結合することが可能である。いくつかの実施形態では、組換えCas9は、配列番号23と少なくとも約90%配列同一性のアミノ酸配列を有し、野生型Cas9よりも急速に分解する。
いくつかの実施形態では、本開示の組換えCas9は、1つ以上の核局在化シグナルを含む。「核局在化シグナル」又は「核局在化配列」(NLS)は、核輸送による細胞核中への輸送のためにタンパク質を「タグ付けする」アミノ酸配列であり、すなわち、NLSを有するタンパク質は、細胞核中に輸送される。典型的には、NLSは、タンパク質表面上で露出される正電荷Lys又はArg残基を含む。例示的な核局在化配列としては、SV40ラージT-抗原、核質、EGL-13、c-Myc及びTUS-タンパク質由来のNLSが挙げられるが、これらに限定されない。いくつかの実施形態では、NLSは、配列PKKKRKV(配列番号42)を含む。いくつかの実施形態では、NLSは、配列AVKRPAATKKAGQAKKKKLD(配列番号43)を含む。いくつかの実施形態では、NLSは、配列PAAKRVKLD(配列番号44)を含む。いくつかの実施形態では、NLSは、配列MSRRRKANPTKLSENAKKLAKEVEN(配列番号45)を含む。いくつかの実施形態では、NLSは、配列KLKIKRPVK(配列番号46)を含む。他の核局在化配列としては、hnRNP A1の酸性M9ドメイン、酵母転写抑制因子Matα2中の配列KIPIK(配列番号47)及びPY-NLSが挙げられるが、これらに限定されない。
ヌクレオチド
いくつかの実施形態では、本開示は、本明細書に記載される組換えCas9タンパク質をコードするポリヌクレオチド配列を提供する。いくつかの実施形態では、本開示は、改変KFERQモチーフ又はKFERQ様モチーフを含む組換えCas9をコードするポリヌクレオチド配列を提供する。いくつかの実施形態では、本開示は、野生型Cas9タンパク質の1つ以上のアミノ酸修飾を含む組換えCas9タンパク質をコードするポリヌクレオチド配列であって、アミノ酸修飾は、Cas9タンパク質中にCMA標的モチーフ又はeMI標的モチーフを導入し、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質よりも少なくとも20%急速に分解する、ポリヌクレオチド配列を提供する。いくつかの実施形態では、本開示は、野生型Cas9タンパク質中に1つ以上のアミノ酸修飾を含む組換えCas9タンパク質をコードするポリヌクレオチド配列であって、組換えCas9タンパク質は、CMA標的モチーフ又はeMI標的モチーフを含む、ポリヌクレオチド配列を提供する。いくつかの実施形態では、本開示は、配列番号1の位置F185、A547、I548、T560、V561、D829、I830、L1087、S1088、P1199、K1200又はこれらの組み合わせの1つ以上にアミノ酸修飾を含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)をコードするポリヌクレオチド配列を提供する。いくつかの実施形態では、本開示は、HSC70に結合することが可能な組換えCas9タンパク質をコードするポリヌクレオチド配列を提供する。いくつかの実施形態では、本開示は、配列番号1のアミノ酸位置185に改変KFERQモチーフ又はKFERQ様モチーフを含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)をコードするポリヌクレオチド配列を提供する。
いくつかの実施形態では、ポリヌクレオチド配列は、配列番号3と少なくとも50%の配列同一性を有する。いくつかの実施形態では、ポリヌクレオチド配列は、配列番号3と少なくとも60%の配列同一性を有する。いくつかの実施形態では、ポリヌクレオチド配列は、配列番号3と少なくとも70%の配列同一性を有する。いくつかの実施形態では、ポリヌクレオチド配列は、配列番号3と少なくとも80%の配列同一性を有する。いくつかの実施形態では、ポリヌクレオチド配列は、配列番号3と少なくとも90%の配列同一性を有する。いくつかの実施形態では、ポリヌクレオチド配列は、配列番号3と少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%の配列同一性を有する。
いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド配列は、真核細胞中での発現のためにコドン最適化されている。いくつかの実施形態では、stiCas9をコードするポリヌクレオチド配列は、動物細胞中での発現のためにコドン最適化されている。いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド配列は、ヒト細胞中での発現のためにコドン最適化されている。いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド配列は、植物細胞中での発現のためにコドン最適化されている。コドン最適化は、組換え又は異種タンパク質発現の収量及び効率を増加させるためにその発現を宿主のtRNA存在量にマッチさせるようにコドンを調整することである。コドン最適化法は、当技術分野における定型作業であり、ソフトウェアプログラム、例えばIntegrated DNA TechnologiesのCodon Optimizationツール、EntelechonのCodon Usage Table分析ツール、GENEMAKERのBlue Heronソフトウェア、AptagenのGene Forgeソフトウェア、DNA Builderソフトウェア、General Codon Usage Analysisソフトウェア、公的に利用可能なOPTIMIZERソフトウェア及びGenscriptのOptimumGeneアルゴリズムなどを使用して実施することができる。
CRISPR-Cas系
いくつかの実施形態では、本開示は、本明細書で提供される組換えCas9タンパク質と、組換えCas9タンパク質との複合体を形成し、且つガイド配列を含むガイドポリヌクレオチドとを含む非天然発生CRISPR-Cas系を提供する。
いくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質としては、改変KFERQモチーフ又はKFERQ様モチーフが挙げられる。いくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、野生型Cas9タンパク質の1つ以上のアミノ酸修飾を含み、アミノ酸修飾は、Cas9タンパク質中にCMA標的モチーフ又はeMI標的モチーフを導入し、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも20%急速に分解する。いくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、野生型Cas9タンパク質中に1つ以上のアミノ酸修飾を含み、組換えCas9タンパク質は、CMA標的モチーフ又はeMI標的モチーフを含む。いくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、S.ピオゲネス(S.pyogenes)から単離されており(SpCas9)、配列番号1の位置F185、A547、I548、T560、V561、D829、I830、L1087、S1088、P1199、K1200又はこれらの組み合わせの1つ以上にアミノ酸修飾を含む。いくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、HSC70と結合することが可能である。いくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、S.ピオゲネス(S.pyogenes)から単離されており(SpCas9)、配列番号1のアミノ酸位置185に改変KFERQモチーフ又はKFERQ様モチーフを含む。
いくつかの実施形態では、本開示は、本明細書で提供される組換えCas9タンパク質をコードするポリヌクレオチド配列と、組換えCas9タンパク質との複合体を形成し、且つガイド配列を含むガイドポリヌクレオチドとを含む非天然発生CRISPR-Cas系を提供する。
いくつかの実施形態では、本開示は、本明細書で提供される組換えCas9タンパク質をコードするポリヌクレオチド配列と操作可能に連結された調節エレメントと、組換えCas9タンパク質との複合体を形成し、且つガイド配列を含むガイドポリヌクレオチドとを含む非天然発生CRISPR-Cas系を提供する。
いくつかの実施形態では、非天然発生CRISPR-Cas系のポリヌクレオチドは、改変KFERQモチーフ又はKFERQ様モチーフを含む組換えCas9をコードする。いくつかの実施形態では、非天然発生CRISPR-Cas系のポリヌクレオチドは、野生型Cas9タンパク質の1つ以上のアミノ酸修飾を含む組換えCas9タンパク質をコードし、アミノ酸修飾は、Cas9タンパク質中にCMA標的モチーフ又はeMI標的モチーフを導入し、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも20%急速に分解する。いくつかの実施形態では、非天然発生CRISPR-Cas系のポリヌクレオチドは、野生型Cas9タンパク質中に1つ以上のアミノ酸修飾を含む組換えCas9タンパク質をコードし、組換えCas9タンパク質は、CMA標的モチーフ又はeMI標的モチーフを含む。いくつかの実施形態では、非天然発生CRISPR-Cas系のポリヌクレオチドは、配列番号1の位置F185、A547、I548、T560、V561、D829、I830、L1087、S1088、P1199、K1200又はこれらの組み合わせの1つ以上にアミノ酸修飾を含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)をコードする。いくつかの実施形態では、非天然発生CRISPR-Cas系のポリヌクレオチドは、HSC70と結合することが可能な組換えCas9タンパク質をコードする。いくつかの実施形態では、非天然発生CRISPR-Cas系のポリヌクレオチドは、配列番号1のアミノ酸位置185に改変KFERQモチーフ又はKFERQ様モチーフを含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)をコードする。
いくつかの実施形態では、組換えCas9タンパク質をコードするポリヌクレオチド配列と結合した調節エレメントは、プロモーターである。いくつかの実施形態では、調節エレメントは、細菌プロモーターである。いくつかの実施形態では、調節エレメントは、ウイルスプロモーターである。いくつかの実施形態では、調節エレメントは、真核生物調節エレメント、すなわち真核生物プロモーターである。いくつかの実施形態では、真核生物調節エレメントは、哺乳動物プロモーターである。
いくつかの実施形態では、非天然発生CRISPR-Cas系のガイドポリヌクレオチドは、RNA分子である。CRISPR-Cas構成成分に結合し、それらを標的DNA内の特異的位置に標的化するRNA分子は、本明細書において「ガイドRNA」、「gRNA」又は「小分子ガイドRNA」と称され、本明細書において「DNA標的化RNA」と称することもできる。ガイドポリヌクレオチド、例えばガイドRNAは、少なくとも2つのヌクレオチドセグメント、すなわち少なくとも1つの「DNA結合セグメント」及び少なくとも1つの「ポリペプチド結合セグメント」を含む。「セグメント」とは、分子の一部、セクション又は領域、例えばガイドポリヌクレオチド分子のヌクレオチドの連続ストレッチを意味する。「セグメント」の定義は、特に具体的に定義されない限り、特定数の合計塩基対に限定されない。
いくつかの実施形態では、ガイドポリヌクレオチドのDNA結合セグメント(又は「DNA標的化配列」)は、細胞中の標的配列とハイブリダイズする。いくつかの実施形態では、ガイドポリヌクレオチド、例えばガイドRNAのDNA結合セグメントは、標的DNA内で特定の配列に対して相補的なポリヌクレオチド配列を含む。
いくつかの実施形態では、本開示のガイドポリヌクレオチドは、細菌細胞中の標的配列にハイブリダイズするガイド配列を有する。方法のいくつかの実施形態では、標的配列は、細菌細胞中にある。いくつかの実施形態では、細菌細胞は、実験室株である。こうした細胞の例としては、E.コリ(E.coli)、S.アウレウス(S.aureus)、V.コレラ(V.cholerae)、S.ニューモニエ(S.pneumoniae)、B.サブチルス(B.subtilis)、C.クレセンタス(C.crescentus)、M.ジェニタリウム(M.genitalium)、A.フィシェリ(A.fischeri)、シネコシスティス(Synechocystis)、P.フルオレッセンス(P.fluorescens)、A.ビネランジイ(A.vinelandii)、S.コエリカラー(S.coelicolor)が挙げられるが、これらに限定されない。いくつかの実施形態では、細菌細胞は、食料及び/又は飲料の調製に用いられる細菌からなる。こうした細胞の非限定的な例示の属としては、アセトバクター(Acetobacter)、アルスロバクター(Arthrobacter)、バチルス(Bacillus)、ビフィドバクテリウム(Bifidobacterium)、ブラキバクテリウム(Brachybacterium)、ブレビバクテリウム(Brevibacterium)、カルノバクテリウム(Carnobacterium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、グルコナセトバクター(Gluconacetobacter)、ハフニア(Hafnia)、ハロモナス(Halomonas)、Kocuria(コクリア)、ラクトバシラス(Lactobacillus)、(L.アセトトレランス(L.acetotolerans)、L.アシジピスシス(L.acidipiscis)、L.アシドフィルス(L.acidophilus)、L.アリメンタリウス(L.alimentarius)、L.ブレビス(L.brevis)、L.ブチエリ(L.bucheri)、L.カゼイ(L.casei)、L.カルバツス(L.curvatus)、L.ファーメンタム(L.fermentum)、L.ヒルガルジイ(L.hilgardii)、L.ジェンセニイ(L.jensenii)、L.キムチイ(L.kimchii)、L.ラクチス(L.lactis)、L.パラカゼイ(L.paracasei)、L.プランタルム(L.plantarum)及びL.サケイ(L.sakei)を含む)リューコノストック(Leuconostoc)、ミクロバクテリウム(Microbacterium)、ペジオコックス(Pediococcus)、プロピオニバクテリウム(Propionibacterium)、ワイセラ(Weissella)及びザイモモナス(Zymomonas)が挙げられるが、これらに限定されない。
いくつかの実施形態では、本開示のガイドポリヌクレオチドは、真核細胞中の標的配列にハイブリダイズするガイド配列を有する。いくつかの実施形態では、真核細胞は、動物又はヒト細胞である。いくつかの実施形態では、真核細胞は、ヒト、又はげっ歯類、又はウシ細胞系、又は細胞株である。このような細胞、細胞系又は細胞株の例としては、限定されるものではないが、マウス骨髄腫(NSO)細胞系、チャイニーズハムスター卵母(CHO)細胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓細胞)、VERO、SP2/0、YB2/0、Y0、C127、L細胞、COS、例えば、COS1及びCOS7、QC1-3、HEK-293、VERO、PER.C6、HeLA、EB1、EB2、EB3、腫瘍溶解又はハイブリドーマ細胞系が挙げられる。いくつかの実施形態では、真核細胞は、CHO細胞株である。いくつかの実施形態では、真核細胞は、CHO細胞である。いくつかの実施形態では、細胞は、CHO-K1細胞、CHO-K1 SV細胞、DG44 CHO細胞、DUXB11 CHO細胞、CHOS、CHO GSノックアウト細胞、CHO FUT8 GSノックアウト細胞、CHOZN又はCHO由来細胞である。CHO GSノックアウト細胞(例えば、GSKO細胞)は、例えば、CHO-K1 SV GSノックアウト細胞である。CHO FUT8ノックアウト細胞は、例えば、POTELLIGENT CHOK1 SV(Lonza Biologics,Inc.)である。真核細胞は、鳥類細胞、細胞系又は細胞株、例えばEBX細胞、EB14、EB24、EB26、EB66又はEBvl3などでもあり得る。
いくつかの実施形態では、真核細胞は、ヒト細胞である。いくつかの実施形態では、ヒト細胞は、幹細胞である。幹細胞は、例えば、多能性幹細胞、例として、胚性幹細胞(ESC)、成体幹細胞、誘発された多能性幹細胞(iPSC)、組織特異的幹細胞(例えば、造血幹細胞)及び間充織幹細胞(MSC)であり得る。いくつかの実施形態では、ヒト細胞は、本明細書に記載の細胞のいずれかの分化形態である。いくつかの実施形態では、真核細胞は、培養下の任意の初代細胞に由来する細胞である。
いくつかの実施形態では、真核細胞は、肝細胞、例えばヒト肝細胞、動物肝細胞又は非実質細胞である。例えば、真核細胞は、付着型代謝試験用ヒト肝細胞、付着型誘導試験用ヒト肝細胞、付着型ヒト肝細胞、懸濁液試験用ヒト肝細胞(例として、10-ドナー及び20-ドナープール肝細胞)、ヒト肝臓クッパー細胞、ヒト肝臓星細胞、イヌ肝細胞(例として、単一及びプールビーグル肝細胞)、マウス肝細胞(例として、CD-1及びC57BI/6肝細胞)、ラット肝細胞(例として、Sprague-Dawley、Wistar Han及びWistar肝細胞)、サル肝細胞(例として、カニクイザル又はアカゲザル肝細胞)、ネコ肝細胞(例として、ドメスティックショートヘア肝細胞)及びウサギ肝細胞(例として、ニュージーランドホワイト肝細胞)であり得る。
いくつかの実施形態では、真核細胞は、植物細胞である。例えば、植物細胞は、作物植物、例えばキャッサバ、トウモロコシ、モロコシ、コムギ又はイネのものであり得る。植物細胞は、藻類、樹木又は野菜のものであり得る。植物細胞は、単子葉若しくは双子葉植物のもの又は作物若しくは穀類植物、生産植物、果実若しくは野菜のものであり得る。例えば、植物細胞は、樹木、例えば柑橘樹木、例えばオレンジ、グレープフルーツ又はレモン樹木;モモ又はネクタリン樹木;リンゴ又はナシ樹木;堅果樹木、例えばアーモンド又はクルミ又はピスタチオ樹木;ナス属の植物、例えばジャガイモ;ブラシカ属(Brassica)の植物、ラクツカ属(Lactuca)の植物、スピナシア属(Spinacia)の植物;カプシカム属(Capsicum)の植物;綿、タバコ、アスパラガス、ニンジン、キャベツ、ブロッコリー、カリフラワー、トマト、ナス、コショウ、レタス、ホウレンソウ、イチゴ、ブルーベリー、ラズベリー、ブラックベリー、ブドウ、コーヒー、ココアなどのものであり得る。
いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約5~約50ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約6~約45ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約7~約40ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約8~約35ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約9~約30ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約10~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約12~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約14~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約16~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約18~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約5~約10ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約6~約10ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約7~約10ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約8~約10ヌクレオチドである。ガイド配列の長さは、例えば、CRISPR Design Tool(Hsu et al.,Nat Biotechnol 31(9):827-832(2013))、ampliCan(Labun et al.,bioRxiv 2018,doi:10.1101/249474)、CasFinder(Alach et al.,bioRxiv 2014,doi:10.1101/005074)、CHOPCHOP(Labun et al.,Nucleic Acids Res 2016,doi:10.1093/nar/gkw398)などのガイド配列の設計ツールを用いて、当業者によって判定され得る。
いくつかの実施形態では、本開示のガイドポリヌクレオチド、例えばガイドRNAは、ポリペプチド結合配列/セグメントを含む。ガイドポリヌクレオチド、例えばガイドRNAのポリペプチド結合セグメント(又は「タンパク質結合配列」)は、本開示のCasタンパク質のポリヌクレオチド結合ドメインと相互作用する。こうしたポリペプチド結合セグメント又は配列、例えばその開示全体が本明細書に組み込まれる米国特許出願公開第2014/0068797号明細書、同第2014/0273037号明細書、同第2014/0273226号明細書、同第2014/0295556号明細書、同第2014/0295557号明細書、同第2014/0349405号明細書、同第2015/0045546号明細書、同第2015/0071898号明細書、同第2015/0071899号明細書及び同第2015/0071906号明細書に開示されるものは、当業者に既知である。いくつかの実施形態では、ガイドポリヌクレオチドのポリペプチド結合セグメントは、Cas9に結合する。いくつかの実施形態では、ガイドポリヌクレオチドのポリペプチド結合セグメントは、本明細書で提供される組換えCas9タンパク質に結合する。
いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも約10、15、20、25又は30ヌクレオチド且つ最大で約25、30、35、40、45、50、60、70、80、90、100、110、120、130、140又は150ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約10~約150ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約20~約120ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約30~約100ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約40~約80ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約50~約60ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約10~約35ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約15~約30ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドは、約20~約25ヌクレオチドである。
ガイドポリヌクレオチド、例えばガイドRNAは、単離分子、例えばRNA分子として標的細胞中に導入することができるか、又はガイドポリヌクレオチド、例えばガイドRNAをコードするDNAを含有する発現ベクターを使用して細胞中に導入する。
いくつかの実施形態では、CRISPR-Cas系のガイドポリヌクレオチドは、ダイレクトリピート配列に連結されている。ダイレクトリピート又はDR配列は、非反復配列(スペーサー)の短鎖ストレッチが介在しているCRISPR遺伝子座中の反復配列のアレイである。スペーサー配列は、標的配列上のプロトスペーサー隣接モチーフ(PAM)を標的化する。CRISPR遺伝子座の非コード部分(すなわちガイドポリヌクレオチド及びtracrRNA)が転写される場合、転写産物は、DR配列において個々のスペーサー配列を含有する短鎖crRNAに開裂され、それがCas9ヌクレアーゼをPAMに指向する。いくつかの実施形態では、DR配列は、RNAである。いくつかの実施形態では、DR配列は、核酸によりコードされる。いくつかの実施形態では、DR配列は、ガイドポリヌクレオチドに結合している。いくつかの実施形態では、DR配列は、ガイドポリヌクレオチドのガイド配列に結合している。いくつかの実施形態では、DR配列は、二次構造を含む。いくつかの実施形態では、DR配列は、ステムループ構造を含む。いくつかの実施形態では、DR配列は、10~20ヌクレオチドである。いくつかの実施形態では、DR配列は、少なくとも16ヌクレオチドである。いくつかの実施形態では、DR配列は、少なくとも16ヌクレオチドであり、単一のステムループを含む。いくつかの実施形態では、DR配列は、RNAアプタマーを含む。いくつかの実施形態では、DRの二次構造又はステムループは、開裂のためのヌクレアーゼにより認識される。いくつかの実施形態では、ヌクレアーゼは、リボヌクレアーゼである。いくつかの実施形態では、ヌクレアーゼは、RNアーゼIIIである。
いくつかの実施形態では、本開示のCRISPR-Cas系は、tracrRNAを更に含む。「tracrRNA」又はトランス活性化CRISPR-RNAは、プレcrRNA又はプレCRISPR-RNAとのRNA二本鎖を形成し、次いでRNA特異的リボヌクレアーゼRNアーゼIIIにより開裂されて、crRNA/tracrRNAハイブリッドが形成される。いくつかの実施形態では、ガイドRNAは、crRNA/tracrRNAハイブリッドを含む。いくつかの実施形態では、ガイドRNAのtracrRNA構成成分は、Cas9タンパク質を活性化させる。いくつかの実施形態では、CRISPR-Cas系のガイドポリヌクレオチドは、tracrRNA配列を含む。いくつかの実施形態では、CRISPR-Cas系は、tracrRNA配列を含む別個のポリヌクレオチドを含む。
いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド及びガイドポリヌクレオチドは、単一のベクター上に存在する。いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド、ガイドポリヌクレオチド(又はガイドポリヌクレオチドに転写され得るヌクレオチド)及びtracrRNAは、単一のベクター上に存在する。いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド、ガイドポリヌクレオチド(又はガイドポリヌクレオチドに転写され得るヌクレオチド)、tracrRNA及びダイレクトリピート配列は、単一のベクター上に存在する。いくつかの実施形態では、ベクターは、発現ベクターである。いくつかの実施形態では、ベクターは、哺乳動物発現ベクターである。いくつかの実施形態では、ベクターは、ヒト発現ベクターである。いくつかの実施形態では、ベクターは、植物発現ベクターである。
いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド及びガイドポリヌクレオチドは、単一の核酸分子である。いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド、ガイドポリヌクレオチド及びtracrRNAは、単一の核酸分子である。いくつかの実施形態では、組換えCas9をコードするポリヌクレオチド、ガイドポリヌクレオチド、tracrRNA及びダイレクトリピート配列は、単一の核酸分子である。いくつかの実施形態では、単一の核酸分子は、発現ベクターである。いくつかの実施形態では、単一の核酸分子は、哺乳動物発現ベクターである。いくつかの実施形態では、単一の核酸分子は、ヒト発現ベクターである。いくつかの実施形態では、単一の核酸分子は、植物発現ベクターである。
いくつかの実施形態では、組換えCas9及びガイドポリヌクレオチドは、複合体を形成することができる。いくつかの実施形態では、組換えCas9とガイドポリヌクレオチドとの複合体は、天然に生じない。
CRISPR-Cas系の送達に関する様々な方法が当技術分野において既知である。いくつかの実施形態では、本開示のCRISPR-Cas系は、送達粒子によって送達される。送達粒子は、粒子を含む生物送達系又は配合物である。本明細書に定義される「粒子」とは、約100ミクロン(μm)の最大直径を有する実体である。いくつかの実施形態では、粒子は、約10μmの最大直径を有する。いくつかの実施形態では、粒子は、約2000ナノメートル(nm)の最大直径を有する。いくつかの実施形態では、粒子は、約1000nmの最大直径を有する。いくつかの実施形態では、粒子は、約900nm、約800nm、約700nm、約600nm、約500nm、約400nm、約300nm、約200nm又は約100nmの最大直径を有する。いくつかの実施形態では、粒子は、約25nm~約200nmの直径を有する。いくつかの実施形態では、粒子は、約50nm~約150nmの直径を有する。いくつかの実施形態では、粒子は、約75nm~約100nmの直径を有する。
送達粒子は、以下のものが挙げられるが、これらに限定されない任意の形態で提供され得る:固体、半固体、エマルション又はコロイド粒子。いくつかの実施形態では、送達粒子は、脂質ベース系、リポソーム、ミセル、マイクロベシクル、エキソソーム又は遺伝子銃である。いくつかの実施形態では、送達粒子は、CRISPR-Cas系を含む。いくつかの実施形態では、送達粒子は、組換えCas9及びガイドポリヌクレオチドを含むCRISPR-Cas系を含む。いくつかの実施形態では、送達粒子は、組換えCas9及びガイドポリヌクレオチドを含むCRISPR-Cas系を含み、組換えCas9及びガイドポリヌクレオチドは、複合体中に存在する。いくつかの実施形態では、送達粒子は、組換えCas9、ガイドポリヌクレオチド及びtracrRNAを含むポリヌクレオチドを含むCRISPR-Cas系を含む。いくつかの実施形態では、送達粒子は、組換えCas9、ガイドポリヌクレオチド及びtracrRNA含むCRISPR-Cas系を含む。
いくつかの実施形態では、送達粒子は、脂質、糖、金属又はタンパク質を更に含む。いくつかの実施形態では、送達粒子は、脂質エンベロープである。脂質エンベロープ又は脂質を含む送達粒子を用いたmRNAの送達は、例えば、Su et al.,Molecular Pharmacology 8(3):774-784(2011)に記載されている。いくつかの実施形態では、送達粒子は、糖ベース粒子、例えばGalNAcである。糖ベース粒子は、国際公開第2014/118272号パンフレット及びNair et al.,J Am Chem Soc 136(49):16958-16961(2014)に記載されている。
いくつかの実施形態では、送達粒子は、ナノ粒子である。本開示に包含されるナノ粒子は、様々な形態において、例えば固体ナノ粒子(例えば、金属、例えば銀、金、鉄、チタン)、非金属、脂質ベース固体、ポリマー、ナノ粒子の懸濁液又はそれらの組合せとして提供することができる。金属、誘電体及び半導体ナノ粒子並びにハイブリッド構造(例えば、コア-シェルナノ粒子)を調製することができる。半導体材料製のナノ粒子は、それらが電子エネルギーレベルの量子化が生じるほど十分に小さい場合(典型的には10nm未満)、標識量子ドットであり得る。このようなナノスケール粒子は、生物医学用途において薬物担体又はイメージング剤として使用され、本開示における類似の目的に適合させることができる。
送達粒子の調製は、米国特許出願公開第2011/0293703号明細書、同第2012/0251560号明細書及び同第2013/0302401号明細書並びに米国特許第5,543,158号明細書、同第5,855,913号明細書、同第5,895,309号明細書、同第6,007,845号明細書及び同第8,709,843号明細書に更に記載されている。
いくつかの実施形態では、ベシクルは、本開示のCRISPR-Cas系を含む。「ベシクル」は、脂質二重層により封入される流体を有する細胞内の小型構造である。いくつかの実施形態では、本開示のCRISPR-Cas系は、ベシクルにより送達される。いくつかの実施形態では、ベシクルは、組換えCas9及びガイドポリヌクレオチドを含む。いくつかの実施形態では、ベシクルは、組換えCas9及びガイドポリヌクレオチドを含み、組換えCas9及びガイドポリヌクレオチドは、複合体中に存在する。いくつかの実施形態では、ベシクルは、組換えCas9、ガイドポリヌクレオチド及びtracrRNAを含むポリヌクレオチドを含むCRISPR-Cas系を含む。いくつかの実施形態では、ベシクルは、組換えCas9、ガイドポリヌクレオチド及びtracrRNA含むCRISPR-Cas系を含む。
いくつかの実施形態では、組換えCas9及びガイドポリヌクレオチドを含むベシクルは、エキソソーム又はリポソームである。いくつかの実施形態では、ベシクルは、エキソソームである。いくつかの実施形態では、エキソソームを使用して本開示のCRISPR-Cas系を送達する。エキソソームは、RNA及びタンパク質を輸送し、RNAを脳及び他の標的器官に送達し得る内因性ナノベシクル(すなわち約30~約100nmの直径を有する)である。外因性生物材料を標的器官に送達するための改変エキソソームは、例えば、Alvarez-Erviti et al.,Nature Biotechnology 29:341(2011)、El-Andaloussi et al.,Nature Protocols 7:2112-2116(2012)及びWahlgren et al.,Nucleic Acids Research 40(17):e130(2012)によって説明されている。
いくつかの実施形態では、stiCas9及びガイドポリヌクレオチドを含むベシクルは、リポソームである。いくつかの実施形態では、リポソームを使用して本開示のCRISPR-Cas系を送達する。リポソームは、少なくとも1つの脂質二重層を有する球状ベシクル構造であり、栄養及び医薬物の投与用ビヒクルとして使用することができる。リポソームは、リン脂質、特にホスファチジルコリンから構成されることが多いが、他の脂質、例えば卵ホスファチジルエタノールアミンからも構成される。リポソームの型としては、限定されるものではないが、マルチラメラベシクル、スモールユニラメラベシクル、ラージユニラメラベシクル及び渦巻き型ベシクルが挙げられる。例えば、Spuch and Navarro,Journal of Drug Delivery,Article ID469679(2011)を参照されたい。生物材料、例えばCRISPR-Cas構成成分を送達するためのリポソームは、例えば、Morrissey et al.,Nature Biotechnology 23(8):1002-1007(2005)、Zimmerman et al.,Nature Letters 441:111-114(2006)及びLi et al.,Gene Therapy 19:775-780(2012)によって説明されている。
いくつかの実施形態では、ウイルスベクターは、本開示のCRISPR-Cas系を含む。いくつかの実施形態では、本開示のCRISPR-Cas系は、ウイルスベクターにより送達される。いくつかの実施形態では、ウイルスベクターは、組換えCas9及びガイドポリヌクレオチドを含む。いくつかの実施形態では、ウイルスベクターは、組換えCas9及びガイドポリヌクレオチドを含み、組換えCas9及びガイドポリヌクレオチドは、複合体中に存在する。いくつかの実施形態では、ウイルスベクターは、組換えCas9、ガイドポリヌクレオチド及びtracrRNAを含むポリヌクレオチドを含むCRISPR-Cas系を含む。いくつかの実施形態では、ウイルスベクターは、組換えCas9、ガイドポリヌクレオチド及びtracrRNA含むCRISPR-Cas系を含む。いくつかの実施形態では、ウイルスベクターは、アデノウイルス、レンチウイルス又はアデノ随伴ウイルスのものである。ウイルスベクターの例は、本明細書に提供される。
いくつかの実施形態では、アデノ随伴ウイルス(AAV)及び/又はレンチウイルスは、本明細書に記載のCRISPR-Cas系のエレメントを含むウイルスベクターとして使用することができる。本開示のいくつかの実施形態では、Casタンパク質は、ウイルスベクターにより形質導入された細胞により細胞内で発現される。
いくつかの実施形態では、本開示のCasタンパク質及び方法は、エクスビボ遺伝子編集、例えばCAR-T型療法において使用される。これらの実施形態は、ヒトドナーからの細胞の修飾を含み得る。これらの例では、ウイルスベクターを使用することもできるが、Cas9タンパク質を(インビトロ転写ガイドRNA及びドナーDNAと共に)培養細胞中に直接形質移入する追加の選択肢も存在する。
いくつかの実施形態では、本開示の組換えCas9タンパク質は、1つ以上の異種タンパク質ドメイン(例えば、組換えCas9タンパク質の他に約又は少なくとも約1、2、3、4、5、6、7、8、9又は10個以上のドメイン)を含む融合タンパク質の一部である。Cas9融合タンパク質は、任意の追加のタンパク質配列及び必要に応じて任意の2つのドメイン間のリンカー配列を含み得る。組換えCas9タンパク質に融合され得るタンパク質ドメインの例としては、以下のものが挙げられるが、これらに限定されない:エピトープ標識、レポーター遺伝子配列及び以下の活性の1つ以上を有するタンパク質ドメイン:メチラーゼ酵素活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子活性、ヒストン修飾活性、RNA開裂活性及び核酸結合活性。エピトープ標識の非限定例としては、以下のものが挙げられる:ヒスチジン(His)標識、V5標識、FLAG標識、インフルエンザヘマグルチニン(HA)標識、Myc標識、VSV-G標識及びチオレドキシン(Trx)標識。レポーター遺伝子の例としては、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、自己蛍光タンパク質、例として、青色蛍光タンパク質(BFP)及びmCherryが挙げられるが、これらに限定されない。いくつかの実施形態では、組換えCas9タンパク質は、DNA分子と結合するか、又は他の細胞分子と結合するタンパク質又はタンパク質のフラグメントと融合し、これには以下のものが挙げられるが、これらに限定されない:マルトース結合タンパク質(MBP)、S-標識、Lex A DNA結合ドメイン(DBD)、GAL4 DNA結合ドメイン及び単純ヘルペス(herpes simplex)ウイルス(HSV)BP16タンパク質。Cas9タンパク質を含む融合タンパク質の一部を形成し得る追加のドメインについては、米国特許出願公開第2011/0059502号明細書に記載されている。いくつかの実施形態では、標識された組換えCas9タンパク質を使用して標的配列の位置を同定する。
いくつかの実施形態では、組換えCas9タンパク質は、誘導性系の構成成分を形成し得る。系の誘導性は、エネルギーの形態を使用する遺伝子編集又は遺伝子発現の時空間制御を可能とする。エネルギーの形態としては、以下のものが挙げられ得るが、これらに限定されない:電磁放射線、音響エネルギー、化学エネルギー及び熱エネルギー。誘導性系の非限定例としては、以下のものが挙げられる:テトラサイクリン誘導性プロモーター(Tet-On又はTet-Off)、小分子ツーハイブリッド転写活性化系(FKBP、ABAなど)又は光誘導性系(フィトクロム、LOVドメイン又はクリプトクロム)。いくつかの実施形態では、Cas9タンパク質は、配列特異的に転写活性の変化を指向するための光誘導性転写エフェクター(LITE)の一部である。光の構成成分としては、Cas9タンパク質、光応答性シトクロムヘテロ二量体(例えば、アラビドプシス・タリアナ(Arabidopsis thaliana)からのもの)及び転写活性化/抑制ドメインが挙げられ得る。誘導性DNA結合タンパク質及びそれらの使用方法の更なる例は、国際特許出願公開の国際公開第2014/018423号パンフレット及び同第2014/093635号パンフレット;米国特許第8,889,418号明細書及び同第8,895,308号明細書;並びに米国特許出願公開第2014/0186919号明細書、同第2014/0242700号明細書、同第2014/0273234号明細書及び同第2014/0335620号明細書に提供されている。
部位特異的修正の方法
いくつかの実施形態では、本開示は、細胞のゲノム中の標的配列において部位特異的修飾を提供する方法であって、本明細書に記載される非天然発生CRISPR-Cas系を細胞中に導入することを含む方法を提供する。
方法のいくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質としては、改変KFERQモチーフ又はKFERQ様モチーフが挙げられる。方法のいくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、野生型Cas9タンパク質の1つ以上のアミノ酸修飾を含み、アミノ酸修飾は、Cas9タンパク質中にCMA標的モチーフ又はeMI標的モチーフを導入し、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも20%急速に分解する。方法のいくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、野生型Cas9タンパク質中に1つ以上のアミノ酸修飾を含み、組換えCas9タンパク質は、CMA標的モチーフ又はeMI標的モチーフを含む。方法のいくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、S.ピオゲネス(S.pyogenes)から単離されており(SpCas9)、配列番号1の位置F185、A547、I548、T560、V561、D829、I830、L1087、S1088、P1199、K1200又はこれらの組み合わせの1つ以上にアミノ酸修飾を含む。方法のいくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、HSC70と結合することが可能である。方法のいくつかの実施形態では、非天然発生CRISPR-Cas系の組換えCas9タンパク質は、S.ピオゲネス(S.pyogenes)から単離されており(SpCas9)、配列番号1のアミノ酸位置185に改変KFERQモチーフ又はKFERQ様モチーフを含む。
標的配列の「修飾」は、核酸の単一ヌクレオチド置換、複数ヌクレオチド置換、挿入(すなわちノックイン)及び欠失(すなわちノックアウト)、フレームシフト突然変異及び他の核酸修飾を包含する。
方法のいくつかの実施形態では、修飾は、標的配列の少なくとも一部の欠失である。標的配列は、2つの異なる部位において開裂させ、相補的粘着末端を生成することができ、相補的粘着末端を再ライゲートさせ、それによりその2つの部位間の配列部分を除去することができる。
方法のいくつかの実施形態では、修飾は、標的配列の変異である。部位特異的突然変異誘発は、目的突然変異を含有する外因性ポリヌクレオチドテンプレート(「ドナーポリヌクレオチド」又は「ドナーベクター」とも呼ばれる)の相同組換えを促進する部位特異的ヌクレアーゼの使用により達成され得る。いくつかの実施形態では、目的配列(SoI)は、目的突然変異を含む。
方法のいくつかの実施形態では、修飾は、標的配列中への目的配列(SoI)の挿入である。SoIは、外因性ポリヌクレオチドテンプレートとして導入することができる。いくつかの実施形態では、外因性ポリヌクレオチドは、平滑末端を含む。いくつかの実施形態では、外因性ポリヌクレオチドテンプレートは、粘着末端を含む。いくつかの実施形態では、外因性ポリヌクレオチドテンプレートは、標的配列中の粘着末端に相補的な粘着末端を含む。
外因性ポリヌクレオチドテンプレートは、任意の好適な長さ、例えば約又は少なくとも約10、15、20、25、50、75、100、150、200、250、500又は1000以上のヌクレオチド長さのものであり得る。いくつかの実施形態では、外因性ポリヌクレオチドテンプレートは、標的配列を含むポリヌクレオチドの一部に相補的である。外因性ポリヌクレオチドテンプレートは、最適にアラインされる場合、標的配列の1つ以上のヌクレオチド(例えば、約又は少なくとも約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90又は100以上のヌクレオチド)と重複する。いくつかの実施形態では、外因性ポリヌクレオチドテンプレート及び標的配列を含むポリヌクレオチドが最適にアラインされる場合、外因性ポリヌクレオチドテンプレートの最近傍ヌクレオチドは、標的配列から約1、5、10、15、20、25、50、75、100、200、300、400、500、100、1500、2000、2500、5000、10000以上のヌクレオチド以内に存在する。
いくつかの実施形態では、外因性ポリヌクレオチドは、DNA、例えばDNAプラスミド、細菌人工染色体(BAC)、酵母人工染色体(YAC)、ウイルスベクター、線状一本鎖又は二本鎖DNA片、オリゴヌクレオチド、PCRフラグメント、ネイキッド核酸又は送達ビヒクル、例えばリポソームと複合体化している核酸などである。
いくつかの実施形態では、外因性ポリヌクレオチドは、細胞の内因性DNA修復経路を使用して標的配列中に挿入される。内因性DNA修復経路としては、NHEJ、MMEJ及びHDRが挙げられ、これらは、それぞれ本明細書で説明される。修復プロセス中、SoIを含む外因性ポリヌクレオチドテンプレートを標的配列中に導入することができる。いくつかの実施形態では、上流配列及び下流配列によりフランキングされたSoIを含む外因性ポリヌクレオチドテンプレートを細胞中に導入し、上流及び下流配列は、標的配列中の組込みの部位のいずれかの側と配列類似性を共有する。いくつかの実施形態では、SoIを含む外因性ポリヌクレオチドは、例えば、突然変異遺伝子を含む。いくつかの実施形態では、外因性ポリヌクレオチドは、細胞に対して内因性又は外因性である配列を含む。いくつかの実施形態では、SoIは、タンパク質をコードするポリヌクレオチド又は非コード配列、例えばマイクロRNAなどを含む。いくつかの実施形態では、SoIは、調節エレメントに操作可能に連結されている。いくつかの実施形態では、SoIは、調節エレメントである。いくつかの実施形態では、SoIは、耐性カセット、例えば抗生物質に対する耐性を付与する遺伝子を含む。いくつかの実施形態では、SoIは、野生型標的配列の突然変異を含む。いくつかの実施形態では、SoIは、フレームシフト突然変異又はヌクレオチド置換を作出することにより標的配列を破壊又は補正する。いくつかの実施形態では、SoIは、マーカーを含む。標的配列中へのマーカーの導入は、標的化組込みのスクリーニングを容易にし得る。いくつかの実施形態では、マーカーは、制限部位、蛍光タンパク質又は選択マーカーである。いくつかの実施形態では、SoIは、SoIを含むベクターとして導入される。
外因性ポリヌクレオチドテンプレート中の上流及び下流配列は、標的配列及び外因性ポリヌクレオチド間の相同組換えを促進するように選択される。上流配列は、組込みのための標的部位の上流の配列(すなわち標的配列)との配列類似性を共有する核酸配列である。同様に、下流配列は、組込みのための標的化部位の下流の配列との配列類似性を共有する核酸配列である。したがって、いくつかの実施形態では、SoIを含む外因性ポリヌクレオチドテンプレートは、上流及び下流配列において相同組換えにより標的配列中に挿入する。いくつかの実施形態では、外因性ポリヌクレオチドテンプレート中の上流及び下流配列は、標的化ゲノム配列の上流及び下流配列とそれぞれ少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は100%の配列同一性を有する。いくつかの実施形態では、上流又は下流配列は、少なくとも約20、50、100、150、200、250、300、350、400又は500の塩基対、且つ最大で約600、750、1000、1250、1500、1750又は2000の塩基対を有する。いくつかの実施形態では、上流又は下流配列は、約20~2000の塩基対、又は約50~1750の塩基対、又は約100~1500の塩基対、又は約200~1250の塩基対、又は約300~1000の塩基対、又は約400~約750の塩基対、又は約500~600の塩基対を有する。いくつかの実施形態では、上流又は下流配列は、約50、約100、約250、約500、約100、約1250、約1500、約1750、約2000、約2250又は約2500の塩基対を有する。
方法のいくつかの実施形態では、標的配列中の修飾は、細胞中の標的配列の発現の不活性化である。例えば、標的配列へのCRISPR-Cas複合体の結合時、標的配列は不活性化され、その結果、その配列は、転写されず、コードされるタンパク質は、産生されず、且つ/又は配列は、その野生型配列が機能するように機能しない。例えば、タンパク質又はマイクロRNAコード配列は、不活性化され得、その結果、タンパク質は、産生されない。
いくつかの実施形態では、調節配列は、それが調節配列としてもはや機能しないように不活性化させることができる。調節配列の例としては、本明細書に記載のプロモーター、転写終結因子、エンハンサー及び他の調節エレメントが挙げられる。不活性化標的配列としては、欠失突然変異(すなわち1つ以上のヌクレオチドの欠失)、挿入突然変異(すなわち1つ以上のヌクレオチドの挿入)又はナンセンス突然変異(すなわち終止コドンが導入されるような別のヌクレオチドでの単一ヌクレオチドの置換)を挙げることができる。いくつかの実施形態では、標的配列の不活性化は、標的配列の「ノックアウト」をもたらす。
本明細書で提供される組換えCas9を含む方法のいくつかの実施形態では、細胞のゲノム中のオフターゲット修飾は、野生型Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9と比較して少なくとも約50%だけ低減される。本明細書に記載される通り、オフターゲット修飾は、例えば、意図されたものではない点突然変異、欠失、挿入、逆位及び転座など、非特異的且つ意図されたものではない遺伝子修飾である。いくつかの実施形態では、本開示の組換えCas9タンパク質は、分解速度がより速いため、細胞中のオフターゲッティングが低減する。いくつかの実施形態では、本開示の組換えCas9タンパク質は、Cas9の細胞利用可能性がより低いため、細胞中のオフターゲッティングが低減する。いくつかの実施形態では、本開示の組換えCas9タンパク質は、Cas9に対する細胞の暴露時間がより短いため、細胞中のオフターゲッティングが低減する。
本明細書で提供される組換えCas9を含む方法のいくつかの実施形態では、野生型Cas9と比較して、オフターゲット修飾は、低減し、オンターゲット修飾は、少なくともほぼ同じレベルである。いくつかの実施形態では、組換えCas9のオンターゲット修飾は、野生型Cas9のオンターゲット修飾の少なくとも約20%、少なくとも約15%、少なくとも約10%、少なくとも約5%、少なくとも約4%、少なくとも約3%、少なくとも約2%、少なくとも約1%、少なくとも約0.5%以内である。本明細書で提供される組換えCas9を含むいくつかの実施形態では、野生型Cas9と比較して、オフターゲット修飾は、低減し、オンターゲット修飾は、増加する。いくつかの実施形態では、組換えCas9のオンターゲット修飾は、野生型Cas9よりも少なくとも約5%高い、少なくとも約10%高い、少なくとも約11%高い、少なくとも約12%高い、少なくとも約13%高い、少なくとも約14%高い、少なくとも約15%高い、少なくとも約16%高い、少なくとも約17%高い、少なくとも約18%高い、少なくとも約19%高い又は少なくとも約20%高い。
いくつかの実施形態では、細胞のゲノム中のオフターゲット修飾は、野生型Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9と比較して、少なくとも約10%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約100%、少なくとも約150%又は少なくとも約200%だけ低減される。
本明細書で提供される組換えCas9を含む方法のいくつかの実施形態では、細胞のゲノム中のオフターゲット修飾は、野生型Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9と比較して、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約20倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約60倍、少なくとも約70倍、少なくとも約80倍、少なくとも約90倍、少なくとも約100倍、少なくとも約500倍又は少なくとも約1000倍低減される。
方法のいくつかの実施形態では、細胞のゲノム中のオフターゲット修飾は、KFERQモチーフ又はKFERQ様モチーフを有する組換えCas9によってなされるゲノム中の全修飾の約5%未満である。方法のいくつかの実施形態では、細胞のゲノム中のオフターゲット修飾は、KFERQモチーフ又はKFERQ様モチーフを有する組換えCas9によってなされるゲノム中の全修飾の約2%未満である。方法のいくつかの実施形態では、細胞のゲノム中のオフターゲット修飾は、KFERQモチーフ又はKFERQ様モチーフを有する組換えCas9によってなされるゲノム中の全修飾の約1%未満である。本明細書に記載される通り、野生型Cas9によるオフターゲット修飾は、野生型Cas9によるゲノム中の全修飾の少なくとも約2%、少なくとも約3%、少なくとも約4%、少なくとも約5%、少なくとも約6%、少なくとも約7%、少なくとも約8%、少なくとも約9%又は少なくとも約10%であり得る。いくつかの実施形態では、KFERQモチーフ又はKFERQ様モチーフを有する組換えCas9によるオフターゲット修飾は、KFERQモチーフ又はKFERQ様モチーフを有する組換えCas9によってなされるゲノム中の全修飾の約5%未満、約4%未満、約3%未満、約2%未満、約1.5%未満、約1%未満、約0.5%未満又は約0.1%未満である。オフターゲット修飾の量は、ガイドポリヌクレオチドの配列及び標的ゲノム遺伝子座に応じて変化し得る。一般に、同じガイドポリヌクレオチドを用いる場合、KFERQモチーフ又はKFERQ様モチーフを有する組換えCas9タンパク質は、野生型Cas9と比較してオフターゲット修飾が低減する。
方法のいくつかの実施形態では、標的配列は、細菌細胞中にある。いくつかの実施形態では、細菌細胞は、実験室株である。こうした細胞の例としては、E.コリ(E.coli)、S.アウレウス(S.aureus)、V.コレラ(V.cholerae)、S.ニューモニエ(S.pneumoniae)、B.サブチルス(B.subtilis)、C.クレセンタス(C.crescentus)、M.ジェニタリウム(M.genitalium)、A.フィシェリ(A.fischeri)、シネコシスティス(Synechocystis)、P.フルオレッセンス(P.fluorescens)、A.ビネランジイ(A.vinelandii)、S.コエリカラー(S.coelicolor)が挙げられるが、これらに限定されない。いくつかの実施形態では、細菌細胞は、食料及び/又は飲料の調製に用いられる細菌からなる。こうした細胞の非限定的な例示の属としては、アセトバクター(Acetobacter)、アルスロバクター(Arthrobacter)、バチルス(Bacillus)、ビフィドバクテリウム(Bifidobacterium)、ブラキバクテリウム(Brachybacterium)、ブレビバクテリウム(Brevibacterium)、カルノバクテリウム(Carnobacterium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、グルコナセトバクター(Gluconacetobacter)、ハフニア(Hafnia)、ハロモナス(Halomonas)、Kocuria(コクリア)、ラクトバシラス(Lactobacillus)、(L.アセトトレランス(L.acetotolerans)、L.アシジピスシス(L.acidipiscis)、L.アシドフィルス(L.acidophilus)、L.アリメンタリウス(L.alimentarius)、L.ブレビス(L.brevis)、L.ブチエリ(L.bucheri)、L.カゼイ(L.casei)、L.カルバツス(L.curvatus)、L.ファーメンタム(L.fermentum)、L.ヒルガルジイ(L.hilgardii)、L.ジェンセニイ(L.jensenii)、L.キムチイ(L.kimchii)、L.ラクチス(L.lactis)、L.パラカゼイ(L.paracasei)、L.プランタルム(L.plantarum)及びL.サケイ(L.sakei)を含む)リューコノストック(Leuconostoc)、ミクロバクテリウム(Microbacterium)、ペジオコックス(Pediococcus)、プロピオニバクテリウム(Propionibacterium)、ワイセラ(Weissella)及びザイモモナス(Zymomonas)が挙げられるが、これらに限定されない。
方法のいくつかの実施形態では、標的細胞は、真核細胞である。いくつかの実施形態では、真核細胞は、動物又はヒト細胞である。いくつかの実施形態では、真核細胞は、ヒト、又はげっ歯類、又はウシ細胞系、又は細胞株である。このような細胞、細胞系又は細胞株の例としては、限定されるものではないが、マウス骨髄腫(NSO)細胞系、チャイニーズハムスター卵母(CHO)細胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓細胞)、VERO、SP2/0、YB2/0、Y0、C127、L細胞、COS、例えば、COS1及びCOS7、QC1-3、HEK-293、VERO、PER.C6、HeLA、EB1、EB2、EB3、腫瘍溶解又はハイブリドーマ細胞系が挙げられる。いくつかの実施形態では、真核細胞は、CHO細胞株である。いくつかの実施形態では、真核細胞は、CHO細胞である。いくつかの実施形態では、細胞は、CHO-K1細胞、CHO-K1 SV細胞、DG44 CHO細胞、DUXB11 CHO細胞、CHOS、CHO GSノックアウト細胞、CHO FUT8 GSノックアウト細胞、CHOZN、又はCHO由来細胞である。CHO GSノックアウト細胞(例えば、GSKO細胞)は、例えば、CHO-K1 SV GSノックアウト細胞である。CHO FUT8ノックアウト細胞は、例えば、POTELLIGENT CHOK1 SV(Lonza Biologics,Inc.)である。真核細胞は、鳥類細胞、細胞系又は細胞株、例えばEBX細胞、EB14、EB24、EB26、EB66又はEBvl3などでもあり得る。
いくつかの実施形態では、真核細胞は、ヒト細胞である。いくつかの実施形態では、ヒト細胞は、幹細胞である。幹細胞は、例えば、多能性幹細胞、例として胚性幹細胞(ESC)、成体幹細胞、誘発された多能性幹細胞(iPSC)、組織特異的幹細胞(例えば、造血幹細胞)及び間充織幹細胞(MSC)であり得る。いくつかの実施形態では、細胞は、多能性幹細胞である。いくつかの実施形態では、細胞は、誘発された多能性幹細胞である。いくつかの実施形態では、ヒト細胞は、本明細書に記載の細胞のいずれかの分化形態である。いくつかの実施形態では、真核細胞は、培養下の任意の初代細胞に由来する細胞である。
いくつかの実施形態では、真核細胞は、肝細胞、例えばヒト肝細胞、動物肝細胞又は非実質細胞である。例えば、真核細胞は、付着型代謝試験用ヒト肝細胞、付着型誘導試験用ヒト肝細胞、付着型ヒト肝細胞、懸濁液試験用ヒト肝細胞(例として、10-ドナー及び20-ドナープール肝細胞)、ヒト肝臓クッパー細胞、ヒト肝臓星細胞、イヌ肝細胞(例として、単一及びプールビーグル肝細胞)、マウス肝細胞(例として、CD-1及びC57BI/6肝細胞)、ラット肝細胞(例として、Sprague-Dawley、Wistar Han及びWistar肝細胞)、サル肝細胞(例として、カニクイザル又はアカゲザル肝細胞)、ネコ肝細胞(例として、ドメスティックショートヘア肝細胞)及びウサギ肝細胞(例として、ニュージーランドホワイト肝細胞)であり得る。
いくつかの実施形態では、真核細胞は、植物細胞である。例えば、植物細胞は、作物植物、例えばキャッサバ、トウモロコシ、モロコシ、コムギ又はイネのものであり得る。植物細胞は、藻類、樹木又は野菜のものであり得る。植物細胞は、単子葉若しくは双子葉植物のもの又は作物若しくは穀類植物、生産植物、果実若しくは野菜のものであり得る。例えば、植物細胞は、樹木、例えば柑橘樹木、例えばオレンジ、グレープフルーツ又はレモン樹木;モモ又はネクタリン樹木;リンゴ又はナシ樹木;堅果樹木、例えばアーモンド又はクルミ又はピスタチオ樹木;ナス属の植物、例えばジャガイモ;ブラシカ属(Brassica)の植物、ラクツカ属(Lactuca)の植物、スピナシア属(Spinacia)の植物;カプシカム属(Capsicum)の植物;綿、タバコ、アスパラガス、ニンジン、キャベツ、ブロッコリー、カリフラワー、トマト、ナス、コショウ、レタス、ホウレンソウ、イチゴ、ブルーベリー、ラズベリー、ブラックベリー、ブドウ、コーヒー、ココアなどのものであり得る。
方法のいくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのDNA結合セグメントは、細胞中の標的配列とハイブリダイズする。いくつかの実施形態では、ガイドポリヌクレオチド、例えばガイドRNAのDNA結合セグメントは、標的DNA内で特定の配列に対して相補的なポリヌクレオチド配列を含む。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、細菌細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、真核細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、哺乳動物細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、ヒト細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、多能性幹細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、誘発された多能性幹細胞中で標的配列にハイブリダイズすることが可能である。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、植物細胞で標的配列にハイブリダイズすることが可能である。
いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、少なくとも約5、6、7、8、9、10、12、14、16、18又は20ヌクレオチド及び最大で約20、25、30、35、40、45又は50ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約5~約50ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約6~約45ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約7~約40ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約8~約35ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約9~約30ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約10~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約12~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約14~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約16~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約18~約20ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約5~約10ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約6~約10ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約7~約10ヌクレオチドである。いくつかの実施形態では、ガイドポリヌクレオチドのガイド配列は、約8~約10ヌクレオチドである。ガイド配列の長さは、本明細書に記載されるガイド配列の設計ツールを用いて当業者によって判定され得る。
方法のいくつかの実施形態では、CRISPR-Cas系は、送達粒子、ベシクル又はウイルスベクターを介して細胞に導入される。方法のいくつかの実施形態では、組換えCas9及びガイドポリヌクレオチドを含むCRISPR-Cas系は、送達粒子を介して細胞中に導入される。方法のいくつかの実施形態では、組換えCas9及びガイドポリヌクレオチドを含むCRISPR-Cas系は、ベシクルを介して細胞中に導入される。方法のいくつかの実施形態では、組換えCas9及びガイドポリヌクレオチドを含むCRISPR-Cas系は、ベクターを介して細胞中に導入される。方法のいくつかの実施形態では、組換えCas9及びガイドポリヌクレオチドを含むCRISPR-Cas系は、ウイルスベクターを介して細胞中に導入される。方法のいくつかの実施形態では、組換えCas9を含む複合体の構成成分をコードするポリヌクレオチドは、1つ以上のベクター上に導入される。送達粒子、ベシクル、ベクター、ウイルスベクター及び細胞への送達方法(例えば、ベクターのトランスフェクション)の例を本明細書で提供する。
本明細書に引用される全ての参考文献、例えば特許、特許出願、論文、教科書など、及びそれらに引用される参考文献は、それらが依然として引用されていない限りに、その全体が参照により本明細書に援用される。
追加の例示的実施形態
実施形態1は、改変KFERQモチーフ又はKFERQ様モチーフを含む組換えCas9タンパク質である。
実施形態2は、実施形態1の組換えCas9タンパク質を含み、改変KFERQモチーフ又はKFERQ様モチーフは、KFERQ(配列番号24)、RKVEQ(配列番号25)、QDLKF(配列番号26)、QRFFE(配列番号27)、NRVVD(配列番号28)、QRDKV(配列番号29)、QKILD(配列番号30)、QKKEL(配列番号31)、QFREL(配列番号32)、IKLDQ(配列番号33)、DVVRQ(配列番号34)、QRIVE(配列番号35)、VKELQ(配列番号36)、QKVFD(配列番号37)、QELLR(配列番号38)、VDKLN(配列番号39)、RIKEN(配列番号40)、NKKFE(配列番号41)及びこれらの組み合わせから選択される。
実施形態3は、実施形態1又は2の組換えCas9タンパク質を含み、改変KFERQ様モチーフは、VDKLN(配列番号39)である。
実施形態4は、実施形態1の組換えCas9タンパク質を含み、改変KFERQモチーフ又はKFERQ様モチーフは、Cas9タンパク質のRECローブ中にある。
実施形態5は、実施形態2の組換えCas9タンパク質を含み、改変KFERQモチーフ又はKFERQ様モチーフは、RECローブのRec2ドメイン中にある。
実施形態6は、実施形態1の組換えCas9タンパク質を含み、改変KFERQモチーフ又はKFERQ様モチーフは、組換えCas9タンパク質のHNHドメイン、RuvCドメイン又はPIドメイン中にある。
実施形態7は、実施形態1~4のいずれか1つの組換えCas9タンパク質を含み、改変KFERQモチーフ又はKFERQ様モチーフは、組換えCas9タンパク質の表面露出領域中にある。
実施形態8は、実施形態1~6のいずれか1つの組換えCas9タンパク質を含み、改変KFERQモチーフ又はKFERQ様モチーフは、組換えCas9タンパク質のN末端又はC末端にある。
実施形態9は、野生型Cas9タンパク質の1つ以上のアミノ酸修飾を含む組換えCas9タンパク質であり、アミノ酸修飾は、Cas9タンパク質中にシャペロン介在性オートファジー(CMA)標的モチーフ又はエンドソームミクロオートファジー(eMI)標的モチーフを導入し、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも20%急速に分解する。
実施形態10は、実施形態9の組換えCas9タンパク質を含み、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも50%急速に分解する。
実施形態11は、実施形態9又は10の組換えCas9タンパク質を含み、組換えCas9タンパク質は、インビボで、野生型Cas9タンパク質又はCMA若しくはeMI標的モチーフを含まないCas9タンパク質よりも少なくとも80%急速に分解する。
実施形態12は、野生型Cas9タンパク質中に1つ以上のアミノ酸修飾を含む組換えCas9タンパク質であり、組換えCas9タンパク質は、CMA標的モチーフ又はeMI標的モチーフを含む。
実施形態13は、実施形態9~12のいずれか1つの組換えCas9タンパク質を含み、CMA標的モチーフ又はeMI標的モチーフは、KFERQ(配列番号24)、RKVEQ(配列番号25)、QDLKF(配列番号26)、QRFFE(配列番号27)、NRVVD(配列番号28)、QRDKV(配列番号29)、QKILD(配列番号30)、QKKEL(配列番号31)、QFREL(配列番号32)、IKLDQ(配列番号33)、DVVRQ(配列番号34)、QRIVE(配列番号35)、VKELQ(配列番号36)、QKVFD(配列番号37)、QELLR(配列番号38)、VDKLN(配列番号39)、RIKEN(配列番号40)、NKKFE(配列番号41)及びこれらの組み合わせから選択される。
実施形態14は、実施形態13の組換えCas9タンパク質を含み、CMA標的モチーフ又はeMI標的モチーフは、VDKLN(配列番号39)である。
実施形態15は、実施形態9~14のいずれか1つの組換えCas9タンパク質を含み、1つ以上のアミノ酸置換は、組換えCas9タンパク質の表面露出領域中にある。
実施形態16は、配列番号1の位置F185、A547、I548、T560、V561、D829、I830、L1087、S1088、P1199、K1200又はこれらの組み合わせの1つ以上にアミノ酸修飾を含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離された組換えCas9タンパク質(SpCas9)を含む。
実施形態17は、実施形態9~16のいずれか1つの組換えCas9タンパク質を含み、アミノ酸修飾は、以下の変異:F185N;A547E/I548L;T560E/V561Q;D829L/I830R;L1087E/S1088Q;又はP1199D/K1200Qの1つ以上を含む。
実施形態18は、実施形態9~17のいずれか1つの組換えCas9タンパク質を含み、アミノ酸修飾は、F185における変異である。
実施形態19は、実施形態18の組換えCas9タンパク質を含み、変異は、F185Nである。
実施形態20は、実施形態16~19のいずれか1つの組換えCas9タンパク質を含み、アミノ酸修飾は、CMA標的モチーフ又はeMI標的モチーフをもたらす。
実施形態21は、実施形態9~20のいずれか1つの組換えCas9タンパク質を含み、組換えCas9タンパク質は、配列番号1と少なくとも90%同一である。
実施形態22は、70kDの熱ショック同族タンパク質(HSC70)に結合することが可能な組換えCas9タンパク質である。
実施形態23は、配列番号1のアミノ酸位置185に改変KFERQモチーフ又はKFERQ様モチーフを含む、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes、SpCas9)から単離された組換えCas9タンパク質である。
実施形態24は、実施形態23の組換えCas9タンパク質を含み、KFERQ様モチーフは、VDKLN(配列番号39)である。
実施形態25は、配列番号1の位置D10、H840又はこれらの組み合わせにおける変異を更に含む、実施形態1~24のいずれか1つの組換えCas9タンパク質を含む。
実施形態26は、実施形態25の組換えCas9タンパク質を含み、変異は、D10A又はD10N;H840A、H840N又はH840Y及びこれらの組み合わせから選択される。
実施形態27は、実施形態1~26のいずれか1つに記載の組換えCas9タンパク質を含み、組換えCas9タンパク質は、粘着末端を生成する。
実施形態28は、1つ以上の核局在化シグナルを更に含む、実施形態1~27のいずれか1つの組換えCas9タンパク質を含む。
実施形態29は、実施形態1~28のいずれか1つの組換えCas9タンパク質をコードするポリヌクレオチド配列である。
実施形態30は、実施形態29のポリヌクレオチド配列を含み、ポリヌクレオチド配列は、真核細胞中での発現のためにコドン最適化されている。
実施形態31は、実施形態1~28のいずれか1つの組換えCas9タンパク質と、組換えCas9タンパク質との複合体を形成し、且つガイド配列を含むガイドポリヌクレオチドとを含む非天然発生CRISPR-Cas系である。
実施形態32は、実施形態29又は30のポリヌクレオチド配列と、組換えCas9タンパク質との複合体を形成し、且つガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチド配列とを含む非天然発生CRISPR-Cas系である。
実施形態33は、実施形態29又は30のポリヌクレオチド配列に操作可能に連結された調節エレメントと、組換えCas9タンパク質との複合体を形成し、且つガイド配列を含むガイドポリヌクレオチドとを含む非天然発生CRISPR-Cas系である。
実施形態34は、実施形態31~33のいずれか1つの系を含み、ガイド配列は、ダイレクトリピート配列に連結されている。
実施形態35は、実施形態31~34のいずれか1つの系を含み、ガイドポリヌクレオチドは、tracrRNA配列を含む。
実施形態36は、tracrRNA配列を含む別個のポリヌクレオチドを更に含む、実施形態31~34のいずれか1つの系を含む。
実施形態37は、実施形態31~35のいずれか1つの系を含み、組換えCas9タンパク質をコードするポリヌクレオチド配列及びガイドポリヌクレオチドは、単一のベクター上にある。
実施例38は、実施形態36の系を含み、組換えCas9タンパク質をコードするポリヌクレオチド配列、ガイドポリヌクレオチド及びtracrRNA配列は、単一のベクター上にある。
実施形態39は、実施形態31~38のいずれか1つの系を含む送達粒子である。
実施形態40は、実施形態31~38のいずれか1つの系を含むベシクルである。
実施形態41は、実施形態40のベシクルを含み、ベシクルは、エキソソーム又はリポソームである。
実施形態42は、実施形態31~38のいずれか1つの系を含むウイルスベクターである。
実施形態43は、実施形態42のウイルスベクターを含み、ウイルスベクターは、アデノウイルス、レンチウイルス又はアデノ随伴ウイルスのものである。
実施形態44は、細胞のゲノム中の標的配列において部位特異的修飾を提供する方法であって、実施形態31~38のいずれか1つのCRISPR-Cas系を細胞中に導入することを含む方法である。
実施形態45は、実施形態44の方法を含み、修飾は、標的配列の少なくとも一部の欠失を含む。
実施形態46は、実施形態44の方法を含み、修飾は、標的配列の変異を含む。
実施例47は、実施形態44の方法を含み、修飾は、目的配列(SoI)を標的配列において挿入することを含む。
実施形態48は、実施形態44~47のいずれか1つの方法を含み、細胞のゲノム中のオフターゲット修飾は、組換えCas9によってなされるゲノム中の修飾の約5%未満である。
実施形態49は、実施形態44~48のいずれか1つの方法を含み、細胞のゲノム中のオフターゲット修飾は、組換えCas9によってなされるゲノム中の修飾の約2%未満である。
実施形態50は、実施形態44~49のいずれか1つの方法を含み、細胞のゲノム中のオフターゲット修飾は、組換えCas9によってなされるゲノム中の修飾の約1%未満である。
実施形態51は、実施形態44~50のいずれか1つの方法を含み、細胞のゲノム中のオフターゲット修飾は、野生型CRISPR-Cas9又はKFERQモチーフ若しくはKFERQ様モチーフを含まないCas9と比較して少なくとも約50%だけ低減される。
実施形態52は、実施形態44~51のいずれか1つの方法を含み、細胞は、細菌細胞、哺乳動物細胞又は植物細胞である。
実施形態53は、実施形態52の方法を含み、細胞は、ヒト細胞である。
実施形態54は、実施形態53の方法を含み、細胞は、多能性幹細胞である。
実施形態55は、実施形態54の方法を含み、細胞は、誘発された多能性幹細胞である。
実施形態56は、実施形態44~55のいずれか1つの方法を含み、ガイドポリヌクレオチドのガイド配列は、細胞のゲノム中で標的配列にハイブリダイズすることが可能である。
実施形態57は、実施形態44~56のいずれか1つの方法を含み、CRISPR-Cas系は、送達粒子、ベシクル又はウイルスベクターを介して細胞に導入される。
配列
下記の表4は、本明細書で提供される配列を列挙する。
SpCas9-ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9(配列番号1)
FaDe-SpCas9-F185N変異を有するSpCas9(配列番号2)
FaDe-SpCas9ヌクレオチド配列(配列番号4)
SpCas9RECローブ:SpCas9のアミノ酸61~718(配列番号5)
SpCas9 NUCローブ1:SpCas9のアミノ酸1~60(配列番号6)
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAE
SpCas9 NUCローブ2:SpCas9のアミノ酸719~1368(配列番号7)
SpCas9BHドメイン:SpCas9のアミノ酸61~94(配列番号8)
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVD
SpCas9 Rec1ドメイン1:SpCas9のアミノ酸95~180(配列番号9)
SpCas9 Rec1ドメイン2:SpCas9のアミノ酸309~718(配列番号10)
SpCas9 Rec2ドメイン:SpCas9のアミノ酸181~308(配列番号11)
SpCas9 RuvC Iドメイン:SpCas9のアミノ酸1~59(配列番号12)
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETA
SpCas9 RuvC IIドメイン:SpCas9のアミノ酸718~774(配列番号13)
DSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQ
SpCas9 RuvC IIIドメイン:SpCas9のアミノ酸909~1098(配列番号14)
SpCas9 HNHドメイン:SpCas9のアミノ酸775~908(配列番号15)
SpCas9 PIドメイン:SpCas9のアミノ酸1099~1368(配列番号16)
ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)由来Cas9(配列番号17)
ストレプトコッカス・ディスガラクティエ(Streptococcus dysgalactiae)由来Cas9(配列番号18)
ストレプトコッカス・ミュータンス(Streptococcus mutans)由来Cas9(配列番号19)
リステリア・イノキュア(Listeria innocua)由来Cas9(配列番号20)
スタフィロコッカス・アウレウス(Staphylococcus aureus)由来Cas9(配列番号21)
クレブシエラ・ニューモニエ(Klebsiella pneumoniae)由来Cas9(配列番号22)
FnCas9-フランシセラ・ノビサイダ(Francisella novicida)由来Cas9(配列番号23)
材料及び方法
実施例に記載する実験では、以下の材料及び方法を使用した。オリゴヌクレオチド及びガイドRNA合成は、Sigma及びSynthegoにより提供された。別段の指摘がない限り、試薬及びキットは、ThermoFisherより入手した。
試薬及びキットのリスト
細胞内分画キット;
EDTAフリーのプロテアーゼ阻害剤カクテル(Sigma);
NOVEX NUPAGEタンパク質ゲル、Bis-Tris 4~12%、1.5mm厚、10ウェル;
4×Laemmliバッファー(BioRad);
NUPAGE MOPS 20×SDSランニングバッファー;
NUPAGE 20×転写バッファー;
NOVEX Sharp予染色タンパク質標準分子量マーカー;
ニトロセルロース予切断ブロッティング膜、孔径0.45μm;
一次抗体:Cas9マウスモノクローナル(Abcam);
モノクローナルANTI-FLAG M2抗体(Sigma);
モノクローナル抗α-チューブリン(Sigma);
二次抗体:IRDYE 680RD Donkey抗マウスIgG(H+L)、0.1mg(Li-COR);
HSC70マウスモノクローナル(Santa Cruz);
タンパク質Aセファロース(Abcam);
REVERTAID RTキット;
DNアーゼI、RNアーゼフリー;
Phusion Flash High-Fidelity PCR Master Mix;
Q5 Hot Start High-Fidelity 2× Master Mix;
Gentra Puregeneキット(Qiagen);
Lipofectamine LTX Plus(Invitrogen);
FUGENE HD(Promega)
Cas9(CRISPR関連タンパク質9)ELISAキット(Cell Biolabs)
シクロヘキシミドCHX(Sigma)
ロイペプチン(SIGMA)
抗CRISPR-Cas9抗体[EPR19799](ab203933)
抗Ki67抗体(ab15580)
抗開裂カスパーゼ-3抗体(ab2302)
抗γH2A.X(phospho S139)抗体[9F3](ab26350)
抗CD8α抗体[144B](ab17147)
抗CD4抗体[EPR19514]-低エンドトキシン、アジドフリー(ab221775)
本明細書に記載される実験で用いられるプライマーを表2に列挙する。
本明細書に記載される実験で用いられるガイドRNAを表3に列挙する。
実験手順
細胞培養。SV-HUC-1細胞を、10%(v/v)ウシ胎児血清(Gibco)及び1%抗生物質(100U/mLのペニシリン及び100mg/Lの硫酸ストレプトマイシン)を追加したF-12K培地(Kaighn’s Modification of Ham’s)中で培養した。
HEK293細胞を、10%(v/v)ウシ胎児血清(Gibco)及び1%抗生物質(100U/mLのペニシリン及び100mg/Lの硫酸ストレプトマイシン)を追加したダルベッコー修飾イーグル培地(Invitrogen)中で培養した。全ての細胞を、5%のCO2を含む37℃の湿気環境中で育成した。
Neuro-2a細胞を、10%(v/v)ウシ胎児血清(Gibco)及び1%抗生物質(100U/mLのペニシリン及び100mg/Lの硫酸ストレプトマイシン)を追加したイーグル最小必須培地(EMEM)中で培養した。
HCT細胞を、10%(v/v)ウシ胎児血清(Gibco)及び1%抗生物質(100U/mLのペニシリン及び100mg/Lの硫酸ストレプトマイシン)を追加したRPMI-1640培地(ATCC 30-2001)中で培養した。
ヒトiPSCを、GF-1添加剤(1:333に希釈)、GF-2添加剤(1:1000に希釈)及びGF-3添加剤(1:1000に希釈)を追加したCELLARTIS DEF-CS基本培地中で培養した。
プラスミド変異。変異をG-Blocksの遺伝子フラグメント及び合成によって行った。
実施例1.Cas9対FaDe-Cas9:タンパク質代謝回転の分析
プラスミドトランスフェクション。不死化ヒト又はマウス細胞株を、リバーストランスフェクションにより、Cas9又はFaDe-Cas9(FaDe-Cas9:F185N変異を有する野生型Cas9;図5AのKFERQ-Cas9として示される)をコードするプラスミドでトランスフェクトした。3μgのプラスミド(Cas9又はFaDe-Cas9)をOPTIMEM培地中でトランスフェクション剤(Lipofectamine LTX)と混合し、6ウェルプレートに25分間インキュベートした。インキュベーション後、細胞を剥離し、計数し(50×104)、2mLの完全培地中に再懸濁し、トランスフェクション試薬ミックスを含有するウェルに添加した。トランスフェクション後24時間で細胞をGFP発現により分析して、トランスフェクション効率を評価し、ウエスタンブロット法のために様々な時点で採取した。
ウエスタンブロットのための細胞溶解及びタンパク質抽出。トランスフェクト細胞をトリプシンで採取し、2000rpmで5分間遠心分離した。冷PBS1Xで洗浄した後、細胞ペレットを、プロテアーゼ阻害剤を加えた冷「2工程溶解バッファー」(2工程溶解バッファー」:10mMのKCl、20mMのTris HCl pH7.4、10mMのMgCl2、20mMのEDTA、10%のグリセロール、0.8%のTRITON)に懸濁させ、ボルテックスし、超音波処理し、氷上で20分間インキュベートした。超音波処理プログラムは、2つの処理を含んだ:最大出力20.0-衝撃係数40.0-サイクルバースト50-期間15秒間。続いて細胞溶解液を420nMのNaClで5分間インキュベートして核酸からタンパク質を分離させ、4℃で30分間にわたる15,000rpmの遠心分離により清澄化した。遠心分離後、DNA及び膜を含有するペレットを廃棄し、上澄みのタンパク質濃度をNANODROPにより測定した。
免疫ブロッティング。上記の通りトランスフェクトした細胞からの清澄化溶解液をローディングバッファー(10%β-メルカプトエタノール)と混合し、8分間煮沸した。試料をNUPAGE Bis-Tris SDSタンパク質ゲルに投入し、200V(MOPS 1X)で40分間運転することによって分離した。続いて、タンパク質ゲルを、20%のメタノールを加えたNUPAGE転写バッファーを用いて35Vでニトロセルロース膜に転写した(タンク転写)。膜を1%BSA中で1時間ブロックし、一次抗体を用いて4℃でインキュベートした。PBS TWEEN0.2%で3回洗浄した後、二次抗体(1%BSA中1:10000)を用いて、室温で1時間膜をインキュベートしてからPBS TWEEN0.2%で3回洗浄した。ODYSSEYイメージングシステムを用いて検出を実施した。
結果を図6A、6B及び7に示す。Cas9対FaDe-Cas9の分析は、FaDe-Cas9の発現がウエスタンブロットの検出レベル未満であったことを示した(図6A)。図6Bに示すように、FaDe-Cas9を生成するためのCas9中の変異は、Cas9抗体特異性を損なわない。図7Aに示すように、FaDe-Cas9は、Cas9と比較して短い時間窓内で非常に低い発現を示した。Cas9は、トランスフェクション後8時間から72時間まで、増加するレベルで抗Cas9によって検出可能であったが、FaDe-Cas9は、トランスフェクション後8時間であっても抗Cas9によって検出されなかった。
GFP融合タンパク質発現によるタンパク質代謝回転の分析。96ウェルプレートに7×103細胞密度で播種したHEK293細胞を、それ自体のプロモーター下で発現したCas9-GFP融合体又はFaDe-Cas9-GFp融合体及びmCherryをコードする100ngのデュアルプロモーター駆動レポーターベクターでトランスフェクトした。FUGENE HDトランスフェクション試薬でトランスフェクションを実施した。続いて、プレートをINCUCYTE内に置いて、経時的なGFP蛍光シグナルを測定することによってCas9及びFaDe-Cas9タンパク質のインビボレベルを監視した。mCherry蛍光を分析してトランスフェクション効率を評価した。トランスフェクション効率評価のために細胞にトランスフェクトされたデュアルレポーターベクターの図面については、図8を参照されたい。
結果を図9~11に示す。トランスフェクション効率は、同等である(mCherry蛍光により測定して、図10A)が、FaDe-Cas9-GFp融合体は、Cas9-GFP融合体と比較するとより低い発現レベルを示した(GFP蛍光により測定して、図10B)。図12は、HEK、HCT、hIPSc及びNeuro-2a細胞中の類似のCas9及びFaDe-Cas9タンパク質代謝回転実験の結果を示し、これは、FaDe-Cas9の高い代謝回転が細胞の種類とは無関係であることを示す。
半定量的RT-PCRによるmRNA安定性の評価。Cas9又はFaDe-Cas9をコードするプラスミドをトランスフェクトしたSVHUC1細胞からRNAを単離した。様々な時点で採取した細胞ペレットを1mLのTRIZOLに懸濁させた。RTで5分間後、200μLのクロロホルムを添加し、続いて室温で3分間インキュベートした。試料を4℃で15分間にわたり15,000rpmで遠心分離し、水相(RNA含有)を別の管に回収した。続いて、500μLのイソプロパノールを水相に添加し、室温で10分間インキュベートし、15,000rpmで遠心分離することによりRNAを沈殿させた。底部のゲル状ペレットとしてRNAを回収し、70%エタノールで洗浄して、RNアーゼフリーの水に溶解した。RNA試料を、1μgのRNA、1×のDNアーゼバッファー並びに超純水を加えた1μLのDNアーゼを含有する10μL反応中のDNアーゼで処理した。混合物を37℃で30分間インキュベートし、RNA濃度をNANODROPで測定した。
cDNA合成。500ngのRNA、1μLのランダムヘキサマープライマー、4μLの5×反応バッファー、1μLのRIBOLOCK RNアーゼ阻害剤(20U/μL)、2μLの10mM dNTPミックス、1μLのREVERTAID RT(200U/μL)及びヌクレアーゼフリー水を含む20μL反応中で反応を実施した。反応を42℃で60分間インキュベートし、70℃で5分間加熱することにより終了させた。
PCR。PCRを20μLの反応容量中の1μLのQ5 Hot Start High-Fidelity 2× Master Mixで実施した(0.5μLのフォワード及びリバースプライマー(10μM)、1μLのcDNA及び水)。各反応は、3重で実行した。PCRは、以下の通り実施した:95℃で1分間の熱変性、続いて24サイクルの95℃で30秒間の熱変性、58℃で30秒間のアニーリング、72℃で30秒間の伸長及び2分間の最終伸長。
結果は、図7Bに示され、これは、Cas9及びFaDe-Cas9からの同様のmRNA転写レベルを示す。これらのデータは、Cas9及びFaDe-Cas9のトランスフェクション効率が同等であったことを立証する。
実施例2.FaDe-Cas9のタンパク質代謝回転及び細胞内位置に対するCMAの役割の評価。
Cas9-HSC70の共免疫沈降。70%の密集度で播種されたSV-HUC-1細胞を、Cas9又はFaDe-Cas9をコードするプラスミドでトランスフェクトした。トランスフェクション後48時間で細胞を採取し、CO-IP溶解バッファーで溶解した(140mMのKCl、3mMのMgCl2、0.5%のNONIDET P-40、20mMのHEPES pH7.4、1mMのEDTA、1.5mMのEGTA、プロテアーゼ阻害剤(EDTAフリーのプロテアーゼ阻害剤のカクテル))。細胞ペレットを、冷たい新たに調製した溶解バッファーに懸濁させ、1mLシリンジを用いて25ゲージ針に5~6回通した。溶解液を氷上で30分間インキュベートし、4℃で20分間にわたり15,000rpmで遠心分離した。清澄化溶解液を新しい管に回収し、NANODROPで分析してタンパク質濃度を測定した。Cas9の免疫沈降を、溶解バッファー中で希釈され、Cas9一次抗体(1:100)を用いて4℃で終夜インキュベートされた800μgの清澄化溶解液上で実施した。翌日、免疫複合体を4℃で4時間にわたりタンブリングホイール上の50μLのタンパク質G-セファロースビーズ上に固定化した。続いて、ビーズをCO-IP溶解バッファーで洗浄し(3×)、30μLのSDS試料バッファーに再懸濁させ、5分間煮沸し、HSC70一次抗体を用いたウエスタンブロットに供した(1:1000)。
結果を図13Aに示す。共免疫沈降法は、CMAシャペロンHSC70とFaDe-Cas9とが相互作用するが、Cas9と相互作用しないことを示した。抗HSC70ブロットによって示されるように、抗HSC70抗体を用いてFaDe-Cas9は、検出されたが、Cas9は、検出されなかった。
FaDe-Lamp2Aの共局在化。96ウェルプレートに7×103の細胞密度で播種したHEK293細胞を50ngのCas9-GFP融合体又はFaDe-Cas9-GFp融合体及び30ngのLamp2A-dsRed融合体で共トランスフェクトした。トランスフェクション後24時間で細胞をINCUCYTE zoomによって分析した。細胞にトランスフェクトしたプラスミドの概略については、図14を参照されたい。
結果を図13B及び15に示す。GFP標識化Cas9又はFaDe-Cas9は、緑色蛍光を呈する一方、mCherry標識化Lamp2Aは、赤色蛍光を示した。免疫蛍光シグナルの可視化により、サイトゾル中でリソソームタンパク質及びCMAレギュレーターLamp2Aと共局在化するFaDe-Cas9が示された。Lamp2Aとの共局在化は、活性な分解を示唆する。
細胞内タンパク質分画。細胞をトリプシン-EDTAで採取し、続いて500×gで5分間遠心分離した。細胞ペレットを氷冷PBSで洗浄し、乾燥させて、上澄みを除去し廃棄した。細胞質抽出物のために、プロテアーゼ阻害剤を含有する氷冷細胞抽出バッファー(CEB)を細胞ペレットに添加し、4℃で10分間インキュベートした。溶解液を500×gで5分間遠心分離した。続いて、上澄み(細胞質抽出物)を、氷上で予め冷却された清浄な管に移した。プロテアーゼ阻害剤を含有する氷冷膜抽出バッファー(MEB)をペレットに添加して膜を抽出し、4℃で10分間インキュベートし、続いて3000×gで5分間遠心分離した。核抽出のために、100μLあたり5μLの100mMのCaCl2及び3μLの小球菌ヌクレアーゼ(300単位)を加えたプロテアーゼ阻害剤を含有する氷冷核抽出バッファー(NEB)をペレットに添加し、4℃で10分間、続いて室温で5分間インキュベートした。続いて、溶解液を、4℃で10分間にわたり15,000rpmで遠心分離することにより清澄化した。各細胞区画から抽出されたタンパク質を測定してタンパク質濃度を定量化し、NUPAGE Bis-Tris SDSタンパク質ゲル上で分離した。
トランスフェクションから48時間後のCas9及びFaDe-Cas9の細胞内局在化の結果を図16に示す。Cas9及びFaDe-Cas9は、同じ細胞内位置で発見され、これは、FaDe-Cas9中のF185N変異が区画化に影響を及ぼさなかったことを示す。
実施例3.酵素活性、オンターゲット及びオフターゲットインデルの分析
ゲノムDNA抽出。ゲノムDNA抽出を、Gentra Puregeneキットを用いて実施した。細胞ペレットを300μLの溶解バッファーに懸濁させ、タンパク質沈殿バッファー(100μL)の添加後、氷上で5分間インキュベートした。続いて溶解液を10分間にわたり14,000rpmで遠心分離し(centrifugated)、上澄みをDNA沈殿のために300μLのイソプロパノールと混合し、続いて10分間にわたり14,000rpmで遠心分離した。DNAペレットを100μLの70%エタノールで洗浄し、30μLの水に懸濁させた。DNA濃度をNANODROPで測定した。
Surveyorヌクレアーゼアッセイ。PCR:100ngのgDNA及び1μLのフォワード及びリバースプライマー(10μM)を加えた10μLの2× Master Mix(PHUSION Flash High-Fidelity PCR)を含む20μLの合計容量中でPCRを実施した。PCRは、以下の通り実施した:95℃で3分間の熱変性、続いて35サイクルの95℃で5秒間の熱変性、58℃で30秒間のアニーリング及び72℃での伸長(1分/1,000bps)及び5分間の最終伸長。
消化:PCR生成物を、99℃で5分間加熱することにより熱変性させ、続いてヘテロ二本鎖形成のために、65℃で30分間及び23℃で30分間冷却することにより再アニーリングした。
ハイブリダイズされたヘテロ二本鎖又はホモ二本鎖を、ヘテロ二本鎖DNA中に存在するミスマッチを認識し、ミスマッチひずみの3’側上で両方の鎖を開裂させるSurveyorヌクレアーゼ(CELヌクレアーゼとしても知られる)で処理した。したがって、50μL中の反応容量中の20μLの未精製PCR生成物(約250ng)を42℃で20分間にわたり、1μLのsurveyor酵素+1μLのエンハンサーで消化した。続いて10μLの処理済みDNAを電気泳動によって10%アクリルアミドゲル上で40分間にわたり分離した。
HEK細胞中のCas9及びFaDe-Cas9のヌクレアーゼ効率を判定するアッセイの結果を図17Aに示す。「切断」DNAを示すゲルバンドにより示されるように、Cas9及びFaDe-Cas9ヌクレアーゼ活性は、同等であった。図17Bに示される次世代配列分析は、Cas9(12.8%)及びFaDe-Cas9(16.5%)で同等のヌクレアーゼ効率を立証した。図18は、FaDe-Cas9がhiPSC中でCas9と同等レベルのヌクレアーゼ活性を有したことを示した。
EMX1/FANCF1オフターゲット分析。HEK293細胞を60×104の密度で12ウェルプレートに播種し、Cas9又はFaDe-Cas9をコードするプラスミド800ng及びgRNAをコードするプラスミド200ngで共トランスフェクトした(EMX1又はFANCF1)。FUGENE HDトランスフェクション試薬を用いてトランスフェクションを実施した。トランスフェクション後72時間で細胞を採取し、ゲノムDNA抽出のために溶解した。100ngのgDNA、1μのPHUSION FLASH High-Fidelity PCR Master Mix並びにIlluminaからの製造者推薦に基づいて設計されたアダプター融合フォワード及びリバースプライマーでオンターゲット及びオフターゲット領域のPCR増幅を実施した。PCRは、以下の通り実施した:95℃で1分間の熱変性、続いて30サイクルの95℃で30秒間の熱変性、58℃で30秒間のアニーリング、72℃で30秒間の伸長及び2分間の最終伸長。PCR生成物を精製し、次世代配列決定法により分析した。
結果を図19に示す。FaDe-Cas9は、Cas9と比較してわずかに低いオンターゲット修飾を有していたが、FaDe-Cas9のオフターゲット修飾は、Cas9と比較して著しく低下した。したがって、FaDe-Cas9は、Cas9よりも増加した正規化オンターゲット修飾の効率を示した。
リボ核タンパク質(RNP)エレクトロポレーション。Cas9/RNPの予複合体化:1.5mLの管中において、100pmolのCas9又はFaDe-Cas9を10μLの1×Cas9バッファー中で120pmolの合成デュアルgRNAと混合し、室温で20分間インキュベートした。20×104の密度のHEK293細胞を20μLのエレクトロポレーションバッファーSFに懸濁させ、RNP複合体で2分間インキュベートした。細胞を、4D NUCLEOFECTOR(Lonza)を用いてエレクトロポレーションした。ヌクレオフェクション(nucleofection)後、細胞を、1mLの完全培地(DMEM)を備える12ウェルプレートに播種し、様々な時点で採取した(3時間、6時間、10時間、24時間)。
RNPトランスフェクション。ヒトiPSCを、20×104の密度で播種し、濃度が増加するCas9又はFaDe-Cas9及び3μMのデュアルgRNAでトランスフェクトした。Lipofectamine CRISPRMAXトランスフェクション試薬でトランスフェクションを実施した。感染後48時間で細胞をゲノムDNA抽出のために溶解させ、PCRにより欠失を立証した。
実施例4.細胞に対するCas9発現の効果
実施例4.1
ヒト尿路上皮細胞(SVHUC-1)を野生型Cas9でトランスフェクトした。Cas9を含有する細胞クローンをddPCRにより立証した(図1A、上部のパネル)。Cas9の安定細胞株の生成から4週間後、細胞は、増殖し、24、48及び72時間で計数した。野生型細胞(Cas9なし)、クローン1(異型Cas9組込み)及びクローン3(同型Cas9組み込み)からの細胞計数は、低減傾向を示した(図1A、下部のパネル)。
実施例4.2
マウスをドキシサイクリン誘導性プロモーター上において野生型Cas9でトランスフェクトした。誘導後、マウス(「iCas dox」)の体重を測定し、野生型マウス(「WT water」)、ドキシサイクリンを含む野生型マウス(「WT dox」)及びCas9でトランスフェクトさせたが、Cas9を発現していないマウス(「iCas water」)と比較した。図1Bの結果は、野生型Cas9でトランスフェクトされ、野生型Cas9を発現したマウスは、Cas9を発現していないマウスと比較して体重の減少を呈することを示す。
実施例4.3
ヒトの誘発された多能性幹細胞(hiPSC)を野生型Cas9で一過性にトランスフェクトした。Cas9の一過性発現から5週間後に細胞の顕微鏡画像を取得した。図2に示すように、hiPSCは、Cas9を一過性発現したときにその未分化表現型を喪失する。
実施例5.タンパク質代謝回転のCas9対FaDe-Cas9分析
実施例5.1 ELISAアッセイにより測定したCas9及びFaDe-Cas9の細胞内タンパク質レベル
20×104の密度のHEK293細胞を20μLのエレクトロポレーションバッファーSFに懸濁させ、RNP複合体で2分間インキュベートした。細胞を、4Dヌクレオフェクター(nucleofector)を用いてエレクトロポレーションした(4D-Nucleofector Core Unit:Lonza,AAF-1002B;4D-Nucleofector X Unit:AAF-1002X;Lonza)。ヌクレオフェクション後、細胞を、1mLの完全培地(DMEM)を含む12ウェルプレートに播種し、24時間で採取した。細胞を溶解させ、市販キットのELISAアッセイ(Cell Biolabs)により、使用説明書に従い、タンパク質レベルを分析した: RIPAバッファー(25mMのTris・HCl pH7.6、150mMのNaCl、1%のNP-40、1%のデオキシコール酸ナトリウム、0.1%のSDS)などの溶解バッファー中で細胞又は組織溶解液を超音波処理又は均質化し、アッセイ前に4℃で10分間にわたり10,000×gで遠心分離した。
結果を図24Aに示す。7.5μg/10^5細胞のRNPエレクトロポレーションでは、24時間で約5%の細胞内Cas9が回復した(<0.1%のFaDe-Cas9と比較して)。FaDe-Cas9は、エレクトロポレーション後24時間で細胞中の豊富さが>97%少なかった。
実施例5.2 タンパク質代謝回転及び分解の測定
HEK293細胞を、GFP融合Cas9又はFaDe-Cas9を用いて30×104の密度でトランスフェクトさせ、incucyteによりGFP発現を経時的に分析した。
トランスフェクション後12時間で細胞をCHX(10μg/ml)で処理して、タンパク質合成を阻害し、GFPシグナルに従い、未処理細胞と比較して、Cas9対FaDe-Cas9の分解タンパク質を測定した。
GFP発現により、FaDe-Cas9の豊富さが減少し、Cas9で観察された細胞内タンパク質レベルに決して到達しなかった(図24B)。タンパク質翻訳阻害剤シクロヘキシミド(CHX)に暴露された細胞は、FaDe-Cas9レベルの時間依存的な低下を示し、経時的に一定を維持したCas9タンパク質レベルとは対照的であった(図24C)。
実施例6.FaDe-Cas9の高いタンパク質代謝回転及びタンパク質の細胞内局在化に対するCMAの役割
実施例6.1 Lamp2Aノックダウン
HEK293細胞を、RNAiMAXトランスフェクション試薬及びOPTIMEMを使用し、GFP融合発現ベクターCas9又はFaDe-Cas9、加えてDs-Red lamp2aベクター(2:1)、加えてgRNA(3:1)及び増加用量のsiRNA(10~20~40~60~90~100ng)を用いて、7×103の密度で共トランスフェクトした。対照として、HEK293細胞をスクランブルsiRNAで共トランスフェクトした。トランスフェクトした細胞をincucyte zoomで経時的に監視し、GFPシグナルによりKD lamp2a効率及びタンパク質蓄積を分析した。
CMAを阻害するために、リソソーム受容体Lampa2aの発現をsiRNAにより低下させた。siRNAのトランスフェクションにより、Lamp2A受容体の用量依存的な低減がもたらされた(図25A/B)が、Cas9のタンパク質レベルは、不変である一方(図25A)、FaDe-Cas9は、用量依存的な蓄積を示し、これは、その分解がCMA依存的であることを示唆した(図25B)。
実施例6.2 Cas9-HSC70の共免疫沈降。
MaxCyteを使用して、HEK293s細胞(5,000万)を20μgのFLAG標識融合Cas9又はFaDe-Cas9でエレクトロポレーションした。エレクトロポレーション後24時間で細胞を100μMのロイペプチン(カテプシンB阻害剤)で処理し、リソソームによる分解を一時的に阻害した。エレクトロポレーション後48時間で細胞を採取し、CO-IP溶解バッファーで溶解した(140mMのKCl、3mMのMgCl2、0.5%のNonidet P-40、20mMのHepes pH7.4、1mMのEDTA、1.5mMのEGTA、プロテアーゼ阻害剤(EDTAフリーのプロテアーゼ阻害剤のカクテル-Sigma)。細胞ペレットを、冷たい新たに調製した溶解バッファーに懸濁させ、1mLシリンジを用いて25Ga針に5~6回通した。溶解液を氷上で30分間インキュベートし、4℃で20分間にわたり15,000で遠心分離した。清澄化溶解液を新しい管に回収し、Nanodropで分析してタンパク質濃度を測定した。Cas9の免疫沈降を、溶解バッファー中で希釈され、4℃で終夜にわたりFLAG一次抗体(抗FLAG F7425 SIGMA 1:500)を用いてインキュベートされた800μgの清澄化溶解液上で実施した。翌日、免疫複合体を、4℃で4時間にわたり、タンブリングホイール上でタンパク質G-セファロースビーズ(50μL)上に固定化した。ビーズをCO-IP溶解バッファーで洗浄し(3×)、SDS試料バッファー(30μL)に再懸濁させ、5分間煮沸し、Cas9及びHSC70一次抗体を用いたウエスタンブロットに供した(1:1000)。30μgの溶解液を投入量(INPUT)として用いて、タンパク質の合計量を立証した。
免疫沈降法は、FaDe-Cas9がシャペロン介在性オートファジーHSC70のマスターレギュレーターに対する高親和性の結合を有することを示した。結果を図26に示す。
実施例7.Cas9対FaDe-Cas9インビボマウスモデル
実施例7.1 アデノウイルス作成物
Cas9又はFaDe-Cas9及びgRNAを発現するアデノウイルス(Ad-Cas9-gMH及びAd-Cas9-gP並びにAd-FaDe-Cas9-gMH及びAd-FaDe-Cas9-gP)を、Vector Biolabs(Malvern)により生成した。Adv Cas9/FaDe及びgRNAを複製欠損性アデノウイルス-血清型5(dE1/E3)骨格中でそれぞれニワトリβ-アクチンハイブリッド(CBh)及びU6プロモーターから発現させた。CBh及びCMVプロモーターからそれぞれCas9及びGFPを発現するが、gRNAを発現しない陰性対照アデノウイルス(Ad-Cas9-GFP及びAd-FaDe-Cas9-GFP)も生成した。
実施例7.2 インビボでのオン/オフ標的分析
インビボでのオフターゲット編集分析のために、複数のオフターゲット変異マウスゲノムを誘発する高い可能性のために選択されたマウスPCSK9遺伝子座を標的化する広宿主域ガイドRNA(gP)(図27A)。
9~11週齢の雄マウスが、リン酸緩衝生理食塩水で希釈した200μL中の1×109感染単位(IFU)用量のアデノウイルス(Ad-Cas9-gp若しくはAd-FaDe-Cas9-gp又はAd-Cas9-GFP又はAd-FaDe-Cas9-GFP)の尾静脈注射を受けた。ウイルス投与前(ベースライン)、ウイルス投与から1週間後及び終了時(ウイルス投与から4日又は3週間後)に末梢血をサンプリングした。
処理後7日目に、アデノウイルスを注射されたマウスの肝組織由来のゲノムDNAをインデル分析のために抽出した。標的化ディープ配列決定のために、オフターゲットを、CIRCLE-seqにより、オンターゲットの50%を超える読取計数を有する部位及び様々なより下位にランクされる部位(オンターゲットと比較して最大で6つのミスマッチを含む)を選択することにより同定した。マウスモデルにおけるgPのオンターゲット+9つのオフターゲット部位での遺伝子編集頻度の評価は、9つのうちの4つの異なるオフターゲット部位が、Cas9と比較して、FaDe-Cas9による著しく低減した遺伝子編集を示したことを示した(図27B)。
実施例7.3 次世代配列決定(NGS)
PCR生成物を、電磁ビーズを用いて精製し、QuantiFlor dsDNA Systemキット(Promega)を用いて定量化し、単位複製配列あたり10ng/μLに正規化し、プールした。プールした試料を、Illumina用NEBNext Ultra II DNA Library PrepキットからのEnd Prep Enzyme Mix及び反応バッファーを用いて末端修復及びA-テーリングし、同じキットからのライゲーションマスターミックス及びライゲーションエンハンサーを用いてIllumina TruSeqアダプターにライゲートさせる。続いて、ライブラリ試料を電磁ビーズで精製し、PEG/NaCl SPRI溶液(KAPA Biosystems)を用いてサイズ選択し、droplet digital PCR(BioRad)を用いて定量化し、ディープ配列決定のためにIllumina MiSeq上に搭載した。
実施例7.4 インビボゲノム編集及び生存率評価
インビボでのPcsk9遺伝子編集のために、マウス又はヒトPSCK9の単一対立遺伝子を収容する9~11週齢ヒト化PCSK9マウス(PCSK9KIKO)が、リン酸緩衝生理食塩水で希釈した200μL中の1×109感染単位(IFU)の用量のアデノウイルス(Ad-Cas9-gMH又はAd-FaDe-Cas9-gMH及びAd-Cas9-GFP又はAd-FaDe-Cas9-GFP)で尾静脈注射を受けた。処理後7日目に、アデノウイルスを注射されたマウスの肝組織由来のゲノムDNAを、それぞれヒト及びマウスPCSK9遺伝子座上でのNGSによるインデル分析のために抽出した。肝臓ローブをパラフィンブロックに収め、ヘマトキシリン&エオシン(H&E)、有糸分裂マーカーKi6、Cas9、開裂カスパーゼ3、p-H2AX及びCD4/CD8のために染色した。
FaDe-Cas9に暴露されたマウス肝臓は、その肝組織中での急速な分解(これは、したがって、図28Aに示されるように編集された細胞のより高い生存率をもたらす)の結果として、より高い遺伝子編集を示した。インビボでのFaDe-Cas9の急速な代謝回転により、肝毒性は、Cas9と比較してより低くなり、これは、未変化の肝臓グリコーゲン、ほぼ検出不可能な有糸分裂マーカーKi67、より少ない浸潤物及び最小限の細胞壊死によって確認された。(図28B/C)。
更に、インビボでのFaDe-Cas9のウイルス媒介発現により、細胞傷害性T-リンパ球免疫応答は、より低くなった(図29)。AdV送達後1週間で、Cas9は、肝細胞中で依然として高度に発現していたが、FaDe-Cas9は、検出不可能であった(A、E)。FaDe-Cas9のより短い潜伏時間のために、肝細胞中のアポトーシス(開裂カスパーゼ3 IHC;B、F)及びDNA二本鎖の切断(ホスホ-H2AX IHC;C、G)のレベルがより低くなった。マウス肝臓中のCas9送達に対する免疫反応は、中程度数のCD4+(メモリー)リンパ球及び多数のCD8+(細胞傷害性)リンパ球からなったが、後者は、FaDe-Cas9 AdVに感染した肝臓中で著しく減少した(CD4-CD8 IHC;D、H)。