[go: up one dir, main page]

CN119570909A - 用于靶标筛选的方法和系统 - Google Patents

用于靶标筛选的方法和系统 Download PDF

Info

Publication number
CN119570909A
CN119570909A CN202411787375.7A CN202411787375A CN119570909A CN 119570909 A CN119570909 A CN 119570909A CN 202411787375 A CN202411787375 A CN 202411787375A CN 119570909 A CN119570909 A CN 119570909A
Authority
CN
China
Prior art keywords
cells
cell
exogenous
protein
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202411787375.7A
Other languages
English (en)
Inventor
杉本庆树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Xite Corp
Original Assignee
New Xite Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Xite Corp filed Critical New Xite Corp
Publication of CN119570909A publication Critical patent/CN119570909A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • G01N15/1433Signal processing using image recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/149Optical investigation techniques, e.g. flow cytometry specially adapted for sorting particles, e.g. by their size or optical properties
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48735Investigating suspensions of cells, e.g. measuring microbe concentration
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5026Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on cell morphology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/10Nucleic acid folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1493Particle size
    • G01N2015/1495Deformation of particles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1497Particle shape
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Dispersion Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Signal Processing (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)

Abstract

本公开内容提供了用于鉴定核酸的方法,其可以包括对已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导的细胞进行温育。接下来,可以鉴定所述细胞的形态变化。接下来,可以处理所述细胞的内容物以鉴定核酸序列或肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列。接下来,可以分析所述核酸序列或所述肽、多肽或蛋白质或所述肽、多肽或蛋白质的所述序列,以确定所述外源RNA分子或所述外源DNA分子的外源序列。接下来,可以将所述外源RNA分子或所述外源DNA分子的所述外源序列鉴定为影响所述细胞的所述形态变化。

Description

用于靶标筛选的方法和系统
本申请是申请日为2019年10月17日、申请号为201980083654.6、发明名称为“用于靶标筛选的方法和系统”的中国专利申请(其对应PCT申请的申请日为2019年10月17日、申请号为PCT/US2019/056743)的分案申请。
交叉引用
本申请要求于2018年10月18日提交的美国临时专利申请号62/747,620和于2019年3月28日提交的美国临时专利申请号62/825,524的权益,出于所有目的每一项专利申请均通过引用整体并入本文。
背景技术
混合遗传筛选是非常强大的工具,用于鉴定负责目标途径的基因。到目前为止,用于混合遗传筛选的选择方法主要依靠阳性筛选、阴性筛选或通过荧光激活细胞分选(FACS)进行的基于荧光强度的筛选。
基于图像的筛选也是非常有用的筛选方法,用于鉴定在目标途径中可能具有重要作用的基因。大多数基于图像的筛选方法只能通过显微镜进行,并且可能不适用于混合格式的筛选。
发明内容
本文提出了用于基于快速图像的混合遗传/肽筛选(RIPGS)的系统和方法。这些系统和方法可以代表用于诸如转录因子、RAS和磷酸酶等非药物性靶标的新的高通量命中鉴定平台。此外,RIPGS可用于鉴定一种或多种基因,这些基因引起转录因子的核转位、蛋白质聚集、细胞器功能障碍等。可以在一种或多种细胞中转导一个或多个肽表达文库、核糖核酸(RNA)文库、短发夹RNA(shRNA)文库、小干扰RNA(siRNA)文库、微小RNA(miRNA)文库、反义RNA(asRNA)文库或成簇的规律间隔的回文重复序列(CRISPR)向导RNA(gRNA)文库。向导RNA文库可以是单个向导RNA(sgRNA)文库。一旦使用文库对细胞进行转染或转导并准备好进行分析,就可以基于荧光信号模式对目标细胞进行分选,这些荧光信号模式表现出诸如蛋白质定位等行为。可以通过核酸测序,如下一代测序(NGS)来分析所分选的细胞,以确定在细胞中转染或转导了哪些质粒。该一流的药物发现平台将不仅使行业受益,还将使患者受益。
在各个方面,本公开内容提供了一种用于鉴定核酸分子的方法,其包括:(a)提供已经或疑似已经被至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中所述细胞在细胞群之中;(b)在(a)之后,鉴定所述细胞的形态变化;(c)处理所述细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或(iii)所述肽、多肽或蛋白质的序列;(d)分析(i)所述核酸序列或(ii)所述肽、多肽或蛋白质或(iii)所述肽、多肽或蛋白质的所述序列以确定所述外源RNA分子或所述外源DNA分子的所述外源序列;以及(e)将所述外源RNA分子或所述外源DNA分子的外源序列鉴定为影响所述细胞的所述形态变化。
在一些方面,所述外源RNA分子或所述外源DNA分子的所述外源序列是未知的。在一些方面,所述外源RNA分子或所述外源DNA分子的所述外源序列是已知的。在一些方面,所述外源RNA分子或所述外源DNA分子编码基因、肽、多肽或蛋白质。
在一些方面,所述形态变化包括一个或多个选自以下的成员:所述细胞内蛋白质-蛋白质相互作用的变化、所述细胞内蛋白质定位的变化、所述细胞的形状变化、所述细胞的一种或多种成分的形状变化、以及所述细胞的一种或多种细胞器的形状变化。在一些方面,使用包含所述外源RNA分子或所述外源DNA分子的质粒转染所述细胞。
在一些方面,(c)包括对来自所述细胞的至少一个核酸分子或至少一个蛋白质分子进行测序。在一些方面,所述测序包括大规模并行阵列测序。在一些方面,所述测序包括合成测序。在一些方面,所述测序包括下一代测序。
在一些方面,使用光学显微镜法鉴定所述形态变化。在一些方面,所述光学显微镜法包括共聚焦显微镜法。
在一些方面,在(b)中,在所述细胞在流动池或流动通道中流动时,鉴定所述细胞的所述形态变化。在一些方面,在(b)中鉴定所述形态变化,所述细胞未被固定化或固定。在一些方面,当在(b)中鉴定所述形态变化时,所述细胞是被固定的。
在一些方面,所述细胞群是异质的。在一些方面,对于所述细胞群之中的多个细胞中的每个细胞重复(b)。在一些方面,以至少约1500个细胞/秒(细胞/s)的速率重复(b)。在一些方面,以至少约2000个细胞/秒、至少约3000个细胞/秒、至少约4000个细胞/秒、至少约5000个细胞/秒、至少约6000个细胞/秒、至少约7000个细胞/秒、至少约8000个细胞/秒、至少约9000个细胞/秒或至少约10,000个细胞/秒的速率重复(b)。
在一些方面,基于所述形态变化从所述细胞群中分离所述细胞。在一些方面,所述细胞群未被固定化或固定。在一些方面,所述细胞群是被固定的。在一些方面,在(b)中鉴定所述形态变化,所述细胞群流过流动池或流动通道。在一些方面,所述细胞群之中的每个细胞包含至少一个随机插入的外源RNA分子或至少一个随机插入的外源DNA分子。
在一些方面,(b)包括使所述细胞成像。在一些方面,(b)包括获得包含图像信息的时间信号。在一些方面,将所述时间信号转换成与时间无关的图像信息。在一些方面,(b)包括获得包含空间信息的时间信号。在一些方面,将所述时间信号转换成与时间无关的空间信息。
在一些方面,所述方法还包括在鉴定所述细胞内所述形态变化后分离所述细胞,并随后从所述细胞获得所述测序信息。在一些方面,从多个细胞中分离所述细胞。
根据权利要求1所述的方法,还包括使用至少所述形态变化来确定所述外源DNA分子或所述RNA分子抑制或激活所述细胞内的生化途径。
在一些方面,(b)包括使用机器学习算法来鉴定所述形态变化。在一些方面,所述机器学习算法包括选自以下的一个或多个成员:支持向量机、随机森林、人工神经网络、卷积神经网络、深度学习、超深度学习、梯度提升、AdaBoosting、决策树、线性回归和逻辑回归。在一些方面,使用训练集训练所述机器学习算法,所述训练集包括对于所述形态变化呈阳性的细胞群的图像信息和对于所述形态变化呈阴性的细胞群的图像信息。在一些方面,使用训练集训练所述机器学习算法,所述训练集包括对于所述形态变化呈阳性的细胞群的空间信息和对于所述形态变化呈阴性的细胞群的空间信息。
在一些方面,所述方法还包括,在(b)之前,标记所述细胞内的所述肽、多肽或蛋白质。在一些方面,所述标记包括用一种或多种荧光标记、福斯特共振能量转移(FRET)标记、染料、荧光团或量子点标记所述一个或多个肽、多肽或蛋白质。
在各个方面,本公开内容提供了一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的方法,其包括(a)提供已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中所述细胞在细胞群之中,并且其中所述外源RNA或DNA导致所述细胞在所述细胞内表达大分子群,(b)鉴定响应于由所述细胞表达的所述大分子群体的所述细胞的形态变化,(c)对所述细胞的基因组进行序列鉴定以鉴定所述外源RNA或DNA,以及(d)确定所述外源RNA或DNA诱导所述形态变化。
在一些方面,鉴定所述形态变化包括鉴定所述大分子群的大分子的定位概况或模式。在一些方面,鉴定所述形态变化包括鉴定所述细胞或所述细胞的一种或多种亚细胞成分的形状。在一些方面,所述一种或多种亚细胞成分包含所述细胞的细胞器。在一些方面,所述大分子群包括选自肽、多肽、蛋白质和核酸分子的一个或多个成员的群。
在各个方面,本公开内容提供了一种用于鉴定核酸分子的系统,其包括一个或多个计算机处理器,所述一个或多个计算机处理器被单独或共同编程以:(a)鉴定细胞的形态变化,所述细胞已经或疑似已经被至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导,其中所述细胞在细胞群之中;(b)处理所述细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列;(c)分析(i)所述核酸序列或(ii)所述肽、多肽或蛋白质或所述肽、多肽或蛋白质的所述序列,以确定所述外源RNA分子或所述外源DNA分子的所述外源序列;以及(d)将所述外源RNA分子或所述外源DNA分子的外源序列鉴定为影响所述细胞的所述形态变化。
在各个方面,本公开内容提供了一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的系统,其包括一个或多个计算机处理器,所述一个或多个计算机处理器被单独或共同编程以:(a)鉴定响应于由所述细胞表达的大分子群的细胞的形态变化,其中所述细胞已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导,其中所述细胞在细胞群之中,并且其中所述外源RNA或DNA引起所述细胞在所述细胞内表达所述大分子群;(b)对所述细胞的基因组进行序列鉴定,以鉴定所述外源RNA或DNA;以及(c)确定所述外源RNA或DNA诱导所述形态变化。
本公开内容的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,所述机器可执行代码在被一个或多个计算机处理器执行时,实现以上或本文其他地方的任何所述方法。
本公开内容的另一方面提供了一种包括一个或多个计算机处理器和与其耦合的计算机存储器的系统。所述计算机存储器包括机器可执行代码,所述机器可执行代码在由所述一个或多个计算机处理器执行时,实现以上或本文其他地方的任何所述方法。
根据以下详细描述,本公开内容的其他方面和优点对于本领域技术人员将变得明显,其中仅示出和描述了本公开内容的说明性实施方案。正如将要认识到的,本公开内容能够具有其他和不同的实施方案,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开内容。因此,附图和描述本质上应被认为是说明性的,而非限制性的。
援引并入
在本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被特别地和单独地指出通过引用并入。在通过引用而并入的出版物和专利或专利申请与本说明书中包含的本公开内容相抵触的程度上,本说明书旨在取代和/或优先于任何此类相抵触的材料。
附图说明
本专利或申请文件包含至少一幅彩色附图。根据要求并支付必要的费用,专利局将提供带有彩色附图的本专利或专利申请公开的副本。
在所附的权利要求书中具体阐述本发明的新颖特征。通过参考以下对利用了本发明的原理的说明性实施方案加以阐述的详细说明及其附图(在此也称为“图”),可以更好地理解本发明的特征和优点,在附图中:
图1示出了被编程或以其他方式配置以实现本文提供的方法的计算机系统。
图2A示出了用于混合遗传筛选的方法的示例。
图2B示出了用于基于图像的遗传筛选的方法的示例。
图3示出了用于基于图像的混合遗传筛选的方法的示例。
图4A示出了具有荧光标记的线粒体的细胞和具有荧光标记的溶酶体的细胞的荧光图像。
图4B示出了使用本公开内容的系统和方法对具有荧光标记的线粒体的细胞和具有荧光标记的溶酶体的细胞进行的分类。
图4C示出了位于细胞核内(核定位的)和细胞核外(细胞质)的STAT3蛋白的荧光图像。
图4D示出了使用本公开内容的系统和方法将STAT3蛋白分类为位于细胞核内或细胞核外(细胞质)。
图4E示出了细胞内未聚集蛋白和聚集蛋白复合物的荧光图像。
图4F示出了使用本公开内容的系统和方法将蛋白质分类为未聚集的蛋白质或聚集的蛋白质复合物。
图4G示出了具有活化的B细胞(NF-κB)蛋白的核定位核因子κ-轻链增强子的细胞和具有细胞质的NF-κB蛋白的细胞的荧光图像。
图4H示出了使用本公开内容的系统和方法对具有核定位的NF-κB蛋白的细胞和具有细胞质的NF-κB蛋白的细胞进行的分类。
图5示出了用于鉴定核酸分子的方法示例的流程图。
图6示出了基于蛋白质-蛋白质相互作用、蛋白质聚集或蛋白质定位来鉴定核酸分子或肽、多肽或蛋白质的方法的示例。
图7示出了使用基于图像的混合遗传筛选进行靶标发现的方法的示例。
图8A示出了具有核定位的p65蛋白的细胞和具有细胞质的p65蛋白的细胞的荧光图像。
图8B示出了使用本公开内容的系统和方法对具有核定位的p65蛋白的细胞和具有细胞质的p65蛋白的细胞进行的分类。
图9A示出了在分选前使用基于图像的系统对具有核定位的荧光蛋白的细胞和具有细胞质的荧光蛋白的细胞进行的分类。
图9B示出了在使用本公开内容的系统和方法进行分选后,使用基于图像的系统对具有核定位的荧光蛋白的细胞和具有细胞质的荧光蛋白的细胞进行的分类。
图10A示出了具有活化的B细胞(NF-κB)蛋白的核定位的核因子κ-轻链增强子的细胞和具有细胞质的NF-κB蛋白的细胞的荧光图像。
图10B示出了使用本公开内容的系统和方法对具有核定位的NF-κB蛋白的细胞和具有细胞质的NF-κB蛋白的细胞进行的分类。
图10C示出了其中p53结合至MDM2的细胞和其中p53未结合MDM2的细胞的荧光图像。
图10D示出了使用本公开内容的系统和方法对其中p53结合至MDM2的细胞和其中p53未结合MDM2的细胞进行的分类。
图10E示出了具有荧光标记的线粒体的细胞和具有荧光标记的溶酶体的细胞的荧光图像。
图10F示出了使用本公开内容的系统和方法对具有荧光标记的线粒体的细胞和具有荧光标记的溶酶体的细胞进行的分类。
图11示出了使用本公开内容的系统和方法对具有核定位的NF-κB或细胞质的NF-κB的细胞进行分选,以及随后使用基于图像的系统和荧光激活细胞分选(FACS)进行验证。
具体实施方式
尽管本文已经示出和描述了本发明的各个实施方案,但对于本领域技术人员明显的是,这样的实施方案仅以示例的方式提供。本领域技术人员可以在不偏离本发明的情况下想到许多更改、改变和替代。应当理解,可以采用本文所描述的本发明实施方案的各种替代方案。
除非另有定义,否则本文中使用的所有技术术语均具有与本发明所属领域的普通技术人员通常所理解的相同含义。如本说明书和所附权利要求书中所使用的,单数形式“一个(a)”、“一种(an)”和“该(the)”包括复数个指称物,除非上下文另有明确规定。除非另有说明,否则本文中对“或”的任何引用旨在涵盖“和/或”。
每当术语“至少”、“大于”或“大于或等于”在一系列两个或多个数值中的第一数值之前时,术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3等同于大于或等于1、大于或等于2或大于或等于3。
每当术语“不超过”、“小于”、“小于或等于”或“至多”在一系列两个或多个数值中的第一数值之前时,术语“不超过”、“小于”或“小于或等于”或“至多”适用于该系列数值中的每个数值。例如,小于或等于3、2或1等同于小于或等于3、小于或等于2或小于或等于1。
在将值描述为范围的情况下,则应理解该公开内容包括在该范围内的所有可能的子范围的公开,以及落入该范围内的具体数值,无论具体数值或具体子范围是否明确说明。
在一个方面,本公开内容提供了一种用于鉴定核酸分子的方法,其可以包括提供已经或疑似已经用至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导的细胞。核酸分子可以赋予细胞特性,例如,形态变化。接下来,可以鉴定细胞的形态变化。接下来,可以处理细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列。接下来,可以分析(i)核酸序列或(ii)肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列,以确定外源RNA分子或外源DNA分子的外源序列。接下来,可以将外源RNA分子或外源DNA分子的外源序列鉴定为影响细胞的形态变化。
外源RNA分子或外源DNA分子的外源序列可以是未知的。外源RNA分子或外源DNA分子的外源序列可以是已知的。外源RNA分子或外源DNA分子的外源序列可以编码基因、肽、多肽或蛋白质。
形态变化可以包括选自以下的一个或多个成员:细胞内蛋白质-蛋白质相互作用的变化、细胞内蛋白质定位的变化、细胞形状的变化、细胞的一种或多种成分的形状变化,以及细胞的一种或多种细胞器的形状变化。
细胞的形态变化可以直接或间接地受到外源RNA分子或外源DNA分子的影响。在一些情况下,外源RNA分子或外源DNA分子可以通过与一个或多个选自以下的成员直接相互作用而直接影响形态变化:蛋白质、小分子、离子、辅因子、细胞器、磷脂或核酸。在一些情况下,外源RNA分子或外源DNA分子可以通过编码直接影响形态变化的蛋白质或核酸而间接影响形态变化。直接影响形态变化的蛋白质或核酸可以通过与一个或多个选自以下的成员直接相互作用而影响形态变化:蛋白质、小分子、离子、辅因子、细胞器、磷脂、或核酸。在一些情况下,外源RNA分子或外源DNA分子可以通过编码间接影响形态变化的蛋白质或核酸而间接影响形态变化。间接影响形态变化的蛋白质或核酸可以通过与一个或多个选自以下的成员相互作用或改变其相互作用而间接影响形态变化:蛋白质、小分子、离子、辅因子、细胞器、磷脂或核酸,其中改变相互作用影响相互作用下游的形态变化。
在一些情况下,可以使用S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“GhostCytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096中公开的方法和系统(在本文中称为“ghost流式细胞术”)进行成像,其通过引用整体并入本文。
可以使用包含外源RNA分子或外源DNA分子的质粒转染或转导细胞。
可以通过对来自细胞的至少一个DNA分子和/或至少一个RNA分子(例如,转导的外源RNA或DNA分子、细胞的基因组和/或转录组)进行测序来从细胞获得测序信息。
测序可以是大规模并行阵列测序。测序可以包括合成测序(例如,Illumina,Pacific Biosciences of California或Ion Torrent)。测序可以是单分子测序(例如,Oxford Nanopore)。测序可以包括下一代测序。
在一些情况下,外源RNA分子或外源DNA分子被设计为编码具有稳定α-螺旋结构(这可以是肽-蛋白质相互作用的关键方面)的肽、多肽或蛋白质。可以将编码RNA或DNA的肽克隆到质粒载体中,以进行转染或转导到细胞中。细胞可以表达编码的肽、多肽或蛋白质。
在一些情况下,使用成簇的规律间隔的短回文重复序列(CRISPR)或其他基因编辑技术,将外源RNA分子或外源DNA分子转染到细胞中,所述成簇的规律间隔的短回文重复序列(CRISPR)例如CRISPR相关的9(Cas9)、Cas13d、CasX或其他变体,所述其他基因编辑技术例如锌指核酸酶(ZFN)或转录激活因子样效应物核酸酶(TALEN),如在Shalem O.,SanjanaNE.,Hartenian E.,Shi X.,Scott DA.,Mikkelson T.,Heckl D.,Ebert BL.,Root DE.,Doench JG.,Zhang F.,Science.2014,343(6166):84-87.doi:10.1126/science.1247005.Genome-scale CRISPR-Cas9 knockout screening in human cells;以及Joung J.,Konermann S.,Gootenberg JS.,Abudayyeh OO.,Platt RJ.,Brigham MD.,Sanjana NE.,Zhang F.,Nat Protoc.2017,12(4):828-863.doi:10.1038/nprot.2017.016.Genome-scale CRISPR-Cas9 knockout and transcriptionalactivation screening中所述,其每一个都通过引用整体并入本文。
在一些情况下,将基因组规模的CRISPR文库或肽表达文库扩增。
在一些情况下,使用光学显微镜鉴定形态变化。在一些情况下,使用荧光显微镜鉴定形态变化。在一些情况下,使用共聚焦显微镜法鉴定形态变化。在一些情况下,使用超分辨率显微镜鉴定形态变化。在一些情况下,可以当细胞在流通池中流动时,鉴定形态变化。
当鉴定形态变化时,可以不将细胞固定化或固定。当鉴定形态变化时,可以将细胞固定化或固定。细胞可以在细胞群之中。可以不细胞群固定化或固定。可以将细胞群固定化或固定。当鉴定形态变化时,细胞群可以流过流动通道。
鉴定形态变化可以包括对细胞成像。鉴定形态变化可以包括获得包含图像信息的时间信号。可以将时间信号转换成与时间无关的图像信息。鉴定形态变化可以包括获得包含细胞结构信息的时间信号。可以将时间信号转换成与时间无关的细胞结构信息。
该方法还可以包括在鉴定形态变化时分离细胞,并随后从该细胞获得测序信息。可以从多个细胞中分离该细胞。
该方法还可以包括至少使用形态变化来确定外源DNA或外源RNA抑制、激活或改变细胞内的生化途径。生化途径可以包括一个或多个选自以下的成员:蛋白质-蛋白质相互作用、蛋白质构象变化、定位、易位、转运、胞吞作用、胞吐作用、化学反应、酶促反应、磷酸化、去磷酸化、水解、水合、切割或融合。
鉴定形态变化可以包括使用机器学习算法来鉴定形态变化。机器学习算法可以包括选自以下的一个或多个成员:支持向量机、随机森林、人工神经网络、卷积神经网络、深度学习、超深度学习、梯度提升、AdaBoosting、决策树、线性回归和逻辑回归,或其他任何机器学习算法。
可以在细胞群之中的多个细胞的每一个中鉴定形态变化的存在或不存在。可以以至少约10个细胞/秒(细胞/s)、至少约50个细胞/秒、至少约100个细胞/秒、至少约500个细胞/秒、至少约1000个细胞/秒、至少约1500个细胞/秒、至少约2000个细胞/秒、至少约3000个细胞/秒、至少约4000个细胞/秒、至少约5000个细胞/秒、至少约6000个细胞/秒、至少约7000个细胞/秒、至少约8000个细胞/秒、至少约9000个细胞/秒、至少约10,000个细胞/秒、至少约11,000个细胞/秒、至少约12,000个细胞/秒、至少约13,000个细胞/秒、至少约14,000个细胞/秒、至少约15,000个细胞/秒、至少约20,000个细胞/秒、至少约25,000个细胞/秒、至少约30,000个细胞/秒、至少约35,000个细胞/秒、至少约40,000个细胞/秒、至少约50,000个细胞/秒或更高的速率在细胞群之中的每个细胞中鉴定形态变化的存在或不存在。可以以至多约50,000个细胞/秒、至多约40,000个细胞/秒、至多约35,000个细胞/秒、至多约30,000个细胞/秒、至多约25,000个细胞/秒、至多约20,000个细胞/秒、至多约15,000个细胞/秒、至多约14,000个细胞/秒、至多约13,000个细胞/秒、至多约12,000个细胞/秒、至多约11,000个细胞/秒、至多约10,000个细胞/秒、至多约9,000个细胞/秒、至多约8,000个细胞/秒、至多约7,000个细胞/秒、至多约6,000个细胞/秒、至多约5,000个细胞/秒、至多约4,000个细胞/秒、至多约3,000个细胞/秒、至多约2,000个细胞/秒、至多约1,500个细胞/秒、至多约1,000个细胞/秒、至多约500个细胞/秒、至多约100个细胞/秒、至多约50个细胞/秒、至多约10个细胞/秒或更低的速率在细胞群之中的每个细胞中鉴定形态变化的存在或不存在。
可以以10个细胞/秒至500个细胞/秒、100个细胞/秒至1000个细胞/秒、500个细胞/秒至1500个细胞/秒、1000个细胞/秒至2000个细胞/秒、1500个细胞/秒至2000个细胞/秒、1500个细胞/秒至10,000个细胞/秒、1500个细胞/秒至15,000个细胞/秒、1500个细胞/秒至20,000个细胞/秒、1500个细胞/秒至40,000个细胞/秒、1500个细胞/秒至50,000个细胞/秒、2000个细胞/秒至10,000个细胞/秒、2000个细胞/秒至15,000个细胞/秒、2000个细胞/秒至20,000个细胞/秒、2000个细胞/秒至40,000个细胞/秒、2000个细胞/秒至50,000个细胞/秒、5000个细胞/秒至10,000个细胞/秒、5000个细胞/秒至15,000个细胞/秒、5000个细胞/秒至20,000个细胞/秒、5000个细胞/秒至40,000个细胞/秒、5000个细胞/秒至50,000个细胞/秒、9000个细胞/秒至10,000个细胞/秒、9000个细胞/秒至15,000个细胞/秒、9000个细胞/秒至20,000个细胞/秒、9000个细胞/秒至40,000个细胞/秒、9000个细胞/秒至50,000个细胞/秒、10,000个细胞/秒至15,000个细胞/秒、10,000个细胞/秒至20,000个细胞/秒、10,000个细胞/秒至40,000个细胞/秒、10,000个细胞/秒至50,000个细胞/秒、20,000个细胞/秒至40,000个细胞/秒或20,000个细胞/秒至50,000个细胞/秒的速率在细胞群之中的每个细胞中鉴定形态变化的存在或不存在。
该方法还可以包括,在鉴定响应于由细胞表达的大分子群的细胞的形态变化之前,标记细胞内的一个或多个肽、多肽和/或蛋白质。标记可以包括用一种或多种荧光标记、福斯特共振能量转移(FRET)标记、染料、荧光团或量子点标记一个或多个肽、多肽和/或蛋白质。
标记可以包括用选自以下的一个或多个成员标记一个或多个肽、多肽和/或蛋白质:SYBR绿、SYBR蓝、4’,6-二脒基-2-苯基吲哚(DAPI)、碘化丙啶、Hoechst、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶、光神霉素、多吡啶钌、安曲霉素、菲啶和吖啶、溴化乙锭、碘化丙锭、碘化己锭(hexidium iodide)、二氢乙锭、乙锭同型二聚体-1和乙锭同型二聚体-2、单叠氮化乙锭以及9-氨基-6-氯-2-甲氧基吖啶(ACMA)、Hoechst 33258、Hoechst 33342、Hoechst 34580、吖啶橙、7-AAD、放线菌素D、LDS751、羟芪巴脒、SYTOX蓝、SYTOX绿、SYTOX橙、POPO-1、POPO-3、YOYO-1、YOYO-3、TOTO-1、TOTO-3、JOJO-1、LOLO-1、BOBO-1、BOBO-3、PO-PRO-1、PO-PRO-3、BO-PRO-1、BO-PRO-3、TO-PRO-1、TO-PRO-3、TO-PRO-5、JO-PRO-1、LO-PRO-1、YO-PRO-1、YO-PRO-3、PicoGreen、OliGreen、RiboGreen、SYBR金、SYBR绿I、SYBR绿II、SYBR DX、SYTO-40、-41、-42、-43、-44和-45(蓝),SYTO-13、-16、-24、-21、-23、-12、-11、-20、-22、-15、-14和-25(绿),SYTO-81、-80、-82、-83、-84和-85(橙),SYTO-64、-17、-59、-61、-62、-60和-63(红),荧光素、异硫氰酸荧光素(FITC)、四甲基若丹明异硫氰酸酯(TRITC)、若丹明、四甲基若丹明、R-藻红蛋白、Cy-2、Cy-3、Cy-3.5、Cy-5、Cy5.5、Cy-7、德克萨斯红、法尔红(Phar-Red)、别藻蓝蛋白(APC)、SYBR绿I、SYBR绿II、SYBR金、CellTracker绿、7-氨基放线菌素D(7-AAD)、乙锭同型二聚体I、乙锭同型二聚体II、乙锭同型二聚体III、溴化乙锭、伞形酮、曙红、绿色荧光蛋白、赤藓红、香豆素、甲基香豆素、芘、孔雀石绿、对称二苯代乙烯、荧光黄、级联蓝、二氯三嗪基胺荧光素、丹磺酰氯、荧光镧系元素络合物(例如包括铕和铽的那些)、羧基四氯荧光素、5和/或6-羧基荧光素(FAM)、VIC、5-(或6-)碘乙酰氨基荧光素、5-{[2(和3)-5-(乙酰巯基)-琥珀酰基]氨基}荧光素(SAMSA)-荧光素)、丽丝胺若丹明B磺酰氯、5和/或6羧基若丹明(ROX)、7-氨基-甲基香豆素、7-氨基-4-甲基香豆素-3-乙酸(AMCA)、BODIPY荧光团、8-甲氧基芘-1,3,6-三磺酸三钠盐、3,6-二磺酸酯-4-氨基-萘二甲酰亚胺、藻胆蛋白、Atto 390、425、465、488、495、532、565、594、633、647、647N、665、680和700染料,AlexaFluor 350、405、430、488、532、546、555、568、594、610、633、635、647、660、680、700、750和790染料,DyLight 350、405、488、550、594、633、650、680、755和800染料或其他荧光团,黑洞猝灭染料(Biosearch Technologies)例如BH1-0、BHQ-1、BHQ-3和BHQ-10,QSY染料荧光猝灭剂(来自Molecular Probes/Invitrogen)例如QSY7、QSY9、QSY21和QSY35,以及其他猝灭剂例如Dabcyl和Dabsyl,Cy5Q和Cy7Q和深色花青染料(GE Healthcare),Dy猝灭剂(Dyomics)例如DYQ-660和DYQ-661,ATTO荧光猝灭剂(ATTO-TEC GmbH)例如ATTO 540Q、580Q和612Q,绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、蓝色荧光蛋白(BFP)、青色荧光蛋白(CYP)和红色荧光蛋白(RFP)。
图2A示出了用于混合遗传筛选的方法的示例。在混合遗传筛选中,细胞接种和转导(如通过使用慢病毒)可以产生经遗传修饰的细胞池,其每个细胞可以包含来自文库的外源核酸分子(如外源DNA分子或外源RNA分子)。经遗传修饰的细胞池可以是异质的。然后可以进行选择程序,并通过下一代核酸测序方法对目标细胞的核酸进行测序。在一些情况下,例如在鉴定负责目标途径的基因时,混合遗传筛选可以是非常强大的工具。迄今为止,选择方法主要依赖于阳性筛选、阴性筛选或通过荧光激活细胞分选(FACS)进行的基于荧光强度的筛选。
图2B示出了基于图像的遗传筛选的示例方法。在基于图像的筛选中,细胞接种和转导产生经遗传修饰的细胞。然而,与混合遗传筛选形成对比,在基于图像的筛选中,使用成像技术(如荧光成像)分析所得的经遗传修饰的细胞。可以使用基于图像的筛选来筛选经遗传修饰的细胞,以鉴定具有目标特性的细胞。这种基于图像的筛选可以提供有关目标细胞的详细结构信息,但可能是耗时或昂贵的。
图3示出了基于图像的混合遗传筛选的示例方法。基于图像的混合遗传筛选程序可以利用细胞接种和转导(如通过使用慢病毒)产生经遗传修饰的细胞池,其每个细胞可以包含来自文库的外源核酸分子(如外源DNA分子或外源RNA分子)。经遗传修饰的细胞池可以是异质的。然后可以进行成像程序(如在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“GhostCytometry”,Science360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096中公开的一种或多种成像程序,或在N.Nitta,T.Sugimura,A.Isozaki,H.Mikami,S.Sakuma,T.Iino,F.Arai,T.Endo,Y.Fujiwaki,H.Fukuzawa,M.Hase,T.Hayakawa,K.Hiramatsu,Y.Hoshino,M.Inaba,T.Ito,H.Karakawa,Y.Kasai,K.Koizumi,S.Lee,C.Lei,M.Li,T.Maeno,S.Matsusaka,D.Murakami,A.Nakagawa,Y.Oguchi,M.Oikawa,T.Ota,K.Shiba,H.Shintaku,Y.Shirasaki,K.Suga,Y.Suzuki,N.Suzuki,Y.Tanaka,H.Tezuka,C.Toyokawa,Y.Yalikun,M.Yamada,M.Yamagishi,T.Yamano,A.Yasumoto,Y.Yatomi,M.Yazawa,D.DiCarlo,Y.Hosokawa,S.Uemura,Y.Ozeki和K.Goda,“Intelligent Image-Activated CellSorting”,Cell 175(1),第266-276页(2018),doi:10.1016/j.cell.2018.08.028中公开的一种或多种成像程序,所述参考文献通过引用整体并入本文)以基于包含在图像中的信息(如目标细胞内的蛋白质定位或蛋白质聚集)选择具有目标特性的细胞。可以对具有目标特性的细胞进行分选,并且可以从具有目标特性的细胞中提取目标核酸。然后可以通过下一代核酸测序方法对目标核酸进行测序。基于图像的混合筛选可以提供许多优于上述混合筛选和基于图像的筛选方法的优势。
图7示出了使用基于快速图像的混合遗传筛选(RIPGS)进行靶标发现的示例方法。在一些情况下,可以在包含外源RNA分子或外源DNA分子的细胞中鉴定形态变化。在一些情况下,可以将形态变化鉴定为是由外源RNA分子或外源DNA分子引起的。形态变化的鉴定可以提供关于可以被鉴定为靶分子的外源RNA分子或外源DNA分子的信息。在一些情况下,由外源RNA分子或外源DNA分子编码的肽或蛋白质可以是具有治疗特性的肽或蛋白质,或者可以成为治疗药物。在一些情况下,靶标可以是能够影响细胞形态变化的肽或核酸。根据本发明,形态变化可以包括选自以下的一个或多个成员:细胞内蛋白质-蛋白质相互作用的变化、细胞内蛋白质定位的变化、细胞形状的变化、细胞的一种或多种成分的形状变化,以及细胞的一种或多种细胞器的形状变化。在第一操作中,如分图1所示,该方法可以包括将混合的质粒文库转染到细胞中,以产生包含经遗传修饰的细胞的细胞池。例如,混合的质粒文库可以包含编码选自以下的一个或多个成员的质粒:肽、蛋白质、多肽、非编码RNA、gRNA、sgRNA、shRNA、siRNA、miRNA或asRNA。细胞池可以是异质的。在一些情况下,混合的质粒文库中的质粒可以编码潜在的靶标候选物。
在第二操作中,如图7中分图2所示,该方法可以包括分离具有靶表型的细胞(例如,基于细胞的图像是否显示蛋白质定位、蛋白质-蛋白质相互作用、易位、共定位、点(puncta)或其他属性)。分离细胞可以包括对细胞进行分选。在一些情况下,分离细胞可以包括基于图像的细胞分选。靶表型可以包括细胞的形态变化。可以基于细胞的形态变化分离细胞。靶表型可以受到来自混合的质粒文库的质粒或由质粒编码的产物影响。
在第三操作中,如图7中分图3所示,该方法可以包括通过核酸测序鉴定插入的质粒。核酸测序可以包括DNA测序或RNA测序。核酸测序可以包括反转录,然后进行DNA测序。核酸测序可以包括大规模并行阵列测序。核酸测序可以包括合成测序。核酸测序可以包括下一代测序。该方法可应用于多种应用,包括靶标鉴定或筛选细胞内功能性命中分子。通常,该方法可以被认为是用于高通量、高含量筛选的方法。
分离具有靶表型的细胞,例如,如在图7的第二操作中所进行的,可以包括使用基于快速图像的混合遗传/肽筛选(RIPGS)对细胞进行分选。RIPGS可以包括训练机器学习算法以基于靶表型的存在或不存在来区分细胞。如图8A和图8B所示,可以使用训练集来训练机器学习算法。在一些情况下,训练集可以包括阳性对照数据集和阴性对照数据集。阳性对照数据集可以包括具有靶表型的细胞。阴性对照数据集可以包括缺乏靶表型的细胞。例如,阳性对照数据集可以包括用试剂处理细胞以诱导靶表型。可以例如使用荧光显微镜对阳性训练集和阴性训练集成像,如图8A所示。如图8B的上分图所示,可以测量来自每个阳性对照数据集和阴性对照数据集的各个细胞的波形。波形可用于训练机器学习算法,并将机器学习(ML)评分分配给测得的细胞波形,如图8B的下分图所示。从细胞波形确定的ML评分可以指示细胞与靶表型的相似性。经过训练的机器学习算法可用于将ML评分分配给来自细胞池的各个细胞,例如包含遗传修饰细胞的细胞池。可以基于分配的ML评分对形成细胞池的各个细胞进行分选。在一些情况下,可以使用ghost流式细胞术进行细胞分离,如S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096中所述,其通过引用整体并入本文。
图5示出了用于鉴定核酸分子的方法600的示例的流程图。
在第一操作610中,方法600可以包括提供已经或疑似已经被至少一个外源RNA或至少一个外源DNA分子转染或转导的细胞。外源RNA分子或外源DNA分子的外源序列可以是未知的。外源RNA分子或外源DNA分子的外源序列可以是已知的。外源RNA分子或外源DNA分子可以编码基因、肽、多肽或蛋白质。
细胞可以源自任何来源。例如,细胞可以是人细胞、动物细胞、非人灵长类细胞、马科细胞、猪细胞、犬科细胞、猫科细胞、鼠科细胞、植物细胞、细菌细胞或任何其他细胞。细胞可以来自组织或器官。例如,细胞可以来自心脏、动脉、静脉、大脑、神经、肺、脊柱、脊髓、骨骼、结缔组织、气管、食道、胃、小肠或大肠、膀胱、肝脏、肾脏、脾脏、尿道、输尿管、前列腺、输精管、阴茎、卵巢、子宫、子宫内膜、输卵管或阴道,或与前述任何相关的任何组织。细胞可以是或可以疑似是癌细胞(如肿瘤细胞)。例如,细胞可以源自肿瘤组织。细胞可以包括天然或非天然成分。例如,细胞可以包括核酸(例如DNA或RNA)、肽、多肽、蛋白质、脂质或碳水化合物。细胞可以包括一种或多种光学可检测元素,例如一个或多个荧光团。荧光团可以对细胞来说是天然或非天然的。例如,荧光团可以是已经通过诸如一种或多种细胞染色或标记技术引入细胞的非天然荧光团。
细胞可以在细胞群之中。例如,细胞可以在至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、2,000,000、3,000,000、4,000,000、5,000,000、6,000,000、7,000,000、8,000,000、9,000,000、10,000,000、20,000,000、30,000,000、40,000,000、50,000,000、60,000,000、70,000,000、80,000,000、90,000,000、100,000,000、200,000,000、300,000,000、400,000,000、500,000,000、600,000,000、700,000,000、800,000,000、900,000,000、1,000,000个或更多个细胞的细胞群之中。细胞可以在至多约1,000,000,000、900,000,000、800,000,000、700,000,000、600,000,000、500,000,000、400,000,000、300,000,000、200,000,000、100,000,000、90,000,000、80,000,000、70,000,000、60,000,000、50,000,000、40,000,000、30,000,000、20,000,000、10,000,000、9,000,000、8,000,000、7,000,000、6,000,000、5,000,000、4,000,000、3,000,000、2,000,000、1,000,000、900,000、800,000、700,000、600,000、500,000、400,000、300,000、200,000、100,000、90,000、80,000、70,000、60,000、50,000、40,000、30,000、20,000、10,000、9,000、8,000、7,000、6,000、5,000、4,000、3,000、2,000、1,000、900、800、700、600、500、400、300、200、100、90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2、1个或更少个细胞的细胞群之中。细胞可以在由任何前述两个值定义的范围内的细胞群之中。细胞可以在1至1,000,000个细胞、10至1,000,000个细胞、100至1,000,000个细胞、1,000至1,000,000个细胞、10,000至1,000,000个细胞、100,000至1,000,000个细胞、1至100,000个细胞、10至100,000个细胞、100至100,000个细胞、1,000至100,000个细胞、10,000至100,000个细胞、1至10,000个细胞、10至10,000个细胞、100至10,000个细胞、1,000至10,000个细胞、1至1,000个细胞、10至1,000个细胞、100至1,000个细胞、1至100个细胞、10至100个细胞或1至10个细胞的细胞群中。可以从细胞群中分离细胞。可以从多个细胞中分离细胞。
可以将细胞或细胞群固定化或固定。可以不将细胞或细胞群固定化或不固定。细胞或细胞群可以处于静止状态。细胞或细胞群可以处于运动状态。例如,细胞或细胞群可以流动(如通过或在流动通道或流动池中)。
至少一个外源RNA分子或至少一个外源DNA分子可以包含至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000个或更多个外源RNA分子或外源DNA分子。至少一个外源RNA分子或至少一个外源DNA分子可以包含至多约1,000、900、800、700、600、500、400、300、200、100、90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2、1个或更少的外源RNA分子或外源DNA分子。至少一个外源RNA分子或至少一个外源DNA分子可以包含在由前述值中的任何两个所定义的范围内的多个外源RNA分子或外源DNA分子。至少一个外源RNA分子或至少一个外源DNA分子可以包含1至1,000、10至1,000、100至1,000、1至100、10至100、1至10、1至5、5至10、10至20或1至20个外源RNA分子或外源DNA分子。
可以使用质粒转染细胞。质粒可以包含外源RNA分子或外源DNA分子。
在第二操作620中,方法600可以包括鉴定细胞的形态变化。形态变化可以包括一个或多个选自以下的成员:细胞内蛋白质-蛋白质相互作用的变化、细胞内蛋白质定位的变化、细胞形状的变化、细胞的一种或多种成分的形状的变化(例如细胞内细胞质的形状变化或细胞骨架的形状或排布的变化),以及细胞的一种或多种细胞器的形状变化(如细胞的核仁、核、核糖体、囊泡、糙面内质网、高尔基体、细胞骨架、光滑内质网、线粒体、液泡、溶酶体、中心体或细胞膜的形状的变化)。
可以使用一种或多种光学技术,例如光学成像、光学显微镜法或光学光谱法来鉴定形态变化。可以使用明视野显微镜法、交叉偏光显微镜法、暗视野显微镜法、相衬显微镜法、微分干涉对比(DIC)显微镜法、反射干涉显微镜法、Sarfus显微镜法、荧光显微镜法、落射荧光显微镜法、共聚焦显微镜法、光片显微镜法、多光子显微镜法、超分辨率显微镜法、近场扫描光学显微镜法、近场光学随机映射(NORM)显微镜法、结构照明显微镜法(SIM)、空间调制照明(SMI)显微镜法、4π显微镜法、光谱精确距离显微镜法、受激发射耗尽(STED)显微镜法、基态耗尽(GSD)显微镜法、可逆饱和光学线性荧光跃迁(RESOLFT)显微镜法、结合激活定位(BALM)显微镜法、照片激活定位(PALM)显微镜法、随机光学重建(STORM)显微镜法、直接随机光学重建显微镜法(dSTORM)、超分辨率光学波动(SOFI)显微镜法或无所不在定位显微镜法(OLM)中的一种或多种来鉴定形态变化。
可以通过获得包含图像信息的时间信号来鉴定形态变化。可以将时间信号转换成与时间无关的图像信息。可以在不重建图像的情况下鉴定形态变化。例如,可以在不获得细胞完整图像的情况下鉴定形态变化。鉴定形态变化可以包括获得包含结构信息的时间信号。可以将时间信号转换成与时间无关的结构信息。鉴定形态变化可以包括对通过在光学成像方法中有效地压缩细胞空间信息而不是细胞图像的二维信息而获得的时间波形信号进行处理。可以使用训练过的机器学习算法来鉴定形态变化。可以使用教师性数据(teacher data)来训练训练过的机器学习算法。例如,教师数据可以包括具有已知形态特性的细胞的图像、结构或时间数据。例如,可以使用S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的一种或多种成像方法和系统鉴定形态变化。
可以在固定化或固定细胞时鉴定形态变化。可以在不固定化或不固定细胞时鉴定形态变化。可以在细胞静止时鉴定形态变化。可以在细胞运动时鉴定形态变化。例如,可以在细胞流动时(如通过或在流动通道或流动池中)鉴定形态变化。
机器学习算法可以用于鉴定形态变化。例如,可以使用训练集对机器学习算法进行训练,所述训练集包括具有显示一个或多个目标细胞特征(例如一个或多个特定的蛋白质定位模式、蛋白质-蛋白质相互作用、易位、共定位、点或其他属性,如本文所述)的特征的细胞群的标记或未标记图像。然后可以将机器学习算法应用于测试图像,以将细胞群中的细胞分类为针对一个或多个目标特征的阳性或阴性。
机器学习算法可以包括一个或多个监督、半监督或无监督的机器学习技术。机器学习算法可以包括回归分析、正则化、分类、降维、集成学习、元学习、强化学习、关联规则学习、聚类分析、异常检测、深度学习或超深度学习的一项或多项。机器学习算法可以包括,但不限于:k均值、k均值聚类、k最近邻、学习矢量量化、线性回归、非线性回归、最小二乘回归、偏最小二乘回归、逻辑回归、逐步回归、多元自适应回归样条、岭回归、主成分回归、最小绝对收缩和选择运算、最小角度回归、典型相关分析、因子分析、独立成分分析、线性判别分析、多维标度、非负矩阵分解、主成分分析、主坐标分析、投影追踪、Sammon映射、t分布随机近邻嵌入、AdaBoosting、增强、梯度增强、自举集成、累加平均、决策树、条件决策树、增强决策树、梯度增强决策树、随机森林、堆叠泛化、贝叶斯网络、贝叶斯信念网络、朴素贝叶斯、高斯朴素贝叶斯、多项式朴素贝叶斯、隐马尔可夫模型、分层隐马尔可夫模型、支持向量机、编码器、解码器、自动编码器、堆叠式自动编码器、感知器、多层感知器、人工神经网络、前馈神经网络、卷积神经网络、递归神经网络、长短期记忆、深度置信网络、深度玻尔兹曼机器、深度卷积神经网络、深度递归神经网络或生成对抗网络。
机器学习算法可以以至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的灵敏度、特异性和准确度,将细胞针对一个或多个特征分类为阳性或阴性。机器学习算法可以以在前述值中的任何两个所定义的范围内的灵敏度、特异性和准确度,将细胞针对一个或多个特征分类为阳性或阴性。
可在鉴定形态变化时或之后分离细胞。例如,可以使用流式细胞术或在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的一种或多种“ghost流式细胞术”方法和系统分离细胞。
在第二操作620前,该方法还可以包括标记细胞内的肽、多肽和/或蛋白质。标记可以包括用一种或多种荧光标记、福斯特共振能量转移(FRET)标记、染料、荧光团、量子点或任何其他标记来标记细胞内的肽、多肽和/或蛋白质。例如,标记可以包括用以下中的一种或多种来标记细胞内的肽、多肽和/或蛋白质:SYBR绿、SYBR蓝、4’,6-二脒基-2-苯基吲哚(DAPI)、碘化丙啶、Hoechst、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶、光神霉素、多吡啶钌、安曲霉素、菲啶和吖啶、溴化乙锭、碘化丙锭、碘化己锭、二氢乙锭、乙锭同型二聚体-1和乙锭同型二聚体-2、单叠氮化乙锭以及9-氨基-6-氯-2-甲氧基吖啶(ACMA)、Hoechst 33258、Hoechst 33342、Hoechst34580、吖啶橙、7-AAD、放线菌素D、LDS751、羟芪巴脒、SYTOX蓝、SYTOX绿、SYTOX橙、POPO-1、POPO-3、YOYO-1、YOYO-3、TOTO-1、TOTO-3、JOJO-1、LOLO-1、BOBO-1、BOBO-3、PO-PRO-1、PO-PRO-3、BO-PRO-1、BO-PRO-3、TO-PRO-1、TO-PRO-3、TO-PRO-5、JO-PRO-1、LO-PRO-1、YO-PRO-1、YO-PRO-3、PicoGreen、OliGreen、RiboGreen、SYBR金、SYBR绿I、SYBR绿II、SYBR DX、SYTO-40、-41、-42、-43、-44和-45(蓝),SYTO-13、-16、-24、-21、-23、-12、-11、-20、-22、-15、-14和-25(绿),SYTO-81、-80、-82、-83、-84和-85(橙),SYTO-64、-17、-59、-61、-62、-60和-63(红),荧光素、异硫氰酸荧光素(FITC)、四甲基若丹明异硫氰酸酯(TRITC)、若丹明、四甲基若丹明、R-藻红蛋白、Cy-2、Cy-3、Cy-3.5、Cy-5、Cy5.5、Cy-7、德克萨斯红、法尔红、别藻蓝蛋白(APC)、SYBR绿I、SYBR绿II、SYBR金、CellTracker绿、7-氨基放线菌素D(7-AAD)、乙锭同型二聚体I、乙锭同型二聚体II、乙锭同型二聚体III、溴化乙锭、伞形酮、曙红、绿色荧光蛋白、赤藓红、香豆素、甲基香豆素、芘、孔雀石绿、对称二苯代乙烯、荧光黄、级联蓝、二氯三嗪基胺荧光素、丹磺酰氯、荧光镧系元素络合物(例如包括铕和铽的那些)、羧基四氯荧光素、5和/或6-羧基荧光素(FAM)、VIC、5-(或6-)碘乙酰氨基荧光素、5-{[2(和3)-5-(乙酰巯基)-琥珀酰基]氨基}荧光素(SAMSA)-荧光素)、丽丝胺若丹明B磺酰氯、5和/或6羧基若丹明(ROX)、7-氨基-甲基-香豆素、7-氨基-4-甲基香豆素-3-乙酸(AMCA)、BODIPY荧光团、8-甲氧基芘-1,3,6-三磺酸三钠盐、3,6-二磺酸酯-4-氨基-萘二甲酰亚胺、藻胆蛋白、Atto 390、425、465、488、495、532、565、594、633、647、647N、665、680和700染料,AlexaFluor350、405、430、488、532、546、555、568、594、610、633、635、647、660、680、700、750和790染料,DyLight350、405、488、550、594、633、650、680、755和800染料或其他荧光团,黑洞猝灭染料(Biosearch Technologies)例如BH1-0、BHQ-1、BHQ-3和BHQ-10,QSY染料荧光猝灭剂(来自Molecular Probes/Invitrogen)例如QSY7、QSY9、QSY21和QSY35,以及其他猝灭剂例如Dabcyl和Dabsyl,Cy5Q和Cy7Q和深色花青染料(GE Healthcare),Dy猝灭剂(Dyomics)例如DYQ-660和DYQ-661,ATTO荧光猝灭剂(ATTO-TEC GmbH)例如ATTO 540Q、580Q和612Q,绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、蓝色荧光蛋白(BFP)、青色荧光蛋白(CYP)和红色荧光蛋白(RFP)以及其他。在一些情况下,标记可以包含一个或多个接头。例如,标记可以具有附接至标记的二硫键。此类标记的非限制性示例包括Cy5-叠氮化物、Cy-2-叠氮化物、Cy-3-叠氮化物、Cy-3.5-叠氮化物、Cy5.5-叠氮化物和Cy-7-叠氮化物。在一些情况下,接头可以包含可裂解的接头。在一些情况下,标记可以被配置为使得标记不自淬灭或不表现出接近淬灭。不自淬灭或不表现出接近淬灭的标记类型的非限制性示例包括二烯衍生物,如一溴二烯。或者,标记可以被配置为使得标记自淬灭或表现出接近淬灭。此类标记的非限制性示例包括Cy5-叠氮化物、Cy-2-叠氮化物、Cy-3-叠氮化物、Cy-3.5-叠氮化物、Cy5.5-叠氮化物和Cy-7-叠氮化物。
在第三操作630中,方法600可以包括处理细胞的内容物以鉴定核酸序列或肽、多肽或蛋白质,或肽、多肽或蛋白质的序列。操作630可以包括对来自细胞的至少一个核酸分子和/或至少一个肽、多肽或蛋白质分子进行测序。该方法可以包括对至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、2,000,000、3,000,000、4,000,000、5,000,000、6,000,000、7,000,000、8,000,000、9,000,000、10,000,000、20,000,000、30,000,000、40,000,000、50,000,000、60,000,000、70,000,000、80,000,000、90,000,000、100,000,000、200,000,000、300,000,000、400,000,000、500,000,000、600,000,000、700,000,000、800,000,000、900,000,000、1,000,000,000个或更多个来自细胞的核酸分子或肽、多肽或蛋白质分子进行测序。该方法可以包括对至多约1,000,000,000、900,000,000、800,000,000、700,000,000、600,000,000、500,000,000、400,000,000、300,000,000、200,000,000、100,000,000、90,000,000、80,000,000、70,000,000、60,000,000、50,000,000、40,000,000、30,000,000、20,000,000、10,000,000、9,000,000、8,000,000、7,000,000、6,000,000、5,000,000、4,000,000、3,000,000、2,000,000、1,000,000、900,000、800,000、700,000、600,000、500,000、400,000、300,000、200,000、100,000、90,000、80,000、70,000、60,000、50,000、40,000、30,000、20,000、10,000、9,000、8,000、7,000、6,000、5,000、4,000、3,000、2,000、1,000、900、800、700、600、500、400、300、200、100、90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2或1个来自细胞的核酸分子或肽、多肽或蛋白质分子进行测序。该方法可以包括对在由前述值中的任何两个定义的范围内的来自细胞的多个核酸分子或肽、多肽或蛋白质分子进行测序。该方法可以包括对1至1,000,000,000、10至1,000,000,000、100至1,000,000,000、1,000至1,000,000,000、10,000至1,000,000,000、100,000至1,000,000,000、1,000,000至1,000,000,000、10,000,000至1,000,000,000、100,000,000至1,000,000,000、1至100,000,000、10至100,000,000、100至100,000,000、1,000至100,000,000、10,000至100,000,000、100,000至100,000,000、1,000,000至100,000,000、10,000,000至100,000,000、1至10,000,000、10至10,000,000、100至10,000,000、1,000至10,000,000、10,000至10,000,000、100,000至10,000,000、1,000,000至10,000,000、1至1,000,000、10至1,000,000、100至1,000,000、1,000至1,000,000、10,000至1,000,000、100,000至1,000,000、1至100,000、10至100,000、100至100,000、1,000至100,000、10,000至100,000、1至10,000、10至10,000、100至10,000、1,000至10,000、1至1,000、10至1,000、100至1,000、1至100、10至100或1至10个来自细胞的核酸分子或肽、多肽或蛋白质分子进行测序。
测序可包括任何核酸测序,如任何DNA测序或RNA测序。测序可以包括聚合酶链反应(PCR)、数字PCR、实时PCR、定量PCR(qPCR)、逆转录、逆转录PCR(RT-PCR)、Sanger测序、高通量测序、合成测序、单分子测序、连接测序、RNA-Seq(Illumina)、下一代测序、数字基因表达(Helicos)、阵列杂交、克隆单微阵列(Solexa)、鸟枪法测序、Maxim-Gilbert测序、大规模并行测序或大规模并行阵列测序。
在第四操作640中,方法600可以包括分析核酸序列或肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列,以确定外源RNA或外源DNA的外源序列。
在第五操作650中,方法600可以包括将外源RNA或外源DNA分子的外源序列鉴定为影响细胞的形态变化。
方法600还可以包括至少使用形态变化来确定至少一个外源DNA分子或至少一个外源RNA分子抑制或激活细胞内的生化途径。
在一个方面,本公开内容提供了一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的方法,其包括:(a)提供已被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中外源RNA或DNA被编码以表达细胞内大分子群,(b)鉴定响应于细胞表达的大分子群的细胞的形态变化,(c)对细胞的基因组进行序列鉴定,以鉴定外源RNA或DNA,以及(d)确定外源RNA或DNA诱导了形态变化。鉴定形态变化可以包括鉴定大分子群中大分子的定位概况或模式。鉴定形态变化可以包括鉴定细胞的形状或细胞的一种或多种亚细胞成分。一种或多种亚细胞成分可以包含细胞的细胞器。大分子群可以包括选自肽、多肽、蛋白质和核酸分子的一个或多个成员的群。
图6示出了基于蛋白质-蛋白质相互作用、蛋白质聚集或蛋白质定位来鉴定核酸分子或肽、多肽或蛋白质的方法的示例。如图6的分图1所示,可以制备细胞并用包含外源DNA或RNA分子的质粒文库转染,如本文所述。外源DNA或RNA分子可以编码肽、多肽、蛋白质或核酸,例如RNA、DNA、短发夹RNA(shRNA)、向导RNA(gRNA)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义RNA(asRNA)或向导DNA(gDNA),如本文所述。如本文所述,可以基于光学空间信息来分离显示靶表型的细胞。如本文所述,然后可以使用核酸测序,例如下一代测序(NGS),对与显示靶表型的细胞相关的外源DNA或RNA分子进行解码。
如图6的分图2所示,第一蛋白质A和第二蛋白质B之间的蛋白质-蛋白质相互作用(PPI)可以引起可检测到的形态变化。蛋白质A和B可以被荧光标记。当蛋白质A和B相互作用时,蛋白质A和B可以形成荧光焦点。当蛋白质A和B不相互作用时,它们可以不形成这种荧光焦点。可以使用本文所述的光学检测系统和方法检测这种荧光焦点的存在或不存在。本文所述的一个或多个外源DNA或RNA分子(或由该外源DNA或RNA分子表达的肽、多肽或蛋白质)可以抑制荧光焦点的形成,而其他外源DNA或RNA分子(或由该外源DNA或RNA分子表达的肽、多肽或)可以不抑制荧光焦点的形成。因此,可以将用抑制荧光焦点形成的外源DNA或RNA分子(例如,抑制PPI的外源DNA或RNA分子,或由抑制PPI的外源DNA或RNA分子表达的肽、多肽或蛋白质)转染的细胞与被不抑制荧光焦点形成的外源DNA或RNA分子(例如,不抑制PPI的外源DNA或RNA分子或由不抑制PPI的外源DNA或RNA分子表达的肽、多肽或蛋白质)转染的细胞区分开。然后可以分离抑制PPI的外源DNA或RNA分子(或由该外源DNA或RNA分子表达的肽、多肽或蛋白质),并对其进行核酸测序,以鉴定抑制蛋白质A和B之间PPI的肽、多肽、蛋白质或核酸。
在一些情况下,本文所述的一个或多个外源DNA或RNA分子(或由该外源DNA或RNA分子表达的肽、多肽或蛋白质)可以促进荧光焦点的形成,而其他外源DNA或RNA分子(或由该外源DNA或RNA分子表达的肽、多肽或)可以不促进荧光焦点的形成。因此,可以将用促进荧光焦点形成的外源DNA或RNA分子(例如,促进PPI的外源DNA或RNA分子,或由促进PPI的外源DNA或RNA分子表达的肽、多肽或蛋白质)转染的细胞与由不促进荧光焦点形成的外源DNA或RNA分子(例如,不促进PPI的外源DNA或RNA分子或由不促进PPI的外源DNA或RNA分子表达的肽、多肽或蛋白质)转染的细胞区别开。然后可以分离促进PPI的外源DNA或RNA分子(或由外源DNA或RNA分子表达的肽、多肽或蛋白质),并对其进行核酸测序,以鉴定促进蛋白质A和B之间PPI的肽、多肽、蛋白质或核酸。
如图6的分图3所示,蛋白质定位可以引起可检测到的形态变化。蛋白A可以被荧光标记。在一些情况下,蛋白质A可以在细胞核中检测到。
在一些情况下,本文所述的一个或多个外源DNA或RNA分子(或细胞响应于该外源DNA或RNA分子而表达的肽、多肽或蛋白质)可以引起蛋白质A定位于细胞的细胞质中,而其他外源DNA或RNA分子(或由外源DNA或RNA分子表达的肽、多肽或)可以不引起这种定位。因此,可以将用引起这种蛋白质定位的外源DNA或RNA分子(例如,引起蛋白质定位的外源DNA或RNA分子,或由引起蛋白质定位的外源DNA或RNA分子表达的肽、多肽或蛋白质)转染的细胞与被不引起这种蛋白质定位的外源DNA或RNA分子(例如,不引起蛋白质定位的外源DNA或RNA分子或由不引起蛋白质定位的外源DNA或RNA分子表达的肽、多肽或蛋白质)转染的细胞区别开。然后可以将引起蛋白质定位的外源DNA或RNA分子(或由该外源DNA或RNA分子表达的肽、多肽或蛋白质)分离,并对其进行核酸测序,以鉴定引起蛋白质定位的肽、多肽、蛋白质或核酸。
在一些情况下,本文所述的一个或多个外源DNA或RNA分子(或由细胞响应于该外源DNA或RNA分子而表达的肽、多肽或蛋白质)可以引起蛋白质A定位的变化。例如,本文所述的一个或多个外源DNA或RNA分子(或由细胞响应于外源DNA或RNA分子而表达的肽、多肽或蛋白质)可以引起蛋白质A的定位从第一细胞器或亚细胞区域或隔室改变到第二细胞器或亚细胞区域或隔室。第一细胞器或亚细胞区域或隔室可以包括线粒体、细胞核、细胞质、细胞骨架、细胞膜、核膜、溶酶体、内体、内质网、高尔基体、液泡、溶酶体、中心体、核仁、核糖体或囊泡。第二细胞器或亚细胞区域或隔室可以包括线粒体、细胞核、细胞质、细胞骨架、细胞膜、核膜、溶酶体、内体、内质网、高尔基体、液泡、溶酶体、中心体、核仁、核糖体或囊泡。
计算机系统
本公开内容提供被编程为实现本公开内容的方法的计算机系统。图1示出了计算机系统101,该计算机系统101被编程或以其他方式配置以针对一个或多个靶标例如肽、多肽、蛋白质或细胞器,或一个或多个靶表型例如蛋白质定位、蛋白质-蛋白质相互作用或细胞形态筛选生物样品。
计算机系统101包括中央处理单元(CPU,本文也称为“处理器”和“计算机处理器”)105,该中央处理单元可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统101还包括存储器或存储器位置110(例如,随机存取存储器、只读存储器、闪存)、电子存储单元115(例如,硬盘)、用于与一个或多个其他系统通信的通信接口120(例如,网络适配器),以及外围装置125(如高速缓存、其他存储器、数据存储和/或电子显示适配器)。存储器110、存储单元115、接口120和外围装置125通过通信总线(实线)(例如主板)与CPU 105通信。存储单元115可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统101可以借助于通信接口120可操作地耦合至计算机网络(“网络”)130。网络130可以是因特网、互联网和/或外联网或与因特网通信的内联网和/或外联网。在一些情况下,网络130是电信和/或数据网络。网络130可以包括一个或多个计算机服务器,其可以实现分布式计算,如云计算。在一些情况下,网络130可以借助计算机系统101实现对等网络,该对等网络可以使耦合至计算机系统101的装置充当客户端或服务器。
CPU 105可以执行一系列机器可读指令,其可以体现在程序或软件中。指令可以被存储在存储器位置,例如存储器110中。指令可以被定向至CPU 105,其随后可以对CPU 105进行编程或以其他方式配置CPU 105,以实现本公开内容的方法。CPU 105执行的操作示例可以包括获取、解码、执行和写回。
CPU 105可以是电路例如集成电路的一部分。系统101的一个或多个其他部件可以包括在电路中。在一些情况下,该电路是专用集成电路(ASIC)。
电子存储单元115可以存储文件,如驱动程序、库和保存的程序。电子存储单元115可以存储用户数据,例如,用户偏好和用户程序。在一些情况下,计算机系统101可以包括计算机系统101外部的一个或多个附加数据存储单元,例如位于通过内联网或因特网与计算机系统101通信的远程服务器上。
计算机系统101可以通过网络130与一个或多个远程计算机系统通信。例如,计算机系统101可以与用户的远程计算机系统通信。远程计算机系统的示例包括个人计算机(例如,便携式PC)、平板PC或平板计算机(例如,iPad、Galaxy Tab)、电话、智能电话(例如,iPhone、支持Android的装置、)或个人数字助理。用户可以通过网络130访问计算机系统101。
如本文所述的方法可以通过存储在计算机系统101的电子存储位置上(例如,在存储器110或电子存储单元115上)的机器(例如,计算机处理器)可执行代码的方式来实现。可以以软件的形式提供机器可执行代码或机器可读代码。在使用期间,代码可以由处理器105执行。在一些情况下,可以从存储单元115中检索代码,并将其存储在存储器110中,以供处理器105随时访问。在一些情况下,可以不包括电子存储单元115,并且将机器可执行指令存储在存储器110中。
可以对代码进行预编译并配置为与具有适于执行代码的处理器的机器一起使用,或者可以在运行时期间进行编译。可以以编程语言提供代码,可以选择编程语言以使代码能够以预编译或即时编译的方式执行。
本文提供的系统和方法的方面,如计算机系统1301,可以体现编程中。技术的各个方面可以被认为“产品”或“制品”,通常为在机器可读介质类型上承载或以机器可读介质类型体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储在电子存储单元上,如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘。“存储”类型的介质可以包括计算机、处理器等的任何或所有有形存储器,或其相关模块,如各种半导体存储器、磁带驱动器、磁盘驱动器等,它们可以随时为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或其他各种电信网络进行通信。例如,这种通信可以使软件能够从一个计算机或处理器加载到另一个计算机或处理器,例如,从管理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种介质类型包括光波、电波和电磁波,如在本地装置之间的物理接口上、通过有线和光学陆线网络以及在各种空中链路上使用的。携带这种波的物理元件,例如有线或无线链路、光链路等也可以被视为承载软件的介质。如本文所用,除非限于非暂时性的、有形的“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。
因此,机器可读介质,如计算机可执行代码,可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,例如任何计算机中的任何存储装置等,它们例如可用于实现附图所示的数据库等。易失性存储介质包括动态存储器,例如此类计算机平台的主存储器。有形的传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的电线。载波传输介质可以采用电信号或电磁信号的形式,或声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间生成的那些。因此,计算机可读介质的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、带孔图案的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒带、传输数据或指令的载波、传输此类载波的电缆或链路,或计算机可以从中读取编程代码和/或数据的任何其他介质。计算机可读介质的许多这些形式可以涉及将一个或多个指令的一个或多个序列传送给处理器以供执行。
计算机系统101可以包括电子显示器135或与电子显示器135通信,该电子显示器包括用户界面(UI)140,用于提供例如细胞的图像,包括肽、多肽和/或蛋白质(例如,蛋白质分布),和/或来自细胞的基因组(脱氧核糖核酸和/或核糖核酸)的测序信息。UI的示例包括,但不限于,图形用户界面(GUI)和基于web的用户界面。
本公开内容的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单元105执行时通过软件实现。
本发明提供了包括但不限于以下实施方式:
1.一种用于鉴定核酸分子的方法,包括:
(a)提供已经或疑似已经用至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中所述细胞在细胞群之中;
(b)在(a)之后,鉴定所述细胞的形态变化;
(c)处理所述细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或(iii)所述肽、多肽或蛋白质的序列;
(d)分析(i)所述核酸序列或(ii)所述肽、多肽或蛋白质或(iii)所述肽、多肽或蛋白质的所述序列,以确定所述外源RNA分子或所述外源DNA分子的所述外源序列;以及
(e)将所述外源RNA分子或所述外源DNA分子的外源序列鉴定为影响所述细胞的所述形态变化。
2.根据实施方式1所述的方法,其中所述外源RNA分子或所述外源DNA分子的所述外源序列是未知的。
3.根据实施方式1所述的方法,其中所述外源RNA分子或所述外源DNA分子的所述外源序列是已知的。
4.根据实施方式1所述的方法,其中所述外源RNA分子或所述外源DNA分子编码基因、肽、多肽或蛋白质。
5.根据实施方式1所述的方法,其中所述形态变化包括一个或多个选自以下的成员:所述细胞内蛋白质-蛋白质相互作用的变化、所述细胞内蛋白质定位的变化、所述细胞的形状变化、所述细胞的一种或多种成分的形状变化、以及所述细胞的一种或多种细胞器的形状变化。
6.根据实施方式1所述的方法,其中使用包含所述外源RNA分子或所述外源DNA分子的质粒转染所述细胞。
7.根据实施方式1所述的方法,其中(c)包括对来自所述细胞的至少一个核酸分子或至少一个蛋白质分子进行测序。
8.根据实施方式7所述的方法,其中所述测序包括大规模并行阵列测序。
9.根据实施方式7所述的方法,其中所述测序包括合成测序。
10.根据实施方式7所述的方法,其中所述测序包括下一代测序。
11.根据实施方式1所述的方法,其中使用光学显微镜法鉴定所述形态变化。
12.根据实施方式11所述的方法,其中所述光学显微镜包括共聚焦显微镜法。
13.根据实施方式1所述的方法,其中在(b)中,当所述细胞在流动池或流动通道中流动时,鉴定所述细胞的所述形态变化。
14.根据实施方式1所述的方法,其中在(b)中鉴定所述形态变化时,所述细胞未被固定化或固定。
15.根据实施方式1所述的方法,其中当在(b)中鉴定所述形态变化时,所述细胞是被固定的。
16.根据实施方式1所述的方法,其中所述细胞群是异质的。
17.根据实施方式1所述的方法,其中对于所述细胞群之中的多个细胞中的每个细胞重复(b)。
18.根据实施方式17所述的方法,其中以至少约1500个细胞/秒(细胞/s)的速率重复(b)。
19.根据实施方式18所述的方法,其中以至少约2000个细胞/秒、至少约3000个细胞/秒、至少约4000个细胞/秒、至少约5000个细胞/秒、至少约6000个细胞/秒、至少约7000个细胞/秒、至少约8000个细胞/秒、至少约9000个细胞/秒或至少约10,000个细胞/秒的速率重复(b)。
20.根据实施方式1所述的方法,其中基于所述形态变化从所述细胞群分离所述细胞。
21.根据实施方式20所述的方法,其中所述细胞群未被固定化或固定。
22.根据实施方式20所述的方法,其中所述细胞群是被固定的。
23.根据实施方式20所述的方法,其中当在(b)中鉴定所述形态变化时,所述细胞群流过流动池或流动通道。
24.根据实施方式20所述的方法,其中所述细胞群之中的每个细胞包含至少一个随机插入的外源RNA分子或至少一个随机插入的外源DNA分子。
25.根据实施方式1所述的方法,其中(b)包括使所述细胞成像。
26.根据实施方式1所述的方法,其中(b)包括获得包含图像信息的时间信号。
27.根据实施方式26所述的方法,其中将所述时间信号转换成与时间无关的图像信息。
28.根据实施方式1所述的方法,其中(b)包括获得包含空间信息的时间信号。
29.根据实施方式28所述的方法,其中将所述时间信号转换成与时间无关的空间信息。
30.根据实施方式1所述的方法,还包括在鉴定所述细胞内的所述形态变化后分离所述细胞,并随后从所述细胞获得所述测序信息。
31.根据实施方式1所述的方法,其中从多个细胞中分离所述细胞。
32.根据实施方式1所述的方法,还包括使用至少所述形态变化来确定所述外源DNA分子或所述RNA分子抑制或激活所述细胞内的生化途径。
33.根据实施方式1所述的方法,其中(b)包括使用机器学习算法来鉴定所述形态变化。
34.根据实施方式33所述的方法,其中所述机器学习算法包括选自以下的一个或多个成员:支持向量机、随机森林、人工神经网络、卷积神经网络、深度学习、超深度学习、梯度提升、AdaBoosting、决策树、线性回归和逻辑回归。
35.根据实施方式34所述的方法,其中使用训练集训练所述机器学习算法,所述训练集包括对于所述形态变化呈阳性的细胞群的图像信息和对于所述形态变化呈阴性的细胞群的图像信息。
36.根据实施方式34所述的方法,其中使用训练集训练所述机器学习算法,所述训练集包括对于所述形态变化呈阳性的细胞群的空间信息和对于所述形态变化呈阴性的细胞群的空间信息。
37.根据实施方式1所述的方法,还包括,在(b)之前,标记所述细胞内的所述肽、多肽或蛋白质。
38.根据实施方式37所述的方法,其中所述标记包括用一种或多种荧光标记、福斯特共振能量转移(FRET)标记、染料、荧光团或量子点来标记所述一个或多个肽、多肽或蛋白质。
39.一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的方法,包括(a)提供已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中所述细胞在细胞群之中,并且其中所述外源RNA或DNA导致所述细胞在所述细胞内表达大分子群,(b)鉴定响应于由所述细胞表达的所述大分子群的所述细胞的形态变化,(c)对所述细胞的基因组进行序列鉴定以鉴定所述外源RNA或DNA,以及(d)确定所述外源RNA或DNA诱导所述形态变化。
40.根据实施方式39所述的方法,其中鉴定所述形态变化包括鉴定所述大分子群的大分子的定位概况或模式。
41.根据实施方式39所述的方法,其中鉴定所述形态变化包括鉴定所述细胞或所述细胞的一种或多种亚细胞成分的形状。
42.根据实施方式41所述的方法,其中所述一种或多种亚细胞成分包含所述细胞的细胞器。
43.根据实施方式39所述的方法,其中所述大分子群包括选自肽、多肽、蛋白质和核酸分子的一个或多个成员的群。
44.一种用于鉴定核酸分子的系统,包括一个或多个计算机处理器,所述一个或多个计算机处理器被单独或共同编程以:
(a)鉴定细胞的形态变化,所述细胞已经或疑似已经被至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导,其中所述细胞在细胞群之中;
(b)处理所述细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列;
(c)分析(i)所述核酸序列或(ii)所述肽、多肽或蛋白质或所述肽、多肽或蛋白质的所述序列,以确定所述外源RNA分子或所述外源DNA分子的所述外源序列;以及
(d)将所述外源RNA分子或所述外源DNA分子的外源序列鉴定为影响所述细胞的所述形态变化。
45.一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的系统,包括一个或多个计算机处理器,所述一个或多个计算机处理器被单独或共同编程以:
(a)鉴定响应于由细胞表达的大分子群的所述细胞的形态变化,其中所述细胞已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导,其中所述细胞在细胞群之中,并且其中所述外源RNA或DNA引起所述细胞在所述细胞内表达所述大分子群;
(b)对所述细胞的基因组进行序列鉴定,以鉴定所述外源RNA或DNA;以及
(c)确定所述外源RNA或DNA诱导所述形态变化。
实施例
实施例1:实验方案
在一些情况下,外源RNA分子或外源DNA分子被设计为表达肽、多肽或蛋白质。肽、多肽或蛋白质可以具有稳定的α-螺旋结构,这可以是肽-蛋白质相互作用的关键方面。可以将肽表达RNA或DNA克隆到质粒载体中以用于转染或转导到细胞中。
用30个残基的定制随机化,构建了两个肽表达文库。将支架肽设计成具有稳定的二级结构,其具有8个螺旋圈。如所报道的,赖氨酸(K)和谷氨酸(E)残基之间在其表面上的盐桥的广泛网络,可以稳定螺旋结构,也可以帮助增加肽的溶解度。放置丙氨酸残基以促进(内部)螺旋结构的形成。通过使位于螺旋结构同一平面内的7个丙氨酸残基位置随机化(对于每个文库)而构建文库,如在Krstenansky JL,Owen TJ.,Hagaman KA.,McLean LR.,FEBSLett.,1989,242(2):409-13.doi.org/10.1016/0014-5793(89)80512-5.Short modelpeptides having a highα-helical tendency:Design and solution properties中所详述的,其通过引用整体并入本文。
在一些情况下,使用成簇的规律间隔的短回文重复序列(CRISPR)或其他基因编辑技术,将外源RNA分子或外源DNA分子转染到细胞中,所述成簇的规律间隔的短回文重复序列(CRISPR)例如CRISPR相关的9(Cas9)、Cas13d、CasX或其他变体,所述其他基因编辑技术例如锌指核酸酶(ZFN)或转录激活因子样效应物核酸酶(TALEN),如在Shalem O.,SanjanaNE.,Hartenian E.,Shi X.,Scott DA.,Mikkelson T.,Heckl D.,Ebert BL.,Root DE.,Doench JG.,Zhang F.,Science.2014,343(6166):84-87.doi:10.1126/science.1247005.Genome-scale CRISPR-Cas9 knockout screening in human cells;以及Joung J.,Konermann S.,Gootenberg JS.,Abudayyeh OO.,Platt RJ.,Brigham MD.,Sanjana NE.,Zhang F.,Nat Protoc.2017,12(4):828-863.doi:10.1038/nprot.2017.016.Genome-scale CRISPR-Cas9 knockout and transcriptionalactivation screening中所述的,其每一个都通过引用整体并入本文。
在一些情况下,将基因组规模的CRISPR文库或肽表达文库扩增。简言之,将适量的质粒电穿孔到电感受态细胞中。确认转化效率后,使用Macherey-Nagel NucleoBond XtraMaxi EF试剂盒收获并纯化扩增的单向导RNA(sgRNA)文库或肽表达文库。然后,对质粒内的包含肽编码区的序列或sgRNA进行PCR扩增和条码化,然后在敲除实验前进行高通量测序分析。
在一些情况下,将肽文库的寡核苷酸克隆到病毒或非病毒载体中,例如pLVX-Puro慢病毒表达载体中。这些载体实际上可以在任何类型的哺乳动物细胞类型中提供高水平的肽表达。用于肽文库和sgRNA的慢病毒颗粒是使用HEK 293FT细胞通过Lenti-X PackagingSingle Shots试剂盒(TaKara)生产的。为了确保大多数细胞仅接受一种遗传干扰,将慢病毒颗粒(带有sgRNA/肽文库)以MOI(感染复数)<0.05转导至细胞系,以用于筛选。
将细胞的质粒序列进行PCR扩增、纯化,并进行从头测序。使用具有下一代测序平台的深度测序方法,对插入的sgRNA和分布在分选细胞中的质粒解码。
实施例2:荧光标记的线粒体或溶酶体的分类
图4A和图10E示出了包含荧光标记的线粒体或荧光标记的溶酶体的HEK293T细胞的荧光图像。图4A和图10E中的左分图示出了包含用Mito Tracker染色的线粒体的细胞。图4A和图10E中的右分图示出了包含用Lyso Tracker染色的溶酶体的细胞。将用MitoTracker染色的细胞或用Lyso tracker染色的细胞作为训练集。通过使用荧光成像的视觉分析来区分用Mito Tracker染色的细胞和用Lyso Tracker染色的细胞。
图4B示出了使用本公开内容的系统和方法对包含荧光标记的线粒体(左峰,“线粒体”)或荧光标记的溶酶体(右峰,“溶酶体”)的HEK293T细胞进行的分类。图10F示出了使用本公开内容的系统和方法对包含荧光标记的线粒体(右峰,“线粒体”)或荧光标记的溶酶体(左峰,“溶酶体”)的HEK293T细胞进行的分类。基于荧光标记的细胞器的形态,对用MitoTracker染色的细胞和用Lyso Tracker染色的细胞进行分类,从而区分包含荧光标记的线粒体的细胞和包含荧光标记的溶酶体的细胞。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序对蛋白质进行分类。在图4B和图10F的每一个示出的两个峰说明了两个细胞群体的机器学习(ML)评分分布。分类方法利用支持向量机(SVM)。ML评分也可以称为SVM评分。对于图4B中描绘的样品,SVM获得了0.993的受试者工作特征曲线下的面积(ROC-AUC),并且对于图10F中描绘的样品,ROC-AUC大于0.999。
实施例3:STAT3细胞质或核定位的分类
图4C示出了包含位于细胞核内(核)和细胞核外(细胞质)的荧光标记的STAT3蛋白的HepG2细胞的荧光图像。针对STAT3使用免疫荧光(IF)标记细胞。将具有或不具有白介素6(IL-6)刺激的野生型(WT)HepG2作为训练集。将在存在或不存在IL-6的情况下针对STAT3染色的细胞通过使用荧光成像的视觉分析进行区分。图4C的右分图图示了在不存在IL-6的情况下针对STAT3染色的HepG2细胞,并且图4C的左分图图示了在存在IL-6下的情况下针对STAT3染色的HepG2细胞。IL-6激活STAT3,并促进STAT3定位于细胞核,如在IL-6存在下在细胞中心附近的荧光积累所见。
对于筛选组,将混合的sgRNA转导至表达Cas9的HepG2细胞,或将混合的肽表达文库转导至HepG2细胞。通过IL-6激活STAT3,以筛选抑制STAT3核易位的功能基因或肽。对于训练组,将WT HepG2细胞进行胰蛋白酶化并低速离心5分钟。除去上清液后,加入1mL新鲜的RPMI 10%FBS培养基,并等分装到两个Eppendorf管中。一种用于IL-6刺激,另一种用于未刺激的对照。为了激活STAT3,将HepG2细胞和筛选组用100微克/毫升(μg/mL)的IL-6处理,并在37℃下温育15分钟。离心并除去上清液后,将细胞在室温下用500微升(μL)4%甲醛固定15分钟。然后,用PBS缓冲液洗涤几次。然后,将细胞用500μL透化缓冲液(甲醇,丙酮[1:2])在4℃下透化30分钟。用PBS洗涤后,将细胞用500μL 5%BSA(在PBS中)封闭,并在室温下温育1小时。然后,将细胞用PBS洗涤,并与125μLSTAT3一抗(在PBS中稀释50倍)一起温育,并在4℃温育过夜。然后,将细胞用PBS洗涤几次以去除非特异性结合,然后用300μL兔二抗(山羊抗兔IgG-488-在PBS中稀释100倍)重悬沉淀。在室温(暗)下温育60分钟后,将细胞用PBS洗涤3次,最后将沉淀物重浮于300μL PBS中。对细胞数进行计数,并调节至1×106个细胞/mL。
图4D示出了使用本公开内容的系统和方法对具有核定位的STAT3(右峰,“IL6_+”)的HepG2细胞和具有细胞质的STAT3(左峰,“IL6_-”)蛋白的细胞进行的分类。针对STAT3使用免疫荧光对细胞染色。并基于STAT3的定位对用IL-6处理的细胞或未经处理的细胞进行分类。在图4D的每一个中示出的两个峰图示了基于与定位于细胞核的STAT3表型的相似性的两个细胞群的SVM评分分布。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“GhostCytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序对图像进行分类。分类方法利用SVM。SVM获得的ROC-AUC为0.962。
实施例4:NF-κB细胞质或细胞核定位的分类
图10A示出了包含位于细胞核或细胞质中的荧光标记的NF-κB蛋白的THP-1细胞的荧光图像。在用脂多糖(LPS)刺激后,NF-κB的亚基易位至细胞核。针对NF-κB使用免疫荧光标记细胞。将具有或不具有LPS刺激的THP-1细胞用作训练集。将在存在或不存在LPS刺激的情况下针对NF-κB染色的细胞通过使用荧光成像的视觉分析进行区分。图10A的左分图图示了在不存在LPS刺激的情况下针对NF-κB染色的THP-1细胞。图10A的右分图图示了在LPS刺激的存在下针对NF-κB染色的THP-1细胞。LPS的添加促进了NF-κB亚基向细胞核的易位。
图10B示出了使用本公开内容的系统和方法对具有核定位的NF-κB和细胞质NF-κB的THP-1细胞进行的分类。针对NF-κB使用免疫荧光对细胞进行染色,并基于NF-κB的核定位(右峰,“LPS(+)”)或细胞质定位(左峰,“LPS(-)”),对用LPS预处理的细胞和未处理的细胞进行分类。在图10B的每一个中示出的两个峰图示了基于与具有NF-κB核定位的表型相似性的两个细胞群的机器学习(ML)评分分布。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序对图像进行分类。分类方法利用SVM。SVM获得的ROC-AUC为0.997。
图8A和图8B图示了训练机器学习算法以基于荧光标记的蛋白质的定位对细胞进行分类的方法。使用针对NF-κB的p65亚基(“抗p65”)通过免疫荧光染色的THP-1细胞的荧光图像生成训练集,如图8A所示。在LPS刺激下,p65定位于细胞核。将细胞用核染色剂(例如,DAPI或Hoechst)共染色。将用LPS刺激的标记细胞用作核定位阳性细胞的训练集(图8A,右列),并且将未刺激的标记细胞用作核定位阴性细胞的训练集(图8A,左列)。从受刺激和未受刺激的数据集生成如图8B上分图所示的波形。使用受刺激和未受刺激数据集中的每个的波形来开发机器学习模型,以对核定位呈阳性或核定位呈阴性的细胞进行分类。分类模型利用SVM来区分具有核定位的NF-κB的细胞(右峰,“受刺激的”)和具有细胞质的NF-κB的细胞(左峰,“未受刺激的”),如图8B的下分图所示。经过训练的模型能够区分受激细胞和未受激细胞的波形。
实施例5:基于靶蛋白的细胞质或细胞核定位对细胞进行分选
图9A和图9B示出了基于靶蛋白的细胞质或细胞核定位而分选的细胞。针对NF-κB的p65亚基(“抗p65”)通过免疫荧光对细胞染色。用LPS刺激染色的细胞以促进p65的核定位,并将其与在不存在刺激的情况下染色的细胞混合(图9A,上分图)。使用基于图像的系统对混合的细胞进行分类(图9A,中间和下分图),或者使用基于ghost流式细胞术图像的细胞分选对混合的细胞进行分选(图9B,上分图),如在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096中公开的,其通过引用整体并入本文。如通过先前获得的训练集所确定的,ghost流式细胞术分选基于荧光强度和形态。如实施例4和实施例5中所述获得训练集。基于荧光标记的p65蛋白质的定位,将细胞分选为“受刺激的”和“未受刺激的”亚群。使用基于图像的系统进一步对分类为未受刺激的细胞亚群进行分析,以确认分选(图9B,中间和下分图)。在分选之前,混合的细胞包含两个不同的细胞群(图9A)。分选后,选定的细胞亚群包含单个群(图9B),表明ghost流式细胞术能够基于荧光标记的p65的核定位有效地分选细胞。
实施例6:细胞内未聚集和聚集蛋白的分类
图4E示出了HEK293T细胞内未聚集或聚集的蛋白质的荧光图像。使用Fluoppi系统对细胞进行染色,以检测诱导型髓样白血病细胞分化蛋白(MCL-1)和Bcl-2同源拮抗剂/杀伤蛋白(BAK)之间的蛋白质-蛋白质相互作用。Fluoppi系统通过在靶蛋白之间相互作用时促进荧光点或焦点的形成,而促进蛋白质-蛋白质相互作用的检测。将在存在或不存在MCL-1抑制剂A-1210477的情况下,针对MCL-1/BAK相互作用而用Fluoppi染色的细胞作为训练集。A-1210477抑制MCL-1并破坏MCL-1与BAK之间的相互作用。将在存在或不存在A-1210477的情况下针对MCL-1/BAK相互作用染色的细胞通过使用荧光成像的视觉分析进行区分。图4F的右分图图示了在不存在A-1210477的情况下的HEK293T细胞。在不存在A-1210477的情况下,用Fluoppi系统染色的MCL-1和BAK形成可见的荧光焦点。图4F的左分图图示了在A-1210477存在下的HEK293T细胞。A-1210477的添加破坏MCL-1和BAK之间的相互作用。
图4F示出了使用本公开内容的系统和方法对具有未聚集蛋白或聚集蛋白的细胞进行的分类。Fluoppi蛋白质-蛋白质相互作用可视化系统用于通过形成可检测的聚集体来检测蛋白质相互作用。简言之,Fluoppi通过将多聚体荧光蛋白标签附着到第一标记的蛋白质上,并将组装辅助标签附着到第二标记的蛋白质上进行操作。当第一标记的蛋白质和第二标记的蛋白质相互作用时,荧光蛋白标签和组装辅助标签之间的相互作用形成光学可检测的寡聚蛋白复合物。复合物可以被检测为包含蛋白质聚集体或寡聚体的焦点。在这里,使用Fluoppi系统探测了MCL-1和BAK之间的相互作用。使用MCL-1抑制剂A-1210477破坏了MCL-1和BAK之间的相互作用。基于存在可检测的蛋白质聚集体(左峰,“阳性”)或不存在可检测的蛋白质聚集体(右峰,“阴性”)对细胞进行分类。在图4F的每一个中示出的两个峰图示了基于与蛋白质-蛋白质相互作用的表型相似性的两个细胞群的SVM评分分布。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序对图像进行分类。分类方法利用SVM。
实施例7:细胞内蛋白质-蛋白质相互作用的分类
实施了ghost流式细胞术以从蛋白质-蛋白质相互作用(PPI)-阳性细胞和PPI-阴性细胞两者中获取包含图像信息(如蛋白定位信息)的荧光信号的波形。然后,将每个细胞类型设置为训练集,以开发机器学习模型以对PPI阳性细胞和PPI阴性细胞进行分类。分类模型利用SVM区分PPI阳性细胞和PPI阴性细胞。
图10C示出了针对p53与小鼠双分钟2同源物(MDM2)之间的蛋白质-蛋白质相互作用标记的CHO-K1细胞的荧光图像。如实施例6中所述,用Fluoppi系统标记蛋白质p53和MDM2。图10C的左分图示出了未处理的细胞,并且图10C的右分图示出了用Nutlin-3处理的细胞。与未处理的样品相比,Nutlin-3破坏了p53与MDM2之间的相互作用,如用Nutlin-3处理后通过荧光分散所看到的。将针对p53和MDM2之间蛋白质相互作用标记的、并用Nutlin-3处理或未处理的细胞作为训练集。通过使用荧光成像的视觉分析来区分具有或不具有Nutlin-3的细胞。
图10D示出了使用本公开内容的系统和方法,对于针对p53和MDM2之间的蛋白质-蛋白质相互作用的阳性细胞(右峰,“未处理”)或阴性细胞(左峰,“Nutlin-3”)的分类。使用Nutlin-3破坏p53和MDM2之间的相互作用。对细胞染色以检测p53和MDM2之间的相互作用,并基于p53和MDM2之间的相互作用对用Nutlin-3处理的细胞或未处理的细胞进行分类。在图10D的每一个中示出的两个峰图示了基于与p53和MDM2之间的相互作用的表型的相似性的两个细胞群的ML评分分布。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“GhostCytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序对图像进行分类。分类方法利用SVM。SVM获得的ROC-AUC为0.958。
图4G示出了具有核定位的NF-κB蛋白的THP细胞和具有细胞质NF-κB蛋白质的细胞的荧光图像。为了鉴定NF-κB核易位抑制剂,对位于胞液中的NF-κB(图4G,右分图)和由脂多糖(LPS)刺激以诱导核易位的NF-κB(图4G,左分图)分别染色作为阳性和阴性训练集。LPS刺激促进p65从NF-κB复合体解离,并促进p65易位至细胞核。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序获取细胞的图像信息并进行分类。对于筛选集,将混合的sgRNA文库转导到表达Cas9的THP-1细胞,或将混合的肽表达文库转导到WT THP-1细胞。在LPS刺激下,将分类模型应用于筛选集,以对没有NF-κB核易位的细胞进行分选。从分选的细胞中分离质粒,并进行下一代测序分析,以鉴定抑制NF-κB的核定位的基因或肽。
图4H示出了使用本公开内容的系统和方法,对基于NF-κB的核定位的p65亚基的THP-1细胞和具有NF-κB蛋白质的细胞质p65亚基的细胞进行的分类。使用LPS刺激p65定位于细胞核。基于在LPS刺激存在(右峰,“受刺激的”)或不存在(左峰,“未受刺激的”)的情况下,荧光标记p65的形态和定位对细胞进行分类。使用在S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“Ghost Cytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的成像程序对图像分类。分类获得的ROC-AUC为0.972。
实施例8:基于快速图像的混合遗传/肽筛选(RIPGS)的验证
图11示出了使用基于图像的系统和FACS对基于快速图像的混合遗传/肽筛选方法的验证。针对NF-κB的p65亚基(“抗p65”)通过免疫荧光对细胞进行染色。用LPS刺激染色的细胞以促进p65的核定位。将刺激的细胞与未进行LPS刺激的染色细胞混合。根据混合后的细胞的荧光强度以及先前在训练集上获得的ghost信号,对它们进行ghost流式细胞术分选。如实施例4和实施例5中所述获得训练集。对分选的细胞进行收集、浓缩并使用基于图像的系统和常规FACS检查纯度。如S.Ota,R.Horisaki,Y.Kawamura,M.Ugawa,I.Sato,K.Hashimoto,R.Kamesawa,K.Setoyama,S.Yamaguchi,K.Fujiu,K.Waki和H.Noji,“GhostCytometry”,Science 360(6394),第1246-1251页(2018),doi:10.1126/science.aan0096(其通过引用整体并入本文)中公开的进行基于ghost流式细胞术图像的细胞分选(图11,左上分图)。基于荧光标记的p65蛋白质的定位,将细胞分选为“受刺激的”和“未受刺激的”亚群。将分类为未受刺激的细胞亚群进一步进行FACS(图11,上中心分图)或使用基于图像的系统进行分析,以确认分选(图11,右上分图和下分图)。从ghost流式细胞术分选获得的ROC曲线(Roc-AUC)和准确度(Acc)分别为0.959和0.912,表明纯度很高。结果与使用FACS和基于图像的系统计算的结果相当(分别为83.6%和86.7%的纯度),并且表明ghost流式细胞术能够基于荧光标记的p65的核定位有效地分选细胞。
实施例9:基于图像筛选的遗传筛选
出于各种目的,本公开内容的系统和方法可用于进行基于快速图像的混合遗传和/或肽筛选。例如,该系统和方法可以用于鉴定改变细胞的荧光图像(例如,核易位、蛋白质聚集等)的基因或肽。替代地或组合地,该系统和方法可用于鉴定改变细胞表达的一种或多种肽、多肽和/或蛋白质的结构和/或功能的遗传序列。
可以通过本文描述的成像系统和方法来检测改变。例如,可以基于图像是否显示蛋白质定位、蛋白质-蛋白质相互作用、易位、共定位、点或其他属性来检测改变。
本文所述的系统和方法可用于鉴定阻止转录因子的核易位、解离蛋白聚集、恢复细胞器功能等的一个或多个肽、多肽和/或蛋白质。
本文所述的系统和方法可用于鉴定非药物性靶标,如转录因子、磷酸酶RAS或蛋白质位点例如PPI位点。例如,涉及PPI的位点通常可以包含相对较大、相对较平坦的表面,这些表面通常不受小型药物样分子的抑制。然而,此类位点可以被较大的分子(如肽、多肽和/或蛋白质)抑制。作为另一个示例,转录因子可以是柔性的,缺乏有序的结构,或者可以是结构多样化的。转录因子只有在细胞内时才能采用其适当的三维结构。因此,针对转录因子的筛选可需要在天然细胞环境中对转录因子进行筛选。本文所述的方法可用于在其天然细胞环境中筛选非药物性靶标(例如,转录因子、磷酸酶RAS或蛋白质位点)。
虽然本文已经示出和描述了本发明的优选实施方式,但对于本领域技术人员容易理解的是,这样的实施方式只是以示例的方式提供的。并非旨在通过说明书中提供的具体实施例来限制本发明。尽管已经参考前述说明书描述了本发明,但是对本文实施方案的描述和说明并不意味着以限制性的意义来解释。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替代。此外,应当理解,本发明的所有方面不限于本文阐述的具体描述、配置或相对比例,其取决于各种条件和变量。应当理解,本文所述的本发明实施方案的各种替代方案可用于实施本发明。因此,考虑到本发明还应当涵盖任何这样的替代、修改、变化或等同方案。以下权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同方案。

Claims (10)

1.一种用于鉴定核酸分子的方法,包括:
(a)提供已经或疑似已经用至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中所述细胞在细胞群之中;
(b)在(a)之后,鉴定所述细胞的形态变化;
(c)处理所述细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或(iii)所述肽、多肽或蛋白质的序列;
(d)分析(i)所述核酸序列或(ii)所述肽、多肽或蛋白质或(iii)所述肽、多肽或蛋白质的所述序列,以确定所述外源RNA分子或所述外源DNA分子的所述外源序列;以及
(e)将所述外源RNA分子或所述外源DNA分子的外源序列鉴定为影响所述细胞的所述形态变化。
2.根据权利要求1所述的方法,其中所述外源RNA分子或所述外源DNA分子的所述外源序列是未知的。
3.根据权利要求1所述的方法,其中所述外源RNA分子或所述外源DNA分子的所述外源序列是已知的。
4.根据权利要求1所述的方法,其中所述外源RNA分子或所述外源DNA分子编码基因、肽、多肽或蛋白质。
5.根据权利要求1所述的方法,其中所述形态变化包括一个或多个选自以下的成员:所述细胞内蛋白质-蛋白质相互作用的变化、所述细胞内蛋白质定位的变化、所述细胞的形状变化、所述细胞的一种或多种成分的形状变化、以及所述细胞的一种或多种细胞器的形状变化。
6.根据权利要求1所述的方法,其中使用包含所述外源RNA分子或所述外源DNA分子的质粒转染所述细胞。
7.根据权利要求1所述的方法,其中(c)包括对来自所述细胞的至少一个核酸分子或至少一个蛋白质分子进行测序。
8.一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的方法,包括(a)提供已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导的细胞,其中所述细胞在细胞群之中,并且其中所述外源RNA或DNA导致所述细胞在所述细胞内表达大分子群,(b)鉴定响应于由所述细胞表达的所述大分子群的所述细胞的形态变化,(c)对所述细胞的基因组进行序列鉴定以鉴定所述外源RNA或DNA,以及(d)确定所述外源RNA或DNA诱导所述形态变化。
9.一种用于鉴定核酸分子的系统,包括一个或多个计算机处理器,所述一个或多个计算机处理器被单独或共同编程以:
(a)鉴定细胞的形态变化,所述细胞已经或疑似已经被至少一个外源核糖核酸(RNA)分子或至少一个外源脱氧核糖核酸(DNA)分子转染或转导,其中所述细胞在细胞群之中;
(b)处理所述细胞的内容物以鉴定(i)核酸序列或(ii)肽、多肽或蛋白质或所述肽、多肽或蛋白质的序列;
(c)分析(i)所述核酸序列或(ii)所述肽、多肽或蛋白质或所述肽、多肽或蛋白质的所述序列,以确定所述外源RNA分子或所述外源DNA分子的所述外源序列;以及
(d)将所述外源RNA分子或所述外源DNA分子的外源序列鉴定为影响所述细胞的所述形态变化。
10.一种用于筛选细胞的靶核酸、肽、多肽或蛋白质的系统,包括一个或多个计算机处理器,所述一个或多个计算机处理器被单独或共同编程以:
(a)鉴定响应于由细胞表达的大分子群的所述细胞的形态变化,其中所述细胞已经或疑似已经被外源核糖核酸(RNA)分子或外源脱氧核糖核酸(DNA)分子转染或转导,其中所述细胞在细胞群之中,并且其中所述外源RNA或DNA引起所述细胞在所述细胞内表达所述大分子群;
(b)对所述细胞的基因组进行序列鉴定,以鉴定所述外源RNA或DNA;以及
(c)确定所述外源RNA或DNA诱导所述形态变化。
CN202411787375.7A 2018-10-18 2019-10-17 用于靶标筛选的方法和系统 Pending CN119570909A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201862747620P 2018-10-18 2018-10-18
US62/747,620 2018-10-18
US201962825524P 2019-03-28 2019-03-28
US62/825,524 2019-03-28
CN201980083654.6A CN113195718A (zh) 2018-10-18 2019-10-17 用于靶标筛选的方法和系统
PCT/US2019/056743 WO2020081819A1 (en) 2018-10-18 2019-10-17 Methods and systems for target screening

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980083654.6A Division CN113195718A (zh) 2018-10-18 2019-10-17 用于靶标筛选的方法和系统

Publications (1)

Publication Number Publication Date
CN119570909A true CN119570909A (zh) 2025-03-07

Family

ID=70282999

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202411787375.7A Pending CN119570909A (zh) 2018-10-18 2019-10-17 用于靶标筛选的方法和系统
CN201980083654.6A Pending CN113195718A (zh) 2018-10-18 2019-10-17 用于靶标筛选的方法和系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201980083654.6A Pending CN113195718A (zh) 2018-10-18 2019-10-17 用于靶标筛选的方法和系统

Country Status (5)

Country Link
US (1) US20210310053A1 (zh)
EP (1) EP3867374A4 (zh)
JP (2) JP7626454B2 (zh)
CN (2) CN119570909A (zh)
WO (1) WO2020081819A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3372985B1 (en) 2015-10-28 2025-06-25 The University Of Tokyo Analysis device
JP7369385B2 (ja) 2018-06-13 2023-10-26 シンクサイト株式会社 サイトメトリーのための方法及びシステム
JP7475848B2 (ja) * 2019-11-29 2024-04-30 シスメックス株式会社 細胞解析方法、細胞解析装置、細胞解析システム、及び細胞解析プログラム、並びに訓練された人工知能アルゴリズムの生成方法、生成装置、及び生成プログラム
EP4357754A3 (en) 2019-12-27 2024-07-10 Thinkcyte, Inc. Flow cytometer performance evaluation method and standard particle suspension
WO2021200960A1 (ja) 2020-04-01 2021-10-07 シンクサイト株式会社 観察装置
CN115349083B (zh) 2020-04-01 2025-11-04 新克赛特株式会社 流式细胞仪
US20250172484A1 (en) * 2021-09-17 2025-05-29 Thinkcyte K.K. Classification Model Generation Method, Particle Classification Method, and Recording Medium
JPWO2023042646A1 (zh) * 2021-09-17 2023-03-23
WO2024224369A1 (en) 2023-04-28 2024-10-31 Thinkcyte K.K. Systems and methods of machine learning-based physical sample classification with sample variation control
CN121100334A (zh) 2023-04-28 2025-12-09 兴科尚株式会社 基于机器学习的用于物理样本的样本分类器的系统和方法
US20240377307A1 (en) * 2023-05-09 2024-11-14 Becton, Dickinson And Company Methods and systems for classifying analyte data into clusters
GB202312503D0 (en) * 2023-08-16 2023-09-27 Univ Oxford Innovation Ltd Method and system for detecting characteristics of particles or particle environments, and method of training a machine learning model

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7122330B2 (en) * 2000-04-13 2006-10-17 Mark Aaron Emalfarb High-throughput screening of expressed DNA libraries in filamentous fungi
CN100463962C (zh) * 2001-12-07 2009-02-25 图尔金株式会社 嵌合蛋白质的表型筛选
US9157066B2 (en) * 2005-12-13 2015-10-13 The Trustees Of The University Of Pennsylvania Transcriptome transfer produces cellular phenotype conversion
US20170052106A1 (en) * 2014-04-28 2017-02-23 The Broad Institute, Inc. Method for label-free image cytometry
US12060412B2 (en) * 2016-03-21 2024-08-13 The Broad Institute, Inc. Methods for determining spatial and temporal gene expression dynamics in single cells
EP3562594A4 (en) * 2016-12-30 2020-09-09 The Regents of University of California PROCESSES FOR SELECTING AND GENERATING T-LYMPHOCYTES MODIFIED BY THE GENOME

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAO NITTA等: "Intelligent Image-Activated Cell Sorting", CELL, vol. 175, 20 September 2018 (2018-09-20), pages 266 - 276 *

Also Published As

Publication number Publication date
JP2022512767A (ja) 2022-02-07
CN113195718A (zh) 2021-07-30
EP3867374A1 (en) 2021-08-25
JP2024170414A (ja) 2024-12-10
WO2020081819A1 (en) 2020-04-23
US20210310053A1 (en) 2021-10-07
JP7626454B2 (ja) 2025-02-04
EP3867374A4 (en) 2022-08-17

Similar Documents

Publication Publication Date Title
JP7626454B2 (ja) 標的スクリーニングのための方法及びシステム
Mah et al. Bento: a toolkit for subcellular analysis of spatial transcriptomics data
US20250369984A1 (en) Methods of assaying proteins
Jung et al. Target deconvolution of bioactive small molecules: the heart of chemical biology and drug discovery
US20210239705A1 (en) Methods and applications of protein identification
Naseer et al. Sequence-based identification of arginine amidation sites in proteins using deep representations of proteins and PseAAC
CN109923216A (zh) 将生物分子的检测组合到使用荧光原位测序的单个试验的方法
US12461091B2 (en) Systems and methods for discriminating effects on targets
Heintze et al. The molecular basis for pore pattern morphogenesis in diatom silica
Chen et al. A barcoding strategy enabling higher-throughput library screening by microscopy
Taliaferro Classical and emerging techniques to identify and quantify localized RNAs
Bhushan et al. Recent advancements in subcellular proteomics: growing impact of organellar protein niches on the understanding of cell biology
Uckelmann et al. Dynamic PRC1–CBX8 stabilizes a porous structure of chromatin condensates
Kappel et al. Characterizing protein sequence determinants of nuclear condensates by high-throughput pooled imaging with CondenSeq
Stepanov et al. Optogenetics for sensors: On-demand fluorescent labeling of histone epigenetics
Chen et al. Deep‐Learning‐Based Approaches for Rational Design of Stapled Peptides With High Antimicrobial Activity and Stability
Shrestha et al. Profiling Protein–Protein Interactions in the Human Brain by Refined Cofractionation Mass Spectrometry
McCarthy et al. Theory for High-Throughput Genetic Interaction Screening
Hadarovich et al. PICNIC identifies condensate-forming proteins across organisms
Rehfeldt Application of deep learning methods on publicly available mass spectrometry-based proteomics data
Ayala et al. Classification of Human Transcription Factors Based on Their Effector Domains via Unsupervised Learning
Wiener On DNA-conjugated antibodies for protein detection and protein-interaction analysis
Riva et al. GENESIS: Generating scRNA-Seq data from Multiome Gene Expression
Sahumbaiev Cell cycle staging from DAPI and fluorescence microscopy
Li The automated analysis and statistical characterisation of subcellular biological images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination