[go: up one dir, main page]

CN117535407B - 鼻咽癌菌群辅助诊断标志物 - Google Patents

鼻咽癌菌群辅助诊断标志物 Download PDF

Info

Publication number
CN117535407B
CN117535407B CN202311341498.3A CN202311341498A CN117535407B CN 117535407 B CN117535407 B CN 117535407B CN 202311341498 A CN202311341498 A CN 202311341498A CN 117535407 B CN117535407 B CN 117535407B
Authority
CN
China
Prior art keywords
reagent
bacterial species
detecting
flora
markers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311341498.3A
Other languages
English (en)
Other versions
CN117535407A (zh
Inventor
贾卫华
廖颖
吴艳霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University Cancer Center
Original Assignee
Sun Yat Sen University Cancer Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University Cancer Center filed Critical Sun Yat Sen University Cancer Center
Priority to CN202311341498.3A priority Critical patent/CN117535407B/zh
Publication of CN117535407A publication Critical patent/CN117535407A/zh
Application granted granted Critical
Publication of CN117535407B publication Critical patent/CN117535407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • G01N33/56916Enterobacteria, e.g. shigella, salmonella, klebsiella, serratia
    • G01N33/57557
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/22Klebsiella
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/46Streptococcus ; Enterococcus; Lactococcus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • G01N2333/24Assays involving biological materials from specific organisms or of a specific nature from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • G01N2333/26Klebsiella (G)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • G01N2333/315Assays involving biological materials from specific organisms or of a specific nature from bacteria from Streptococcus (G), e.g. Enterococci
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Public Health (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Hospice & Palliative Care (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)

Abstract

本发明属于生物医药领域,涉及鼻咽癌菌群辅助诊断标志物。其中,所述菌种标志物包括:Cutibacterium acnes、Corynebacterium accolens、Cutibacterium granulosum、Limnobacter thiooxidans、Peptostreptococcus stomatis、Streptococcus mitis、Gemella haemolysans、Gemella morbillorum、Klebsiella pneumoniae、Neisseria sicca、Ralstonia insidiosa和Granulicatella adiacens中的一种或多种。所述标志物对鼻咽癌的诊断和预后具有较高的诊断效能和准确性,为临床提供了经济、简便的解决方法。

Description

鼻咽癌菌群辅助诊断标志物
技术领域
本发明属于生物医药领域,涉及鼻咽癌菌群辅助诊断标志物。
背景技术
鼻咽癌是起源于鼻咽上皮的恶性肿瘤,高发于我国华南地区及东南亚等国。尽管近年来随着诊疗技术的发展,鼻咽癌死亡率有所下降,但发病率仍居高不下。且鼻咽癌高发于40-55岁、好发于男性,该肿瘤的青壮年高发及区域性高发的特点。此外,由于鼻咽癌发病的隐匿性,患者发现时肿瘤分期通常较晚,给华南等高发地区带来了较大的卫生经济负担。早期发现、早期治疗将有望改善患者的长期预后及提升治疗后生活质量。
鼻咽经口、鼻与外环境相通,定植有丰富多样的细菌,它们是局部微环境的关键成员。在健康个体中,鼻咽部菌群主要由来自棒状杆菌属、链球菌属、莫拉氏菌属及狡诈球菌属的需氧细菌构成。这些定植于鼻咽黏膜的常驻菌群在维持局部微生态稳定、抵御机会致病菌定植及调节黏膜免疫平衡中发挥着重要作用,是维持鼻咽健康的基石。鼻咽常常是呼吸道病原体进入机体的第一站,目前我们对鼻咽部菌群的理解多集中于其与病毒或细菌感染、哮喘等呼吸道炎症性疾病的关联。菌群失调已被大量研究证实是推动肿瘤发生发展的关键病因,部分菌群特征在结直肠癌等肿瘤中已展现出其明确的标志物价值。因此,寻找可区分鼻咽癌患者与对照的菌群特征,将有望开发出适用于鼻咽癌早期诊断、治疗检测及干预的新途径。
发明内容
一方面,本发明提供了检测菌种标志物的试剂在制备鼻咽癌的诊断、监测或预后判断产品中的应用;所述菌种标志物包括:Cutibacterium acnes、Corynebacteriumaccolens、Cutibacterium granulosum、Limnobacter thiooxidans、Peptostreptococcusstomatis、Streptococcus mitis、Gemella haemolysans、Gemella morbillorum、Klebsiella pneumoniae、Neisseria sicca、Ralstonia insidiosa和Granulicatellaadiacens中的一种或多种。
在一些实施方案中,所述菌种标志物包括:Cutibacterium acnes;Corynebacterium accolens;或Cutibacterium granulosum。
在一些实施方案中,所述菌种标志物包括:Cutibacterium acnes和Streptococcus mitis。
在一些实施方案中,所述菌种标志物包括第一菌种标志物和第二菌种标志物;所述第一菌种标志物包括:Cutibacterium acnes和Streptococcus mitis;所述第二菌种标志物包括:Corynebacterium accolens、Cutibacterium granulosum、Limnobacterthiooxidans、Peptostreptococcus stomatis、Gemella haemolysans、Gemellamorbillorum、Klebsiellapneumoniae、Neisseria sicca、Ralstonia insidiosa和Granulicatella adiacens中的一种或多种。
在一些实施方案中,所述第二菌种标志物包括:Limnobacter thiooxidans;在一些实施方案中,所述第二菌种标志物包括:Limnobacter thiooxidans和Peptostreptococcus stomatis;在一些实施方案中,所述第二菌种标志物包括:Limnobacter thiooxidans、Peptostreptococcus stomatis和Corynebacteriumaccolens;在一些实施方案中,所述第二菌种标志物包括:Limnobacter thiooxidans、Peptostreptococcus stomatis、Corynebacterium accolens和Klebsiella pneumoniae;在一些实施方案中,所述第二菌种标志物包括:Limnobacter thiooxidans、Peptostreptococcus stomatis、Corynebacterium accolens、Klebsiella pneumoniae和Gemella haemolysans;或Limnobacter thiooxidans、Peptostreptococcus stomatis、Corynebacterium accolens、Klebsiellapneumoniae和Gemella morbillorum;在一些实施方案中,所述第二菌种标志物包括:Limnobacter thiooxidans、Peptostreptococcusstomatis、Corynebacterium accolens、Klebsiellapneumoniae、Gemella haemolysans和Gemella morbillorum;在一些实施方案中,所述第二菌种标志物包括:Corynebacteriumaccolens、Limnobacter thiooxidans、Peptostreptococcus stomatis、Gemellahaemolysans、Gemella morbillorum、Klebsiella pneumoniae、Neisseria sicca、Ralstonia insidiosa及Granulicatella adiacens。
在一些实施方案中,所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂;在一些实施方案中,所述检测菌种标志物的试剂为引物、探针、反义寡核苷酸、适配体、和/或抗体;在一些实施方案中,所述检测菌种标志物的试剂为16S rRNA检测用试剂、PCR检测用试剂、RNAseq检测用试剂、高通量测序用试剂、和/或宏基因组测序用试剂;在一些实施方案中,所述菌种的取样部位包括鼻咽部或鼻腔;在一些实施方案中,所述产品为试剂、试剂盒、试纸、芯片和/或电子装置。
一方面,本发明提供了一种鼻咽癌的诊断、监测或预后判断的试剂盒,所述试剂盒包括检测菌种标志物的检测试剂,所述菌种标志物包括:Cutibacterium acnes、Corynebacterium accolens、Cutibacterium granulosum、Limnobacter thiooxidans、Peptostreptococcus stomatis、Streptococcus mitis、Gemella haemolysans、Gemellamorbillorum、Klebsiellapneumoniae、Neisseria sicca、Ralstonia insidiosa和Granulicatella adiacens中的一种或多种。
在一些实施方案中,所述检测试剂包括检测所述菌种标志物含量的检测试剂;优选地,所述检测菌种标志物的试剂为引物、探针、反义寡核苷酸、适配体、和/或抗体;优选地,所述检测菌种标标志物的试剂为16S rRNA检测用试剂、PCR检测用试剂、RNAseq检测用试剂、高通量测序用试剂、和/或宏基因组测序用试剂;优选地,所述试剂盒还包括取样试剂和/或装置,所述取样试剂和/或装置包括:口腔微生物取样试剂和/
或装置,鼻腔微生物取样试剂和/或装置,鼻咽部微生物取样试剂和/或装置,或肠道微生物取样试剂和/或装置;优选地,所述鼻咽部微生物取样试剂和/或装置包括:鼻咽刷。
一方面,本发明提供了一种鼻咽癌的诊断、监测或预后判断的电子装置,所述电子装置包括:
获取检测模块,所述获取检测模块被设置为获取生物样品,对所述生物样品进行检测,获得所述生物样品中的菌种标志物的含量;
诊断、监测或预后判断模块,所述诊断、监测或预后判断模块是使用逻辑回归模型和所述菌种标志物的含量建立回归方程,构建模型,然后根据所述模型输出诊断、监测或预后判断结果;
所述菌种标志物包括:
Cutibacterium acnes、Corynebacterium accolens、Cutibacteriumgranulosum、Limnobacter thiooxidans、Peptostreptococcus stomatis、Streptococcusmitis、Gemella haemolysans、Gemella morbillorum、Klebsiella pneumoniae、Neisseriasicca、Ralstonia insidiosa和Granulicatella adiacens中的一种或多种。
在一些实施方案中,所述菌种的取样部位包括鼻咽部、口腔、肠道鼻腔和/或鼻道;优选地,所述模型输出诊断、监测或预后判断结果为,输出预测概率值 时,判定为鼻咽癌或风险高;时,判定为不患有鼻咽癌或风险低。
一方面,本发明提供了一种诊断、监测或预后判断鼻咽癌的菌种标志物的筛选方法,所述筛选方法包括:
对取自受试者的所述生物样品进行检测,获得菌群数据集;
获取所述受试者的患鼻咽癌病情况,利用所述菌群数据集和所述患鼻咽癌病情况构建第一数据集;
对所述第一数据集进行多元统计与数据挖掘,对所述菌群数据集进行物种差异分析,获得与所述鼻咽癌病相关的所述菌种标志物;
所述生物样品包括鼻腔粘液、鼻腔冲洗液、鼻腔拭子、鼻腔脱落细胞、鼻咽粘液、鼻咽冲洗液、鼻咽拭子和/或鼻咽脱落细胞;
所述受试者包括健康人和鼻咽癌患者;
所述菌种标志物包括:
Cutibacterium acnes、Corynebacterium accolens、Cutibacteriumgranulosum、Limnobacter thiooxidans、Peptostreptococcus stomatis、Streptococcusmitis、Gemella haemolysans、Gemella morbillorum、Klebsiella pneumoniae、Neisseriasicca、Ralstonia insidiosa和Granulicatella adiacens中的一种或多种。
在一些实施方案中,所述检测包括使用检测试剂;优选地,所述检测试剂包括检测所述菌种标志物含量的检测试剂;优选地,所述检测菌种标志物的试剂为引物、探针、反义寡核苷酸、适配体、和/或抗体;优选地,所述检测菌种标志物的试剂为16S rRNA检测用试剂、PCR检测用试剂、RNAseq检测用试剂、高通量测序用试剂、和/或宏基因组测序用试剂;优选地,从鼻腔粘液、鼻腔冲洗液、鼻腔拭子、鼻腔脱落细胞、鼻咽粘液、鼻咽冲洗液、鼻咽拭子和/或鼻咽脱落细胞中检测所述菌种,获得菌群数据集。
一方面,本发明提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时,控制所述存储介质所在设备执行所述电子装置中的模型、或所述的诊断、监测或预后判断鼻咽癌的菌种标志物的筛选方法。
一方面,本发明提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述模型、或所述的诊断、监测或预后判断鼻咽癌的菌种标志物的筛选方法。
本领域的技术人员可以清楚地了解到,本发明可借助软件加检测装置等硬件设备的方式来实现。基于这样的理解,本申请的技术方案中数据处理的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例,或者实施例的某些部分的方法。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
如本领域技术人员所知,本发明的部分模块或步骤可以在通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
基于本申请展示的与鼻咽癌相关的个体的微生物菌群情况,临床医生还能够给予基于个人微生物菌群的临床指导。例如,当人们的微生物菌群丰度接近或超过一个风险范围,可以建议通过药物干预、控制或治疗鼻咽癌。此外,对于某些有高风险或已确诊鼻咽癌的患者,可根据菌群情况给予必要的鼻咽部、或鼻腔微环境治疗。
附图说明
图1为实施例1中鼻咽刷菌群测序数据的质量控制流程。
图2为实施例1中鼻咽癌患者与对照人群的鼻咽菌群结构多样性差异的主坐标图。
图3为实施例2中单个菌群特征在区分鼻咽癌患者及对照构建模型的受试者工作特征曲线;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图4为实施例2中筛选建模效果最佳的11个菌群特征。
图5为实施例2中11个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图6为实施例2中2个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图7为实施例2中Cutibacterium acnes与其他菌联合模型及Cutibacteriumacnes单菌模型的ROC;其中:ROC1--Cutibacterium acnes单菌模型;ROC2--Cutibacteriumacnes与Streptococcus mitis两菌联合模型;ROC3--Cutibacterium acnes与Gemellahaemolysans两菌联合模型;ROC4--Cutibacterium acnes与Limnobacter thiooxidans两菌联合模型。
图8为实施例2中11个菌群特征在两位点模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数。
图9为实施例2中3个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图10为实施例2中Cutibacterium acnes及Streptococcus mitis与其他菌的3个特征菌群联合模型的ROC;其中:ROC1--Cutibacterium acnes与Streptococcus mitis两菌联合模型;ROC2--Cutibacterium acnes、Streptococcus mitis与Limnobacterthiooxidans三菌联合模型;ROC3--Cutibacterium acnes、Streptococcus mitis与Peptostreptococcus stomatis三菌联合模型;ROC4--Cutibacterium acnes、Streptococcus mitis与Gemella morbillorum三菌联合模型。
图11为实施例2中11个菌群特征在三位点模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数。
图12为实施例2中4个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图13为实施例2中Cutibacterium acnes、Streptococcus mitis及Limnobacterthiooxidans与其他菌的4个特征菌群联合模型的ROC;其中:ROC1--Cutibacterium acnes、Streptococcus mitis及Limnobacter thiooxidans三菌联合模型;ROC2--Cutibacteriumacnes、Streptococcus mitis、Limnobacter thiooxidans及Peptostreptococcusstomatis四菌联合模型;ROC3--Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans及Gemella morbillorum四菌联合模型;ROC4--Cutibacteriumacnes、Streptococcus mitis、Limnobacter thiooxidans及Klebsiellapneumoniae四菌联合模型。
图14为实施例2中11个菌群特征在四位点模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数。
图15为实施例2中5个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图16为实施例2中Cutibacterium acnes、Streptococcus mitis、Limnobacterthiooxidans及Corynebacterium accolens与其他菌的5个特征菌群联合模型的ROC;其中:ROC1--Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans及Peptostreptococcus stomatis四菌联合模型;ROC2--Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans及Peptostreptococcus stomatis及Corynebacterium accolens五菌联合模型;ROC3--Cutibacterium acnes、Streptococcusmitis、Limnobacter thiooxidans、Gemella morbillorum及Corynebacterium accolens五菌联合模型;ROC4--Cutibacterium acnes、Streptococcus mitis、Limnobacterthiooxidans、Klebsiellapneumoniae及Corynebacterium accolens五菌联合模型。
图17为实施例2中11个菌群特征在五位点模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数。
图18为实施例2中6个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
图19为实施例2中11个菌群特征在六位点模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数。
图20为实施例2中纳入不同个数的菌群特征最佳模型的曲线下面积(AUC)变化趋势。
图21为实施例2中8个菌群特征模型的受试者工作特征曲线及预测值;图中标识的AUC为受试者工作特征曲线的曲线下面积;点标记的数据为最佳截断值及其对应的特异度及灵敏度;标记顺序为:截断值(特异度,灵敏度)。
具体实施方式
以下通过具体的实施例进一步说明本发明的技术方案,具体实施例不代表对本发明保护范围的限制。其他人根据本发明理念所做出的一些非本质的修改和调整仍属于本发明的保护范围。
术语
术语“生物标志物”,也称为“标志物”、“诊断标志物”,是指个体的生物状态可测量的指标。这样的生物标志物可以是在个体中的任何物质,只要它们与被检个体的特定生物状态(例如,疾病状态)有关关系,例如,核酸标志物(也可以称为基因标志物,例如DNA),蛋白质标志物,细胞因子标志物,趋化因子标志物,碳水化合物标志物,抗原标志物,抗体标志物,物种标志物(种/属的标记)和功能标志物(KO/OG标记)等。其中,核酸标志物的含义并不局限于现有可以表达为具有生物活性的蛋白质的基因,还包括任何核酸片段,可以为DNA,也可以为RNA,可以是经过修饰的DNA或者RNA,也可以是未经修饰的DNA或者RNA,以及由它们组成的集合。在本文中核酸标志物有时也可以称为特征片段。在本发明中,生物标志物也可以用“微生物标志物”、“细菌标志物”来表示。生物标志物经过测量和评估,经常用以检查正常生物过程,致病过程,或治疗干预药理响应。在本发明的具体实施方式中,本发明运用高通量测序,分析了鼻咽癌患者和健康人群的生物样本,基于高通量测序的数据,对鼻咽癌患者和健康人群进行了对比,从而确定了与诊断区分鼻咽癌患者和健康人群相关的生物标志物。
术语“丰度”,是指生物样品中目标微生物的数量的量度。“丰度”也被称为“负载”。一般通过分子方法,典型地通过例如荧光原位杂交(FISH)、定量聚合酶链式反应(qPCR)或PCR/焦磷酸测序测定所述目标微生物的16S rRNA基因拷贝数,进行细菌定量。生物样品内目标核酸序列丰度的定量可能是绝对的或相对的。“相对定量”通常是基于一个或多个内部参考基因,即来自参考菌株的16S rRNA基因,比如使用通用引物并且将目标核酸序列的丰度表达为总细菌16S rRNA基因拷贝的百分比或通过大肠杆菌16S rRNA基因拷贝归一化而测定的细菌。“绝对定量”通过与DNA标准进行比较或通过DNA浓度归一化来给出目标分子的确切数目。“定量水平”可以是浓度(每单位体积的DNA量)、每细胞数量的DNA量或基因拷贝数、循环阈值(Ct值)或其任何数学变换,如基因拷贝数的Log10。
在本发明中,可以采用本领域技术人员熟知的任何方法来检测微生物标志物或测定微生物标志物的水平。这些方法包括但不限于利用引物的序列扩增的方法,使用抗原-抗体反应的免疫学方法。其中,利用引物的序列扩增的方法可以是例如聚合酶链式反应(PCR)、逆转录-聚合酶链式反应(RT-PCR)、多重PCR、降落PCR、热启动PCR、巢式PCR、增效PCR、实时PCR、差示PCR、cDNA末端快速扩增、反向聚合酶链式反应、载体介导PCR、热不对称交错PCR、连接酶链式反应、修复链式反应、转录-介导的扩增、自主序列复制、目标碱基序列的选择性扩增反应。使用抗原-抗体反应的免疫学方法可以是例如蛋白质印迹、酶联免疫吸附分析、放射免疫分析、放射免疫扩散法、欧氏免疫扩散法、火箭免疫电泳、组织免疫染色、免疫沉淀分析法、补体结合分析法、荧光活化细胞分选器、蛋白芯片等,但本发明的范围不限于此。
术语“样本”,是指包含来自受试者的至少一种的样本。样本品的实例可以是:细胞、组织、体液、活检标本、血液、尿液、粪便、唾液、痰、血浆、血清、细胞培养上清液、拭子样本等。在本发明的具体实施方式中,所述样本为鼻咽拭子。
术语“检测对象”,也称为“研究对象”或“受试者”,是指任何动物受试者,包括但不限于人、实验室动物、家畜和家养宠物。受试者可以寄居有多种微生物。受试者可在其身体之上和之内的各种生境中具有不同的微生物组。所述受试者可被诊断出疾病或被怀疑具有患病的风险。受试者可具有导致疾病的微生物组状态(生态失调),优选地,所述检测对象、研究对象或受试者为人。
术语“检测”同“诊断”,除了鼻咽癌的早期诊断,还包括鼻咽癌中期和晚期的诊断,且也包括鼻咽癌筛选、风险评估、预后、疾病识别、病症阶段的诊断及监测,以及治疗性靶标的选择。
术语“诊断”,也称为“早期诊断”,是指确认病理状态的存在或者特征,在本发明的具体实施方式中,所述诊断是指区分确定鼻咽癌的存在与否。
术语“16S rRNA”,是指构成原核生物核糖体的30S亚基的、所有物种共有的保守区和能够对特定物种进行分类的高变区的rRNA,因此可以通过碱基序列分析,来鉴定微生物的存在。特别地,由于同源物种之间几乎没有多样性,而不同物种之间则具有多样性,因此可以通过比较16S rRNA的序列来有效地鉴定原核生物。此外,由于16S rDNA是编码16SrRNA的基因,因此也可以使用16S rDNA来鉴定微生物。
术语“AUC(Area under the ROC curve,ROC曲线下面积)”,是指接收者操作特征曲线(Receiver operating characteristic curve,ROC曲线)下面积,所述ROC曲线是一个用于度量分类中的非均衡性的工具,ROC曲线及AUC常被用来评价一个二值分类器的优劣。ROC曲线是一个概率曲线,在不同的阈值下绘制TPR(真阳性率)与FPR(假阳性率)的关系图,其中,横坐标为FPR(False positive rate,假阳率),纵坐标为TPR(True positive rate,真阳率)。FPR是指所有负例中有多少被预测为正例;TPR是指有多少真正的正例被预测出来;ROC曲线可以从本质上把“信号”与“噪声”分开;AUC是一个概率值,当随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的分数将这个正样本排在负样本前面的概率就是AUC值,用作ROC曲线的总结,AUC越高,模型在区分正类和负类方面的性能越好。当AUC=1时,分类器能够正确区分所有的正类点和负类点;然而,如果AUC为0,那么分类器将预测所有的否定为肯定,所有的肯定为否定,因此,AUC越接近1表示该测试具有高度灵敏并且具有高度特异性,而AUC接近0.5则表明该测试既不具有灵敏性也不具有特异性。
实施例1:基于三代16S rRNA扩增子测序发现鼻咽癌患者与健康对照的鼻咽菌群存在显著差异
本实施例中共招募了84例鼻咽癌患者及94例对照人群,采集其鼻咽刷样本并收集参与者临床及基础信息,提取鼻咽刷DNA并进行16S rRNA基因V1-V9区全长扩增子测序(PacBio测序技术),成功检测符合质量控制的菌群数据共计156例(70例鼻咽癌患者及86例健康对照),鉴定病例对照间的差异菌群特征。具体实施方案如下:
1.1研究对象纳入及信息采集
该队列为病例对照研究设计,为申请者所在团队于2020年6月至2020年11月在中国广西壮族自治区梧州市红十字医院招募的70名鼻咽癌患者和86名对照组,利用Pacbio16S全长测序技术在物种水平上探索鼻咽癌相关鼻咽微生物群的特征。纳入标准如下:
*病例组的纳入标准为:
①经病理确诊为鼻咽癌,未经任何鼻咽癌相关治疗;
②年龄18-75岁;
③自愿参加,签署知情同意书且接受样本采集。
*对照组的纳入标准为:
①未发现头颈部异常症状;
②既往无严重疾病(如心、脑、肝脏、肾脏、精神疾病及恶性肿瘤);
③年龄18-75岁;
④自愿参加、签署知情同意书且能够接受样本采集。
参与者个人信息采集由经专业培训的工作人员采集,包括性别、年龄、联系方式等个人基本信息,疾病史、吸烟饮酒等个人生活史,家族史及既往EB病毒检测情况。纳入人群的基本信息特征见表1。
表1:纳入队列的基本信息特征
1.2鼻咽刷采集及DNA提取
鼻咽刷样本的采集流程为:将鼻咽刷经中鼻道伸入鼻咽部,经鼻咽镜确定刷位置,均匀擦拭鼻咽各壁及隐窝处2-3圈,待刷充分吸收所擦拭组织后取出,迅速放入装有保存液的采集管中,并在-80℃冻存。
鼻咽刷DNA提取流程为:将鼻咽刷在冰上解冻,解冻后的样本进行涡旋振荡,将刷上的脱落细胞等物质充分释放至保存液中制成样本悬液,随后取200μL样本悬液进行DNA提取。使用无菌玻璃珠在涡旋仪中以最大转速研磨10分钟以充分裂解细菌细胞壁。预处理后的样本采用QIAGEN tissue andblood DNA提取试剂盒,按照试剂盒说明书流程进行DNA提取,提取后的DNA冻存于-20℃冰箱。样本处理及DNA提取过程均设置空白对照样本。
1.3样本的菌群测序实验流程
鼻咽刷DNA使用Qubit荧光计(配套使用Qubit dsDNABR试剂盒)进行定量,使用凝胶电泳进行质量控制。将鼻咽刷稀释至25ng/μL分装于96孔板中。基于27F/1492R引物扩增16SrRNA基因全长区域并联合PacBio三代测序的微生物组检测体系。具体流程为:采用含有12bp barcode序列的细菌通用引物27F(5'-AGRGTTYGATYMTGGCTCAG-3',Forward primer)和1492R(5'-RGY TACCTTGTTACGACTT-3',Reverse primer)扩增16SrRNA全长基因。使用KAPAHiFi HotStart DNA聚合酶对鼻咽刷DNA进行32-33个循环的扩增。
*PCR扩增体系:
KAPAHiFi HotStart DNA聚合酶-------12.5μL
Nuclease-free water(invitrogen)-------4.5μL
Forwardprimer(2.5μM)---------------3μL
Reverse primer(2.5μM)---------------3μL
鼻咽刷DNA(25ng/μL)---------------2μL
*PCR反应条件为:
扩增PCR产物使用琼脂糖凝胶电泳确认扩增产物长度的准确性(~1500bp);使用Agencourt AMPure XP(0.6×)磁珠纯化扩增产物,各样本纯化后产物进行等摩尔浓度混合。使用纯化后产物按照制造商的说明(PacBio平台)进行SMRTbell DNA文库构建,并使用PacBio Sequel平台(Pacific Biosciences)进行测序。每样本测序深度为0.5-2万条序列。PCR及文库构建过程均设置阴性质控标本,连同样本处理过程空白对照样本一起纳入测序。
1.416S rRNA全长扩增测序数据的分析流程
使用SMRT Link软件(v9.0.0,Pacific Biosciences)从原始PacBio测序数据中获得高质量的循环一致序列(CCS)。使用Lima(v2.0.0)基于文库构建过程中扩增引物上的12bp barcode序列,将序列拆分至对应的样本中。使用针对PacBio全长16S rRNA基因测序数据定制的DADA2(v1.22.0)工作流用于CCS序列的质量控制、去噪和扩增子序列变体(ASV)的识别。基于上述流程,可得到每个样本在每个ASV中的序列数量数据。
使用silva_nr99_v138_train_set数据库联合silva_species_assignment_v138序列数据库对上述流程得到的ASV进行菌群物种的分类注释。按照“RIDE检查表”,应用一系列方案进行序列质控及去污染处理,具体为:1)去除注释信息为线粒体或叶绿体的ASV;2)去除在细菌门水平上未被注释的ASV。此外,结合样本采集及处理、DNA建库测序过程中设计的阴性对照样本所得的序列信息,利用R包Decontam(v1.10.0)进行潜在环境污染的识别和过滤。以测序深度2000作为截断值,删除测序深度低于此截断值的样本,最终得到质控后的ASV丰度表。样本质控流程见图1。
1.5结果:鼻咽癌患者鼻咽部菌群与健康对照有显著差异
首先,检验鼻咽癌患者的鼻咽菌群结构与对照人群是否具有显著差异。经分析发现,鼻咽癌患者的微生物菌群结构与对照组明显不同(Bray-Curtis距离矩阵,PERMANOVA分析,P<0.001,图2),说明鼻咽癌患者与对照人群的鼻咽部菌群在整体构成上具有显著差别。
1.6结果:鼻咽癌患者与健康对照的差异菌群特征
为了进一步寻找鼻咽癌相关的菌群特征,进行ANCOM-BC分析以确定鼻咽癌患者和对照组之间差异丰富的细菌物种,分析已校正性别、年龄、吸烟、饮酒及口腔鼻咽疾病等潜在混杂因素。我们在鼻咽部共计检出533个物种,将97个检出率高于5%的物种进行差异检验,发现25个物种的相对丰度在鼻咽癌患者和对照组之间具有显著差异(p<0.05)。物种水平差异检验结果见表1。其中,Corynebacterium(棒状杆菌属)共检出18个种,仅Corynebacterium accolens具有统计学意义;Staphylococcus(葡萄球菌属)共检出25个种,仅Staphylococcus epidermidis及Staphylococcus hominis具有统计学意义;Streptococcus(链球菌属)共检出17个种,仅Streptococcus mitis具有统计学意义;Prevotella(普雷沃氏菌属)共检出25个种,仅Prevotella nanceiensis具有统计学意义。
表1:鼻咽癌病例与对照在鼻咽部菌群中的差异菌群特征
实施例2:显著差异的鼻咽菌群对鼻咽癌患者与健康对照的判别效果评价
基于实施例1中涉及的样本及数据,本实施例评价各菌群特征单独及不同组合情况下所构建模型对鼻咽癌患者及对照人群的预测效果。我们将该样本按6:4的比例随机分为训练集及测试集,对训练集构建的模型在测试集进行独立验证。测试集包括39名鼻咽癌患者及50名对照,验证集包括31名鼻咽癌患者及36名健康对照。以下是具体实施内容:
2.1:单个差异菌群特征对鼻咽癌与对照的判别效果
首先,对实施例1中所述的25个鼻咽癌差异菌群特征运用Logistic回归模型进行独立建模。模型自变量为各菌群特征的相对丰度信息,因变量为疾病分组(是否为鼻咽癌患者)。首先在训练集人群中进行模型的构建,并计算训练集人群模型预测效果。然后将构建的模型在测试集进行验证,并计算其在独立人群的预测效果。基于各菌群特征共建立25个预测模型(Model 1~Model25),各菌群指标的富集组别、检出率及模型预测信息见表3。
表3:鼻咽癌病例与对照组间差异显著的鼻咽菌群物种构建预测模型及曲线下面积情况
表注:*(Logistic回归模型方程式中的x变量为所在行代表的菌群特征相对丰度,为回归模型计算所得的模型预测概率值)。
各模型的受试者工作特征曲线,最佳截断值及其对应的灵敏度及特异度信息见图3。训练集中单个菌群特征的AUC>0.6的物种共有7个,包括:1)对照组富集细菌Cutibacterium acnes、Corynebacterium accolens、Cutibacterium granulosum、Staphylococcus epidermidis、Streptococcus mitis、Gemella haemolysans及Peptostreptococcus stomatis。其中,训练集及测试集AUC同时>0.6的菌群特征有3个,包括:1)Cutibacterium acnes:训练集的AUC为0.714,测试集的AUC为0.634;当取训练集的最佳截断值=0.522时,训练集灵敏度为76.9%,特异度为66.0%,此时测试集灵敏度为45.2%,测试集特异度为72.2%;2)Corynebacterium accolens:训练集的AUC为0.702,测试集的AUC为0.656;当取训练集的最佳截断值=0.515时,训练集灵敏度为69.2%,特异度为68.0%,此时测试集灵敏度为48.4%,测试集特异度为72.2%;3)Cutibacteriumgranulosum:训练集的AUC为0.657,测试集的AUC为0.656;当取训练集的最佳截断值=0.511时,训练集灵敏度为61.5%,特异度为68.0%,此时测试集灵敏度为45.2%,测试集特异度为80.6%。
从单个菌群特征的AUC可以看到,不同菌群特征对鼻咽癌患者识别的模式存在较大差别,如Peptostreptococcus stomatis及Gemella haemolysans等菌群特征的AUC明显左偏,表现出优异的特异度(98%~100%);Staphylococcus hominis的AUC则明显右偏,在训练集及测试集有87.4%及96.8%的灵敏度。而Cutibacterium acnes、Corynebacteriumaccolens及Cutibacterium granulosum则在综合判别能力上具有优势。上述结果提示多菌群标志物组合联用将有望实现标志物的优势互补,提升菌群模型判别鼻咽癌的准确性。
2.2:11个鼻咽菌群特征组合构建鼻咽癌诊断模型
进一步地,我们采用LASSO模型进行进一步特征选择,具体为:使用R语言中的glmnet函数,设置参数family="binomial";同时联合cv.glmnet函数进行5折交叉验证优化模型lamda值(lamda值取1se),进一步优选出11个菌群特征下一阶段的预测模型。筛选出的菌群特征在100次LASSO模型迭代建模中纳入模型的次数见图4。采用上述菌群特征的相对丰度信息构建Logistic回归模型以判断鼻咽癌患者及对照人群。
11个菌群构建的模型(Model 26)公式如下:
Model 26:
基于所构建模型Model26区分鼻咽癌患者及对照人群中展现出良好的预测效果,在训练集的曲线下面积(AUC)=0.922(95%CI:0.870~0.974),在测试集的AUC为0.852(95%CI:0.757~0.947);当取训练集的最佳截断值为0.432时,灵敏度为87.2%,特异度为82.0%,此时测试集灵敏度为71.0%,测试集特异度为80.6%。训练集及测试集的受试者工作特征曲线如图5。
2.3:2个鼻咽菌群特征组合构建鼻咽癌诊断模型
为测试不同数量及不同菌群特征的模型的预测效果,首先测试了纳入2个菌群特征及其组合建模对鼻咽癌诊断的性能,将上述筛选的11个菌群特征的两两组合应用Logistic回归模型进行建模。在测试的55种组合中,Cutibacterium acnes与Streptococcus mitis两个菌群特征组合的模型表现最佳,在训练集的AUC为0.808,测试集的AUC为0.648;在取模型最佳截断值为0.494时,训练集的灵敏度为77%,特异度为76%;测试集的灵敏度为48%,特异度为72%。该模型公式为:
Model 27:
Model27在训练集及测试集的受试者工作特征曲线见图6。
值得注意的是,纳入两位点的模型中,训练集AUC效果前三的模型均纳入Cutibacterium acnes,该细菌在与Streptococcus mitis、Gemella haemolysans组合建模的效果均显著高于独立建模(图7)。其中Cutibacterium acnes与Gemella haemolysans所构建的模型在训练集的AUC为0.778,测试集的AUC为0.683;在取模型最佳截断值为0.466时,训练集的灵敏度为82%,特异度为66%;测试集的灵敏度为52%,特异度为72%。Cutibacterium acnes与Limnobacter thiooxidans所构建的模型在训练集的AUC为0.765,测试集的AUC为0.689;在取模型最佳截断值为0.490时,训练集的灵敏度为82%,特异度为66%;测试集的灵敏度为55%,特异度为69%。
此外,通过对模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数进行统计,发现在两位点建模时,模型纳入次数最多的菌群特征包括Cutibacteriumacnes、Corynebacterium accolens、Peptostreptococcus stomatis及Streptococcusmitis等(图8),说明上述菌群特征联合建模时诊断效能更佳。
2.4:3个鼻咽菌群特征组合构建鼻咽癌诊断模型
我们测试了纳入3个菌群特征及其组合建模对鼻咽癌诊断的性能,将上述筛选的11个菌群特征中的3个菌群特征应用Logistic回归模型进行建模,共计测试165种组合。其中,Cutibacterium acnes、Streptococcus mitis及Limnobacter thiooxidans三个菌群特征组合建模在165种组合中表现最佳,在训练集的AUC为0.849,测试集的AUC为0.701;在取模型最佳截断值为0.458时,训练集的灵敏度为85%,特异度为76%;测试集的灵敏度为58%,特异度为69%。该模型公式为:
Model 28:
Model28在训练集及测试集的受试者工作特征曲线见图9。
纳入三个菌群特征的模型中训练集AUC效果前三的模型均纳入Cutibacteriumacnes及Streptococcus mitis。在此基础上分别联合Limnobacter thiooxidans、Peptostreptococcus stomatis及Gemella morbillorum(图10)。其中Cutibacteriumacnes、Streptococcus mitis与Peptostreptococcus stomatis所构建的模型在训练集的AUC为0.835,测试集的AUC为0.670;在取模型最佳截断值为0.446时,训练集的灵敏度为80%,特异度为76%;测试集的灵敏度为52%,特异度为72%。Cutibacterium acnes、Streptococcus mitis与Gemella morbillorum所构建的模型在训练集的AUC为0.835,测试集的AUC为0.649;在取模型最佳截断值为0.464时,训练集的灵敏度为79%,特异度为76%;测试集的灵敏度为48%,特异度为72%。
通过对模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数进行统计,发现在3个菌群特征建模时,模型纳入次数最多的菌群特征包括Cutibacteriumacnes、Streptococcus mitis、Limnobacter thiooxidans、Corynebacterium accolens及Gemella haemolysans等(图11),说明上述菌群特征联合有望提升模型准确性。
2.5:4个鼻咽菌群特征组合构建鼻咽癌诊断模型
我们测试了纳入4个菌群特征及其组合建模对鼻咽癌诊断的性能,将上述筛选的11个菌群特征的4个菌群特征应用Logistic回归模型进行建模,共计测试330种组合。其中,Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans及Peptostreptococcus stomatis四个菌群特征组合建模在330种组合中表现最佳,在训练集的AUC为0.876,测试集的AUC为0.723;在取模型最佳截断值为0.403时,训练集的灵敏度为85%,特异度为76%;测试集的灵敏度为61%,特异度为69%。该模型公式为:
Model 29:
Model29在训练集及测试集的受试者工作特征曲线见图12。
纳入四个菌群特征的模型中训练集AUC效果前三的模型均纳入Cutibacteriumacnes、Streptococcus mitis及Limnobacter thiooxidans,在此基础上分别联合Peptostreptococcus stomatis、Gemella morbillorum及Klebsiellapneumoniae(图13)。其中Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans及Gemellamorbillorum所构建的模型在训练集的AUC为0.874,测试集的AUC为0.704;在取模型最佳截断值为0.423时,训练集的灵敏度为85%,特异度为76%;测试集的灵敏度为58%,特异度为69%。Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans及Klebsiellapneumoniae所构建的模型在训练集的AUC为0.870,测试集的AUC为0.738;在取模型最佳截断值为0.430时,训练集的灵敏度为87%,特异度为76%;测试集的灵敏度为65%,特异度为69%。
通过对模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数进行统计,发现在4个菌种特征建模时,模型纳入次数最多的菌群特征包括Cutibacteriumacnes、Limnobacter thiooxidans、Streptococcus mitis、Corynebacterium accolens、Peptostreptococcus stomatis及Gemella haemolysans等(图14),说明上述菌群特征在模型重要性较高,多点联合效应更强。
2.6:5个鼻咽菌群特征组合构建鼻咽癌诊断模型
测试了纳入5个菌群特征及其组合建模对鼻咽癌诊断的性能,将上述筛选的11个菌群特征中的5个菌群特征应用Logistic回归模型进行建模,共计测试462种组合。其中,Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans、Peptostreptococcus stomatis及Corynebacterium accolens五个菌群特征组合建模在462种组合中表现最佳,在训练集的AUC为0.901,测试集的AUC为0.768;在取模型最佳截断值为0.447时,训练集的灵敏度为87%,特异度为86%;测试集的灵敏度为55%,特异度为83%。该模型公式为:Model 30:
训练集及测试集的受试者工作特征曲线见图15。
纳入五个菌群特征的模型中训练集AUC效果前三的模型均纳入Cutibacteriumacnes、Streptococcus mitis、Limnobacter thiooxidans及Corynebacterium accolens,在此基础上分别联合Peptostreptococcus stomatis、Gemella morbillorum及Klebsiellapneumoniae(图16)。其中Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans、Corynebacterium accolens及Gemella morbillorum联合所构建的模型在训练集的AUC为0.900,测试集的AUC为0.753;在取模型最佳截断值为0.469时,训练集的灵敏度为87%,特异度为86%;测试集的灵敏度为48%,特异度为83%。Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans、Corynebacterium accolens及Klebsiella pneumoniae所构建的模型在训练集的AUC为0.896,测试集的AUC为0.756;在取模型最佳截断值为0.366时,训练集的灵敏度为90%,特异度为76%;测试集的灵敏度为68%,特异度为69%。
通过对模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数进行统计,发现在5个菌群特征建模时,模型纳入次数最多的菌群特征包括Cutibacteriumacnes、Limnobacter thiooxidans、Streptococcus mitis、Gemella morbillorum、Corynebacterium accolens、Peptostreptococcus stomatis及Gemella haemolysans等(图17)。
2.7:6个鼻咽菌群特征组合构建鼻咽癌诊断模型
我们测试了纳入6个菌群特征及其组合建模对鼻咽癌诊断的性能,将上述筛选的11个菌群特征中的6个菌群特征应用Logistic回归模型进行建模,共计测试462种组合。其中,Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidans、Peptostreptococcus stomatis、Corynebacterium accolens及Klebsiellapneumoniae六个菌群特征组合建模在462种组合中表现最佳,在训练集的AUC为0.909,测试集的AUC为0.783;在取模型最佳截断值为0.430时,训练集的灵敏度为85%,特异度为90%;测试集的灵敏度为61%,特异度为86%。该模型公式为:
Model 31:
训练集及测试集的受试者工作特征曲线见图18。
纳入六个菌群特征的模型中训练集AUC效果排名第二的模型纳入Cutibacteriumacnes、Streptococcus mitis、Limnobacter thiooxidans、Peptostreptococcusstomatis、Corynebacterium accolens及Gemella morbillorum,在训练集的AUC为0.907,测试集的AUC为0.759;在取模型最佳截断值为0.415时,训练集的灵敏度为87%,特异度为86%;测试集的灵敏度为55%,特异度为83%。
通过对模型效果前十、前二十及前三十的模型中菌群特征变量被纳入的次数进行统计,发现在6个菌群特征建模时,模型纳入次数最多的菌群特征包括Cutibacteriumacnes、Limnobacter thiooxidans、Streptococcus mitis、Gemella morbillorum、Corynebacterium accolens、Peptostreptococcus stomatis及Gemella morbillorum等(图19),说明上述菌群特征联合建模时诊断效能更佳。
2.8纳入不同数量的菌群特征对模型预测效果的影响
为查看纳入不同数量菌群特征的模型的预测效果改变,计算了分别纳入1个、2个、3个、4个、5个、6个、7个、8个、9个、10个及11个菌群特征的所有模型的组合,选择纳入不同数量特征在测试集AUC最高的模型进行展示,可以看到,相对于仅纳入1个特征,多个特征的联合可明显提高测试集及验证集预测的准确性(图20)。
在纳入特征数量至8个菌群特征时,模型在训练集和测试集的效果达到平台(图20)。该模型(Model32)纳入Corynebacterium accolens、Cutibacterium acnes、Limnobacter thiooxidans、Peptostreptococcus stomatis、Gemella haemolysans、Klebsiella pneumoniae、Ralstonia_insidiosa及Granulicatella_adiacens,在训练集的AUC为0.922,测试集的AUC为0.816;在取模型最佳截断值为0.420时,训练集的灵敏度为87%,特异度为86%;测试集的灵敏度为68%,特异度为89%。该模型公式为:
Model 32:
训练集及测试集的受试者工作特征曲线见图21。

Claims (17)

1.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Granulicatella adiacensCutibacteriumacnesGemellahaemolysansCorynebacteriumaccolensRalstoniainsidiosaNeisseriasiccaKlebsiella pneumoniae、Streptococcus mitis、Limnobacterthiooxidans、 PeptostreptococcusstomatisGemellamorbillorum的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
2.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Cutibacterium acnesStreptococcus mitis的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
3.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Cutibacterium acnes、Streptococcus mitisLimnobacter thiooxidans的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
4.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Cutibacterium acnes、Streptococcus mitis、Limnobacter thiooxidansPeptostreptococcus stomatis的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
5.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Cutibacterium acnesStreptococcus mitisLimnobacter thiooxidansPeptostreptococcus stomatisCorynebacterium accolens的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
6.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Cutibacterium acnesStreptococcus mitisLimnobacter thiooxidansPeptostreptococcus stomatisCorynebacterium accolensKlebsiella pneumoniae的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
7.检测菌种标志物的试剂在制备鼻咽癌的诊断产品中的应用,其特征在于,所述菌种标志物为Corynebacterium accolensCutibacterium acnesLimnobacter thiooxidansPeptostreptococcus stomatisGemella haemolysansKlebsiella pneumoniaeRalstonia_insidiosaGranulicatella_adiacens的组合;所述检测菌种标志物的试剂为定量检测菌种标志物丰度的试剂。
8.如权利要求1-7任一所述的应用,其特征在于,所述检测菌种标志物的试剂为引物、探针、适配体和/或抗体。
9.如权利要求1-7任一所述的应用,其特征在于,所述检测菌种标志物的试剂为PCR检测用试剂。
10.如权利要求1-7任一所述的应用,其特征在于,所述检测菌种标志物的试剂为高通量测序用试剂。
11. 如权利要求1-7任一所述的应用,其特征在于,所述检测菌种标志物的试剂为16SrRNA检测用试剂。
12.如权利要求1-7任一所述的应用,其特征在于,所述检测菌种标志物的试剂为RNAseq检测用试剂。
13.如权利要求1-7任一所述的应用,其特征在于,所述检测菌种标志物的试剂为宏基因组测序用试剂。
14.如权利要求1-7任一所述的应用,其特征在于,所述菌种的取样部位为鼻咽部。
15.如权利要求1-7任一所述的应用,其特征在于,所述产品为试剂。
16.如权利要求1-7任一所述的应用,其特征在于,所述产品为试剂盒。
17.如权利要求1-7任一所述的应用,其特征在于,所述产品为试纸、芯片和/或电子装置。
CN202311341498.3A 2023-10-17 2023-10-17 鼻咽癌菌群辅助诊断标志物 Active CN117535407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311341498.3A CN117535407B (zh) 2023-10-17 2023-10-17 鼻咽癌菌群辅助诊断标志物

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311341498.3A CN117535407B (zh) 2023-10-17 2023-10-17 鼻咽癌菌群辅助诊断标志物

Publications (2)

Publication Number Publication Date
CN117535407A CN117535407A (zh) 2024-02-09
CN117535407B true CN117535407B (zh) 2025-05-23

Family

ID=89786930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311341498.3A Active CN117535407B (zh) 2023-10-17 2023-10-17 鼻咽癌菌群辅助诊断标志物

Country Status (1)

Country Link
CN (1) CN117535407B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050201978A1 (en) * 2003-11-17 2005-09-15 Lipton James S. Tumor and infectious disease therapeutic compositions
CN107541544A (zh) * 2016-06-27 2018-01-05 卡尤迪生物科技(北京)有限公司 用于确定微生物分布谱的方法、系统、试剂盒、用途和组合物
CN109266750B (zh) * 2018-12-03 2022-05-31 中国科学院苏州纳米技术与纳米仿生研究所 用于鼻咽癌诊断的生物标志物以及应用
WO2021072275A1 (en) * 2019-10-11 2021-04-15 Guardant Health, Inc. Use of cell free bacterial nucleic acids for detection of cancer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Microbes translocation from oral cavity to nasopharyngeal carcinoma in patients;Ying Liao et al.;《Nature Communications》;20240222;全文 *

Also Published As

Publication number Publication date
CN117535407A (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
Russo et al. Preliminary comparison of oral and intestinal human microbiota in patients with colorectal cancer: a pilot study
RU2723336C2 (ru) Способ определения дисбиоза желудочно-кишечного тракта
CN105209918B (zh) 生物标记鉴定方法和系统
US10982283B2 (en) Indices of microbial diversity relating to health
CN120966978A (zh) 诊断和治疗急性呼吸系统感染的方法
CN114898800B (zh) 一种预测肺炎克雷伯菌对头孢曲松敏感性的方法及系统
CN111440884A (zh) 源于肠道的诊断肌少症的菌群及其用途
CN114898808B (zh) 一种预测肺炎克雷伯菌对头孢吡肟敏感性的方法及系统
CN110904213B (zh) 一种基于肠道菌群的溃疡性结肠炎生物标志物及其应用
CN115537462B (zh) 一种同时检测病原菌和宿主基因表达量的测序方法及在细菌性脑膜炎诊断和预后中的应用
CN107273711B (zh) 一种对虾健康状况指示菌群的筛选方法
CN112522412A (zh) 检测生物标志物的试剂、产品及其在疾病中的应用
CN115125312A (zh) 用于Basal型胰腺导管腺癌(PDAC)诊断的标志物组合及其应用
CN117535407B (zh) 鼻咽癌菌群辅助诊断标志物
CN113684242A (zh) 一种基于淋巴结微生物菌群的头颈癌预后生物标志物及其应用
CN116656851B (zh) 一种生物标志物及其在慢性阻塞性肺疾病诊断方面的应用
CN112410449A (zh) 一种与结直肠癌相关的微生物标志物及其应用
CN114480636B (zh) 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途
CN117535416A (zh) 细菌在作为鼻咽癌检测、治疗或预后标志物中的应用
US20240290488A1 (en) Systems and methods for determining oral microbiome compositions and health outcomes
CN115247207B (zh) 一种用于2型糖尿病鉴别的肠道微生物基因标记物组合及其应用
CN114214438B (zh) 胆道菌群检测试剂在制备预测胆道结石术后早期复发的试剂中的应用
CN116904575B (zh) 与矽肺患者体能衰退相关的生物标志物及其用途
CN117385066B (zh) 一种高血压诊断标志物及其应用
CN119082330B (zh) 微生物标志物在诊断尿酸异常相关疾病中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant