[go: up one dir, main page]

CN111985246A - 一种基于主要症状与伴随症状词的疾病认知系统 - Google Patents

一种基于主要症状与伴随症状词的疾病认知系统 Download PDF

Info

Publication number
CN111985246A
CN111985246A CN202010876663.5A CN202010876663A CN111985246A CN 111985246 A CN111985246 A CN 111985246A CN 202010876663 A CN202010876663 A CN 202010876663A CN 111985246 A CN111985246 A CN 111985246A
Authority
CN
China
Prior art keywords
disease
symptom
characteristic
feature
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010876663.5A
Other languages
English (en)
Other versions
CN111985246B (zh
Inventor
杜乐
杜小军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Donghu Big Data Technology Co ltd
Original Assignee
Wuhan Donghu Big Data Trading Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Donghu Big Data Trading Center Co ltd filed Critical Wuhan Donghu Big Data Trading Center Co ltd
Priority to CN202010876663.5A priority Critical patent/CN111985246B/zh
Publication of CN111985246A publication Critical patent/CN111985246A/zh
Application granted granted Critical
Publication of CN111985246B publication Critical patent/CN111985246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提出了一种基于主要症状与伴随症状词的疾病认知系统。包括:数据获取模块,用于获取疾病特征信息以及对应症状特征信息,建立疾病知识数据库;特征提取模块,用于获取待识别临床症状特征信息,获取特征词;匹配模块,用于将待识别疾病特征词与疾病特征信息进行匹配,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;认知模块,用于建立Jaccard系数相似性算法,计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。本发明通过关键词匹配方法与Jaccard系数相似性定理构建联合认知模型,通过联合认知模型精确对待识别疾病进行认知,提高系统的识别精确度,提升了用户体验。

Description

一种基于主要症状与伴随症状词的疾病认知系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于主要症状与伴随症状词的疾病认知系统。
背景技术
每个疾病都有其特定的病因和病理,特别是都有一定的发展演变规律,并且表现出不同的临床症状特征信息。临床症状特征信息是患者因疾病而表现出来的不正常状态。每个人年龄、性别、体质不同,即使患同一种疾病,其症状也不同。疾病初期、中期、晚期的症状,也呈现出阶段性变化。
近年来,相关专家开始研究通过临床症状特征信息来推导和预测疾病的方法。比如,基于临床症状的特征权重推导疾病概率方法等,但是这些方法对于人工依赖比较大,并且精确度不够高,速度较慢,所以亟需一种基于主要症状与伴随症状词的疾病认知系统,能够提高疾病认知速度以及精确度。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于主要症状与伴随症状词的疾病认知系统,旨在解决现有技术无法通过二次提取特征词以及Jaccard系数相似性定理来提高疾病认知的精确度的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于主要症状与伴随症状词的疾病认知系统,所述基于主要症状与伴随症状词的疾病认知系统包括:
数据获取模块,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
特征提取模块,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;
匹配模块,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;
认知模块,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。
在以上技术方案的基础上,优选的,数据获取模块包括数据集建立模块,用于获取疾病特征信息以及对应的症状特征信息,所述疾病特征信息包括:疾病特征词,症状特征信息包括:主要症状特征词以及伴随症状特征词,根据疾病特征信息以及该症状特征信息建立不同的特征词集合,包括:疾病特征词集合、主要症状特征词集合以及伴随症状特征词集合。
在以上技术方案的基础上,优选的,数据获取模块还包括数据库建立模块,用于根据疾病特征信息以及对应症状特征信息之间的对应关系建立疾病特征信息与对应症状特征信息的关系表,将该特征词集合与关系表组合,作为疾病知识数据库。
在以上技术方案的基础上,优选的,特征提取模块包括特征分词提取模块,用于获取待识别临床症状特征信息,所述待识别临床症状特征信息包括:疾病文本描述以及对应的症状文本描述,利用TF-IDF从待识别临床症状特征信息中提取各个词条的出现频率数据,设定出现频率阈值,将各个词条的出现频率数据与出现频率阈值进行比较,将出现频率数据大于出现频率阈值的词条作为特征分词。
在以上技术方案的基础上,优选的,特征提取模块包括特征词提取模块,用于设定常用词库,根据该常用词库对特征分词进行筛选,将筛选出的常用词从对应的特征分词中删除,保留剩余特征分词作为待识别疾病特征词。
在以上技术方案的基础上,优选的,匹配模块包括匹配计算模块,用于设定匹配相似度阈值,将疾病特征词集合中的各特征词与待识别疾病特征词进行匹配计算,计算出对应的匹配相似度,将该匹配相似度与匹配相似度阈值进行比较,当该匹配相似度大于匹配相似度阈值时,对疾病特征词集合中的特征词进行标记,并通过该特征词从疾病知识数据库查询对应的症状特征信息。
在以上技术方案的基础上,优选的,认知模块包括计算认知模块,用于建立Jaccard系数相似性算法,设定相似性阈值,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,将该相似性与相似性阈值进行比较,当相似性大于相似性阈值时,生成对应的认知报告。
更进一步优选的,所述基于主要症状与伴随症状词的疾病认知设备包括:
数据获取单元,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
特征提取单元,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;
匹配单元,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;
认知单元,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。
本发明的一种基于主要症状与伴随症状词的疾病认知系统相对于现有技术具有以下有益效果:
(1)通过关键词匹配方法与Jaccard系数相似性定理构建联合认知模型,通过临床症状词之间语义相似性计算,可以相对准确地预测或评估待诊断症状特征信息与可能的疾病之间的关系,提升了系统认知的精确度,同时提升了用户体验;
(2)通过采用无监督的形式,从已有的症状特征信息库中去自学习症状特征,并智能地进行症状特征信息词对之间语义相似度计算,预测疾病,减少了工作量,避免了人工干涉,实现灵活,实用性强。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于主要症状与伴随症状词的疾病认知系统第一实施例的结构框图;
图2为本发明基于主要症状与伴随症状词的疾病认知系统的第二实施例结构框图;
图3为本发明基于主要症状与伴随症状词的疾病认知系统的第三实施例结构框图;
图4为本发明基于主要症状与伴随症状词的疾病认知系统的第四实施例结构框图;
图5为本发明基于主要症状与伴随症状词的疾病认知系统的第五实施例结构框图;
图6为本发明基于主要症状与伴随症状词的疾病认知设备结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于主要症状与伴随症状词的疾病认知系统第一实施例的结构框图。其中,所述基于主要症状与伴随症状词的疾病认知系统包括:数据获取模块10、特征提取模块20、匹配模块30和认知模块40。
数据获取模块10,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
特征提取模块20,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;
匹配模块30,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;
认知模块40,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。
应当理解的是,本实施的执行主体可以为患者或者医生认知状态处理终端中的处理器或者控制器等。
应当理解的是,本实施例的方案如下:首先按照疾病的相关类别,建立某一类别疾病以及该类别下具体疾病临床主要症状与伴随症状特征信息以及相应的疾病知识数据库。该库分别包含该类别疾病以及该类别下具体疾病临床主要症状与伴随症状特征信息向量集(或称为第一词对)以及相应的具体的疾病知识等;
其次,通过利用TF-IDF选取特征项,采集患者待识别的临床症状特征信息,提取其症状特征信息向量集(或称第二对词,里面可能包含临床主症状与伴随症状特征信息向量集),建立待识别的临床症状特征信息向量集;
第三,利用关键词匹配方法,对所述第一对词里面的主要特征信息向量集(即主特征关键词集)与待识别第二词对里面所有特征信息向量集(即特征关键词集)进行相似度匹配;如果第二词对里面特征信息关键词与第一对词里面的主要特征信息向量集(即主特征关键词集)出现相似或者相似概率大,则归为该类别疾病,进行下一步认知;反之,不归为该类别疾病,中止下一步认知;
第四,在明确判别上述类别疾病的基础上,利用Jaccard系数相似性定理,计算所述第一词对伴随症状特征信息向量集与待识别第二词伴随症状特征信息量集关系的相似性。如果相似,给出可能的疾病名称与知识,相反,亦然;最后,再根据患者年龄、性别、体质等因素,进行加权,计算并推导出相对精确的结果,并给出解决方案。
进一步地,如图2所示,基于上述各实施例提出本发明基于主要症状与伴随症状词的疾病认知系统的第二实施例结构框图,在本实施例中,数据获取模块10还包括:
数据集建立模块101,用于获取疾病特征信息以及对应的症状特征信息,所述疾病特征信息包括:疾病特征词,症状特征信息包括:主要症状特征词以及伴随症状特征词,根据疾病特征信息以及该症状特征信息建立不同的特征词集合,包括:疾病特征词集合、主要症状特征词集合以及伴随症状特征词集合;
数据库建立模块102,用于根据疾病特征信息以及对应症状特征信息之间的对应关系建立疾病特征信息与对应症状特征信息的关系表,将该特征词集合与关系表组合,作为疾病知识数据库;
应当理解的是,系统会获取疾病特征信息以及对应的症状特征信息,所述疾病特征信息包括:疾病特征词,症状特征信息包括:主要症状特征词以及伴随症状特征词,根据疾病特征信息以及该症状特征信息建立不同的特征词集合,包括:疾病特征词集合、主要症状特征词集合以及伴随症状特征词集合。
应当理解的是,上述步骤还可以解释为按照疾病的相关类别,建立某一类别疾病以及该类别下具体疾病临床主要症状特征信息与伴随症状特征信息以及相应的疾病知识数据库。该库分别包含该类别疾病以及该类别下具体疾病临床主要症状与伴随症状特征信息向量集(或称为第一词对)以及相应的具体的疾病知识等。
简单地举例,假设一个龟头方面疾病特征点信息M(龟头炎)的描述信息包括“外阴、龟头包皮溃疡、男性、以外阴部为主、龟头部由外伤、刺激或感染等因素引起的炎症、表现为龟头局部红肿、糜烂、溃疡”等;另一个特征点信息N的(急性浅表性包皮龟头炎)描述信息包括“外阴、龟头包皮溃疡、男性、阴茎龟头起病之初、局部皮肤潮红、自觉龟头有灼热感、瘙痒感、翻开包皮可见龟头有水肿性红斑、糜烂、渗液、出血、严重者可出现水疱”等,并且又一个特征点信息Z的(环状溃烂性龟头炎)描述信息包括“外阴、龟头包皮溃疡、男性、阴茎龟头及包皮发生红斑、逐渐扩大、呈环状或多环状、以后形成浅表溃疡面”等,并且又一个特征点信息W的(念珠菌性龟头炎)描述信息包括“外阴、龟头包皮溃疡、男性、阴茎龟头处潮红、炎性丘疹、又或点阵式小红疙瘩、大量密集排列、少许鳞屑或渗出、龟头上有粘稠的分泌物、或有白色伪膜样白膜、自觉瘙痒、烧灼感”等,那么,可以通过上述步骤来聚类所有的描述信息以得到如下“外阴、龟头包皮溃疡、男性等”的词条:“外阴、龟头包皮溃疡、男性、以外阴部为主、龟头部由外伤、刺激或感染等因素引起的炎症、表现为龟头局部红肿、糜烂、溃疡、阴茎龟头起病之初、局部皮肤潮红、自觉龟头有灼热感、瘙痒感、翻开包皮可见龟头有水肿性红斑、糜烂、渗液、出血、严重者可出现水疱、阴茎龟头及包皮发生红斑、逐渐扩大、呈环状或多环状、以后形成浅表溃疡面、阴茎龟头处潮红、炎性丘疹、又或点阵式小红疙瘩、大量密集排列、少许鳞屑或渗出、龟头上有粘稠的分泌物、或有白色伪膜样白膜”等,并归于“龟头炎”一类,从而组成龟头炎主要症状特征信息词典,其他则列入伴随症状特征信息词典。再比如,胃部(一般指胃、腹、胃部、腹部、上腹、上消化道等)系统疾病主要症状特征信息主要有:腹痛、腹胀、嗳气、反酸、厌食、恶心、呕吐、腹部不适、胃部隐痛、食欲不振等;如果说糜烂性胃炎,除了上述症状特征信息外,伴随症状特征信息有:胃黏膜多发性点状或弥漫性充血、糜烂、黑粪、晕厥、休克等;如果是急性化脓性胃炎,除了上述症状特征信息外,伴随症状特征信息有:起病急、胃壁细菌感染引起、常伴寒战、高热,上腹部疼痛、发冷发热、呕吐物为脓血样物、便血等;如果是药物性胃病,除了上述症状特征信息外,伴随症状特征信息有用药不当、用药过程中出现胃部症状等。再比如,食积胃病,除了上述症状特征信息外,伴随症状特征信息有:饮食过量、食用生冷食品等。
应当理解的是,之后系统会根据疾病特征信息以及对应症状特征信息之间的对应关系建立疾病特征信息与对应症状特征信息的关系表,将该特征词集合与关系表组合,主要组合方式就是简单的关联关系,通过特征词集合中的特征词可以从关系表中找到对应的特征词,作为疾病知识数据库。
进一步地,如图3所示,基于上述各实施例提出本发明基于主要症状与伴随症状词的疾病认知系统的第三实施例结构框图,在本实施例中,特征提取模块20还包括:
特征分词提取模块201,用于获取待识别临床症状特征信息,所述待识别临床症状特征信息包括:疾病文本描述以及对应的症状文本描述,利用TF-IDF从待识别临床症状特征信息中提取各个词条的出现频率数据,设定出现频率阈值,将各个词条的出现频率数据与出现频率阈值进行比较,将出现频率数据大于出现频率阈值的词条作为特征分词。
特征词提取模块202,用于设定常用词库,根据该常用词库对特征分词进行筛选,将筛选出的常用词从对应的特征分词中删除,保留剩余特征分词作为待识别疾病特征词。
应当理解的是,系统会获取待识别临床症状特征信息,所述待识别临床症状特征信息包括:疾病文本描述以及对应的症状文本描述,然后利用TF-IDF从待识别临床症状特征信息中提取各个词条的出现频率数据,设定出现频率阈值,将各个词条的出现频率数据与出现频率阈值进行比较,将出现频率数据大于出现频率阈值的词条作为特征分词。
应当理解的是,这一步则是通过利用TF-IDF选取特征项,采集患者待识别的临床症状特征信息,提取其症状特征信息向量集(或称第二对词,里面可能包含临床主症状与伴随症状特征信息向量集),建立待识别的临床症状特征信息向量集。TF-IDF的主要思想是:如果某个单词在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。词频(TF)表示词条(关键字)在文本中出现的频率。这个数字通常会被归一化(一般是词频除以文章总词数),以防止它偏向长的文件。
应当理解的是,由于本实施例中的文章以及词条数较少,获取的特征分词可能存在一定误差,所以,本实施例会设定常用词库,根据该常用词库对特征分词进行筛选,将筛选出的常用词从对应的特征分词中删除,保留剩余特征分词作为待识别疾病特征词,通过这种方式对特征分词进一步提取,得到精确的特征词用于后续计算,这样可以提高系统的精确度。
比如,一个短文本这样描述:常先有皮肤瘙痒,随即出现丘疹、风团,呈鲜红色或苍白色、皮肤色,少数患者有水肿性红斑。皮肤此起彼伏的大斑块,起的发生快,消退的快,会大块的像风疹块,此起彼伏的消退很快的这种皮疹,伴有剧烈的瘙痒。皮疹反复成批发生,以傍晚发作者多见。通过分词技术提取并去重后为特征信息向量集为:红斑、丘疹、风团,伴有剧烈的瘙痒;起的发生快、消退的快;反复成批发生;傍晚发作者多见等,这些则是特征分词,然后对这些特征分词进一步提取得到的特征词则是:红斑、丘疹、风团、剧烈的瘙痒、发生快、消退快、反复、成批发生、傍晚发作者多见。
进一步地,如图4所示,基于上述各实施例提出本发明基于主要症状与伴随症状词的疾病认知系统的第四实施例结构框图,在本实施例中,匹配模块30包括:
匹配计算模块301,用于设定匹配相似度阈值,将疾病特征词集合中的各特征词与待识别疾病特征词进行匹配计算,计算出对应的匹配相似度,将该匹配相似度与匹配相似度阈值进行比较,当该匹配相似度大于匹配相似度阈值时,对疾病特征词集合中的特征词进行标记,并通过该特征词从疾病知识数据库查询对应的症状特征信息。
应当理解的是,最后系统会利用关键词匹配方法,对所述第一对词里面的主要特征信息向量集(即主特征关键词集,因为临床主要症状特征信息往往代表了某一类疾病的主要特征信息)与待识别第二词对里面所有特征信息向量集(即特征关键词集)进行相似度匹配;此处为了方便比较,系统会设定匹配相似度阈值,通过这个相似度阈值来判断相似概率的大小,如果第二词对里面特征信息关键词与第一对词里面的主要特征信息向量集(即主特征关键词集)出现相似或者相似概率大,则归为该类别疾病,进行下一步认知;反之,不归为该类别疾病,中止下一步认知。
例如,皮肤病有很多类别:(1)以红斑、丘疹、风团为主的皮肤病;(2)以增生性丘疹、结节为主的皮肤病;(3)以非瘤性结节、斑块为主的皮肤病;(4)以丘疱疹、疱疹为主的皮肤病;(5)以脓疱为主的皮肤病等等。这里拿第一对词里面的主要特征信息向量集(即主特征关键词集)数据库待识别第二词对里面所有特征信息向量集(即特征关键词集)进行相似度匹配后,就可以发现:他们共同的主要特征信息:红斑、丘疹、风团等,那么,毫无疑问,该待识别特征信息归属于红斑、丘疹、风团为主的皮肤病类别。
应当理解的是,这里的文本描述中的分词或者短语识别和分词或者短语标记的主要方法为:将分词或者短语中的分词与疾病词词库中的分词或者短语进行匹配,若匹配成功则标记该分词或者短语为疾病分词或者短语,否则,标记该分词或者短语为描述分词或者短语;这里描述分词或者短语是指疾病症状描述分词或者短语;疾病词词库包含人体运动系统、消化系统、呼吸系统、泌尿系统、生殖系统、内分泌系统、免疫系统、神经系统、循环系统九大系统中各个类别以及各个疾病症状(或者征兆)分词或者短语。
进一步地,如图5所示,基于上述各实施例提出本发明基于主要症状与伴随症状词的疾病认知系统的第五实施例结构框图,在本实施例中,认知模块40包括:
计算认知模块401,用于建立Jaccard系数相似性算法,设定相似性阈值,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,将该相似性与相似性阈值进行比较,当相似性大于相似性阈值时,生成对应的认知报告。
应当理解的是,最后在明确判别上述类别疾病的基础上,利用Jaccard系数相似性定理,计算所述第一词对伴随症状特征信息向量集与待识别第二词伴随症状特征信息量集关系的相似性。如果相似,给出可能的疾病名称与知识,相反,亦然。比如,上述已经判断出待识别特征信息归属于红斑、丘疹、风团为主的皮肤病类别。那么,只要计算“剧烈的瘙痒;起的发生快、消退的快;反复成批发生;傍晚发作者多见”等伴随症状的相似性就可以了。这里,红斑、丘疹、风团为主的皮肤病有哪些具体的病呢?比如荨麻疹、接触性皮炎、药疹、多形红斑、环形红斑、多形性日光疹、系统性红斑狼疮、丹毒等。利用Jaccard系数相似性定理计算的结果为:该皮肤病为荨麻疹。那么,什么是荨麻疹?荨麻疹俗称风疹块。荨麻疹就是皮肤发生风团样的皮疹,所谓风团就是皮肤此起彼伏的大斑块,起的发生快,消退的快,会大块的像风疹块,此起彼伏的消退很快的这种皮疹,伴有剧烈的瘙痒,我们叫荨麻疹,它是因为皮肤过敏导致的。,然后系统设定相似性阈值,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,将该相似性与相似性阈值进行比较,当相似性大于相似性阈值时,生成对应的认知报告,过这种方式,能够更进一步提高认知诊断的精确度,提升用户体验,此处相似性阈值与上述的相似度阈值都由管理员自行进行设定。
应当理解的是,Jaccard系数是两个集合A和B交集元素的个数在A、B并集中所占的比例,称为这两个集合的杰卡德系数。Jaccard系数等于样本集交集个数和样本集并集个数的比值,用J(A,B)表示。给定两个集合A,B,均含有n个共同的属性,每个属性取值为0或1。具体讲:给定两个集合A,B,Jaccard系数定义为A与B交集的大小与A与B并集的大小的比值,J(A,B)∈[0,1],定义如下:
Figure BDA0002652791550000111
当集合A,B都为空时,J(A,B)定义为1。与Jaccard系数相关的指标叫做Jaccard距离,用于描述集合之间的不相似度。Jaccard距离越大,样本相似度越低。公式定义如下:
Figure BDA0002652791550000121
其中,对参差(symmetric difference):AΔB=|A∪B|-|A∩B|,比如:M11为集合A与B的属性值都是1的个数;M01为样本A的属性值是1,且样本B的属性值是0的个数;M10为样本A的属性值是0,且样本B的属性值是1的个数;M00为样本A与B的属性值都是0的个数。则有如下结论:
M11+M01+M10+M00=n,J=M11/(M01+M10+M00);
如果集合A,B均为空集,定义J(A,B)=1。显然0≤J(A,B)≤1。J值越大,两样本相似度越大。n维向量指样本的N维特征,组成一个集合。而集合是由元素组成的,在对应的特征位置,如果样本有该特征,这个位置集合值取1,表示包含该元素;否则,取0,表示不包含该元素。可见,元素=特征。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于主要症状与伴随症状词的疾病认知系统,包括:数据获取模块,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;特征提取模块,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;匹配模块,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;认知模块,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。本实施例通过关键词匹配方法与Jaccard系数相似性定理构建联合认知模型,通过联合认知模型精确对待识别疾病进行认知,提高系统的识别精确度,提升了用户体验。
此外,本发明实施例还提出一种基于主要症状与伴随症状词的疾病认知设备。如图6所示,该基于主要症状与伴随症状词的疾病认知设备包括:数据获取单元10、特征提取单元20、匹配单元30以及认知单元40。
数据获取单元10,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
特征提取单元20,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;
匹配单元30,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;
认知单元40,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于主要症状与伴随症状词的疾病认知系统,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于主要症状与伴随症状词的疾病认知系统,其特征在于,所述基于主要症状与伴随症状词的疾病认知系统包括:
数据获取模块,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
特征提取模块,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;
匹配模块,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;
认知模块,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。
2.如权利要求1所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:数据获取模块包括数据集建立模块,用于获取疾病特征信息以及对应的症状特征信息,所述疾病特征信息包括:疾病特征词,症状特征信息包括:主要症状特征词以及伴随症状特征词,根据疾病特征信息以及该症状特征信息建立不同的特征词集合,包括:疾病特征词集合、主要症状特征词集合以及伴随症状特征词集合。
3.如权利要求2所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:数据获取模块还包括数据库建立模块,用于根据疾病特征信息以及对应症状特征信息之间的对应关系建立疾病特征信息与对应症状特征信息的关系表,将该特征词集合与关系表组合,作为疾病知识数据库。
4.如权利要求3所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:特征提取模块包括特征分词提取模块,用于获取待识别临床症状特征信息,所述待识别临床症状特征信息包括:疾病文本描述以及对应的症状文本描述,利用TF-IDF从待识别临床症状特征信息中提取各个词条的出现频率数据,设定出现频率阈值,将各个词条的出现频率数据与出现频率阈值进行比较,将出现频率数据大于出现频率阈值的词条作为特征分词。
5.如权利要求4所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:特征提取模块包括特征词提取模块,用于设定常用词库,根据该常用词库对特征分词进行筛选,将筛选出的常用词从对应的特征分词中删除,保留剩余特征分词作为待识别疾病特征词。
6.如权利要求5所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:匹配模块包括匹配计算模块,用于设定匹配相似度阈值,将疾病特征词集合中的各特征词与待识别疾病特征词进行匹配计算,计算出对应的匹配相似度,将该匹配相似度与匹配相似度阈值进行比较,当该匹配相似度大于匹配相似度阈值时,对疾病特征词集合中的特征词进行标记,并通过该特征词从疾病知识数据库查询对应的症状特征信息。
7.如权利要求6所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:认知模块包括计算认知模块,用于建立Jaccard系数相似性算法,设定相似性阈值,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,将该相似性与相似性阈值进行比较,当相似性大于相似性阈值时,生成对应的认知报告。
8.一种基于主要症状与伴随症状词的疾病认知设备,其特征在于,所述基于主要症状与伴随症状词的疾病认知设备包括:
数据获取单元,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
特征提取单元,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词;
匹配单元,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息;
认知单元,用于建立Jaccard系数相似性算法,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,并生成对应认知报告。
CN202010876663.5A 2020-08-27 2020-08-27 一种基于主要症状与伴随症状词的疾病认知系统 Active CN111985246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010876663.5A CN111985246B (zh) 2020-08-27 2020-08-27 一种基于主要症状与伴随症状词的疾病认知系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010876663.5A CN111985246B (zh) 2020-08-27 2020-08-27 一种基于主要症状与伴随症状词的疾病认知系统

Publications (2)

Publication Number Publication Date
CN111985246A true CN111985246A (zh) 2020-11-24
CN111985246B CN111985246B (zh) 2023-08-15

Family

ID=73439884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010876663.5A Active CN111985246B (zh) 2020-08-27 2020-08-27 一种基于主要症状与伴随症状词的疾病认知系统

Country Status (1)

Country Link
CN (1) CN111985246B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112802597A (zh) * 2021-01-18 2021-05-14 吾征智能技术(北京)有限公司 一种新生儿黄疸的智能评估系统、设备、存储介质
CN112820409A (zh) * 2021-01-27 2021-05-18 五八到家有限公司 健康预测方法、设备及存储介质
CN113488183A (zh) * 2021-06-30 2021-10-08 南京云上数融技术有限公司 一种发热疾病多模态特征融合认知系统、设备、存储介质
CN113901989A (zh) * 2021-09-13 2022-01-07 吾征智能技术(北京)有限公司 一种基于尿液颜色的疾病认知系统
CN114334065A (zh) * 2022-03-07 2022-04-12 阿里巴巴达摩院(杭州)科技有限公司 病历处理方法、计算机可读存储介质及计算机设备
CN115831297A (zh) * 2022-12-16 2023-03-21 江苏研码科技有限公司 一种临床试验证和疾病数据匹配方法和装置
CN116013450A (zh) * 2021-10-20 2023-04-25 中移(成都)信息通信科技有限公司 病患的急诊级别确定方法、装置、设备和存储介质
CN118155836A (zh) * 2024-05-13 2024-06-07 中国中医科学院广安门医院 一种智能在线病症匹配系统

Citations (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040023861A1 (en) * 2000-02-10 2004-02-05 Cousens Diane Joan Cysteinyl leukotriene receptor 2 (cysl t2)
CN103020454A (zh) * 2012-12-15 2013-04-03 中国科学院深圳先进技术研究院 发病关键因素提取与疾病预警方法及系统
CN103226578A (zh) * 2013-04-02 2013-07-31 浙江大学 面向医学领域的网站识别和网页细分类的方法
CN104102816A (zh) * 2014-06-20 2014-10-15 周晋 基于症状匹配和机器学习的自动诊断系统和方法
US20150074112A1 (en) * 2012-05-14 2015-03-12 Huawei Technologies Co., Ltd. Multimedia Question Answering System and Method
US20160098519A1 (en) * 2014-06-11 2016-04-07 Jorge S. Zwir Systems and methods for scalable unsupervised multisource analysis
CN106096273A (zh) * 2016-06-08 2016-11-09 江苏华康信息技术有限公司 一种基于tf‑idf改进算法的疾病症状推导方法
CN106372439A (zh) * 2016-09-21 2017-02-01 北京大学 基于病例库的疾病症状及其权重知识的获取和处理方法
CN106557653A (zh) * 2016-11-15 2017-04-05 合肥工业大学 一种移动医疗智能导医系统及其方法
US20170132210A1 (en) * 2014-06-26 2017-05-11 Hcl Technologies Limited Method and system for providing semantics based technical support
CN106682220A (zh) * 2017-01-04 2017-05-17 华南理工大学 一种基于深度学习的在线中医文本命名实体识别方法
CN106874643A (zh) * 2016-12-27 2017-06-20 中国科学院自动化研究所 基于词向量自动构建知识库实现辅助诊疗的方法和系统
CN107145744A (zh) * 2017-05-08 2017-09-08 合肥工业大学 医学知识图谱的构建方法、装置及辅助诊断方法
JP2017201899A (ja) * 2016-05-09 2017-11-16 国立大学法人東北大学 コンフォメーション病薬スクリーニング用細胞の製造方法及びコンフォメーション病薬スクリーニング方法
CN107491655A (zh) * 2017-08-31 2017-12-19 康安健康管理咨询(常熟)有限公司 基于机器学习的肝脏疾病信息智能咨询方法及系统
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
KR101875306B1 (ko) * 2017-01-11 2018-07-05 전북대학교산학협력단 의료용어 클러스터를 이용한 질병정보제공시스템
WO2018120634A1 (zh) * 2016-12-30 2018-07-05 深圳前海弘稼科技有限公司 病虫害识别方法及装置
CN108305690A (zh) * 2018-02-07 2018-07-20 王博冉 神经系统疾病分诊方法及神经系统疾病的分诊系统
CN108417272A (zh) * 2018-02-08 2018-08-17 合肥工业大学 带时序约束的相似病例推荐方法及装置
CN108538395A (zh) * 2018-04-02 2018-09-14 上海市儿童医院 一种通用的医疗专病数据系统的构建方法
CN108733733A (zh) * 2017-04-21 2018-11-02 为朔生物医学有限公司 基于机器学习的生物医学文本分类方法、系统和存储介质
CN108877921A (zh) * 2017-05-12 2018-11-23 京东方科技集团股份有限公司 医疗智能分诊方法和医疗智能分诊系统
CN109243618A (zh) * 2018-09-12 2019-01-18 腾讯科技(深圳)有限公司 医学模型的构建方法、疾病标签构建方法及智能设备
CN109471945A (zh) * 2018-11-12 2019-03-15 中山大学 基于深度学习的医疗文本分类方法、装置及存储介质
CN109509551A (zh) * 2018-11-01 2019-03-22 新博卓畅技术(北京)有限公司 一种常见疾病智能诊断方法及系统
CN109545373A (zh) * 2018-11-08 2019-03-29 新博卓畅技术(北京)有限公司 一种人体疾病症状特征自动抽取方法、系统及设备
CN109686441A (zh) * 2018-12-21 2019-04-26 质直(上海)教育科技有限公司 一种大数据医疗数据特征提取和智能分析预测方法
CN109977422A (zh) * 2019-04-18 2019-07-05 中国石油大学(华东) 一种基于分词技术的病历关键信息提取模型
CN110019698A (zh) * 2017-09-04 2019-07-16 珠海健康云科技有限公司 一种医学问答的智能服务方法及系统
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
CN110489566A (zh) * 2019-08-22 2019-11-22 上海软中信息系统咨询有限公司 一种智能导诊服务机器人的导诊方法
WO2020052162A1 (zh) * 2018-09-10 2020-03-19 平安科技(深圳)有限公司 疾病数据映射方法、装置、计算机设备和存储介质
CN110931128A (zh) * 2019-12-05 2020-03-27 中国科学院自动化研究所 非结构化医疗文本无监督症状自动识别方法、系统、装置
CN111105852A (zh) * 2019-12-02 2020-05-05 上海联影智能医疗科技有限公司 一种电子病历推荐方法、装置、终端及存储介质
CN111341406A (zh) * 2020-02-17 2020-06-26 西安医疗指南者信息技术服务有限公司 肿瘤疾病的诊疗信息处理方法、装置、设备及存储介质
CN111415740A (zh) * 2020-02-12 2020-07-14 东北大学 问诊信息的处理方法、装置、存储介质及计算机设备
CN111540461A (zh) * 2020-04-22 2020-08-14 山东凯鑫宏业生物科技有限公司 一种具有问题理解的智能医疗系统及其诊断方法
CN111563891A (zh) * 2020-05-09 2020-08-21 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测系统

Patent Citations (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040023861A1 (en) * 2000-02-10 2004-02-05 Cousens Diane Joan Cysteinyl leukotriene receptor 2 (cysl t2)
US20150074112A1 (en) * 2012-05-14 2015-03-12 Huawei Technologies Co., Ltd. Multimedia Question Answering System and Method
CN103020454A (zh) * 2012-12-15 2013-04-03 中国科学院深圳先进技术研究院 发病关键因素提取与疾病预警方法及系统
CN103226578A (zh) * 2013-04-02 2013-07-31 浙江大学 面向医学领域的网站识别和网页细分类的方法
US20160098519A1 (en) * 2014-06-11 2016-04-07 Jorge S. Zwir Systems and methods for scalable unsupervised multisource analysis
CN104102816A (zh) * 2014-06-20 2014-10-15 周晋 基于症状匹配和机器学习的自动诊断系统和方法
US20170132210A1 (en) * 2014-06-26 2017-05-11 Hcl Technologies Limited Method and system for providing semantics based technical support
JP2017201899A (ja) * 2016-05-09 2017-11-16 国立大学法人東北大学 コンフォメーション病薬スクリーニング用細胞の製造方法及びコンフォメーション病薬スクリーニング方法
CN106096273A (zh) * 2016-06-08 2016-11-09 江苏华康信息技术有限公司 一种基于tf‑idf改进算法的疾病症状推导方法
CN106372439A (zh) * 2016-09-21 2017-02-01 北京大学 基于病例库的疾病症状及其权重知识的获取和处理方法
CN106557653A (zh) * 2016-11-15 2017-04-05 合肥工业大学 一种移动医疗智能导医系统及其方法
US20180137250A1 (en) * 2016-11-15 2018-05-17 Hefei University Of Technology Mobile health intelligent medical guide system and method thereof
CN106874643A (zh) * 2016-12-27 2017-06-20 中国科学院自动化研究所 基于词向量自动构建知识库实现辅助诊疗的方法和系统
WO2018120634A1 (zh) * 2016-12-30 2018-07-05 深圳前海弘稼科技有限公司 病虫害识别方法及装置
CN106682220A (zh) * 2017-01-04 2017-05-17 华南理工大学 一种基于深度学习的在线中医文本命名实体识别方法
KR101875306B1 (ko) * 2017-01-11 2018-07-05 전북대학교산학협력단 의료용어 클러스터를 이용한 질병정보제공시스템
CN108733733A (zh) * 2017-04-21 2018-11-02 为朔生物医学有限公司 基于机器学习的生物医学文本分类方法、系统和存储介质
CN107145744A (zh) * 2017-05-08 2017-09-08 合肥工业大学 医学知识图谱的构建方法、装置及辅助诊断方法
US20180322954A1 (en) * 2017-05-08 2018-11-08 Hefei University Of Technology Method and device for constructing medical knowledge graph and assistant diagnosis method
CN108877921A (zh) * 2017-05-12 2018-11-23 京东方科技集团股份有限公司 医疗智能分诊方法和医疗智能分诊系统
CN107491655A (zh) * 2017-08-31 2017-12-19 康安健康管理咨询(常熟)有限公司 基于机器学习的肝脏疾病信息智能咨询方法及系统
CN110019698A (zh) * 2017-09-04 2019-07-16 珠海健康云科技有限公司 一种医学问答的智能服务方法及系统
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
CN108305690A (zh) * 2018-02-07 2018-07-20 王博冉 神经系统疾病分诊方法及神经系统疾病的分诊系统
CN108417272A (zh) * 2018-02-08 2018-08-17 合肥工业大学 带时序约束的相似病例推荐方法及装置
CN108538395A (zh) * 2018-04-02 2018-09-14 上海市儿童医院 一种通用的医疗专病数据系统的构建方法
WO2020052162A1 (zh) * 2018-09-10 2020-03-19 平安科技(深圳)有限公司 疾病数据映射方法、装置、计算机设备和存储介质
CN109243618A (zh) * 2018-09-12 2019-01-18 腾讯科技(深圳)有限公司 医学模型的构建方法、疾病标签构建方法及智能设备
CN109509551A (zh) * 2018-11-01 2019-03-22 新博卓畅技术(北京)有限公司 一种常见疾病智能诊断方法及系统
CN109545373A (zh) * 2018-11-08 2019-03-29 新博卓畅技术(北京)有限公司 一种人体疾病症状特征自动抽取方法、系统及设备
CN109471945A (zh) * 2018-11-12 2019-03-15 中山大学 基于深度学习的医疗文本分类方法、装置及存储介质
CN109686441A (zh) * 2018-12-21 2019-04-26 质直(上海)教育科技有限公司 一种大数据医疗数据特征提取和智能分析预测方法
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
CN109977422A (zh) * 2019-04-18 2019-07-05 中国石油大学(华东) 一种基于分词技术的病历关键信息提取模型
CN110489566A (zh) * 2019-08-22 2019-11-22 上海软中信息系统咨询有限公司 一种智能导诊服务机器人的导诊方法
CN111105852A (zh) * 2019-12-02 2020-05-05 上海联影智能医疗科技有限公司 一种电子病历推荐方法、装置、终端及存储介质
CN110931128A (zh) * 2019-12-05 2020-03-27 中国科学院自动化研究所 非结构化医疗文本无监督症状自动识别方法、系统、装置
CN111415740A (zh) * 2020-02-12 2020-07-14 东北大学 问诊信息的处理方法、装置、存储介质及计算机设备
CN111341406A (zh) * 2020-02-17 2020-06-26 西安医疗指南者信息技术服务有限公司 肿瘤疾病的诊疗信息处理方法、装置、设备及存储介质
CN111540461A (zh) * 2020-04-22 2020-08-14 山东凯鑫宏业生物科技有限公司 一种具有问题理解的智能医疗系统及其诊断方法
CN111563891A (zh) * 2020-05-09 2020-08-21 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112802597A (zh) * 2021-01-18 2021-05-14 吾征智能技术(北京)有限公司 一种新生儿黄疸的智能评估系统、设备、存储介质
CN112802597B (zh) * 2021-01-18 2023-11-21 吾征智能技术(北京)有限公司 一种新生儿黄疸的智能评估系统、设备、存储介质
CN112820409A (zh) * 2021-01-27 2021-05-18 五八到家有限公司 健康预测方法、设备及存储介质
CN113488183A (zh) * 2021-06-30 2021-10-08 南京云上数融技术有限公司 一种发热疾病多模态特征融合认知系统、设备、存储介质
CN113488183B (zh) * 2021-06-30 2023-10-31 吾征智能技术(北京)有限公司 一种发热疾病多模态特征融合认知系统、设备、存储介质
CN113901989A (zh) * 2021-09-13 2022-01-07 吾征智能技术(北京)有限公司 一种基于尿液颜色的疾病认知系统
CN116013450A (zh) * 2021-10-20 2023-04-25 中移(成都)信息通信科技有限公司 病患的急诊级别确定方法、装置、设备和存储介质
CN114334065A (zh) * 2022-03-07 2022-04-12 阿里巴巴达摩院(杭州)科技有限公司 病历处理方法、计算机可读存储介质及计算机设备
CN115831297A (zh) * 2022-12-16 2023-03-21 江苏研码科技有限公司 一种临床试验证和疾病数据匹配方法和装置
CN118155836A (zh) * 2024-05-13 2024-06-07 中国中医科学院广安门医院 一种智能在线病症匹配系统

Also Published As

Publication number Publication date
CN111985246B (zh) 2023-08-15

Similar Documents

Publication Publication Date Title
CN111985246A (zh) 一种基于主要症状与伴随症状词的疾病认知系统
Nandipati et al. Polycystic Ovarian Syndrome (PCOS) classification and feature selection by machine learning techniques
CN109299239B (zh) 一种基于es的电子病历检索方法
Hdaib et al. Detection of polycystic ovary syndrome (PCOS) using machine learning algorithms
CN107993724B (zh) 一种医学智能问答数据处理的方法及装置
CN106557653B (zh) 一种移动医疗智能导医系统及其方法
CN110085307A (zh) 一种基于多源知识图谱融合的智能导诊方法和系统
Güvenir et al. Estimating the chance of success in IVF treatment using a ranking algorithm
WO2021104323A1 (zh) 用于确定文本相似度的方法、获取语义答案文本的方法及问答方法
CN114093507B (zh) 边缘计算网络中基于对比学习的皮肤病智能分类方法
CN111563891B (zh) 基于颜色认知的疾病预测系统
CN107403068A (zh) 融合临床思维的智能辅助问诊方法及系统
CN113688255A (zh) 一种基于中文电子病历的知识图谱构建方法
CN113488157B (zh) 智能导诊处理方法、装置、电子设备及存储介质
CN108304552B (zh) 一种基于知识库特征抽取的命名实体链接方法
CN110335684A (zh) 基于主题模型技术的中医智能辨证辅助决策方法
CN107887025A (zh) 一种医疗大脑系统
CN115732078A (zh) 基于多变量决策树模型的疼痛疾病判别与分类方法和装置
Yiğit et al. Comparison of machine learning classification techniques to predict implantation success in an IVF treatment cycle
WO2022083011A1 (zh) 基于聚类等级关系自动识别方法、系统、设备及存储介质
CN111063434A (zh) 一种基于临床症状特征的性病诊断系统
Ozhan et al. Machine learning approach for classification of prostate cancer based on clinical biomarkers
Sagala A comparative study of data mining methods to diagnose cervical cancer
CN112002415A (zh) 一种基于人体粪便智能认知疾病系统
CN114171185A (zh) 乳腺癌化疗期中医辨证分型判别模型、系统及其构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 1101, 11th Floor, Building B4, Future Science and Technology City, No. 999 Gaoxin Avenue, Donghu New Technology Development Zone, Wuhan City, Hubei Province, 430000

Patentee after: Wuhan Donghu Big Data Technology Co.,Ltd.

Country or region after: China

Address before: 430000 Room 2101, F3 Building, Phase I, Longshan Innovation Park, 999 High-tech Avenue, Donghu New Technology Development Zone, Wuhan City, Hubei Province

Patentee before: WUHAN DONGHU BIG DATA TRADING CENTER Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address