[go: up one dir, main page]

CN114981803B - 一种体检信息分配方法及装置 - Google Patents

一种体检信息分配方法及装置 Download PDF

Info

Publication number
CN114981803B
CN114981803B CN202080003671.7A CN202080003671A CN114981803B CN 114981803 B CN114981803 B CN 114981803B CN 202080003671 A CN202080003671 A CN 202080003671A CN 114981803 B CN114981803 B CN 114981803B
Authority
CN
China
Prior art keywords
information
physical examination
sample
model
examination information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080003671.7A
Other languages
English (en)
Other versions
CN114981803A (zh
Inventor
张振中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd filed Critical BOE Technology Group Co Ltd
Publication of CN114981803A publication Critical patent/CN114981803A/zh
Application granted granted Critical
Publication of CN114981803B publication Critical patent/CN114981803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Complex Calculations (AREA)

Abstract

本申请提供了一种体检信息分配方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,首先获取体检信息以及多个分配对象的信息;然后将体检信息与分配对象的信息输入预先训练得到的信息匹配模型,获得体检信息与分配对象之间的匹配度;之后再根据体检信息与各个分配对象之间的匹配度,从多个分配对象中确定目标分配对象,并将体检信息分配给目标分配对象。通过信息匹配模型计算体检信息与分配对象之间的匹配度,能够从专业匹配和工作量匹配两方面综合考量分配对象与体检信息之间的匹配度,确保将体检信息分配给专业匹配的分配对象的同时,还能够兼顾各分配对象的工作量,使各分配对象之间的工作量均衡。

Description

一种体检信息分配方法及装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种体检信息分配方法、装置、电子设备、计算机可读存储介质以及计算机程序产品。
背景技术
用户完成一系列体检项目(如内科检查、外科检查、心电图等)后,体检信息中除了各个体检项目有检查结果(如心电图:正常窦性心律)外,还会有总检结论和健康建议等。总检结论和健康建议是由总检医生依据体检信息中各项检查结果做出的健康评估和建议。在实际应用中,只有将体检信息分配给合适的总检医生才能确保健康评估和建议的准确性。
因此,如何匹配体检信息和总检医生是本领域工作人员需要解决的技术问题。
发明内容
本申请提供一种体检信息分配方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,以匹配体检信息与分配对象。本申请的技术方案如下:
根据本申请的第一方面,提供一种体检信息分配方法,所述方法包括:
获取体检信息以及多个分配对象的信息,所述体检信息包括异常体检信息以及所述体检信息的工作量信息,所述分配对象的信息包括所述分配对象的特长信息和工作量信息;
将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度,所述信息匹配模型用于根据所述异常体检信息、所述体检信息的工作量信息以及所述分配对象的特长信息和工作量信息,计算所述体检信息与所述分配对象之间的匹配度;
根据所述体检信息与各个所述分配对象之间的匹配度,从所述多个分配对象中确定目标分配对象,并将所述体检信息分配给所述目标分配对象。
在一种可选的实现方式中,所述信息匹配模型包括语义向量模型和向量匹配模型,所述将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度的步骤,包括:
将所述体检信息与所述分配对象的信息输入所述语义向量模型,输出第一向量;
将所述第一向量输入所述向量匹配模型,输出所述体检信息与所述分配对象之间的匹配度。
在一种可选的实现方式中,所述将所述体检信息与所述分配对象的信息输入所述语义向量模型,输出第一向量的步骤,包括:
将所述体检信息与所述分配对象的信息进行拼接,得到拼接信息,所述拼接信息的头部采用标记符号[CLS],在所述体检信息与所述分配对象的信息之间采用分隔符号[SEP]连接;
将所述拼接信息输入所述语义向量模型,输出所述第一向量。
在一种可选的实现方式中,所述将所述第一向量输入所述向量匹配模型,输出所述体检信息与所述分配对象之间的匹配度的步骤,包括:
所述向量匹配模型按照以下公式计算所述体检信息与所述分配对象之间的匹配度:
其中,所述score表示所述体检信息与所述分配对象之间的匹配度,所述V[cls]表示所述第一向量,所述W1表示所述向量匹配模型的第一映射矩阵,所述表示所述向量匹配模型的第二映射矩阵W2的转置,所述b1表示所述向量匹配模型的偏置矩阵,所述σ表示所述向量匹配模型的激活函数。
在一种可选的实现方式中,所述语义向量模型包括BERT模型。
在一种可选的实现方式中,所述向量匹配模型包括全连接层网络模型。
在一种可选的实现方式中,在将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度的步骤之前,还包括:
获取多个训练样本对,各所述训练样本为第一样本对或第二样本对,所述第一样本对包括样本体检信息与第一样本分配对象的信息,所述第二样本对包括所述样本体检信息与第二样本分配对象的信息,其中,所述第一样本对的匹配度大于所述第二样本对的匹配度,所述样本体检信息包括异常样本体检信息,样本分配对象的信息包括所述样本分配对象的特长信息,所述样本分配对象为所述第一样本分配对象或所述第二样本分配对象;
将所述训练样本对输入待训练模型,得到所述训练样本对的匹配度;
根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型。
在一种可选的实现方式中,所述根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型的步骤,包括:
以所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值大于第一预设阈值,且各所述样本分配对象的第一参量相等为目标,对所述待训练模型进行训练,其中,所述第一预设阈值大于零,所述第一参量用于表征各所述样本分配对象的工作量,所述第一参量由所述样本体检信息的工作量信息确定。
在一种可选的实现方式中,所述以所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值大于第一预设阈值,且各所述样本分配对象的第一参量相等为目标,对所述待训练模型进行训练的步骤,包括:
计算所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值,并根据所述差值以及所述第一预设阈值,确定第一损失部分;
根据多个所述样本体检信息的第二参量、多个所述样本分配对象的第三参量以及各所述样本分配对象的第一参量,确定第二损失部分,其中,所述第二参量用于表征多个所述样本体检信息的工作量,所述第三参量为多个所述样本分配对象的数量;
将所述第一损失部分与所述第二损失部分进行加权求和,得到损失函数;
以最小化所述损失函数为目标,对所述待训练模型进行训练。
在一种可选的实现方式中,按照以下公式确定所述第一损失部分:
其中,所述L1表示所述第一损失部分,所述uj表示所述样本体检信息,所述dij表示所述第一样本分配对象的信息,所述dil表示所述第二样本分配对象的信息,所述(uj,dij)表示所述第一样本对,所述(uj,dil)表示所述第二样本对,所述score(uj,dil)表示所述第二样本对的匹配度,所述score(uj,dij)表示所述第一样本对的匹配度,所述γ表示所述第一预设阈值;
按照以下公式确定所述第二损失部分:
其中,所述L2表示所述第二损失部分,所述N表示所述第二参量,所述M表示所述第三参量,所述hi表示所述样本分配对象i的第一参量;
按照以下公式确定所述损失函数:
L=L1+βL2,其中,所述L表示所述损失函数,所述β表示调和参数。
在一种可选的实现方式中,当所述信息匹配模型包括语义向量模型和向量匹配模型时,所述待训练模型包括第一待训练模型和第二待训练模型,所述将所述训练样本对输入待训练模型,得到所述训练样本对的匹配度的步骤,包括:
将所述训练样本对输入所述第一待训练模型,得到所述训练样本对的向量;
将所述训练样本对的向量输入所述第二待训练模型,得到所述训练样本对的匹配度;
所述根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型的步骤,包括:
根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述第一待训练模型和所述第二待训练模型进行训练,将训练后的第一待训练模型确定为所述语义向量模型,将训练后的第二待训练模型确定为所述向量匹配模型。
在一种可选的实现方式中,所述体检信息与所述目标分配对象之间的匹配度大于或等于第二预设阈值;或者,
所述体检信息与所述目标分配对象之间的匹配度大于所述体检信息与其它分配对象之间的匹配度,所述其它分配对象为所述多个分配对象中除所述目标分配对象之外的分配对象。
根据本申请的第二方面,提供一种体检信息分配装置,所述装置包括:
信息获取模块,被配置为获取体检信息以及多个分配对象的信息,所述体检信息包括异常体检信息以及所述体检信息的工作量信息,所述分配对象的信息包括所述分配对象的特长信息和工作量信息;
信息处理模块,被配置为将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度,所述信息匹配模型用于根据所述异常体检信息、所述体检信息的工作量信息以及所述分配对象的特长信息和工作量信息,计算所述体检信息与所述分配对象之间的匹配度;
信息分配模块,被配置为根据所述体检信息与各个所述分配对象之间的匹配度,从所述多个分配对象中确定目标分配对象,并将所述体检信息分配给所述目标分配对象。
根据本申请的第三方面,提供一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的体检信息分配方法。
根据本申请的第四方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的体检信息分配方法。
根据本申请的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的体检信息分配方法。
现有技术相比,本申请包括以下优点:
本申请技术方案提供了一种体检信息分配方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,其中,体检信息分配方法包括:首先获取体检信息以及多个分配对象的信息;然后将体检信息与分配对象的信息输入预先训练得到的信息匹配模型,获得体检信息与分配对象之间的匹配度,所述信息匹配模型用于根据异常体检信息、体检信息的工作量信息以及分配对象的特长信息和工作量信息,计算体检信息与分配对象之间的匹配度;之后再根据体检信息与各个分配对象之间的匹配度,从多个分配对象中确定目标分配对象,并将体检信息分配给目标分配对象。本申请技术方案,通过信息匹配模型计算体检信息与分配对象之间的匹配度,能够从专业匹配和工作量匹配两方面综合考量分配对象与体检信息之间的匹配度,确保将体检信息分配给专业匹配的分配对象的同时,还能够兼顾各分配对象的工作量,使各分配对象之间的工作量均衡,从而实现体检信息与分配对象之间的匹配。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种体检信息分配方法的流程图。
图2是根据一示例性实施例示出的一种匹配度计算的流程图。
图3是根据一示例性实施例示出的一种语义向量模型处理信息的示意图。
图4是根据一示例性实施例示出的一种向量匹配模型处理信息的示意图。
图5是根据一示例性实施例示出的一种模型获得方式的流程图。
图6是根据一示例性实施例示出的一种模型训练方式的流程图。
图7是根据一示例性实施例示出的一种体检信息分配装置的结构框图。
图8是根据一示例性实施例示出的一种电子设备的框图。
图9是根据一示例性实施例示出的另一种电子设备的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
假设体检中心有N份体检信息,M个总检医生,依次给每个总检医生派发一份体检信息,当总检医生完成健康评估和建议后,系统会从剩余的体检信息中顺序地给该医生派发一份体检信息。假设总共有两个总检医生A和B,A擅长内科,B擅长外科。体检信息u中内科检查结果有异常,外科检查结果正常,直观上应该把体检信息u派发给总检医生A,如果将此体检信息u派发给总检医生B,出现体检信息与分配的总检医生不匹配的问题。
另外,在总检医生完成后顺序派发,在体检报告总量一定的情况下,效率高的总检医生工作量会很大。例如假设总检医生A的效率是总检医生B的2倍,则总检医生A会完成2N/3的报告,总检医生B会完成N/3的报告,总检医生A的工作量是总检医生B工作量的两倍。
为了能够精确匹配体检信息和分配对象,图1是根据一示例性实施例示出的一种体检信息分配方法的流程图,如图1所示,该方法可以包括以下步骤。
步骤S11:获取体检信息以及多个分配对象的信息,体检信息包括异常体检信息以及体检信息的工作量信息,分配对象的信息包括分配对象的特长信息和工作量信息。
本实施例的执行主体可以为电子设备,例如服务器等,也可以为用户终端设备,例如手机、电脑等。
其中,体检信息例如可以为已完成单项检查结果但需要给出总检结果的体检报告。体检信息可以包含一系列体检项目(如一般检查、内科检查、心电图、头颅CT等)的检查结果(如心电图项目的检查结果包括:窦性心律等)。
本实施例中,体检信息可以包括异常体检信息,异常体检信息可以包括有异常的检查结果或者有异常的体检项目等,本实施例对异常体检信息的具体内容不作限定。体检信息还可以包括该体检信息的工作量信息,体检信息的工作量信息例如可以由有异常的检查结果的字数来确定等等,本实施例对此不作限定。
分配对象例如可以为总检医生。分配对象的信息可以包括分配对象的特长信息,特长信息可以包括总检医生的毕业院校专业、工作年限、擅长的检查项目等描述介绍,本实施例对特长信息的具体内容不作限定。例如特长信息可以为A医生,毕业于**,…,工作**年,…,擅长内科…。分配对象的信息还可以包括分配对象的工作量信息,工作量信息可以由总检医生已处理的体检报告数量来确定,如A医生已处理M份体检报告,B医生已处理N份体检报告,等等。
体检信息例如可以从各个单项检查设备处获取,例如,各个单项检查设备的检查结果由各分检医生给出或者设备自动分析给出。例如,分配对象的信息可以预先录入并存储,例如,可以通过用户交互界面供各医生录入。
步骤S12:将体检信息与分配对象的信息输入预先训练得到的信息匹配模型,获得体检信息与分配对象之间的匹配度,信息匹配模型用于根据异常体检信息、体检信息的工作量信息以及分配对象的特长信息和工作量信息,计算体检信息与分配对象之间的匹配度。
具体地,信息匹配模型可以根据体检信息的异常体检信息和分配对象的特长信息,计算体检信息与分配对象之间的专业匹配度,同时还可以根据体检信息的工作量信息和分配对象的工作量信息,计算体检信息与分配对象之间的工作量匹配度。也就是,步骤S12计算得到的体检信息与分配对象之间的匹配度包含了体检信息与分配对象之间的专业匹配度和工作量匹配度。
当体检信息为体检报告,分配对象为总检医生时,体检信息和分配对象的专业匹配指的是体检信息中的检查结果是否由擅长该项检查结果的总检医生进行解读和处理。例如体检信息u中的内科检查结果有异常,则内科医生A比外科医生B在专业方面更适合处理该体检报告,即总检医生A与体检报告u的专业匹配度更高。
体检信息和分配对象的工作量匹配指的是通过体检信息的分配能够使多个分配对象之间的工作量均衡。
本实施例中,信息匹配模型可以预先根据样本体检信息、第一样本分配对象和第二样本分配对象进行迭代训练得到,其中第一样本分配对象与样本体检信息的专业匹配度大于第二样本分配对象与样本体检信息的专业匹配度。具体地,在训练过程中,可以计算第一样本分配对象与样本体检信息之间的第一匹配度,以及第二样本分配对象与样本体检信息之间的第二匹配度,并且以第一匹配度与第二匹配度之间的差值大于第一预设阈值且第一样本分配对象与第二样本分配对象之间的工作量均衡为目标,训练得到信息匹配模型。后续实施例会对信息匹配模型的具体训练过程进行详细介绍。
采用信息匹配模型能够从专业匹配和工作量匹配两方面综合考量分配对象与体检信息之间的匹配度,确保将体检信息分配给专业匹配的分配对象的同时,还能够兼顾各分配对象的工作量,使各分配对象之间的工作量均衡。
步骤S13:根据体检信息与各个分配对象之间的匹配度,从多个分配对象中确定目标分配对象,并将体检信息分配给目标分配对象。
在具体实现中,可以采用步骤S12计算出的体检信息与各个分配对象之间的匹配度。假设有M个分配对象,则可以得到M个分配对象分别与体检信息u之间的匹配度score,进而可以根据体检信息与各个分配对象之间的匹配度确定目标分配对象,并将体检信息派发给目标分配对象。
在本公开的一些实施例中对,各步骤的执行顺序不作限定,具体可以根据实际需要进行调整。
本实施例中,从多个分配对象中确定目标分配对象的实现方式有多种。
在一种实现方式中,体检信息与目标分配对象之间的匹配度可以大于或等于第二预设阈值。第二预设阈值的具体数值可以根据实际需求确定,本实施例不作限定。
在另一种实现方式中,体检信息与目标分配对象之间的匹配度可以大于体检信息与其它分配对象之间的匹配度。其它分配对象为多个分配对象中除目标分配对象之外的分配对象。本实现方式中,将匹配度最大的分配对象确定为目标分配对象。
给定体检信息u,多个分配对象的信息集合{d1,d2,…,dN},函数f(u,di)∈R+(R+表示正实数)的值可以用来衡量体检信息u与分配对象的信息di之间的匹配度,函数值越大表明体检信息u与分配对象越匹配。在实际应用中,将体检报告u分配给目标分配对象,其中,目标分配对象的信息可以表示为即目标分配对象可以为多个分配对象中与体检报告匹配度最高的分配对象。本实施例中,函数f(u,di)表示预先训练得到的信息匹配模型。
本实施例提供的体检信息分配方法,首先获取体检信息以及多个分配对象的信息;然后将体检信息与分配对象的信息输入预先训练得到的信息匹配模型,获得体检信息与分配对象之间的匹配度;之后再根据体检信息与各个分配对象之间的匹配度,从多个分配对象中确定目标分配对象,并将体检信息分配给目标分配对象。本实施例中,通过信息匹配模型计算体检信息与分配对象之间的匹配度,能够从专业匹配和工作量匹配两方面综合考量分配对象与体检信息之间的匹配度,确保将体检信息分配给专业匹配的分配对象的同时,还能够兼顾各分配对象的工作量,使各分配对象之间的工作量均衡,从而实现体检信息与分配对象之间的匹配。
在一种可选的实现方式中,信息匹配模型包括语义向量模型和向量匹配模型,参照图2,步骤S12具体可以包括:
步骤S21:将体检信息与分配对象的信息输入语义向量模型,输出第一向量。
步骤S22:将第一向量输入向量匹配模型,输出体检信息与分配对象之间的匹配度。
其中,语义向量模型用于将体检信息和分配对象的信息映射到同一向量空间中;向量匹配模型用于在该向量空间中计算体检信息和分配对象之间的匹配度。
体检信息和分配对象的信息从词形上看差异很大,但语义相关。因此可以将它们映射到语义向量空间中,在语义向量空间中语义相关的内容位置相近,因此,可以语义向量空间中衡量体检信息和分配对象的信息之间的匹配度。
本步骤通过预先训练得到的语义向量模型将体检信息和分配对象的信息映射到同一向量空间中,进而在该向量空间中进一步计算体检信息与分配对象之间的匹配度。
语义向量模型可以为BERT模型、RNN模型或LSTM等语言模型。由于BERT模型是真正意义上的双向语言模型,每个词可以同时利用该词的上下文信息,因此语义向量模型采用BERT模型可以获得更准确的语义向量,进一步提高匹配精确度。
本实施例中,语义向量模型采用BERT模型训练得到。在一种可选的实现方式中,可以首先将体检信息与分配对象的信息进行拼接,得到拼接信息,拼接信息的头部采用标记符号[CLS],在体检信息与分配对象的信息之间采用分隔符号[SEP]连接;然后再将拼接信息输入语义向量模型,输出第一向量。
在具体实现中,可以首先采用word embedding等技术将文本形式的体检信息和分配对象的信息转换得到字向量。参照图3,“字i”表示对应文本(体检信息或分配对象的信息)中的第i个字,通过word embedding等方式将每个字对应的文本“字i”转化为向量Ei或Ei’。其中,Ei为体检信息的字向量,Ei’为分配对象的信息的字向量。然后,可以将Ei和Ei’作为初始化向量,采用标记符号[CLS]和分隔符号[SEP]对字向量形式的体检信息与分配对象的信息进行拼接,得到拼接信息。具体地,可以在拼接信息的头部加入标记符号[CLS],在体检信息u和分配对象的信息d之间加入分隔符号[SEP]。之后,可以将该拼接信息作为一个整体输入语义向量模型如BERT模型中,得到第一向量。
其中,标记符号[CLS]作为拼接信息的头部,表示该符号对应的输出向量V[cls]可以作为拼接信息的语义表示或语义向量。通过标记符号[CLS]可以更“公平”地融合拼接信息中各个字或词的语义信息。分隔符号[SEP]用于将拼接信息中的体检信息与分配对象的信息进行区分。
如图3所示,第一向量V[cls]为语义向量模型的输出结果,第一向量V[cls]包含了体检信息u和分配对象的信息d。在一些实施例中,第一向量V[cls]表示输入的体检信息和分配对象信息对应的向量。当语义向量模型采用的是BERT模型时,V[cls]的维度为768维。本实施例中,采用的BERT模型默认的向量维度为768维,当然,BERT模型中的向量也可以是其它维度,本实施例对此不作限定。图3中的Vi或Vi’表示“字i”经过语义向量模型处理后输出的向量。
在具体实现中,可以将体检信息与每一个分配对象的信息构成的信息对输入预先训练得到的语义向量模型,获得与输入的体检信息和分配对象的信息对应的第一向量。这样通过语义向量模型就可以将体检信息和各个分配对象的信息映射到同一个向量空间。
在一种可选的实现方式中,向量匹配模型可以采用全连接层网络模型。需要说明的是,向量匹配模型并不仅限于全连接层网络模型,凡是能够将输入向量变换为标量的任意网络模型均可。
在一种可选的实现方式中,向量匹配模型可以按照以下公式计算体检信息与分配对象之间的匹配度:
其中,score表示体检信息与分配对象之间的匹配度,V[cls]表示第一向量,W1表示向量匹配模型的第一映射矩阵,表示向量匹配模型的第二映射矩阵W2的转置,b1表示向量匹配模型的偏置矩阵,σ表示向量匹配模型的激活函数。
如图4所示,可以将第一向量V[cls]输入到向量匹配模型,输出体检信息与分配对象之间的匹配度score。图4中的xi表示第一向量V[cls]中第i个维度的值。当语义向量模型采用BERT模型时,W1可以为384*768的矩阵,W2和b1可以为384*1的矩阵。
语义向量模型的参数以及向量匹配模型中矩阵W1,W2和b1等参数,可以通过联合训练获得。其中,语义向量模型的参数可以使用预训练模型中的参数作为初始值,向量匹配模型中的矩阵W1,W2以及b1可以通过随机初始化获取初始值。例如,使用大量数据对模型进行预训练,得到预训练模型中的各个参数,再在具体任务上对参数进行细致调整。语义向量模型和向量匹配模型的具体训练过程在后续实施例中会详细描述。
本实施例中,通过语义向量模型将体检信息和分配对象的信息映射到同一向量空间中,在该向量空间中计算体检信息与各分配对象之间的匹配度,进而根据匹配度将体检信息分配给合适的分配对象。
为了获得信息匹配模型,在一种可选的实现方式中,参照图5,在步骤S12之前,本申请实施例提供的体检信息分配方法还可以包括以下步骤。
步骤S51:获取多个训练样本对,各训练样本为第一样本对或第二样本对,第一样本对包括样本体检信息与第一样本分配对象的信息,第二样本对包括样本体检信息与第二样本分配对象的信息,其中,第一样本对的匹配度大于第二样本对的匹配度,样本体检信息包括异常样本体检信息,样本分配对象的信息包括样本分配对象的特长信息,样本分配对象为第一样本分配对象或第二样本分配对象。
样本体检信息例如可以为已完成单项检查结果但需要给出总检结果的样本体检报告。样本体检信息可以包含一系列体检项目(如一般检查、内科检查、心电图、头颅CT等)的检查结果(如心电图项目的检查结果包括:窦性心律等)。
本实施例中,样本体检信息可以包括异常样本体检信息,异常样本体检信息可以包括有异常的检查结果或者有异常的体检项目等,本实施例对异常样本体检信息的具体内容不作限定。
样本分配对象例如可以为总检医生。样本分配对象的信息可以包括样本分配对象的特长信息,特长信息可以包括总检医生的毕业院校专业、工作年限、擅长的检查项目等描述介绍,本实施例对特长信息的具体内容不作限定。例如特长信息可以为A医生,毕业于**,…,工作**年,…,擅长内科…。
本实施例中,第一样本分配对象可以为与样本体检信息专业匹配的样本分配对象,即第一样本分配对象的特长信息与样本体检信息中的异常样本体检信息匹配。第二样本分配对象可以为与样本体检信息专业不匹配的样本分配对象,即第二样本分配对象的特长信息与样本体检信息中的异常样本体检信息不匹配。在获取训练样本对的过程中,例如可以根据样本体检信息和样本分配对象的信息人为指定第一样本分配对象和第二样本分配对象。例如,如果第一样本分配对象的专业匹配度大于第二样本分配对象的专业匹配度的,则可认为第一样本分配对象为与样本体检信息专业匹配的样本分配对象,第二样本分配对象为与样本体检信息专业不匹配的样本分配对象。
第一样本对(uj,dij),包括样本体检信息uj和第一样本分配对象的信息dij(其中下标ij∈[1,M],M为样本分配对象的总数量);第二样本对(uj,dil),包括样本体检信息uj和第二样本分配对象的信息dil(其中下标il∈[1,M]且ij≠il)。其中,第一样本对(uj,dij)的匹配度可以大于第二样本对(uj,dil)的匹配度,即样本体检信息与第一样本分配对象的专业更匹配。
步骤S52:将训练样本对输入待训练模型,得到训练样本对的匹配度。
步骤S53:根据第一样本对的匹配度、第二样本对的匹配度、样本体检信息的工作量信息以及各样本分配对象的工作量信息,对待训练模型进行训练,将训练后的待训练模型确定为信息匹配模型。
其中,样本体检信息的工作量信息例如可以由样本体检信息所包含的样本体检报告的份数来确定,还可以由有异常的检查结果的字数来确定等等,本实施例对此不作限定。
样本分配对象的工作量信息可以由与样本分配对象专业匹配的样本体检信息的工作量确定,例如可以为与样本分配对象专业匹配的样本体检信息的数量。
在一种可选的实现方式中,当信息匹配模型包括语义向量模型和向量匹配模型时,待训练模型包括第一待训练模型和第二待训练模型,步骤S52具体可以包括:首先将训练样本对输入第一待训练模型,得到训练样本对的向量;然后将训练样本对的向量输入第二待训练模型,得到训练样本对的匹配度,步骤S53具体可以包括:根据第一样本对的匹配度、第二样本对的匹配度、样本体检信息的工作量信息以及各样本分配对象的工作量信息,对第一待训练模型和第二待训练模型进行训练,将训练后的第一待训练模型确定为语义向量模型,将训练后的第二待训练模型确定为向量匹配模型。
其中,第一待训练模型可以为BERT模型、RNN模型或LSTM等语言模型。由于BERT模型是真正意义上的双向语言模型,每个词可以同时利用该词的上下文信息,因此第一待训练模型采用BERT模型可以获得更准确的语义向量,进一步提高匹配精确度。
第二待训练模型可以采用全连接层网络模型。需要说明的是,第二待训练模型并不仅限于全连接层网络模型,凡是能够将输入向量变换为标量的任意网络模型均可。
在具体实现中,可以将训练样本对输入第一待训练模型中,获得与输入的训练样本对对应的向量,然后将训练样本对的向量输入第二待训练模型,获得与输入的训练样本对对应的匹配度。这样,就可以获得所有训练样本对的匹配度,包括第一样本对(uj,dij)的匹配度score(uj,dij)以及第二样本对(uj,dil)的匹配度score(uj,dil)。之后,可以根据第一样本对的匹配度、第二样本对的匹配度、样本体检信息的工作量信息以及各样本分配对象的工作量信息,对第一待训练模型和第二待训练模型或者对待训练模型进行训练。
在一种可选的实现方式中,在步骤S53中,可以以第一样本对的匹配度score(uj,dij)与第二样本对的匹配度score(uj,dil)之间的差值大于第一预设阈值γ,且各样本分配对象的第一参量相等为目标,对待训练模型进行训练,其中,第一预设阈值大于零,样本分配对象为第一样本分配对象或第二样本分配对象,第一参量用于表征各样本分配对象的工作量,第一参量由样本体检信息的工作量信息确定。例如,第一参量可以为与样本分配对象专业匹配的样本体检信息的工作量。
在一些实施例中,“相等”可以是两者完全相等,也可以是两者之差小于一定阈值,该阈值可以根据需要进行设定。
具体地,参照图6,在步骤S53中可以包括:
步骤S61:计算第一样本对的匹配度与第二样本对的匹配度之间的差值,并根据差值以及第一预设阈值,确定第一损失部分。
在实际应用中,可以以第一样本对的匹配度score(uj,dij)比第二样本对的匹配度score(uj,dil)至少高第一预设阈值γ为第一训练目标,即score(uj,dij)>score(uj,dil)+γ,其中il∈[1,M],ij∈[1,M]且ij≠il。其中,第一预设阈值大于零,例如可以设定为1,具体数据可以根据实际情况设定,本实施例不作限定。
在具体实现中,可以按照以下公式确定第一损失部分:
其中,L1表示第一损失部分,uj表示样本体检信息,dij表示第一样本分配对象的信息,dil表示第二样本分配对象的信息,(uj,dij)表示第一样本对,(uj,dil)表示第二样本对,score(uj,dil)表示第二样本对的匹配度,score(uj,dij)表示第一样本对的匹配度,γ表示第一预设阈值。如果a≤0,则[a]+=0;否则[a]+=a。
步骤S62:根据多个样本体检信息的第二参量、多个样本分配对象的第三参量以及各样本分配对象的第一参量,确定第二损失部分,其中,第二参量用于表征多个样本体检信息的工作量,第三参量为多个样本分配对象的数量。
本实施例中,可以以各样本分配对象的第一参量相等作为第二训练目标,或者以各样本分配对象的第一参量与平均工作量之间的差值最小作为第二训练目标,使训练得到的模型能够均衡各分配对象之间的工作量。
在具体实现中,可以首先计算第二参量与第三参量的比值;然后根据第一参量与比值之间的差值,确定第二损失部分。
假设完成每份样本体检信息u的工作量为u_ci,其中i∈[1,k],k表示样本体检信息的总份数,则总工作量即第二参量平均工作量为M为样本分配对象的数量作为第三参量。假设与样本分配对象j匹配的样本体检信息包括{uj1,…,ujh},则可以将该样本分配对象的工作量不平衡度记为其中,为与样本分配对象j专业匹配的样本体检信息的工作量即第一参量。
为了简化描述,本实施例中假定每份体检信息的工作量相同,设为1,即其中N为样本体检信息的总份数作为第二参量,M为样本分配对象的数量即第三参量。由于所以样本分配对象j的第一参量为
在具体实现中,可以按照以下公式确定第二损失部分:
其中,L2表示第二损失部分,N表示第二参量,M表示第三参量,hi表示样本分配对象i的第一参量。
根据第二损失部分的计算公式可知,当每个样本分配对象处理的样本体检信息数量为平均数N/M时,各样本分配对象的工作量相同,均为平均工作量,这种情况下工作量平衡性的损失最小为0,当各样本分配对象处理的样本体检信息数量差异很大时,损失会增大。
步骤S63:将第一损失部分与第二损失部分进行加权求和,得到损失函数。
在具体实现中,可以按照以下公式确定损失函数:
L=L1+βL2,其中,L表示损失函数,β表示调和参数。
步骤S64:以最小化损失函数为目标,对待训练模型进行训练。
在具体实现中,可以使用批量梯度下降方法(batch gradient descent)最小化损失函数来学习模型参数。
本实施例中,通过第一损失部分来衡量样本体检信息与各样本分配对象之间的专业匹配度损失,通过第二损失部分来衡量各样本分配对象工作量之间的平衡性损失。当第一样本对的匹配度score(uj,dij)比第二样本对的匹配度score(uj,dil)高出γ以上,并且每个分配对象处理的工作量(第一参量)相同的时候,损失函数L最小为0。
由损失函数L公式可知,如果每份体检信息都分发给专业最匹配(匹配度最高)的分配对象,就会导致有的分配对象处理很多体检信息,有的分配对象处理很少的总检信息,此时第一损失部分较小,但是第二损失部分会很大。模型训练过程中,可以通过调整参数使总损失函数L最小,实现把部分体检信息分发给专业匹配度较高(如专业匹配度第二高或第三高等)的分配对象,以便使得分配对象之间的工作量相对平衡。
采用上述损失函数对待训练模型进行训练,可以得到信息匹配模型。采用上述损失函数对第一待训练模型和第二待训练模型进行训练,可以得到语义向量模型和向量匹配模型。采用训练好的信息匹配模型或者语义向量模型和向量匹配模型,可以计算新的体检信息与每个分配对象之间的匹配度,从而可以从多个分配对象中选出专业匹配度较高且工作量平衡的目标分配对象。
通过构建语义向量模型和向量匹配模型,实现将体检信息和分配对象的信息映射到同一向量空间中,并在该向量空间中根据专业匹配度和工作量平衡度确定目标分配对象,进而将体检信息分发给目标分配对象。本方案兼顾了体检信息与分配对象之间的专业匹配度以及各分配对象之间的工作量平衡。相比传统方法,本方案能够将体检信息分配给匹配度较高的分配对象,同时还能够合理分配各分配对象之间的工作量,实现各分配对象之间的工作量均衡。
在实际应用中,本实施例提供的体检信息分配方法可以由服务器执行,发送给终端,或者由终端执行,本实施例对体检信息分配方法的执行主体不作限定。
图7是根据一示例性实施例示出的一种体检信息分配装置框图。参照图7,可以包括:
信息获取模块71,被配置为获取体检信息以及多个分配对象的信息,所述体检信息包括异常体检信息以及所述体检信息的工作量信息,所述分配对象的信息包括所述分配对象的特长信息和工作量信息;
信息处理模块72,被配置为将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度,所述信息匹配模型用于根据所述异常体检信息、所述体检信息的工作量信息以及所述分配对象的特长信息和工作量信息,计算所述体检信息与所述分配对象之间的匹配度;
信息分配模块73,被配置为根据所述体检信息与各个所述分配对象之间的匹配度,从所述多个分配对象中确定目标分配对象,并将所述体检信息分配给所述目标分配对象。
本实施例提供的体检信息分配装置可以应用于电子设备,例如服务器等,也可以应用于用户终端设备,例如手机、电脑等。
其中,体检信息例如可以为已完成单项检查结果但需要给出总检结果的体检报告。体检信息可以包含一系列体检项目(如一般检查、内科检查、心电图、头颅CT等)的检查结果(如心电图项目的检查结果包括:窦性心律等)。
本实施例中,体检信息可以包括异常体检信息,异常体检信息可以包括有异常的检查结果或者有异常的体检项目等,本实施例对异常体检信息的具体内容不作限定。体检信息还可以包括该体检信息的工作量信息,体检信息的工作量信息例如可以由体检信息所包含的体检报告的份数来确定,还可以由有异常的检查结果的字数来确定等等,本实施例对此不作限定。
分配对象例如可以为总检医生。分配对象的信息可以包括分配对象的特长信息,特长信息可以包括总检医生的毕业院校专业、工作年限、擅长的检查项目等描述介绍,本实施例对特长信息的具体内容不作限定。例如特长信息可以为A医生,毕业于**,…,工作**年,…,擅长内科…。分配对象的信息还可以包括分配对象的工作量信息,工作量信息可以由总检医生已处理的体检报告数量来确定,如A医生已处理M份体检报告,B医生已处理N份体检报告,等等。
体检信息例如可以由信息获取模块71从各个单项检查设备处获取,例如,各个单项检查设备的检查结果由各分检医生给出或者设备自动分析给出。例如,分配对象的信息可以预先录入并存储,例如,可以通过用户交互界面供各医生录入。
具体地,信息匹配模型可以根据体检信息的异常体检信息和分配对象的特长信息,计算体检信息与分配对象之间的专业匹配度,同时还可以根据体检信息的工作量信息和分配对象的工作量信息,计算体检信息与分配对象之间的工作量匹配度。也就是,信息处理模块72计算得到的体检信息与分配对象之间的匹配度包含了体检信息与分配对象之间的专业匹配度和工作量匹配度。
当体检信息为体检报告,分配对象为总检医生时,体检信息和分配对象的专业匹配指的是体检信息中的检查结果是否由擅长该项检查结果的总检医生进行解读和处理。例如体检信息u中的内科检查结果有异常,则内科医生A比外科医生B在专业方面更适合处理该体检报告,即总检医生A与体检报告u的专业匹配度更高。
体检信息和分配对象的工作量匹配指的是通过体检信息的分配能够使多个分配对象之间的工作量均衡。
本实施例中,信息匹配模型可以预先根据样本体检信息、第一样本分配对象和第二样本分配对象进行迭代训练得到,其中第一样本分配对象与样本体检信息的专业匹配度大于第二样本分配对象与样本体检信息的专业匹配度。具体地,在训练过程中,可以计算第一样本分配对象与样本体检信息之间的第一匹配度,以及第二样本分配对象与样本体检信息之间的第二匹配度,并且以第一匹配度与第二匹配度之间的差值大于第一预设阈值且第一样本分配对象与第二样本分配对象之间的工作量均衡为目标,训练得到信息匹配模型。后续实施例会对信息匹配模型的具体训练过程进行详细介绍。
信息处理模块72采用信息匹配模型能够从专业匹配和工作量匹配两方面综合考量分配对象与体检信息之间的匹配度,确保将体检信息分配给专业匹配的分配对象的同时,还能够兼顾各分配对象的工作量,使各分配对象之间的工作量均衡。
在具体实现中,信息分配模块73可以采用信息处理模块72计算出的体检信息与各个分配对象之间的匹配度。假设有M个分配对象,则可以得到M个分配对象分别与体检信息u之间的匹配度score,进而信息分配模块73可以根据体检信息与各个分配对象之间的匹配度确定目标分配对象,并将体检信息派发给目标分配对象。
在本公开的一些实施例中对,各模块的执行顺序不作限定,具体可以根据实际需要进行调整。
本实施例中,信息分配模块73从多个分配对象中确定目标分配对象的实现方式有多种。
在一种实现方式中,体检信息与目标分配对象之间的匹配度可以大于或等于第二预设阈值。第二预设阈值的具体数值可以根据实际需求确定,本实施例不作限定。
在另一种实现方式中,体检信息与目标分配对象之间的匹配度可以大于体检信息与其它分配对象之间的匹配度。其它分配对象为多个分配对象中除目标分配对象之外的分配对象。本实现方式中,将匹配度最大的分配对象确定为目标分配对象。
给定体检信息u,多个分配对象的信息集合{d1,d2,…,dN},函数f(u,di)∈R+(R+表示正实数)的值可以用来衡量体检信息u与分配对象的信息di之间的匹配度,函数值越大表明体检信息u与分配对象越匹配。在实际应用中,将体检报告u分配给目标分配对象,其中,目标分配对象的信息可以表示为即目标分配对象可以为多个分配对象中与体检报告匹配度最高的分配对象。本实施例中,函数f(u,di)表示预先训练得到的信息匹配模型。
本实施例提供的体检信息分配装置,通过信息匹配模型计算体检信息与分配对象之间的匹配度,能够从专业匹配和工作量匹配两方面综合考量分配对象与体检信息之间的匹配度,确保将体检信息分配给专业匹配的分配对象的同时,还能够兼顾各分配对象的工作量,使各分配对象之间的工作量均衡,从而实现体检信息与分配对象之间的匹配。
在一种可选的实现方式中,所述信息匹配模型包括语义向量模型和向量匹配模型,信息处理模块72具体被配置为:
将所述体检信息与所述分配对象的信息输入所述语义向量模型,输出第一向量;
将所述第一向量输入所述向量匹配模型,输出所述体检信息与所述分配对象之间的匹配度。
在一种可选的实现方式中,信息处理模块72具体被配置为:
将所述体检信息与所述分配对象的信息进行拼接,得到拼接信息,所述拼接信息的头部采用标记符号[CLS],在所述体检信息与所述分配对象的信息之间采用分隔符号[SEP]连接;
将所述拼接信息输入所述语义向量模型,输出所述第一向量。
在一种可选的实现方式中,信息处理模块72具体被配置为:
所述向量匹配模型按照以下公式计算所述体检信息与所述分配对象之间的匹配度:
其中,所述score表示所述体检信息与所述分配对象之间的匹配度,所述V[cls]表示所述第一向量,所述W1表示所述向量匹配模型的第一映射矩阵,所述表示所述向量匹配模型的第二映射矩阵W2的转置,所述b1表示所述向量匹配模型的偏置矩阵,所述σ表示所述向量匹配模型的激活函数。
在一种可选的实现方式中,所述语义向量模型包括BERT模型。
在一种可选的实现方式中,所述向量匹配模型包括全连接层网络模型。
其中,语义向量模型用于将体检信息和分配对象的信息映射到同一向量空间中;向量匹配模型用于在该向量空间中计算体检信息和分配对象之间的匹配度。
体检信息和分配对象的信息从词形上看差异很大,但语义相关。因此信息处理模块72可以将它们映射到语义向量空间中,在语义向量空间中语义相关的内容位置相近,因此,可以语义向量空间中衡量体检信息和分配对象的信息之间的匹配度。
信息处理模块72通过预先训练得到的语义向量模型将体检信息和分配对象的信息映射到同一向量空间中,进而在该向量空间中进一步计算体检信息与分配对象之间的匹配度。
语义向量模型可以为BERT模型、RNN模型或LSTM等语言模型。由于BERT模型是真正意义上的双向语言模型,每个词可以同时利用该词的上下文信息,因此语义向量模型采用BERT模型可以获得更准确的语义向量,进一步提高匹配精确度。
本实施例中,语义向量模型采用BERT模型训练得到。在一种可选的实现方式中,信息处理模块72可以首先将体检信息与分配对象的信息进行拼接,得到拼接信息,拼接信息的头部采用标记符号[CLS],在体检信息与分配对象的信息之间采用分隔符号[SEP]连接;然后再将拼接信息输入语义向量模型,输出第一向量。
在具体实现中,信息处理模块72可以首先采用word embedding等技术将文本形式的体检信息和分配对象的信息转换得到字向量。参照图3,“字i”表示对应文本(体检信息或分配对象的信息)中的第i个字,通过word embedding等方式将每个字对应的文本“字i”转化为向量Ei或Ei’。其中,Ei为体检信息的字向量,Ei’为分配对象的信息的字向量。然后,可以将Ei和Ei’作为初始化向量,采用标记符号[CLS]和分隔符号[SEP]对字向量形式的体检信息与分配对象的信息进行拼接,得到拼接信息。具体地,可以在拼接信息的头部加入标记符号[CLS],在体检信息u和分配对象的信息d之间加入分隔符号[SEP]。之后,可以将该拼接信息作为一个整体输入语义向量模型如BERT模型中,得到第一向量。
其中,标记符号[CLS]作为拼接信息的头部,表示该符号对应的输出向量V[cls]可以作为拼接信息的语义表示或语义向量。通过标记符号[CLS]可以更“公平”地融合拼接信息中各个字或词的语义信息。分隔符号[SEP]用于将拼接信息中的体检信息与分配对象的信息进行区分。
如图3所示,第一向量V[cls]为语义向量模型的输出结果,第一向量V[cls]包含了体检信息u和分配对象的信息d。在一些实施例中,第一向量V[cls]表示输入的体检信息和分配对象信息对应的向量。当语义向量模型采用的是BERT模型时,V[cls]的维度为768维。本实施例中,采用的BERT模型默认的向量维度为768维,当然,BERT模型中的向量也可以是其它维度,本实施例对此不作限定。图3中的Vi或Vi’表示“字i”经过语义向量模型处理后输出的向量。
在具体实现中,信息处理模块72可以将体检信息与每一个分配对象的信息构成的信息对输入预先训练得到的语义向量模型,获得与输入的体检信息和分配对象的信息对应的第一向量。这样通过语义向量模型就可以将体检信息和各个分配对象的信息映射到同一个向量空间。
在一种可选的实现方式中,向量匹配模型可以采用全连接层网络模型。需要说明的是,向量匹配模型并不仅限于全连接层网络模型,凡是能够将输入向量变换为标量的任意网络模型均可。
在一种可选的实现方式中,向量匹配模型可以按照以下公式计算体检信息与分配对象之间的匹配度:
其中,score表示体检信息与分配对象之间的匹配度,V[cls]表示第一向量,W1表示向量匹配模型的第一映射矩阵,表示向量匹配模型的第二映射矩阵W2的转置,b1表示向量匹配模型的偏置矩阵,σ表示向量匹配模型的激活函数。
如图4所示,信息处理模块72可以将第一向量V[cls]输入到向量匹配模型,输出体检信息与分配对象之间的匹配度score。图4中的xi表示第一向量V[cls]中第i个维度的值。当语义向量模型采用BERT模型时,W1可以为384*768的矩阵,W2和b1可以为384*1的矩阵。
语义向量模型的参数以及向量匹配模型中矩阵W1,W2和b1等参数,可以通过联合训练获得。其中,语义向量模型的参数可以使用预训练模型中的参数作为初始值,向量匹配模型中的矩阵W1,W2以及b1可以通过随机初始化获取初始值。例如,使用大量数据对模型进行预训练,得到预训练模型中的各个参数,再在具体任务上对参数进行细致调整。语义向量模型和向量匹配模型的具体训练过程在后续实施例中会详细描述。
本实施例中,信息处理模块72通过语义向量模型将体检信息和分配对象的信息映射到同一向量空间中,在该向量空间中计算体检信息与各分配对象之间的匹配度,进而根据匹配度将体检信息分配给合适的分配对象。
在一种可选的实现方式中,所述装置还包括模型训练模块,所述模型训练模块具体被配置为:
获取多个训练样本对,各所述训练样本为第一样本对或第二样本对,所述第一样本对包括样本体检信息与第一样本分配对象的信息,所述第二样本对包括所述样本体检信息与第二样本分配对象的信息,其中,所述第一样本对的匹配度大于所述第二样本对的匹配度,所述样本体检信息包括异常样本体检信息,样本分配对象的信息包括所述样本分配对象的特长信息,所述样本分配对象为所述第一样本分配对象或所述第二样本分配对象;
将所述训练样本对输入待训练模型,得到所述训练样本对的匹配度;
根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型。
在一种可选的实现方式中,所述模型训练模块具体被配置为:
以所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值大于第一预设阈值,且各所述样本分配对象的第一参量相等为目标,对所述待训练模型进行训练,其中,所述第一预设阈值大于零,所述第一参量用于表征各所述样本分配对象的工作量,所述第一参量由所述样本体检信息的工作量信息确定。
计算所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值,并根据所述差值以及所述第一预设阈值,确定第一损失部分;
根据多个所述样本体检信息的第二参量、多个所述样本分配对象的第三参量以及各所述样本分配对象的第一参量,确定第二损失部分,其中,所述第二参量用于表征多个所述样本体检信息的工作量,所述第三参量为多个所述样本分配对象的数量;
将所述第一损失部分与所述第二损失部分进行加权求和,得到损失函数;
以最小化所述损失函数为目标,对所述待训练模型进行训练。
在一种可选的实现方式中,所述模型训练模块具体被配置为:
按照以下公式确定所述第一损失部分:
其中,所述L1表示所述第一损失部分,所述uj表示所述样本体检信息,所述dij表示所述第一样本分配对象的信息,所述dix表示所述第二样本分配对象的信息,所述(uj,dij)表示所述第一样本对,所述(uj,dil)表示所述第二样本对,所述score(uj,dil)表示所述第二样本对的匹配度,所述score(uj,dij)表示所述第一样本对的匹配度,所述γ表示所述第一预设阈值;
按照以下公式确定所述第二损失部分:
其中,所述L2表示所述第二损失部分,所述N表示所述第二参量,所述M表示所述第三参量,所述hi表示所述样本分配对象i的第一参量;
按照以下公式确定所述损失函数:
L=L1+βL2,其中,所述L表示所述损失函数,所述β表示调和参数。
在一种可选的实现方式中,当所述信息匹配模型包括语义向量模型和向量匹配模型时,所述待训练模型包括第一待训练模型和第二待训练模型,所述模型训练模块具体被配置为:
将所述训练样本对输入所述第一待训练模型,得到所述训练样本对的向量;
将所述训练样本对的向量输入所述第二待训练模型,得到所述训练样本对的匹配度;
根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述第一待训练模型和所述第二待训练模型进行训练,将训练后的第一待训练模型确定为所述语义向量模型,将训练后的第二待训练模型确定为所述向量匹配模型。
样本体检信息例如可以为已完成单项检查结果但需要给出总检结果的样本体检报告。样本体检信息可以包含一系列体检项目(如一般检查、内科检查、心电图、头颅CT等)的检查结果(如心电图项目的检查结果包括:窦性心律等)。
本实施例中,样本体检信息可以包括异常样本体检信息,异常样本体检信息可以包括有异常的检查结果或者有异常的体检项目等,本实施例对异常样本体检信息的具体内容不作限定。
样本分配对象例如可以为总检医生。样本分配对象的信息可以包括样本分配对象的特长信息,特长信息可以包括总检医生的毕业院校专业、工作年限、擅长的检查项目等描述介绍,本实施例对特长信息的具体内容不作限定。例如特长信息可以为A医生,毕业于**,…,工作**年,…,擅长内科…。
本实施例中,第一样本分配对象可以为与样本体检信息专业匹配的样本分配对象,即第一样本分配对象的特长信息与样本体检信息中的异常样本体检信息匹配。第二样本分配对象可以为与样本体检信息专业不匹配的样本分配对象,即第二样本分配对象的特长信息与样本体检信息中的异常样本体检信息不匹配。在获取训练样本对的过程中,例如可以根据样本体检信息和样本分配对象的信息人为指定第一样本分配对象和第二样本分配对象。例如,如果第一样本分配对象的专业匹配度大于第二样本分配对象的专业匹配度的,则可认为第一样本分配对象为与样本体检信息专业匹配的样本分配对象,第二样本分配对象为与样本体检信息专业不匹配的样本分配对象。
第一样本对(uj,dij),包括样本体检信息uj和第一样本分配对象的信息dij(其中下标ij∈[1,M],M为样本分配对象的总数量);第二样本对(uj,dil),包括样本体检信息uj和第二样本分配对象的信息dil(其中下标il∈[1,M]且ij≠il)。其中,第一样本对(uj,dij)的匹配度可以大于第二样本对(uj,dil)的匹配度,即样本体检信息与第一样本分配对象的专业更匹配。
其中,样本体检信息的工作量信息例如可以由样本体检信息所包含的样本体检报告的份数来确定,还可以由有异常的检查结果的字数来确定等等,本实施例对此不作限定。
样本分配对象的工作量信息可以由与样本分配对象专业匹配的样本体检信息的工作量确定,例如可以为与样本分配对象专业匹配的样本体检信息的数量。
其中,第一待训练模型可以为BERT模型、RNN模型或LSTM等语言模型。由于BERT模型是真正意义上的双向语言模型,每个词可以同时利用该词的上下文信息,因此第一待训练模型采用BERT模型可以获得更准确的语义向量,进一步提高匹配精确度。
第二待训练模型可以采用全连接层网络模型。需要说明的是,第二待训练模型并不仅限于全连接层网络模型,凡是能够将输入向量变换为标量的任意网络模型均可。
在具体实现中,模型训练模块可以将训练样本对输入第一待训练模型中,获得与输入的训练样本对对应的向量,然后将训练样本对的向量输入第二待训练模型,获得与输入的训练样本对对应的匹配度。这样,就可以获得所有训练样本对的匹配度,包括第一样本对(uj,dij)的匹配度score(uj,dij)以及第二样本对(uj,dil)的匹配度score(uj,dil)。之后,可以根据第一样本对的匹配度、第二样本对的匹配度、样本体检信息的工作量信息以及各样本分配对象的工作量信息,对第一待训练模型和第二待训练模型或者对待训练模型进行训练。
在一种可选的实现方式中,模型训练模块可以以第一样本对的匹配度score(uj,dij)与第二样本对的匹配度score(uj,dil)之间的差值大于第一预设阈值γ,且各样本分配对象的第一参量相等为目标,对待训练模型进行训练,其中,第一预设阈值大于零,样本分配对象为第一样本分配对象或第二样本分配对象,第一参量用于表征各样本分配对象的工作量,第一参量由样本体检信息的工作量信息确定。例如,第一参量可以为与样本分配对象专业匹配的样本体检信息的工作量。
在一些实施例中,“相等”可以是两者完全相等,也可以是两者之差小于一定阈值,该阈值可以根据需要进行设定。
在实际应用中,模型训练模块可以以第一样本对的匹配度score(uj,dij)比第二样本对的匹配度score(uj,dil)至少高第一预设阈值γ为第一训练目标,即score(uj,dij)>score(uj,dil)+γ,其中il∈[1,M],ij∈[1,M]且ij≠il。其中,第一预设阈值大于零,例如可以设定为1,具体数据可以根据实际情况设定,本实施例不作限定。
在具体实现中,模型训练模块可以按照以下公式确定第一损失部分:
其中,L1表示第一损失部分,uj表示样本体检信息,dij表示第一样本分配对象的信息,dil表示第二样本分配对象的信息,(uj,dil)表示第一样本对,(uj,dil)表示第二样本对,score(uj,dil)表示第二样本对的匹配度,score(uj,dij)表示第一样本对的匹配度,γ表示第一预设阈值。如果a≤0,则[a]+=0;否则[a]+=a。
本实施例中,模型训练模块可以以各样本分配对象的第一参量相等作为第二训练目标,或者以各样本分配对象的第一参量与平均工作量之间的差值最小作为第二训练目标,使训练得到的模型能够均衡各分配对象之间的工作量。
在具体实现中,模型训练模块可以首先计算第二参量与第三参量的比值;然后根据第一参量与比值之间的差值,确定第二损失部分。
假设完成每份样本体检信息u的工作量为u_ci,其中i∈[1,k],k表示样本体检信息的总份数,则总工作量即第二参量平均工作量为M为样本分配对象的数量作为第三参量。假设与样本分配对象j匹配的样本体检信息包括{uj1,…,ujh},则可以将该样本分配对象的工作量不平衡度记为其中,为与样本分配对象j专业匹配的样本体检信息的工作量即第一参量。
为了简化描述,本实施例中假定每份体检信息的工作量相同,设为1,即其中N为样本体检信息的总份数作为第二参量,M为样本分配对象的数量即第三参量。由于所以样本分配对象j的第一参量为
在具体实现中,模型训练模块可以按照以下公式确定第二损失部分:
其中,L2表示第二损失部分,N表示第二参量,M表示第三参量,hi表示样本分配对象i的第一参量。
根据第二损失部分的计算公式可知,当每个样本分配对象处理的样本体检信息数量为平均数N/M时,各样本分配对象的工作量相同,均为平均工作量,这种情况下工作量平衡性的损失最小为0,当各样本分配对象处理的样本体检信息数量差异很大时,损失会增大。
在具体实现中,模型训练模块可以按照以下公式确定损失函数:
L=L1+βL2,其中,L表示损失函数,β表示调和参数。
在具体实现中,模型训练模块可以使用批量梯度下降方法(batch gradientdescent)最小化损失函数来学习模型参数。
本实施例中,模型训练模块通过第一损失部分来衡量样本体检信息与各样本分配对象之间的专业匹配度损失,通过第二损失部分来衡量各样本分配对象工作量之间的平衡性损失。当第一样本对的匹配度score(uj,dij)比第二样本对的匹配度score(uj,dil)高出γ以上,并且每个分配对象处理的工作量(第一参量)相同的时候,损失函数L最小为0。
由损失函数L公式可知,如果每份体检信息都分发给专业最匹配(匹配度最高)的分配对象,就会导致有的分配对象处理很多体检信息,有的分配对象处理很少的总检信息,此时第一损失部分较小,但是第二损失部分会很大。模型训练过程中,可以通过调整参数使总损失函数L最小,实现把部分体检信息分发给专业匹配度较高(如专业匹配度第二高或第三高等)的分配对象,以便使得分配对象之间的工作量相对平衡。
模型训练模块采用上述损失函数对待训练模型进行训练,可以得到信息匹配模型。采用上述损失函数对第一待训练模型和第二待训练模型进行训练,可以得到语义向量模型和向量匹配模型。采用训练好的信息匹配模型或者语义向量模型和向量匹配模型,可以计算新的体检信息与每个分配对象之间的匹配度,从而可以从多个分配对象中选出专业匹配度较高且工作量平衡的目标分配对象。
本实施例,通过构建语义向量模型和向量匹配模型,实现将体检信息和分配对象的信息映射到同一向量空间中,并在该向量空间中根据专业匹配度和工作量平衡度确定目标分配对象,进而将体检信息分发给目标分配对象。本方案兼顾了体检信息与分配对象之间的专业匹配度以及各分配对象之间的工作量平衡。相比传统方法,本方案能够将体检信息分配给匹配度较高的分配对象,同时还能够合理分配各分配对象之间的工作量,实现各分配对象之间的工作量均衡。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,例如,使用软件、硬件、固件等方式实现,此处将不做详细阐述说明。
图8是本申请示出的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成任一实施例所述的体检信息分配方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行任一实施例所述的体检信息分配方法。
在示例性实施例中,处理组件1922执行上述体检信息分配方法,由输入接口1958接收用户输入的信息,例如体检信息和分配对象的信息,由输出接口1958将分配结果进行输出,例如,将体检信息分配给目标分配对象。
在示例性实施例中,确定好体检信息与各个分配对象之间的匹配度后,根据匹配度对各个分配对象进行排序,并将排序结果通过输出接口1958输出,例如,用户可以通过用户交互界面对各个分配对象进行选择,或者可以对该顺序进行编辑,例如调整排列数序等。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成任一实施例所述的体检信息分配方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括可读性程序代码,该可读性程序代码可由装置800的处理器820执行以完成任一实施例所述的体检信息分配方法。可选地,该程序代码可以存储在装置800的存储介质中,该存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图9是本申请示出的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。
参照图9,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行任一实施例所述的体检信息分配方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着,结合实施例描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。此外,请注意,这里“在一个实施例中”的词语例子不一定全指同一个实施例。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (15)

1.一种体检信息分配方法,其特征在于,所述方法包括:
获取体检信息以及多个分配对象的信息,所述体检信息包括异常体检信息以及所述体检信息的工作量信息,所述分配对象的信息包括所述分配对象的特长信息和工作量信息;其中,所述分配对象的工作量信息包括所述分配对象已处理的体检报告数量;
将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度,所述信息匹配模型用于根据所述异常体检信息、所述体检信息的工作量信息以及所述分配对象的特长信息和工作量信息,计算所述体检信息与所述分配对象之间的匹配度,所述匹配度包括专业匹配度和工作量匹配度;
其中,在将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型之前,所述方法还包括:获取多个训练样本对,各所述训练样本为第一样本对或第二样本对,所述第一样本对包括样本体检信息与第一样本分配对象的信息,所述第二样本对包括所述样本体检信息与第二样本分配对象的信息,其中,所述第一样本对的匹配度大于所述第二样本对的匹配度,所述样本体检信息包括异常样本体检信息,样本分配对象的信息包括所述样本分配对象的特长信息,所述样本分配对象为所述第一样本分配对象或所述第二样本分配对象;
将所述训练样本对输入待训练模型,得到所述训练样本对的匹配度;
根据所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值,以及与各样本分配对象对应的第一参量,对待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型;所述第一参量为与所述样本分配对象专业匹配的样本体检信息的工作量;
根据所述体检信息与各个所述分配对象之间的匹配度,从所述多个分配对象中确定目标分配对象,并将所述体检信息分配给所述目标分配对象。
2.根据权利要求1所述的体检信息分配方法,其特征在于,所述信息匹配模型包括语义向量模型和向量匹配模型,所述将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度的步骤,包括:
将所述体检信息与所述分配对象的信息输入所述语义向量模型,输出第一向量;
将所述第一向量输入所述向量匹配模型,输出所述体检信息与所述分配对象之间的匹配度。
3.根据权利要求2所述的体检信息分配方法,其特征在于,所述将所述体检信息与所述分配对象的信息输入所述语义向量模型,输出第一向量的步骤,包括:
将所述体检信息与所述分配对象的信息进行拼接,得到拼接信息,所述拼接信息的头部采用标记符号[CLS],在所述体检信息与所述分配对象的信息之间采用分隔符号[SEP]连接;
将所述拼接信息输入所述语义向量模型,输出所述第一向量。
4.根据权利要求2所述的体检信息分配方法,其特征在于,所述将所述第一向量输入所述向量匹配模型,输出所述体检信息与所述分配对象之间的匹配度的步骤,包括:
所述向量匹配模型按照以下公式计算所述体检信息与所述分配对象之间的匹配度:
其中,所述score表示所述体检信息与所述分配对象之间的匹配度,所述V[cls]表示所述第一向量,所述W1表示所述向量匹配模型的第一映射矩阵,所述表示所述向量匹配模型的第二映射矩阵W2的转置,所述b1表示所述向量匹配模型的偏置矩阵,所述σ表示所述向量匹配模型的激活函数。
5.根据权利要求2至4任一项所述的体检信息分配方法,其特征在于,所述语义向量模型包括BERT模型。
6.根据权利要求2至4任一项所述的体检信息分配方法,其特征在于,所述向量匹配模型包括全连接层网络模型。
7.根据权利要求1所述的体检信息分配方法,其特征在于,所述所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值,以及与各样本分配对象对应的第一参量,对待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型的步骤,包括:
以所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值大于第一预设阈值,且各所述样本分配对象的第一参量相等为目标,对所述待训练模型进行训练,其中,所述第一预设阈值大于零,所述第一参量用于表征各所述样本分配对象的工作量,所述第一参量由所述样本体检信息的工作量信息确定。
8.根据权利要求7所述的体检信息分配方法,其特征在于,所述以所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值大于第一预设阈值,且各所述样本分配对象的第一参量相等为目标,对所述待训练模型进行训练的步骤,包括:
计算所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值,并根据所述差值以及所述第一预设阈值,确定第一损失部分;
根据多个所述样本体检信息的第二参量、多个所述样本分配对象的第三参量以及各所述样本分配对象的第一参量,确定第二损失部分,其中,所述第二参量用于表征多个所述样本体检信息的工作量,所述第三参量为多个所述样本分配对象的数量;
将所述第一损失部分与所述第二损失部分进行加权求和,得到损失函数;
以最小化所述损失函数为目标,对所述待训练模型进行训练。
9.根据权利要求8所述的体检信息分配方法,其特征在于,按照以下公式确定所述第一损失部分:
其中,所述L1表示所述第一损失部分,所述uj表示所述样本体检信息,所述dij表示所述第一样本分配对象的信息,所述dil表示所述第二样本分配对象的信息,所述(uj,dij)表示所述第一样本对,所述(uj,dil)表示所述第二样本对,所述score(uj,dil)表示所述第二样本对的匹配度,所述score(uj,dij)表示所述第一样本对的匹配度,所述γ表示所述第一预设阈值;
按照以下公式确定所述第二损失部分:
其中,所述L2表示所述第二损失部分,所述N表示所述第二参量,所述M表示所述第三参量,所述hi表示所述样本分配对象i的第一参量;
按照以下公式确定所述损失函数:
LL=L1+βL2,其中,所述L表示所述损失函数,所述β表示调和参数。
10.根据权利要求8至9任一项所述的体检信息分配方法,其特征在于,当所述信息匹配模型包括语义向量模型和向量匹配模型时,所述待训练模型包括第一待训练模型和第二待训练模型,所述将所述训练样本对输入待训练模型,得到所述训练样本对的匹配度的步骤,包括:
将所述训练样本对输入所述第一待训练模型,得到所述训练样本对的向量;
将所述训练样本对的向量输入所述第二待训练模型,得到所述训练样本对的匹配度;
所述根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型的步骤,包括:
根据所述第一样本对的匹配度、所述第二样本对的匹配度、所述样本体检信息的工作量信息以及各所述样本分配对象的工作量信息,对所述第一待训练模型和所述第二待训练模型进行训练,将训练后的第一待训练模型确定为所述语义向量模型,将训练后的第二待训练模型确定为所述向量匹配模型。
11.根据权利要求1-4、7-9中任一项所述的体检信息分配方法,其特征在于,所述体检信息与所述目标分配对象之间的匹配度大于或等于第二预设阈值;或者,
所述体检信息与所述目标分配对象之间的匹配度大于所述体检信息与其它分配对象之间的匹配度,所述其它分配对象为所述多个分配对象中除所述目标分配对象之外的分配对象。
12.一种体检信息分配装置,其特征在于,所述装置包括:
信息获取模块,被配置为获取体检信息以及多个分配对象的信息,所述体检信息包括异常体检信息以及所述体检信息的工作量信息,所述分配对象的信息包括所述分配对象的特长信息和工作量信息;其中,所述分配对象的工作量信息包括所述分配对象已处理的体检报告数量;
信息处理模块,被配置为将所述体检信息与所述分配对象的信息输入预先训练得到的信息匹配模型,获得所述体检信息与所述分配对象之间的匹配度,所述信息匹配模型用于根据所述异常体检信息、所述体检信息的工作量信息以及所述分配对象的特长信息和工作量信息,计算所述体检信息与所述分配对象之间的匹配度,所述匹配度包括专业匹配度和工作量匹配度;
其中,所述装置还包括模型训练模块,所述模型训练模块具体被配置为:
获取多个训练样本对,各所述训练样本为第一样本对或第二样本对,所述第一样本对包括样本体检信息与第一样本分配对象的信息,所述第二样本对包括所述样本体检信息与第二样本分配对象的信息,其中,所述第一样本对的匹配度大于所述第二样本对的匹配度,所述样本体检信息包括异常样本体检信息,样本分配对象的信息包括所述样本分配对象的特长信息,所述样本分配对象为所述第一样本分配对象或所述第二样本分配对象;
将所述训练样本对输入待训练模型,得到所述训练样本对的匹配度;
根据所述第一样本对的匹配度与所述第二样本对的匹配度之间的差值,以及与各样本分配对象对应的第一参量,对待训练模型进行训练,将训练后的待训练模型确定为所述信息匹配模型;所述第一参量为与所述样本分配对象专业匹配的样本体检信息的工作量;
信息分配模块,被配置为根据所述体检信息与各个所述分配对象之间的匹配度,从所述多个分配对象中确定目标分配对象,并将所述体检信息分配给所述目标分配对象。
13.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至11中任一项所述的体检信息分配方法。
14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至11中任一项所述的体检信息分配方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述的体检信息分配方法。
CN202080003671.7A 2020-12-25 2020-12-25 一种体检信息分配方法及装置 Active CN114981803B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/139523 WO2022134032A1 (zh) 2020-12-25 2020-12-25 一种体检信息分配方法、装置、电子设备、计算机可读存储介质以及计算机程序产品

Publications (2)

Publication Number Publication Date
CN114981803A CN114981803A (zh) 2022-08-30
CN114981803B true CN114981803B (zh) 2025-03-18

Family

ID=82157172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080003671.7A Active CN114981803B (zh) 2020-12-25 2020-12-25 一种体检信息分配方法及装置

Country Status (3)

Country Link
US (1) US12217838B2 (zh)
CN (1) CN114981803B (zh)
WO (1) WO2022134032A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119647862A (zh) * 2024-11-27 2025-03-18 深圳市酷开网络科技股份有限公司 一种基于数字化体检的指标分配方法、系统及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305671A (zh) * 2018-01-23 2018-07-20 深圳科亚医疗科技有限公司 由计算机实现的医学图像调度方法、调度系统及存储介质
CN110232971A (zh) * 2019-05-24 2019-09-13 深圳市翩翩科技有限公司 一种医生推荐方法及装置
CN110377714A (zh) * 2019-07-18 2019-10-25 泰康保险集团股份有限公司 基于迁移学习的文本匹配方法、装置、介质及设备

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090198733A1 (en) * 2008-02-01 2009-08-06 Microsoft Corporation Healthcare resource locator
US20090259488A1 (en) * 2008-04-10 2009-10-15 Microsoft Corporation Vetting doctors based on results
US10061894B2 (en) * 2010-09-01 2018-08-28 Apixio, Inc. Systems and methods for medical referral analytics
US20120185867A1 (en) * 2011-01-17 2012-07-19 International Business Machines Corporation Optimizing The Deployment Of A Workload On A Distributed Processing System
US20120185416A1 (en) * 2011-01-17 2012-07-19 International Business Machines Corporation Load estimation in user-based environments
CN102332052A (zh) 2011-07-22 2012-01-25 大连亿创天地科技发展有限公司 一种数字化体检视频记录导读方法及系统
CN103356166B (zh) 2012-03-30 2015-10-14 苏州康捷医疗股份有限公司 一种多功能体检诊查设备
US10403395B2 (en) 2013-10-14 2019-09-03 SecondOpinionExpert, Inc. Method and apparatus for generating objective medical second opinion
US11568982B1 (en) * 2014-02-17 2023-01-31 Health at Scale Corporation System to improve the logistics of clinical care by selectively matching patients to providers
US10585940B2 (en) * 2014-05-12 2020-03-10 Koninklijke Philips N.V. Method and system for computer-aided patient stratification based on case difficulty
JP6631113B2 (ja) 2015-09-16 2020-01-15 富士ゼロックス株式会社 医療文書管理装置、医療文書管理システム及びプログラム
US20170124497A1 (en) * 2015-10-28 2017-05-04 Fractal Industries, Inc. System for automated capture and analysis of business information for reliable business venture outcome prediction
US9424532B1 (en) * 2015-12-21 2016-08-23 International Business Machines Corporation Machine training and search engine for providing specialized cognitive healthcare apparatus
CN106485056A (zh) 2016-09-22 2017-03-08 河北中兴网信软件科技有限公司 在线诊疗方法和装置
US10456912B2 (en) * 2017-05-11 2019-10-29 King Fahd University Of Petroleum And Minerals Dynamic multi-objective task allocation
US11132533B2 (en) 2017-06-07 2021-09-28 David Scott Dreessen Systems and methods for creating target motion, capturing motion, analyzing motion, and improving motion
CN107301616A (zh) 2017-06-12 2017-10-27 深圳市前海安测信息技术有限公司 企业客户健康体检管理系统及方法
US20190043606A1 (en) * 2017-08-04 2019-02-07 Teladoc, Inc. Patient-provider healthcare recommender system
US20190180868A1 (en) * 2017-12-11 2019-06-13 UBQ, Inc. Optimizing emergency department resource management
CN108399953A (zh) * 2018-03-12 2018-08-14 平安健康互联网股份有限公司 基于体检报告的健康评分方法、装置及存储介质
US11609784B2 (en) * 2018-04-18 2023-03-21 Intel Corporation Method for distributing a computational process, workload distribution device and system for distributing a computational process
CN109102867A (zh) 2018-08-13 2018-12-28 贵阳叁玖互联网医疗有限公司 远程医疗的智能分诊方法及智能分诊平台
CN109215779A (zh) 2018-08-23 2019-01-15 北京远盟普惠健康科技有限公司 一种精准体检会诊方法
CN109192266A (zh) * 2018-09-28 2019-01-11 佐成爱(江苏)健康管理咨询有限公司 一种基于体检报告的药物推荐方法和装置
US11144340B2 (en) * 2018-10-04 2021-10-12 Cisco Technology, Inc. Placement of container workloads triggered by network traffic for efficient computing at network edge devices
CN109887567B (zh) 2018-12-21 2023-01-17 宜宝科技(北京)有限公司 检报生成方法及系统
US11461145B2 (en) * 2019-01-28 2022-10-04 EMC IP Holding Company LLC Building neural networks for resource allocation for iterative workloads using reinforcement learning
US11281863B2 (en) * 2019-04-18 2022-03-22 Salesforce.Com, Inc. Systems and methods for unifying question answering and text classification via span extraction
CN112400165B (zh) * 2019-05-01 2024-06-21 微软技术许可有限责任公司 利用无监督学习来改进文本到内容建议的方法和系统
US11487954B2 (en) * 2019-07-22 2022-11-01 Capital One Services, Llc Multi-turn dialogue response generation via mutual information maximization
CN110580942A (zh) 2019-08-23 2019-12-17 和宇健康科技股份有限公司 一种新型体检报告生成方法、装置、介质及终端设备
CN110797101B (zh) 2019-10-28 2023-11-03 腾讯医疗健康(深圳)有限公司 医学数据处理方法、装置、可读存储介质和计算机设备
CN110993081B (zh) * 2019-12-03 2023-08-11 济南大学 一种医生在线推荐方法及系统
US11573957B2 (en) * 2019-12-09 2023-02-07 Salesforce.Com, Inc. Natural language processing engine for translating questions into executable database queries
US11481259B2 (en) * 2020-01-07 2022-10-25 International Business Machines Corporation Distributing computation workloads based on calculated compute gravity within differing computing paradigms
CN111475713A (zh) * 2020-03-13 2020-07-31 京东方科技集团股份有限公司 医生信息推荐方法、装置、电子设备、系统及存储介质
US11687829B2 (en) * 2020-04-28 2023-06-27 Optum Services (Ireland) Limited Artificial intelligence recommendation system
CN112035674B (zh) * 2020-08-28 2023-05-23 康键信息技术(深圳)有限公司 导诊数据获取方法、装置、计算机设备和存储介质
US11675631B2 (en) * 2020-09-29 2023-06-13 Kyndryl, Inc. Balancing mainframe and distributed workloads based on performance and costs
US12518165B2 (en) * 2020-11-06 2026-01-06 Moffett International Co., Limited Method and system for convolution with workload-balanced activation sparsity
US20220180178A1 (en) * 2020-12-08 2022-06-09 Nvidia Corporation Neural network scheduler

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305671A (zh) * 2018-01-23 2018-07-20 深圳科亚医疗科技有限公司 由计算机实现的医学图像调度方法、调度系统及存储介质
CN110232971A (zh) * 2019-05-24 2019-09-13 深圳市翩翩科技有限公司 一种医生推荐方法及装置
CN110377714A (zh) * 2019-07-18 2019-10-25 泰康保险集团股份有限公司 基于迁移学习的文本匹配方法、装置、介质及设备

Also Published As

Publication number Publication date
CN114981803A (zh) 2022-08-30
US20220406418A1 (en) 2022-12-22
US12217838B2 (en) 2025-02-04
WO2022134032A1 (zh) 2022-06-30

Similar Documents

Publication Publication Date Title
CN110210571B (zh) 图像识别方法、装置、计算机设备及计算机可读存储介质
CN110610181B (zh) 医学影像识别方法及装置、电子设备及存储介质
JP7285589B2 (ja) 対話型健康状態評価方法およびそのシステム
JP7136216B2 (ja) 授業支援システム、判定装置、授業支援方法及びプログラム
CN109446961B (zh) 姿势检测方法、装置、设备及存储介质
CN115227234B (zh) 一种基于摄像头的心肺复苏按压动作评估方法与系统
US20170060828A1 (en) Gesture based annotations
WO2021114847A1 (zh) 网络通话方法、装置、计算机设备及存储介质
CN113724189A (zh) 图像处理方法、装置、设备及存储介质
US20180286389A1 (en) Conference system, conference system control method, and program
CN111178298A (zh) 人体关键点检测方法、装置、电子设备及存储介质
CN114981803B (zh) 一种体检信息分配方法及装置
CN111984180A (zh) 终端读屏方法、装置、设备及计算机可读存储介质
CN113784045B (zh) 聚焦互动方法、装置、介质和电子设备
US20220270500A1 (en) Information processing apparatus, information processing method, and program
CN113238652B (zh) 视线估计方法、装置、设备及存储介质
CN109330559B (zh) 皮质醇含量的测评方法、装置、计算机设备及计算机存储介质
CN110545386B (zh) 用于拍摄图像的方法和设备
CN109785941B (zh) 一种医生的推荐方法和装置
CN114004802B (zh) 基于模糊综合评价法的数据标注方法、装置及存储介质
CN118542688A (zh) 心胸比的确定方法及装置、程序产品及医疗设备
CN112397194A (zh) 用于生成患者病情归因解释模型的方法、装置和电子设备
CN114120352B (zh) 一种人体轮廓点检测方法、装置、电子设备和存储介质
CN114668365A (zh) 视力检测方法
CN115424719A (zh) 一种研发基于深度学习与ar的肠造口智慧诊疗设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant