[go: up one dir, main page]

CN113657406A - 模型训练和特征提取方法、装置、电子设备及存储介质 - Google Patents

模型训练和特征提取方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113657406A
CN113657406A CN202110791892.1A CN202110791892A CN113657406A CN 113657406 A CN113657406 A CN 113657406A CN 202110791892 A CN202110791892 A CN 202110791892A CN 113657406 A CN113657406 A CN 113657406A
Authority
CN
China
Prior art keywords
feature
sample
positive
loss value
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110791892.1A
Other languages
English (en)
Other versions
CN113657406B (zh
Inventor
冯维新
王远江
袁野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kuangshi Technology Co Ltd
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Kuangshi Technology Co Ltd
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuangshi Technology Co Ltd, Beijing Megvii Technology Co Ltd filed Critical Beijing Kuangshi Technology Co Ltd
Priority to CN202110791892.1A priority Critical patent/CN113657406B/zh
Publication of CN113657406A publication Critical patent/CN113657406A/zh
Application granted granted Critical
Publication of CN113657406B publication Critical patent/CN113657406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种模型训练和特征提取方法、装置、电子设备及存储介质,包括:针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;将至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;在基于待查询特征向量和i次模型训练所得到的正样本特征向量确定的第一损失值不满足预设条件时,基于第一损失值对目标特征提取模型和在线特征提取模型中的参数进行更新,在更新时,利用该张样本图像的至少两个正样本特征向量来确定第一损失值,有效缩小正样本与负样本之间的数量差距,继而提高模型训练精度。

Description

模型训练和特征提取方法、装置、电子设备及存储介质
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种模型训练和特征提取方法、装置、电子设备及存储介质。
背景技术
自监督学习是一种无监督学习方法,无需依赖人工为样本设置标签来训练模型,而是利用大量未携带标签的样本来训练模型,其中,训练好的模型可以应用于图像识别,目标检测,语义分割等领域。
针对样本集中的每张样本图像,在利用该样本图像对模型训练时,现有的自监督学习方法通常将该张样本图像的一次数据增强后的图像作为正样本,其它图像均作为负样本,由于这种方式确定出的正样本数量太少,导致正样本与负样本之间的数量相差太大,从而导致训练好的模型的精度不高。
发明内容
鉴于此,本申请实施例的目的在于提供一种模型训练和特征提取方法、装置、电子设备及存储介质,以解决上述问题。
第一方面,本申请实施例提供一种模型训练方法,所述方法包括:针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数;将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定;基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值;在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
在上述实现过程中,针对每次模型训练,将一张样本图像的至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将剩余的增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量,继而在基于待查询特征向量和i次模型训练所得到的正样本特征向量,确定的第一损失值不满足预设条件时,基于第一损失值对目标特征提取模型和所述在线特征提取模型中的参数进行更新,在更新时,由于利用该张样本图像的至少两个正样本特征向量来确定第一损失值,因此,与现有技术利用该张样本图像的一个正样本特征向量来确定第一损失值相比,本申请有效缩小了正样本与负样本之间的数量差距,继而保证训练好的模型的精度高于现有技术。
基于第一方面,在一种可能的设计中,所述基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值,包括:获取精炼负样本特征集;所述精炼负样本特征集包括:负样本库中与待查特征向量的内积满足第一预设条件的特征向量;所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;i为大于等于2的正整数;基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值。
在上述实现过程中,本申请考虑到针对负样本库中的每个特征向量,该特征向量与待查特征向量的内积很大,则表征该特征向量与待查特征向量非常相似,此时,若将该特征向量作为负样本,不仅会增加模型训练复杂度,而且会导致最终训练好的模型的准确度不高,因此,通过将负样本库中与待查特征向量的内积满足第一预设条件的特征向量作为精炼负样本特征集中的向量,并基于精炼负样本特征集、待查询特征向量和第i次模型训练所得到的正样本特征向量,确定第一损失值,充分考虑了样本图像之间的相似性,继而保证利用确定出的第一损失值能够提高模型训练精度。
基于第一方面,在一种可能的设计中,基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值,包括:将所述精炼负样本特征集、所述待查询特征向量,以及所述第i次模型训练所得到的正样本特征向量,输入至第一损失函数
Figure BDA0003161366240000031
中,得到第一损失参数Loss1的所述第一损失值;kv表征第i次模型训练所得的第v个正样本特征向量;V表征第i次模型训练所得到的正样本特征向量的数量;q表征所述待查特征向量;τ表征温度常量;um表征所述精炼负样本特征集中的第m个特征向量;M表征所述精炼负样本特征集中的特征向量的数量。
在上述实现过程中,根据待查特征向量和精炼负样本特征集中的各个特征向量的内积,以及待查特征向量与第i次模型训练所得到的各个正样本特征向量的内积,确定第一损失值,以进一步提高模型训练精度。
基于第一方面,在一种可能的设计中,所述方法还包括:获取历史正特征集和历史负特征集;所述历史正特征集包括:历史特征库中与所述样本图像对应的特征向量;所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;所述历史负特征集包括:所述历史特征库中除所述历史正特征集以外的特征向量;基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值;其中,所述在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件,包括:在确定所述第一损失值和所述第二损失值不满足所述预设条件时,基于所述第一损失值和所述第二损失值,对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
在上述实现过程中,基于历史正特征集、历史负特征集和待查询特征向量,确定第二损失值;并在确定第一损失值和第二损失值不满足所述预设条件时,基于第一损失值和第二损失值对模型进行更新,可以进一步提高训练好的模型的精度。
基于第一方面,在一种可能的设计中,所述基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值,包括:针对所述历史正特征集中的每个正特征向量,从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量;其中,每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值;根据多个子损失值,得到所述第二损失值。
在上述实现过程中,针对历史正特征集中的每个正特征向量,从历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量;基于待查询特征向量、该正特征向量和对应的负特征向量,准确地得到子损失值;继而根据多个子损失值,确定出的第二损失值可以用于进一步提高模型训练精度。
基于第一方面,在一种可能的设计中,所述基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值,包括:将所述待查询特征向量、该正特征向量和对应的负特征向量,输入至第二损失函数
Figure BDA0003161366240000051
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;L表征所述对应的负特征向量的数量;pl表征所述对应的负特征向量中的第l个负特征向量。
在上述实现过程中,针对历史正特征集中的每个正特征向量,根据待查特征向量和该正特征向量的内积,以及待查特征向量与对应的负特征向量的内积,确定与该正特征向量对应的子损失值,以进一步提高模型训练精度。
基于第一方面,在一种可能的设计中,所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果;每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;其中,K为大于等于1的正整数。
在上述实现过程中,针对第i次模型训练,由于最近的K个训练周期所对应的平均结果对第i次模型训练具有较大的参考意义,因此,利用最近的K个训练周期所对应的平均结果确定出的损失值可以有助于提高模型训练精度。
第二方面,本申请实施例提供一种特征提取方法,所述方法包括:获取图像;利用第一方面所述的方法训练好的在线特征提取网络,对所述图像进行特征提取,得到所述图像的特征向量。
在上述实现过程中,在利用样本集中的一张样本图像来训练在线特提取网络时,本申请利用了该张样本图像的至少两个正样本特征向量来确定第一损失值,因此,与现有技术利用该张样本图像的一个正样本特征向量来确定第一损失值相比,本申请有效缩小了正样本与负样本之间的数量差距,继而保证训练好的模型的精度高于现有技术,从而利用训练好的在线特征提取网络能够更好地提取图像特征。
第三方面,本申请实施例提供一种模型训练装置,所述装置包括:增强图像获取单元,用于针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数;第一输入单元,用于将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定;第一损失确定单元,用于基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值;更新单元,用于在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
基于第三方面,在一种可能的设计中,所述第一损失确定单元,包括:精炼负样本获取单元,用于获取精炼负样本特征集;所述精炼负样本特征集包括:负样本库中与待查特征向量的内积满足第一预设条件的特征向量;所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;i为大于等于2的正整数;第一子损失确定单元,用于基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值。
基于第三方面,在一种可能的设计中,所述第一子损失确定单元,具体用于将所述精炼负样本特征集、所述待查询特征向量,以及所述第i次模型训练所得到的正样本特征向量,输入至第一损失函数
Figure BDA0003161366240000061
中,得到第一损失参数Loss1的所述第一损失值;kv表征第i次模型训练所得的第v个正样本特征向量;V表征第i次模型训练所得到的正样本特征向量的数量;q表征所述待查特征向量;τ表征温度常量;um表征所述精炼负样本特征集中的第m个特征向量;M表征所述精炼负样本特征集中的特征向量的数量。
基于第三方面,在一种可能的设计中,所述装置还包括:历史特征集获取单元,用于获取历史正特征集和历史负特征集;所述历史正特征集包括:历史特征库中与所述样本图像对应的特征向量;所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;所述历史负特征集包括:所述历史特征库中除所述历史正特征集以外的特征向量;第二损失确定单元,用于基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值;其中,所述更新单元,具体用于在确定所述第一损失值和所述第二损失值不满足所述预设条件时,基于所述第一损失值和所述第二损失值,对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
基于第三方面,在一种可能的设计中,所述第二损失确定单元,包括:负特征确定单元,用于针对所述历史正特征集中的每个正特征向量,从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量;其中,每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;子损失值确定单元,用于基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值;第二子损失确定单元,用于根据多个子损失值,得到所述第二损失值。
基于第三方面,在一种可能的设计中,所述子损失值确定单元,具体用于将所述待查询特征向量、该正特征向量和对应的负特征向量,输入至第二损失函数
Figure BDA0003161366240000081
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;L表征所述对应的负特征向量的数量;pl表征所述对应的负特征向量中的第l个负特征向量。
基于第三方面,在一种可能的设计中,所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果;每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;其中,K为大于等于1的正整数。
第四方面,本申请实施例提供一种特征提取装置,所述装置包括:图像获取单元,用于获取图像;特征提取单元,用于利用第一方面所述的方法训练好的在线特征提取网络,对所述图像进行特征提取,得到所述图像的特征向量。
第五方面,本申请实施例提供一种电子设备,包括处理器以及与所述处理器连接的存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述电子设备执行第一方面或第二方面所述的方法。
第六方面,本申请实施例提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行第一方面或第二方面所述的方法。
本申请的其他特征向量和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的模型训练方法的流程示意图。
图2为本申请实施例提供的特征提取方法的流程示意图。
图3为本申请实施例提供的模型训练装置的结构示意图。
图4为本申请实施例提供的特征提取装置的结构示意图。
图5为本申请实施例提供的电子设备的结构示意图。
图标:300-模型训练装置;310-增强图像获取单元;320-第一输入单元;330-第一损失确定单元;340-更新单元;400-特征提取装置;410-图像获取单元;420-特征提取单元;500-电子设备;501-处理器;502-存储器;503-通信接口。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1为本申请实施例提供的一种模型训练方法的流程图,下面将对图1所示的流程进行详细阐述,所述方法包括步骤:S11-S14。
S11:针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数。
S12:将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定。
S13:基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值。
S14:在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
下面对上述方法进行详细介绍。
S11:针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数。
其中,图像样本集中包括多张不同的样本图像,从图像样本集中依次选取一张样本图像来用于一次模型训练,不断轮循地从样本图像集中选取样本图像来进行模型训练。
在实际实施过程中,S11可以按照如下方式实施,针对第i次模型训练,从图像样本集中选取一张样本图像,并对所述样本图像进行至少三次数据增强,其中,一次数据增强得到一张增强图像,继而得到至少三张增强图像,数据增强的方式包括:随机裁剪,水平翻转,色度调整、亮度调整,饱和度调整,随机地添加高斯噪声等中的至少一种;由于数据增强具有随机性,因此,所述至少三张增强图像各不相同。
作为一种实施方式,针对第i次模型训练,从图像样本集中选取一张样本图像,根据所述样本图像在图像样本集中的索引位置,从预先存储的索引位置和增强图像集的对应关系中,查找出与所述样本图像的索引位置对应的增强图像集,其中,所述对应的增强图像集中包括所述样本图的至少三张增强图像。
在得到所述至少三张增强图像之后,执行S12。
S12:将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定。
具体地,针对剩余增强图像中的每张增强图像,目标特征提取模型对该增强图像进行特征提取,得到与该张增强图像对应的一个正样本特征向量,由于剩余增强图像的数量为至少两张,因此,针对第i次模型训练,目标特征提取模型输出的正样本特征向量的数量为至少两个。
值得一提的是,若S11中的i等于1,则S12中的在线特征提取模型和目标特征提取模型相同。
若S11中的i不等于1,则S12中的在线特征提取模型和目标特征提取模型不同。在线特征提取模型和目标特征提取模型之间的关系在后续的步骤S14中再进行介绍。
S13:基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值。
作为一种实施方式,S13包括步骤A1-A2。
A1:获取精炼负样本特征集;所述精炼负样本特征集包括:负样本库中与待查特征向量的内积满足第一预设条件的特征向量;所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;i为大于等于2的正整数。
值得一提的是,每个平均结果的维度与每个正样本特征向量的维度相同。
在实际实施过程中,A1可以按照如下方式实施,针对所述负样本库中的每个特征向量,确定该特征向量与待查特征向量的内积,并对负样本库中的各个特征向量的内积进行大小排序,然后根据排序结果,从负样本库中选取N个内积较小的特征向量作为精炼负样本特征集中的特征向量,继而得到精炼负样本特征集;其中,N为大于等于1的正整数;值得一提的是,被选取出的N个内积较小的各个特征向量均满足第一预设条件。
作为一种实施方式,A1可以按照如下方式实施,针对所述负样本库中的每个特征向量,确定该特征向量与待查特征向量的内积,若确定该内积小于预设门限值,则表征该特征向量满足第一预设条件,继而将该特征向量作为精炼负样本特征集中的特征向量。其中,所述预设门限值根据用户需求设定,预设门限值越小,精炼负样本特征集中的特征向量相对越少。
为了提高模型训练精度,作为一种实施方式,所述负样本库中存储前Y次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;其中,Y为小于等于i-1的正整数。
A2:基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值。
具体地,将所述精炼负样本特征集中的各个特征向量、所述待查询特征向量q,以及所述第i次模型训练所得到的正样本特征向量,输入至第一损失函数
Figure BDA0003161366240000121
中,得到第一损失参数Loss1的所述第一损失值;kv表征第i次模型训练所得的第v个正样本特征向量;V表征第i次模型训练所得到的正样本特征向量的数量;q表征所述待查特征向量;τ表征温度常量,为经验值;um表征所述精炼负样本特征集中的第m个特征向量;M表征所述精炼负样本特征集中的特征向量的数量。
作为一种实施方式,S13可以按照如下方式实施,将负样本库中的各个特征向量、所述待查询特征向量,以及所述第i次模型训练所得到的正样本特征向量,输入至第一损失函数
Figure BDA0003161366240000131
中,得到第一损失参数Loss1的所述第一损失值;ut表征所述负样本库中的第t个特征向量;T表征所述负样本库中的特征向量的数量。
在确定出第一损失值之后,执行S14。
S14:在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
值得一提的是,在线特征提取模型和目标特征提取模型的网络结构相同,在第一次进行模型训练时所用的线特征提取模型和目标特征提取模型相同。
在实际实施过程中,S14可以按照如下方式实施,在确定所述第一损失值大于第一预设阈值时,基于所述第一损失值和梯度反向传播算法,对所述在线特征提取模型中的参数进行更新,得到更新后的在线特征提取模型,针对目标特征提取模型中的每个参数ξ,将该参数ξ的值和更新后的在线特征提取模型中与该参数ξ的位置对应的参数θ的值,输入至参数更新函数ξ←αξ+(1-α)θ中,得到该参数ξ更新后的值;其中,α为经验值,用于控制参数ξ的值的更新步长;继而利用该参数ξ更新后的值对目标特征提取模型中的该参数ξ的值进行更新,直到将目标特征模型中的全部参数的值均更新完,得到更新后的目标特征提取模型;其中,所述第一预设阈值根据用户需求设定,所述第一预设阈值越小,最终训练好的在线特征提取模型的精度相对越高。
在得到更新后的在线特征提取模型和更新后的目标特征提取模型之后,将i的值加1,以对i的值进行更新,继而利用更新后的目标提取模型和更新后的在线特征提取模型执行步骤S11-S13,并在利用S13确定出的新的损失值小于等于第一预设阈值时,停止模型训练,并将更新后的在线特征提取模型作为训练好的在线特征提取模型。
作为一种实施方式,在确定第一损失值大于第一预设阈值时,确定i的值是是否等于预设次数,若等于,则基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,得到更新后的目标特征提取模型和更新后的在线特征提取模型,停止模型训练,并将多次模型训练所确定出的最小损失值所对应的在线特征提取模型作为训练好的在线特征提取模型。
作为一种实施方式,所述方法还包括步骤B1-B2。
B1:获取历史正特征集和历史负特征集;所述历史正特征集包括:历史特征库中与所述样本图像对应的特征向量;所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;所述历史负特征集包括:所述历史特征库中除所述历史正特征集以外的特征向量。
在实际实施过程中,B1可以按照如下方式实施,针对历史特征库中的每个特征向量,若该特征向量是基于所述样本图像所确定出的,则将该特征向量作为历史正特征集中的特征向量,反之,则确定该特征向量不为历史正特征集中的特征向量,继而得到历史正特征集;将历史特征库中除历史正特征集以外的特征向量作为历史负特征集中的特征向量,继而得到历史负特征集。
为了提高模型训练精度,作为一种实施方式,所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果;每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;其中,K为大于等于1的正整数。
作为一种实施方式,不同训练周期所确定出的平均结果位于历史特征库的不同的列中,同一个训练周期所确定出的平均结果位于历史特征库的同一列中。
B2:基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值。
作为一种实施方式,步骤B2包括步骤B21-B23。
B21:针对所述历史正特征集中的每个正特征向量,从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量;其中,每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练。
在实际实施过程中,B21可以按照如下方式实施,针对历史正特征集中的每个正特征向量,根据该正特征向量在历史特征库中的位置索引,从预先存储的位置索引与训练周期的对应关系中,查找出该正特征向量的位置索引所对应的训练周期,继而根据历史负特征集中的各个负特征向量在历史特征库中的位置索引所对应的训练周期,从历史特征集中确定出与该正特征向量属于同一个训练周期的负特征向量。
作为一种实施方式,B21可以按照如下方式实施,针对所述历史正特征集中的每个正特征向量,从所述历史负特征集中随机地确定出与该正特征向量属于同一个训练周期的L个负特征向量。
针对历史正特征集中的每个正特征向量,在确定出与该正特征向量对应的负特征向量之后,执行步骤B22。
B22:基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值。
具体地,将所述待查询特征向量、该正特征向量和对应的负特征向量,输入至第二损失函数
Figure BDA0003161366240000151
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;L表征所述对应的负特征向量的数量;pl表征所述对应的负特征向量中的第l个负特征向量。
B23:根据多个子损失值,得到所述第二损失值。
在实际实施过程中,B23可以按照如下方式实施,对所述多个子损失值求和,得到所述第二损失值。
若历史特征集中只包括一个正特征向量,作为一种实施方式,B2可以按照如下方式实施,将所述待查询特征向量、该正特征向量和所述历史负特征集中的负特征向量,输入至第二损失函数
Figure BDA0003161366240000161
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;L表征所述历史负特征集中的负特征向量的数量;pl表征所述历史负特征集中的第l个负特征向量。
若历史特征集中只包括一个正特征向量,作为一种实施方式,B2可以按照如下方式实施,将所述待查询特征向量、该正特征向量和所述历史负特征集中的D个负特征向量,输入至第二损失函数
Figure BDA0003161366240000162
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;pd表征所述D个负特征向量中的第d个负特征向量;D小于历史负特征集中的负特征向量的数量。
对应的,S14包括:在确定所述第一损失值和所述第二损失值不满足所述预设条件时,基于所述第一损失值和所述第二损失值,对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
具体地,确定所述第一损失值和所述第二损失值之和为总损失值,在确定总损失值大于第二预设阈值时,基于所述总损失值和梯度反向传播算法,对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的总损失值小于等于第二预设阈值,并将更新后的在线特征提取模型作为训练好的在线特征提取模型。其中,所述第二预设阈值根据用户需求设定,所述第二预设阈值越小,最终训练好的在线特征提取模型的精度相对越高。
其中,在线特征提取模型和目标特征提取模型中的参数的更新方式请参照前述实施方式,因此,在此不再赘述。
在介绍完模型训练方法之后,下面对特征提取方法进行介绍。
请参照图2,图2为本申请实施例提供的一种特征提取方法的流程图,下面将对图2所示的流程进行详细阐述,所述方法包括步骤:S21-S22。
S21:获取图像。
S22:利用图1所述的方法训练好的在线特征提取网络,对所述图像进行特征提取,得到所述图像的特征向量。
请参照图3,图3是本申请实施例提供的一种模型训练装置300的结构框图。下面将对图3所示的结构框图进行阐述,所示装置包括:
增强图像获取单元310,用于针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数。
第一输入单元320,用于将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定。
第一损失确定单元330,用于基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值。
更新单元340,用于在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
作为一种实施方式,所述第一损失确定单元330,包括:精炼负样本获取单元,用于获取精炼负样本特征集;所述精炼负样本特征集包括:负样本库中与待查特征向量的内积满足第一预设条件的特征向量;所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;i为大于等于2的正整数;第一子损失确定单元,用于基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值。
作为一种实施方式,所述第一子损失确定单元,具体用于将所述精炼负样本特征集、所述待查询特征向量,以及所述第i次模型训练所得到的正样本特征向量,输入至第一损失函数
Figure BDA0003161366240000181
中,得到第一损失参数Loss1的所述第一损失值;kv表征第i次模型训练所得的第v个正样本特征向量;V表征第i次模型训练所得到的正样本特征向量的数量;q表征所述待查特征向量;τ表征温度常量;um表征所述精炼负样本特征集中的第m个特征向量;M表征所述精炼负样本特征集中的特征向量的数量。
作为一种实施方式,所述装置还包括:历史特征集获取单元,用于获取历史正特征集和历史负特征集;所述历史正特征集包括:历史特征库中与所述样本图像对应的特征向量;所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;所述历史负特征集包括:所述历史特征库中除所述历史正特征集以外的特征向量;第二损失确定单元,用于基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值;其中,所述更新单元340,具体用于在确定所述第一损失值和所述第二损失值不满足所述预设条件时,基于所述第一损失值和所述第二损失值,对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
作为一种实施方式,所述第二损失确定单元,包括:负特征确定单元,用于针对所述历史正特征集中的每个正特征向量,从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量;其中,每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;子损失值确定单元,用于基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值;第二子损失确定单元,用于根据多个子损失值,得到所述第二损失值。
作为一种实施方式,所述子损失值确定单元,具体用于将所述待查询特征向量、该正特征向量和对应的负特征向量,输入至第二损失函数
Figure BDA0003161366240000191
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;L表征所述对应的负特征向量的数量;pl表征所述对应的负特征向量中的第l个负特征向量。
作为一种实施方式,所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果;每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;其中,K为大于等于1的正整数。
本实施例对的各功能单元实现各自功能的过程,请参见上述图1所示实施例中描述的内容,此处不再赘述。
请参照图4,图4是本申请实施例提供的一种特征提取装置400的结构框图。下面将对图4所示的结构框图进行阐述,所示装置包括:
图像获取单元410,用于获取图像。
特征提取单元420,用于利用图1所述的方法训练好的在线特征提取网络,对所述图像进行特征提取,得到所述图像的特征向量。
本实施例对的各功能单元实现各自功能的过程,请参见上述图2所示实施例中描述的内容,此处不再赘述。
请参照图5,图5为本申请实施例提供的一种电子设备500的结构示意图,电子设备500可以是个人电脑、平板电脑、智能手机、个人数字助理(personal digital assistant,PDA)等。
电子设备500可以包括:存储器502、处理器501、通信接口503和通信总线,通信总线用于实现这些组件的连接通信。
所述存储器502用于存储本申请实施例提供的模型训练方法、特征提取方法和装置对应的计算程序指令等各种数据,其中,存储器502可以是,但不限于,随机存取存储器,只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器501用于读取并运行存储于存储器中的模型训练方法、特征提取方法和装置对应的计算机程序指令,以针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数;将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定;基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值;在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
其中,处理器501可能是一种集成电路芯片,具有信号的处理能力。上述的处理器501可以是通用处理器,包括CPU、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
通信接口503,用于接收或者发送数据。
此外,本申请实施例还提供了一种存储介质,在该存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行本申请任一项实施方式所提供的方法。
综上所述,本申请各实施例提出的模型训练和特征提取方法、装置、电子设备及存储介质,针对每次模型训练,将一张样本图像的至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将剩余的增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量,继而在基于待查询特征向量和i次模型训练所得到的正样本特征向量,确定的第一损失值不满足预设条件时,基于第一损失值对目标特征提取模型和所述在线特征提取模型中的参数进行更新,在更新时,由于利用该张样本图像的至少两个正样本特征向量来确定第一损失值,因此,与现有技术利用该张样本图像的一个正样本特征向量来确定第一损失值相比,本申请有效缩小了正样本与负样本之间的数量差距,继而保证训练好的模型的精度高于现有技术。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

Claims (12)

1.一种模型训练方法,其特征在于,所述方法包括:
针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数;
将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定;
基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值;
在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
2.根据权利要求1所述的方法,其特征在于,所述基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值,包括:
获取精炼负样本特征集;所述精炼负样本特征集包括:负样本库中与待查特征向量的内积满足第一预设条件的特征向量;所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;i为大于等于2的正整数;
基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值。
3.根据权利要求2所述的方法,其特征在于,基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量,得到所述第一损失值,包括:
将所述精炼负样本特征集、所述待查询特征向量,以及所述第i次模型训练所得到的正样本特征向量,输入至第一损失函数
Figure FDA0003161366230000021
中,得到第一损失参数Loss1的所述第一损失值;kv表征第i次模型训练所得的第v个正样本特征向量;V表征第i次模型训练所得到的正样本特征向量的数量;q表征所述待查特征向量;τ表征温度常量;um表征所述精炼负样本特征集中的第m个特征向量;M表征所述精炼负样本特征集中的特征向量的数量。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取历史正特征集和历史负特征集;所述历史正特征集包括:历史特征库中与所述样本图像对应的特征向量;所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果;所述历史负特征集包括:所述历史特征库中除所述历史正特征集以外的特征向量;
基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值;
其中,所述在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件,包括:
在确定所述第一损失值和所述第二损失值不满足所述预设条件时,基于所述第一损失值和所述第二损失值,对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
5.根据权利要去4所述的方法,其特征在于,所述基于所述历史正特征集、所述历史负特征集和所述待查询特征向量,确定第二损失值,包括:
针对所述历史正特征集中的每个正特征向量,从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量;其中,每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;
基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值;
根据多个子损失值,得到所述第二损失值。
6.根据权利要求5所述的方法,其特征在于,所述基于待查询特征向量、该正特征向量和对应的负特征向量,得到子损失值,包括:
将所述待查询特征向量、该正特征向量和对应的负特征向量,输入至第二损失函数
Figure FDA0003161366230000031
得到子损失参数Loss2的所述子损失值;q表征所述待查特征向量;h表征该正特征向量;τ表征温度常量;L表征所述对应的负特征向量的数量;pl表征所述对应的负特征向量中的第l个负特征向量。
7.根据权利要求4所述的方法,其特征在于,所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果;每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练;其中,K为大于等于1的正整数。
8.一种特征提取方法,其特征在于,所述方法包括:
获取图像;
利用权利要求1-7所述的方法训练好的在线特征提取网络,对所述图像进行特征提取,得到所述图像的特征向量。
9.一种模型训练装置,其特征在于,所述装置包括:
增强图像获取单元,用于针对第i次模型训练,获取图像样本集中的一张样本图像对应的至少三张增强图像;所述至少三张增强图像为对所述样本图像进行数据增强得到;所述至少三张增强图像各不相同;i为大于等于1的正整数;
第一输入单元,用于将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中,得到待查特征向量,并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中,得到至少两个正样本特征向量;所述目标特征提取模型根据所述在线特征提取模型确定;
第一损失确定单元,用于基于所述待查询特征向量和i次模型训练所得到的正样本特征向量,确定第一损失值;
更新单元,用于在确定所述第一损失值不满足预设条件时,基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新,直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。
10.一种特征提取装置,其特征在于,所述装置包括:
图像获取单元,用于获取图像;
特征提取单元,用于利用权利要求1-7中任一权项所述的方法训练好的在线特征提取网络,对所述图像进行特征提取,得到所述图像的特征向量。
11.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器读取并运行时,执行如权利要求1-8中任一项所述的方法。
12.一种存储介质,其特征在于,所述存储介质上存储有计算机程序指令,所述计算机程序指令被计算机读取并运行时,执行如权利要求1-8中任一权项所述的方法。
CN202110791892.1A 2021-07-13 2021-07-13 模型训练和特征提取方法、装置、电子设备及存储介质 Active CN113657406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110791892.1A CN113657406B (zh) 2021-07-13 2021-07-13 模型训练和特征提取方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110791892.1A CN113657406B (zh) 2021-07-13 2021-07-13 模型训练和特征提取方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113657406A true CN113657406A (zh) 2021-11-16
CN113657406B CN113657406B (zh) 2024-04-23

Family

ID=78478027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110791892.1A Active CN113657406B (zh) 2021-07-13 2021-07-13 模型训练和特征提取方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113657406B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119989A (zh) * 2021-11-29 2022-03-01 北京百度网讯科技有限公司 图像特征提取模型的训练方法、装置及电子设备
CN114155366A (zh) * 2022-02-07 2022-03-08 北京每日优鲜电子商务有限公司 动态柜图像识别模型训练方法、装置、电子设备和介质
CN114881937A (zh) * 2022-04-15 2022-08-09 北京医准智能科技有限公司 一种针对超声切面的检测方法、装置及计算机可读介质
CN114926658A (zh) * 2022-06-15 2022-08-19 平安科技(深圳)有限公司 图片特征的提取方法、装置、计算机设备及可读存储介质
CN115375911A (zh) * 2022-09-15 2022-11-22 北京爱笔科技有限公司 基于重排序的特征提取、特征提取模型的训练方法和装置
WO2023221790A1 (zh) * 2022-05-16 2023-11-23 腾讯科技(深圳)有限公司 图像编码器的训练方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020006961A1 (zh) * 2018-07-03 2020-01-09 北京字节跳动网络技术有限公司 用于提取图像的方法和装置
WO2020155939A1 (zh) * 2019-01-31 2020-08-06 广州视源电子科技股份有限公司 图像识别方法、装置、存储介质和处理器
CN111814810A (zh) * 2020-08-11 2020-10-23 Oppo广东移动通信有限公司 图像识别方法、装置、电子设备及存储介质
US20200410290A1 (en) * 2019-06-25 2020-12-31 Fujitsu Limited Information processing apparatus and information processing method
CN112232384A (zh) * 2020-09-27 2021-01-15 北京迈格威科技有限公司 模型训练方法、图像特征提取方法、目标检测方法和装置
CN112949750A (zh) * 2021-03-25 2021-06-11 清华大学深圳国际研究生院 一种图像分类方法及计算机可读存储介质
CN112990432A (zh) * 2021-03-04 2021-06-18 北京金山云网络技术有限公司 目标识别模型训练方法、装置及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020006961A1 (zh) * 2018-07-03 2020-01-09 北京字节跳动网络技术有限公司 用于提取图像的方法和装置
WO2020155939A1 (zh) * 2019-01-31 2020-08-06 广州视源电子科技股份有限公司 图像识别方法、装置、存储介质和处理器
US20200410290A1 (en) * 2019-06-25 2020-12-31 Fujitsu Limited Information processing apparatus and information processing method
CN111814810A (zh) * 2020-08-11 2020-10-23 Oppo广东移动通信有限公司 图像识别方法、装置、电子设备及存储介质
CN112232384A (zh) * 2020-09-27 2021-01-15 北京迈格威科技有限公司 模型训练方法、图像特征提取方法、目标检测方法和装置
CN112990432A (zh) * 2021-03-04 2021-06-18 北京金山云网络技术有限公司 目标识别模型训练方法、装置及电子设备
CN112949750A (zh) * 2021-03-25 2021-06-11 清华大学深圳国际研究生院 一种图像分类方法及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周幸;陈立福;: "基于双注意力机制的遥感图像目标检测", 计算机与现代化, no. 08 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119989A (zh) * 2021-11-29 2022-03-01 北京百度网讯科技有限公司 图像特征提取模型的训练方法、装置及电子设备
CN114119989B (zh) * 2021-11-29 2023-08-11 北京百度网讯科技有限公司 图像特征提取模型的训练方法、装置及电子设备
CN114155366A (zh) * 2022-02-07 2022-03-08 北京每日优鲜电子商务有限公司 动态柜图像识别模型训练方法、装置、电子设备和介质
CN114155366B (zh) * 2022-02-07 2022-05-20 北京每日优鲜电子商务有限公司 动态柜图像识别模型训练方法、装置、电子设备和介质
CN114881937A (zh) * 2022-04-15 2022-08-09 北京医准智能科技有限公司 一种针对超声切面的检测方法、装置及计算机可读介质
CN114881937B (zh) * 2022-04-15 2022-12-09 北京医准智能科技有限公司 一种针对超声切面的检测方法、装置及计算机可读介质
WO2023221790A1 (zh) * 2022-05-16 2023-11-23 腾讯科技(深圳)有限公司 图像编码器的训练方法、装置、设备及介质
CN114926658A (zh) * 2022-06-15 2022-08-19 平安科技(深圳)有限公司 图片特征的提取方法、装置、计算机设备及可读存储介质
CN115375911A (zh) * 2022-09-15 2022-11-22 北京爱笔科技有限公司 基于重排序的特征提取、特征提取模型的训练方法和装置

Also Published As

Publication number Publication date
CN113657406B (zh) 2024-04-23

Similar Documents

Publication Publication Date Title
CN113657406A (zh) 模型训练和特征提取方法、装置、电子设备及存储介质
US8756174B2 (en) Forward feature selection for support vector machines
CN112257738B (zh) 机器学习模型的训练方法、装置和图像的分类方法、装置
CN110516705A (zh) 基于深度学习的目标跟踪方法、装置及计算机可读存储介质
CN112613581A (zh) 一种图像识别方法、系统、计算机设备和存储介质
CN113228062B (zh) 基于特征多样性学习的深度集成模型训练方法
CN111191533A (zh) 行人重识别的处理方法、装置、计算机设备和存储介质
CN109325440A (zh) 人体动作识别方法及系统
CN113191152B (zh) 一种基于实体扩展的实体识别方法和系统
CN116310994B (zh) 一种视频片段提取方法、装置、电子设备及介质
US20240331441A1 (en) Facial recognition method and apparatus, device and storage medium
CN107507199A (zh) 一种图像分割方法及系统
Valem et al. Unsupervised similarity learning through cartesian product of ranking references
CN111291754A (zh) 一种文本级联检测方法、装置及存储介质
CN115099189A (zh) 基于并行计算的语音识别模型及确定方法
CN113886578B (zh) 一种表单分类方法及装置
CN113887535A (zh) 模型训练方法、文本识别方法、装置、设备和介质
CN114139658A (zh) 分类模型的训练方法及计算机可读存储介质
CN108475339B (zh) 用于对图像中的对象分类的方法和系统
CN114358011B (zh) 命名实体提取方法与装置以及电子设备
Goshen et al. Balanced exploration and exploitation model search for efficient epipolar geometry estimation
CN119418108B (zh) 基于因果扩散模型的鲁棒图像分类方法及装置
CN116012873B (zh) 一种行人重识别方法、装置、电子设备及存储介质
CN117746069B (zh) 以图搜图的模型训练方法、和以图搜图方法
Yang et al. multi-target tracking and segmentation method for Missile-borne Image based on IoU association

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant