CN113657406A

CN113657406A - 模型训练和特征提取方法、装置、电子设备及存储介质

Info

Publication number: CN113657406A
Application number: CN202110791892.1A
Authority: CN
Inventors: 冯维新; 王远江; 袁野
Original assignee: Beijing Kuangshi Technology Co Ltd; Beijing Megvii Technology Co Ltd
Current assignee: Beijing Kuangshi Technology Co Ltd; Beijing Megvii Technology Co Ltd
Priority date: 2021-07-13
Filing date: 2021-07-13
Publication date: 2021-11-16
Anticipated expiration: 2041-07-13
Also published as: CN113657406B

Abstract

本申请提供一种模型训练和特征提取方法、装置、电子设备及存储介质，包括：针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；将至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；在基于待查询特征向量和i次模型训练所得到的正样本特征向量确定的第一损失值不满足预设条件时，基于第一损失值对目标特征提取模型和在线特征提取模型中的参数进行更新，在更新时，利用该张样本图像的至少两个正样本特征向量来确定第一损失值，有效缩小正样本与负样本之间的数量差距，继而提高模型训练精度。

Description

模型训练和特征提取方法、装置、电子设备及存储介质

技术领域

本申请涉及图像处理技术领域，具体而言，涉及一种模型训练和特征提取方法、装置、电子设备及存储介质。

背景技术

自监督学习是一种无监督学习方法，无需依赖人工为样本设置标签来训练模型，而是利用大量未携带标签的样本来训练模型，其中，训练好的模型可以应用于图像识别，目标检测，语义分割等领域。

针对样本集中的每张样本图像，在利用该样本图像对模型训练时，现有的自监督学习方法通常将该张样本图像的一次数据增强后的图像作为正样本，其它图像均作为负样本，由于这种方式确定出的正样本数量太少，导致正样本与负样本之间的数量相差太大，从而导致训练好的模型的精度不高。

发明内容

鉴于此，本申请实施例的目的在于提供一种模型训练和特征提取方法、装置、电子设备及存储介质，以解决上述问题。

第一方面，本申请实施例提供一种模型训练方法，所述方法包括：针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数；将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定；基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值；在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

在上述实现过程中，针对每次模型训练，将一张样本图像的至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将剩余的增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量，继而在基于待查询特征向量和i次模型训练所得到的正样本特征向量，确定的第一损失值不满足预设条件时，基于第一损失值对目标特征提取模型和所述在线特征提取模型中的参数进行更新，在更新时，由于利用该张样本图像的至少两个正样本特征向量来确定第一损失值，因此，与现有技术利用该张样本图像的一个正样本特征向量来确定第一损失值相比，本申请有效缩小了正样本与负样本之间的数量差距，继而保证训练好的模型的精度高于现有技术。

基于第一方面，在一种可能的设计中，所述基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值，包括：获取精炼负样本特征集；所述精炼负样本特征集包括：负样本库中与待查特征向量的内积满足第一预设条件的特征向量；所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；i为大于等于2的正整数；基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值。

在上述实现过程中，本申请考虑到针对负样本库中的每个特征向量，该特征向量与待查特征向量的内积很大，则表征该特征向量与待查特征向量非常相似，此时，若将该特征向量作为负样本，不仅会增加模型训练复杂度，而且会导致最终训练好的模型的准确度不高，因此，通过将负样本库中与待查特征向量的内积满足第一预设条件的特征向量作为精炼负样本特征集中的向量，并基于精炼负样本特征集、待查询特征向量和第i次模型训练所得到的正样本特征向量，确定第一损失值，充分考虑了样本图像之间的相似性，继而保证利用确定出的第一损失值能够提高模型训练精度。

基于第一方面，在一种可能的设计中，基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值，包括：将所述精炼负样本特征集、所述待查询特征向量，以及所述第i次模型训练所得到的正样本特征向量，输入至第一损失函数

中，得到第一损失参数Loss1的所述第一损失值；k_v表征第i次模型训练所得的第v个正样本特征向量；V表征第i次模型训练所得到的正样本特征向量的数量；q表征所述待查特征向量；τ表征温度常量；u_m表征所述精炼负样本特征集中的第m个特征向量；M表征所述精炼负样本特征集中的特征向量的数量。

在上述实现过程中，根据待查特征向量和精炼负样本特征集中的各个特征向量的内积，以及待查特征向量与第i次模型训练所得到的各个正样本特征向量的内积，确定第一损失值，以进一步提高模型训练精度。

基于第一方面，在一种可能的设计中，所述方法还包括：获取历史正特征集和历史负特征集；所述历史正特征集包括：历史特征库中与所述样本图像对应的特征向量；所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；所述历史负特征集包括：所述历史特征库中除所述历史正特征集以外的特征向量；基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值；其中，所述在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件，包括：在确定所述第一损失值和所述第二损失值不满足所述预设条件时，基于所述第一损失值和所述第二损失值，对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

在上述实现过程中，基于历史正特征集、历史负特征集和待查询特征向量，确定第二损失值；并在确定第一损失值和第二损失值不满足所述预设条件时，基于第一损失值和第二损失值对模型进行更新，可以进一步提高训练好的模型的精度。

基于第一方面，在一种可能的设计中，所述基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值，包括：针对所述历史正特征集中的每个正特征向量，从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量；其中，每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值；根据多个子损失值，得到所述第二损失值。

在上述实现过程中，针对历史正特征集中的每个正特征向量，从历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量；基于待查询特征向量、该正特征向量和对应的负特征向量，准确地得到子损失值；继而根据多个子损失值，确定出的第二损失值可以用于进一步提高模型训练精度。

基于第一方面，在一种可能的设计中，所述基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值，包括：将所述待查询特征向量、该正特征向量和对应的负特征向量，输入至第二损失函数

得到子损失参数Loss2的所述子损失值；q表征所述待查特征向量；h表征该正特征向量；τ表征温度常量；L表征所述对应的负特征向量的数量；p_l表征所述对应的负特征向量中的第l个负特征向量。

在上述实现过程中，针对历史正特征集中的每个正特征向量，根据待查特征向量和该正特征向量的内积，以及待查特征向量与对应的负特征向量的内积，确定与该正特征向量对应的子损失值，以进一步提高模型训练精度。

基于第一方面，在一种可能的设计中，所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果；每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；其中，K为大于等于1的正整数。

在上述实现过程中，针对第i次模型训练，由于最近的K个训练周期所对应的平均结果对第i次模型训练具有较大的参考意义，因此，利用最近的K个训练周期所对应的平均结果确定出的损失值可以有助于提高模型训练精度。

第二方面，本申请实施例提供一种特征提取方法，所述方法包括：获取图像；利用第一方面所述的方法训练好的在线特征提取网络，对所述图像进行特征提取，得到所述图像的特征向量。

在上述实现过程中，在利用样本集中的一张样本图像来训练在线特提取网络时，本申请利用了该张样本图像的至少两个正样本特征向量来确定第一损失值，因此，与现有技术利用该张样本图像的一个正样本特征向量来确定第一损失值相比，本申请有效缩小了正样本与负样本之间的数量差距，继而保证训练好的模型的精度高于现有技术，从而利用训练好的在线特征提取网络能够更好地提取图像特征。

第三方面，本申请实施例提供一种模型训练装置，所述装置包括：增强图像获取单元，用于针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数；第一输入单元，用于将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定；第一损失确定单元，用于基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值；更新单元，用于在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

基于第三方面，在一种可能的设计中，所述第一损失确定单元，包括：精炼负样本获取单元，用于获取精炼负样本特征集；所述精炼负样本特征集包括：负样本库中与待查特征向量的内积满足第一预设条件的特征向量；所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；i为大于等于2的正整数；第一子损失确定单元，用于基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值。

基于第三方面，在一种可能的设计中，所述第一子损失确定单元，具体用于将所述精炼负样本特征集、所述待查询特征向量，以及所述第i次模型训练所得到的正样本特征向量，输入至第一损失函数

基于第三方面，在一种可能的设计中，所述装置还包括：历史特征集获取单元，用于获取历史正特征集和历史负特征集；所述历史正特征集包括：历史特征库中与所述样本图像对应的特征向量；所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；所述历史负特征集包括：所述历史特征库中除所述历史正特征集以外的特征向量；第二损失确定单元，用于基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值；其中，所述更新单元，具体用于在确定所述第一损失值和所述第二损失值不满足所述预设条件时，基于所述第一损失值和所述第二损失值，对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

基于第三方面，在一种可能的设计中，所述第二损失确定单元，包括：负特征确定单元，用于针对所述历史正特征集中的每个正特征向量，从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量；其中，每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；子损失值确定单元，用于基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值；第二子损失确定单元，用于根据多个子损失值，得到所述第二损失值。

基于第三方面，在一种可能的设计中，所述子损失值确定单元，具体用于将所述待查询特征向量、该正特征向量和对应的负特征向量，输入至第二损失函数

基于第三方面，在一种可能的设计中，所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果；每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；其中，K为大于等于1的正整数。

第四方面，本申请实施例提供一种特征提取装置，所述装置包括：图像获取单元，用于获取图像；特征提取单元，用于利用第一方面所述的方法训练好的在线特征提取网络，对所述图像进行特征提取，得到所述图像的特征向量。

第五方面，本申请实施例提供一种电子设备，包括处理器以及与所述处理器连接的存储器，所述存储器内存储计算机程序，当所述计算机程序被所述处理器执行时，使得所述电子设备执行第一方面或第二方面所述的方法。

第六方面，本申请实施例提供一种存储介质，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行第一方面或第二方面所述的方法。

本申请的其他特征向量和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的模型训练方法的流程示意图。

图2为本申请实施例提供的特征提取方法的流程示意图。

图3为本申请实施例提供的模型训练装置的结构示意图。

图4为本申请实施例提供的特征提取装置的结构示意图。

图5为本申请实施例提供的电子设备的结构示意图。

图标：300-模型训练装置；310-增强图像获取单元；320-第一输入单元；330-第一损失确定单元；340-更新单元；400-特征提取装置；410-图像获取单元；420-特征提取单元；500-电子设备；501-处理器；502-存储器；503-通信接口。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行描述。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参照图1，图1为本申请实施例提供的一种模型训练方法的流程图，下面将对图1所示的流程进行详细阐述，所述方法包括步骤：S11-S14。

S11：针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数。

S12：将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定。

S13：基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值。

S14：在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

下面对上述方法进行详细介绍。

其中，图像样本集中包括多张不同的样本图像，从图像样本集中依次选取一张样本图像来用于一次模型训练，不断轮循地从样本图像集中选取样本图像来进行模型训练。

在实际实施过程中，S11可以按照如下方式实施，针对第i次模型训练，从图像样本集中选取一张样本图像，并对所述样本图像进行至少三次数据增强，其中，一次数据增强得到一张增强图像，继而得到至少三张增强图像，数据增强的方式包括：随机裁剪，水平翻转，色度调整、亮度调整，饱和度调整，随机地添加高斯噪声等中的至少一种；由于数据增强具有随机性，因此，所述至少三张增强图像各不相同。

作为一种实施方式，针对第i次模型训练，从图像样本集中选取一张样本图像，根据所述样本图像在图像样本集中的索引位置，从预先存储的索引位置和增强图像集的对应关系中，查找出与所述样本图像的索引位置对应的增强图像集，其中，所述对应的增强图像集中包括所述样本图的至少三张增强图像。

在得到所述至少三张增强图像之后，执行S12。

具体地，针对剩余增强图像中的每张增强图像，目标特征提取模型对该增强图像进行特征提取，得到与该张增强图像对应的一个正样本特征向量，由于剩余增强图像的数量为至少两张，因此，针对第i次模型训练，目标特征提取模型输出的正样本特征向量的数量为至少两个。

值得一提的是，若S11中的i等于1，则S12中的在线特征提取模型和目标特征提取模型相同。

若S11中的i不等于1，则S12中的在线特征提取模型和目标特征提取模型不同。在线特征提取模型和目标特征提取模型之间的关系在后续的步骤S14中再进行介绍。

作为一种实施方式，S13包括步骤A1-A2。

A1：获取精炼负样本特征集；所述精炼负样本特征集包括：负样本库中与待查特征向量的内积满足第一预设条件的特征向量；所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；i为大于等于2的正整数。

值得一提的是，每个平均结果的维度与每个正样本特征向量的维度相同。

在实际实施过程中，A1可以按照如下方式实施，针对所述负样本库中的每个特征向量，确定该特征向量与待查特征向量的内积，并对负样本库中的各个特征向量的内积进行大小排序，然后根据排序结果，从负样本库中选取N个内积较小的特征向量作为精炼负样本特征集中的特征向量，继而得到精炼负样本特征集；其中，N为大于等于1的正整数；值得一提的是，被选取出的N个内积较小的各个特征向量均满足第一预设条件。

作为一种实施方式，A1可以按照如下方式实施，针对所述负样本库中的每个特征向量，确定该特征向量与待查特征向量的内积，若确定该内积小于预设门限值，则表征该特征向量满足第一预设条件，继而将该特征向量作为精炼负样本特征集中的特征向量。其中，所述预设门限值根据用户需求设定，预设门限值越小，精炼负样本特征集中的特征向量相对越少。

为了提高模型训练精度，作为一种实施方式，所述负样本库中存储前Y次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；其中，Y为小于等于i-1的正整数。

A2：基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值。

具体地，将所述精炼负样本特征集中的各个特征向量、所述待查询特征向量q，以及所述第i次模型训练所得到的正样本特征向量，输入至第一损失函数

中，得到第一损失参数Loss1的所述第一损失值；k_v表征第i次模型训练所得的第v个正样本特征向量；V表征第i次模型训练所得到的正样本特征向量的数量；q表征所述待查特征向量；τ表征温度常量，为经验值；u_m表征所述精炼负样本特征集中的第m个特征向量；M表征所述精炼负样本特征集中的特征向量的数量。

作为一种实施方式，S13可以按照如下方式实施，将负样本库中的各个特征向量、所述待查询特征向量，以及所述第i次模型训练所得到的正样本特征向量，输入至第一损失函数

中，得到第一损失参数Loss1的所述第一损失值；u_t表征所述负样本库中的第t个特征向量；T表征所述负样本库中的特征向量的数量。

在确定出第一损失值之后，执行S14。

值得一提的是，在线特征提取模型和目标特征提取模型的网络结构相同，在第一次进行模型训练时所用的线特征提取模型和目标特征提取模型相同。

在实际实施过程中，S14可以按照如下方式实施，在确定所述第一损失值大于第一预设阈值时，基于所述第一损失值和梯度反向传播算法，对所述在线特征提取模型中的参数进行更新，得到更新后的在线特征提取模型，针对目标特征提取模型中的每个参数ξ，将该参数ξ的值和更新后的在线特征提取模型中与该参数ξ的位置对应的参数θ的值，输入至参数更新函数ξ←αξ+(1-α)θ中，得到该参数ξ更新后的值；其中，α为经验值，用于控制参数ξ的值的更新步长；继而利用该参数ξ更新后的值对目标特征提取模型中的该参数ξ的值进行更新，直到将目标特征模型中的全部参数的值均更新完，得到更新后的目标特征提取模型；其中，所述第一预设阈值根据用户需求设定，所述第一预设阈值越小，最终训练好的在线特征提取模型的精度相对越高。

在得到更新后的在线特征提取模型和更新后的目标特征提取模型之后，将i的值加1，以对i的值进行更新，继而利用更新后的目标提取模型和更新后的在线特征提取模型执行步骤S11-S13，并在利用S13确定出的新的损失值小于等于第一预设阈值时，停止模型训练，并将更新后的在线特征提取模型作为训练好的在线特征提取模型。

作为一种实施方式，在确定第一损失值大于第一预设阈值时，确定i的值是是否等于预设次数，若等于，则基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，得到更新后的目标特征提取模型和更新后的在线特征提取模型，停止模型训练，并将多次模型训练所确定出的最小损失值所对应的在线特征提取模型作为训练好的在线特征提取模型。

作为一种实施方式，所述方法还包括步骤B1-B2。

B1：获取历史正特征集和历史负特征集；所述历史正特征集包括：历史特征库中与所述样本图像对应的特征向量；所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；所述历史负特征集包括：所述历史特征库中除所述历史正特征集以外的特征向量。

在实际实施过程中，B1可以按照如下方式实施，针对历史特征库中的每个特征向量，若该特征向量是基于所述样本图像所确定出的，则将该特征向量作为历史正特征集中的特征向量，反之，则确定该特征向量不为历史正特征集中的特征向量，继而得到历史正特征集；将历史特征库中除历史正特征集以外的特征向量作为历史负特征集中的特征向量，继而得到历史负特征集。

为了提高模型训练精度，作为一种实施方式，所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果；每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；其中，K为大于等于1的正整数。

作为一种实施方式，不同训练周期所确定出的平均结果位于历史特征库的不同的列中，同一个训练周期所确定出的平均结果位于历史特征库的同一列中。

B2：基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值。

作为一种实施方式，步骤B2包括步骤B21-B23。

B21：针对所述历史正特征集中的每个正特征向量，从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量；其中，每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练。

在实际实施过程中，B21可以按照如下方式实施，针对历史正特征集中的每个正特征向量，根据该正特征向量在历史特征库中的位置索引，从预先存储的位置索引与训练周期的对应关系中，查找出该正特征向量的位置索引所对应的训练周期，继而根据历史负特征集中的各个负特征向量在历史特征库中的位置索引所对应的训练周期，从历史特征集中确定出与该正特征向量属于同一个训练周期的负特征向量。

作为一种实施方式，B21可以按照如下方式实施，针对所述历史正特征集中的每个正特征向量，从所述历史负特征集中随机地确定出与该正特征向量属于同一个训练周期的L个负特征向量。

针对历史正特征集中的每个正特征向量，在确定出与该正特征向量对应的负特征向量之后，执行步骤B22。

B22：基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值。

具体地，将所述待查询特征向量、该正特征向量和对应的负特征向量，输入至第二损失函数

B23：根据多个子损失值，得到所述第二损失值。

在实际实施过程中，B23可以按照如下方式实施，对所述多个子损失值求和，得到所述第二损失值。

若历史特征集中只包括一个正特征向量，作为一种实施方式，B2可以按照如下方式实施，将所述待查询特征向量、该正特征向量和所述历史负特征集中的负特征向量，输入至第二损失函数

得到子损失参数Loss2的所述子损失值；q表征所述待查特征向量；h表征该正特征向量；τ表征温度常量；L表征所述历史负特征集中的负特征向量的数量；p_l表征所述历史负特征集中的第l个负特征向量。

若历史特征集中只包括一个正特征向量，作为一种实施方式，B2可以按照如下方式实施，将所述待查询特征向量、该正特征向量和所述历史负特征集中的D个负特征向量，输入至第二损失函数

得到子损失参数Loss2的所述子损失值；q表征所述待查特征向量；h表征该正特征向量；τ表征温度常量；p_d表征所述D个负特征向量中的第d个负特征向量；D小于历史负特征集中的负特征向量的数量。

对应的，S14包括：在确定所述第一损失值和所述第二损失值不满足所述预设条件时，基于所述第一损失值和所述第二损失值，对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

具体地，确定所述第一损失值和所述第二损失值之和为总损失值，在确定总损失值大于第二预设阈值时，基于所述总损失值和梯度反向传播算法，对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的总损失值小于等于第二预设阈值，并将更新后的在线特征提取模型作为训练好的在线特征提取模型。其中，所述第二预设阈值根据用户需求设定，所述第二预设阈值越小，最终训练好的在线特征提取模型的精度相对越高。

其中，在线特征提取模型和目标特征提取模型中的参数的更新方式请参照前述实施方式，因此，在此不再赘述。

在介绍完模型训练方法之后，下面对特征提取方法进行介绍。

请参照图2，图2为本申请实施例提供的一种特征提取方法的流程图，下面将对图2所示的流程进行详细阐述，所述方法包括步骤：S21-S22。

S21：获取图像。

S22：利用图1所述的方法训练好的在线特征提取网络，对所述图像进行特征提取，得到所述图像的特征向量。

请参照图3，图3是本申请实施例提供的一种模型训练装置300的结构框图。下面将对图3所示的结构框图进行阐述，所示装置包括：

增强图像获取单元310，用于针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数。

第一输入单元320，用于将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定。

第一损失确定单元330，用于基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值。

更新单元340，用于在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

作为一种实施方式，所述第一损失确定单元330，包括：精炼负样本获取单元，用于获取精炼负样本特征集；所述精炼负样本特征集包括：负样本库中与待查特征向量的内积满足第一预设条件的特征向量；所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；i为大于等于2的正整数；第一子损失确定单元，用于基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值。

作为一种实施方式，所述第一子损失确定单元，具体用于将所述精炼负样本特征集、所述待查询特征向量，以及所述第i次模型训练所得到的正样本特征向量，输入至第一损失函数

作为一种实施方式，所述装置还包括：历史特征集获取单元，用于获取历史正特征集和历史负特征集；所述历史正特征集包括：历史特征库中与所述样本图像对应的特征向量；所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；所述历史负特征集包括：所述历史特征库中除所述历史正特征集以外的特征向量；第二损失确定单元，用于基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值；其中，所述更新单元340，具体用于在确定所述第一损失值和所述第二损失值不满足所述预设条件时，基于所述第一损失值和所述第二损失值，对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

作为一种实施方式，所述第二损失确定单元，包括：负特征确定单元，用于针对所述历史正特征集中的每个正特征向量，从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量；其中，每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；子损失值确定单元，用于基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值；第二子损失确定单元，用于根据多个子损失值，得到所述第二损失值。

作为一种实施方式，所述子损失值确定单元，具体用于将所述待查询特征向量、该正特征向量和对应的负特征向量，输入至第二损失函数

作为一种实施方式，所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果；每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；其中，K为大于等于1的正整数。

本实施例对的各功能单元实现各自功能的过程，请参见上述图1所示实施例中描述的内容，此处不再赘述。

请参照图4，图4是本申请实施例提供的一种特征提取装置400的结构框图。下面将对图4所示的结构框图进行阐述，所示装置包括：

图像获取单元410，用于获取图像。

特征提取单元420，用于利用图1所述的方法训练好的在线特征提取网络，对所述图像进行特征提取，得到所述图像的特征向量。

本实施例对的各功能单元实现各自功能的过程，请参见上述图2所示实施例中描述的内容，此处不再赘述。

请参照图5，图5为本申请实施例提供的一种电子设备500的结构示意图，电子设备500可以是个人电脑、平板电脑、智能手机、个人数字助理(personal digital assistant，PDA)等。

电子设备500可以包括：存储器502、处理器501、通信接口503和通信总线，通信总线用于实现这些组件的连接通信。

所述存储器502用于存储本申请实施例提供的模型训练方法、特征提取方法和装置对应的计算程序指令等各种数据，其中，存储器502可以是，但不限于，随机存取存储器，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-OnlyMemory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。

处理器501用于读取并运行存储于存储器中的模型训练方法、特征提取方法和装置对应的计算机程序指令，以针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数；将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定；基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值；在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

其中，处理器501可能是一种集成电路芯片，具有信号的处理能力。上述的处理器501可以是通用处理器，包括CPU、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

通信接口503，用于接收或者发送数据。

此外，本申请实施例还提供了一种存储介质，在该存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行本申请任一项实施方式所提供的方法。

综上所述，本申请各实施例提出的模型训练和特征提取方法、装置、电子设备及存储介质，针对每次模型训练，将一张样本图像的至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将剩余的增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量，继而在基于待查询特征向量和i次模型训练所得到的正样本特征向量，确定的第一损失值不满足预设条件时，基于第一损失值对目标特征提取模型和所述在线特征提取模型中的参数进行更新，在更新时，由于利用该张样本图像的至少两个正样本特征向量来确定第一损失值，因此，与现有技术利用该张样本图像的一个正样本特征向量来确定第一损失值相比，本申请有效缩小了正样本与负样本之间的数量差距，继而保证训练好的模型的精度高于现有技术。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的装置来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

Claims

1.一种模型训练方法，其特征在于，所述方法包括：

针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数；

将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定；

基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值；

在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

2.根据权利要求1所述的方法，其特征在于，所述基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值，包括：

获取精炼负样本特征集；所述精炼负样本特征集包括：负样本库中与待查特征向量的内积满足第一预设条件的特征向量；所述负样本库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；i为大于等于2的正整数；

基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值。

3.根据权利要求2所述的方法，其特征在于，基于所述精炼负样本特征集、所述待查询特征向量和所述第i次模型训练所得到的正样本特征向量，得到所述第一损失值，包括：

将所述精炼负样本特征集、所述待查询特征向量，以及所述第i次模型训练所得到的正样本特征向量，输入至第一损失函数

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取历史正特征集和历史负特征集；所述历史正特征集包括：历史特征库中与所述样本图像对应的特征向量；所述历史特征库中存储前i-1次中的每次模型训练所得到的至少两个正样本特征向量的平均结果；所述历史负特征集包括：所述历史特征库中除所述历史正特征集以外的特征向量；

基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值；

其中，所述在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件，包括：

在确定所述第一损失值和所述第二损失值不满足所述预设条件时，基于所述第一损失值和所述第二损失值，对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

5.根据权利要去4所述的方法，其特征在于，所述基于所述历史正特征集、所述历史负特征集和所述待查询特征向量，确定第二损失值，包括：

针对所述历史正特征集中的每个正特征向量，从所述历史负特征集中确定出与该正特征向量属于同一个训练周期的负特征向量；其中，每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；

基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值；

根据多个子损失值，得到所述第二损失值。

6.根据权利要求5所述的方法，其特征在于，所述基于待查询特征向量、该正特征向量和对应的负特征向量，得到子损失值，包括：

将所述待查询特征向量、该正特征向量和对应的负特征向量，输入至第二损失函数

7.根据权利要求4所述的方法，其特征在于，所述历史特征库中存储前i-1次中的最近K个训练周期中的每次模型训练所确定的平均结果；每个训练周期中所述图像样本集中的各张样本图像分别被用于一次模型训练；其中，K为大于等于1的正整数。

8.一种特征提取方法，其特征在于，所述方法包括：

获取图像；

利用权利要求1-7所述的方法训练好的在线特征提取网络，对所述图像进行特征提取，得到所述图像的特征向量。

9.一种模型训练装置，其特征在于，所述装置包括：

增强图像获取单元，用于针对第i次模型训练，获取图像样本集中的一张样本图像对应的至少三张增强图像；所述至少三张增强图像为对所述样本图像进行数据增强得到；所述至少三张增强图像各不相同；i为大于等于1的正整数；

第一输入单元，用于将所述至少三张增强图像中的一张增强图像输入至在线特征提取模型中，得到待查特征向量，并将所述至少三张增强图像中的剩余增强图像输入至目标特征提取模型中，得到至少两个正样本特征向量；所述目标特征提取模型根据所述在线特征提取模型确定；

第一损失确定单元，用于基于所述待查询特征向量和i次模型训练所得到的正样本特征向量，确定第一损失值；

更新单元，用于在确定所述第一损失值不满足预设条件时，基于所述第一损失值对所述目标特征提取模型和所述在线特征提取模型中的参数进行更新，直到利用更新后的在线特征提取模型和更新后的目标特征提取模型确定的新的损失值满足所述预设条件。

10.一种特征提取装置，其特征在于，所述装置包括：

图像获取单元，用于获取图像；

特征提取单元，用于利用权利要求1-7中任一权项所述的方法训练好的在线特征提取网络，对所述图像进行特征提取，得到所述图像的特征向量。

11.一种电子设备，其特征在于，包括存储器以及处理器，所述存储器中存储有计算机程序指令，所述计算机程序指令被所述处理器读取并运行时，执行如权利要求1-8中任一项所述的方法。

12.一种存储介质，其特征在于，所述存储介质上存储有计算机程序指令，所述计算机程序指令被计算机读取并运行时，执行如权利要求1-8中任一权项所述的方法。