CN108021930A - 一种自适应的多视角图像分类方法及系统 - Google Patents
一种自适应的多视角图像分类方法及系统 Download PDFInfo
- Publication number
- CN108021930A CN108021930A CN201711140976.9A CN201711140976A CN108021930A CN 108021930 A CN108021930 A CN 108021930A CN 201711140976 A CN201711140976 A CN 201711140976A CN 108021930 A CN108021930 A CN 108021930A
- Authority
- CN
- China
- Prior art keywords
- mrow
- label
- view
- msup
- msubsup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种自适应的多视角图像分类方法及系统,将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,通过引入线性变换来获取不同视角空间的权重参数,进而结合每个视角构建最优的权重系数。由于在多视角数据权重学习方面采用了自适应方式,可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的近邻数量或高斯核参数选择难问题。模型主要通过在训练过程中最小化基于多视角数据的分类误差和其重构系数之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。
Description
技术领域
本发明涉及计算机视觉和图像识别技术领域,更具体的说,是涉及一种自适应的多视角图像分类方法及系统。
背景技术
由于标签传播在标签预测过程的有效性和效率,近来年,在模式识别和机器学习领域引起了人们的极大关注。标签传播是基于标记和未标记数据的几何结构,将标记数据的有监督标签信息传播到未标记样本的过程。一般来说,现有的基于图形的方法主要集中在从单个视角中预测标签,即单视角分类。但在现实生活中,许多数据集包含在多个视角中的不同表示或来自多个视角源,这激发了一个新的研究领域,即多视角学习。虽然给定数据的每个视角表示对于给定的学习任务可能是足够的,但是忽略不同视角的重要互补信息,即将每个视角分开学习。因此,多视角学习的主要挑战是开发算法来整合多个视角的补充信息,以增强表示和标签预测性能。
为了将实际应用领域从单视角扩展到多视角,并克服单视角标签传播的缺点,最近来,MLPP-CLP和AMGL将多视角学习的概念纳入到标签传播学习中。AMGL建议为各种视角中的所有子图学习一组加权因子,然后对每个视角预先计算的拉普拉斯矩阵执行半监督分类。而MLPP-CLP是通过查找预测来利用从多个数据表示获得的信息。显然,他们在将多视角重构过程从多视角标签传播过程中明确分离出来,因此不能保证来自各种视角的图权重对于随后的多视角标签估计是最佳的,并且都会在确定最佳邻域大小或内核宽度时遇到同样棘手的问题。此外,近邻的数量通常是人为的为每个视角固定相同的值,但是这种操作显然不能考虑各种实际数据的实际分布,也不考虑各种视角的不同分布。应该指出的是,上述几个遇到的问题可能导致分类性能下降。
因此,提供一种新的多视角标签传播框架,通过将多视角标签传播学习扩展到自适应学习场景,是本领域技术人员亟待解决的问题。
发明内容
本发明的发明目的是提供一种自适应的多视角图像分类方法及系统,以克服现有技术中仅限于单视角分类或者不能高效的结合多个视角对数据图像进行快速直接的分类,最大化分类精度的问题。
为达到上述发明目的,本发明采用的技术方案是:一种自适应的多视角图像分类方法,包括:
(1)、对原始多视角数据集进行随机划分,获得有标签训练集及无标签训练集,根据划分出来的所述有标签训练集和无标签训练集进行类别标签矩阵初始化;
(2)、联合自适应多图重建权重学习和多视角标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性;
(3)、通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签。
优选地,所述联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性,包括:所述框架为
其中,是软标签矩阵,c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0,α和β是该稀疏编码项的权衡参数,为自适应权重系数矩阵;
对上述向量形式的框架进行转换,得到如下矩阵形式的框架:
其中,第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
优选地,所述原始数据集为图像数据向量集合其中dν是训练样本的维度,N是样本的数量),其中V代表数据集视角个数。
优选地,步骤(3)中所述通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签,包括:对所述框架最小化求解,最终得到每个无标签训练样本的软标签向量fi,所得向量的最大元素对应的位置即为无标签训练样本的归属类别标签,每个无标签训练样本的硬标签可以被归结为arg maxi≤c(fi)i,其中(fi)i表示预测的软标签向量fi第i个元素位置。输出无标签样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得到最准确的分类结果。
本发明还公开了一种自适应的多视角图像分类系统,包括:
训练预处理模块,对原始多视角数据集进行随机划分,获得有标签训练集和无标签训练集,根据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵初始化;
训练模块,联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,并对稀疏编码系数和重构错误进行L2,1范数正则化,利用L2,1范数正则化度量增强提升整体预测准度和鲁棒性,通过迭代优化最终得到无标签训练集的软标签矩阵F;
测试模块,对于迭代生成的所述软标签矩阵F,最后每个无标签训练样本的硬标签可以被归结为arg maxi≤c(fi),其中(fi)i表示预测的软标签向量fi第i个元素位置。根据无标签训练集对应的最大值得到对应的标签预测类别。
本发明中,对于多视角表示和标签传播,旨在将自适应多图重建权重学习和多视角标签传播整合到一个统一的框架。利用标签传播方法对训练集中的有标签样本进行训练,并且同时得无标定数据的类别标签,输出分类结果;
基于多视角训练集中的数据及标签信息,将原始多视角训练集中图像数据进行基于L2,1范数稀疏编码,利用每个单视角构建最佳自适应重构权重矩阵,分别得到各个视角的自适应权重,再通过多权重融合,以充分利用线性变换来进行视角间信息的互补。值得注意的是,重建权重学习和标签传播学习的联合制定可以确保学习的权重对于表示和分类都是最佳的。
利用基于每个单视角所求得的自适应重构权计算自适应关联矩阵,为下一步标签传播做好准备;
将计算得到的关联矩阵进行标签传播,输出无标签样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得到最准确的分类。
由于上述技术方案运用,本发明与现有技术相比具有下列优点:
本发明公开了一种自适应的多视角图像分类方法及系统,理论提出了一种新的自适应半监督多视角标签传播学习框架,并设计完成一个基于自适应多视角学习方法的图像分类系统。本发明方法将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,通过引入线性变换来获取不同视角空间的权重参数,进而结合每个视角构建最优的权重系数。由于在多视角数据权重学习方面采用了自适应方式,可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的近邻数量或高斯核参数选择难问题。模型主要通过在训练过程中最小化基于多视角数据的分类误差和其重构系数之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。此外,使用迭代方案来解决所提出的模型,可快速实现样本数据的分类,有效提高图像分类的精准度。与传统单视角分类方法相比,多视角方法可充分挖掘多个视角之间的内在关系,显著增强了分类结果。
附图说明
图1为本发明实施例一中UMISTface特征识别数据结果对比图;
图2为本发明实施例一中GeorgiaTech face特征识别数据结果对比图;
图3为本发明实施例一中ORLface特征识别数据结果对比图;
图4为本发明实施例一中Reuters Multilingual数据集结果对比图;
图5为本发明实施例一中HandwrittenNumerals数据集结果对比图;
图6为本发明实施例公开的一种自适应的多视角图像分类方法流程图;
图7为本发明实施例公开的一种自适应的多视角图像分类系统结构图;
图8为本发明实施例公开的一种自适应的多视角图像分类方法的图像类别预测及分类过程示意图。
具体实施方式
下面结合附图及实施例对本发明作进一步描述:
实施例一:
参见图1至图5所示,本发明在五个图像数据的数据库进行了测试:UMIST face,Georgia Tech fac,ORLface,Reuters Multilingual和handwritten numerals。其中人脸数据集和Reuters Multilingual都包含五个视角,handwritten numerals包含了六个视角。这些数据库从多方面收集,因而测试结果具有普遍说明性,。
请参阅附图6,为本发明实施例公开的一种自适应的多视角图像分类的方法流程图。本发明实施例公开的一种自适应的多视角图像分类的方法,具体实施步骤为:
步骤101:对多视角数据集进行随机划分,生产有标签训练集和无标签训练集,跟据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵Y初始化,同时对一些必要的参数初始化,具体为:
随机的从原始c类样本数据集中的每类选取一定量的样本作为有标签训练集,剩下的用作无标签训练集;初始化训练集的类别标签矩阵,Y=[y1,y2,…,yl+u],对于已标记样本xi,假定xi属于第i类,则yi,j=1,反之,若xi未被标记,则yi,j=0;对于自适应权重Wν利用AdaptiveNP中的S初始化。
步骤102:联合自适应多图重建权重学习和多视角标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性,即基于预处理后的数据,建立模型进行训练,具体为:
基于多视角训练集中的数据及标签信息,将原始多视角训练集中图像数据进行基于L2,1范数稀疏编码,利用每个单视角构建最佳自适应重构权重矩阵,分别得到各个视角的自适应权重,再通过多权重融合,以充分利用线性变换来进行视角间信息的互补。
其中所述原始多视角数据集为图像数据向量集合其中dν是训练样本的维度,N是样本的数量),其中V代表数据集视角个数,通过解决如下问题得到软标签矩阵F:
其中,是软标签矩阵,其中c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0。α和β是该稀疏编码项的权衡参数。为自适应权重系数矩阵;上述目标函数为向量形式,其矩阵定义为:
其中,对上述目标函数,第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
步骤103:对目标函数利用迭代的优化方案进行求解,最终得到最优的软标签矩阵F,取最大值对应位置的类别标号,即为类别归属,具体为:
由于上述目标函数同时包含两个未知变量,对上述框架进行最小化求解时,本发明采用迭代的优化思路。具体方法为:
首先利用AdaptiveNP中的自适应权重对本发明方法中各个视角的自适应权重进行初始化赋值,然后固定自适应权重对软标签F进行计算,具体可归纳为对如下公式进行优化:
首先提出对软标签矩阵F进行更新,可归纳为对如下公式进行优化:
利用Lagrange function对上述问题进行求解,可构造如下函数:
其中δ是拉格朗日乘子,ψ(δ,F)为约束项。对上式进行求F偏导数可得:
其中λν可被看做权重因子,用来权衡各个视角数据对于最小化重构误差的贡献度,可通过如下公式计算:
其中是一个自适应的关联矩阵,I为维度为N的单位矩阵。λν是依靠变量F存在的,因此可以通过相互迭代来计算F和λν,并且λν中的各个值被初始化为1/V。综上所述,关于F的目标函数可以被重写为:
对上式进行求F偏导,并且取值为0,最终可得到F的更新公式:
利用上述方式求得软标签矩阵F值后,可固定F对自适应权重矩阵Wν进行求解更新,具体归纳为对如下公式进行优化:
其中α||Xν-XνWν||2,1+β||Wν||2,1为基于L2,1范数正则化稀疏编码的权重构造。上述公式可转化为对如下几个变量求解:
其中,和分别定义如下:
通过对自适应权重矩阵的目标函数进行求Wν偏导,且等式右边取值为0,可得:
上式即为Wν在第(t+1)次迭代的更新公式。
最后,因为Wν和λν都是关于F的函数,所以该方法通过对三个变量相互迭代使目标函数得到有效解决,最后得出软标签F和预测结果。
具体算法如下:
一种自适应的多视角图像分类算法
输入:原始数据集初始标签集控制参数α和β;
初始化:F=Y;λν=1/V;初始化Wν值为AdaptiveNP中的自适应重构权S;
当未收敛时:
1).固定和更新Ft+1:
2).固定W和Ft,更新
3).固定Ft和更新自适应权重矩阵
4).固定更新和
检查是否收敛:
若sqrt(sum(tmp(:).2))<tol||iter>=maxIter则停止;
否则t=t+1
输出:软标签矩阵(F*←Ft+1)。
最终得到每个无标签训练样本的软标签向量fi,所得向量的最大元素对应位置即为无标签样本的归属类别标签,每个无标签样本的硬标签可以被归结为arg maxi≤c(fi)i,其中(fi)i表示预测的软标签向量fi第i个元素位置。
本发明公开了一种自适应的多视角图像分类方法及系统,理论提出了一种新的自适应半监督多视角标签传播学习框架,并设计完成一个基于自适应多视角学习方法的图像分类系统。本发明方法将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,通过引入线性变换来获取不同视角空间的权重参数,进而结合每个视角构建最优的权重系数。由于在多视角数据权重学习方面采用了自适应方式,可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的近邻数量或高斯核参数选择难问题。模型主要通过在训练过程中最小化基于多视角数据的分类误差和其重构系数之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。此外,使用迭代方案来解决所提出的模型,可快速实现样本数据的分类,有效提高图像分类的精准度。与传统单视角分类方法相比,多视角方法可充分挖掘多个视角之间的内在关系,显著增强了分类结果。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的系统实现,因此本发明还公开了一种系统,下面给出具体的实施例进行详细说明。
请参阅附图7,为本发明实施例公开的一种自适应的多视角图像分类的系统结构图。本发明公开了一种自适应的多视角图像分类的系统,该系统具体包括:
训练预处理模块201对原始多视角数据集进行随机划分,生产有标签训练集和无标签训练集,跟据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵初始化Y。同时对一些必要的参数初始化;
训练模块202联合多视角学习和标签传播构建统一型框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,对稀疏编码系数和重构错误进行L2,1范数正则化,利用L2,1范数正则化度量增强提升整体预测准度和鲁棒性,通过迭代优化最终得到无标签训练集的软标签矩阵F;
测试模块203基于所述预测类别软标签矩阵确定待测样本对应的类别标签,即对于所述软标签矩阵F,最后每个无标签训练样本的硬标签可以被归结为arg maxi≤c(fi),其中(fi)i表示预测的软标签向量fi第i个元素位置,根据无标签训练集对应的最大值得到对应的标签预测类别。
具体为:给定原始多视角数据集为图像数据向量集合(其中,dν是某一视角训练样本的维度,N是样本的数量),其中包含有c个类别标签(c>2),所述训练模型为:
其中,是软标签矩阵,其中c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0。α和β是该稀疏编码项的权衡参数。为自适应权重系数矩阵;上述目标函数为向量形式,其矩阵定义为:
其中,上述目标函数中的第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
由于上述目标函数同时包含两个未知变量,对上述框架进行最小化求解时,本发明采用迭代的优化思路。具体方法为:
首先利用AdaptiveNP中的自适应权重对本发明方法中各个视角的自适应权重进行初始化赋值,然后固定自适应权重对软标签F进行计算,具体可归纳为对如下公式进行优化:
首先提出对软标签矩阵F进行更新,可归纳为对如下公式进行优化:
利用Lagrange function对上述问题进行求解,可构造如下函数:
其中δ是拉格朗日乘子,ψ(δ,F)为约束项。对上式进行求F偏导数可得:
其中λν可被看做权重因子,用来权衡各个视角数据对于最小化重构误差的贡献度,可通过如下公式计算:
其中是一个自适应的关联矩阵,I为维度为N的单位矩阵。λν是依靠变量F存在的,因此可以通过相互迭代来计算F和λν,并且λν中的各个值被初始化为1/V。综上所述,关于F的目标函数可以被重写为:
对上式进行求F偏导,并且取值为0,最终可得到F的更新公式:
利用上述方式求得软标签矩阵F值后,可固定F对自适应权重矩阵Wν进行求解更新,具体归纳为对如下公式进行优化:
其中α||Xν-XνWν||2,1+β||Wν||2,1为基于L2,1范数正则化稀疏编码的权重构造。上述公式可转化为对如下几个变量求解:
其中,和分别定义如下:
通过对自适应权重矩阵的目标函数进行求Wν偏导,且等式右边取值为0,可得:
上式即为Wν在第(t+1)次迭代的更新公式。
最后,因为Wν和λν都是关于F的函数,所以该方法通过对三个变量相互迭代使目标函数得到有效解决,最后得出软标签F和预测结果。其中向量fi中最大元素的位置就是xi的类别。
参阅图1~3,为本发明方法和LNP、SLP、LLGC、GFHF、CD-LNP、SIS-LP、LapLDA、ProjLP、AdaptiveNP、SparseNP、和AMGL方法在三个数据集、一个Handwritten Numerals和一个Reuters Multilingual数据集的识别结果对比表,给出了各方法实验的精度。本例中,参与比较的LNP、SLP、LLGC、GFHF、CD-LNP、SIS-LP、LapLDA、ProjLP、AdaptiveNP、SparseNP、和AMGL方法均采用各文献中算法使用的默认参数。
请参阅附图8,为本发明实施例公开的一种自适应的多视角图像分类方法的图像类别预测及分类过程示意图,其中包括自适应权重构造与标签传播两个过程。
综上所述:本发明公开了一种自适应的多视角图像分类方法及系统,与传统单视角分类方法不同的是利用多个视角增强分类结果。提出了一种新的自适应多视角标签传播框架。本发明将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,其中引入线性变换来形成不同视角空间的不同权重。因此,可以结合每个视角构建最优图形权重。由于在多视角中构造多个权重的自适应方式,本发明可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的邻域大小或内核宽度选择难问题。模型主要通过在训练过程中最小化分类误差和其稀疏编码之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。此外,使用迭代方案来解决所提出的模型,可快速实现样本数据的分类,有效提高图像分类的精准度。
Claims (5)
1.一种自适应的多视角图像分类方法,其特征在于,包括:
(1)、对原始多视角数据集进行随机划分,获得有标签训练集及无标签训练集,根据划分出来的所述有标签训练集和无标签训练集进行类别标签矩阵初始化;
(2)、联合自适应多图重建权重学习和多视角标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性;
(3)、通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签。
2.根据权利要求1所述的自适应的多视角图像分类方法,其特征在于,所述联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性,包括:所述框架为
<mrow>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>F</mi>
<mo>,</mo>
<msup>
<mi>W</mi>
<mi>v</mi>
</msup>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>v</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>V</mi>
</munderover>
<msqrt>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>f</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msubsup>
<mi>Fw</mi>
<mi>i</mi>
<mi>v</mi>
</msubsup>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
</mrow>
</msqrt>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>v</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>V</mi>
</munderover>
<mo>&lsqb;</mo>
<mi>&alpha;</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mo>|</mo>
<mo>|</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>v</mi>
</msubsup>
<mo>-</mo>
<msup>
<mi>X</mi>
<mi>v</mi>
</msup>
<msubsup>
<mi>w</mi>
<mi>i</mi>
<mi>v</mi>
</msubsup>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>2</mn>
</msub>
<mo>+</mo>
<mi>&beta;</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mo>|</mo>
<mo>|</mo>
<msubsup>
<mi>w</mi>
<mi>i</mi>
<mi>v</mi>
</msubsup>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>2</mn>
</msub>
<mo>&rsqb;</mo>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>&mu;</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>f</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
</mrow>
其中,是软标签矩阵,c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0,α和β是该稀疏编码项的权衡参数,为自适应权重系数矩阵;对上述向量形式的框架进行转换,得到如下矩阵形式的框架:
<mrow>
<mi>J</mi>
<mrow>
<mo>(</mo>
<mi>F</mi>
<mo>,</mo>
<msup>
<mi>W</mi>
<mi>v</mi>
</msup>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msubsup>
<mo>&Sigma;</mo>
<mrow>
<mi>v</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>V</mi>
</msubsup>
<msqrt>
<mrow>
<mo>|</mo>
<mo>|</mo>
<mi>F</mi>
<mo>-</mo>
<msup>
<mi>FW</mi>
<mi>v</mi>
</msup>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mi>F</mi>
<mn>2</mn>
</msubsup>
</mrow>
</msqrt>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>v</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>V</mi>
</munderover>
<mrow>
<mo>(</mo>
<mi>&alpha;</mi>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>X</mi>
<mi>v</mi>
</msup>
<mo>-</mo>
<msup>
<mi>X</mi>
<mi>v</mi>
</msup>
<msup>
<mi>W</mi>
<mi>v</mi>
</msup>
<mo>|</mo>
<msub>
<mo>|</mo>
<mrow>
<mn>2</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>+</mo>
<mi>&beta;</mi>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>v</mi>
</msup>
<mo>|</mo>
<msub>
<mo>|</mo>
<mrow>
<mn>2</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>t</mi>
<mi>r</mi>
<msup>
<mrow>
<mo>(</mo>
<mi>F</mi>
<mo>-</mo>
<mi>Y</mi>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
<mi>U</mi>
<mrow>
<mo>(</mo>
<mi>F</mi>
<mo>-</mo>
<mi>Y</mi>
<mo>)</mo>
</mrow>
</mrow>
其中,第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
3.根据权利要求1所述的自适应的多视角图像分类方法,其特征在于,所述原始多视角数据集为图像数据向量集合其中dν是训练样本的维度,N是样本的数量),其中V代表数据集视角个数。
4.根据权利要求1所述的自适应的多视角图像分类方法,其特征在于,步骤(3)中所述通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签,包括:对所述框架最小化求解,最终得到每个无标签训练样本的软标签向量fi,所得向量的最大元素对应的位置即为无标签训练样本的归属类别标签,每个无标签训练样本的硬标签可以被归结为argmaxi≤c(fi)i,其中(fi)i表示预测的软标签向量fi第i个元素位置,输出无标签样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得到最准确的分类结果。
5.一种自适应的多视角图像分类系统,其特征在于,包括:
训练预处理模块,对原始多视角数据集进行随机划分,获得有标签训练集和无标签训练集,根据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵初始化;
训练模块,联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,并对稀疏编码系数和重构错误进行L2,1范数正则化,利用L2,1范数正则化度量增强提升整体预测准度和鲁棒性,通过迭代优化最终得到无标签训练集的软标签矩阵F;
测试模块,基于所述软标签矩阵F确定待测样本对应的类别标签。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201711140976.9A CN108021930B (zh) | 2017-11-16 | 2017-11-16 | 一种自适应的多视角图像分类方法及系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201711140976.9A CN108021930B (zh) | 2017-11-16 | 2017-11-16 | 一种自适应的多视角图像分类方法及系统 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN108021930A true CN108021930A (zh) | 2018-05-11 |
| CN108021930B CN108021930B (zh) | 2022-01-14 |
Family
ID=62079901
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201711140976.9A Expired - Fee Related CN108021930B (zh) | 2017-11-16 | 2017-11-16 | 一种自适应的多视角图像分类方法及系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN108021930B (zh) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110008365A (zh) * | 2019-04-09 | 2019-07-12 | 广东工业大学 | 一种图像处理方法、装置、设备及可读存储介质 |
| CN110222793A (zh) * | 2019-06-20 | 2019-09-10 | 中国科学院自动化研究所 | 基于多视角主动学习的在线半监督分类方法及系统 |
| CN110727833A (zh) * | 2019-09-30 | 2020-01-24 | 广东工业大学 | 一种基于多视角学习的图数据检索结果优化方法 |
| CN111008637A (zh) * | 2018-10-08 | 2020-04-14 | 北京京东尚科信息技术有限公司 | 图像分类方法及系统 |
| CN111382758A (zh) * | 2018-12-28 | 2020-07-07 | 杭州海康威视数字技术股份有限公司 | 训练图像分类模型、图像分类方法、装置、设备及介质 |
| CN111680579A (zh) * | 2020-05-22 | 2020-09-18 | 常州工业职业技术学院 | 一种自适应权重多视角度量学习的遥感图像分类方法 |
| CN112884030A (zh) * | 2021-02-04 | 2021-06-01 | 重庆邮电大学 | 一种基于交叉重建的多视角分类系统及方法 |
| CN113985733A (zh) * | 2021-10-26 | 2022-01-28 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应概率学习的配电网故障辨识方法 |
| CN114492620A (zh) * | 2022-01-24 | 2022-05-13 | 西安电子科技大学 | 基于证据深度学习的可信多视角分类方法 |
| CN115878993A (zh) * | 2021-09-28 | 2023-03-31 | 中移(苏州)软件技术有限公司 | 一种标签重构分类方法、装置、计算设备和存储介质 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106529604A (zh) * | 2016-11-24 | 2017-03-22 | 苏州大学 | 一种自适应的图像标签鲁棒预测方法及系统 |
-
2017
- 2017-11-16 CN CN201711140976.9A patent/CN108021930B/zh not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106529604A (zh) * | 2016-11-24 | 2017-03-22 | 苏州大学 | 一种自适应的图像标签鲁棒预测方法及系统 |
Non-Patent Citations (1)
| Title |
|---|
| FADI DORNAIKA等: "Learning Flexible Graph-Based Semi-Supervised Embedding", 《 IEEE TRANSACTIONS ON CYBERNETICS》 * |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111008637A (zh) * | 2018-10-08 | 2020-04-14 | 北京京东尚科信息技术有限公司 | 图像分类方法及系统 |
| CN111382758B (zh) * | 2018-12-28 | 2023-12-26 | 杭州海康威视数字技术股份有限公司 | 训练图像分类模型、图像分类方法、装置、设备及介质 |
| CN111382758A (zh) * | 2018-12-28 | 2020-07-07 | 杭州海康威视数字技术股份有限公司 | 训练图像分类模型、图像分类方法、装置、设备及介质 |
| CN110008365A (zh) * | 2019-04-09 | 2019-07-12 | 广东工业大学 | 一种图像处理方法、装置、设备及可读存储介质 |
| CN110222793A (zh) * | 2019-06-20 | 2019-09-10 | 中国科学院自动化研究所 | 基于多视角主动学习的在线半监督分类方法及系统 |
| CN110727833B (zh) * | 2019-09-30 | 2023-03-31 | 广东工业大学 | 一种基于多视角学习的图数据检索结果优化方法 |
| CN110727833A (zh) * | 2019-09-30 | 2020-01-24 | 广东工业大学 | 一种基于多视角学习的图数据检索结果优化方法 |
| CN111680579A (zh) * | 2020-05-22 | 2020-09-18 | 常州工业职业技术学院 | 一种自适应权重多视角度量学习的遥感图像分类方法 |
| CN112884030A (zh) * | 2021-02-04 | 2021-06-01 | 重庆邮电大学 | 一种基于交叉重建的多视角分类系统及方法 |
| CN115878993A (zh) * | 2021-09-28 | 2023-03-31 | 中移(苏州)软件技术有限公司 | 一种标签重构分类方法、装置、计算设备和存储介质 |
| CN113985733A (zh) * | 2021-10-26 | 2022-01-28 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应概率学习的配电网故障辨识方法 |
| CN113985733B (zh) * | 2021-10-26 | 2023-11-17 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应概率学习的配电网故障辨识方法 |
| CN114492620A (zh) * | 2022-01-24 | 2022-05-13 | 西安电子科技大学 | 基于证据深度学习的可信多视角分类方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN108021930B (zh) | 2022-01-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108021930B (zh) | 一种自适应的多视角图像分类方法及系统 | |
| Klein et al. | Timewarp: Transferable acceleration of molecular dynamics by learning time-coarsened dynamics | |
| CN117237733B (zh) | 一种结合自监督和弱监督学习的乳腺癌全切片图像分类方法 | |
| CN110348579B (zh) | 一种领域自适应迁移特征方法及系统 | |
| CN105335756B (zh) | 一种基于鲁棒学习模型的图像分类方法与图像分类系统 | |
| CN108171279B (zh) | 一种多视角视频自适应乘积Grassmann流形子空间聚类方法 | |
| KR100724104B1 (ko) | 멀티플 지지벡터장치를 사용하여 멀티플 데이터세트로부터의 지식발견 강화방법 | |
| CN112585684A (zh) | 确定蛋白结构的机器学习 | |
| CN105740912B (zh) | 基于核范数正则化的低秩图像特征提取的识别方法及系统 | |
| CN110210625A (zh) | 基于迁移学习的建模方法、装置、计算机设备和存储介质 | |
| CN109063724A (zh) | 一种增强型生成式对抗网络以及目标样本识别方法 | |
| CN112529063B (zh) | 一种适用于帕金森语音数据集的深度域适应分类方法 | |
| CN109242832B (zh) | 一种多时相多光谱遥感影像变化检测方法及系统 | |
| Magnet et al. | Scalable and efficient functional map computations on dense meshes | |
| Park et al. | Bayesian manifold learning: the locally linear latent variable model (LL-LVM) | |
| Liu et al. | Penalized partial least square discriminant analysis with ℓ1-norm for multi-label data | |
| CN110414616A (zh) | 一种利用空间关系的遥感图像字典学习分类方法 | |
| Van Assel et al. | Distributional reduction: Unifying dimensionality reduction and clustering with gromov-wasserstein | |
| CN108009570A (zh) | 一种基于核正负标签传播的数据分类方法及系统 | |
| CN117056771B (zh) | 结合类内特征对齐与柔性超参度量学习的迁移学习方法 | |
| CN110348287A (zh) | 一种基于字典和样本相似图的无监督特征选择方法和装置 | |
| CN106529604A (zh) | 一种自适应的图像标签鲁棒预测方法及系统 | |
| CN117371511A (zh) | 图像分类模型的训练方法、装置、设备及存储介质 | |
| CN117786457A (zh) | 一种鲁棒的弱监督多标签分类学习方法 | |
| CN111062406B (zh) | 一种面向异构领域适应的半监督最优传输方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220114 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |