CN108846314A

CN108846314A - 一种基于深度学习的食材辨识系统和食材辨识方法

Info

Publication number: CN108846314A
Application number: CN201810432216.3A
Authority: CN
Inventors: 高忠科; 党伟东; 常传泉
Original assignee: Tianjin Keyuan Technology Co ltd; Tianjin University
Current assignee: Tianjin Keyuan Technology Co ltd; Tianjin University
Priority date: 2018-05-08
Filing date: 2018-05-08
Publication date: 2018-11-20

Abstract

本发明提供一种基于深度学习的食材辨识系统和食材辨识方法，还涉及一种基于深度学习的食材图像识别模块的构建方法，其中所述食材图像识别模块的构建方法包括：获取大量食材图像，根据食材信息为所述食材图像分别设定标签，构建带标签的食材图像数据库；构建初始深度学习网络模型，包括对网络结构以及网络参数的初始化；将所述食材图像数据库中食材图像输入初始深度学习网络模型，训练获得食材图像识别模块。本发明将基于深度学习的图像识别方法用于食材识别，采用深度学习算法对食材数据进行训练分析，能够实现尽可能精确的食材辨识。

Description

一种基于深度学习的食材辨识系统和食材辨识方法

技术领域

本发明涉及一种食材辨识系统和食材辨识方法，以及基于深度学习的食材图像识别模块的构建方法和所述食材图像识别模块在智能冰箱中的应用。

背景技术

深度学习作为一种新兴的机器学习方法，其特征在于模拟人脑关于认知的结构，不断提取样本特征，进而抽象出样本的属性特征。通过数据驱动，可找寻大量样本的内在联系，进而解决一类问题。其在语音识别、图像识别和自然语言处理三个领域中，对于图像的处理是深度学习最早尝试的领域。随着各机构组织研究人员的不懈努力和计算机处理数据能力的不断提高，深度学习算法的模型层次不断加深，结构日趋复杂，在图像识别上对识别效果的提升最为显著。从传统的CNN，到后来的DPM、RCNN，再到现如今AlexNet、GoogLeNet、ResNet等，许多网络结构都能在不同程度上实现对图像的准确识别。如今图像识别已经成为一项较为成熟的技术，在网络搜索、军事、医疗、安防、智能家居等领域均有广泛应用。

智能家居提高了人们的生活质量、工作效率，体现了科技性和人性化。作为智能家居系统中不可或缺的一部分，智能冰箱与人们的生活息息相关。在传统冰箱的使用中，食材管理成为一直困扰家家户户的问题，靠里面放置的食材时常因为用户看不到而变质，长此以往将很严重的浪费。通过智能冰箱实现对食材的自主识别，并搭建服务器实现食材管理，是实现健康饮食的关键一步。。

发明内容

针对现有技术问题中的一种或多种，在本发明的一个方面，本发明提供一种基于深度学习的食材图像识别模块的构建方法，包括：

(1)获取大量食材图像，根据食材信息为所述食材图像分别设定标签，构建带标签的食材图像数据库；

(2)构建初始深度学习网络模型；

(3)将所述食材图像数据库中食材图像输入初始深度学习网络模型，训练获得食材图像识别模块。

根据本发明的一个方面，所述步骤(2)中，初始深度学习网络模型采用Mask RCNN网络模型，所述Mask RCNN网络模型包括VGG、RPN、ROIAlign、卷积输出四部分，优选地，

所述VGG部分用于接受图像输入，通过卷积、池化过程产生特征图谱输出，其结构式如下：

input->[conv_1*α->max_pool]*β->[conv_1*λ->conv_2->max_pool]*γ->fmap式中，input表示输入，conv_1表示卷积层，卷积核大小为3*3，max_pool表示最大池化，conv_2表示卷积层，卷积核大小为1*1，fmap为VGG网络的特征图谱输出，其中α、β、λ和γ为特定结构的重复次数，均为整数，且满足：α>0，优选α＝2；β>0，优选β＝2；λ>0，优选λ＝2；γ>0，优选γ＝2；

所述RPN部分用于接受VGG产生的特征图谱，采用不同大小的滑窗生成特征向量，然后通过分类核、区域核产生分类图谱、区域界定图谱，用于后续内容分类与区域界定，结构式如下：

式中，a_box表示滑窗，可视为一种步长为1的卷积核，rpn_out表示输出的特征向量，cls_kernel表示分类核，reg_kernel表示区域核，二者本质上均为卷积核，cls_out为分类特征图谱，reg_out为区域界定特征图谱；

所述ROIAlign部分用于接受RPN部分的区域界定，利用双线性插值计算对应于原图的当前特征图中的像素点输出，计算公式如下：

式中，x₁,y₁为原图中像素点坐标，x₂,y₂为当前特征图中像素点坐标，X,Y为原图大小，x,y为当前特征图大小；

所述卷积输出部分包括卷积部分CONV和输出部分，所述卷积部分CONV包括FastRCNN模型和FCN模型，所述输出部分包括分类输出、区域界定输出和图像分割输出。

根据本发明的一个方面，所述步骤(2)中构建初始深度学习网络模型的方法为：获取公开的用于图像识别的已训练RPN模型和已训练Fast RCNN模型作为初始深度学习网络模型。

根据本发明的一个方面，所述步骤(3)具体操作方法为：

将所述食材图像数据库中的食材图像分为训练样本和测试样本，优选地，所述训练样本为所述食材图像数据库中食材图像的80％，其余20％食材图像作为测试样本；

将所述训练样本输入所述初始深度学习模型，通过反向传播算法对所述已训练RPN模型进行参数更新，产生候选区域，利用训练样本对所述已训练Fast RCNN模型再次进行训练，获得进一步训练的Fast RCNN模型，通过所述进一步训练的Fast RCNN模型的卷积层提取输入图像的整体特征，得到输入图像的特征图，结合参数更新后的RPN模型产生的候选区域得到图像中候选区域的特征图，对每一个候选区域使用ROIAlign进行像素校正，得到每个候选区域后对每个候选区域进行预测，得到待识别物体的类别与bounding box，同时使用FCN网络对每个候选区域进行实例分割，预测每个像素点所属类别，根据得到的图像分割结果优化模型结构与参数，获得基于Mask RCNN网络模型的食材识别模块。

根据本发明的一个方面，所述训练过程中使用的损失函数表达式为：

L＝L_cls+L_reg+L_mask，

其中L为总损失函数，L_cls为分类损失函数，L_reg为区域界定损失函数，L_mask为图像分割损失函数，

式中，

其中N_cls表示分类层的归一化，p_i为第i个anchor的目标预测概率值，为groundtruth的标签值，当第i个anchor为正标签时为1，当第i个anchor为负标签时为0；

其中λ为平衡权重，N_reg表示回归层的归一化，t_i为预测的bounding box参数化坐标(t_x,t_y,t_w,t_h)的向量，为第i个anchor为正标签时对应的bounding box参数化坐标的向量，R是Smooth L1函数，其计算公式为

图像分割损失函数是对每一个像素用Sigmoid求二值交叉熵，得到平均的二值交叉熵误差L_mask；对于每一个m×m大小的候选区域，当所有类别为K时，FCN层分支有一个K×m²维的输出，对于每个候选区域，如果检测到候选区域属于哪一类，则用哪一个分支的二值交叉熵作为误差值进行计算，满足以下表达式：

L_mask(cls_k)＝Sigmoid(cls_k)

其中cls_k为对应第k类的区域输出，Sigmoid表示平均二值交叉熵计算。

根据本发明的一个方面，所述优化模型结构与参数的具体操作方法为：

确定模型结构中的超参数数量及其取值范围，构成参数空间；

在确定的参数空间下执行细菌觅食优化算法，以模型在参数向量下的准确率作为评价该向量的目标函数；

把所述细菌觅食优化算法获得的最优参数向量输出作为该模型的参数设置。

根据本发明的一个方面，所述细菌觅食优化算法的具体方法为：

初始化参数：给定算法中参数p,S,P_ed,C(i)的初始值，设定趋化步数N_C、复制次数N_re、消除分散次数N_ed，游泳长度N_S，其中参数p,S,P_ed,C(i)分别代表：优化过程变量数量，细菌总数，消除扩散概率，随机方向上的步长大小；

计算当前细菌适应值函数J(i,j,k,l)并初始化J_last＝J(i,j,k,l)，式中

J(i,j,k,l)＝J(i,j,k,l)+J_CC(θⁱ(j,k,l),P(j,k,l))

其中，J_CC(·)为趋化函数，i,j,k,l分别代表菌群数目判断环节、趋化环节、复制环节、消除扩散环节中的索引,简称判断索引、趋化索引、复制索引、消除扩散索引，θⁱ(·)代表第i个细菌在参数空间中的表示，P(·)代表除θⁱ(·)外其余细菌在参数空间中的表示；

细菌按某方向向量移动：

其中，θⁱ(·)是第i个细菌在参数空间中的表示，j,k,l分别是趋化索引、复制索引、消除扩散索引，C(i)是随机方向上的步长大小，△(i)表示参数空间θ中的随机方向向量；

计算移动后的适应值函数J(i,j+1,k,l)，判断J_last与J(i,j+1,k,l)，做如下代换：

J_last＝min{J(i,j+1,k,l),J_last}

并将游动次数迭代值m加1，其中，i,j,k,l分别代表菌群数目判断环节、趋化环节、复制环节、消除扩散环节中的索引,简称判断索引、趋化索引、复制索引、消除扩散索引；

细菌进行N_S次游动后，切换至下一细菌游动，同时菌群判断数i加1；菌群全部完成游动后，菌群判断数i重置为0，并进行一次趋化，趋化计数值j加1，菌群进行下一组游动；趋化表示菌群中优良个体对其他个体的吸引及速度更新，该过程描述如下：

其中，J_cc(θ,P(j,k,l))表示趋化函数，S是细菌总数，p是该优化过程变量数量，表现在单个细菌中，有θ＝[θ₁,θ₂,...,θ_m,...,θ_p]^T，是参数空间中一点，d_attractant w_attractant,h_reprllant,w_repellant是描述系数，θ是细菌群中优良个体，i,j,k,l分别代表菌群数目判断环节、趋化环节、复制环节、消除扩散环节中的索引,简称判断索引、趋化索引、复制索引、消除扩散索引；

菌群完成N_c次趋化后，趋化计数值j重置为0，并进行一次复制，复制计数值k加1，菌群进行下一组趋化；复制表示健康的细菌分裂成两个子细菌，停留在原来搜索空间位置；和

菌群完成N_re次复制后，复制计数值k重置为0，并进行一次消除扩散，消除扩散计数值l加1，菌群进行下一组复制；菌群完成N_ed次消除扩散后算法结束，得到最优参数向量输出；消除扩散表示以消除扩散概率P_ed去除细菌群中的某些细菌，达到选择作用，同时以消除扩散概率P_ed把细菌群中的某些细菌分散到整个搜索空间中，避免陷入局部最优解。

根据本发明的一个方面，所述步骤(1)中，所述食材信息包括食材的颜色、类别、体积和数量。

在本发明的另一方面，提供一种基于深度学习的食材辨识系统，包括：

图像采集设备，用于获取食材图像；

食材图像识别模块，与所述图像采集设备连接，所述食材图像识别模块基于深度学习网络模型，用于根据所获取的食材图像进行食材识别，确定食材信息；和

用户界面，与所述食材图像识别模块连接，用于接收并显示食材图像识别模块所识别确定的食材信息。

根据本发明的一个方面，所述基于深度学习的食材辨识系统还包括与食材图像识别模块连接的食材数据库；优选地，所述食材数据库包括食材的热量和营养元素数据，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒中的一种或多种。

根据本发明的一个方面，所述食材图像识别模块包括基于深度学习的食材辨识应用程序接口。

根据本发明的一个方面，所述深度学习网络模型包括深度卷积神经网络模型及深度卷积神经网络模型的变形和改进、递归神经网络模型及递归神经网络模型的变形和改进、生成对抗网络模型及生成对抗网络模型的变形和改进。

根据本发明的一个方面，所述食材图像识别模块是基于Mask RCNN网络模型经训练而成，具体为：

获取大量食材图像，根据食材信息对所述食材图像设定标签，构建带标签的食材图像数据库，优选地，其中80％数据库作为训练样本，剩余20％数据库作为测试样本；

获取公开的用于图像识别的已训练RPN模型和已训练Fast RCNN模型作为初始深度学习网络模型；

将所述训练样本输入所述初始深度学习模型，通过反向传播算法对所述已训练RPN模型进行参数更新，产生候选区域，利用训练样本对所述已训练Fast RCNN模型再次进行训练，获得进一步训练的Fast RCNN模型，通过所述进一步训练的Fast RCNN模型的卷积层提取输入图像的整体特征，得到输入图像的特征图，结合参数更新后的RPN模型产生的候选区域得到图像中候选区域的特征图，对每一个候选区域使用ROIAlign进行像素校正，得到每个候选区域后对每个候选区域进行预测，得到待识别物体的类别与bounding box，同时使用FCN网络对每个候选区域进行实例分割，预测每个像素点所属类别，根据得到的图像分割结果优化模型结构与参数，得到基于Mask RCNN网络模型的食材图像识别模块。

L＝L_cls+L_reg+L_mask，

式中，

L_mask(cls_k)＝Sigmoid(cls_k)

J(i,j,k,l)＝J(i,j,k,l)+J_CC(θⁱ(j,k,l),P(j,k,l))

细菌按某方向向量移动：

J_last＝min{J(i,j+1,k,l),J_last}

在本发明的又一方面，提供一种基于深度学习的食材辨识方法，包括：

获取食材图像；

对获取的食材图像进行食材识别，确定食材信息；和

将所述食材信息反馈给用户。

根据本发明的一个方面，所述食材识别包括识别食材基本信息和/或识别食材扩展信息。

根据本发明的一个方面，所述识别食材基本信息通过食材图像识别模块完成，将所获取的食材图像输入食材图像识别模块，确定食材基本信息；优选地，所述图像识别模块制作成基于深度学习的食材辨识应用程序接口，通过调用基于深度学习的食材辨识应用程序接口对所获取食材图像进行识别，确定食材基本信息；优选地，所述食材基本信息包括食材的类别和/或数量、和/或颜色、和/或体积估计；和/或

所述识别食材扩展信息采用在食材图像识别模块上连接食材数据库，食材图像识别模块根据识别的食材基本信息调取数据库中数据，确定食材扩展信息；

优选地，所述食材扩展信息包括食材质量和/或食材热量和/或对食材含有的营养元素的评估；

进一步优选地，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒中的一种或多种。

根据本发明的一个方面，将所述食材信息反馈给用户的方法采用将食材图像识别模块接入至用户界面，所述食材基本信息和/或食材扩展信息呈现于用户界面。

在本发明的又一方面，本发明还提供一种智能冰箱中食材储备信息的管理系统，包括：

智能冰箱，

设置于智能冰箱储藏室中的图像采集设备，用于获取智能冰箱储藏室中的食材图像；

食材图像识别模块，用于识别所获取的食材图像；

数据库储存模块，用于储存食材信息；

云端服务器，用于所述食材图像识别模块和数据库储存模块的交互，以及图像采集设备与食材图像识别模块的交互；

设置于智能冰箱上的人机交互模块，与食材图像识别模块连接，用于用户与智能冰箱之间进行信息交互。

根据本发明的一个方面，所述食材信息包括食材类别信息、食材数量信息、食材颜色信息、食材营养成分信息、食材热量信息、食材质量信息、冰箱可用存储空间的信息；

优选地，所述食材颜色信息包括光泽度、颜色亮度、颜色均匀度中的部分或全部；

优选地，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒。

在本发明的又一方面，本发明还提供一种基于深度学习的食材辨识方法在智能冰箱中的应用，包括：

获取智能冰箱储存的食材图像；

将食材图像传输至云端服务器；

通过食材图像识别模块确定所述食材图像对应的食材信息；

将所述食材信息更新至数据库储存模块；

用户通过人机交互模块访问更新后的数据库储存模块获取食材储备信息。

根据本发明的一个方面，所述传输的方式包括wifi传输方式、lifi传输方式。

根据本发明的一个方面，所述的确定所述食材图像对应的食材信息，包括通过智能冰箱的食材采购信息和/或饮食历史记录信息进行佐证，确保食材识别的准确率。

根据本发明的一个方面，所述的确定所述食材图像对应的食材信息，包括通过食材附带的RFID标签进行辅助识别，确保食材识别的准确率。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明的一个实施例的基于深度学习的食材图像识别模块的构建方法流程图；

图2为本发明的一个实施例的Mask RCNN网络模型的结构；

图3为本发明的一个实施例的VGG部分结构示意图；

图4为本发明的一个实施例的RPN部分结构示意图；

图5为本发明的一个实施例的细菌觅食优化算法流程图；

图6为本发明的一个实施例的食材辨识方法流程图；

图7为本发明的一个实施例的智能冰箱食材储备信息管理系统的示意图；

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。

下文的公开提供了许多不同的实施方式或例子用来实现本发明的不同结构。为了简化本发明的公开，下文中对特定例子的部件和设置进行描述。当然，它们仅仅为示例，并且目的不在于限制本发明。此外，本发明可以在不同例子中重复参考数字和/或参考字母，这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施方式和/或设置之间的关系。此外，本发明提供了的各种特定的工艺和材料的例子，但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例1：

在本发明的一个实施方式中，提供了一种基于深度学习的食材图像识别模块的构建方法，如图1所示，示出了本发明的一个实施例的基于深度学习的食材图像识别模块的构建方法，包括：

(2)构建初始深度学习网络模型；

根据本发明的一个优选实施例，上述步骤(2)中，初始深度学习网络模型采用MaskRCNN网络模型，所述Mask RCNN网络模型包括VGG、RPN、ROIAlign、卷积输出四部分，如图2所示，示出了本发明的一个实施例的Mask RCNN网络模型的结构，其中：

所述VGG部分用于接受图像输入，通过卷积、池化过程产生特征图谱输出，如图3所示，示出了本发明的一个实施例的VGG部分结构示意图，其结构式如下：

所述RPN部分用于接受VGG产生的特征图谱，采用不同大小的滑窗生成特征向量，然后通过分类核、区域核产生分类图谱、区域界定图谱，用于后续内容分类与区域界定，如图4所示，示出了本发明的一个实施例的RPN部分结构示意图，结构式如下：

所述卷积输出部分包括卷积部分CONV和输出部分，所述卷积部分CONV包括FastRCNN模型和FCN模型，所述输出部分包括分类输出、区域界定输出和图像分割输出。其中分类输出表明区域中图像所属类别；区域界定输出在整个图像中框定可分类对象；图像分割输出对可分类对象进行像素级别的分割。

根据本发明的一个优选实施例，上述步骤(2)中构建初始深度学习网络模型的方法为：获取公开的用于图像识别的已训练RPN模型和已训练Fast RCNN模型作为初始深度学习网络模型。

根据本发明的一个实施例，所述步骤(3)具体操作方法为：

将所述训练样本输入所述初始深度学习模型，通过反向传播算法对所述已训练RPN模型进行参数更新，产生候选区域，利用训练样本对所述已训练Fast RCNN模型再次进行训练，获取进一步训练的Fast RCNN模型，通过所述进一步训练的Fast RCNN模型的卷积层提取输入图像的整体特征，得到输入图像的特征图，结合参数更新后的RPN模型产生的候选区域得到图像中候选区域的特征图，对每一个候选区域使用ROIAlign进行像素校正，得到每个候选区域后对每个候选区域进行预测，得到待识别物体的类别与bounding box，同时使用FCN网络对每个候选区域进行实例分割，预测每个像素点所属类别，根据得到的图像分割结果优化模型结构与参数，获得基于Mask RCNN网络模型的食材识别模块。

其中所述Mask RCNN网络模型的特点为：Mask RCNN模型能够在原有RCNN系列目标检测的基础上，实现对目标像素级别的识别。Mask RCNN网络模型比较容易实现和训练，运算速度也较快，可以很方便地应用到其他领域。将Mask RCNN网络模型应用于智能冰箱的食材识别中，将更为精准快速的识别出食材种类、数量等，为食材管理与推荐奠定了基础。

根据本发明的一个优选实施例，上述步骤(3)中，所述训练过程中使用的损失函数表达式为：

L＝L_cls+L_reg+L_mask，

式中，

L_mask(cls_k)＝Sigmoid(cls_k)

根据本发明的一个优选实施例，所述优化模型结构与参数的具体操作方法为：

在确定的参数空间下执行细菌觅食优化算法，以模型在参数向量下的准确率作为评价该向量的目标函数；和

根据本发明的一个优选实施例，如图5所示，示出了本发明的一个实施例的细菌觅食优化算法的流程图，包括：

J(i,j,k,l)＝J(i,j,k,l)+J_CC(θⁱ(j,k,l),P(j,k,l))

细菌按某方向向量移动：

J_last＝min{J(i,j+1,k,l),J_last}

根据本发明的一个优选实施例，所述步骤(1)中，所述食材信息包括食材的颜色、类别、体积和数量。根据食材信息为食材图像数据库中的食材图像设定标签后，可以使用带有标签的食材图像数据库中的食材图像对初始深度学习网络模型进行训练，可得到能够确定食材颜色、类别、体积和数量的深度学习网络模型，然后通过识别得到的食材颜色、类别、体积、数量对食材的热量、包含营养元素、质量等进行估计，丰富食材信息，丰富的过程中需要连接互联网或者数据库，例如，通过查询一个苹果包含哪些营养元素，对识别到的n个苹果所包含的营养元素进行估计。

在本发明的另一实施方式中，提供一种基于深度学习的食材辨识系统，所述基于深度学习的食材辨识系统包括：

图像采集设备，用于获取食材图像；

根据本发明的一个优选实施例，所述基于深度学习的食材辨识系统还包括与食材图像识别模块连接的食材数据库；优选地，所述食材数据库包括食材的热量和营养元素数据，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷或硒中的一种或多种。

根据本发明的一个优选实施例，所述食材图像识别模块包括基于深度学习的食材辨识应用程序接口。

根据本发明的一个优选实施例，所述深度学习网络模型包括但不限于深度卷积神经网络模型及深度卷积神经网络模型的变形和改进、递归神经网络模型及递归神经网络模型的变形和改进、生成对抗网络模型及生成对抗网络模型的变形和改进。

根据本发明的一个优选实施例，所述食材图像识别模块是基于Mask RCNN网络模型经训练而成，具体为：

获取公开的用于图像识别的已训练RPN模型和已训练Fast RCNN模型作为初始深度学习模型；

将所述训练样本输入所述初始深度学习模型，通过反向传播算法对所述已训练RPN模型进行参数更新，产生候选区域，利用训练样本对所述已训练Fast RCNN模型再次进行训练，获取进一步训练的Fast RCNN模型，通过所述进一步训练的Fast RCNN模型的卷积层提取输入图像的整体特征，得到输入图像的特征图，结合参数更新后的RPN模型产生的候选区域得到图像中候选区域的特征图，对每一个候选区域使用ROIAlign进行像素校正，得到每个候选区域后对每个候选区域进行预测，得到待识别物体的类别与bounding box，同时使用FCN网络对每个候选区域进行实例分割，预测每个像素点所属类别，根据得到的图像分割结果优化模型结构与参数，得到基于Mask RCNN网络模型的食材图像识别模块。

根据本发明的一个优选实施例，上述训练过程中使用的损失函数表达式为：

L＝L_cls+L_reg+L_mask，

式中，

L_mask(cls_k)＝Sigmoid(cls_k)

根据本发明的一个优选实施例，如图5所示，示出了上述细菌觅食优化算法的流程图，包括：

J(i,j,k,l)＝J(i,j,k,l)+J_CC(θⁱ(j,k,l),P(j,k,l))

细菌按某方向向量移动：

J_last＝min{J(i,j+1,k,l),J_last}

在本发明的另一实施方式中，提供了一种基于深度学习的食材辨识方法，如图6所示，所述基于深度学习的食材辨识方法包括：

获取食材图像；

对获取的食材图像进行食材识别，确定食材信息；和

将所述食材信息反馈给用户。

根据本发明的一个优选实施例，所述食材识别包括识别食材基本信息和/或识别食材扩展信息。

根据本发明的一个优选实施例，所述识别食材基本信息通过食材图像识别模块完成，将所获取的食材图像输入食材图像识别模块，确定食材基本信息；优选地，所述图像识别模块制作成基于深度学习的食材辨识应用程序接口，通过调用基于深度学习的食材辨识应用程序接口对所获取食材图像进行识别，确定食材基本信息；优选地，所述食材基本信息包括食材的类别和/或数量、和/或颜色、和/或体积估计；和/或

所述识别食材扩展信息采用在食材图像识别模块上连接食材数据库，食材图像识别模块根据识别的食材基本信息调取数据库中数据，确定食材扩展信息。

根据本发明的一个优选实施例，所述食材扩展信息包括食材质量和/或食材热量和/或对食材含有的营养元素的评估。

根据本发明的一个优选实施例，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒中的一种或多种。

根据本发明的一个优选实施例，将所述食材信息反馈给用户的方法采用将食材图像识别模块接入至用户界面，所述食材基本信息和/或食材扩展信息呈现于用户界面。

在本发明的又一实施方式中，提供了一种智能冰箱中食材储备信息的管理系统，如图7所示，所述智能冰箱中食材储备信息的管理系统包括：

智能冰箱，

食材图像识别模块，用于识别所获取的食材图像；

数据库储存模块，用于储存食材信息；

根据本发明的一个优选实施例，所述食材信息包括食材类别信息、食材数量信息、食材颜色信息、食材营养成分信息、食材热量信息、食材质量信息、冰箱可用存储空间的信息。

根据本发明的一个优选实施例，所述食材颜色信息包括光泽度、颜色亮度、颜色均匀度中的部分或全部。

根据本发明的一个优选实施例，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒。

在本发明的又一实施方式中，提供了一种基于深度学习的食材辨识方法在智能冰箱中的应用，包括：

获取智能冰箱储存的食材图像；

将食材图像传输至云端服务器；

通过食材图像识别模块确定所述食材图像对应的食材信息；

将所述食材信息更新至数据库储存模块；

根据本发明的一个优选实施例，所述传输的方式包括wifi传输方式、lifi传输方式。

根据本发明的一个优选实施例，所述的确定所述食材图像对应的食材信息，包括通过智能冰箱的食材采购信息和/或饮食历史记录信息进行佐证，确保食材识别的准确率；和/或所述的确定所述食材图像对应的食材信息，包括通过食材附带的RFID标签进行辅助识别，确保食材识别的准确率。例如可以根据智能冰箱所记录的食材采购信息以及饮食历史记录信息来佐证智能冰箱中的食材识别的准确率，识别模块识别出未购买的食材，说明出现了错误；识别模块识别出已经食用了的食材，说明出现了错误。另外，还可以根据食材上附带的RFID标签来辅助识别智能冰箱的食材识别模块的准确率。

本发明将基于深度学习的图像识别方法用于食材识别，采用深度学习算法对食材数据进行训练分析，能够实现尽可能精确的食材辨识。将此项技术用于智能冰箱，将极大程度上方便用户对冰箱内食材进行管理，监管食材质量，避免因食材变质造成食材浪费以及危害用户身体健康。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的食材图像识别模块的构建方法，其特征在于：包括：

(1)获取大量食材图像，根据食材信息为所述食材图像分别设定标签，构建带标签的食材图像数据库，优选地，所述食材信息包括食材的颜色、类别、体积和数量；

(2)构建初始深度学习网络模型；

2.如权利要求1所述的基于深度学习的食材图像识别模块的构建方法，其特征在于：所述步骤(2)中，初始深度学习网络模型采用Mask RCNN网络模型，所述Mask RCNN网络模型包括VGG、RPN、ROIAlign、卷积输出四部分，

优选地，

所述卷积输出部分包括卷积部分CONV和输出部分，所述卷积部分CONV包括Fast RCNN模型和FCN模型，所述输出部分包括分类输出、区域界定输出和图像分割输出；

和/或，所述步骤(2)中构建初始深度学习网络模型的方法为：获取公开的用于图像识别的已训练RPN模型和已训练Fast RCNN模型作为初始深度学习网络模型；

和/或，所述步骤(3)具体操作方法为：

将所述训练样本输入所述初始深度学习模型，通过反向传播算法对所述已训练RPN模型进行参数更新，产生候选区域，利用训练样本对所述已训练Fast RCNN模型再次进行训练，获得进一步训练的Fast RCNN模型，通过所述进一步训练的Fast RCNN模型的卷积层提取输入图像的整体特征，得到输入图像的特征图，结合参数更新后的RPN模型产生的候选区域得到图像中候选区域的特征图，对每一个候选区域使用ROIAlign进行像素校正，得到每个候选区域后对每个候选区域进行预测，得到待识别物体的类别与bounding box，同时使用FCN网络对每个候选区域进行实例分割，预测每个像素点所属类别，根据得到的图像分割结果优化模型结构与参数，获得基于Mask RCNN网络模型的食材识别模块；

优选地，所述优化模型结构与参数的具体操作方法为：

把所述细菌觅食优化算法获得的最优参数向量输出作为该模型的参数设置；

进一步优选地，所述细菌觅食优化算法的具体方法为：

J(i,j,k,l)＝J(i,j,k,l)+J_CC(θⁱ(j,k,l),P(j,k,l))

细菌按某方向向量移动：

其中θⁱ(·)是第i个细菌在参数空间中的表示，j,k,l分别是趋化索引、复制索引、消除扩散索引，C(i)是随机方向上的步长大小，△(i)表示参数空间θ中的随机方向向量；

J_last＝min{J(i,j+1,k,l),J_last}

并将游动次数迭代值m加1，其中i,j,k,l分别代表菌群数目判断环节、趋化环节、复制环节、消除扩散环节中的索引,简称判断索引、趋化索引、复制索引、消除扩散索引；

菌群完成N_re次复制后，复制计数值k重置为0，并进行一次消除扩散，消除扩散计数值l加1，菌群进行下一组复制；菌群完成N_ed次消除扩散后算法结束，得到最优参数向量输出；消除扩散表示以消除扩散概率P_ed去除细菌群中的某些细菌，达到选择作用，同时以消除扩散概率P_ed把细菌群中的某些细菌分散到整个搜索空间中，避免陷入局部最优解；

和/或，所述步骤(3)中，所述训练过程中使用的损失函数表达式为：

L＝L_cls+L_reg+L_mask，

式中，

其中N_cls表示分类层的归一化，p_i为第i个anchor的目标预测概率值为ground truth的标签值，当第i个anchor为正标签时为1，当第i个anchor为负标签时为0；

L_mask(cls_k)＝Sigmoid(cls_k)

3.一种基于深度学习的食材辨识系统，其特征在于，包括：

图像采集设备，用于获取食材图像；

4.如权利要求3所述的食材辨识系统，其特征在于，所述食材辨识系统还包括与所述食材图像识别模块连接的食材数据库；优选地，所述食材数据库包括食材的热量和营养元素数据，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒中的一种或多种；和/或，

所述食材图像识别模块包括基于深度学习的食材辨识应用程序接口；和/或，

所述深度学习网络模型包括深度卷积神经网络模型及深度卷积神经网络模型的变形和改进、递归神经网络模型及递归神经网络模型的变形和改进、生成对抗网络模型及生成对抗网络模型的变形和改进。

5.如权利要求3或4所述的食材辨识系统，其特征在于，所述食材图像识别模块是基于Mask RCNN网络模型经训练而成，具体为：

将所述训练样本输入所述初始深度学习模型，通过反向传播算法对所述已训练RPN模型进行参数更新，产生候选区域，利用训练样本对所述已训练Fast RCNN模型再次进行训练，获得进一步训练的Fast RCNN模型，通过所述进一步训练的Fast RCNN模型的卷积层提取输入图像的整体特征，得到输入图像的特征图，结合参数更新后的RPN模型产生的候选区域得到图像中候选区域的特征图，对每一个候选区域使用ROIAlign进行像素校正，得到每个候选区域后对每个候选区域进行预测，得到待识别物体的类别与bounding box，同时使用FCN网络对每个候选区域进行实例分割，预测每个像素点所属类别，根据得到的图像分割结果优化模型结构与参数，得到基于Mask RCNN网络模型的食材图像识别模块；

优选地，所述训练过程中使用的损失函数表达式为：

L＝L_cls+L_reg+L_mask，

式中，

其中N_cls表示分类层的归一化，p_i为第i个anchor的目标预测概率值，为ground truth的标签值，当第i个anchor为正标签时为1，当第i个anchor为负标签时为0；

L_mask(cls_k)＝Sigmoid(cls_k)

其中cls_k为对应第k类的区域输出，Sigmoid表示平均二值交叉熵计算；

优选地，所述优化模型结构与参数的具体操作方法为：

进一步优选地，所述细菌觅食优化算法的具体方法为：

J(i,j,k,l)＝J(i,j,k,l)+J_CC(θⁱ(j,k,l),P(j,k,l))

其中，J_CC(·)为趋化函数，i、j、k、l分别代表：菌群数目判断环节、趋化环节、复制环节、消除扩散环节中的索引,简称判断索引、趋化索引、复制索引、消除扩散索引，θⁱ(·)代表第i个细菌在参数空间中的表示，P(·)代表除θⁱ(·)外其余细菌在参数空间中的表示；

细菌按某方向向量移动：

J_last＝min{J(i,j+1,k,l),J_last}

6.一种基于深度学习的食材辨识方法，其特征在于，包括：

获取食材图像；

对获取的食材图像进行食材识别，确定食材信息；和

将所述食材信息反馈给用户；

优选地，所述食材识别包括识别食材基本信息和/或识别食材扩展信息；

优选地，

所述识别食材基本信息通过食材图像识别模块完成，将所获取的食材图像输入食材图像识别模块，确定食材基本信息；优选地，所述图像识别模块制作成基于深度学习的食材辨识应用程序接口，通过调用基于深度学习的食材辨识应用程序接口对所获取食材图像进行识别，确定食材基本信息；优选地，所述食材基本信息包括食材的类别和/或数量、和/或颜色、和/或体积估计；和/或

进一步优选地，所述营养元素包括蛋白质、脂肪、糖类、膳食纤维、胆固醇、烟酸、维生素A、维生素B1、维生素B2、维生素E、维生素C、钙、镁、锌、铜、锰、铁、钾、磷、硒中的一种或多种；

优选地，将所述食材信息反馈给用户的方法采用将食材图像识别模块接入至用户界面，所述食材基本信息和/或食材扩展信息呈现于用户界面。

7.一种智能冰箱中食材储备信息的管理系统，其特征在于，包括：

智能冰箱，

食材图像识别模块，用于识别所获取的食材图像；

数据库储存模块，用于储存食材信息；

8.如权利要求7所述的智能冰箱中食材储备信息的管理系统，其特征在于，所述食材信息包括食材类别信息、食材数量信息、食材颜色信息、食材营养成分信息、食材热量信息、食材质量信息、冰箱可用存储空间的信息；

9.一种基于深度学习的食材辨识方法在智能冰箱中的应用，其特征在于，包括：

获取智能冰箱储存的食材图像；

将食材图像传输至云端服务器；

通过食材图像识别模块确定所述食材图像对应的食材信息；

将所述食材信息更新至数据库储存模块；

10.如权利要求9所述的基于深度学习的食材辨识方法在智能冰箱中的应用，其特征在于，所述传输的方式包括wifi传输方式、lifi传输方式；和/或，

所述的确定所述食材图像对应的食材信息，包括通过智能冰箱的食材采购信息和/或饮食历史记录信息进行佐证，确保食材识别的准确率；和/或

所述的确定所述食材图像对应的食材信息，包括通过食材附带的RFID标签进行辅助识别，确保食材识别的准确率。