CN112819874B

CN112819874B - 深度信息处理方法、装置、设备、存储介质以及程序产品

Info

Publication number: CN112819874B
Application number: CN202110019698.1A
Authority: CN
Inventors: 宋希彬; 张良俊
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Baidu USA LLC
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Baidu USA LLC
Priority date: 2021-01-07
Filing date: 2021-01-07
Publication date: 2024-05-28
Anticipated expiration: 2041-01-07
Also published as: US12125224B2; JP2022106666A; US20220122281A1; CN112819874A

Abstract

本公开公开了深度信息处理方法、装置、设备、存储介质以及程序产品，涉及图像处理技术领域，尤其涉及计算机视觉技术、深度学习技术和自动驾驶技术。具体实现方案为：通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定目标场景的中间深度信息；将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。本公开实施例可以提高稠密深度信息预测的准确性。

Description

深度信息处理方法、装置、设备、存储介质以及程序产品

技术领域

本公开涉及图像处理技术领域，尤其涉及计算机视觉技术、深度学习技术和自动驾驶技术。

背景技术

深度感知是指对同一场景中不同物体的远近的知觉，深度感知是许多计算机视觉任务(例如自动导航任务)中的重要组成部分。

例如，雷达设备通常只能生成稀疏深度图，该稀疏深度图缺失较多的深度数据。深度补全技术是指将采集的离散场景深度信息为输入，恢复稠密场景深度信息的方法。

发明内容

本公开提供了一种深度信息处理方法、装置、设备、存储介质以及程序产品。

根据本公开的一方面，提供了一种通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定目标场景的中间深度信息；

将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

根据本公开的另一方面，提供了一种深度信息处理装置，包括：

稀疏深度信息输入模块，用于通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定目标场景的中间深度信息；

稠密深度信息生成模块，用于将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开任一实施例所述的深度信息处理方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本公开任一实施例所述的深度信息处理方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开任一实施例所述的深度信息处理方法。

根据本公开的技术方案，提高稠密深度信息预测的准确性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例的一种深度信息处理方法的示意图；

图2是根据本公开实施例的一种深度信息处理方法的示意图；

图3是可以实现本公开实施例的深度信息补充模型的示意图；

图4是根据本公开实施例的一种深度信息处理方法的示意图；

图5是可以实现本公开实施例的子模型单元的示意图；

图6是可以实现本公开实施例的深度信息补充模型的示意图；

图7是可以实现本公开实施例的子模型单元的示意图；

图8是根据本公开实施例的一种深度信息处理方法的示意图；

图9是根据本公开实施例的一种深度信息处理装置的示意图；

图10是用来实现本公开实施例的深度信息处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本公开实施例公开的一种深度信息处理方法的流程图，本实施例可以适用于对目标场景的稀疏深度信息进行补充，生成目标场景的稠密深度信息的情况。本实施例方法可以由深度信息处理装置来执行，该装置可采用软件和/或硬件的方式实现，并具体配置于具有一定数据运算能力的电子设备中。

S101，通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定目标场景的中间深度信息。

深度信息补充模型用于对稀疏深度信息进行补充，形成稠密深度信息，其中，深度信息补充还可以理解为深度信息预测。一个场景的深度信息可以采用图像进行描述，该图像中的像素点具有深度信息。稀疏深度信息和稠密深度信息之间的区别，可以是指图像中有效像素点的占比不同。稀疏深度信息对应的图像中具有深度信息的像素点在该图像包括的全部像素点的占比(如20％)，小于稠密深度信息对应的图像中具有深度信息的像素点在该图像包括的全部像素点的占比(80％)。同时，稀疏深度信息对应的图像中，具有深度信息的像素点的分布不均匀且稀疏；稠密深度信息对应的图像中，具有深度信息的像素点的分布均匀且密集。稠密深度信息相较于稀疏深度信息，深度信息更为丰富和密集。

深度信息补充模型可以是指预先训练的深度学习模型。深度信息补充模型包括多个子模型单元，多个子模型单元之间的连接方式可以是串联和/或并联。

目标场景可以是包括任意应用场景，示例性的，目标场景可以是道路实景的场景，又如，目标场景可以是立体物体所在的场景。目标场景的稀疏深度信息可以是指采用雷达或者深度传感器对目标场景进行采集得到的深度信息图像，其中，深度信息图像中像素点具有深度信息。稀疏深度信息的采集设备可以配置于机器人、无人车和终端设备上，可以采用该机器人、无人车或终端设备在移动或静止过程中实时采集目标场景的深度信息。此外，通常采集得到的深度信息图像为单目图像。

目标场景的稀疏深度信息作为深度信息补充模型的输入数据。可选的，目标场景的稀疏深度信息作为深度信息补充模型中首部子模型单元或各子模型单元的输入数据。将稀疏深度信息输入至深度信息补充模型中，通过每个子模型单元，分别确定对应的中间深度信息。中间深度信息可以是指子模型单元输出的深度信息的预测结果，通常是对子模型单语输入的深度信息进行补充处理，形成的深度信息。每个子模型单元对应输出一个中间深度信息。

S102，将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

尾部子模型单元可以是指多个连接的子模型单元中处于末尾的子模型单元。示例性的，仅串联连接的多个子模型单元中，处于末尾的子模型单元为尾部子模型单元，或者，处于末尾的并联的多个子模型单元均为尾部子模型单元。在尾部子模型单元的数量为一个的情况下，将尾部子模型单元输出的中间深度信息，确定为目标场景的稠密深度信息，也即确定为深度信息补充模型的稠密深度信息。目标场景的稠密深度信息作为深度信息补充模型的输出数据。深度信息补充模型用于将稀疏深度信息补充为稠密深度信息。

根据本公开的技术方案，根据目标场景的稀疏深度信息，通过深度信息补充模型中子模型单元，分别确定目标场景的中间深度信息，实现对稀疏深度信息逐步补充，最后将尾部子模型单元的中间深度信息确定为目标场景的稠密深度信息，实现多阶段对稀疏深度信息进行补充，充分补充深度信息，提高深度信息预测的准确性。

图2是根据本公开实施例公开的另一种深度信息处理方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。

S201，将所述目标场景的稀疏深度信息作为所述深度信息补充模型中的首部子模型单元的输入，得到所述首部子模型单元确定的中间深度信息。

深度信息补充模型包括串联连接的各子模型单元。目标场景的稀疏深度信息作为深度信息补充模型中的首部子模型单元的输入，该目标场景的稀疏深度信息由首部子模型单元进行处理，得到首部子模型单元确定的中间深度信息，并向后一子模型单元传输。

首部子模型单元用于对稀疏深度信息进行补充，得到首部子模型单元确定的中间深度信息。其中，首部子模型单元确定的中间深度信息对应的图像中具有深度信息的像素点的占比，高于稀疏深度信息对应的图像中具有深度信息的像素点的占比，可以理解为，首部子模型单元确定的中间深度信息相较于稀疏深度信息更为稠密，同时首部子模型单元确定的中间深度信息中的深度信息更加丰富。

S202，针对所述深度信息补充模型中除首部子模型单元的每一其他子模型单元，将所述其他子模型单元的上一子模型单元所确定的中间深度信息，作为所述其他子模型单元的输入，得到所述其他子模型单元确定的中间深度信息。

其他子模型可以是指非首部子模型单元。其他子模型单元的上一子模型单元与其他子模型串联，且其他子模型单元的上一子模型单元的输出为其他子模型的输入。其他子模型单元的上一子模型单元的输出包括中间深度信息。其他子模型单元对上一子模型单元确定的中间深度信息进行处理，得到其他子模型确定的中间深度信息。其中，每个中间深度信息对应的图像尺寸均相同，且与目标场景的稀疏深度信息对应的图像尺寸相同，图像尺寸可以包括通道数、图像宽度和图像高度等。

实际上，首部子模型单元学习的内容是稀疏深度信息与真实稠密深度信息之间的差值，而每个其他子模型单元学习的内容可以是上一子模型单元输出的中间深度信息与真实稠密深度信息之间的差值。通过不断学习，每个子模型单元输出的中间深度信息越接近真实稠密深度信息。其中，真实稠密深度信息为目标场景的真实深度信息，即对应的图像中每个像素都具有深度信息。

如图3所示，深度信息补充模型包括多个串接的子模型单元302-304，其中，子模型单元302为首部子模型单元，子模型304为尾部子模型单元，子模型单元302接收稀疏深度信息301，并进行处理得到中间深度信息，并传输至串接的下一子模型单元303，以此类推，直至子模型单元304输出中间深度信息，确定为稠密深度信息305。可选的，深度信息补充模型包括至少两个子模型单元。

现有的用于深度信息补充的深度学习模型，通常只对深度信息进行单阶段处理，直接得到补充后的深度信息，而深度信息难以一步到位，导致深度信息补充的充分性不足。根据本公开的技术方案，通过在串接的多个子模型单元中，每个子模型的单元基于前一子模型单元提供的中间深度信息进行补充，实现多阶段的深度信息补充，逐步对稀疏深度信息进行累加补充，逐渐使稀疏深度信息更加稠密，可以精准提高深度信息的稠密性。

S203，将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

根据本公开的技术方案，通过在串接的多个子模型单元中，每个子模型的单元基于前一子模型单元提供的中间深度信息进行补充，通过多阶段深度信息的补充操作，逐步对稀疏深度信息进行累加补充，逐渐使稀疏深度信息更加稠密，可以精准提高深度信息的稠密性，从而提高深度信息的预测准确率。

图4是根据本公开实施例公开的另一种深度信息处理方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。

S401，通过所述深度信息补充模型中子模型单元的沙漏网络层，对输入的深度信息进行处理，得到补充深度信息。

各子模型单元的结构相同，均包括沙漏网络层和累加层，沙漏网络层与累加层相连，累加层的输入包括沙漏网络层的输出。补充深度信息可以是指输入的深度信息缺失的深度信息，补充深度信息用于累加到输入的深度信息中，对输入的深度信息进行补充，形成中间深度信息。补充深度信息对应的图像尺寸与输入的深度信息对应的图像尺寸相同。

其中，沙漏网络层(Hourglass Networks)包括编码器和解码器(Encoder-Decoder)。编码器和解码器是对称结构，编码器包括的卷积层数和解码器包括的卷积层数相同，从而，沙漏网络层输出的补充深度信息对应的图像尺寸与输入的深度信息对应的图像尺寸相同。编码器用于特征提取，解码器可以视作是编码器的逆向操作。示例性的，编码器可以采用深度卷积神经网络VGG(Visual Geometry Group)或残差网络(Resnet)等。其中，每个卷积操作包括k*k的卷积核及c层通道(Channel)。

如图5所示，子模型单元的结构中，子模型单元获取输入的深度信息501，依次采用沙漏网络层中的编码器502和解码器503进行处理，得到的数据为补充深度信息，并输入到累加层504中，累加层504还获取输入的深度信息501，将补充深度信息和输入的深度信息501进行累加得到中间深度信息505。其中，输入的深度信息501可以是稀疏深度信息，或者是中间深度信息。其中，在沙漏网络层中，编码器502和解码器503中箭头相连的两个卷积层对应，且尺寸相同，解码器503中卷积层需要与对应的卷积层(即箭头相连的卷积层)的输出进行特征融合。示例性的，解码器503和编码器502均包括4个卷积层。按照从左到右的顺序，解码器503第一个卷积层的输入是编码器502最后一个卷积层(即第四个卷积层)卷积获得的特征(feature)，该特征的尺寸最小。以后的解码器503卷积层的输入是上一层的解码器503卷积的输出和解码器503对应层的输出，即先进行上采样(up-sampling)，并融合尺寸相同的编码器502的卷积层中获得输出特征，融合方式可以是像素累加或者拼接(concate)加卷积操作。

S402，通过所述子模型单元的累加层，将补充深度信息与所述子模型单元输入的深度信息进行叠加，得到其他子模型单元确定的中间深度信息。

累加层用于第输入的深度信息与补充深度信息进行像素级累加，具体用于将相同尺寸的图像进行逐像素的深度信息累加操作。

可选的，将所述补充深度信息与所述子模型单元输入的深度信息进行叠加，包括：通过所述子模型单元的累加层，确定所述补充深度信息中的补充像素点与输入的深度信息中稀疏像素点之间的匹配关系；将所述补充像素点的补充深度数据与匹配的稀疏像素点的稀疏深度数据进行叠加。

匹配关系用于确定各补充像素点与各稀疏像素点之间的关系，以及用于确定需要进行叠加的补充像素点与稀疏像素点。可选的，匹配关系可以是指在图像中处于相同位置的补充像素点与稀疏像素点相互匹配。实际上，补充深度信息的图像尺寸和输入的深度信息的图像尺寸相同，可以将处于同一位置的补充像素点与稀疏像素点之间建立匹配的关系。补充深度数据用于描述补充像素点的深度信息值，稀疏深度数据用于描述稀疏像素点的深度信息值。可以直接将匹配的两个补充深度数据和稀疏深度数据进行累加计算，将得到的深度数据确定为匹配的位置处新像素点对应的深度数据，并基于具有新的深度数据的各新像素点组合形成新的图像，确定为中间深度信息。

通过确定补充像素点以及匹配的稀疏像素点，并将两个像素点的深度数据进行叠加，实现深度数据的像素级叠加，可以逐像素精准预测深度信息，从而得到叠加后形成的各新像素点，以及对应的新深度数据，以确定中间深度信息，从而准确预测中间深度信息中各像素点的深度信息，提高深度信息的预测准确性。

S403，将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

可选的，所述深度信息处理方法，还包括：通过所述深度信息补充模型中子模型单元，根据所述目标场景的像素信息，确定深度特征信息；根据所述深度特征信息，对所述子模型单元确定的中间深度信息进行调整。

像素信息可以是指像素点的像素值。像素信息用于描述目标场景的颜色特征，可以在与稀疏深度信息的采集条件相同的情况下，采用彩色摄像头对目标场景进行采集，得到像素信息，其中，采集条件相同可以是指，视角、亮度和相机参数等条件中的至少一项相同。通常，像素值可以采用红绿蓝(Red Green Blue，RGB)表示。深度特征信息用于描述子模型单元从目标场景的像素信息中学习到的深度特征。深度特征信息用于对子模型单元确定的中间深度信息进行调整，更新中间深度信息，以使中间深度信息更加准确和丰富。实际上，在目标场景中，一个物体中深度信息相同的像素点对应的像素信息相同，例如，相对于采集面一个物体中处于同一平面，且属于同一部位的像素点的深度和颜色均相同。从而，一个物体中部分像素的像素信息与深度信息存在一致性，由此，可以将目标场景的像素信息输入至子模型单元中，使子模型单元学习像素信息，而且像素信息的信息丰富且稠密，能够对场景的识别起到指导作用，例如对场景中各物体的轮廓具有指导作用，而通常属于同一个物体的深度信息相同的概率较高，可以据此预测属于同一个物体的像素点的深度信息，从而根据像素信息确定的深度特征信息来调整中间深度信息，可以使子模型单元能够更好的预测深度信息，提高深度信息的预测准确率。

在一个具体的例子中，如图6所示，像素信息606和输入的深度信息共同作为每个子模型单元(602-604)的输入。将目标场景的稀疏深度信息601和目标场景的像素信息606共同作为深度信息补充模型中的首部子模型单元602的输入，得到首部子模型单元确定的中间深度信息，该中间深度信息为采用像素信息606确定的深度特征信息，对稀疏深度信息601确定的中间深度信息进行调整得到的深度信息；针对深度信息补充模型中除首部子模型单元的每一其他子模型单元，将其他子模型单元(603和604)的上一子模型单元所确定的中间深度信息，和目标场景的像素信息共同作为其他子模型单元的输入，得到其他子模型单元确定的中间深度信息，该其他子模型单元确定的中间深度信息为，采用像素信息确定的深度特征信息，对根据上一子模型单元所确定的中间深度信息确定的中间深度信息进行调整，得到的深度信息。

如图7所示，通过深度信息补充模型中子模型单元的沙漏网络层，对输入的深度信息701和像素信息706进行处理，得到补充深度信息，沙漏网络层包括编码器702和解码器703，该补充深度信息实际是沙漏网络层根据像素信息706确定的深度特征信息，对沙漏网络层根据输入的深度信息701确定的补充深度信息进行调整，得到的深度信息；通过子模型单元的累加层704，将补充深度信息与子模型单元输入的深度信息进行叠加，得到其他子模型单元确定的中间深度信息705，从而，该中间深度信息705为，采用像素信息对根据输入的深度信息确定的中间深度信息进行调整，得到的深度信息。

通过在每个子模型单元中均使用颜色信息辅助进行深度预测，使稠密深度的预测结果更加准确。

通过沙漏网络层提取多尺度的深度信息特征，并将其他子模型单元的上一子模型单元输出的中间深度信息，确定为其他子模型单元的输入，可以使每个子模型单元的学习目标是上一子模型单元的中间深度信息与真实稠密深度信息之间的残差，从而使输入的中间深度信息迭代的逐渐接近真实稠密深度信息，从而获得高质量的稠密深度信息的恢复结果。

图8是根据本公开实施例公开的另一种深度信息处理方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。

S801，获取标准场景的标准稀疏深度信息和标准稠密深度信息。

标准稀疏深度信息用于作为模型的输入数据，标准稠密深度信息用于作为模型的真实值。标准稀疏深度信息和标准稠密深度信息是针对同一标准场景进行采集处理得到的深度信息。标准场景的标准稀疏深度信息和标准稠密深度信息用于作为一个训练样本，对深度学习模型进行训练，得到深度信息补充模型。可以对至少一个标准场景分别进行采集，形成多个样本对，不同样本对对应的标准场景可以不同或相同。获取大量样本对，形成训练数据集合，以对深度学习模型进行训练，得到深度信息补充模型。

可选的，所述获取标准场景的标准稀疏深度信息和标准稠密深度信息，包括：采用深度传感器对所述标准场景进行图像采集，得到所述标准稠密深度信息；在所述标准稠密深度信息中进行采样，生成所述标准稀疏深度信息。

深度传感器可以是是指高精度的深度传感器，可以采集到高精度的深度信息。采用深度传感器对标准场景进行图像采集，得到的深度信息可以认为是相对稠密的深度信息，由此可以作为标准稠密深度信息。在标准稠密深度信息中进行采样，用于对标准稠密深度信息进行筛选，得到少量的具有深度信息的像素点，形成标准稀疏深度信息，即用于将标准稠密深度信息从相对密集的深度信息，转变为相对稀疏离散的深度信息。

通过深度传感器对标准场景进行图像采集，将得到的深度信息作为标准稠密深度信息，并对标准稠密深度信息进行稀疏采样，形成标准稀疏深度信息，可以快速生成训练样本。

可选的，所述获取标准场景的标准稀疏深度信息和标准稠密深度信息，包括：采用雷达设备对所述标准场景进行视频采集，得到连续多帧稀疏深度信息；将所述连续多帧稀疏深度信息进行投影处理，生成所述标准稠密深度信息；在所述连续多帧稀疏深度信息中，获取与所述标准稠密深度信息匹配的稀疏深度信息，确定为所述标准稀疏深度信息。

雷达设备可以是指低精度的深度采集设备，可以采集到低精度的深度信息。采用雷达设备对标准场景进行视频采集，可以是指对标准场景进行连续采集，形成视频流数据。视频流数据包括多帧稀疏深度信息。

可以设置不同帧稀疏深度信息的采集视角不同，从而可以作为多目雷达设备拍摄得到的不同稀疏深度信息。相应的，将连续多帧稀疏深度信息进行投影处理，实际上是将多目稀疏深度信息融合为单目稠密深度信息，并将单目稠密深度信息确定为标准稠密深度信息。具体的，将连续多帧稀疏深度信息投影到其中任意一帧中，得到一帧对应的稠密深度信息，并将被选定的一帧稀疏深度信息确定为标准稀疏深度信息。标准稠密深度信息匹配的稀疏深度信息可以是指，与标准稠密深度信息的采集条件相同的稀疏深度信息。

其中，融合方式可以是根据多帧稀疏深度信息中各像素点之间的位置关系，以及各像素点具有的深度信息，确定某一采集视角下的某一帧包括的各像素点，以及包括的各像素点具有的深度信息。位置关系用于将各像素点映射到同一坐标系中，并确定属于同一帧的像素点。将该帧包括各像素点，以及包括的各像素点具有的深度信息进行组合，形成新的深度信息，确定为标准稠密深度信息。同时，将预先采集的该帧对应的稀疏深度信息，作为标准稀疏深度信息，与标准稠密深度信息进行组合，形成一个训练样本。

通过雷达对标准场景进行视频采集，将得到的多个深度信息进行融合形成标准稠密深度信息，并任意一个深度信息作为标准稀疏深度信息，可以在不具备高精度采集设备的情况下，同样精确生成训练样本，降低训练样本的生成成本。

可选的，一个训练样本还可以包括标准场景的标准像素信息，可以采用彩色摄像头对标准场景进行采集，得到标准像素信息，其中，彩色摄像头的采集条件与标准稀疏深度信息和标准稠密深度信息的采集条件相同。

深度学习模型的结构可以参考前述深度信息补充模型的结构的描述。各子模型单元的结构相同，在未进行训练时，深度学习模型中各子模型单元的顺序可以调整，在开始训练以及训练结束后，各子模型单元的顺序固定。在深度学习模型训练完成的情况下，将当前深度学习模型确定为深度信息补充模型。深度学习模型训练完成可以是指，各子模型单元的损失值之和小于第一损失阈值，或者尾部子模型单元的损失值小于第二损失阈值，或者迭代次数或训练次数达到次数阈值等。

在训练过程中，可以实时根据模型性能来重新更改训练阶段的训练样本、学习率或者训练迭代次数优化整个模型的性能。在应用过程中，如果损失值过大，可以增加子模型单元的数量、增加训练次数或者增加训练数据来提升目前模型的性能，从而实现整个系统的自我优化。其中，增加子模型单元的数量可以是指，针对预先训练的包括M个子模型单元的深度信息补充模型，仅将其中前N个(N<M)子模型单元组成的第一模型进行应用，在此基础上，可以增加子模型单元的数量，而此时，子模型单元的数量最多增加至M个，若再增加，需要额外训练。

S802，根据所述标准稀疏深度信息和所述标准稠密深度信息，训练得到深度信息补充模型。

可选的，深度学习模型的结构还包括置信度层，该置信度层与沙漏网络层相连，沙漏网络层的输出还用于作为该置信度层的输入。置信度层包括非线性激活函数(Sigmoid)，用于对沙漏网络层输出的补充深度信息进行处理，得到置信度信息，即图像中每个像素点具有置信度值。置信度信息用于计算所属子模型单元的损失值。可以基于如下公式计算子模型单元的损失值Loss：

Loss＝Ic*||D-D_gt||

其中，Ic为置信度信息，D为中间深度信息，D_gt为标准稠密深度信息。实际上，Ic为置信度矩阵，该置信度矩阵基于置信度信息确定，即置信度信息中各像素点的置信度值形成的矩阵。D为累加层输出的中间深度信息对应的矩阵。D_gt为训练样本中标准稠密深度信息对应的矩阵。Ic、D和D_gt的尺寸相同。

需要说明的是，训练过程中，深度学习模型包括置信度层，而在应用过程中，深度信息补充模型可以包括置信度层，也可以不包括置信度层。

S803，通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定目标场景的中间深度信息。

S804，将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

通过获取标准场景的标准稀疏深度信息和标准稠密深度信息，训练得到深度信息补充模型，并通过预先训练的深度信息补充模型，实现对稀疏深度信息逐步补充，实现多阶段对稀疏深度信息进行补充，以充分补充深度信息，提高模型的深度信息预测精度，而且训练样本仅包括标准稀疏深度信息和标准稠密深度信息，可以简化模型输入和输出的额外数据处理，提高稠密深度信息的预测效率。

根据本公开的实施例，图9是本公开实施例中的深度信息处理装置的结构图，本公开实施例适用于对目标场景的稀疏深度信息进行补充，生成目标场景的稠密深度信息的情况，该装置采用软件和/或硬件实现，并具体配置于具备一定数据运算能力的电子设备中。

稀疏深度信息输入模块901，用于通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定目标场景的中间深度信息；

稠密深度信息生成模块902，用于将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息。

进一步的，所述稀疏深度信息输入模块901，包括：串接输入单元，用于将所述目标场景的稀疏深度信息作为所述深度信息补充模型中的首部子模型单元的输入，得到所述首部子模型单元确定的中间深度信息；中间传输单元，用于针对所述深度信息补充模型中除首部子模型单元的每一其他子模型单元，将所述其他子模型单元的上一子模型单元所确定的中间深度信息，作为所述其他子模型单元的输入，得到所述其他子模型单元确定的中间深度信息。

进一步的，所述稀疏深度信息输入模块901，包括：补充深度信息获取单元，用于通过所述深度信息补充模型中子模型单元的沙漏网络层，对输入的深度信息进行处理，得到补充深度信息；补充深度信息叠加单元，用于通过所述子模型单元的累加层，将所述补充深度信息与所述子模型单元输入的深度信息进行叠加，得到所述子模型单元确定的中间深度信息。

进一步的，所述补充深度信息叠加单元，包括：像素匹配子单元，用于通过所述子模型单元的累加层，确定补充深度信息中的补充像素点与输入的深度信息中稀疏像素点之间的匹配关系；像素叠加子单元，用于将所述补充像素点的补充深度数据与匹配的稀疏像素点的稀疏深度数据进行叠加。

进一步的，所述深度信息处理装置，还包括：像素信息输入模块，用于通过所述深度信息补充模型中子模型单元，根据所述目标场景的像素信息，确定深度特征信息；中间深度信息调整模块，用于根据所述深度特征信息，对所述子模型单元确定的中间深度信息进行调整。

进一步的，所述深度信息处理装置，还包括：样本获取模块，用于获取标准场景的标准稀疏深度信息和标准稠密深度信息；模型训练模块，用于根据所述标准稀疏深度信息和所述标准稠密深度信息，训练得到深度信息补充模型。

进一步的，所述样本获取模块，包括：稠密深度信息采集单元，用于采用深度传感器对所述标准场景进行图像采集，得到所述标准稠密深度信息；稀疏深度信息生成单元，用于在所述标准稠密深度信息中进行采样，生成所述标准稀疏深度信息。

进一步的，所述样本获取模块，包括：稀疏深度信息采集单元，用于采用雷达设备对所述标准场景进行视频采集，得到连续多帧稀疏深度信息；稀疏深度信息融合单元，用于将所述连续多帧稀疏深度信息进行投影处理，生成所述标准稠密深度信息；稠密深度信息生成单元，用于在所述连续多帧稀疏深度信息中，获取与所述标准稠密深度信息匹配的稀疏深度信息，确定为所述标准稀疏深度信息。

上述深度信息处理装置可执行本公开任意实施例所提供的深度信息处理方法，具备执行深度信息处理方法相应的功能模块和有益效果。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图10所示，设备1000包括计算单元1001，其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序，来执行各种适当的动作和处理。在RAM 1003中，还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

设备1000中的多个部件连接至I/O接口1005，包括：输入单元1006，例如键盘、鼠标等；输出单元1007，例如各种类型的显示器、扬声器等；存储单元1008，例如磁盘、光盘等；以及通信单元1009，例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理，例如深度信息处理。例如，在一些实施例中，深度信息处理可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时，可以执行上文描述的深度信息处理的一个或多个步骤。备选地，在其他实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行深度信息处理。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种深度信息处理方法，包括：

通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定所述目标场景的中间深度信息；其中，所述深度信息补充模型包括多个所述子模型单元，所述多个子模型单元之间的连接方式为串联和/或并联，各所述子模型单元的结构相同，均包括沙漏网络层和累加层，所述沙漏网络层与所述累加层相连，所述累加层的输入包括所述沙漏网络层的输出；

将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息；

其中，所述通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定所述目标场景的中间深度信息，包括：

通过所述深度信息补充模型中子模型单元的沙漏网络层，对输入的深度信息进行处理，得到补充深度信息；

通过所述子模型单元的累加层，将所述补充深度信息与所述子模型单元输入的深度信息进行叠加，得到所述子模型单元确定的中间深度信息；其中，所述累加层用于将相同尺寸的图像进行逐像素的深度信息累加操作。

2.根据权利要求1所述的方法，其中，所述通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定所述目标场景的中间深度信息，还包括：

将所述目标场景的稀疏深度信息作为所述深度信息补充模型中的首部子模型单元的输入，得到所述首部子模型单元确定的中间深度信息；

针对所述深度信息补充模型中除所述首部子模型单元的每一其他子模型单元，将所述其他子模型单元的上一子模型单元所确定的中间深度信息，作为所述其他子模型单元的输入，得到所述其他子模型单元确定的中间深度信息。

3.根据权利要求1所述的方法，其中，所述将所述补充深度信息与所述子模型单元输入的深度信息进行叠加，包括：

通过所述子模型单元的累加层，确定所述补充深度信息中的补充像素点与所述输入的深度信息中稀疏像素点之间的匹配关系；

将所述补充像素点的补充深度数据与匹配的稀疏像素点的稀疏深度数据进行叠加。

4.根据权利要求1所述的方法，还包括：

通过所述深度信息补充模型中子模型单元，根据所述目标场景的像素信息，确定深度特征信息；

根据所述深度特征信息，对所述子模型单元确定的中间深度信息进行调整。

5.根据权利要求1所述的方法，还包括：

获取标准场景的标准稀疏深度信息和标准稠密深度信息；

根据所述标准稀疏深度信息和所述标准稠密深度信息，训练得到深度信息补充模型。

6.根据权利要求5所述的方法，其中，所述获取标准场景的标准稀疏深度信息和标准稠密深度信息，包括：

采用深度传感器对所述标准场景进行图像采集，得到所述标准稠密深度信息；

在所述标准稠密深度信息中进行采样，生成所述标准稀疏深度信息。

7.根据权利要求5所述的方法，其中，所述获取标准场景的标准稀疏深度信息和标准稠密深度信息，包括：

采用雷达设备对所述标准场景进行视频采集，得到连续多帧稀疏深度信息；

将所述连续多帧稀疏深度信息进行投影处理，生成所述标准稠密深度信息；

在所述连续多帧稀疏深度信息中，获取与所述标准稠密深度信息匹配的稀疏深度信息，确定为所述标准稀疏深度信息。

8.一种深度信息处理装置，包括：

稀疏深度信息输入模块，用于通过深度信息补充模型中子模型单元，根据目标场景的稀疏深度信息，确定所述目标场景的中间深度信息；其中，所述深度信息补充模型包括多个所述子模型单元，所述多个子模型单元之间的连接方式为串联和/或并联，各所述子模型单元的结构相同，均包括沙漏网络层和累加层，所述沙漏网络层与所述累加层相连，所述累加层的输入包括所述沙漏网络层的输出；

稠密深度信息生成模块，用于将通过所述深度信息补充模型中尾部子模型单元所确定的中间深度信息，作为所述目标场景的稠密深度信息；

其中，所述稀疏深度信息输入模块，包括：

补充深度信息获取单元，用于通过所述深度信息补充模型中子模型单元的沙漏网络层，对输入的深度信息进行处理，得到补充深度信息；

补充深度信息叠加单元，用于通过所述子模型单元的累加层，将所述补充深度信息与所述子模型单元输入的深度信息进行叠加，得到所述子模型单元确定的中间深度信息；其中，所述累加层用于将相同尺寸的图像进行逐像素的深度信息累加操作。

9.根据权利要求8所述的装置，其中，所述稀疏深度信息输入模块，还包括：

串接输入单元，用于将所述目标场景的稀疏深度信息作为所述深度信息补充模型中的首部子模型单元的输入，得到所述首部子模型单元确定的中间深度信息；

中间传输单元，用于针对所述深度信息补充模型中除所述首部子模型单元的每一其他子模型单元，将所述其他子模型单元的上一子模型单元所确定的中间深度信息，作为所述其他子模型单元的输入，得到所述其他子模型单元确定的中间深度信息。

10.根据权利要求8所述的装置，其中，所述补充深度信息叠加单元，包括：

像素匹配子单元，用于通过所述子模型单元的累加层，确定所述补充深度信息中的补充像素点与所述输入的深度信息中稀疏像素点之间的匹配关系；

像素叠加子单元，用于将所述补充像素点的补充深度数据与匹配的稀疏像素点的稀疏深度数据进行叠加。

11.根据权利要求8所述的装置，还包括：

像素信息输入模块，用于通过所述深度信息补充模型中子模型单元，根据所述目标场景的像素信息，确定深度特征信息；

中间深度信息调整模块，用于根据所述深度特征信息，对所述子模型单元确定的中间深度信息进行调整。

12.根据权利要求8所述的装置，还包括：

样本获取模块，用于获取标准场景的标准稀疏深度信息和标准稠密深度信息；

模型训练模块，用于根据所述标准稀疏深度信息和所述标准稠密深度信息，训练得到深度信息补充模型。

13.根据权利要求12所述的装置，其中，所述样本获取模块，包括：

稠密深度信息采集单元，用于采用深度传感器对所述标准场景进行图像采集，得到所述标准稠密深度信息；

稀疏深度信息生成单元，用于在所述标准稠密深度信息中进行采样，生成所述标准稀疏深度信息。

14.根据权利要求12所述的装置，其中，所述样本获取模块，包括：

稀疏深度信息采集单元，用于采用雷达设备对所述标准场景进行视频采集，得到连续多帧稀疏深度信息；

稀疏深度信息融合单元，用于将所述连续多帧稀疏深度信息进行投影处理，生成所述标准稠密深度信息；

稠密深度信息生成单元，用于在所述连续多帧稀疏深度信息中，获取与所述标准稠密深度信息匹配的稀疏深度信息，确定为所述标准稀疏深度信息。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的深度信息处理方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的深度信息处理方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的深度信息处理方法。