[go: up one dir, main page]

CN114814800A - 基于超声回波的对象识别方法、装置及存储介质 - Google Patents

基于超声回波的对象识别方法、装置及存储介质 Download PDF

Info

Publication number
CN114814800A
CN114814800A CN202110071159.2A CN202110071159A CN114814800A CN 114814800 A CN114814800 A CN 114814800A CN 202110071159 A CN202110071159 A CN 202110071159A CN 114814800 A CN114814800 A CN 114814800A
Authority
CN
China
Prior art keywords
training
image
echo
acoustic wave
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110071159.2A
Other languages
English (en)
Other versions
CN114814800B (zh
Inventor
郭子毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110071159.2A priority Critical patent/CN114814800B/zh
Priority to EP22742041.1A priority patent/EP4198559A4/en
Priority to PCT/CN2022/071297 priority patent/WO2022156562A1/zh
Publication of CN114814800A publication Critical patent/CN114814800A/zh
Priority to US17/992,754 priority patent/US12449524B2/en
Application granted granted Critical
Publication of CN114814800B publication Critical patent/CN114814800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/52Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00
    • G01S7/539Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/86Combinations of sonar systems with lidar systems; Combinations of sonar systems with systems not using wave reflection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • G01S15/89Sonar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/52Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00
    • G01S7/523Details of pulse systems
    • G01S7/526Receivers
    • G01S7/53Means for transforming coordinates or for evaluating data, e.g. using computers
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Acoustics & Sound (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了基于超声回波的对象识别方法、装置及存储介质,应用于人工智能的计算机视觉技术。通过终端的声波发射装置向待识别对象发射超声波信号;然后通过声波接收装置接收待识别对象反射的回波信号;提取回波信号的超声波回波特征;并对超声波回波特征进行特征维度转换得到目标维度特征;进而进行人脸转译处理,以得到待识别对象对应的人脸图像信息。从而实现基于超声波信号的对象识别过程,由于基于超声波信号的回波信号与待识别对象具有对应性,使得对象识别过程适用于不同的场景中,保证了对象识别的准确性并提高了终端的安全性。

Description

基于超声回波的对象识别方法、装置及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及基于超声回波的对象识别方法、装置及存储介质。
背景技术
随着人工智能技术的发展,对象识别已广泛应用于安防和金融等领域,在对象识别的过程中,通过对于使用对象进行识别,从而提高应用场景权限管理的准确性以及终端的安全性能。
相关技术中,对象识别的过程基于图像识别进行,即通过采集使用对象或待识别对象的图像信息,进行图像的特征提取,进而将图像识别所得的结果作为对象的识别结果。
但是,在终端进行图像识别过程中,由于场景的多样性,图像特征可能无法覆盖所有的复杂场景,即基于图像特征的识别过程会受到场景变化的影响,从而造成对象识别的误差,影响对象识别的准确性以及对应终端的安全性。
发明内容
有鉴于此,本申请提供基于超声回波的对象识别方法,可以有效提高对象识别的准确性。
本申请第一方面提供基于超声回波的对象识别方法,可以应用于终端设备中包含基于超声回波的对象识别功能的系统或程序中,具体包括:
通过终端的声波发射装置向待识别对象发射超声波信号;
通过所述终端的声波接收装置接收所述待识别对象反射的回波信号,所述回波信号与所述超声波信号相对应;
对所述回波信号进行向量标准化处理,以提取所述回波信号对应的超声波回波特征;
调用目标模型对所述超声波回波特征进行特征维度转换,以得到用于表征所述待识别对象的目标维度特征;
对所述待识别对象的目标维度特征进行人脸转译处理,以得到所述待识别对象对应的人脸图像信息。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取针对于所述待识别对象采集的训练图像数据和训练回波数据;
将所述训练图像数据输入预设模型中的图像特征提取网络,以响应于目标维度的设定确定训练图像特征;
基于所述训练回波数据生成对应的频谱信息,以确定训练回波特征;
将所述训练回波特征输入所述预设模型中的声波转换网络,以基于所述目标维度对所述训练回波数据进行转换得到训练声波特征,所述训练维度特征与所述训练图像特征的维度相同;
将所述训练图像特征作为训练目标对所述训练声波特征进行调整,以得到相似度损失;
基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在本申请一些可能的实现方式中,所述基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型,包括:
将所述预设模型中的图像特征提取网络的参数固定;
响应于所述预设模型中的图像特征提取网络的参数固定,基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取预训练数据,所述预训练数据用于指示预训练图像与预训练特征的对应关系;
基于所述预训练数据对所述预设模型中的图像特征提取网络进行训练,以对所述预设模型中的图像特征提取网络的参数进行固定。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
基于预设频率特征控制所述声波发射装置向所述待识别对象发射单通道超声波;
获取所述麦克风接收到的反射得到的声波数据,以确定所述训练回波数据;
响应于所述训练回波数据的接收,调用所述终端中的图像采集装置采集所述待识别对象对应的训练图像数据;
将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对;
所述基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型,包括:
基于所述训练样本对确定所述相似度损失,以对所述预设模型中的声波转换网络进行参数调整,以得到目标模型。
可选的,在本申请一些可能的实现方式中,所述基于所述声波接收装置接收反射得到的声波数据,以确定所述训练回波数据,包括:
基于所述声波接收装置接收反射得到的所述声波数据;
根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据;
基于所述待识别对象反射得到的声波数据确定所述训练回波数据。
可选的,在本申请一些可能的实现方式中,所述根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据,包括:
根据所述预设频率特征将所述声波数据分割为多个定长的声波序列;
基于预设滤波器对所述声波序列进行过滤,以得到过滤序列;
根据滑动窗口对所述过滤序列进行归一化处理,以确定由所述待识别对象反射得到的声波数据。
可选的,在本申请一些可能的实现方式中,所述将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对,包括:
响应于所述训练回波数据的接收,调用图像采集装置采集所述待识别对象对应的视频流;
获取所述视频流中的每个视频帧对应的时间戳;
根据所述时间戳将所述训练回波数据与所述训练图像数据对齐,以生成所述训练样本对。
可选的,在本申请一些可能的实现方式中,所述通过终端的声波发射装置向待识别对象发射超声波信号,包括:
响应于识别指令确定私密操作权限;
基于所述私密操作权限调用所述声波发射装置,以使得所述声波发射装置发射单通道超声波。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取与所述目标模型对应的目标应用中保存的预设图像;
将所述人脸图像信息与所述预设图像进行比对,以得到比对信息;
基于所述比对信息指示所述目标应用的执行。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取所述人脸图像信息对应的位置信息和景深信息;
基于所述位置信息和所述景深信息对所述识别图像进行校验,以确定对象识别信息;
根据所述对象识别信息指示所述目标应用的执行。
可选的,在本申请一些可能的实现方式中,所述超声波信息为单通道超声波,所述终端为手机,所述声波发射装置为扬声器,所述声波接收装置为麦克风。
本申请第二方面提供基于超声回波的对象识别装置,包括:
发射单元,用于通过终端的声波发射装置向待识别对象发射超声波信号;
接收单元,用于通过所述终端的声波接收装置接收所述待识别对象反射的回波信号,所述回波信号与所述超声波信号相对应;
提取单元,用于对所述回波信号进行向量标准化处理,以提取所述回波信号对应的超声波回波特征;
转换单元,用于调用目标模型对所述超声波回波特征进行特征维度转换,以得到用于表征所述待识别对象的目标维度特征;
识别单元,用于对所述待识别对象的目标维度特征进行人脸转译处理,以得到所述待识别对象对应的人脸图像信息。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于获取针对于所述待识别对象采集的训练图像数据和训练回波数据;
所述识别单元,具体用于将所述训练图像数据输入预设模型中的图像特征提取网络,以响应于目标维度的设定确定训练图像特征;
所述识别单元,具体用于基于所述训练回波数据生成对应的频谱信息,以确定训练回波特征;
所述识别单元,具体用于将所述训练回波特征输入所述预设模型中的声波转换网络,以基于所述目标维度对所述训练回波数据进行转换得到训练声波特征,所述训练维度特征与所述训练图像特征的维度相同;
所述识别单元,具体用于将所述训练图像特征作为训练目标对所述训练声波特征进行调整,以得到相似度损失;
所述识别单元,具体用于基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于将所述预设模型中的图像特征提取网络的参数固定;
所述识别单元,具体用于响应于所述预设模型中的图像特征提取网络的参数固定,基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于获取预训练数据,所述预训练数据用于指示预训练图像与预训练特征的对应关系;
所述识别单元,具体用于基于所述预训练数据对所述预设模型中的图像特征提取网络进行训练,以对所述预设模型中的图像特征提取网络的参数进行固定。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于基于预设频率特征控制所述声波发射装置向所述待识别对象发射单通道超声波;
所述识别单元,具体用于获取所述麦克风接收到的反射得到的声波数据,以确定所述训练回波数据;
所述识别单元,具体用于响应于所述训练回波数据的接收,调用所述终端中的图像采集装置采集所述待识别对象对应的训练图像数据;
所述识别单元,具体用于将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对;
所述识别单元,具体用于基于所述训练样本对确定所述相似度损失,以对所述预设模型中的声波转换网络进行参数调整,以得到目标模型。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于基于所述声波接收装置接收反射得到的所述声波数据;
所述识别单元,具体用于根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据;
所述识别单元,具体用于基于所述待识别对象反射得到的声波数据确定所述训练回波数据。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于根据所述预设频率特征将所述声波数据分割为多个定长的声波序列;
所述识别单元,具体用于基于预设滤波器对所述声波序列进行过滤,以得到过滤序列;
所述识别单元,具体用于根据滑动窗口对所述过滤序列进行归一化处理,以确定由所述待识别对象反射得到的声波数据。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于响应于所述训练回波数据的接收,调用图像采集装置采集所述待识别对象对应的视频流;
所述识别单元,具体用于获取所述视频流中的每个视频帧对应的时间戳;
所述识别单元,具体用于根据所述时间戳将所述训练回波数据与所述训练图像数据对齐,以生成所述训练样本对。
可选的,在本申请一些可能的实现方式中,所述发射单元,具体用于响应于识别指令确定私密操作权限;
所述发射单元,具体用于基于所述私密操作权限调用所述声波发射装置,以使得所述声波发射装置发射单通道超声波。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于获取与所述目标模型对应的目标应用中保存的预设图像;
所述识别单元,具体用于将所述人脸图像信息与所述预设图像进行比对,以得到比对信息;
所述识别单元,具体用于基于所述比对信息指示所述目标应用的执行。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于获取所述人脸图像信息对应的位置信息和景深信息;
所述识别单元,具体用于基于所述位置信息和所述景深信息对所述识别图像进行校验,以确定对象识别信息;
所述识别单元,具体用于根据所述对象识别信息指示所述目标应用的执行。
本申请第三方面提供一种计算机设备,包括:存储器、处理器以及总线系统;所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的基于超声回波的对象识别方法。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一项所述的基于超声回波的对象识别方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的基于超声回波的对象识别方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
通过终端的声波发射装置向待识别对象发射超声波信号;然后通过终端的声波接收装置接收待识别对象反射的回波信号,回波信号与超声波信号相对应;进一步的对回波信号进行向量标准化处理,以提取回波信号对应的超声波回波特征;并调用目标模型对超声波回波特征进行特征维度转换,以得到用于表征待识别对象的目标维度特征;进而对待识别对象的目标维度特征进行人脸转译处理,以得到待识别对象对应的人脸图像信息。从而实现基于超声波信号的对象识别过程,由于基于超声波信号的回波信号与待识别对象具有对应性,使得对象识别过程适用于不同的场景中,保证了对象识别的准确性并提高了终端的安全性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为基于超声回波的对象识别系统运行的网络架构图;
图2为本申请实施例提供的基于超声回波的对象识别的流程架构图;
图3为本申请实施例提供的基于超声回波的对象识别方法的流程图;
图4为本申请实施例提供的基于超声回波的对象识别方法的场景示意图;
图5为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;
图6为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;
图7为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;
图8为本申请实施例提供的另基于超声回波的对象识别方法的流程图;
图9为本申请实施例提供的另基于超声回波的对象识别方法的流程图;
图10为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;
图11为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;
图12为本申请实施例提供的基于超声回波的对象识别装置的结构示意图;
图13为本申请实施例提供的一种终端设备的结构示意图;
图14为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
本申请实施例提供了基于超声回波的对象识别方法、装置及存储介质,通过终端的声波发射装置向待识别对象发射超声波信号;然后通过终端的声波接收装置接收待识别对象反射的回波信号,回波信号与超声波信号相对应;进一步的对回波信号进行向量标准化处理,以提取回波信号对应的超声波回波特征;并调用目标模型对超声波回波特征进行特征维度转换,以得到用于表征待识别对象的目标维度特征;进而对待识别对象的目标维度特征进行人脸转译处理,以得到待识别对象对应的人脸图像信息。从而实现基于超声波信号的对象识别过程,由于基于超声波信号的回波信号与待识别对象具有对应性,使得对象识别过程适用于不同的场景中,保证了对象识别的准确性并提高了终端的安全性。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,对本申请实施例中可能出现的一些名词进行解释。
声波回波:声波发出后,从物体上反射回来的声波。
人脸特征抽取器:对图片进行人脸特征抽取的网络。
声波转换网络:对输入声波样本进行特征抽取并生成人脸特征的网络。
人脸图像转译网络:对高维人脸特征进行转译得到相应人脸图像的网络。
应理解,本申请提供的基于超声回波的对象识别方法可以应用于终端设备中包含基于超声回波的对象识别功能的系统或程序中,例如密码保护应用,具体的,基于超声回波的对象识别系统可以运行于如图1所示的网络架构中,如图1所示,是基于超声回波的对象识别系统运行的网络架构图,如图可知,基于超声回波的对象识别系统可以提供与多个信息源的基于超声回波的对象识别过程,即通过终端采集超声回波信息,在服务器侧对超声回波信息进行图像恢复,从而进行相应的对象识别过程;可以理解的是,图1中示出了多种终端设备,终端设备可以为手机等移动终端、计算机设备等,在实际场景中可以有更多或更少种类的终端设备参与到基于超声回波的对象识别的过程中,具体数量和种类因实际场景而定,此处不做限定,另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,具体服务器数量因实际场景而定。
本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,终端以及服务器可以连接组成区块链网络,本申请在此不做限制。
可以理解的是,上述基于超声回波的对象识别系统可以运行于个人移动终端,例如:作为密码保护应用这样的应用,也可以运行于服务器,还可以作为运行于第三方设备以提供基于超声回波的对象识别,以得到信息源的基于超声回波的对象识别处理结果;具体的基于超声回波的对象识别系统可以是以一种程序的形式在上述设备中运行,也可以作为上述设备中的系统部件进行运行,还可以作为云端服务程序的一种,具体运作模式因实际场景而定,此处不做限定。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案涉及人工智能的计算机视觉技术。计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像修复、图像识别、图像语义理解、图像检索、OCR(Optical Character Recognition,光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D(3-Dimension,三维)技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、对象识别等生物特征识别技术。
随着人工智能技术的发展,对象识别已广泛应用于安防和金融等领域,在对象识别的过程中,通过对于使用对象进行识别,从而提高应用场景权限管理的准确性以及终端的安全性能。
相关技术中,对象识别的过程基于图像识别进行,即通过采集使用对象或待识别对象的图像信息,进行图像的特征提取,进而将图像识别所得的结果作为对象的识别结果。
但是,在终端进行图像识别过程中,由于场景的多样性,图像特征可能无法覆盖所有的复杂场景,即基于图像特征的识别过程会受到场景变化的影响,从而造成对象识别的误差,影响对象识别的准确性以及对应终端的安全性。
为了解决上述问题,本申请提出了基于超声回波的对象识别方法,该方法应用于图2所示的基于超声回波的对象识别的流程框架中,如图2所示,为本申请实施例提供的基于超声回波的对象识别的流程架构图,用户通过界面层进行相关的私密操作,为了保证私密操作是用户本人进行的,可以在后台触发对象识别进程,即终端通过控制声波发射装置(例如扬声器)向待识别对象发射超声波信号,并通过声波接收装置(例如麦克风)接收待识别对象反射的超声波信号,即回波信号;进而将采集回波信号输入目标模型进行识别,由于该目标模型通过与用户相关联的回波信息与图像信息进行比对训练而得,已经具有从回波信息恢复为图像信息的能力,从而保证对于回波信号识别过程的进行,进而输出回波信号对应的图像信息。
在一种可能的场景中,终端为手机,即可以通过控制前置摄像头位置的扬声器向待识别对象发射单通道超声波,然后通过麦克风接收待识别对象反射的单通道超声波,并通过前置摄像头录制用户的人脸视频或采集用户的人脸图像。具体的,该视频可以是用户的2D人脸图像序列。进一步的,终端会向上述声波和图像信息发送至服务器进行特征提取,即首先对检测到的单个超声回波向量进行标准化,并采用2D人脸图像通过人脸特征抽取器得到的高维特征作为目标特征,使该超声波向量通过声波转换网络,以训练声波转换网络接近对应的人脸特征,并用从声波得到的人脸特征恢复2D图像。最终该声波转换网络可以学习反射声波与人脸图像特征之间的映射关系,实现从反射声波中构建对应人脸图像;进而使得对终端采集到的回波信息进行识别得到识别图像。
可以理解的是,本申请实施例通过对超声回波到2D人脸图像高维特征的映射关系的学习,可以将超声回波中包含的物理信息提取出来。提取出的图像特征或可以作为后续基于超声继续学习其他任务(如身份核验等)的基础。
可以理解的是,本申请所提供的方法可以为一种程序的写入,以作为硬件系统中的一种处理逻辑,也可以作为基于超声回波的对象识别装置,采用集成或外接的方式实现上述处理逻辑。作为一种实现方式,该基于超声回波的对象识别装置通过终端的声波发射装置向待识别对象发射超声波信号;然后通过终端的声波接收装置接收待识别对象反射的回波信号,回波信号与超声波信号相对应;进一步的对回波信号进行向量标准化处理,以提取回波信号对应的超声波回波特征;并调用目标模型对超声波回波特征进行特征维度转换,以得到用于表征待识别对象的目标维度特征;进而对待识别对象的目标维度特征进行人脸转译处理,以得到待识别对象对应的人脸图像信息。从而实现基于超声波信号的对象识别过程,由于基于超声波信号的回波信号与待识别对象具有对应性,使得对象识别过程适用于不同的场景中,保证了对象识别的准确性并提高了终端的安全性。
本申请实施例提供的方案涉及人工智能的计算机视觉技术,具体通过如下实施例进行说明:
结合上述流程架构,下面将对本申请中基于超声回波的对象识别方法进行介绍,请参阅图3,图3为本申请实施例提供的基于超声回波的对象识别方法的流程图,该管理方法可以是由终端设备执行的,也可以是由服务器执行的,还可以是由终端设备和服务器共同执行的,本申请实施例至少包括以下步骤:
301、通过终端的声波发射装置向待识别对象发射超声波信号。
本实施例中,终端发射超声波的动作需要硬件支撑,例如当终端为手机时,采用的硬件设备是扬声器与麦克风,辅助设备是现在智能手机均配置的前置摄像头。以本实施例为例,使用手机顶部扬声器作为声波发射装置,并使用麦克风作为声波接收装置,前置摄像头作为图像采集装置,即用于图像与视频的采集。
在一种可能的场景中,如图4所示,为本申请实施例提供的基于超声回波的对象识别方法的场景示意图;其中图4中的(1)(2)(3)为不同配置的收集终端,在图4中的(1)里示出了扬声器A1、麦克风A2和前置摄像头A3;图4中的(2)里示出了扬声器B1、麦克风B2和前置摄像头B3;图4中的(3)里示出了扬声器C1、麦克风C2和前置摄像头C3。具体的,扬声器负责超声波的发射;麦克风负责超声回波的接收;前置摄像头负责目标物图像与视频的拍摄和录制。
可以理解的是,图4中列出了三种手机结构上(安卓手机、iPhone系列与异形屏手机)传感器的所在位置,其他结构智能手机上三个传感器的位置因实际场景而定,此处不做限定。
可选的,本实施例中扬声器发射的超声波信号可以是多声道的超声波信号,当考虑到手机终端的适用性,可以仅通过单声道的超声波信号即可实现对象识别的过程,从而显著降低成本,提升技术适用性。
具体的,由于单声道超声波在传播过程中,遭遇障碍物或平面时会产生反射和漫反射,所产生的回波中,不仅包含距离远近信息,亦包含反射面或障碍物本身的形状和材质信息。
302、通过终端的声波接收装置接收待识别对象反射的回波信号,回波信号与超声波信号相对应。
本实施例中,回波信号为超声波信号由待识别对象反射的声波信号,具体的,声波接收装置即为步骤301中所述的麦克风,相关描述可以进行参考,此处不做赘述。
可选的,本实施例中的声波接收装置还可以用于训练回波数据的获取过程,即通过训练回波数据与训练图像数据对目标模型进行训练,以进行识别的过程。如图5所示,为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;可以是将手机面对人脸,使人脸正面出现在前置摄像头的中心位置,由手机的顶部扬声器发射超声波(频率较高的声波,难以被人耳接受),如图5左图;声波在空气中传播,遇到障碍物会产生回波,在传播到人脸时,声波遭遇障碍形成反射,如图5右图,声波在人脸不同的平面形成反射,反射波传播至手机位置被顶部麦克风接受。在声波发射与接收的同时,前置摄像头进行录像收集对应时刻的训练图像信息。
可选的,本实施例中提出使用手机顶部麦克风与扬声器配合前置摄像头,方案并不局限于此,可以配合使用同一手机设备的任一扬声器和任一麦克风进行声波发射或采集,具体硬件位置因实际场景而定,此处不做限定。
另外,本实施例均基于单声道声波发射与回收,是考虑成本控制与可拓展性。由于多声道阵列往往可以提供更为丰富的信息,在手机端上,可表现为同时使用多个扬声器与麦克风进行声波发射与回波接收;亦可表现为外接设备的添加。设备采用数量与位置的变化,应视为本实施例的拓展。
通过上述实施例的描述,通过终端即可获取到训练回波数据以及训练图像数据,具体的数据规模可以是针对于多个对象进行的(例如100个人的人脸识别),也可以是针对于某一群组内的多个对象进行的(例如性别为男的人脸识别),还可以是针对于特定用户的加强识别过程(例如手机初始化时获取用户的人脸数据,以对手机内的目标模型进行参数调整,从而使得目标模型对于用户的识别更加准确),具体的训练数据的规模以及应用方式因实际场景而定,此处不做限定。
303、对回波信号进行向量标准化处理,以提取回波信号对应的超声波回波特征。
本实施例中,向量标准化处理的过程可以是生成回波信号对应的频谱信息,例如生成频谱图等,并将其处理得到频域与时域信息,从而通过对频域与时域信息中的特征进行提取,得到回波信号对应的超声波回波特征。
可以理解的是,由于用户与终端之间的距离有限,超声波对应的传输距离亦有限,故在对回波信号进行向量标准化处理的过程中,可以截取一定时间范围内的时域信息,从而避免由于其他对象的超声回波造成的识别干扰,从而提高特征提取的准确性。
304、调用目标模型对超声波回波特征进行特征维度转换,以得到用于表征待识别对象的目标维度特征。
本实施例中,目标模型即为将回波信息转换为图像信息的模型,其中,对于还没经过参数调整的目标模型可以称为预设模型。下面对由预设模型训练得到目标模型的过程进行说明;该预设模型包括图像特征提取网络和声波转换网络,其中,图像特征提取网络用于提取训练图像数据对应的训练图像特征,声波转换网络用于提取训练回波数据对应的训练声波特征;而参数调整的过程即为预设模型的训练过程,该训练过程基于声波转换网络的训练过程执行,即本申请主要对声波转换网络进行参数调整,以使得回波数据与图像数据相匹配;另外,声波转换网络的训练过程根据训练图像特征和训练声波特征比对所得的相似度损失进行,即使得训练声波特征与训练图像特征之间的差异最小。
具体的,对于预设模型的训练过程,即训练声波特征与训练图像特征的匹配过程,该匹配过程为多个特征向量维度的匹配,为了保证匹配的准确性,可以采用高维度(例如2048维)对训练声波特征与训练图像特征进行表示。具体的,可以首先将训练图像数据输入预设模型中的图像特征提取网络,以响应于目标维度的设定确定训练图像特征;然后基于训练回波数据生成对应的频谱信息(例如生成频谱图等,并将其处理得到频域与时域信息);接下来将频谱信息输入预设模型中的声波转换网络,以基于目标维度将训练回波数据处理为与训练图像特征维度相同的训练声波特征;并以训练图像特征为训练目标调整训练声波特征,以得到相似度损失;进而基于相似度损失对预设模型中的声波转换网络进行参数调整,以得到目标模型,从而保证了训练声波特征与训练图像特征的匹配过程的准确性,即提高了相似度损失的准确性,保证了目标模型对于声波特征转化为图像特征的能力。
可选的,由于本申请主要针对目标模型的声波特征转化为图像特征的能力,故可以将预设模型中的图像特征提取网络的参数固定;进而响应于预设模型中的图像特征提取网络的参数固定,基于相似度损失对预设模型中的声波转换网络进行参数调整,以得到目标模型。从而避免了基于相似度损失的训练过程对于图像特征提取网络。
可选的,声波特征转化为图像特征的过程涉及图像转译网络,即预设模型还包括图像转译网络,故在基于相似度损失的训练过程中图像转译网络的参数也进行固定。
具体的,对于图像特征提取网络与图像转译网络的训练过程可以是经过额外数据集的预训练直接使用的,即首先获取预训练数据,预训练数据用于指示预训练图像与预训练特征的对应关系;然后基于预训练数据对预设模型中的图像特征提取网络进行训练,以对预设模型中的图像特征提取网络的参数进行固定。
可以理解的是,为了保证后续识别数据的隐私性,训练使用的数据样本与后续测试使用的数据并不相同,并保证训练与测试集不重叠,避免出现信息泄露。
在一种可能的场景中,本申请的训练图像数据为人脸数据,对应的目标模型(或预设模型)可以参见图6所示的场景架构,如图6所示,为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;图中示出了人脸特征抽取器(图像特征提取网络)、声波转换网络以及人脸图像转译器(图像转译网络);具体的,对于模型训练的过程,即可以首先采用预训练的人脸特征抽取器对人脸图像进行特征处理,得到高维的人脸特征,作为训练目标。同时,对超声回波信号进行处理(例如生成频谱图等)将其处理得到频域与时域信息,将其输入声波转换网络,将其转换为高维声波特征,将该高维声波特征与上述处理过的高维人脸特征进行比对,使二者之间的差别尽量小。然后将抽取得到的高维声波特征输入人脸图像转译器,得到恢复的人脸。
具体的,对于模型的训练过程,即将人脸特征抽取器将输入2D图像处理为高维特征(例如2048维的向量),且人脸图像转译器使用特征重构2D人脸图像,声波转换网络将声波处理成与人脸特征相同维度的向量;而相似度损失计算两个变量(人脸图像特征和声波特征)之间的差别,并通过反向传播更新声波转换网络。
可以理解的是,对于参数固定的部分,包括声波转换网络;而其他部分(例如人脸特征抽取器与人脸图像转译器)则经过额外数据集的预训练直接使用,并且在模型训练过程中保持固定。其中训练使用的数据样本与测试使用的数据并不相同,并保证训练与测试集不重叠,避免出现信息泄露。
在一种可能的场景中,将目标模型训练好后,即可以进行基于单通道超声波的对象识别过程,例如人脸识别;具体的识别对象可以是与人(或动物)相关的对象,例如人脸、全身等;也可以是与物相关的对象,例如花朵、树木等,具体的对象因实际场景而定。
可以理解的是,对于对象识别的过程需要与训练过程所采用的训练数据对应,即若对象识别是针对人脸,则训练数据为基于人脸的训练回波数据和训练图像数据。
在另一种可能的场景中,对回波信号(超声回波信号)的识别过程如图7所示,为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;即在对新采集的声波数据进行处理(回波特征的提取,例如频率、强度阈值等)后,将超声回波特征输入声波转换网络得到高维声波特征(采集声波特征),并将高维声波特征输入人脸图像转译器,进而从超声回波信号直接生成图像(恢复人脸图像)。
305、对待识别对象的目标维度特征进行人脸转译处理,以得到待识别对象对应的人脸图像信息。
本实施例中,由于上述经过大量训练的模型已经拥有从回波恢复对应图像的能力,故而可以直接采用上述流程中固定的模型,使用采集到的超声回波对其对应图像进行恢复。具体的,在训练稳定后,模型可以对干净的人脸实现较为清晰的恢复。且恢复图像与采集图像极为相似,物理位置差别较小。可以证明单通道超声回波拥有恢复对应图像的能力。
可以理解的是,本实施例除了验证本模型拥有从回波中抽取物理信息并生成人脸图像的能力外,所恢复的图像或中间层特征亦可以直接服务于其他任务场景。比如,声波所恢复的人脸图像可以直接接入经典的人脸识别网络做识别,也可以与摄像头所拍摄的人脸做比对是否相同;同时,如果用户使用照片或屏幕人脸尝试骗过对象识别,由于超声反射波中包含丰富的物理位置与景深信息,其恢复的人脸图像亦可拍摄图亦可表现出较大差别。
可选的,本实施例在最终生成图像上,产生的是RGB三通道彩图,原理上超声回波并不包含色彩信息,模型所学习出的图像色彩,可以认为是训练数据的先验。在一些场景中,采用灰度图作为目标进行恢复流程并不会改变,故而目标图像的色彩选择亦可视为本实施例的识别参数。
在一种可能的场景中,本申请中的目标模型可以应用于身份认证、电子商务、数据安全、金融风控、智能硬件等,例如作为电子商务的身份验证模型;作为金融风控中的交易对象识别模型,具体的模型用途因实际场景而定,此处不做限定。
结合上述实施例可知,通过终端的声波发射装置向待识别对象发射超声波信号;然后通过终端的声波接收装置接收待识别对象反射的回波信号,回波信号与超声波信号相对应;进一步的对回波信号进行向量标准化处理,以提取回波信号对应的超声波回波特征;并调用目标模型对超声波回波特征进行特征维度转换,以得到用于表征待识别对象的目标维度特征;进而对待识别对象的目标维度特征进行人脸转译处理,以得到待识别对象对应的人脸图像信息。从而实现基于超声波信号的对象识别过程,由于基于超声波信号的回波信号与待识别对象具有对应性,使得对象识别过程适用于不同的场景中,保证了对象识别的准确性并提高了终端的安全性。
上述实施例介绍了目标模型的训练以及使用过程,其中,目标模型的训练采用的是训练回波数据以及训练图像数据,而在一些场景中,训练回波数据以及训练图像数据可以是作为样本对输入预测模型进行训练的,下面对该场景进行介绍,如图8所示,为本申请实施例提供的另基于超声回波的对象识别方法的场景示意图;该场景包括如下步骤:
步骤1:响应于目标应用的启动,执行对象识别进程。
本实施例中,基于超声回波的对象识别方法的开始可以是软件应用维度的触发,即响应于目标应用的启动而触发对象识别进程,例如响应于密码保护应用的下载而触发对象识别进程,也可以是对于密码保护应用的配置过程而触发对象识别进程。
另外,基于超声回波的对象识别方法的开始也可以硬件设备维度的触发,例如手机初始化的过程中触发对象识别进程,或检测到手机进行换卡操作之后触发对象识别进程。
步骤2:基于待识别的对象调用训练图像数据和训练回波数据,并进行样本的处理。
本实施例中,对于训练图像数据(图像信号)与训练回波数据(声波信号)的数据收集与处理,是为了生成用于预测模型训练的样本对,该预测模型即为未训练的目标模型;具体的,首先基于预设频率特征控制终端中的声波发射装置向待识别对象发射单通道超声波;然后基于终端中的声波接收装置接收反射得到的声波数据,以确定训练回波数据;并响应于训练回波数据的接收,调用终端中的图像采集装置采集待识别对象对应的训练图像数据;将训练回波数据与训练图像数据基于执行时间进行对齐,以生成训练样本对;进而基于训练样本对对预设模型进行训练,以得到目标模型。
可以理解的是,基于预设频率特征发射单通道超声波是为了便于声波信号的过滤,这是由于麦克风(声波接收装置)即会收集到人脸反射的回波,也可以直接接受到扬声器(声波发射装置)发出的超声波,而在反射回波过程中会发生衰减,直接接受到扬声器发出的超声波则不会,故可以根据预设频率特征进行声波信号的过滤,保证信号的准确性。
具体的,对于筛选过程首先基于终端中的声波接收装置接收反射得到的声波数据;然后根据预设频率特征对声波数据进行过滤,以确定由待识别对象反射得到的声波数据;基于待识别对象反射得到的声波数据确定训练回波数据。
另外,在具体的声波过滤过程中可以是基于滤波器进行的,即首先根据预设频率特征将声波数据分割为多个定长的声波序列;然后基于预设滤波器对声波序列进行过滤,以得到过滤序列;进而根据滑动窗口对过滤序列进行归一化处理,以确定由待识别对象反射得到的声波数据。由于对序列之间进行了归一化处理,保证了声波数据的连续性。
可以理解的是,由于图像的采集可以通过视频所得,故对于图像数据的处理过程可以响应于训练回波数据的接收,调用终端中的图像采集装置采集待识别对象对应的视频流;然后获取视频流中的每个视频帧对应的时间戳;进而根据时间戳将训练回波数据与训练图像数据对齐,以生成训练样本对,从而保证了声波数据与图像数据的对应性。
步骤3:基于训练图像数据和训练回波数据对目标模型进行搭建,并训练学习。
本实施例中,模型搭建参考图6所示的场景架构,此处不做赘述;而对于训练学习的过程,即将样本对<图像,反射声波>输入预设模型,其中,样本对中的图像(训练图像数据)输入图像特征抽取网络,而反射声波(训练回声数据)输入声波转换网络,进而实现多个样本对的输入,以对预测模型进行训练,从而得到目标模型。
通过将训练回波数据与训练图像数据采用样本对的形式输入预设模型进行训练,保证了训练数据之间的对应性,提升了相似度差异的准确性,保证了目标模型训练的有效性。
步骤4:响应于对于识别对象反射的回波的接收,识别得到对应的人脸图像。
本实施例中,回波的接收可以是在私密操作发起时自动触发的超声波发射后得到的,具体的私密操作可以是对应于身份认证、电子商务、数据安全、金融风控、智能硬件认证等场景。
步骤5:根据识别得到的人脸图像执行目标任务。
本实施例中,目标任务可以是图像识别任务,即声波所恢复的人脸图像可以直接接入经典的人脸识别网络做识别,也可以与摄像头所拍摄的人脸做比对是否相同;同时,如果用户使用照片或屏幕人脸尝试骗过对象识别,由于超声反射波中包含丰富的物理位置与景深信息,其恢复的人脸图像亦可拍摄图亦可表现出较大差别。
在一种可能的场景中,在手机中对于安全性需求较高的应用(例如支付应用、隐私应用等)进行初始化的过程中,可以进行上述步骤1-步骤3的目标模型的训练过程,进而在每次开启该应用时,可以对开始的用户对象进行自动识别,并根据识别得到的图像与预设用户图像进行对比,若图像的相似度达到预设值(例如相似度为95%),则确定使用应用的对象为预设用户,从而保证应用数据的安全性。
通过上述实施例可见,本申请实施例采用了从人脸返回的反射波,包含更准确、丰富的物理信息,足够支撑人脸图像细节的恢复。本申请实施例仅通过单通道声波回波即可进行成像,使得普通手机上得到的单通道回波也可以进行成像,显著降低成本,提升技术适用性。另外,采用来自人脸的超声回波进行成像,包含更丰富准确的物理信息,并利用已有成熟的人脸特征抽取器辅助,可以利用神经网络的特性对复杂场景进行灵活建模,进行高精度成像。
在一种可能的场景中,对于<图像,反射声波>的生成过程可以采用图9所示的流程,图9为本申请实施例提供的另基于超声回波的对象识别方法的流程图,本申请实施例至少包括以下步骤:
901、获取待识别对象反射的反射声波。
需要说明的是,此处的目标物的图像序列和目标物反射的反射声波序列,均来自该目标物。图像序列中包括多个图像,每个图像对应一个时间戳。在一种可能实现方式中,终端获取任一目标物的图像序列的方式为:终端按照固定时间间隔采集该任一目标物的至少一个图像,将这至少一个图像按照采集时间的先后顺序依次排序,得到该任一目标物的图像序列。本申请实施例对固定时间间隔不加以限定,可以根据终端的图像采集装置的图像采集帧率确定,例如,假设终端的图像采集装置的图像采集帧率为50fps(famespersecond,帧每秒),则固定时间间隔为20ms(毫秒)。
在一种可能实现方式中,终端获取任一目标物反射的反射声波的方式为:终端周期性地向该任一目标物发射声波,将接收到的反射声波作为该任一目标物反射的反射声波。由于终端周期性地发射声波,所以接收到的反射声波中包括该任一目标物对每个周期发射的声波的反射声波。在一种可能实现方式中,终端周期性地向该任一目标物发射声波是指终端每隔一段时间向该任一目标物发射一次声波。本申请实施例对发射两次声波的间隔时长不加以限定,可以根据需要进行对象的待检测物与对象识别终端的参考距离以及声波传播速度进行设置。例如,发射两次声波的间隔时长可以设置为5ms。需要进行对象的待检测物与对象识别终端的参考距离可以根据经验获得。
902、将反射声波分割为多个反射子声波。
由于任一目标物反射的反射声波中包括该任一目标物对每个周期发射的声波的反射声波,所以可以根据显著特征对反射声波进行分割,以将反射声波分割成至少一个反射子声波,每个反射子声波视为该任一目标物对一个周期发射的声波的反射声波。在一种可能实现方式中,对于发射两次声波的间隔时长根据需要进行对象的待检测物与对象识别终端的参考距离以及声波传播速度进行设置的情况,显著特征可以为周期时长。需要说明的是,发射声波本身具有发射时长,周期时长为一个发射时长与一个间隔时长的总和。例如,假设一个发射时长为1ms,一个间隔时长为5ms,则周期时长为6ms。按照6ms的周期时长对反射声波进行分割后,得到的每个反射子声波均为6ms的高频声波片段。在将反射声波分割成至少一个反射子声波后,每个反射子声波均对应时间信息。每个反射子声波对应的时间信息可以是指每个反射子声波的起始时间戳,也可以是指每个反射子声波的终止时间戳,还可以是指每个反射子声波的某一位置(例如,中间位置)的时间戳等,还可以是指每个反射子声波的时间戳范围等,本申请实施例对此不加以限定。
903、对反射子声波进行滤波和归一化处理。
本实施例中,对反射声波进行预处理能够提高反射声波在对象识别过程中的可靠性。对反射声波进行预处理的操作可以根据经验设置,本申请实施例对此不加以限定。示例性地,对反射声波进行预处理的操作包括滤波、归一化处理、小波变换中的至少一种。可选地,对反射声波进行滤波的过程可以利用滤波器进行,本申请实施例对滤波器的类型不加以限定,示例性地,滤波器为时域滤波器、频域滤波器或者卡尔曼滤波器等。可选地,对反射声波进行归一化处理的过程可以基于滑动窗口实现。
904、获取待识别对象的图像序列。
本实施例中,图像序列可以是预设时间段内的相邻视频帧组成,该视频帧对应的预设时间段为进行回波采集的时间段。
905、确定图像序列中的图像对象的时间戳。
本实施例中,图像序列中的图像对象的时间戳即为了保证图像与声波的对应性,具体的,视频数据可以视为间隔较短的图像流,故而对其按照时间戳进行截取,得到每帧图像及其时间戳,然后对图像进行人脸截取(人脸检测、居中切割等)。
906、对图像进行增广操作。
在一种可能实现方式中,对图像进行预处理可以是指对图像进行增广操作,以增加图像在对象识别过程中的可靠性。本申请实施例对增广操作不加以限定,示例性地,增广操作包括旋转、改变颜色、模糊、加入随机噪声、居中切割、降低分辨率中的一种或多种。
可以理解的是,图像的处理过程中,所采用的声波处理方式或图像增广方式仅列举了一部分,采用其他特征处理方式(例如采用连续小波变换得到更多特征)亦可,此处不做限定。
907、对处理后的反射子声波和处理后的图像进行对齐处理,确定图像与反射声波的对应关系。
反射子声波的收集帧率与图像序列中的图像的收集帧率不同,例如,假设每个反射子声波均为6ms的高频声波片段,则反射子声波的收集帧率为每秒收集167个反射子声波,而图像的收集帧率通常为每秒收集30-60个图像。反射子声波的收集帧率与图像序列中的图像的收集帧率相差较大,需要将获取的至少一个反射子声波与图像序列中的至少一个图像进行对齐处理,以得到与各个图像分别对齐的反射子声波。
在一种可能实现方式中,将至少一个反射子声波与图像序列中的至少一个图像进行对齐处理,得到与至少一个图像分别对齐的反射子声波的过程为:根据图像序列中的至少一个图像的时间戳,以及至少一个反射子声波的时间信息,确定与至少一个图像分别对齐的反射子声波。在一种可能实现方式中,根据图像序列中的至少一个图像的时间戳,以及至少一个反射子声波的时间信息,确定与至少一个图像分别对齐的反射子声波的过程为:对于任一图像,将时间信息与该任一图像的时间戳匹配的反射子声波作为与该任一图像对齐的反射子声波。
需要说明的是,与任一图像对齐的反射子声波的数量可以为一个或多个,本申请实施例对此不加以限定。与相邻的两个图像分别对齐的反射子声波中可以存在交叉,也可以不存在交叉,本申请实施例对此不加以限定。对于与相邻的两个图像分别对齐的反射子声波中不存在交叉的情况,可能存在与任一图像均不对齐的反射子声波,将这部分反射子声波剔除。
判断时间信息是否与图像的时间戳匹配的条件可以根据经验设置,例如,判断时间信息是否与图像的时间戳匹配的条件可以为:判断时间信息指示的时间戳与图像的时间戳的差值的绝对值是否不大于参考阈值;当时间信息指示的时间戳与图像的时间戳的差值的绝对值不大于参考阈值时,说明时间信息与图像的时间戳匹配;当时间信息指示的时间戳与图像的时间戳的差值的绝对值大于参考阈值时,说明时间信息与图像的时间戳不匹配。需要说明的是,当时间信息为时间戳时,时间信息指示的时间戳即为该时间戳;当时间信息为时间戳范围时,时间信息指示的时间戳可以是指时间戳范围中某一参考位置(例如,中间位置)的时间戳。参考阈值可以根据经验设置,也可以根据应用场景灵活调整,本申请实施例对此不加以限定。
在一种可能实现方式中,在将至少一个反射子声波与图像序列中的至少一个图像进行对齐处理之前,可以先对至少一个反射子声波和图像序列中的至少一个图像分别进行预处理,然后再将预处理后的至少一个反射子声波与预处理后至少一个图像进行对齐处理。
在一种可能实现方式中,对图像进行预处理可以是指对图像进行增广操作,本申请实施例对增广操作不加以限定,示例性地,增广操作包括旋转、改变颜色、模糊、加入随机噪声、居中切割、降低分辨率中的一种或多种。对反射子声波进行预处理的操作可以根据经验设置,本申请实施例对此不加以限定。示例性地,对反射子声波进行预处理的操作包括滤波、归一化处理、小波变换中的至少一种。可选地,对反射子声波进行滤波的过程可以利用滤波器进行,本申请实施例对滤波器的类型不加以限定,示例性地,滤波器为时域滤波器、频域滤波器或者卡尔曼滤波器等。可选地,对反射子声波进行归一化处理的过程可以基于滑动窗口实现。
908、将针对同一图像的<图像,反射声波>对作为待识别对象的训练样本。
在得到与至少一个图像分别对齐的反射子声波后,对于任一图像,基于与任一图像对齐的反射子声波构成该任一图像对应的反射声波。在一种可能实现方式中,基于与任一图像对齐的反射子声波构成该任一图像对应的反射声波的方式为:将与任一图像对齐的反射子声波按照反射子声波的时间信息指示的时间戳的先后顺序进行拼接,得到该任一图像对应的反射声波。根据此种方式,可以根据与至少一个图像分别对齐的反射子声波,得到至少一个图像分别对应的反射声波。
在得到任一图像对应的反射声波后,基于该任一图像和该任一图像对应反射声波构成任一目标物对应的任一训练样本。需要说明的是,在基于该任一图像和该任一图像对应反射声波构成任一目标物对应的任一训练样本后,该任一训练样本中包括一个来自同一目标物的针对同一图像的<图像,反射声波>对。
在得到至少一个图像分别对应的反射声波后,基于每个图像和该图像对应的反射声波均可以构成任一目标物对应的一个训练样本,从而得到至少一个图像构成的任一目标物对应的至少一个训练样本。
可以理解的是,在上述数据采集的过程中,仅采取单通道超声进行2D人脸图像的生成。具体的,发声和接收装置都静止的情况下,单通道超声是无法进行2D成像的。而且超声中也基本不包含物体的颜色信息。本申请实施例借助人脸特征抽取器可以对人脸关键点特征抽取的能力,与深度神经网络的拟合能力,基于单通道超声进行2D成像,而且可以进行彩色成像。这样大大降低了需要使用多通道超声装置所带来的成本。使得在普通仅有单通道声波装置的手机上即可采用本申请实施例的方法来进行特征提取。
本申请实施例仅通过单通道声波回波即可进行成像,使得普通手机上得到的单通道回波也可以进行成像,显著降低成本,提升技术适用性。
通过对于采集的反射声波(回波)以及图像序列的采集,并进行对应的预处理过程,保证了<图像,反射声波>对的对应性以及准确性,提高了对于预设模型训练的有效性。
接下来,以图灵盾主人识别的应用场景为例,介绍对象识别过程。图灵盾是一个在以太坊智能合约底层程序上,衍生出来的一种电子加密数字经济体在支付上的应用产品。首先简单介绍图灵盾基于超声回波的主人识别。用户在移动终端输入密码或验证码的过程中,假设大部分时间用户人脸正对手机顶部摄像头,此时通过手机顶部摄像头位置的听筒发射声波,用手机顶部摄像头位置的麦克风来接收声波回波。该声波回波数据上报后用来训练该用户的身份验证模型,该模型用来验证输入密码是否是手机主人。移动终端还对用户进行身份验证,身份验证包括两个层面的验证,一个层面为验证用户的面部特征是否与图灵盾的主人的面部特征相匹配,另外一个层面为验证用户的密码或验证码输入习惯是否与图灵盾的主人的输入习惯匹配。
图灵盾主人识别过程中的密码输入界面如图10所示,在密码输入界面进行密码守护测试,统计测试次数和成功识别次数。图10中包含数字171718为已给出的密码,用户需要在数字输入位置输入已给出的密码。在用户通过数字键盘输入密码的过程中,移动终端会采集用户的输入习惯,例如,输入过程中移动终端的倾斜角度、输入过程中用户手指的停留时长等,然后将采集的输入习惯与预先存储的图灵盾的主人的输入习惯进行匹配,以验证该用户的密码或验证码输入习惯是否与图灵盾的主人的输入习惯匹配。此种过程可以在用户输入密码的同时以较低的用户交互成本实现对用户的无感对象识别。
在另一种可能的场景中,除了可以进行上述校验用户的过程,即防止入侵者占用后台的操作权限的场景。本申请还可以作用于密码输入过程中的用户认证,即保证输入密码的执行者为目标用户,具体如图11所示,图11为本申请实施例提供的另基于超声回波的对象识别方法的流程图,包括如下步骤:
1101、响应于密码输入操作控制扬声器向人脸发送单通道超声波。
本实施例中,响应于密码输入操作可以是在密码输入的过程中,也可以是在相关密码页面出现时,还可以是密码输入完毕后的确定过程,例如图11中用户点击密码确定D1后,即会触发服务器进行用户认证以及密码校验的过程。
1102、接收反射的回波信息。
本实施例中,接收反射的回波信息即响应于私密操作的执行调用终端中的声波发射装置发射单通道超声波,以通过终端中的声波接收装置获取回波信号的过程,然后将回波信号输入目标模型中的声波转换网络,以得到采集声波特征。
1103、将回波信息输入目标模型,以得到识别图像。
本实施例中,对于回波信息的识别过程参见图3所示实施例步骤304的描述,此处不做赘述。
1104、将识别图像与保存的用户图像进行比对,以确定比对信息。
本实施例中,比对过程可以是基于保存的用户图像进行的,即获取终端中针对目标应用保存的预设图像;然后将识别图像与预设图像进行比对,以得到比对信息;进而基于比对信息指示目标应用的执行。
另外,为了防止入侵者用照片或图片来代替人脸进行识别过程,还可以获取识别图像对应的位置信息和景深信息;从而基于位置信息和景深信息对识别图像进行校验,以确定对象识别信息;进而根据对象识别信息指示目标应用的执行。这是由于回波信息在训练过程中包含了对应的位置信息和景深信息,从而避免了用照片或图片来代替人脸进行识别的通过。
1105、比对信息指示识别图像为目标用户。
本实施例中,若识别图像与用户图像一致,即说明执行密码操作的对象为目标用户,则在图11中显示操作成功D2。
1106、比对信息指示识别图像不是目标用户。
本实施例中,若识别图像与用户图像不一致,即说明执行密码操作的对象不是目标用户,需要进行进一步的身份核验,则可以在图11中显示操作异常D3。通过对于密码输入过程中操作对象的识别,保证了密码输入等私密操作的安全性。
可以理解的是,在声波发射装置和声波接收装置都静止的情况下,单通道超声波是无法进行2D成像的。而且超声中也基本不包含物体的颜色信息。本实施例借助人脸特征抽取器可以对人脸关键点特征抽取的能力,与深度神经网络的拟合能力,基于单通道超声进行2D成像,而且可以进行彩色成像。降低了需要使用多通道超声装置所带来的成本。使得在普通仅有单通道声波装置的手机上即可采用本方案的方法来进行特征提取。
为了更好的实施本申请实施例的上述方案,下面还提供用于实施上述方案的相关装置。请参阅图12,图12为本申请实施例提供的基于超声回波的对象识别装置的结构示意图,识别装置1200包括:
发射单元1201,用于通过终端的声波发射装置向待识别对象发射超声波信号;
接收单元1202,用于通过所述终端的声波接收装置接收所述待识别对象反射的回波信号,所述回波信号与所述超声波信号相对应;
提取单元1203,用于对所述回波信号进行向量标准化处理,以提取所述回波信号对应的超声波回波特征;
转换单元1204,用于调用目标模型对所述超声波回波特征进行特征维度转换,以得到用于表征所述待识别对象的目标维度特征;
识别单元1205,用于对所述待识别对象的目标维度特征进行人脸转译处理,以得到所述待识别对象对应的人脸图像信息。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于获取针对于所述待识别对象采集的训练图像数据和训练回波数据;
所述识别单元1205,具体用于将所述训练图像数据输入预设模型中的图像特征提取网络,以响应于目标维度的设定确定训练图像特征;
所述识别单元1205,具体用于基于所述训练回波数据生成对应的频谱信息,以确定训练回波特征;
所述识别单元1205,具体用于将所述训练回波特征输入所述预设模型中的声波转换网络,以基于所述目标维度对所述训练回波数据进行转换得到训练声波特征,所述训练维度特征与所述训练图像特征的维度相同;
所述识别单元1205,具体用于将所述训练图像特征作为训练目标对所述训练声波特征进行调整,以得到相似度损失;
所述识别单元1205,具体用于基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于将所述预设模型中的图像特征提取网络的参数固定;
所述识别单元1205,具体用于响应于所述预设模型中的图像特征提取网络的参数固定,基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于获取预训练数据,所述预训练数据用于指示预训练图像与预训练特征的对应关系;
所述识别单元1205,具体用于基于所述预训练数据对所述预设模型中的图像特征提取网络进行训练,以对所述预设模型中的图像特征提取网络的参数进行固定。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于基于预设频率特征控制所述声波发射装置向所述待识别对象发射单通道超声波;
所述识别单元1205,具体用于获取所述麦克风接收到的反射得到的声波数据,以确定所述训练回波数据;
所述识别单元1205,具体用于响应于所述训练回波数据的接收,调用所述终端中的图像采集装置采集所述待识别对象对应的训练图像数据;
所述识别单元1205,具体用于将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对;
所述识别单元1205,具体用于基于所述训练样本对确定所述相似度损失,以对所述预设模型中的声波转换网络进行参数调整,以得到目标模型。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于基于所述声波接收装置接收反射得到的所述声波数据;
所述识别单元1205,具体用于根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据;
所述识别单元1205,具体用于基于所述待识别对象反射得到的声波数据确定所述训练回波数据。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于根据所述预设频率特征将所述声波数据分割为多个定长的声波序列;
所述识别单元1205,具体用于基于预设滤波器对所述声波序列进行过滤,以得到过滤序列;
所述识别单元1205,具体用于根据滑动窗口对所述过滤序列进行归一化处理,以确定由所述待识别对象反射得到的声波数据。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于响应于所述训练回波数据的接收,调用图像采集装置采集所述待识别对象对应的视频流;
所述识别单元1205,具体用于获取所述视频流中的每个视频帧对应的时间戳;
所述识别单元1205,具体用于根据所述时间戳将所述训练回波数据与所述训练图像数据对齐,以生成所述训练样本对。
可选的,在本申请一些可能的实现方式中,所述发射单元1201,具体用于响应于识别指令确定私密操作权限;
所述发射单元1201,具体用于基于所述私密操作权限调用所述声波发射装置,以使得所述声波发射装置发射单通道超声波。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于获取与所述目标模型对应的目标应用中保存的预设图像;
所述识别单元1205,具体用于将所述人脸图像信息与所述预设图像进行比对,以得到比对信息;
所述识别单元1205,具体用于基于所述比对信息指示所述目标应用的执行。
可选的,在本申请一些可能的实现方式中,所述识别单元1205,具体用于获取所述人脸图像信息对应的位置信息和景深信息;
所述识别单元1205,具体用于基于所述位置信息和所述景深信息对所述识别图像进行校验,以确定对象识别信息;
所述识别单元1205,具体用于根据所述对象识别信息指示所述目标应用的执行。
通过终端的声波发射装置向待识别对象发射超声波信号;然后通过终端的声波接收装置接收待识别对象反射的回波信号,回波信号与超声波信号相对应;进一步的对回波信号进行向量标准化处理,以提取回波信号对应的超声波回波特征;并调用目标模型对超声波回波特征进行特征维度转换,以得到用于表征待识别对象的目标维度特征;进而对待识别对象的目标维度特征进行人脸转译处理,以得到待识别对象对应的人脸图像信息。从而实现基于超声波信号的对象识别过程,由于基于超声波信号的回波信号与待识别对象具有对应性,使得对象识别过程适用于不同的场景中,保证了对象识别的准确性并提高了终端的安全性。
本申请实施例还提供了一种终端设备,如图13所示,是本申请实施例提供的另一种终端设备的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant,PDA)、销售终端(point of sales,POS)、车载电脑等任意终端设备,以终端为手机为例:
图13示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图13,手机包括:射频(radio frequency,RF)电路1310、存储器1320、输入单元1330、显示单元1340、传感器1350、音频电路1360、无线保真(wireless fidelity,WiFi)模块1370、处理器1380、以及电源1390等部件。本领域技术人员可以理解,图13中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图13对手机的各个构成部件进行具体的介绍:
RF电路1310可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1380处理;另外,将设计上行的数据发送给基站。通常,RF电路1310包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路1310还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器1320可用于存储软件程序以及模块,处理器1380通过运行存储在存储器1320的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1320可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1330可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1330可包括触控面板1331以及其他输入设备1332。触控面板1331,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1331上或在触控面板1331附近的操作,以及在触控面板1331上一定范围内的隔空触控操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1331可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1380,并能接收处理器1380发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1331。除了触控面板1331,输入单元1330还可以包括其他输入设备1332。具体地,其他输入设备1332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1340可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1340可包括显示面板1341,可选的,可以采用液晶显示器(liquidcrystal display,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板1341。进一步的,触控面板1331可覆盖显示面板1341,当触控面板1331检测到在其上或附近的触摸操作后,传送给处理器1380以确定触摸事件的类型,随后处理器1380根据触摸事件的类型在显示面板1341上提供相应的视觉输出。虽然在图13中,触控面板1331与显示面板1341是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1331与显示面板1341集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1350,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1341的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1341和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1360、扬声器1361,传声器1362可提供用户与手机之间的音频接口。音频电路1360可将接收到的音频数据转换后的电信号,传输到扬声器1361,由扬声器1361转换为声音信号输出;另一方面,传声器1362将收集的声音信号转换为电信号,由音频电路1360接收后转换为音频数据,再将音频数据输出处理器1380处理后,经RF电路1310以发送给比如另一手机,或者将音频数据输出至存储器1320以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1370可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图13示出了WiFi模块1370,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1380是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1320内的软件程序和/或模块,以及调用存储在存储器1320内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1380可包括一个或多个处理单元;可选的,处理器1380可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1380中。
具体的,该处理器1380具体用于通过终端的声波发射装置向待识别对象发射超声波信号;
该处理器1380具体用于通过所述终端的声波接收装置接收所述待识别对象反射的回波信号,所述回波信号与所述超声波信号相对应;
该处理器1380具体用于对所述回波信号进行向量标准化处理,以提取所述回波信号对应的超声波回波特征;
该处理器1380具体用于调用目标模型对所述超声波回波特征进行特征维度转换,以得到用于表征所述待识别对象的目标维度特征;
该处理器1380具体用于对所述待识别对象的目标维度特征进行人脸转译处理,以得到所述待识别对象对应的人脸图像信息。
可选的,在一种可能的场景中,该处理器1380具体用于获取针对于所述待识别对象采集的训练图像数据和训练回波数据;
该处理器1380具体用于将所述训练图像数据输入预设模型中的图像特征提取网络,以响应于目标维度的设定确定训练图像特征;
该处理器1380具体用于基于所述训练回波数据生成对应的频谱信息,以确定训练回波特征;
该处理器1380具体用于将所述训练回波特征输入所述预设模型中的声波转换网络,以基于所述目标维度对所述训练回波数据进行转换得到训练声波特征,所述训练维度特征与所述训练图像特征的维度相同;
该处理器1380具体用于将所述训练图像特征作为训练目标对所述训练声波特征进行调整,以得到相似度损失;
该处理器1380具体用于基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在一种可能的场景中,该处理器1380具体用于将所述预设模型中的图像特征提取网络的参数固定;
该处理器1380具体用于响应于所述预设模型中的图像特征提取网络的参数固定,基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
可选的,在一种可能的场景中,该处理器1380具体用于获取预训练数据,所述预训练数据用于指示预训练图像与预训练特征的对应关系;
该处理器1380具体用于基于所述预训练数据对所述预设模型中的图像特征提取网络进行训练,以对所述预设模型中的图像特征提取网络的参数进行固定。
可选的,在一种可能的场景中,该处理器1380具体用于基于预设频率特征控制所述声波发射装置向所述待识别对象发射单通道超声波;
该处理器1380具体用于获取所述麦克风接收到的反射得到的声波数据,以确定所述训练回波数据;
该处理器1380具体用于响应于所述训练回波数据的接收,调用所述终端中的图像采集装置采集所述待识别对象对应的训练图像数据;
该处理器1380具体用于将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对;
该处理器1380具体用于所述基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型,包括:
该处理器1380具体用于基于所述训练样本对确定所述相似度损失,以对所述预设模型中的声波转换网络进行参数调整,以得到目标模型。
可选的,在一种可能的场景中,该处理器1380具体用于基于所述声波接收装置接收反射得到的所述声波数据;
该处理器1380具体用于根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据;
该处理器1380具体用于基于所述待识别对象反射得到的声波数据确定所述训练回波数据。
可选的,在一种可能的场景中,该处理器1380具体用于根据所述预设频率特征将所述声波数据分割为多个定长的声波序列;
该处理器1380具体用于基于预设滤波器对所述声波序列进行过滤,以得到过滤序列;
该处理器1380具体用于根据滑动窗口对所述过滤序列进行归一化处理,以确定由所述待识别对象反射得到的声波数据。
可选的,在一种可能的场景中,该处理器1380具体用于响应于所述训练回波数据的接收,调用图像采集装置采集所述待识别对象对应的视频流;
该处理器1380具体用于获取所述视频流中的每个视频帧对应的时间戳;
该处理器1380具体用于根据所述时间戳将所述训练回波数据与所述训练图像数据对齐,以生成所述训练样本对。
可选的,在一种可能的场景中,该处理器1380具体用于响应于识别指令确定私密操作权限;
该处理器1380具体用于基于所述私密操作权限调用所述声波发射装置,以使得所述声波发射装置发射单通道超声波。
可选的,在一种可能的场景中,该处理器1380具体用于获取与所述目标模型对应的目标应用中保存的预设图像;
该处理器1380具体用于将所述人脸图像信息与所述预设图像进行比对,以得到比对信息;
该处理器1380具体用于基于所述比对信息指示所述目标应用的执行。
可选的,在一种可能的场景中,该处理器1380具体用于获取所述人脸图像信息对应的位置信息和景深信息;
该处理器1380具体用于基于所述位置信息和所述景深信息对所述识别图像进行校验,以确定对象识别信息;
根据所述对象识别信息指示所述目标应用的执行。手机还包括给各个部件供电的电源1390(比如电池),可选的,电源可以通过电源管理系统与处理器1380逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头(图像采集装置)、麦克风(声波接收装置)、扬声器(声波发射装置)蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器1380还具有执行如上述页面处理方法的各个步骤的功能。
本申请实施例还提供了一种服务器,请参阅图14,图14是本申请实施例提供的一种服务器的结构示意图,该服务器1400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1422(例如,一个或一个以上处理器)和存储器1432,一个或一个以上存储应用程序1442或数据1444的存储介质1430(例如一个或一个以上海量存储设备)。其中,存储器1432和存储介质1430可以是短暂存储或持久存储。存储在存储介质1430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1422可以设置为与存储介质1430通信,在服务器1400上执行存储介质1430中的一系列指令操作。
服务器1400还可以包括一个或一个以上电源1426,一个或一个以上有线或无线网络接口1450,一个或一个以上输入输出接口1458,和/或,一个或一个以上操作系统1441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
该服务器1400用于对目标模型的训练并进行训练后的识别过程,对于训练过程,输入部分维处理过的<声波,人脸图像>对,首先采用预训练的人脸特征抽取器对人脸图像进行特征处理,得到高维的人脸特征,作为训练目标。同时,对超声回波信号进行处理(例如生成频谱图等)将其处理得到频域与时域信息,将其输入声波转换网络,将其转换为高维声波特征,将该高维声波特征与上述处理过的高维人脸特征进行比对,使二者之间的差别尽量小。然后将抽取得到的高维声波特征输入人脸图像转译器,得到恢复的人脸。
可以理解的是,人脸特征抽取器将输入图像处理为高维特征,人脸图像转译器使用特征重构人脸图像,声波转换网络将声波处理成与人脸特征相同维度的向量;而相似度损失计算两个变量之间的差别,并通过反向传播更新声波转换网络。
目标模型中可训练的部分主要包括声波转换网络;而对于其他部分(例如人脸特征抽取器与人脸图像转译器)则经过额外数据集的预训练直接使用,并且在模型训练过程中保持固定。另外,训练使用的数据样本与测试使用的数据并不相同,并保证训练与测试集不重叠,避免出现信息泄露。
上述实施例中由管理装置所执行的步骤可以基于该图14所示的服务器结构。
本申请实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有基于超声回波的对象识别指令,当其在计算机上运行时,使得计算机执行如前述图3至图11所示实施例描述的方法中基于超声回波的对象识别装置所执行的步骤。
本申请实施例中还提供一种包括基于超声回波的对象识别指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如前述图3至图11所示实施例描述的方法中基于超声回波的对象识别装置所执行的步骤。
本申请实施例还提供了基于超声回波的对象识别系统,所述基于超声回波的对象识别系统可以包含图12所描述实施例中的基于超声回波的对象识别装置,或图13所描述实施例中的终端设备,或者图14所描述的服务器。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,基于超声回波的对象识别装置,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (15)

1.一种基于超声回波的对象识别方法,其特征在于,包括:
通过终端的声波发射装置向待识别对象发射超声波信号;
通过所述终端的声波接收装置接收所述待识别对象反射的回波信号,所述回波信号与所述超声波信号相对应;
对所述回波信号进行向量标准化处理,以提取所述回波信号对应的超声波回波特征;
调用目标模型对所述超声波回波特征进行特征维度转换,以得到用于表征所述待识别对象的目标维度特征;
对所述待识别对象的目标维度特征进行人脸转译处理,以得到所述待识别对象对应的人脸图像信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取针对于所述待识别对象采集的训练图像数据和训练回波数据;
将所述训练图像数据输入预设模型中的图像特征提取网络,以响应于目标维度的设定确定训练图像特征;
基于所述训练回波数据生成对应的频谱信息,以确定训练回波特征;
将所述训练回波特征输入所述预设模型中的声波转换网络,以基于所述目标维度对所述训练回波数据进行转换得到训练声波特征,所述训练维度特征与所述训练图像特征的维度相同;
将所述训练图像特征作为训练目标对所述训练声波特征进行调整,以得到相似度损失;
基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型,包括:
将所述预设模型中的图像特征提取网络的参数固定;
响应于所述预设模型中的图像特征提取网络的参数固定,基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取预训练数据,所述预训练数据用于指示预训练图像与预训练特征的对应关系;
基于所述预训练数据对所述预设模型中的图像特征提取网络进行训练,以对所述预设模型中的图像特征提取网络的参数进行固定。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于预设频率特征控制所述声波发射装置向所述待识别对象发射单通道超声波;
获取所述麦克风接收到的反射得到的声波数据,以确定所述训练回波数据;
响应于所述训练回波数据的接收,调用所述终端中的图像采集装置采集所述待识别对象对应的训练图像数据;
将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对;
所述基于所述相似度损失对所述预设模型中的声波转换网络进行参数调整,以得到所述目标模型,包括:
基于所述训练样本对确定所述相似度损失,以对所述预设模型中的声波转换网络进行参数调整,以得到目标模型。
6.根据权利要求5所述的方法,其特征在于,所述基于所述声波接收装置接收反射得到的声波数据,以确定所述训练回波数据,包括:
基于所述声波接收装置接收反射得到的所述声波数据;
根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据;
基于所述待识别对象反射得到的声波数据确定所述训练回波数据。
7.根据权利要求6所述的方法,其特征在于,所述根据所述预设频率特征对所述声波数据进行过滤,以确定由所述待识别对象反射得到的声波数据,包括:
根据所述预设频率特征将所述声波数据分割为多个定长的声波序列;
基于预设滤波器对所述声波序列进行过滤,以得到过滤序列;
根据滑动窗口对所述过滤序列进行归一化处理,以确定由所述待识别对象反射得到的声波数据。
8.根据权利要求5所述的方法,其特征在于,所述将所述训练回波数据与所述训练图像数据基于执行时间进行对齐,以生成训练样本对,包括:
响应于所述训练回波数据的接收,调用图像采集装置采集所述待识别对象对应的视频流;
获取所述视频流中的每个视频帧对应的时间戳;
根据所述时间戳将所述训练回波数据与所述训练图像数据对齐,以生成所述训练样本对。
9.根据权利要求1所述的方法,其特征在于,所述通过终端的声波发射装置向待识别对象发射超声波信号,包括:
响应于识别指令确定私密操作权限;
基于所述私密操作权限调用所述声波发射装置,以使得所述声波发射装置发射单通道超声波。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述方法还包括:
获取与所述目标模型对应的目标应用中保存的预设图像;
将所述人脸图像信息与所述预设图像进行比对,以得到比对信息;
基于所述比对信息指示所述目标应用的执行。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
获取所述人脸图像信息对应的位置信息和景深信息;
基于所述位置信息和所述景深信息对所述识别图像进行校验,以确定对象识别信息;
根据所述对象识别信息指示所述目标应用的执行。
12.根据权利要求1所述的方法,其特征在于,所述超声波信息为单通道超声波,所述终端为手机,所述声波发射装置为扬声器,所述声波接收装置为麦克风。
13.一种基于超声回波的对象识别装置,其特征在于,包括:
发射单元,用于通过终端的声波发射装置向待识别对象发射超声波信号;
接收单元,用于通过所述终端的声波接收装置接收所述待识别对象反射的回波信号,所述回波信号与所述超声波信号相对应;
提取单元,用于对所述回波信号进行向量标准化处理,以提取所述回波信号对应的超声波回波特征;
转换单元,调用目标模型对所述超声波回波特征进行特征维度转换,以得到用于表征所述待识别对象的目标维度特征;
识别单元,用于对所述待识别对象的目标维度特征进行人脸转译处理,以得到所述待识别对象对应的人脸图像信息。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行权利要求1至12任一项所述的基于超声回波的对象识别方法。
15.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述权利要求1至12任一项所述的基于超声回波的对象识别方法。
CN202110071159.2A 2021-01-19 2021-01-19 基于超声回波的对象识别方法、装置及存储介质 Active CN114814800B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110071159.2A CN114814800B (zh) 2021-01-19 2021-01-19 基于超声回波的对象识别方法、装置及存储介质
EP22742041.1A EP4198559A4 (en) 2021-01-19 2022-01-11 OBJECT DETECTION METHOD AND DEVICE BASED ON ULTRASONIC ECHO AND STORAGE MEDIUM
PCT/CN2022/071297 WO2022156562A1 (zh) 2021-01-19 2022-01-11 基于超声回波的对象识别方法、装置及存储介质
US17/992,754 US12449524B2 (en) 2021-01-19 2022-11-22 Object recognition method and apparatus based on ultrasonic echoes and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110071159.2A CN114814800B (zh) 2021-01-19 2021-01-19 基于超声回波的对象识别方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN114814800A true CN114814800A (zh) 2022-07-29
CN114814800B CN114814800B (zh) 2025-05-27

Family

ID=82525258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110071159.2A Active CN114814800B (zh) 2021-01-19 2021-01-19 基于超声回波的对象识别方法、装置及存储介质

Country Status (4)

Country Link
US (1) US12449524B2 (zh)
EP (1) EP4198559A4 (zh)
CN (1) CN114814800B (zh)
WO (1) WO2022156562A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118011405A (zh) * 2024-04-08 2024-05-10 厦门印海途海洋科技有限公司 海底地质成像方法、装置、设备及介质
CN119181126A (zh) * 2024-10-23 2024-12-24 荣耀终端有限公司 面部信息获取方法和电子设备
WO2025241352A1 (zh) * 2024-05-23 2025-11-27 马上消费金融股份有限公司 对象识别方法、对象识别模型的训练方法、装置、电子设备、存储介质及程序产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160148441A (ko) * 2015-06-16 2016-12-26 삼성메디슨 주식회사 초음파 장치 및 그 동작 방법
CN209231947U (zh) * 2018-12-29 2019-08-09 航天信息股份有限公司 超声波人脸扫描识别装置
CN209765528U (zh) * 2019-05-07 2019-12-10 郑州利生创客空间有限公司 一种基于树莓派的人脸防伪识别装置
WO2020016449A1 (en) * 2018-07-20 2020-01-23 Koninklijke Philips N.V. Ultrasound imaging by deep learning and associated devices, systems, and methods
CN111368811A (zh) * 2020-05-26 2020-07-03 腾讯科技(深圳)有限公司 活体检测方法、装置、设备及存储介质
CN111382644A (zh) * 2018-12-29 2020-07-07 Tcl集团股份有限公司 手势识别方法、装置、终端设备及计算机可读存储介质
CN111444830A (zh) * 2020-03-25 2020-07-24 腾讯科技(深圳)有限公司 基于超声回波信号的成像的方法、装置、存储介质及电子装置
US20200320750A1 (en) * 2019-04-04 2020-10-08 Hitachi, Ltd. Ultrasonic imaging device and image processing device

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000098031A (ja) * 1998-09-22 2000-04-07 Hitachi Ltd インパルスソーナー
CN201084168Y (zh) * 2007-09-26 2008-07-09 中国科学院声学研究所 一种人脸识别装置
CN101396277A (zh) * 2007-09-26 2009-04-01 中国科学院声学研究所 一种超声波人脸识别方法和识别装置
JP6392190B2 (ja) * 2015-08-31 2018-09-19 富士フイルム株式会社 画像位置合せ装置、画像位置合せ装置の作動方法およびプログラム
CN105323480A (zh) * 2015-10-15 2016-02-10 广东欧珀移动通信有限公司 一种基于超声波的拍照方法及装置
CN106767584B (zh) * 2015-11-20 2019-12-06 富泰华工业(深圳)有限公司 物体表面点三维坐标测量装置及测量方法
JP6761893B2 (ja) * 2017-03-10 2020-09-30 古野電気株式会社 超音波探知装置及び超音波探知方法
DE102017108508A1 (de) * 2017-04-21 2018-10-25 Pepperl + Fuchs Gmbh Verfahren zum Erkennen und Sortieren von Objekten
CN107992842B (zh) * 2017-12-13 2020-08-11 深圳励飞科技有限公司 活体检测方法、计算机装置及计算机可读存储介质
US20200160018A1 (en) * 2018-11-21 2020-05-21 Qualcomm Incorporated Ultrasonic biometric sensor with transmit and receive side beamforming
US10891458B2 (en) * 2019-02-28 2021-01-12 Qualcomm Incorporated Module architecture for large area ultrasonic fingerprint sensor
CN110074813B (zh) * 2019-04-26 2022-03-04 深圳大学 一种超声图像重建方法及系统
CN110688957B (zh) * 2019-09-27 2023-06-30 腾讯科技(深圳)有限公司 应用于人脸识别的活体检测方法、装置及存储介质
CN110780741B (zh) * 2019-10-28 2022-03-01 Oppo广东移动通信有限公司 模型训练方法、应用运行方法、装置、介质及电子设备
CN111178340B (zh) * 2020-04-10 2020-07-21 支付宝(杭州)信息技术有限公司 图像识别方法及图像识别模型的训练方法
CN111709409B (zh) * 2020-08-20 2020-11-20 腾讯科技(深圳)有限公司 人脸活体检测方法、装置、设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160148441A (ko) * 2015-06-16 2016-12-26 삼성메디슨 주식회사 초음파 장치 및 그 동작 방법
WO2020016449A1 (en) * 2018-07-20 2020-01-23 Koninklijke Philips N.V. Ultrasound imaging by deep learning and associated devices, systems, and methods
CN209231947U (zh) * 2018-12-29 2019-08-09 航天信息股份有限公司 超声波人脸扫描识别装置
CN111382644A (zh) * 2018-12-29 2020-07-07 Tcl集团股份有限公司 手势识别方法、装置、终端设备及计算机可读存储介质
US20200320750A1 (en) * 2019-04-04 2020-10-08 Hitachi, Ltd. Ultrasonic imaging device and image processing device
CN209765528U (zh) * 2019-05-07 2019-12-10 郑州利生创客空间有限公司 一种基于树莓派的人脸防伪识别装置
CN111444830A (zh) * 2020-03-25 2020-07-24 腾讯科技(深圳)有限公司 基于超声回波信号的成像的方法、装置、存储介质及电子装置
CN111368811A (zh) * 2020-05-26 2020-07-03 腾讯科技(深圳)有限公司 活体检测方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118011405A (zh) * 2024-04-08 2024-05-10 厦门印海途海洋科技有限公司 海底地质成像方法、装置、设备及介质
CN118011405B (zh) * 2024-04-08 2024-06-28 厦门印海途海洋科技有限公司 海底地质成像方法、装置、设备及介质
WO2025241352A1 (zh) * 2024-05-23 2025-11-27 马上消费金融股份有限公司 对象识别方法、对象识别模型的训练方法、装置、电子设备、存储介质及程序产品
CN119181126A (zh) * 2024-10-23 2024-12-24 荣耀终端有限公司 面部信息获取方法和电子设备

Also Published As

Publication number Publication date
EP4198559A1 (en) 2023-06-21
EP4198559A4 (en) 2024-05-22
CN114814800B (zh) 2025-05-27
WO2022156562A1 (zh) 2022-07-28
US20230114470A1 (en) 2023-04-13
US12449524B2 (en) 2025-10-21

Similar Documents

Publication Publication Date Title
EP3965003B1 (en) Image processing method and device
CN111368811B (zh) 活体检测方法、装置、设备及存储介质
US10936709B2 (en) Electronic device and method for controlling the same
US11074466B2 (en) Anti-counterfeiting processing method and related products
EP3639051B1 (en) Sound source localization confidence estimation using machine learning
TWI751161B (zh) 終端設備、智慧型手機、基於臉部識別的認證方法和系統
WO2020216054A1 (zh) 视线追踪模型训练的方法、视线追踪的方法及装置
EP3872699A1 (en) Face liveness detection method and apparatus, and electronic device
US20240005695A1 (en) Fingerprint Recognition Method and Electronic Device
US12449524B2 (en) Object recognition method and apparatus based on ultrasonic echoes and storage medium
CN103716309A (zh) 一种安全认证方法及终端
CN112580472A (zh) 一种快速轻量的人脸识别方法、装置、机器可读介质及设备
CN114333774A (zh) 语音识别方法、装置、计算机设备及存储介质
CN111401283A (zh) 面部识别方法及装置、电子设备及存储介质
WO2025029513A1 (en) System and method for determining liveness using face rotation
CN115526772A (zh) 视频处理方法、装置、设备和存储介质
KR20230031056A (ko) 감성 분석 시스템을 이용한 데이터 학습 방법
CN113643392B (zh) 面部生成模型训练方法、面部图像生成方法及装置
CN114548998A (zh) 信息处理方法、装置、存储介质及终端
CN114079728A (zh) 拍摄防抖方法、装置、电子设备及存储介质
US20260037555A1 (en) Conversation-based assistance using a display free body wearable computing device
US20260037031A1 (en) Facilitating visual intent using a display free body wearable computing device
CN109993177A (zh) 一种图像处理方法及装置
HK40026328B (zh) 活体检测方法、装置、设备及存储介质
HK40026328A (zh) 活体检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant