[go: up one dir, main page]

CN118038877A - 一种音频信号的编码、解码方法及装置 - Google Patents

一种音频信号的编码、解码方法及装置 Download PDF

Info

Publication number
CN118038877A
CN118038877A CN202211357728.0A CN202211357728A CN118038877A CN 118038877 A CN118038877 A CN 118038877A CN 202211357728 A CN202211357728 A CN 202211357728A CN 118038877 A CN118038877 A CN 118038877A
Authority
CN
China
Prior art keywords
signal
frequency
low
target
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211357728.0A
Other languages
English (en)
Inventor
林坤鹏
张德军
伍子谦
蒋佳为
王鹤
肖益剑
丁飘
宋慎义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Original Assignee
Douyin Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd filed Critical Douyin Vision Co Ltd
Priority to CN202211357728.0A priority Critical patent/CN118038877A/zh
Priority to PCT/CN2023/128523 priority patent/WO2024094006A1/zh
Priority to EP23884935.0A priority patent/EP4524958A1/en
Publication of CN118038877A publication Critical patent/CN118038877A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本申请实施例提供了一种音频信号的编码、解码方法及装置,涉及信号处理技术领域。该方法包括:获取目标音频帧的高频残差信号和低频残差信号;对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;对所述编码抑制信号进行频谱反转,获取频谱反转信号;根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益;根据所述高频能量增益生成所述目标音频帧的编码数据。本申请实施例用于提高音频信号编码、解码后的音频质量。

Description

一种音频信号的编码、解码方法及装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种音频信号的编码、解码方法及装置。
背景技术
在音频信号处理时,带宽扩展算法可以在码率的限制下,将大部分码率来编码人耳更加敏感的低频信号,而人耳关注较少的高频信号则使用较少的码率传输,或者仅依靠在解码端根据解码后的低频信号来还原高频信号,以此来在固定码率下提升整体编码语音的质量。
在现有技术中,音频信号处理时高频信号的频谱普遍为对低频信号的频谱进行折叠生成的,因此恢复的音频帧信号会缺少部分谐波分量,且为了抑制折叠到高频的基音分量,在解码端恢复高频信号能量时对高频能量进行衰减,导致恢复后的高频能量偏低,整体音频帧听感不佳。
发明内容
有鉴于此,本申请实施例提供了一种音频信号编码、解码方法及装置,用于提高音频信号处理后的音频质量。
为了实现上述目的,本申请实施例提供技术方案如下:
第一方面,本申请的实施例提供了一种音频信号的编码方法,包括:
获取目标音频帧的高频残差信号和低频残差信号;
对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
对所述编码抑制信号进行频谱反转,获取频谱反转信号;
根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益;
根据所述高频能量增益生成所述目标音频帧的编码数据。
作为本申请实施例一种可选的实施方式,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,以获取编码抑制信号,包括:
基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
作为本申请实施例一种可选的实施方式,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,以获取编码抑制信号,包括:
基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
作为本申请实施例一种可选的实施方式,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,以获取编码抑制信号,包括:
基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取编码陷波信号;
对所述编码陷波信号进行白化处理,以获取所述编码抑制信号。
作为本申请实施例一种可选的实施方式,所述对所述编码抑制信号进行频谱反转,获取频谱反转信号,包括:
将所述编码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
作为本申请实施例一种可选的实施方式,所述获取目标音频信号的高频残差信号和低频残差信号,包括:
将所述目标音频帧分频为低频信号和高频信号;
对所述高频信号进行线性预测分析获取第一线性预测LPC系数;
将所述第一线性预测系数转换为线谱对LSP系数;
将所述线谱对系数还原为第二线性预测系数;
将所述高频信号平均分为预设数量个子信号;
基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号;
对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
作为本申请实施例一种可选的实施方式,所述根据所述高频能量增益生成所述目标音频帧的编码数据,包括:
对所述低频编码信息、所述线谱对系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
第二方面,本申请的实施例提供了一种音频信号的解码方法,包括:
解析目标音频帧的编码数据,获取低频编码信息;
对所述低频编码信息进行解码,获取低频信号和低频残差信号;
对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
对所述解码抑制信号进行频谱反转,获取低频激励信号;
根据所述低频激励信号进行信号的重建,获取高频信号;
根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
作为本申请实施例一种可选的实施方式,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,包括:
基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号;
作为本申请实施例一种可选的实施方式,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,包括:
基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
作为本申请实施例一种可选的实施方式,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,包括:
基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取解码陷波信号;
对所述解码陷波信号进行白化处理,以获取所述解码抑制信号。
作为本申请实施例一种可选的实施方式,所述对所述解码抑制信号进行频谱反转,获取低频激励信号,包括:
将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
作为本申请实施例一种可选的实施方式,所述目标音频帧的编码数据还包括:LSP系数和高频能量增益;
所述根据所述低频激励信号进行信号的重建,以获取高频信号,包括:
根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
作为本申请实施例一种可选的实施方式,所述根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取高频信号,包括:
获取所述高频能量增益中各个子信号对应的能量增益;
根据所述低频激励信号和各个子信号的能量增益,获取各个子信号的残差信号;
将所述LSP系数还原为LPC系数;
根据所述LPC系数获取各个预测子信号;
根据各个预测子信号和各个子信号的残差信号,生成各个子信号;
根据各个子信号生成所述高频信号。
第三方面,本申请实施例提供一种音频信号的编码装置,包括:
获取单元,用于获取目标音频帧的高频残差信号和低频残差信号;
抑制单元,用于对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
反转单元,用于对所述编码抑制信号进行频谱反转,获取频谱反转信号;
处理单元,用于根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益;
生成单元,用于根据所述高频能量增益生成所述目标音频帧的编码数据。
作为本申请实施例一种可选的实施方式,所述抑制单元,具体用于基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元,具体用于基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元,具体用于基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取编码陷波信号,以及对所述编码陷波信号进行白化处理,以获取所述编码抑制信号。
作为本申请实施例一种可选的实施方式,所述反转单元,具体用于将所述编码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
作为本申请实施例一种可选的实施方式,所述获取单元,具体用于:
将所述目标音频帧分频为低频信号和高频信号;
对所述高频信号进行线性预测分析获取第一线性预测LPC系数;
将所述第一线性预测系数转换为线谱对LSP系数;
将所述线谱对系数还原为第二线性预测系数;
将所述高频信号平均分为预设数量个子信号;
基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号;
对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
作为本申请实施例一种可选的实施方式,所述生成单元,具体用于对所述低频编码信息、所述线谱对系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
第四方面,本申请实施例提供一种音频信号的解码装置,包括:
获取单元,解析目标音频帧的编码数据,获取低频编码信息;
解码单元,对所述低频编码信息进行解码,获取低频信号和低频残差信号;
抑制单元,对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
反转单元,对所述解码抑制信号进行频谱反转,获取低频激励信号;
重建单元,根据所述低频激励信号进行信号的重建,获取高频信号;
生成单元,根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
作为本申请实施例一种可选的实施方式,所述抑制单元,具体用于:基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元,具体用于基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元,具体用于基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取解码陷波信号,以及对所述解码陷波信号进行白化处理,以获取所述解码抑制信号。
作为本申请实施例一种可选的实施方式,所述反转单元,具体用于将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取低频激励信号。
作为本申请实施例一种可选的实施方式,所述目标音频帧的编码数据还包括:LSP系数和高频能量增益,所述重建单元,具体用于根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
作为本申请实施例一种可选的实施方式,所述重建单元,具体用于获取所述高频能量增益中各个子信号对应的能量增益;根据所述低频激励信号和各个子信号的能量增益,获取各个子信号的残差信号;将所述LSP系数还原为LPC系数;根据所述LPC系数获取各个预测子信号;根据各个预测子信号和各个子信号的残差信号,生成各个子信号;根据各个子信号生成所述高频信号。
第五方面,本申请实施例提供一种电子设备,包括:存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于在执行计算机程序时,使得所述电子设备实现上述任一实施方式所述的音频信号的编码方法或音频信号的解码方法。
第六方面,本申请实施例提供一种计算机可读存储介质,当所述计算机程序被计算设备执行时,使得所述计算设备实现上述任一实施方式所述的音频信号的编码方法或音频信号的解码方法。
第七方面,本申请实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机实现上述任一实施方式所述的音频信号的编码方法或音频信号的解码方法。
本申请实施例所提供的音频信号的编码方法,通过获取目标音频帧的高频残差信号和低频残差信号,再对低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;对编码抑制信号进行频谱反转,获取频谱反转信号;然后,根据频谱反转信号和所述高频残差信号,获取目标音频信号的高频能量增益;最终根据所述高频能量增益生成目标音频帧的编码数据。本申请实施例通过对获取的低频残差信号的频率分量进行抑制、反转,再结合高频残差信号以及高频能量增益或得目标音频帧的编码数据,从而保证重建后的高频信号不会出现缺少谐波分量以及能量偏低的问题。这样,就可以避免在获取目标音频帧的码流数据时出现音频质量不佳的问题,提高用户体验。因此本申请实施例可以在编码、解码的过程中,提高音频的质量。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要调用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的音频信号的编码方法的流程图之一;
图2为本申请实施例提供的音频信号的编码方法的流程图之二;
图3为本申请实施例提供的音频信号的编码方法的流程图之三;
图4为本申请实施例提供的音频信号的编码方法的流程图之四;
图5为本申请实施例提供的音频信号的编码设备的硬件框图;
图6为本申请实施例提供的音频信号的解码方法的流程图之一;
图7为本申请实施例提供的音频信号的解码方法的流程图之二;
图8为本申请实施例提供的音频信号的解码方法的流程图之三;
图9为本申请实施例提供的音频信号的解码方法的流程图之四;
图10为本申请实施例提供的音频信号的解码设备的硬件框图;
图11为本申请实施例提供的音频信号的编码装置的结构示意图;
图12为本申请实施例提供的音频信号的解码装置的结构示意图;
图13为本申请实施例提供的电子设备结构示意图。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面将对本申请的方案进行进一步描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,但本申请还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本申请的一部分实施例,而不是全部的实施例。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,调用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。此外,在本申请实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
本申请实施例提供了一种音频信号的编码方法,参照图1所示,该音频信号的编码方法包括以下步骤:
S101:获取目标音频帧的高频残差信号和低频残差信号。
其中,高频残差信号是指音频信号的高频信号的各个样点的值与对应的预测值的差值,各个样点对应的预测值为线性预测系数(Linear Prediction Coefficient,LPC)乘与历史音频信号的低频信号的乘积;低频残差信号是指音频信号的低频信号的各个样点的值与对应的预测值的差值,各个样点对应的预测值为线性预测系数乘与历史音频信号的低频信号的乘积。其中,线性预测系数是指音频信号的样点值可以通过历史音频数据的样点值乘以系数,并对乘积求和的线形组合来逼近,例如:LPC阶数为10,则具有10个系数,使用该10个系数分别乘以历史音频数据的10个样点值,并对乘积求和可以逼近当前样点值,而这些系数即为线性预测系数。
获得高频残差信号和低频残差信号的方式可以与现有技术相同,本申请实施例获取目标音频帧的高频残差信号和低频残差信号的实现方式不做限定,以能够获取目标音频帧的高频残差信号和低频残差信号为主。
S102:对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
其中,所述目标频率范围的中心频率为所述低频残差信号的基音频率。
基音频率又叫基频(Baseband)或基带,是指一个复音中基音的频率。在构成一个复音的若干个音中,基音的频率最低,强度最大。基频的高低决定一个音的高低。
示例性的,当目标频率范围的中心频率为20千赫兹(Khz),则目标频率范围可以为:{10Khz,30Khz};当目标频率范围的中心频率为40Khz,则目标频率范围可以为:{20Khz,60Khz}。
S103:对所述编码抑制信号进行频谱反转,获取频谱反转信号。
根据带通采样定理的公式得到的采样基带频谱(中心频率在0Hz附近),与原始信号正、负频谱的形状刚好相反,因此本申请实施例中对所述编码抑制信号进行频谱反转即为使频谱反转信号与编码抑制信号正、负频谱的形状相反。
S104:根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益。
高频能量增益是指高频残差信号的能量增益,具体为高频残差信号和低频残差信号的能量之比增益值指高频信号与低频信号之间的能量抵值。
在一些实施例中,根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益的实现方式可以包括:
获取所述频谱反转信号的能量值和所述高频残差信号的能量值,以及计算所述频谱反转信号的能量值和所述高频残差信号的能量值的比值,以获取所述目标音频信号的高频能量增益。
S105:根据所述高频能量增益生成所述目标音频帧的编码数据。
本申请实施例所提供的音频信号的编码方法,通过获取目标音频帧的高频残差信号和低频残差信号,再对低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;对编码抑制信号中符合预设条件的频率分量进行反转,获取频谱反转信号;然后,根据频谱反转信号和所述高频残差信号,获取目标音频信号的高频能量增益;最终根据所述高频能量增益生成目标音频帧的编码数据。本申请实施例通过对获取的低频残差信号的频率分量进行抑制、反转,从而保证重建后的高频信号不会出现缺少谐波分量以及能量偏低的问题。这样,就可以避免在获取目标音频帧的码流数据时出现音频质量不佳的问题,提高用户体验。因此本申请实施例可以在编码过程中,提高音频质量。
作为对上实施例的扩展和细化,本申请实施例提供了另一种音频信号的编码方法,参照图2所示,该音频信号的编码方法包括以下步骤:
S201、将所述目标音频帧分频为低频信号和高频信号。
在一些实施例中,可以通过正交镜像滤波器(Quadrature Mirror Filter,QMF)将目标音频帧分频为低频信号和高频信号。其中,低频信号的频率范围可以为[0kHz-4kHz],高频信号的频率范围可以为[4kHz-8kHz]。
S202、对所述高频信号进行线性预测分析获取第一线性预测系数。
在一些实施例中,可以通过伯格(burg algorithm)算法对所述高频信号进行线性预测分析,以获取第一线性预测系数。其中,伯格算法是一种直接由已知的时间信号序列计算功率谱估计值的递推算法。
S203、将所述第一线性预测系数转换为线谱对(Line Spectrum Pair,LSP)系数。
将第一线性预测系数转换为线谱对系数的实现方式可以现有技术中将LPC系数转换为LSP系数的实现方式相同,本申请实施例对此不做限定。
S204、将所述线谱对系数还原为第二线性预测系数。
同样,将所述线谱对系数还原为第二线性预测系数的实现方式可以现有技术中将LSP系数还原为LPC系数的实现方式相同,本申请实施例对此不做限定。
S205、将所述高频信号平均分为预设数量个子信号。
本申请实施例中不对预设数量进行限制,实际编码过程中可以根据需求将高频信号平均分为任意数量个子信号。例如:可以将所述高频信号分为4个等长度的子信号,再例如:将所述高频信号分为8个等长度的子信号。
S206、基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号。
具体的,基于所述第二线性预测系数分别对各个子信号进行滤波处理的线性预测滤波器的传递函数可以为:
通过该传递函数获得的子信号的残差信号为:
其中,i为子信号的索引,xhb表示原始的子信号,ai为索引为i的子信号的线性预测系数,reshb为索引为i的子信号的残差信号。
S207、对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
在一些实施例中,可以通过编码器SILK编码器对所述低频信号进行编码,以获取所述低频编码信息和所述低频残差信号。
S208、基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
具体的,由于预加重处理也是一种滤波处理,所以基于所述第二线性预测系数分别对各个子信号进行预加重处理会采用高通滤波器进行预加重处理高通滤波器用来抑制基音频率附近突出的频率分量,则高通滤波器的传递函数为:H(z)=1-μz-1,为预设滤波系数。
使用差分方程表示为:
其中表示经过处理后的低频残差信号,μ为预滤波系数,其中,μ决定了对低频残差信号中频率较低的频率分量的抑制以及对频率较高的频率分量的加重程度,μ值越大对频率较低的频率分量的抑制程度越高,对频率较高的频率分量的加重程度越高。
S209、将所述编码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
由于目标音频帧的音频信号经过正交镜像滤波器分频后,得到的高频信号的频谱发生了反转,因此为了保证频谱反转信号和原始高频信号的频谱对应,需要对编码抑制信号进行频谱反转。
对所述编码抑制信号中索引为奇数的采样点进行取相反数,以获取频谱反转信号,具体可以为通过如下公式和所述编码抑制信号,获取频谱反转信号:
reslb(i)=reslb(i)*(-1)i
其中,i为编码抑制信号中的采样点的索引。例如,当编码抑制信号中的采样点的索引为1时,即i=1时,该公式记为:reslb(1)=reslb(1)*(-1)1,得到reslb(1)=-reslb(1),表示当i=1时,得到的频谱反转信号对应的索引为1采样点为编码抑制信号索引为1采样点的相反数;当编码抑制信号中的采样点的索引为2时,即i=2时,该公式记为:reslb(2)=reslb(2)*(-1)2,得到reslb(2)=reslb(2),表示当i=2时,得到的频谱反转信号对应的索引为2采样点等于为编码抑制信号索引为2采样点。
示例性的,若编码抑制信号为:{a1、a2、a3、……a64},则经过上述公式计算后得到的频谱反转信号为:{-a1、a2、-a3、……a64}。
S210、根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益。
其中,所述高频能量增益包括各个子信号的能量增益。
在一些实施例中,索引i的子信号的能量增益值为:
其中,N为子信号的长度,gaini为索引为i的子信号的能量增益值,为频谱反转信号的能量,为索引为i的子信号的能量。
S211、对所述低频编码信息、所述LSP系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
即,对所述低频编码信息、所述LSP系数以及所述高频能量增益进行音频信号包的封装,以获取所述目标音频帧的编码数据。
在一些实施例中,在根据所述低频编码信息、所述LSP系数以及所述高频能量增益生成所述目标音频帧的编码数据之前,本发明实施例提供的音频信号的编码方法还包括:对所述LSP系数进行双码本量化。
例如:先对LSP系数进行双码本量化,然后再使用12bit将对应码本下标编码到主码流。
其中,双码本量化是将得到的LSP系数通过两个不同码本进行系数检索得到LSP系数与对应码本的下标编码,经过两个码本检索合成新的LSP系数下标编码。
双码本编码下标与LSP系数对应关系可以如下表一所示:
表一
当双码本编码下标与LSP系数对应关系如上表一所示,则当LSP系数为{1111,1112,1113,1115,1117,1118,1119}时,经过双码本量化,得到对应的码本下标编码{C1、C2、C3、C4、C5、C6、C7、C8}。
通过对LSP系数进行双码本量化可减少LSP系数的数据量,进而提升音频信号传输的效率。
在一些实施例中,在根据所述低频编码信息、所述LSP系数以及所述高频能量增益生成所述目标音频帧的编码数据之前,本发明实施例提供的音频信号的编码方法还包括:对所述高频能量增益进行码本量化。
例如:可以将高频能量增益量化后将对应下标使用5bit编码到主码流,当包括4个子信号时,高频能量增益的编码数据共计消耗20bit。
编码下标与高频能量增益对应关系可以如下表二所示:
表二
通过对高频能量增益进行码本量化可减少高频能量增益的数据量,进而提升音频信号传输的效率。
本申请实施例提供了另一种音频信号的编码方法,参照图3所示,该音频信号的编码方法包括以下步骤:
S301、将所述目标音频帧分频为低频信号和高频信号。
S302、对所述高频信号进行线性预测分析获取第一线性预测系数。
S303、将所述第一线性预测系数转换为线谱对系数。
S304、将所述线谱对系数还原为第二线性预测系数。
S305、将所述高频信号平均分为预设数量个子信号。
S306、基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号。
S307、对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
上述步骤S301至S307的实现方式可以与图2所示实施例中的步骤S201至S207的实现方式相同,为避免赘述,此处不再详细说明。
S308、基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
即,通过一个斜坡式滤波器对低频残差信号进行滤波处理,从而对中心频率为所述低频残差信号的基音频率的目标频率范围内的频率分量进行抑制。
在一些实施例中,斜坡滤波器传递函数可以如下:
使用差分方程表示为:
其中,fc表示需要调整的频率,G=1+B0表示相应频率下的增益值,可以根据谱倾斜的程度,指定滤波器抑制频率范围的和抑制程度,降低低频残差的频谱倾斜程度。
S309、对所述编码抑制信号中符合预设条件的频率分量进行反转,获取频谱反转信号。
同样,音频信号经过正交镜像滤波器分频后,得到的高频信号的频谱发生了反转,为了保证频谱反转信号和原始高频频谱对应,需要对低频残差信号进行频谱反转。对所述编码抑制信号进行频谱反转的实现方式与上述步骤S209所述相同,此处不再赘述。
S310、根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益。
上述步骤S310的实现方式可以与图2所示实施例中的步骤S210的实现方式相同,为避免赘述,此处不再详细说明。
S311、对所述低频编码信息、所述LSP系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
本申请实施例提供了另一种音频信号的编码方法,参照图4所示,所该音频信号的编码方法包括以下步骤:
S401、将所述目标音频帧分频为低频信号和高频信号。
S402、对所述高频信号进行线性预测分析获取第一线性预测系数。
S403、将所述第一线性预测系数转换为线谱对系数。
S404、将所述线谱对系数还原为第二线性预测系数。
S405、将所述高频信号平均分为预设数量个子信号。
S406、基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号。
S407、对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
上述步骤S401至S407的实现方式可以与图2所示实施例中的步骤S201至S207的实现方式相同,为避免赘述,此处不再详细说明。
S408:基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取编码陷波信号。
即,先获取所述低频残差信号的基因频率,然后根据所述低频残差信号的基因频率确定所述目标频率范围,以及使用二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,以获取编码陷波信号。
由于频谱反转信号主要在基音频率附近(目标频率范围内)有较高的频率分量,因此将频谱反转信号通入二阶陷波器,对目标频率范围内的频率分量做陷波处理。
在一些实施例中,二阶陷波器的传递函数如下:
使用差分方程表示为:
其中,
γ=G*tanf(bw/2)
其中,表示经过二阶陷波处理后的低频残差信号,bw表示滤波器的陷波带宽,Ω0表示陷波器的中心频率点,G表示在指定频率下的陷波增益值。
S409、对所述编码陷波信号进行白化处理,以获取所述编码抑制信号。
即,将低频残差信号做完陷波处理后,对处理结果进一步进行白化处理。
在一些实施例中,对所述编码陷波信号进行白化处理的实现方式包括:
首先,通过伯格算法得到低频残差信号的LPC系数。
其次,使用该LPC系数对上述步骤中处理得到的编码陷波信号做高阶的LPC滤波得到编码抑制信号。
例如,高阶的LPC滤波为8阶,则可以通过如下公式进行计算:
S410、将所述编码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
S411、根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益。
S412、对所述低频编码信息、所述线谱对系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
参照图5所示,图5为本申请实施例提供的音频信号的编码设备的硬件框图,音频信号的编码设备包括:正交镜像滤波器501、编码器502、抑制模块503、反转模块504、拆分模块505、线性预测分析器506、参数量化器507、还原模块508、高频残差生成器509、增益计算器510以及封装器511。
其中,正交镜像滤波器501用于将单一帧音频信号分频成低频(Low Band,LB)信号和高频(High Band,HB)信号。
编码器502用于对低频信号进行编码,以生成低频编码信息和低频残差信号。
抑制模块503用于对中心频率为所述低频残差信号的基音频率的目标频率范围内的频率分量进行抑制,以获取编码抑制信号。
反转模块504用于对编码抑制信号进行频谱反转,以获取频谱反转信号。
拆分模块505用于将单帧的高频信号平均分为预设数量个子信号。
线性预测分析器506用于对高频信号进行线性预测分析,以获取高频信号的第一LPC系数。
参数量化器507用于将第一线性预测系数转换为LSP系数。
还原模块508用于将LSP系数还原为第二线性预测系数。
高频残差生成器509根据第二线性预测系数和各个子信号生成各个子信号的残差信号,以获取高频残差信号。
增益计算器510根据频谱反转信号和高频残差信号计算高能量增益值。
封装器511用于封装所述低频编码信息、所述LSP系数以及所述高频能量增益生成音频信号的编码数据。
本申请另一实施例提供了一种音频信号的解码方法,参照图6所示,该音频信号的解码方法,包括如下步骤:
S601、解析目标音频帧的编码数据,获取低频编码信息。
即,对接收到的音频帧的编码数据进行解封装,以获取编码数据中携带的低频编码信息。
S602、对所述低频编码信息进行解码,获取低频信号和低频残差信号。
在一些实施例中,可以用解码器对所述低频编码信息进行解码,以获取所述低频信号和所述低频残差信号。
S603、对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
其中,所述目标频率范围的中心频率为所述低频残差信号的基音频率。
S604、对所述解码抑制信号进行频谱反转,获取低频激励信号。
S605、根据所述低频激励信号进行信号的重建,获取高频信号。
S606、根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
本申请实施例所提供的音频信号的解码方法,通过解析目标音频帧的编码数据获取低频编码信息,然后对低频编码信息进行解码获取低频信号和低频残差信号,再对所述低频残差信号中目标频率范围内的频率分量进行抑制,然后对获取到的解码抑制信号进行频谱反转获取低频激励信号,以及根据低频激励信号进行信号的重建,获取高频信号。最终根据低频信号和高频信号生成目标音频帧的音频信号。由于本申请实施例通过在对低频激励信号的频谱进行抑制,而无需对高频信号进行衰减,因此避免了高频信号能量偏低的问题,又因为本申请实施例还会在重建高频信号时对符合预设条件的采样点的频谱值进行反转,因此避免了高频信号缺少谐波分量的问题。综上,本申请实施例可以在解码端重建高频信号时避免高频能量偏低以及高频谐波缺失,因此,本申请实施例可以提高音频质量。
本申请实施例提供了另一种音频信号的解码方法,参照图7所示,该音频信号的解码方法包括以下步骤:
S701、解析目标音频帧的编码数据,获取低频编码信息、LSP系数以及高频能量增益。
S702、对所述低频编码信息进行解码,获取低频信号和低频残差信号。
S703、基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
S704、将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取低频激励信号。
S705、根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
其中,所述根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取高频信号,包括以下步骤1至步骤6:
步骤1、获取所述高频能量增益中各个子信号对应的能量增益。
步骤2、根据所述低频激励信号和各个子信号的能量增益,获取各个子信号的残差信号。
步骤3、将所述LSP系数还原为LPC系数。
步骤4、根据所述LPC系数获取各个预测子信号。
步骤5、根据各个预测子信号和各个子信号的残差信号,生成各个子信号。
步骤6、根据各个子信号生成所述高频信号。
S706、根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
在一些实施例中,可以通过正交镜像滤波器对所述低频信号和所述高频信号进行合成,以生成所述目标音频帧的音频信号。
本申请实施例提供了另一种音频信号的解码方法,参照图8所示,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,该音频信号的解码方法包括以下步骤:
S801、解析目标音频帧的编码数据,获取低频编码信息、LSP系数以及高频能量增益。
S802、对所述低频编码信息进行解码,获取低频信号和低频残差信号。
S803、基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
S804、将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取低频激励信号。
S805、根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
S806、根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
本申请实施例提供了另一种音频信号的解码方法,参照图9所示,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,该音频信号的解码方法包括以下步骤:
S901、解析目标音频帧的编码数据,获取低频编码信息、LSP系数以及高频能量增益。
S902、对所述低频编码信息进行解码,获取低频信号和低频残差信号。
S903、基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取解码陷波信号。
S904、对所述解码陷波信号进行白化处理,以获取所述解码抑制信号。
S905、将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取低频激励信号。
S906、根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
S907、根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
结合上述实施例,参照图10所示,图10为本申请实施例提供的音频信号的解码设备的硬件框图,解码设备包括:解封器101、解码器102、抑制模块103、反转模块104、残差生成器105、还原模块106、预测模块107、重建模块108、拼接模块109以及正交镜像滤波器1010。
其中,解封器101用于解析获取低频编码信息、LSP系数以及高频能量增益。
解码器102用于对所述低频编码信息进行解码获取低频信号和低频残差信号。
抑制模块103用于对中心频率为所述低频残差信号的基音频率的目标频率范围内的频率分量进行抑制,以获取解码抑制信号。
反转模块104用于对解码抑制信号进行频谱反转,以获取低频激励信号。
残差生成器105用于根据所述低频激励信号和所述高频能量增益中各个子信号对应的能量增益,获取各个子信号的残差信号。
还原模块106用于将LSP系数还原为LPC系数。
预测模块107用于根据LPC系数获取各个高频子信号。
重建模块108用于根据各个预测子信号和各个子信号的残差信号,生成各个子信号。
拼接模块109用于将各个子信号拼接为高频信号。
正交镜像滤波器1010用于将高频信号和低频信号合成为音频信号。
基于同一发明构思,作为对上述方法的实现,本申请实施例还提供了一种音频信号的编码装置和一种音频信号的解码装置,该实施例与前述方法实施例对应,为便于阅读,本申请实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本申请实施例中的音频信号的解码装置和音频信号的解码装置能够对应实现前述方法实施例中的全部内容。
基于同一构思,本申请实施例提供了一种音频信号的编码装置,图11该音频信号的编码装置的结构示意图,参照图11所示,该音频信号的编码装置1100包括:
获取单元1101用于获取目标音频帧的高频残差信号和低频残差信号。
抑制单元1102用于对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率。
反转单元1103用于对所述编码抑制信号进行频谱反转,获取频谱反转信号。
处理单元1104用于根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益。
生成单元1105用于根据所述高频能量增益生成所述目标音频帧的编码数据。
作为本申请实施例一种可选的实施方式,所述抑制单元1102,具体用于:
基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元1102,具体用于基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元1102,具体用于基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取编码陷波信号,以及对所述编码陷波信号进行白化处理,以获取所述编码抑制信号。
作为本申请实施例一种可选的实施方式,所述反转单元1103,具体用于将所述编码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
作为本申请实施例一种可选的实施方式,所述处理单元1104,具体用于将所述目标音频帧分频为低频信号和高频信号;对所述高频信号进行线性预测分析获取第一线性预测LPC系数;将所述第一线性预测系数转换为线谱对LSP系数;将所述线谱对系数还原为第二线性预测系数;将所述高频信号平均分为预设数量个子信号;基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号;对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
作为本申请实施例一种可选的实施方式,所述生成单元1105,具体用于对所述低频编码信息、所述线谱对系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
本申请实施例提供的音频信号的编码装置可以执行上述方法实施例提供的音频信号的编码方法,其实现原理与技术效果类似,此处不再赘述。
基于同一构思,本申请实施例提供了一种音频信号的解码装置,图12该音频信号的解码装置的结构示意图,参照图12所示,该音频信号解码设备1200包括:
获取单元1201用于解析目标音频帧的编码数据,获取低频编码信息;
解码单元1202用于对所述低频编码信息进行解码,获取低频信号和低频残差信号。
抑制单元1203用于对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
所述目标频率范围的中心频率为所述低频残差信号的基音频率。
反转单元1204用于对所述解码抑制信号进行频谱反转,获取低频激励信号。
重建单元1205用于根据所述低频激励信号进行信号的重建,获取高频信号。
生成单元1206用于根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
作为本申请实施例一种可选的实施方式,所述抑制单元1203,具体用于基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元1203,具体用于基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
作为本申请实施例一种可选的实施方式,所述抑制单元1203,具体用于基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取解码陷波信号,以及对所述解码陷波信号进行白化处理,以获取所述解码抑制信号。
作为本申请实施例一种可选的实施方式,所述反转单元1204,具体用于将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取低频激励信号。
作为本申请实施例一种可选的实施方式,所述目标音频帧的编码数据还包括:LSP系数和高频能量增益,所述重建单元1205,具体用于根据所述低频激励信号,所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
作为本申请实施例一种可选的实施方式,所述重建单元1205,具体用于获取所述高频能量增益中各个子信号对应的能量增益;根据所述低频激励信号和各个子信号的能量增益,获取各个子信号的残差信号;将所述LSP系数还原为LPC系数;根据所述LPC系数获取各个预测子信号;根据各个预测子信号和各个子信号的残差信号,生成各个子信号;根据各个子信号生成所述高频信号。
本申请实施例提供的音频信号的解码装置可以执行上述方法实施例提供的音频信号的解码方法,其实现原理与技术效果类似,此处不再赘述。
基于同一发明构思,本申请实施例还提供了一种电子设备。图13为本申请实施例提供的电子设备的结构示意图,参照图13所示,本申请实施例提供的电子设备包括:存储器131和处理器132,所述存储器131用于存储计算机程序;所述处理器132用于在执行计算机程序时执行上述实施例提供的音频信号的编码方法或音频信号的解码方法。
基于同一发明构思,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当计算机程序被处理器执行时,使得所述计算设备实现上述实施例提供的音频信号的编码方法或音频信号的解码方法。
基于同一发明构思,本申请实施例还提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算设备实现上述实施例提供的音频信号的编码方法或音频信号的解码方法。
本领域技术人员应明白,本申请的实施例可提供为方法,系统,或计算机程序产品。因此,本申请可采用完全硬件实施例,完全软件实施例,或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
处理器可以是中央渲染单元(Central Processing Unit,CPU),还可以是其他通用处理器,数字信号处理器(Digital Signal Processor,DSP),专用集成电路(Application Specific Integrated Circuit,ASIC),现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件,分立门或者晶体管逻辑器件,分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性,可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储,信息可以是计算机可读指令,数据结构,程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM),静态随机存取存储器(SRAM),动态随机存取存储器(DRAM),其他类型的随机存取存储器(RAM),只读存储器(ROM),电可擦除可编程只读存储器(EEPROM),快闪记忆体或其他内存技术,只读光盘只读存储器(CD-ROM),数字多功能光盘(DVD)或其他光学存储,磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。根据本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (19)

1.一种音频信号的编码方法,其特征在于,包括:
获取目标音频帧的高频残差信号和低频残差信号;
对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
对所述编码抑制信号进行频谱反转,获取频谱反转信号;
根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益;
根据所述高频能量增益生成所述目标音频帧的编码数据。
2.根据权利要求1所述的方法,其特征在于,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,以获取编码抑制信号,包括:
基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
3.根据权利要求1所述的方法,其特征在于,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,以获取编码抑制信号,包括:
基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号。
4.根据权利要求1所述的方法,其特征在于,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,以获取编码抑制信号,包括:
基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取编码陷波信号;
对所述编码陷波信号进行白化处理,以获取所述编码抑制信号。
5.根据权利要求1所述的方法,其特征在于,所述对所述编码抑制信号进行频谱反转,获取频谱反转信号,包括:
将所述编码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取频谱反转信号。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述获取目标音频信号的高频残差信号和低频残差信号,包括:
将所述目标音频帧分频为低频信号和高频信号;
对所述高频信号进行线性预测分析获取第一线性预测LPC系数;
将所述第一线性预测系数转换为线谱对LSP系数;
将所述线谱对系数还原为第二线性预测系数;
将所述高频信号平均分为预设数量个子信号;
基于所述第二线性预测系数分别对各个子信号进行滤波处理,获取各个子信号的残差信号,以获取所述高频残差信号;
对所述低频信号进行编码获取低频编码信息和所述低频残差信号。
7.根据权利要求6所述的方法,其特征在于,所述根据所述高频能量增益生成所述目标音频帧的编码数据,包括:
对所述低频编码信息、所述线谱对系数以及所述高频能量增益进行编码,生成所述目标音频帧的编码数据。
8.一种音频信号的解码方法,其特征在于,包括:
解析目标音频帧的编码数据,获取低频编码信息;
对所述低频编码信息进行解码,获取低频信号和低频残差信号;
对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
对所述解码抑制信号进行频谱反转,获取低频激励信号;
根据所述低频激励信号进行信号的重建,获取高频信号;
根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
9.根据权利要求8所述的方法,其特征在于,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,包括:
基于高通滤波器对所述低频残差信号进行预加重处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
10.根据权利要求8所述的方法,其特征在于,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,包括:
基于斜坡式滤波器对所述低频残差信号进行滤波处理,以对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号。
11.根据权利要求8所述的方法,其特征在于,所述对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号,包括:
基于二阶陷波滤波器对所述目标频率范围内的频率分量进行陷波处理,获取解码陷波信号;
对所述解码陷波信号进行白化处理,以获取所述解码抑制信号。
12.根据权利要求8所述的方法,其特征在于,所述对所述解码抑制信号中符合预设条件的采样点的频谱值进行反转,获取频谱反转信号,包括:
将所述解码抑制信号中索引为奇数的采样点的幅值修改为相反数,以获取低频激励信号。
13.根据权利要求8-12任一项所述的方法,其特征在于,所述目标音频帧的编码数据还包括:LSP系数和高频能量增益;
所述根据所述低频激励信号进行信号的重建,以获取高频信号,包括:
根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取所述高频信号。
14.根据权利要求13所述的方法,其特征在于,所述根据所述低频激励信号、所述LSP系数以及所述高频能量增益进行信号的重建,以获取高频信号,包括:
获取所述高频能量增益中各个子信号对应的能量增益;
根据所述低频激励信号和各个子信号的能量增益,获取各个子信号的残差信号;
将所述LSP系数还原为LPC系数;
根据所述LPC系数获取各个预测子信号;
根据各个预测子信号和各个子信号的残差信号,生成各个子信号;
根据各个子信号生成所述高频信号。
15.一种音频信号的编码装置,其特征在于,包括:
获取单元,用于获取目标音频帧的高频残差信号和低频残差信号;
抑制单元,用于对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取编码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
反转单元,用于对所述编码抑制信号进行频谱反转,获取频谱反转信号;
处理单元,用于根据所述频谱反转信号和所述高频残差信号,获取所述目标音频信号的高频能量增益;
生成单元,用于根据所述高频能量增益生成所述目标音频帧的编码数据。
16.一种音频信号的解码装置,其特征在于,包括:
获取单元,用于解析目标音频帧的编码数据,获取低频编码信息;
解码单元,用于对所述低频编码信息进行解码,获取低频信号和低频残差信号;
抑制单元,用于对所述低频残差信号中目标频率范围内的频率分量进行抑制,获取解码抑制信号;所述目标频率范围的中心频率为所述低频残差信号的基音频率;
反转单元,对所述解码抑制信号进行频谱反转,获取低频激励信号;
重建单元,用于根据所述低频激励信号进行信号的重建,获取高频信号;
生成单元,用于根据所述低频信号和所述高频信号生成所述目标音频帧的音频信号。
17.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于在执行计算机程序时,使得所述电子设备实现权利要求1-7任一项所述的音频信号的编码方法或权利要求8-14任一项所述的音频信号的解码方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,当所述计算机程序被计算设备执行时,使得所述计算设备实现权利要求1-7任一项所述的音频信号的编码方法或权利要求8-14任一项所述的音频信号的解码方法。
19.一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得所述计算机实现如权利要求1-7任一项所述的音频信号的编码方法或权利要求8-14任一项所述的音频信号的解码方法。
CN202211357728.0A 2022-11-01 2022-11-01 一种音频信号的编码、解码方法及装置 Pending CN118038877A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202211357728.0A CN118038877A (zh) 2022-11-01 2022-11-01 一种音频信号的编码、解码方法及装置
PCT/CN2023/128523 WO2024094006A1 (zh) 2022-11-01 2023-10-31 一种音频信号的编码、解码方法及装置
EP23884935.0A EP4524958A1 (en) 2022-11-01 2023-10-31 Audio signal coding method and apparatus, and audio signal decoding method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211357728.0A CN118038877A (zh) 2022-11-01 2022-11-01 一种音频信号的编码、解码方法及装置

Publications (1)

Publication Number Publication Date
CN118038877A true CN118038877A (zh) 2024-05-14

Family

ID=90929715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211357728.0A Pending CN118038877A (zh) 2022-11-01 2022-11-01 一种音频信号的编码、解码方法及装置

Country Status (3)

Country Link
EP (1) EP4524958A1 (zh)
CN (1) CN118038877A (zh)
WO (1) WO2024094006A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118038877A (zh) * 2022-11-01 2024-05-14 抖音视界有限公司 一种音频信号的编码、解码方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001166800A (ja) * 1999-12-09 2001-06-22 Nippon Telegr & Teleph Corp <Ntt> 音声符号化方法及び音声復号化方法
CN101273404A (zh) * 2005-09-30 2008-09-24 松下电器产业株式会社 语音编码装置以及语音编码方法
CN101436406A (zh) * 2008-12-22 2009-05-20 西安电子科技大学 音频编解码器
CN101521014A (zh) * 2009-04-08 2009-09-02 武汉大学 音频带宽扩展编解码装置
US20100017197A1 (en) * 2006-11-02 2010-01-21 Panasonic Corporation Voice coding device, voice decoding device and their methods
CN101903945A (zh) * 2007-12-21 2010-12-01 松下电器产业株式会社 编码装置、解码装置以及编码方法
CN105593933A (zh) * 2013-10-10 2016-05-18 高通股份有限公司 用于改善高频带时间特性跟踪的增益形状估计
CN107945813A (zh) * 2012-08-29 2018-04-20 日本电信电话株式会社 解码方法、解码装置、程序和记录介质
US20210390967A1 (en) * 2020-04-29 2021-12-16 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using linear predictive coding
CN117995203A (zh) * 2022-10-28 2024-05-07 抖音视界有限公司 一种音频信号的处理方法及装置
WO2024094006A1 (zh) * 2022-11-01 2024-05-10 抖音视界有限公司 一种音频信号的编码、解码方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
CN101436407B (zh) * 2008-12-22 2011-08-24 西安电子科技大学 音频编解码方法
US9858941B2 (en) * 2013-11-22 2018-01-02 Qualcomm Incorporated Selective phase compensation in high band coding of an audio signal
KR102067044B1 (ko) * 2016-02-17 2020-01-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 과도 프로세싱을 향상시키기 위한 사후 프로세서, 사전 프로세서, 오디오 인코더, 오디오 디코더, 및 관련 방법
WO2021022079A1 (en) * 2019-08-01 2021-02-04 Dolby Laboratories Licensing Corporation System and method for enhancement of a degraded audio signal

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001166800A (ja) * 1999-12-09 2001-06-22 Nippon Telegr & Teleph Corp <Ntt> 音声符号化方法及び音声復号化方法
CN101273404A (zh) * 2005-09-30 2008-09-24 松下电器产业株式会社 语音编码装置以及语音编码方法
US20100017197A1 (en) * 2006-11-02 2010-01-21 Panasonic Corporation Voice coding device, voice decoding device and their methods
CN101903945A (zh) * 2007-12-21 2010-12-01 松下电器产业株式会社 编码装置、解码装置以及编码方法
CN101436406A (zh) * 2008-12-22 2009-05-20 西安电子科技大学 音频编解码器
CN101521014A (zh) * 2009-04-08 2009-09-02 武汉大学 音频带宽扩展编解码装置
CN107945813A (zh) * 2012-08-29 2018-04-20 日本电信电话株式会社 解码方法、解码装置、程序和记录介质
CN105593933A (zh) * 2013-10-10 2016-05-18 高通股份有限公司 用于改善高频带时间特性跟踪的增益形状估计
US20210390967A1 (en) * 2020-04-29 2021-12-16 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using linear predictive coding
CN117995203A (zh) * 2022-10-28 2024-05-07 抖音视界有限公司 一种音频信号的处理方法及装置
WO2024094006A1 (zh) * 2022-11-01 2024-05-10 抖音视界有限公司 一种音频信号的编码、解码方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
T. PAINTER: "Perceptual coding of digital audio", PERCEPTUAL CODING OF DIGITAL AUDIO, vol. 88, no. 4, 30 April 2000 (2000-04-30) *

Also Published As

Publication number Publication date
WO2024094006A9 (zh) 2024-11-21
WO2024094006A1 (zh) 2024-05-10
EP4524958A1 (en) 2025-03-19

Similar Documents

Publication Publication Date Title
JP7475410B2 (ja) サブバンドブロックに基づく高調波移調の改善
US6263312B1 (en) Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US20220180881A1 (en) Speech signal encoding and decoding methods and apparatuses, electronic device, and storage medium
JP3199020B2 (ja) 音声音楽信号の符号化装置および復号装置
JP5249426B2 (ja) 信号符号化及び復号化方法及び装置、並びに符号化及び復号化システム
RU2752127C2 (ru) Усовершенствованный квантователь
RU2530926C2 (ru) Изменение формы шума округления для основанных на целочисленном преобразовании кодирования и декодирования аудио и видеосигнала
JP6474874B2 (ja) ハーモニックオーディオ信号の帯域幅拡張
JP4473913B2 (ja) スペクトル/変調スペクトル域表現における変形による情報信号処理
ES2717131T3 (es) Métodos, codificador y decodificador para codificación y decodificación predictiva lineal de señales de sonido tras transición entre tramas que tienen diferentes tasas de muestreo
EP1047045A2 (en) Sound synthesizing apparatus and method
JPS62234435A (ja) 符号化音声の復号化方式
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
CN101223576A (zh) 从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备
RU2654141C1 (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
JP3206661B2 (ja) アナログ信号の符号化方法及び装置
JPH02308632A (ja) 音信号を伝送しまたは記憶する方法
TWI288915B (en) Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
CN118038877A (zh) 一种音频信号的编码、解码方法及装置
JP2003520481A (ja) 符号器における予測フィルタのための係数の生成
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
CN117995203A (zh) 一种音频信号的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination