WO2015049820A1 - 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 - Google Patents
音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 Download PDFInfo
- Publication number
- WO2015049820A1 WO2015049820A1 PCT/JP2014/003930 JP2014003930W WO2015049820A1 WO 2015049820 A1 WO2015049820 A1 WO 2015049820A1 JP 2014003930 W JP2014003930 W JP 2014003930W WO 2015049820 A1 WO2015049820 A1 WO 2015049820A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- avq
- vector
- subband
- category
- sbp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Definitions
- This disclosure relates to a technique for encoding or decoding an acoustic signal such as voice or musical sound by vector quantization.
- AVQ method Algebraic Vector Quantization
- AVQ method Algebraic Vector Quantization
- an input signal is converted into a frequency domain signal (spectrum) by MDCT (Modified Discrete Cosine Transform) or the like in units of a frame composed of a predetermined number of samples, and is divided into a plurality of subbands.
- MDCT Modified Discrete Cosine Transform
- Patent Document 1 discloses the following encoding method. First, a quantized normalized value obtained by quantizing a normalized value that is a value representing a predetermined number of samples and a normalized value quantization index corresponding to the quantized normalized value are obtained. If the subtracted value obtained by subtracting the value corresponding to the quantized normalized value from the value of each sample is positive and the value of each sample is positive, the subtracted value is set as the quantization target value corresponding to each sample, and the subtracted value Is positive and the value of each sample is negative, the value obtained by inverting the sign of the subtraction value is set as the quantization target value corresponding to each sample.
- the quantization target value is vector-quantized to obtain a vector quantization index and output it.
- the main component of the decoded signal is selected by positively quantizing the main component including samples that are not to be quantized by vector quantization such as the AVQ method from all frequency components. The generation of spectrum holes in can be prevented.
- Patent Document 2 discloses a technique for correcting spectral data before being converted into a lattice vector. For example, a technique is described in which the quality of a decoded signal is improved at a low bit rate and a low calculation processing amount by performing correction to make values other than auditory important samples zero.
- Patent Document 3 there is an invention as disclosed in Patent Document 3 as an invention related to the improvement of the AVQ method.
- one aspect of the present disclosure provides an acoustic signal encoding device and the like that can obtain a higher-quality decoded acoustic signal.
- An acoustic signal encoding device includes a time-frequency conversion unit that converts an input signal into a frequency domain spectrum, a division unit that divides the frequency domain spectrum into subbands, And / or a subband classification unit that classifies a plurality of auditory important first category subbands and other second category subbands based on peak characteristics, and a maximum peak from each of the first category subbands.
- a SBP-AVQ vector generation unit that collects and generates and outputs an SBP-AVQ vector (Sub Band Peak-AVQ Vector) and outputs peak position information of the maximum peak, and an SBP-AVQ vector and a second category subband vector
- An AVQ encoding unit that AVV-encodes the VQ vector and the second category subband to generate an AVQ encoded signal
- a multiplexing unit that outputs an AVQ encoded signal and a multiplexed signal in which peak position information is multiplexed;
- Energy refers to the energy of subbands, for example, the average energy of subbands. Further, the energy may be an absolute value or a relative value with other subbands.
- Peakness is an index based on the intensity, density, and other peak shapes included in the spectrum, and for example, Flatness Measure (SFM).
- SFM Flatness Measure
- “Energy and / or peak” may be at least one of energy or peak.
- “Aurally important” does not require the judgment of whether or not it is important auditoryly, but information that is empirically important is extracted as a result using information such as energy and peakity. It only has to be.
- Maximum peak refers to the peak with the highest spectral intensity.
- Peak position information refers to information for specifying the position of a peak in the first category subband.
- Acoustic signal encoding device refers to a device that encodes a signal such as voice or musical sound.
- An acoustic signal decoding apparatus is an acoustic signal decoding apparatus that generates a decoded acoustic signal from a multiplexed signal generated by an acoustic signal encoding apparatus, and the multiplexed signal is converted into an AVQ encoded signal and a peak.
- a separation unit that separates into position information, an AVQ decoding unit that performs AVQ decoding of the AVQ encoded signal to generate an SBP-AVQ vector and a second category decoding subband vector, a peak included in the SBP-AVQ vector,
- a transform unit for converting an SBP-AVQ vector into a plurality of first category decoding subband vectors using the peak position information; and a first category decoding subband vector and a second category decoding subband vector in the time domain A frequency-time conversion unit that converts the signal into a signal and outputs it as a decoded acoustic signal.
- FIG. 1 shows an image of the spectrum of an acoustic signal (voice / musical sound signal).
- the vertical axis represents the spectrum amplitude
- the horizontal axis represents the frequency.
- a unique peak occurs in the spectrum, but when observed for each subband of about 700 Hz, there are only a few peaks at most.
- the higher the spectrum the smaller the peak amplitude. For this reason, the coding efficiency can be increased by changing the coding method into subbands with a large acoustically important spectrum and those not.
- the acoustic signal encoding apparatus 100 includes a time-frequency conversion unit 101, a subband division unit 102, a peak / energy analysis unit 103, a bit distribution unit 104, a subband classification unit 105, an SBP-AVQ vector generation unit 106, an AVQ code.
- a terminal device or base station device which is a completed product used for communication, includes the acoustic signal encoding device 100 provided with an antenna 109.
- the time-frequency conversion unit 101 converts an input signal, which is an acoustic signal, which is a time domain signal, into a frequency domain signal (spectrum).
- An example of the conversion method of the time-frequency conversion unit 101 is a modified discrete cosine transform (MDCT), but other conversion methods such as discrete cosine transform (DCT) and other known time-frequency conversions are used. Can do.
- MDCT modified discrete cosine transform
- DCT discrete cosine transform
- the subband splitting unit 102 encodes the frequency domain signal (spectrum) converted by the time-frequency conversion unit 101 into AVQ based on RE8 which is an 8-dimensional Gosset lattice (Gosset lattice). Therefore, it is divided into subbands every 8 samples. For example, in the case of 16 kHz sampling, up to 8 kHz is divided into 12 subbands with a bandwidth of about 700 Hz. However, the Gosset lattice is an 8-dimensional example for convenience, and another dimension may be used. In the present embodiment, the sub-bands are equally spaced with respect to the frequency axis. However, the sub-bands may be divided into different band widths in the low band and the high band.
- SFM k spectrum flatness measure
- E k average energy
- the average energy E k of each subband is obtained by the following equation.
- SFM Input spectrum
- N k subband number (1 to 12 in this embodiment
- N k number of samples in subband (8 in this embodiment)
- the above SFM is merely an example, and various other measures for determining the peak property can be considered.
- the difference between the average energy and peak energy of the subband may be used.
- the peak property may be determined by the total number of peaks equal to or greater than a predetermined threshold.
- the SFM may be defined by the following formula.
- the bit allocation unit 104 includes a subband allocation calculation unit 1041, a redistribution calculation unit 1042, and an SBP-AVQ vector allocation calculation unit 1043.
- the reallocation calculation unit 1042 does not operate in this embodiment. An example in which the reallocation calculation unit 1042 operates will be described in the third embodiment.
- the subband allocation calculation unit 1041 calculates the minimum number of bits necessary to encode the subband spectrum with AVQ. Then, in response to the analysis result of the peak property / energy analysis unit 103, the above-described calculation is performed from the set of bits allocated in advance for the spectral coding of the frame in order from the subband having the highest average energy of the subband. It is allocated in units of the number of bits until the bit is depleted (or lost).
- the number of bits required for AVQ encoding can be calculated according to the codebook used.
- AVQ encoding with 8-dimensional Gosset lattice RE8 has 5 codebooks in ascending order of stored codewords, and codebook codeword designation is 4, 8, 12, 16, 20 bits respectively is required. Since the index of the codebook number needs 1, 2, 3, 4, and 5 bits, respectively, any of the 5, 10, 15, 20, or 25 bits added to this indicates the subband to be encoded as AVQ. This is the number of bits required for encoding with. The codebook number index is added to this.
- a variable-length code having 0 as a stop bit is used, and codebook number indexes are assigned to the smallest codebook, such as 10, then 110, and then 1110.
- the minimum size codebook is 8 bits (a 4-bit codebook is not used alone), and the number of bits required for AVQ encoding is 10, 15, 20, and 25 bits.
- the codeword type is insufficient with only the above minimum codebook. Therefore, at a minimum, bits (9 bits if the number of bits assigned to AVQ is determined) are allocated so that two of the smallest codebook and the next smallest codebook can be used.
- the number of bits corresponding to the subband width may be assigned as defined below. .
- AVQcbk indexmin 2 AVQcbk indexmin : The smallest codebook used in AVQ SB BW : Subband bandwidth
- SBP-AVQ vector allocation calculation unit 1042 the operation of the SBP-AVQ vector allocation calculation unit 1042 will be described later.
- the subband classification unit 105 receives the analysis result of the peak property / energy analysis unit 103, and subbands are sub-bands that are audibly important (first category sub-band) and other sub-bands (second category sub-band). ).
- the classification result is output as an AVQ / SBP-AVQ determination result for each subband. Note that it is not always necessary to use all of the analysis results of the peak / energy analysis unit 103, and any one of subband energy and peak property may be used.
- the number of code words (that is, the type of spectrum shape) that can be selected by 10 bits distributed by the bit distribution unit 104 is 256.
- 256 spectral shapes there may be a case where the spectral shape of a subband having a high peak property cannot be expressed sufficiently. Since subbands with high average energy and high peak are audibly important and the peaks need to be encoded more accurately, such subbands (first category subbands) and others Classify into subband groups (second category subbands).
- the subbands may be classified into subbands in which the average energy of subbands is equal to or higher than the average value of the average energy of all subbands in the frame and the SFM exceeds 0.5, and subbands that do not.
- the SBP-AVQ vector generation unit 106 performs the following operations on the subbands classified into the first category subbands by the subband classification unit 105. Hereinafter, the operation of the SBP-AVQ vector generation unit 106 will be described with reference to FIG.
- the subband classification unit 105 extracts the first category subband vector (S11).
- the maximum peak is extracted for each extracted first category subband (S12).
- a peak position starting from the start frequency is generated as peak position information for each first category subband.
- the spectrum at both ends of the maximum peak is added to the SBP-AVQ vector in order from the largest energy. If the maximum spectral peak is located at the eighth sample of the first category subband in a certain first category subband, there is no spectrum to the right of that. In this case, only the spectrum to the left of the maximum peak is added. The reason why the spectrums at both ends of the maximum spectrum peak are included in the encoding is to reproduce the shape of the spectrum peak more accurately when it is decoded. In this way, since an auditory important peak can be accurately reproduced, an acoustic signal with less deterioration in sound quality can be decoded.
- both or one of the adjacent spectra may be discarded.
- SB2 in FIG. 4 since the SBP-AVQ vector has only a remaining two-dimensional space, the spectrum on the right side of the maximum peak is discarded, and only the spectrum on the left side moves to the SBP-AVQ vector.
- the subpeak can be generated by collecting the largest peak and the second largest peak in the first category subband.
- a sub peak position may be generated as peak position information.
- the position where the start frequency of the subband is started for each subband is encoded, and the number of bits required for the encoding is subtracted from Sum. Is a new Sum. As long as Sum does not fall below 10 bits, which is the minimum required for AVQ encoding, the spectrum peak position information of each first category subband is encoded one after another. The final Sum is then assigned to the SBP-AVQ vector.
- the AVQ encoding unit 107 receives the SBP-AVQ vector reconstructed from the first category subband and the second category subband vector. Then, AVQ encoding is performed on the SBP-AVQ vector using the number of bits (final Sum) calculated by the SBP-AVQ vector allocation calculation unit 1042 of the bit allocation unit 104. (Hereinafter, AVQ targeting such an SBP-AVQ vector is referred to as SBP-AVQ). Also, AVQ encoding is performed on the second category subband vector using the bits calculated by the subband allocation calculation unit 1041 of the bit allocation unit 104 (hereinafter referred to as AVQ).
- the spectrum of the first category subband is not subject to encoding except for the maximum peak and the spectrum at both ends thereof (that is, 0).
- the final Sum bit is assigned to the coding of the SBP-AVQ vector whose elements are the maximum peak and its both-ends spectrum, a larger codebook can be used, and the amplitude value is more accurately determined. Can be encoded.
- the encoded spectrum peak position is determined for each subband, it is necessary to transmit information indicating which first category subband the spectrum peak belongs to. However, since this can be determined on the receiving side from the AVQ / SBP-AVQ determination result, there is no need for encoding.
- the multiplexing unit 108 multiplexes the AVQ encoded signal output from the AVQ encoding unit 107 and the peak position information output from the SBP-AVQ vector generation unit 106 to generate a multiplexed signal. It should be noted that the average energy of the subband calculated by the peakity / energy analysis unit 103 and the AVQ / SBP-AVQ determination result by the subband classification unit 105 may be multiplexed together. Furthermore, the number of the first category subband reconstructed in the SBP-AVQ vector may be multiplexed together.
- the multiplexed signal is transmitted to the terminal device having the acoustic signal decoding device through the antenna 109.
- the acoustic signal decoding apparatus 200 includes a separation unit 201, an AVQ decoding unit 202, a switching unit 203, an SBP-AVQ vector-subband conversion unit 204, a zero energy subband addition unit 205, and a frequency-time conversion unit 206.
- a terminal device which is a completed product used for communication, includes the acoustic signal decoding device 200 provided with an antenna 207.
- the multiplexed signal transmitted from the acoustic signal encoding apparatus 100 is received by the antenna 207 and input to the separation unit 201.
- the separation unit 201 separates the input multiplexed signal into an AVQ encoded signal and peak position information. When the subband average energy and AVQ / SBP-AVQ determination result are multiplexed, these are also separated.
- the AVQ decoding unit 202 performs AVQ decoding on the AVQ encoded signal, and generates an AVQ decoded signal composed of an 8-dimensional vector group.
- the AVQ decoded signal is composed of an SBP-AVQ vector and a second category decoded subband vector, and is a signal corresponding to the SBP-AVQ vector and the second category subband vector encoded by the acoustic signal encoding apparatus 100, respectively.
- switching section 203 Based on the AVQ / SBP-AVQ determination result, switching section 203 outputs the SBP-AVQ vector to SBP-AVQ vector-subband conversion section 204, and the second category decoding subband vector is a direct zero energy subband adding section. It outputs to 205.
- the SBP-AVQ vector-subband conversion unit 204 extracts the maximum spectrum of each subband and the spectrums at both ends thereof from the SBP-AVQ vector based on the received peak position information. A first category decoding subband is generated. Then, SBP-AVQ vector-subband converting section 204 outputs the first category decoded subband vector to zero energy subband adding section 205.
- the zero energy subband adding unit 205 sets the subbands excluded from the AVQ encoding target by the bit distribution unit 104 of the acoustic signal encoding device 100 as the zero energy subbands. This subband is additionally inserted into the second category decoding subband and the first category decoding subband.
- the output from the zero energy subband adding unit 205 is input to the frequency-time converting unit 206, converted into a time domain signal, and output as a final decoded acoustic signal.
- IMDCT Inverse ⁇ ⁇ MDCT
- the present embodiment by encoding only a particularly important portion (peak) in the first category subband that is acoustically important in the acoustic signal encoding device, a particularly large number of bits are encoded in this portion. Can be assigned. Therefore, an acoustic signal with less spectrum Hall phenomenon can be decoded in the acoustic signal decoding device.
- Embodiment 2 Next, the configuration and operation of the acoustic signal encoding apparatus 300 according to Embodiment 2 of the present invention will be described with reference to FIG. Blocks having the same configuration as in FIG. 2 use the same figure numbers.
- the difference between the acoustic signal encoding apparatus 300 according to the present embodiment and the acoustic signal encoding apparatus 100 according to the first embodiment is that the acoustic signal encoding apparatus 300 according to the present embodiment includes a subband group generation unit 301. It is.
- the subbands output from the subband division unit 102 are grouped by the subband group generation unit 301.
- a “subband group” is a set of one or a plurality of subbands, and the grouping standard is classified into a predetermined frequency band, for example, a low band, a middle band, and a high band on the frequency axis. A way to do this is conceivable.
- the subsequent processing is performed for each subband group. For example, the following processing is performed.
- the peak / energy analyzing unit 103 selects a sub-band having a large energy within the sub-band group, and determines the peak property of the selected sub-band. When a subband with a high peak property occupies a majority, it is determined that the peak property of the entire subband group is high. This determination result is encoded with 1 bit for each group, and transmitted from the subband classification unit 105 to the multiplexing unit as an AVQ / SBP-AVQ determination result. For a group determined to have a high peak property, all subbands included in the group are set as the first category subband, and SBP-AVQ is applied.
- the subband classification unit 105 assigns all the subbands into the first category subband to the subband classification unit 105 and output to the SBP-AVQ vector generation unit 106.
- the SBP-AVQ vector generation unit 106 generates SBP-AVQ vectors for all the subbands in the subband group, and performs bit allocation calculated by the SBP-AVQ vector allocation calculation unit of the bit allocation unit 104.
- the AVQ encoding unit 107 applies AVQ encoding. All subbands included in groups other than the above are processed as second category subbands.
- the acoustic signal decoding apparatus 400 according to Embodiment 2 includes a subband group separation unit 401.
- the AVQ decoding unit 202 performs AVQ decoding on the AVQ encoded signal, and generates an AVQ decoded signal composed of an 8-dimensional vector group. Then, subband group separation section 401 divides the vector group into low band / middle band / high band subband groups based on the AVQ / SBP-AVQ determination result. Specifically, based on the AVQ / SBP-AVQ determination result, a predetermined number of second category decoding subbands are used for AVQ, and one SBP-AVQ vector is used for SBP-AVQ. Into subband groups.
- switching section 203 Based on the AVQ / SBP-AVQ determination result, switching section 203 outputs the SBP-AVQ vector to SBP-AVQ vector-subband conversion section 204, and the subband group consisting of the second category decoding subbands is directly zero energy.
- the data is output to the subband adding unit 205.
- the subsequent processing is the same as in the first embodiment.
- the processing content is determined for each subband group, the calculation amount is reduced, and information such as the AVQ / SBP-AVQ determination result is reduced with a small number of bits in the entire subband group. Can be encoded. Therefore, since the surplus bits can be used for AVQ encoding, a higher-quality decoded signal can be obtained.
- the acoustic signal encoding apparatus is in a state where the redistribution calculation unit 1042 of the bit distribution unit 104 in FIG. 2 is turned on.
- the bit allocation calculation to the normal subband is performed by the subband calculation unit 1041 as in the first embodiment, and then the redistribution calculation unit 1042 further changes the subband having the higher energy from the subband having the higher energy.
- the SBP-AVQ vector allocation calculation unit 1043 performs bit allocation calculation to the SBP-AVQ vector when the SBP-AVQ vector is generated by reconfiguring the subband (first category subband) as in the first embodiment. Do.
- the bits are redistributed from the low energy subband to the high energy subband between the bit allocation subbands. Do. Next, a specific operation will be described.
- subbands with low energy are removed from the encoding target, and when the allocated bits are redistributed bits (R e ) and more than a predetermined bit amount (eb act ) are collected, a certain bit amount (k) bits is set.
- R e redistributed bits
- eb act a predetermined bit amount
- K bits are additionally allocated to all subbands determined to have high peak by the subband classification unit 105. In the case of still surplus R e is then allocated again in the same manner, until R e is depleted (until no) repeats this operation.
- 5 bits are assigned as k bits. If it does so, the code book of one big size can be used reliably by AVQ encoding, and it becomes possible to encode a peak more correctly.
- the sub-band and redistribution order and eb act of setting methods to be redistributed are various.
- the following setting methods 1, 2, and 3 are examples. These setting methods 1, 2, and 3 redistribute the bits of the second category subband whose energy and / or peakness is lower than a predetermined threshold to the vector of the first category subband.
- the above “threshold value” may be an index based on energy and / or peak property, and includes, for example, the average energy and SFM of subbands, or those appropriately modified or processed.
- the criteria used for the classification of the first category subband and the second category subband may be used as they are. In that case, the bits allocated to the second category subband are redistributed to the SBP-AVQ vector.
- n D Number of dominant sub-bands
- n rb number of remaining bits (setting method 2)
- the order of bit allocation to the subbands is a coordinate plane (normal value of SMF and subband average energy (value obtained by dividing the average energy of each subband by the maximum subband average energy)).
- the SFM is the X coordinate
- the normalized value of the subband average energy is the Y axis.
- the first category subbands subject to SBP-AVQ in the first embodiment are all subject to bit redistribution, and the order of redistribution is described in the order of higher SFM or higher subband average energy, or setting method 2. In this order, the sum of the bits allocated to the second category subbands that are not targeted for SBP-AVQ may be eb act .
- the bit allocation calculation to the SBP-AVQ vector is performed by the SBP-AVQ vector allocation calculation unit 1043.
- This process is reversed. Also good. That is, first, the SBP-AVQ vector allocation calculation unit 1043 may perform bit allocation calculation to the SBP-AVQ vector, and then the redistribution calculation unit 1042 may perform bit redistribution calculation.
- bits whose energy and / or peak property is lower than a predetermined threshold are redistributed to the SBP-AVQ vector.
- bits used for AVQ encoding can be assigned to a more auditory important subband vector or SBP-AVQ vector, so that a high-quality decoded acoustic signal can be obtained upon decoding. Is possible.
- the hardware designed for exclusive use is not limited to so-called finished products (consumer electronics) such as mobile phones and land-line phones, but also includes semi-finished products and component levels such as system boards and semiconductor elements.
- the SBP-AVQ vector generation unit generates the SBP-AVQ vector by collecting the spectrum adjacent to the maximum peak in addition to the maximum peak from each of the first category subbands. -Outputs the peak position information of the maximum peak.
- the SBP-AVQ vector generation unit generates and outputs an SBP-AVQ vector by collecting sub-peaks that are the second largest peak in addition to the maximum peak from each of the first category sub-bands In addition, the peak position information of the maximum peak and the sub peak is output.
- the audio signal encoding device further includes subband group means for grouping subbands to form a subband group, and the subband classification unit includes a first category subband and a first band for each subband group. Classify into 2 category subbands.
- the audio signal encoding device further includes a bit redistribution unit that redistributes the bits allocated to the second category subband vector by the bit allocation unit, and the bit redistribution unit includes the second category subband.
- bit redistribution unit that redistributes the bits allocated to the second category subband vector by the bit allocation unit, and the bit redistribution unit includes the second category subband.
- the audio signal encoding device further includes a bit redistribution unit that redistributes the bits allocated to the second category subband vector by the bit allocation unit, and the bit redistribution unit includes the second category subband.
- bit redistribution unit that redistributes the bits allocated to the second category subband vector by the bit allocation unit, and the bit redistribution unit includes the second category subband.
- the terminal device includes an antenna that transmits the multiplexed signal output from the acoustic signal encoding device.
- the base station apparatus includes the acoustic signal encoding apparatus and an antenna that transmits a multiplexed signal output from the acoustic signal encoding apparatus.
- the terminal device includes an antenna that receives the multiplexed signal output from the acoustic signal encoding device and an acoustic signal decoding device.
- the acoustic signal encoding method converts an input signal into a frequency domain spectrum, divides the frequency domain spectrum into subbands, and the subbands are audibly important based on energy and / or peak characteristics.
- a plurality of first category subbands and other second category subbands are collected, and the maximum peak is collected from each of the first category subbands to generate and output an SBP-AVQ vector.
- Position information is output, bits for AVQ encoding are allocated to the SBP-AVQ vector and the second category subband, and the SBP-AVQ vector and the second category subband vector are AVQ encoded using this bit.
- An AVQ encoded signal is generated, and the AVQ encoded signal and peak position information are And it outputs the multiplexed signal ized.
- An acoustic signal decoding method is an acoustic signal decoding method for generating a decoded acoustic signal from a multiplexed signal generated by the above-described acoustic signal encoding method, wherein the multiplexed signal is converted into an AVQ encoded signal and a peak position.
- the SBP-AVQ vector is converted into a plurality of first category decoded subband vectors, the first category decoded subband vector and the second category decoded subband vector are converted into time domain signals and output as decoded acoustic signals. To do.
- the acoustic signal encoding device and the acoustic signal decoding device according to the present invention can be applied to devices related to recording, transmission, and reproduction of acoustic signals.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
AVQ符号化において効率的なベクトル量子化手法を実現する。音響信号符号化装置(100)は、周波数領域のスペクトルを分割したサブバンドを、エネルギーまたはピーク性の少なくとも一つの指標に基づき、聴覚的に重要な複数の第1カテゴリーサブバンドとそれ以外の第2カテゴリーサブバンドに分類するサブバンド分類部(105)、第1カテゴリーサブバンドのそれぞれから、最大ピークを集めてSBP-AVQベクトルを生成・出力するとともに、最大ピークのピーク位置情報を出力するSBP-AVQベクトル生成部(106)、SBP-AVQベクトルおよび第2カテゴリーサブバンドのベクトルにAVQ符号化のためのビットを配分するビット配分部(104)、SBP-AVQベクトルおよび第2カテゴリーサブバンドのベクトルをAVQ符号化するAVQ符号化部(107)を、備える。
Description
本開示は、音声や楽音などの音響信号をベクトル量子化により符号化または復号する技術に関する。
音声や楽音の音響信号を対象として符号化、復号するためのベクトル量子化には、例えば、非特許文献1に記載されたAVQ法(Algebraic Vector Quantization)等の予め設定された量子化ビット数の範囲内でパルスを立てたものを量子化する方法がある。このような方法では、入力された信号を所定数のサンプルからなるフレームを単位としてMDCT(Modified Discrete Cosine Transform)等によって周波数領域の信号(スペクトル)とし、これを複数のサブバンドに分ける。サブバンド毎に一部のスペクトルにだけ量子化のためのビットが割り当てられ、残りのスペクトルに対しては「0」が割り当てられるベクトル量子化が行われている。
しかしながら、このようなベクトル量子化では、周波数成分全体を量子化するために必要なビット数に対して予め定められた量子化ビット数が不足すると、一部の聴覚的に重要なスペクトルが時間的に連続するフレームで量子化対象から漏れてしまうフレームが発生して聴感上の歪みが生じてしまう。いわゆるスペクトルホールという現象が発生することがある。
これを解決するため、特許文献1では、次のような符号化方法が開示されている。まず、所定の個数のサンプルを代表する値である正規化値を量子化した量子化正規化値及びその量子化正規化値に対応する正規化値量子化インデックスを求める。各サンプルの値から量子化正規化値に対応する値を減算した減算値が正であり各サンプルの値が正の場合にはその減算値を各サンプルに対応する量子化対象値とし、減算値が正であり各サンプルの値が負の場合にはその減算値の正負を反転させた値を各サンプルに対応する量子化対象値とする。そして、この量子化対象値をベクトル量子化してベクトル量子化インデックスを求めて出力する。このような方法によって、全ての周波数成分の中からAVQ法等のベクトル量子化では量子化の対象とならないサンプルを含む主要成分を選択して積極的に量子化することにより、復号信号の主要成分におけるスペクトルホールの発生を防止することができる。
また、特許文献2では、ラティスベクトルに変換する前のスペクトルデータに対して補正する技術が開示されている。例えば、聴覚的に重要なサンプル以外の値をゼロにする補正を行うことにより、低ビットレートかつ低演算処理量で復号信号の品質を改善する技術が記載されている。
その他、AVQ法の改良にかかる発明として、特許文献3のような発明がある。
Stephane Ragot, Bruno Bessette, Roch Lefebvre, "Low-complexity Multi-rate Lattice Vector Quantization With Application To Wideband TCX Speech Coding at 32 kbit/s", ICASSP 2004.
Recommendation ITU-T G.718, SERIES G: TRANSMISSION SYSTEMS AND MEDIA, DIGITAL SYSTEMS AND NETWORKS, Digital terminal equipments - Coding of voice and audio signals, Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s.
しかしながら、より高品質な復号音響信号を得るために、より効率的なベクトル量子化手法が求められている。
そこで、本開示の一態様は、より高品質な復号音響信号を得ることができる音響信号符号化装置等を提供する。
本開示の一態様に係る音響信号符号化装置は、入力信号を周波数領域のスペクトルに変換する時間―周波数変換部と、周波数領域のスペクトルをサブバンドに分割する分割部と、サブバンドを、エネルギーおよび/またはピーク性に基づき、聴覚的に重要な複数の第1カテゴリーサブバンドとそれ以外の第2カテゴリーサブバンドに分類するサブバンド分類部と、第1カテゴリーサブバンドのそれぞれから、最大ピークを集めてSBP-AVQベクトル(Sub Band Peak - AVQ Vector)を生成・出力するとともに、最大ピークのピーク位置情報を出力するSBP-AVQベクトル生成部と、SBP-AVQベクトルおよび第2カテゴリーサブバンドのベクトルにAVQ符号化のためのビットを配分するビット配分部と、ビットを用いてSBP-AVQベクトルおよび第2カテゴリーサブバンドをAVQ符号化してAVQ符号化信号を生成するAVQ符号化部と、AVQ符号化信号、およびピーク位置情報を多重化した多重化信号を出力する多重化部と、を有する。
「エネルギー」とは、サブバンドが有するエネルギーをいい、例えばサブバンドの平均エネルギーがこれに含まれる。また、エネルギーは、絶対的な値であっても、他のサブバンドとの相対的な値であってもよい。
「ピーク性」とは、スペクトルに含まれるピークの強度、密度、その他ピークの形状に基づく指標であり、例えばフラットネスメジャー(SFM:Spectral Flatness Measure)がこれに該当する。
「エネルギーおよび/またはピーク性」とは、エネルギーまたはピーク性の少なくとも一つを指標としていればよい。
「聴覚的に重要」とは、聴覚的に重要かどうか自体の判断までを要するものではなく、エネルギーやピーク性などの情報を用いて、経験的に聴覚的に重要なものが結果として抽出されていればよい。
「最大ピーク」とは、スペクトル強度が最大のピークをいう。
「ピーク位置情報」とは、第1カテゴリーサブバンド中のピークの位置を特定する情報をいう。
「音響信号符号化装置」とは、音声や楽音などの信号を符号化する装置をいう。
本開示の一態様に係る音響信号復号装置は、音響信号符号化装置で生成された多重化信号から復号音響信号を生成する音響信号復号装置であって、多重化信号をAVQ符号化信号およびピーク位置情報に分離する分離部と、AVQ符号化信号をAVQ復号して、SBP-AVQベクトルと第2カテゴリー復号サブバンドのベクトルとを生成するAVQ復号部と、SBP-AVQベクトルに含まれるピークとピーク位置情報とを用いて、SBP-AVQベクトルを複数の第1カテゴリー復号サブバンドのベクトルに変換する変換部と、第1カテゴリー復号サブバンドのベクトルおよび第2カテゴリー復号サブバンドのベクトルを時間領域の信号に変換して復号音響信号として出力する周波数―時間変換部と、を有する。
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示によれば、スペクトルホールを低減して、より高品質な復号音響信号を得ることができる。
(本開示の実施形態の基礎となった知見)
本願の発明者らは、人間の聴覚はスペクトルのピークに鋭敏であることに着目し、聴覚的に重要なスペクトルのピーク以外はむしろ積極的に除去して符号化効率をあげることで、その時間的な不連続性の発生を回避してスペクトルホールを防止する、というアプローチをとった。
本願の発明者らは、人間の聴覚はスペクトルのピークに鋭敏であることに着目し、聴覚的に重要なスペクトルのピーク以外はむしろ積極的に除去して符号化効率をあげることで、その時間的な不連続性の発生を回避してスペクトルホールを防止する、というアプローチをとった。
すなわち、本開示の音響信号符号化装置等では、AVQ法によるスペクトル符号化を前提として、聴覚的に重要なスペクトルに符号化のためのビットを優先的に割り当てることで、より高品質な復号音響信号を得ることができる。
(実施形態1)
まず、図1に音響信号(音声・楽音信号)のスペクトルのイメージを示す。縦軸はスペクトル振幅、横軸は周波数である。スペクトルには特有のピークが発生するが700Hz程度のサブバンド毎に観察すると、せいぜい数個のピークが存在するに過ぎない。また高域のスペクトルほどピークの振幅が非常に小さい。このため聴覚的に重要なスペクトルの多いサブバンドとそうではないサブバンドに分けて符号化の方法を変えることで符号化効率を上げることができる。
まず、図1に音響信号(音声・楽音信号)のスペクトルのイメージを示す。縦軸はスペクトル振幅、横軸は周波数である。スペクトルには特有のピークが発生するが700Hz程度のサブバンド毎に観察すると、せいぜい数個のピークが存在するに過ぎない。また高域のスペクトルほどピークの振幅が非常に小さい。このため聴覚的に重要なスペクトルの多いサブバンドとそうではないサブバンドに分けて符号化の方法を変えることで符号化効率を上げることができる。
次に、実施形態1における音響信号符号化装置の構成および動作を、図2を用いて説明する。音響信号符号化装置100は、時間―周波数変換部101、サブバンド分割部102、ピーク性・エネルギー分析部103、ビット配分部104、サブバンド分類部105、SBP-AVQベクトル生成部106、AVQ符号化部107、多重化部108、を有する。なお、通信に用いる完成品たる端末装置または基地局装置は、かかる音響信号符号化装置100にアンテナ109を備えたものである。
時間―周波数変換部101は、時間領域の信号である音響信号たる入力信号を、周波数領域の信号(スペクトル)に変換するものである。時間―周波数変換部101の変換方法の例として、修正離散コサイン変換(MDCT)が挙げられるが、その他の変換方法、例えば、離散コサイン変換(DCT)や、その他公知の時間―周波数変換を用いることができる。
サブバンド分割部102は、時間―周波数変換部101で変換された周波数領域の信号(スペクトル)を、8次元のGosset格子(Gosset lattice)であるRE8に基づきAVQの符号化をする。そのため、8サンプル毎のサブバンドに分ける。例えば16kHzサンプリングであれば8kHzまでをおよそ700Hzのバンド幅で12個のサブバンドに分けることになる。ただし、Gosset格子は便宜上8次元の例を説明するものであり、別次元でもよい。また、本実施形態では、周波数軸に対して等間隔のサブバンドに分割しているが、低域と高域で異なるバンド幅に分割するようにしてもよい。
ピーク性・エネルギー分析部103は、サブバンドに分割されたスペクトルを入力とし、各サブバンドの平均エネルギー(Ek)とサブバンドのスペクトルのピーク性の尺度として、例えばスペクトルフラットネスメジャー(SFMk:振幅スペクトルの幾何平均と算術平均との比(=幾何平均/算術平均))を計算し、計算結果をサブバンド分類部105とビット配分部104に出力する。
各サブバンドの平均エネルギーEkは、次式で求められる。
Nk:サブバンド中のサンプル数(本実施形態では8)
Sk(i):入力スペクトル
また、各サブバンドのスペクトルフラットネスメジャー(SFMk)は、次式で求められる。
Nk:サブバンド中のサンプル数(本実施形態では8)
Sk(i):入力スペクトル
なお上記のSFMは例示にすぎず、ピーク性の判断の尺度は他にもさまざまなものが考えられる。例えば、サブバンドの平均エネルギーとピークエネルギーの差を用いてもよい。また、所定の閾値以上のピークの総数でピーク性を判断してもよい。さらに、次式でSFMを定義してもよい。
ビット配分部104は、サブバンド配分計算部1041、再配分計算部1042、およびSBP-AVQベクトル配分計算部1043、を有する。再配分計算部1042は本実施形態では動作しない。再配分計算部1042が動作する例については、実施形態3で説明する。
サブバンド配分計算部1041は、サブバンドのスペクトルをAVQで符号化するために最低限必要なビット数を計算する。そして、ピーク性・エネルギー分析部103の分析結果を受けて、サブバンドの平均エネルギーが高いサブバンドから順に、フレームのスペクトル符号化用に事前に割り当てられたbitの集合から、前述の算出されたビット数の単位で、bitが枯渇する(無くなる)まで配分していく。
ここで、AVQ符号化で必要とされるビット数は使用するコードブックによって計算が可能である。例えば、8次元のGosset格子RE8によるAVQ符号化には格納しているコードワードの少ない順に5つのコードブックがあり、コードブックのコードワードの指定にはそれぞれ4, 8, 12, 16, 20ビットが必要である。これにコードブック番号のインデックスがそれぞれ1, 2, 3, 4, 5ビット必要になるので、これを加えた5, 10, 15, 20, 25ビットのいずれかが符号化対象のサブバンドをAVQで符号化するのに必要なビット数となる。これにコードブック番号のインデックスが追加される。例えば、ITU-T勧告G.718では、0をストップビットとする可変長コードを用い、最小のコードブックに10、次に110、その次に1110、というようにコードブック番号のインデックスを割り当てる。G.718では,最小サイズのコードブックは8ビット(4ビットのコードブックは単独では使用しない)であるため、AVQ符号化に必要なビット数は10、15、20、25ビットとなる。なお、コードブック番号のインデックスが0である符号も存在し、この符号で表される量子化スペクトルはゼロである(つまり、量子化スペクトルが振幅0のスペクトルを表す場合、AVQの出力符号は’0’の1ビットのみとなる)。なお、AVQへ割り当てられるビット数が分かっている場合は、コードブック番号のインデックスを表す可変長コードにストップビットは必要なくなるため、AVQ符号化に必要なビット数は前述したビット数より1ビット少なくすることができる。
本実施形態において対象となる音声や楽音のスペクトル符号化にあたり、上記の最小のコードブックだけではコードワード種類が不足する。そこで、最低限、最小のコードブックと次に小さいコードブックの2つを使えるようにビット(AVQへの割り当てビット数が決められている場合は9ビット)を割り当てることにする。
なお、他にも8次元のAVQで8次元よりも広いサブバンド幅のサブバンドを量子化する場合には、例えば下記で定義されるようにサブバンド幅に応じたビット数を割り当てても良い。
次式において、log2(SBBW/8)は8次元よりも広いSBBW次元のベクトルからどの8次元を選ぶかを示すために必要なビット数を表している。必要なビット数を整数とすれば、SBBWは8の倍数となる。例えば、SBBW=16の場合、16次元ベクトルを前半8次元と後半8次元とに分け、どちらを選択するかを1ビットで表す。他にも偶数要素8次元と奇数要素8次元とに分け、どちらを選択するかを1ビットで表すようにしてもよい。
AVQcbkindexmin:AVQで使われるコードブックのうち最小のもの
SBBW:サブバンドのバンド幅
なお、ビット配分部104のうち、SBP-AVQベクトル配分計算部1042の動作は後述する。
このような配分によってエネルギーの低いサブバンドは符号化対象から外され、エネルギーが高いサブバンドに対して優先的にスペクトル符号化のためのビットが割り当てられる。なお、この配分結果のイメージを図3に模式的に示す。
サブバンド分類部105は、ピーク性・エネルギー分析部103の分析結果を受けて、サブバンドを聴覚的に重要なサブバンド(第1カテゴリーサブバンド)とそれ以外のサブバンド(第2カテゴリーサブバンド)に分類する。また、サブバンド毎に分類結果をAVQ/SBP-AVQ判定結果として出力する。なお、ピーク性・エネルギー分析部103の分析結果は必ずしもすべて用いる必要はなく、サブバンドのエネルギー、またはピーク性のいずれか一つを用いるようにしてもよい。
ビット配分部104で配分された10bitにより選択できるコードワード数(つまりスペクトルの形状の種類)は256個である。しかし、256個のスペクトル形状では、ピーク性が高いサブバンドのスペクトル形状を十分に表現できない場合がある。平均エネルギーが高く、かつピーク性の高いサブバンドは聴覚的に重要であり、ピークをより正確に符号化する必要があるため、このようなサブバンド群(第1カテゴリーサブバンド)とそれ以外のサブバンド群(第2カテゴリーサブバンド)に分類する。
例えば、サブバンドの平均エネルギーがフレーム中の全サブバンドの平均エネルギーの平均値以上であり、かつSFMが0.5を超えるサブバンドと、そうでないサブバンドに分類するようにすればよい。
SBP-AVQベクトル生成部106は、サブバンド分類部105で第1カテゴリーサブバンドに分類されたサブバンドを対象に以下の操作を行う。以下、SBP-AVQベクトル生成部106の動作を示した図4に基づき説明する。
上述の通り、サブバンド分類部105で第1カテゴリーサブバンドのベクトルが抽出される(S11)。
次に、抽出された第1カテゴリーサブバンド毎に最大ピークを抽出する(S12)。その際、第1カテゴリーサブバンド毎に開始周波数を始点としたピーク位置をピーク位置情報として生成する。
そして、最大ピークを集めて、新たなベクトル(8次元)を生成する。以下、このベクトルのことをSBP-AVQベクトルという。本実施形態の場合は、最大ピークのみでなく、最大ピークとそれに隣接するスペクトルとを集めて、SBP-AVQベクトルを生成している(S13)。この手順について、以下説明する。
もし第1カテゴリーサブバンドのベクトルの数が8未満の場合には、エネルギーの大きなものから順に最大ピークの両端のスペクトルをSBP-AVQベクトルに追加する。もし、ある第1カテゴリーサブバンドで最大スペクトルピークが当該第1カテゴリーサブバンドの8サンプル目に位置すると、その右隣のスペクトルは存在しない。この場合には、最大ピークの左隣のスペクトルだけを追加する。最大スペクトルピークの両端のスペクトルを符号化に含めるのは、復号化した場合にスペクトルピークの形状をより正確に再現するためである。こうすることにより、聴覚上重要なピークを正確に再現できるので、より音質劣化の少ない音響信号を復号することができる。8次元のSBP-AVQベクトルに入りきらない場合は、隣接するスペクトルの両方ないし片方を切り捨てるようにしてもよい。例えば、図4のSB2の場合、SBP-AVQベクトルには残り二次元のスペースしかないので、最大ピークの右側のスペクトルを切り捨て、左側のスペクトルのみSBP-AVQベクトルに移動する。
なお、最大ピークのみ集めてSBP-AVQベクトルを生成することもできる。この場合、より多くのピークを集めることができるので、聴覚上重要なピークを取りこぼす可能性が少なくなる。
あるいは、第1カテゴリーサブバンドの中で最大のピークおよび次に大きなピークであるサブピークを集めてサブピークを生成することもできる。この場合、サブバンド毎のピーク分布の特徴を崩さないようにできるので、より音質劣化の少ない音響信号を復号することができる。この場合は、最大ピーク位置に加えサブピーク位置もピーク位置情報として生成するとよい。
次に、ビット配分部104のうち、SBP-AVQベクトル配分計算部1043の動作を説明する。
第1カテゴリーサブバンドのベクトルは、上述のように最大ピークを集められてSBP-AVQベクトルとして再構成されるので、新たに割り当てるビット数を計算する必要がある。以下、その手順を説明する。
まず、第1カテゴリーサブバンドのベクトルに割り当てられた符号化ビットの合計値Sumを求める。
次に、抽出された各第1カテゴリーサブバンドの最大スペクトルピークについて、サブバンド毎にサブバンドの開始周波数を始点とした位置を符号化し、その符号化に要したビット数をSumから減算したものを新たなSumとする。SumがAVQ符号化で最低限必要とされる10bitを下回らない限り、次々と各第1カテゴリーサブバンドのスペクトルピーク位置情報の符号化を行う。そして、最終的なSumがSBP-AVQベクトルに割り当てられる。
AVQ符号化部107には、第1カテゴリーサブバンドから再構成されて生成されたSBP-AVQベクトル、および第2カテゴリーサブバンドのベクトルが入力される。そして、SBP-AVQベクトルに対しては、ビット配分部104のSBP-AVQベクトル配分計算部1042で計算されたビット数(最終的なSum)によりAVQ符号化が行われる。(以降このようなSBP-AVQベクトルを対象としたAVQを、SBP-AVQと呼ぶ)。また、第2カテゴリーサブバンドのベクトルに対しては、ビット配分部104のサブバンド配分計算部1041で計算されたビットにより、AVQ符号化が行われる(以降、AVQと呼ぶ)。
SBP-AVQによって、第1カテゴリーサブバンドのスペクトルは、最大ピークとその両端のスペクトル以外は符号化対象とされないことになる(すなわち0となる)。しかし、最大ピークとその両端スペクトルを要素とするSBP-AVQベクトルの符号化には最終的なSumビットが割り当てられるので、より大きなサイズのコードブックが使えることになり、その振幅値がより正確に符号化できる。
なお、符号化されたスペクトルピーク位置はサブバンド毎に決めるため、スペクトルピークがどの第1カテゴリーサブバンドに属するかを示す情報を送信する必要がある。しかし、これはAVQ/SBP-AVQ判定結果から、受信側で判断することが可能であるので、特に符号化する必要はない。
多重化部108は、AVQ符号化部107から出力されたAVQ符号化信号、およびSBP-AVQベクトル生成部106から出力されたピーク位置情報、を多重化して多重化信号を生成する。なお、ピーク性・エネルギー分析部103で計算したサブバンドの平均エネルギーや、サブバンド分類部105でのAVQ/SBP-AVQ判定結果も併せて多重化してもよい。さらには、SBP-AVQベクトルに再構成された第1カテゴリーサブバンドの番号も併せて多重化するようにしてもよい。
そして、多重化信号は、アンテナ109を通じて音響信号復号装置を有する端末装置に向けて送信される。
次に、上述の音響信号符号化装置に対応する、本発明の実施形態1における音響信号復号装置の構成および動作を、図5を用いて説明する。音響信号復号装置200は、分離部201、AVQ復号部202、切替部203、SBP-AVQベクトル―サブバンド変換部204、ゼロエネルギーサブバンド付加部205、周波数―時間変換部206を有する。なお、通信に用いる完成品たる端末装置は、かかる音響信号復号装置200にアンテナ207を備えたものである。
音響信号符号化装置100から送信された多重化信号は、アンテナ207で受信され、分離部201に入力される。
分離部201は、入力された多重化信号を、AVQ符号化信号、ピーク位置情報に分離する。サブバンドの平均エネルギー、AVQ/SBP-AVQ判定結果が多重化されている場合は、これらも分離する。
AVQ復号部202は、AVQ符号化信号をAVQ復号し、8次元のベクトル群からなるAVQ復号信号を生成する。AVQ復号信号は、SBP-AVQベクトルと第2カテゴリー復号サブバンドベクトルからなり、それぞれ音響信号符号化装置100で符号化したSBP-AVQベクトルと第2カテゴリーサブバンドのベクトルに対応する信号である。
切替部203は、AVQ/SBP-AVQ判定結果に基づき、SBP-AVQベクトルはSBP-AVQベクトル―サブバンド変換部204に出力し、第2カテゴリー復号サブバンドベクトルは、直接ゼロエネルギーサブバンド付加部205に出力する。
SBP-AVQベクトル―サブバンド変換部204は、受信したピーク位置情報を基にSBP-AVQベクトルから各サブバンドの最大スペクトルとその両端のスペクトルを抽出し、これら以外は0を要素とする複数の第1カテゴリー復号サブバンドを生成する。そして、SBP-AVQベクトル―サブバンド変換部204は、第1カテゴリー復号サブバンドベクトルをゼロエネルギーサブバンド付加部205に出力する。
ゼロエネルギーサブバンド付加部205は、受信したサブバンドの平均エネルギー情報に基づき、音響信号符号化装置100のビット配分部104でAVQの符号化対象から外されたサブバンドをエネルギーゼロのサブバンドとして、このサブバンドを第2カテゴリー復号サブバンドおよび第1カテゴリー復号サブバンドに追加挿入する。
そして、ゼロエネルギーサブバンド付加部205からの出力は周波数―時間変換部206に入力され、時間領域信号に変換され、最終的な復号音響信号となり出力される。変換方法は、例えばIMDCT(Inverse MDCT)が用いられる。
以上、本実施形態によれば、音響信号符号化装置において聴覚的に重要な第1カテゴリーサブバンドの中でも特に重要な部分(ピーク)のみを符号化することにより、この部分に特に多くのビットを割り当てることができる。したがって、音響信号復号装置においてスペクトルホール現象の少ない音響信号を復号することができる。
(実施形態2)
次に、本発明の実施形態2における音響信号符号化装置300の構成および動作を、図6を用いて説明する。図2と同じ構成を有するブロックは、同じ図番号を用いている。本実施形態の音響信号符号化装置300と実施形態1における音響信号符号化装置100との違いは、本実施形態の音響信号符号化装置300が、サブバンドグループ生成部301を有していることである。
次に、本発明の実施形態2における音響信号符号化装置300の構成および動作を、図6を用いて説明する。図2と同じ構成を有するブロックは、同じ図番号を用いている。本実施形態の音響信号符号化装置300と実施形態1における音響信号符号化装置100との違いは、本実施形態の音響信号符号化装置300が、サブバンドグループ生成部301を有していることである。
本実施形態において、サブバンド分割部102から出力されたサブバンドは、サブバンドグループ生成部301でグループ化される。「サブバンドグループ」とは、1又は複数のサブバンドの集合であり、グループ化の基準は、あらかじめ定めた周波数帯に分類する、例えば、周波数軸上で低域、中域、高域に分類する方法が考えられる。そして、それ以降の処理は、サブバンドグループ毎に行われる。例えば、以下のような処理が行われる。
ピーク性・エネルギー分析部103においては、サブバンドグループ内でエネルギーの大きいサブバンドを選択し、選択されたサブバンドのピーク性を判定する。ピーク性が高いサブバンドが過半数を占めていた場合には、サブバンドグループ全体のピーク性が高いと判定する。この判定結果はグループ毎に1ビットで符号化され、サブバンド分類部105からAVQ/SBP-AVQ判定結果として多重化部へ送信される。そして、ピーク性が高いと判定されたグループに対しては、そのグループに含まれるすべてのサブバンドを第1カテゴリーサブバンドとし、SBP-AVQを適用する。つまり、サブバンド分類部105でサブバンドグループ内の全てのサブバンドが第1カテゴリーサブバンドに分類されてSBP-AVQベクトル生成部106に出力される。そして、SBP-AVQベクトル生成部106でサブバンドグループ内の全てのサブバンドを対象にSBP-AVQベクトルを生成するとともに、ビット配分部104のSBP-AVQベクトル配分計算部で計算されたビット配分を適用し、AVQ符号化部107でAVQ符号化を行う。上記以外のグループに含まれるすべてのサブバンドは第2カテゴリーサブバンドとして処理される。
なお、上記のサブバンドのグループ内でサブバンドの平均エネルギーやピーク性に基づき、聴覚的に重要なサブバンドだけをSBP-AVQの対象としてもよい。その場合にはサブバンド毎のAVQ/SBP-AVQの判定結果等を送信することになる。
次に、実施形態2における音響信号復号装置400の構成及び動作を、図7を用いて説明する。図5と同じ構成を有するブロックは、同じ図番号を用いている。本実施形態の音響信号復号装置400と実施形態1における音響信号復号装置200との違いは、本実施形態の音響信号復号装置400が、サブバンドグループ分離部401を有していることである。
AVQ復号部202は、AVQ符号化信号をAVQ復号し、8次元のベクトル群からなるAVQ復号信号を生成する。そして、サブバンドグループ分離部401は、ベクトル群をAVQ/SBP-AVQ判定結果に基づき、低域/中域/高域のサブバンドグループに分ける。具体的には、AVQ/SBP-AVQ判定結果に基づき、AVQであれば第2カテゴリー復号サブバンドを所定の数、SBP-AVQなら1個のSBP-AVQベクトルで、低域/中域/高域のサブバンドグループに分離する。切替部203は、AVQ/SBP-AVQ判定結果に基づき、SBP-AVQベクトルはSBP-AVQベクトル―サブバンド変換部204に出力し、第2カテゴリー復号サブバンドからなるサブバンドグループは、直接ゼロエネルギーサブバンド付加部205に出力する。これ以降の処理は実施形態1と同様である。
以上のように、本実施形態によれば、サブバンドグループ毎に処理内容が決まるため、演算量を削減するとともに、サブバンドグループ全体でAVQ/SBP-AVQ判定結果等の情報を少ないビット数で符号化することができる。したがって、余ったビットをAVQ符号化に用いることができるので、より高品質な復号信号を得ることができる。
(実施形態3)
次に、実施形態3における音響信号符号化装置の構成および動作を、図2を用いて説明する。本実施形態の音響信号符号化装置は、図2のビット配分部104の再配分計算部1042がオンになった状態である。本実施形態では、実施形態1のように通常のサブバンドへのビット配分計算をサブバンド計算部1041で行った後、さらに、再配分計算部1042でエネルギーの小さなサブバンドからエネルギーの大きなサブバンドへビットを再配分するものである。その後、実施形態1のようにサブバンド(第1カテゴリーサブバンド)を構成し直してSBP-AVQベクトルを生成した場合のSBP-AVQベクトルへのビット配分計算をSBP-AVQベクトル配分計算部1043で行う。
次に、実施形態3における音響信号符号化装置の構成および動作を、図2を用いて説明する。本実施形態の音響信号符号化装置は、図2のビット配分部104の再配分計算部1042がオンになった状態である。本実施形態では、実施形態1のように通常のサブバンドへのビット配分計算をサブバンド計算部1041で行った後、さらに、再配分計算部1042でエネルギーの小さなサブバンドからエネルギーの大きなサブバンドへビットを再配分するものである。その後、実施形態1のようにサブバンド(第1カテゴリーサブバンド)を構成し直してSBP-AVQベクトルを生成した場合のSBP-AVQベクトルへのビット配分計算をSBP-AVQベクトル配分計算部1043で行う。
つまり、サブバンドの最大ピーク(とその両端のスペクトル)をさらに正確に符号化するために、ビット配分がされたサブバンド間でエネルギーの低いサブバンドからエネルギーの高いサブバンドへビットの再配分を行う。次に、具体的な動作を説明する。
まず、エネルギーの低いサブバンドを符号化対象から外し、その配分ビットを再配分用のビット(Re)として、所定のビット量(ebact)以上集まったら、一定のビット量(k)ビットを単位としてピーク性・エネルギー分析部103でピーク性が高いと判定されたものから順に追加配分してゆく。サブバンド分類部105でピーク性が高いと判定されたサブバンド全てにkビットを追加配分する。その後でまだReが余っている場合には、再度同様に配分し、Reが枯渇するまで(無くなるまで)この操作を繰り返す。
kビットとしては例えば5 bitを割り当てる。そうすればAVQ符号化で確実に一つ大きなサイズのコードブックが使え、ピークをより正確に符号化することが可能となる。
このようなビット再配分の様子を図8に示す。
なお、再配分されるサブバンドと再配分順序とebactの設定法はさまざまなものが考えられる。下記設定方法1,2,3はその例示である。これら設定方法1,2,3は、第2カテゴリーサブバンドのうち、エネルギーおよび/またはピーク性が所定の閾値より低いもののビットを、第1カテゴリーサブバンドのベクトルに再配分するものである。ここで、上記の「閾値」とは、エネルギーおよび/またはピーク性に基づく指標であれば足り、例えばサブバンドの平均エネルギーやSFM、あるいは、これらを適宜変形や加工したものを含む。さらには、第1カテゴリーサブバンドと第2カテゴリーサブバンドの分類に用いた基準をそのまま用いてもよい。その場合は、第2カテゴリーサブバンドに配分されたビットをSBP-AVQベクトルに再配分することになる。
(設定方法1)
ピーク性・エネルギー分析部103でピーク性が高いと判定されたものの中で、特にピーク性が高いもの(例えばSFM>0.8)を抽出し、SFMが高い順にbitが再配分されるサブバンド群(Dominant Sub-bands)とし、次式としてもよい。
ピーク性・エネルギー分析部103でピーク性が高いと判定されたものの中で、特にピーク性が高いもの(例えばSFM>0.8)を抽出し、SFMが高い順にbitが再配分されるサブバンド群(Dominant Sub-bands)とし、次式としてもよい。
ただし、ここまでの処理において、フレーム全体に与えられたスペクトル符号化用のbitに剰余分(remaining bits)がある場合には、それを上記から差し引いて、次式としてもよい。
(設定方法2)
サブバンドへのbit配分の順序は、図9に示すようにSMFとサブバンド平均エネルギーの正規化値(各サブバンドの平均エネルギーを最大のサブバンド平均エネルギーで除した値)からなる座標平面(SFMをX座標とし、サブバンド平均エネルギーの正規化値をY軸とする)上で各サブバンドの座標からy=xのラインに下ろした垂線が(1.0, 1.0)に近いものから再配分される順序としてもよい。
(設定方法3)
実施形態1でSBP-AVQの対象とされる第1カテゴリーサブバンドを全てビット再配分の対象とし、再配分の順序をSFMの高い順またはサブバンド平均エネルギーの高い順、または設定方法2に記載した順とし、SBP-AVQの対象とされなかった第2カテゴリーサブバンドへの配分ビットの総和をebactとしてもよい。
実施形態1でSBP-AVQの対象とされる第1カテゴリーサブバンドを全てビット再配分の対象とし、再配分の順序をSFMの高い順またはサブバンド平均エネルギーの高い順、または設定方法2に記載した順とし、SBP-AVQの対象とされなかった第2カテゴリーサブバンドへの配分ビットの総和をebactとしてもよい。
なお、上記説明では、再配分計算部1042でビットを再配分した後に、SBP-AVQベクトルへのビット配分計算をSBP-AVQベクトル配分計算部1043で行うことになるが、この処理を逆にしてもよい。つまり、まずSBP-AVQベクトル配分計算部1043でSBP-AVQベクトルへのビット配分計算をした後に、再配分計算部1042でビットの再配分計算を行ってもよい。
この場合は、第2カテゴリーサブバンドのうち、エネルギーおよび/またはピーク性が所定の閾値より低いもののビットを、SBP-AVQベクトルに再配分することになる。
以上、本実施形態においては、AVQ符号化に用いられるビットをより聴覚上重要なサブバンドのベクトルやSBP-AVQベクトルに割り当てることができるので、復号した際に高品質な復号音響信号を得ることが可能である。
なお、図2、図5、図6、図7のブロック図は、専用に設計されたハードウェアの構成および動作を表すとともに、汎用のハードウェアに本発明の方法を実行するプログラムをインストールすることにより実現する場合も含む。汎用のハードウェアたる電子計算機として、例えばパーソナルコンピュータ、スマートホンなどの各種携帯情報端末、および携帯電話などが挙げられる。
また、専用に設計されたハードウェアは、携帯電話や固定電話などのいわゆる完成品(コンシューマエレクトロニクス)に限らず、システムボードや半導体素子など、半完成品や部品レベルをも含むものである。
以上、本開示に係る音響信号符号化装置において、SBP-AVQベクトル生成部は、第1カテゴリーサブバンドのそれぞれから、最大ピークに加え、最大ピークに隣接するスペクトルを集めてSBP-AVQベクトルを生成・出力するとともに、最大ピークのピーク位置情報を出力する。
本開示に係る音響信号符号化装置において、SBP-AVQベクトル生成部は、第1カテゴリーサブバンドのそれぞれから、最大ピークに加え次に大きなピークであるサブピークを集めてSBP-AVQベクトルを生成・出力するとともに、最大ピークおよびサブピークのピーク位置情報を出力する。
本開示に係る音響信号符号化装置において、サブバンドをグループ化してサブバンドグループを形成するサブバンドグループ手段をさらに有し、サブバンド分類部は、サブバンドグループ毎に第1カテゴリーサブバンドと第2カテゴリーサブバンドとに分類する。
本開示に係る音響信号符号化装置において、ビット配分部で第2カテゴリーサブバンドのベクトルに配分したビットを再配分するビット再配分部をさらに有し、ビット再配分部は、第2カテゴリーサブバンドのうち、エネルギーおよび/またはピーク性が所定の閾値より低いもののビットを、所定の閾値より高い第1カテゴリーサブバンドのベクトルに再配分する。
本開示に係る音響信号符号化装置において、ビット配分部で第2カテゴリーサブバンドのベクトルに配分したビットを再配分するビット再配分部をさらに有し、ビット再配分部は、第2カテゴリーサブバンドのうち、エネルギーおよび/またはピーク性が所定の閾値より低いもののビットを、所定の閾値より高いSBP-AVQベクトルに再配分する。
本開示に係る端末装置は、上記の音響信号符号化装置から出力された多重化信号を送信するアンテナと、を有する。
本開示に係る基地局装置は、上記の音響信号符号化装置と、この音響信号符号化装置から出力された多重化信号を送信するアンテナと、を有する。
本開示に係る端末装置は、上記の音響信号符号化装置から出力された多重化信号を受信するアンテナと、音響信号復号装置と、を有する。
本開示に係る音響信号符号化方法は、入力信号を周波数領域のスペクトルに変換し、周波数領域のスペクトルをサブバンドに分割し、サブバンドを、エネルギーおよび/またはピーク性に基づき、聴覚的に重要な複数の第1カテゴリーサブバンドとそれ以外の第2カテゴリーサブバンドに分類し、第1カテゴリーサブバンドのそれぞれから、最大ピークを集めてSBP-AVQベクトルを生成・出力するとともに、最大ピークのピーク位置情報を出力し、SBP-AVQベクトルおよび第2カテゴリーサブバンドにAVQ符号化のためのビットを配分し、このビットを用いてSBP-AVQベクトルおよび第2カテゴリーサブバンドのベクトルをAVQ符号化してAVQ符号化信号を生成し、AVQ符号化信号、およびピーク位置情報を多重化した多重化信号を出力する。
本開示に係る音響信号復号方法は、上記の音響信号符号化方法で生成された多重化信号から復号音響信号を生成する音響信号復号方法であって、多重化信号をAVQ符号化信号およびピーク位置情報に分離し、AVQ符号化信号をAVQ復号して、SBP-AVQベクトルと第2カテゴリー復号サブバンドのベクトルとを生成し、SBP-AVQベクトルに含まれるピークとピーク位置情報とを用いて、SBP-AVQベクトルを複数の第1カテゴリー復号サブバンドのベクトルに変換し、第1カテゴリー復号サブバンドのベクトルおよび第2カテゴリー復号サブバンドのベクトルを時間領域の信号に変換して復号音響信号として出力する。
本発明にかかる音響信号符号化装置および音響信号復号装置は、音響信号の記録、伝送、再生に関係する機器に応用が可能である。
100 音響信号符号化装置
101 時間―周波数変換部
102 サブバンド分割部
103 ピーク性・エネルギー分析部
104 ビット配分部
105 サブバンド分類部
106 SBP-AVQベクトル生成部
107 AVQ符号化部
108 多重化部
109 アンテナ
101 時間―周波数変換部
102 サブバンド分割部
103 ピーク性・エネルギー分析部
104 ビット配分部
105 サブバンド分類部
106 SBP-AVQベクトル生成部
107 AVQ符号化部
108 多重化部
109 アンテナ
Claims (12)
- 入力信号を周波数領域のスペクトルに変換する時間―周波数変換部と、
前記周波数領域のスペクトルをサブバンドに分割する分割部と、
前記サブバンドを、エネルギーまたはピーク性の少なくとも一つの指標に基づき、聴覚的に重要な複数の第1カテゴリーサブバンドとそれ以外の第2カテゴリーサブバンドに分類するサブバンド分類部と、
前記第1カテゴリーサブバンドのそれぞれから、最大ピークを集めてSBP-AVQベクトルを生成・出力するとともに、前記最大ピークのピーク位置情報を出力するSBP-AVQベクトル生成部と、
前記SBP-AVQベクトルおよび前記第2カテゴリーサブバンドのベクトルにAVQ符号化のためのビットを配分するビット配分部と、
前記ビットを用いて前記SBP-AVQベクトルおよび前記第2カテゴリーサブバンドをAVQ符号化してAVQ符号化信号を生成するAVQ符号化部と、
前記AVQ符号化信号、および前記ピーク位置情報を多重化した多重化信号を出力する多重化部と、
を有する音響信号符号化装置。 - 前記SBP-AVQベクトル生成部は、
前記第1カテゴリーサブバンドのそれぞれから、前記最大ピークに加え前記最大ピークに隣接するスペクトルを集めてSBP-AVQベクトルを生成・出力するとともに、前記最大ピークのピーク位置情報を出力する、
請求項1記載の音響信号符号化装置。 - 前記SBP-AVQベクトル生成部は、
前記第1カテゴリーサブバンドのそれぞれから、前記最大ピークに加え次に大きなピークであるサブピークを集めてSBP-AVQベクトルを生成・出力するとともに、前記最大ピークおよび前記サブピークのピーク位置情報を出力する、
請求項1記載の音響信号符号化装置。 - 前記サブバンドをグループ化してサブバンドグループを形成するサブバンドグループ手段をさらに有し、
前記サブバンド分類部は、前記サブバンドグループ毎に前記第1カテゴリーサブバンドと前記第2カテゴリーサブバンドとに分類する、
請求項1記載の音響信号符号化装置。 - 前記ビット配分部で前記第2カテゴリーサブバンドのベクトルに配分したビットを再配分するビット再配分部をさらに有し、
前記ビット再配分部は、前記第2カテゴリーサブバンドのうち、前記エネルギーまたは前記ピーク性の少なくとも一つの指標が所定の閾値より低いもののビットを、所定の閾値より高い前記第1カテゴリーサブバンドのベクトルに再配分する、
請求項1記載の音響信号符号化装置。 - 前記ビット配分部で前記第2カテゴリーサブバンドのベクトルに配分したビットを再配分するビット再配分部をさらに有し、
前記ビット再配分部は、前記第2カテゴリーサブバンドのうち、前記エネルギーまたは前記ピーク性の少なくとも一つの指標が所定の閾値より低いもののビットを、所定の閾値より高い前記SBP-AVQベクトルに再配分する、
請求項1記載の音響信号符号化装置。 - 請求項1から6いずれかに記載の音響信号符号化装置で生成された前記多重化信号から復号音響信号を生成する音響信号復号装置であって、
前記多重化信号をAVQ符号化信号およびピーク位置情報に分離する分離部と、
前記AVQ符号化信号をAVQ復号して、SBP-AVQベクトルと第2カテゴリー復号サブバンドのベクトルとを生成するAVQ復号部と、
前記SBP-AVQベクトルに含まれるピークと前記ピーク位置情報とを用いて、前記SBP-AVQベクトルを複数の第1カテゴリー復号サブバンドのベクトルに変換する変換部と、
前記第1カテゴリー復号サブバンドのベクトルおよび前記第2カテゴリー復号サブバンドのベクトルを時間領域の信号に変換して前記復号音響信号として出力する周波数―時間変換部と、
を有する音響信号復号装置。 - 請求項1から6いずれかに記載の音響信号符号化装置と、
前記音響信号符号化装置から出力された前記多重化信号を送信するアンテナと、
を有する端末装置。 - 請求項1から6いずれかに記載の音響信号符号化装置から出力された前記多重化信号を受信するアンテナと、
請求項7に記載の音響信号復号装置と、
を有する端末装置。 - 請求項1から6いずれかに記載の音響信号符号化装置と、
前記音響信号符号化装置から出力された前記多重化信号を送信するアンテナと、
を有する基地局装置。 - 入力信号を周波数領域のスペクトルに変換し、
前記周波数領域のスペクトルをサブバンドに分割し、
前記サブバンドを、エネルギーまたはピーク性の少なくとも一つの指標に基づき、聴覚的に重要な複数の第1カテゴリーサブバンドとそれ以外の第2カテゴリーサブバンドに分類し、
前記第1カテゴリーサブバンドのそれぞれから、最大ピークを集めてSBP-AVQベクトルを生成・出力するとともに、前記最大ピークのピーク位置情報を出力し、
前記SBP-AVQベクトルおよび前記第2カテゴリーサブバンドにAVQ符号化のためのビットを配分し、
前記ビットを用いて前記SBP-AVQベクトルおよび前記第2カテゴリーサブバンドのベクトルをAVQ符号化してAVQ符号化信号を生成し、
前記AVQ符号化信号、および前記ピーク位置情報を多重化した多重化信号を出力する、
音響信号符号化方法。 - 請求項11に記載の音響信号符号化方法で生成された前記多重化信号から復号音響信号を生成する音響信号復号方法であって、
前記多重化信号をAVQ符号化信号およびピーク位置情報に分離し、
前記AVQ符号化信号をAVQ復号して、SBP-AVQベクトルと第2カテゴリー復号サブバンドのベクトルとを生成し、
前記SBP-AVQベクトルに含まれるピークと前記ピーク位置情報とを用いて、前記SBP-AVQベクトルを複数の第1カテゴリー復号サブバンドのベクトルに変換し、
前記第1カテゴリー復号サブバンドのベクトルおよび前記第2カテゴリー復号サブバンドのベクトルを時間領域の信号に変換して前記復号音響信号として出力する、
音響信号復号方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015540364A JP6400590B2 (ja) | 2013-10-04 | 2014-07-25 | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 |
| US15/063,529 US9830919B2 (en) | 2013-10-04 | 2016-03-08 | Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013-209593 | 2013-10-04 | ||
| JP2013209593 | 2013-10-04 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| US15/063,529 Continuation US9830919B2 (en) | 2013-10-04 | 2016-03-08 | Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2015049820A1 true WO2015049820A1 (ja) | 2015-04-09 |
Family
ID=52778427
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2014/003930 Ceased WO2015049820A1 (ja) | 2013-10-04 | 2014-07-25 | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9830919B2 (ja) |
| JP (1) | JP6400590B2 (ja) |
| WO (1) | WO2015049820A1 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
| US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
| US10580424B2 (en) * | 2018-06-01 | 2020-03-03 | Qualcomm Incorporated | Perceptual audio coding as sequential decision-making problems |
| CN113259115B (zh) * | 2021-05-06 | 2022-03-25 | 上海大学 | 一种基于钙钛矿晶体制备密码原语的方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09106299A (ja) * | 1995-10-09 | 1997-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号変換符号化方法および復号化方法 |
| JP2000338998A (ja) * | 1999-03-23 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体 |
| JP2001007704A (ja) * | 1999-06-24 | 2001-01-12 | Matsushita Electric Ind Co Ltd | トーン成分データの適応オーディオ符号化方法 |
| WO2012144128A1 (ja) * | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3685823B2 (ja) * | 1993-09-28 | 2005-08-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
| JP5606457B2 (ja) | 2010-01-13 | 2014-10-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置および符号化方法 |
| WO2011132368A1 (ja) | 2010-04-19 | 2011-10-27 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法及び復号方法 |
| WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
| CN102959872A (zh) | 2010-07-05 | 2013-03-06 | 日本电信电话株式会社 | 编码方法、解码方法、装置、程序及记录介质 |
| US8924222B2 (en) * | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
-
2014
- 2014-07-25 WO PCT/JP2014/003930 patent/WO2015049820A1/ja not_active Ceased
- 2014-07-25 JP JP2015540364A patent/JP6400590B2/ja not_active Expired - Fee Related
-
2016
- 2016-03-08 US US15/063,529 patent/US9830919B2/en not_active Expired - Fee Related
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09106299A (ja) * | 1995-10-09 | 1997-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号変換符号化方法および復号化方法 |
| JP2000338998A (ja) * | 1999-03-23 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体 |
| JP2001007704A (ja) * | 1999-06-24 | 2001-01-12 | Matsushita Electric Ind Co Ltd | トーン成分データの適応オーディオ符号化方法 |
| WO2012144128A1 (ja) * | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2015049820A1 (ja) | 2017-03-09 |
| US20160189722A1 (en) | 2016-06-30 |
| JP6400590B2 (ja) | 2018-10-03 |
| US9830919B2 (en) | 2017-11-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7581265B2 (ja) | 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法 | |
| KR102055022B1 (ko) | 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 | |
| JP4272897B2 (ja) | 符号化装置、復号化装置およびその方法 | |
| JP6717746B2 (ja) | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 | |
| JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
| JPWO2012144128A1 (ja) | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 | |
| JP6400590B2 (ja) | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 | |
| KR102121642B1 (ko) | 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램 | |
| KR20160120713A (ko) | 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치 | |
| JP2019070823A (ja) | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 | |
| KR20130047630A (ko) | 통신 시스템에서 신호 부호화 장치 및 방법 | |
| HK40002240A (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| HK40002240B (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| HK1242832B (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| HK1242832A1 (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| HK40000355B (en) | Audio signal coding apparatus, audio signal decoding device, and methods thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14850301 Country of ref document: EP Kind code of ref document: A1 |
|
| ENP | Entry into the national phase |
Ref document number: 2015540364 Country of ref document: JP Kind code of ref document: A |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 14850301 Country of ref document: EP Kind code of ref document: A1 |