[go: up one dir, main page]

CN113077801B - 基于二维直方图的双声道音频可逆信息隐藏方法及系统 - Google Patents

基于二维直方图的双声道音频可逆信息隐藏方法及系统 Download PDF

Info

Publication number
CN113077801B
CN113077801B CN202110342881.5A CN202110342881A CN113077801B CN 113077801 B CN113077801 B CN 113077801B CN 202110342881 A CN202110342881 A CN 202110342881A CN 113077801 B CN113077801 B CN 113077801B
Authority
CN
China
Prior art keywords
histogram
prediction error
channel
information
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110342881.5A
Other languages
English (en)
Other versions
CN113077801A (zh
Inventor
马宾
侯金程
马睿和
徐建
王春鹏
李健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Tongyu Network Security Technology Co ltd
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN202110342881.5A priority Critical patent/CN113077801B/zh
Publication of CN113077801A publication Critical patent/CN113077801A/zh
Application granted granted Critical
Publication of CN113077801B publication Critical patent/CN113077801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了基于二维直方图的双声道音频可逆信息隐藏方法及系统,包括:获取可逆信息和双声道音频文件;对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;基于预测误差对,构建预测误差直方图;自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频。在提高嵌入容量的同时,降低了因为嵌入信息对原始样本的修改程度。实验表明,与现有的嵌入方法相比,在相同容量下该方法在音频保真度和容量方面都具有更好的嵌入性能。

Description

基于二维直方图的双声道音频可逆信息隐藏方法及系统
技术领域
本发明涉及音频处理技术领域,特别是涉及基于二维直方图的双声道音频可逆信息隐藏方法及系统。
背景技术
可逆数据隐藏(RDH)的目的是通过对被覆盖图像的像素进行轻微的修改,将秘密信息嵌入到被覆盖图像中,实现了数字隐写、秘密通信和版权保护等功能。更重要的是,它不仅可以将嵌入的数据完全提取出来,而且可以在不损坏的情况下恢复主机信号。因此,在军事、医疗等一些特殊领域,基于可逆数据隐藏的版权认证和隐蔽通信算法具有广阔的应用前景。
目前已经提出了许多RDH方法,如基于无损压缩的方法,基于差分展开的方法和基于直方图修正的方法。
其中,在利用无损压缩技术方面,Fridrich等人提出了第一种压缩Jpeg格式封面图像的RDH方案。Kalker和Willems提出了一种递归编码结构,以提高可逆数据隐藏在图像上的能力。Celik等人通过压缩图像像素的LSB平面,提出了一种无损压缩方法。并且基于此提出了一种无损(可逆)认证水印的新框架,该框架能够在验证后实现无水印图像的零失真重构,但是仍然存在存储容量小等不足之处。为了提高RDH算法的性能,Tian提出了基于一阶差分展开(DE)的方法。基于此思想,Alattar提出了一种将多个比特隐藏在矢量中相邻像素的差值的扩展中的RDH算法,饰演了更高的嵌入容量。Kamstra和Heijmans提出了对像素进行排序这一思想解决田方法中的容量控制问题,这可以自动创建足够的容量来嵌入所需的有效载荷,并保持较小的失真。Tai等人提出了基于最小有效位预测的提升方案和对Tian的差值扩展技术的改进,进一步改进了算法的性能。
同时,基于直方图的方法受到了广泛的关注。基于直方图的方法,通过移动特定的bin来创建空的空间,同时利用其他bin来填充空的空间来携带数据。这种方法可以很好地控制嵌入失真。第一种基于直方图的RDH方法是由Ni等人在中提出的。该方法利用像素值直方图的峰值点和最小值点进行数据嵌入。但是,它的嵌入容量值很低,如果封面图像的直方图是扁平的,这种方法就不能很好地工作。Lee等人提出利用差值直方图来代替。这种新方法利用了相邻像素之间的关系,与Ni等人的方法相比,可以嵌入更大的有效载荷并减少失真。随后,Fallahpour引入了一种修改预测误差直方图的方法。与差分直方图一样,预测误差直方图也是符合拉普拉斯分布,保证了良好的嵌入性能。然后,Tai等通过生成一个平坦的预测误差平面,进一步提高了直方图移位的嵌入性能。Hong在重基于直方图移位的可逆数据隐藏技术,修改了预测误差的直方图,为数据嵌入准备空位。该方法创新地利用了预测误差的修正,不仅有效载荷更大,而且生成的图像质量也优于以往的方法。
基于直方图的思想,最近,提出了两两预测误差扩展(pairwise PEE),差分映射,多直方图修正(MHM).利用两两配对的预测误差模型来挖掘预测误差之间的相关性。将每一个像素对中的两个预测错误都被组合为一个单元,然后根据专门设计的二维空间映射进行修改。充分利用图像内的复杂相关性。Li等人设计了一种新的可逆映射策略,是通过考虑每个像素对及其相邻像素对的相关性生成预测误差直方图,提升了算法的性能。之后根据不同局部复杂性的预测误差可能具有区别统计的特点,并且可以灵活修改对算法进行了改进。Chen等人则在考虑参数确定的基础上对性能进行了系统分析建立了一个新框架。通过解决多直方图的失真最小化,提出了一种改进的预测误差对方法实现自适应嵌入的方式,实验表明,该算法优于现有的算法。
近年来可逆数据隐藏技术发展迅速,可逆信息的载体由图像逐渐向音频和视频发展,由于音频拥有波动小,容量大,不易造成溢出,等优点,成为了优秀的可逆信息隐藏载体。Yan和Wang通过一个音频文件中以前相邻的音节对目标样本进行预测,并将秘密数据嵌入到预测误差中。由于对目标样本的预测只涉及前一个音节,仍有很大的改进余地。然后,Nishimura增加了目标样本附近的支持样本数量,并引入线性预测算法来提高目标样本的预测精度。Wang et al建立了相邻音频样本的线性预测和差分进化算法,用于目标样本值预测,进一步提高了预测精度,但计算复杂度也大大增加。与Yan等人对目标样本的预测只采用过去的邻近样本不同,Xiang采用目标样本前后的样本作为预测上下文进行误差预测,从而取得了较好的预测精度。Huang等人将秘密信息嵌入到离散余弦变换的系数中,从而在实现大规模秘密数据嵌入的同时最大限度地降低了音频文件的质量退化。此后,基于音频的RDH方案在中发展迅速,Xiang等人建立了自适应选择预测上下文的误差预测模型,大大提高了预测精度。但是,由于该算法需要更多的支持样本进行误差预测,对于大型音频文件,其时间复杂度较高。此后,Alin等人提出了一种基于PEE的音频文件高容量RDH算法。通过训练不同预测背景下的目标样本值预测算法,建立了高精度误差预测的最优预测模型。最近,Wu等人提出了一种新的基于立体声音频信号的RDH算法。Yu等进一步提出了另一种大容量RDH方案,采用magic matrix进行数据嵌入,音频文件的保真质量得到了提高。
发明内容
为了解决现有技术的不足,本发明提供了基于二维直方图的双声道音频可逆信息隐藏方法及系统;
第一方面,本发明提供了基于二维直方图的双声道音频可逆信息隐藏方法;
基于二维直方图的双声道音频可逆信息隐藏方法,包括:
获取可逆信息和双声道音频文件;
对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;
基于预测误差对,构建预测误差直方图;
自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频。
第二方面,本发明提供了基于二维直方图的双声道音频可逆信息隐藏系统;
基于二维直方图的双声道音频可逆信息隐藏系统,包括:
获取模块,其被配置为:获取可逆信息和双声道音频文件;
预测误差对构建模块,其被配置为:对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;
直方图构建模块,其被配置为:基于预测误差对,构建预测误差直方图;
隐藏模块,其被配置为:自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频。
第三方面,本发明还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
第四方面,本发明还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果是:
为了优化嵌入性能,本发明利用音频文件左右声道之间的相关性,构建预测误差二维直方图。其所获得的性能优于传统的基于预测误差扩展的可逆信息隐藏(Reversibledata hiding,RDH)算法。基于二维直方图的思想,本发明提出了一种基于双声道信息冗余的音频文件的RDH算法。在新算法中,本发明考虑到音频文件双声道之间的关联性和空间的冗余性,通过利用相同位置不同声道的元素来的得到预测误差对,通过构建基于双声道关联性的二维预测误差对直方图,根据生成的预测误差对直方图,自适应移动合适的直方图的bin嵌入信息,在提高嵌入容量的同时,降低了因为嵌入信息对原始样本的修改程度。实验表明,与现有的嵌入方法相比,在相同容量下该方法在音频保真度和容量方面都具有更好的嵌入性能。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例的方法流程图;
图2(a)~图2(d)为第一个实施例的左声道波形图和右声道波形图;
图3(a)~图3(b)为第一个实施例的截取的音频片段的波形图;
图4(a)~图4(d)为第一个实施例的实验音频文件的预测误差对二维直方图;
图5为第一个实施例的信息嵌入示意图;
图6为第一个实施例的音频文件库9种不同类型的音频文件的实验结果;
图7(a)~图7(i)为第一个实施例的本发明与另外两种算法对比示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例提供了基于二维直方图的双声道音频可逆信息隐藏方法;
如图1所示,基于二维直方图的双声道音频可逆信息隐藏方法,包括:
S101:获取可逆信息和双声道音频文件;
S102:对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;
S103:基于预测误差对,构建预测误差直方图;
S104:自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频。
作为一个或多个实施例,所述S101:获取可逆信息和双声道音频文件;
其中,可逆信息,是指将隐秘信息嵌入到载体音频中,当接收方接收到含密载体时,可以无损的提取出嵌入的隐秘信息,并且完全恢复原始载体音频。
双声道音频文件,包括:左声道音频文件和右声道音频文件。
作为一个或多个实施例,所述S102:对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;具体包括:
构建预测误差对
Figure GDA0003436293270000071
Figure GDA0003436293270000072
Figure GDA0003436293270000073
其中,xi-1和xi+1为左声道的音频样本xi两侧的样本,yi-1和yi+1为右声道的音频样本yi两侧的样本,
Figure GDA0003436293270000074
表示左声道的预测误差值,
Figure GDA0003436293270000075
表示右声道的预测误差值,i代表着声道上第i个音频样本,floor代表向下取整函数。
作为一个或多个实施例,所述S103:基于预测误差对,构建预测误差直方图;具体包括:
预测误差对
Figure GDA0003436293270000076
是一个二维数组,将
Figure GDA0003436293270000077
作为x轴上的值,将
Figure GDA0003436293270000078
作为y轴上的值,误差对
Figure GDA0003436293270000079
数量用z轴上数值来表示,由此得到一个二维直方图;
在二维直方图中,对于该直方图的一个柱子(单元),横轴方向的数值代表预测误差
Figure GDA00034362932700000710
的数值,纵轴方向的数值代表预测误差的
Figure GDA00034362932700000711
值,直方图柱子的高度代表误差对
Figure GDA00034362932700000712
的数量。
作为一个或多个实施例,所述S104:自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频;具体包括:
S1041:在生成的二维直方图中,筛选符合要求的直方图柱子,筛选原则是:筛选出直方图柱子高度H大于待嵌入信息容量M的直方图柱子;得到所筛选出来的直方图柱子对应的直方图单元坐标(a,b);假设待嵌入信息为m;
S1042:计算直方图单元坐标(a,b)右侧的所有直方图单元的数量nr、左侧的所有直方图单元的数量nl、上方的所有直方图单元的数量ns和下方的所有直方图单元的数量nx
S1043:比较右侧的所有直方图单元的数量nr、左侧的所有直方图单元的数量nl、上方的所有直方图单元的数量ns和下方的所有直方图单元的数量nx的大小,筛选出最小数量;其中,最小数量所对应的方向,即为直方图单元坐标(a,b)所对应的直方图柱子的最佳移动方向;
S1044:统计从直方图单元坐标(a,b)开始,沿着最佳移动方向,一直到直方图最边缘的所有直方图单元格;
将所有被统计的直方图单元格对应的直方图柱子,均朝着最佳移动方向移动一格;
将待嵌入信息m嵌入到直方图单元坐标(a,b)对应的单元格中。
在预测误差对构建的直方图中,直方图中的单元表示为(x,y),需要嵌入信息的直方图单元为(a,b),嵌入的秘密信息为m,为了更好的控制载体失真,分别计算直方图单元(a,b)右侧的直方图单元(a>0,y)、左侧的直方图单元(a<0,y)、上方的直方图单元(a,b>0)和下方的直方图单元(a,b<0)的数量分别记为nr、nl、ns和nx。其中,直方图单元坐标(a,b)右侧的所有直方图单元的数量为nr、左侧的所有直方图单元的数量为nl、上方的所有直方图单元的数量为ns和下方的所有直方图单元的数量为nx;需要嵌入秘密信息表示为m,嵌入信息后,经过移动后的直方图单元表示为(x′,y′)。
若min(nr,nl,ns,nx)=nr
Figure GDA0003436293270000091
若min(nr,nl,ns,nx)=nl
Figure GDA0003436293270000092
若min(nr,nl,ns,nx)=ns
Figure GDA0003436293270000093
若min(nr,nl,ns,nx)=nx
Figure GDA0003436293270000094
通过上述公式min(nr,nl,ns,nx)选取出最佳的移动方向,在移动同一个直方图单元的时候,移动的方向直方图单元总数最少的一侧,这样保证在嵌入相同的信息时,所需要修改的样本点的数量最少,最小化载体失真。
如果待嵌入信息的直方图柱子在坐标轴上,就可以由下面两个公式只移动坐标轴上的直方图单元。如由于音频文件相互关联的特性,在二维直方图中,预测误差对的范围集中在坐标轴附近,由二维直方图可以清晰看出,在坐标轴原点附近的直方图单元远远高于其余非坐标轴位置的直方图单元,一般只需要移动坐标轴上的直方图单元进行嵌入,为了更好的与其余算法对比,我们只将信息嵌入到左声道当中,规定直方图单元的移动方向为左右移动,假定需要嵌入的直方图单元是(a,0)位置的直方图单元,直方图中的单元表示为(x,y),需要嵌入的信息为m;
当a≥0时,则有以下移动公式:
Figure GDA0003436293270000101
当a<0时,则有以下移动公式:
Figure GDA0003436293270000102
在生成的二维直方图中,根据嵌入信息的容量大小来选择高度高于容量大小的直方图单元进行移动,假定需要嵌入左声道的二进制信息大小是mbit,则在生成的直方图中,寻找高度大于m的直方图单元,并在这些高度大于m的直方图单元中选取高度最小的一个作为扩展的直方图单元并计算该直方图单元左右两侧需要移动的直方图数量,选择移动数量最小的方向来移动直方图空出空间,用于信息的嵌入。
目前大多数基于音频的可逆信息隐藏算法(RDH)是利用预测算法计算出原始样本值与预测值的预测误差,通过误差一维直方图分布将需要嵌入的隐秘嵌入到载体中,从而实现可逆信息隐藏。然而,在研究中发现,二维直方图可以更好的利用冗余性嵌入信息,达到更好的嵌入性能,到目前为止,很多的音频RDH算法被提出,但是针对于音频文件的二维直方图的研究较少。
为了优化嵌入性能,本发明利用音频文件左右声道之间的相关性,构建预测误差二维直方图。其所获得的性能优于传统的基于预测误差扩展的RDH(reversibledatahiding)算法。
基于二维直方图的思想,本发明提出了一种基于双声道信息冗余的音频文件的RDH算法。在新算法中,本发明考虑到音频文件双声道之间的关联性和空间的冗余性,通过利用相同位置不同声道的元素来的得到预测误差对,通过构建基于双声道关联性的二维预测误差对直方图,根据生成的预测误差对直方图,自适应移动合适的直方图的bin嵌入信息,在提高嵌入容量的同时,降低了因为嵌入信息对原始样本的修改程度。实验表明,与现有的嵌入方法相比,在相同容量下该方法在音频保真度和容量方面都具有更好的嵌入性能。
本发明提出了一种基于双声道信息冗余的音频文件的可逆信息隐藏算法。首先,通过考虑音频不同声道之间存在的相关性和冗余度,对同一相同位置不同声道的元素利用奇偶预测方法计算出对应的预测误差,组成预测误差对,然后构建基于预测误差的二维直方图,根据生成的二维预测误差直方图,自适应移动合适的利用直方图的特点进行嵌入,以最大程度的降低嵌入失真,提升了算法的性能。
当今流行的音频大部分是立体声音频,因为立体声音频中含有两个甚至多个声音采集通道可以展现比单声道更丰富的声音信息,呈现出来的场景和自然感觉比普通的单声道音频更具有代入性,所以双声道音频信息隐藏有着重要的研究价值。本发明在实验使用的音频库中随机选取2个标准立体声音频文件并作出左右声道对应的波形图如图2(a)~图2(d)所示。
由图3(a)~图3(b)可以看到,虽然2个音频文件左右声道看上去差别不大,波形趋势基本相似,但是存在左右声道部分样本区域差异较大的情况。由此本发明随机截取上述4个音频文件的部分片段画出图形图如图3(a)~图3(b)所示并给出具体分析。从图3(a)~图3(b)中可以更具体的观察到音频左右声道波形的变换曲线,可以看出左右声道两种不同的波形曲线峰值处的样本值差异较大,但是其对应的波形变化梯度和形状相似程度高。
为了更具体的表示不同声道的相关性,本发明计算数据库中每种类型随机选择的9种立体声音频文件来计算其相关性系数,计算方法如公式(3)所示:
Figure GDA0003436293270000121
在公式(3)种,L是左声道信号,R是右声道。n是立体声音频的长度。相关系数r在表1中列出,该表显示了大多数音频文件中左右两个声道之间的具有较强的相关性。
表1九个音频片段的相关系数
片段名 声道之间相关性
Clip 01 0.9999
Clip 04 0.9999
Clip 20 0.6754
Clip 44 0.7272
Clip 53 0.9999
Clip 59 0.7015
Clip 62 0.7088
Clip 65 0.5310
Clip 70 0.9853
由此本发明在单声道可逆信息隐藏算法的基础上充分利用双声道音频关联性强的特点,利用左右声道相同位置的样本进行预测来构建预测误差对二维直方图,可以有效提高预测精度。如表2所示,其中Left一行为左声道其中截取的9个音频样本,Left-error一行为利用非因果预测计算出来的预测误差值,Left–pair为利用左声道的预测误差构建的预测误差对;Right一行为右声道其中截取的9个音频样本,Right-error为利用奇偶预测计算出来的预测误差值;Right–pair为利用左声道的预测误差构建的预测误差对;pair为利用左右声道结合构建的预测误差对。
表2实例计算预测误差
Figure GDA0003436293270000131
由表2可以看出,在单独利用左声道和右声道预测误差构建的预测误差对(0,2)、(0,0)、(1,0)和(0,3)、(0,0)、(-1,0)6个误差对中,只有2个误差对在(0,0)bin上。
在结合左声道和右声道预测误差共同构建的预测误差对(0,0)、(2,3)、(0,0)、(0,0)、(1,-1)和(0,0)6个误差对中,存在4个误差对在(0,0)bin上,这样就为嵌入信息增加了更多的嵌入位。
这是因为虽然左右声道相同位置的样本值差距较大,如果只利用左右声道的原始样本值或者只利用一个声道的预测误差值构建预测误差对,会造成预测误差对在二维直方图中分布较散,符合嵌入的直方图的bin数量较少。
由于两个声道具有一定的相关性,样本值变化趋势相似,这就决定了两个声道虽然数值不同,但是利用相同的预测误差方法对两个声道同时计算得出的预测误差在很大程度上时接近或者相同的,所以本发明采用两个声道共同构建预测误差对,来提升嵌入性能。
本发明利用左右声道相关性在左右双声道相同位置利用奇偶预测,构建预测误差对
Figure GDA0003436293270000141
Figure GDA0003436293270000142
Figure GDA0003436293270000143
其中xi-1和xi+1为左声道的音频样本xi两侧的样本,其中yi-1和yi+1为右声道的音频样本yi两侧的样本。分别对两侧相同位置的样本进行预测,求出预测误差,构建预测误差直方图His。
根据上述方法,这里以Clip20、Clip21、Clip22、Clip23为例子,下面图4(a)-图4(d)分别为Clip20、Clip21、Clip22和Clip23的预测误差对二维直方图。
如图4(a)-图4(d)所示,由生成的二维预测误差直方图可以清楚看到,(0,0)所代表的bin具有很高的占比率,数量明显高于其余的bin,所以本发明移动最高占比的bin来进行嵌入信息。而且由于在二维直方图移动的过程中,bin的移动方向控制在平行向左或者向右。这样有两个好处:
(1)由于是二维直方图分布,在移动(0,0)这个bin携带隐秘信息嵌入的时候,只需要移动(x,0)的所有bin,减少了移动bin的数量,降低了对样本的修改程度,因为在传统的直方图中,当移动0bin时需要将0bin右侧的所有的bin都进行移动,这样会增大对样本的修改程度;
(2)控制bin的移动方向只向左或者向右,保证了在嵌入信息的过程中,只对一个声道的预测误差值进行修改,另外一个声道的预测误差值作为辅助信息,用来构建二维直方图在很小容量时,可以通过计算,移动合适的bin,来控制嵌入容量,减小对样本的改变。具体的移动策略如图5所示。
如图5所示,横轴ex代表着左声道的预测误差值,纵轴ey代表着右声道的预测误差值,灰点为移动点,可以移动为嵌入留出空间,黑点为嵌入点,可以携带隐秘信息进行嵌入。水平箭头移动方向为对于左声道样本进行改变嵌入信息,将纵轴上的黑色点通过水平箭头的方向进行左右移动,其右侧和左侧灰色的样本对点进行相应移动为纵轴黑色点嵌入信息预留出空间。而当需要将信息嵌入到右侧声道时,可以根据上述图5中垂直箭头的指示方向对横轴上的黑色点进行上下方向的移动,将隐秘信息嵌入到右声道中。
在一个二维直方图,由于本发明需要嵌入的信息0和1一般为均匀分布,对于样本值的最大修改程度为1,所以对于原始音频文件修改程度的一般期望值为Nembed/2+Nshift,最大为Nembed+Nshift,其中Nembed为图5中黑色的样本对点,携带信息进行嵌入使用,Nshift为移动的样本,不携带信息。可用于嵌入的样本对的占比可以用公式(5)所示,
Figure GDA0003436293270000151
公式(5)在一定程度上显示了嵌入算法的性能,对于一个由预测误差对构建的二维直方图,其占比率越大,说明用于嵌入的样本对的数量越多,对于原始的载体音频修改程度会更小,就会有更好的嵌入性能。显然,对于本发明的方法,根据图5,可将公式(5)转化为下面的表达:
Figure GDA0003436293270000152
M(ex,ey)为样本对(ex,ey)的数量,这个公式代表在形成的二维直方图中,初步可用于嵌入的样本对所占的比例,值越大代表着满足条件的样本值的数量越多,嵌入效果越好。
实验中,在采样率为44.1kHz的70个标准音频文件,上针对于不同类型音频文件评估了这两种方法的性能。文件库的音频文件类型包含:校准信号(1-2),人工信号(3-7),单一仪器(8-43),声音(44-48),演讲(49-54),独奏乐器(55-60),声乐乐团(61-64年),乐团(65-68),和流行音乐(69-70)一共九种不同的类型。采用信噪比(SNR)这个指标来评估嵌入方案对音频文件造成的(可逆)失真。为了更好验证本发明算法对于不同类型的音频文件的性能,由于不同的音频文件之间音调、平滑程度差别很大,为了更好验证本发明算法的适用程度,本部分实验分别对9种类型的所有音频文件进行实验,并求出出不同类型的平均实验结果的SNR值,其信噪比(SNR)-嵌入容量(EC)对比结果如图6所示。
在实验结果图6中,横轴为嵌入容量(bits),纵轴为对应的信噪比数值(SNR)。本发明可以清楚的看出,在相同嵌入容量下,Type2所属的音频文件的嵌入效果远远优于其余算法,这是因为Type2为人工信号类型,平滑程度较好,利用预测算法对原始样本进行预测的过程中,预测精度高于其余类型的实验文件,计算出的误差数值较小。在嵌入过程中,对样本的修改程度远远小于其余8种类型,所以在相同的嵌入容量下SNR值远远高于其余八种类型。
在本发明所有的实验中,秘密信息位都是随机生成的。为了评估所提出方案的容量失真性能,将所提出的算法与其在2012年的PEE经典算法和的2017年方案中的音频RDH框架进行比较。
在原始音频和嵌入信息后的音频之间计算出的信噪比SNR用作评估失真性能的一种措施。该实验是在70种标准音频文件(采样率为44.1kHz)上评估了这三种方法的性能。由于实验数据庞大,为了更好的验证本发明算法对于所有音频文件的适用性,对每种类型的音频文件随机选取一个实验结果,图7(a)~图7(i)选取了9种类型的音频文件的9个详细实验结果,进行说明解释。
测试结果如图7(a)~图7(i)所示,其中水平轴代表嵌入容量(bit),垂直轴代表SNR值。从图7(a)~图7(i)中可以看出,在相同嵌入率的情况下,通过本发明的方法获得的SNR值,比其余两种方法高,这意味着所提出的算法通常可以实现更好的听觉质量,这是因为在利用双声道关联性构建的预测误差对,成功的将大部分符合条件的误差对进行集中,在对于非嵌入条件的样本的移动数量远远小于其余两种算法,所以在嵌入信息的时候修改的样本数量少,所以音频的保真度更高。
针对于音频文件双声道之间的关联性和存在的空间冗余性,通过利用相同位置不同声道的样本,利用奇偶预测方法预测目标样本值从而构建预测误差对,生成基于预测误差对的二维直方图,通过构建基于双声道关联性的二维预测误差对直方图,移动合适的直方图的bin嵌入信息,为信息的嵌入留出空间,在提高嵌入容量的同时,这些策略有效降低移动bin对原始样本带来的改变程度。实验表明,与现有的嵌入方法相比,在相同容量下该方法在音频保真度和容量方面都具有更好的嵌入性能。提高了音频文件的保真度,进一步提升了算法的性能。
实施例二
本实施例提供了基于二维直方图的双声道音频可逆信息隐藏系统;
基于二维直方图的双声道音频可逆信息隐藏系统,包括:
获取模块,其被配置为:获取可逆信息和双声道音频文件;
预测误差对构建模块,其被配置为:对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;
直方图构建模块,其被配置为:基于预测误差对,构建预测误差直方图;
隐藏模块,其被配置为:自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频。
此处需要说明的是,上述获取模块、预测误差对构建模块、直方图构建模块和隐藏模块对应于实施例一中的步骤S101至S104,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.基于二维直方图的双声道音频可逆信息隐藏方法,其特征是,包括:
获取可逆信息和双声道音频文件;
对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;
基于预测误差对,构建预测误差直方图;
自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频;
对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;具体包括:
构建预测误差对
Figure FDA0003449366210000011
Figure FDA0003449366210000012
Figure FDA0003449366210000013
其中,xi-1和xi+1为左声道的音频样本xi两侧的样本,yi-1和yi+1为右声道的音频样本yi两侧的样本,
Figure FDA0003449366210000014
表示左声道的预测误差值,
Figure FDA0003449366210000015
表示右声道的预测误差值,i代表着声道上第i个音频样本,floor代表向下取整函数;
基于预测误差对,构建预测误差直方图;具体包括:
预测误差对
Figure FDA0003449366210000016
是一个二维数组,将
Figure FDA0003449366210000017
作为x轴上的值,将
Figure FDA0003449366210000018
作为y轴上的值,误差对
Figure FDA0003449366210000019
数量用z轴上数值来表示,由此得到一个二维直方图;
在二维直方图中,对于该直方图的一个柱子(单元),横轴方向的数值代表预测误差
Figure FDA00034493662100000110
的数值,纵轴方向的数值代表预测误差的
Figure FDA00034493662100000111
值,直方图柱子的高度代表误差对
Figure FDA0003449366210000021
的数量;
自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频;具体包括:
在生成的二维直方图中,筛选符合要求的直方图柱子,筛选原则是:筛选出直方图柱子高度H大于待嵌入信息容量M的直方图柱子;得到所筛选出来的直方图柱子对应的直方图单元坐标(a,b);假设待嵌入信息为m;
计算直方图单元坐标(a,b)右侧的所有直方图单元的数量nr、左侧的所有直方图单元的数量nl、上方的所有直方图单元的数量ns和下方的所有直方图单元的数量nx
比较右侧的所有直方图单元的数量nr、左侧的所有直方图单元的数量nl、上方的所有直方图单元的数量ns和下方的所有直方图单元的数量nx的大小,筛选出最小数量;其中,最小数量所对应的方向,即为直方图单元坐标(a,b)所对应的直方图柱子的最佳移动方向;
统计从直方图单元坐标(a,b)开始,沿着最佳移动方向,一直到直方图最边缘的所有直方图单元格;将所有被统计的直方图单元格对应的直方图柱子,均朝着最佳移动方向移动一格;将待嵌入信息m嵌入到直方图单元坐标(a,b)对应的单元格中。
2.如权利要求1所述的基于二维直方图的双声道音频可逆信息隐藏方法,其特征是,获取可逆信息和双声道音频文件;
其中,可逆信息,是指将隐秘信息嵌入到载体音频中,当接收方接收到含密载体时,无损提取出嵌入的隐秘信息,并且完全恢复原始载体音频。
3.如权利要求1所述的基于二维直方图的双声道音频可逆信息隐藏方法,其特征是,在生成的二维直方图中,根据嵌入信息的容量大小来选择高度高于容量大小的直方图单元进行移动,假定需要嵌入左声道的二进制信息大小是mbit,则在生成的直方图中,寻找高度大于m的直方图单元,并在这些高度大于m的直方图单元中选取高度最小的一个作为扩展的直方图单元并计算该直方图单元左右两侧需要移动的直方图数量,选择移动数量最小的方向来移动直方图空出空间,用于信息的嵌入。
4.基于二维直方图的双声道音频可逆信息隐藏系统,其特征是,包括:
获取模块,其被配置为:获取可逆信息和双声道音频文件;
预测误差对构建模块,其被配置为:对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;
直方图构建模块,其被配置为:基于预测误差对,构建预测误差直方图;
隐藏模块,其被配置为:自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频;
对于不同声道相同位置的元素,分别计算出左声道的预测误差值和右声道的预测误差值;基于左声道的预测误差值和右声道的预测误差值,构建预测误差对;具体包括:
构建预测误差对
Figure FDA0003449366210000031
Figure FDA0003449366210000032
Figure FDA0003449366210000033
其中,xi-1和xi+1为左声道的音频样本xi两侧的样本,yi-1和yi+1为右声道的音频样本yi两侧的样本,
Figure FDA0003449366210000034
表示左声道的预测误差值,
Figure FDA0003449366210000035
表示右声道的预测误差值,i代表着声道上第i个音频样本,floor代表向下取整函数;
基于预测误差对,构建预测误差直方图;具体包括:
预测误差对
Figure FDA0003449366210000041
是一个二维数组,将
Figure FDA0003449366210000042
作为x轴上的值,将
Figure FDA0003449366210000043
作为y轴上的值,误差对
Figure FDA0003449366210000044
数量用z轴上数值来表示,由此得到一个二维直方图;
在二维直方图中,对于该直方图的一个柱子(单元),横轴方向的数值代表预测误差
Figure FDA0003449366210000045
的数值,纵轴方向的数值代表预测误差的
Figure FDA0003449366210000046
值,直方图柱子的高度代表误差对
Figure FDA0003449366210000047
的数量;
自适应移动预测误差直方图,进行可逆信息的嵌入,得到隐藏可逆信息的双声道音频;具体包括:
在生成的二维直方图中,筛选符合要求的直方图柱子,筛选原则是:筛选出直方图柱子高度H大于待嵌入信息容量M的直方图柱子;得到所筛选出来的直方图柱子对应的直方图单元坐标(a,b);假设待嵌入信息为m;
计算直方图单元坐标(a,b)右侧的所有直方图单元的数量nr、左侧的所有直方图单元的数量nl、上方的所有直方图单元的数量ns和下方的所有直方图单元的数量nx
比较右侧的所有直方图单元的数量nr、左侧的所有直方图单元的数量nl、上方的所有直方图单元的数量ns和下方的所有直方图单元的数量nx的大小,筛选出最小数量;其中,最小数量所对应的方向,即为直方图单元坐标(a,b)所对应的直方图柱子的最佳移动方向;
统计从直方图单元坐标(a,b)开始,沿着最佳移动方向,一直到直方图最边缘的所有直方图单元格;将所有被统计的直方图单元格对应的直方图柱子,均朝着最佳移动方向移动一格;将待嵌入信息m嵌入到直方图单元坐标(a,b)对应的单元格中。
5.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1-3任一项所述的方法。
6.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-3任一项所述的方法。
CN202110342881.5A 2021-03-30 2021-03-30 基于二维直方图的双声道音频可逆信息隐藏方法及系统 Active CN113077801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110342881.5A CN113077801B (zh) 2021-03-30 2021-03-30 基于二维直方图的双声道音频可逆信息隐藏方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110342881.5A CN113077801B (zh) 2021-03-30 2021-03-30 基于二维直方图的双声道音频可逆信息隐藏方法及系统

Publications (2)

Publication Number Publication Date
CN113077801A CN113077801A (zh) 2021-07-06
CN113077801B true CN113077801B (zh) 2022-02-22

Family

ID=76611892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110342881.5A Active CN113077801B (zh) 2021-03-30 2021-03-30 基于二维直方图的双声道音频可逆信息隐藏方法及系统

Country Status (1)

Country Link
CN (1) CN113077801B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150325246A1 (en) * 2014-05-06 2015-11-12 University Of Macau Reversible audio data hiding
CN108447492A (zh) * 2018-03-13 2018-08-24 中山大学 一种基于分段的自适应直方图平移可逆信息隐藏方法
CN111816195A (zh) * 2020-07-03 2020-10-23 宁波大学 一种音频可逆隐写方法、秘密信息提取及载体音频恢复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150325246A1 (en) * 2014-05-06 2015-11-12 University Of Macau Reversible audio data hiding
CN108447492A (zh) * 2018-03-13 2018-08-24 中山大学 一种基于分段的自适应直方图平移可逆信息隐藏方法
CN111816195A (zh) * 2020-07-03 2020-10-23 宁波大学 一种音频可逆隐写方法、秘密信息提取及载体音频恢复方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《A reversible data hiding algorithm for audio files based on code division multiplexing》;Bin Ma et al.;《Multimedia Tools and Applications》;20210208;第17569-17581页 *
《基于二维直方图修改的JPEG图像可逆信息隐藏》;陆兴等;《网络空间安全》;20190831;第10卷(第8期);第55-64页 *
《高保真的可逆信息隐藏》;欧博;《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》;20141215(第12期);第71-90页 *

Also Published As

Publication number Publication date
CN113077801A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
JP7147948B2 (ja) 音声処理装置および方法、並びにプログラム
CN112333348B (zh) 一种基于预测误差的可逆数据隐藏方法及系统
Ding et al. Reversible image data hiding based on scalable difference expansion
CN110363068B (zh) 一种基于多尺度循环生成式对抗网络的高分辨行人图像生成方法
CN115131188A (zh) 一种基于生成对抗网络的鲁棒图像水印方法
CN110232650B (zh) 一种彩色图像水印嵌入方法、检测方法及系统
Peng et al. Reversible data hiding based on RSBEMD coding and adaptive multi-segment left and right histogram shifting
CN106097241B (zh) 基于八邻域像素的可逆信息隐藏方法
TW548990B (en) Fast motion estimation method using N-queen pixel decimation
CN115049715B (zh) 基于纹理融合特征块匹配和大嵌入率乘积码的图像隐写方法
CN114862645B (zh) 基于U-Net网络与DFT最优质量半径结合的抗打印数字水印方法及装置
CN116029887A (zh) 一种基于小波神经网络的图像大容量鲁棒水印方法
CN115018733B (zh) 一种基于生成对抗网络的高动态范围成像及鬼影去除方法
CN102075283B (zh) 一种信息隐写方法及装置
CN113077801B (zh) 基于二维直方图的双声道音频可逆信息隐藏方法及系统
Li et al. Multi-modality ensemble distortion for spatial steganography with dynamic cost correction
CN116723305A (zh) 一种基于生成式对抗网络的虚拟视点质量增强方法
Mao et al. Reversible data hiding of color image based on channel unity embedding: N. Mao et al.
CN119599915B (zh) 一种基于双分支频率与空间融合的轻量化社交平台图像复原方法、系统及可读存储介质
CN120689676A (zh) 基于lm-yolo的轻量级交通目标检测方法、设备及介质
CN108876691B (zh) 自适应可逆水印方法及系统
Song et al. Reversible data hiding based on directional prediction and multiple histograms modification
CN116934647A (zh) 基于空间角度可变形卷积网络的压缩光场质量增强方法
CN116389650A (zh) 基于预测误差修正和自适应优化映射的可逆数据隐藏方法
CN114565499B (zh) 一种基于图像纹理引导预测的可逆信息隐藏方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240408

Address after: Room 301, No. 59-9, Wenhua Middle Road, Huancui District, Weihai City, Shandong 264200

Patentee after: Shandong Tongyu Network Security Technology Co.,Ltd.

Country or region after: China

Address before: 250353 University Road, Changqing District, Ji'nan, Shandong Province, No. 3501

Patentee before: Qilu University of Technology

Country or region before: China