RU2390054C2 - Method of identifying audio file containing digital watermark - Google Patents
Method of identifying audio file containing digital watermark Download PDFInfo
- Publication number
- RU2390054C2 RU2390054C2 RU2008126588/09A RU2008126588A RU2390054C2 RU 2390054 C2 RU2390054 C2 RU 2390054C2 RU 2008126588/09 A RU2008126588/09 A RU 2008126588/09A RU 2008126588 A RU2008126588 A RU 2008126588A RU 2390054 C2 RU2390054 C2 RU 2390054C2
- Authority
- RU
- Russia
- Prior art keywords
- format
- audio file
- digital
- wavelet transform
- converted
- Prior art date
Links
Images
Landscapes
- Complex Calculations (AREA)
- Facsimile Transmission Control (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimiles In General (AREA)
Abstract
Description
Изобретение относится к области стеганографии, а именно к способам идентификации звуковых файлов (ЗФ), содержащих цифровой водяной знак (ЦВЗ), и может быть использовано для поиска ЗФ различных форматов, содержащих дополнительную цифровую информацию в виде ЦВЗ в условиях отсутствия априорных сведений о законе ее встраивания и присутствии в ЗФ.The invention relates to the field of steganography, and in particular to methods for identifying sound files (PF) containing a digital watermark (CEH), and can be used to search for PF of various formats containing additional digital information in the form of a CEH in the absence of a priori information about its law embedding and presence in the SF.
Известен способ идентификации ЗФ, содержащих ЦВЗ (См. Özer Н., Avcibas I., Memon N., Sankur В., "Detection of audio covert channels using statistical footprints of hidden messages", Digital Signal Processing 16, 2006, p.389-401), включающий этап встраивания в звуковой сигнал дополнительной информации в виде ЦВЗ, этап фильтрации звукового сигнала в области вейвлет-преобразования, этап вычисления метрик качества звукового сигнала, этап формирования вектора признаков, этап обучения классификатора и этап классифицирования.A known method for identifying PFs containing CEHs (See Özer N., Avcibas I., Memon N., Sankur B., "Detection of audio covert channels using statistical footprints of hidden messages", Digital Signal Processing 16, 2006, p.389 -401), which includes the step of embedding additional information in the form of a CEH into the sound signal, the step of filtering the sound signal in the wavelet transform domain, the step of calculating the sound signal quality metrics, the step of generating the feature vector, the classifier training step, and the classification step.
Недостатками указанного способа являются низкая вероятность правильной идентификации и отсутствие возможности анализа ЗФ сжатых форматов.The disadvantages of this method are the low probability of correct identification and the inability to analyze ZF compressed formats.
Наиболее близким по технической сущности к заявляемому изобретению (прототипом) является способ идентификации цифрового изображения, содержащего ЦВЗ (см. Патент РФ №2304306, кл. МПК G06K 9/00, опубл. в 2006 г.), заключающийся в том, что в документ встраивают дополнительную информацию, состоящую из двух типов ЦВЗ, выполняют многоуровневое дискретное вейвлет-преобразование, вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования, затем формируют собственный характеристический вектор, при этом в режиме "обучение" формируют массив собственных характеристических векторов изображений из обучающей выборки, обучают классификатор, а в режиме "анализ" осуществляют классифицирование изображения.The closest in technical essence to the claimed invention (prototype) is a method for identifying a digital image containing a CEH (see RF Patent No. 2304306, class IPC G06K 9/00, published in 2006), which consists in the fact that the document embed additional information consisting of two types of CEHs, perform multilevel discrete wavelet transform, calculate high-order statistical characteristics from the distribution of wavelet coefficients at different levels of wavelet transform, then form their own character -terrorist vector, wherein in the "training" form an array of characteristic vectors from the training set of images, trained classifier, and in the "Analysis", classification is carried out images.
Недостатком известного способа является отсутствие возможности идентификации ЗФ, содержащих ЦВЗ.The disadvantage of this method is the lack of identification of ZF containing CEH.
Техническим результатом, на достижение которого направлено изобретение, является разработка способа идентификации звуковых файлов, содержащих цифровой водяной знак, обеспечивающего возможность анализа ЗФ как сжатых, так и несжатых форматов, при этом вероятность правильной идентификации должна быть не ниже, чем у прототипа.The technical result to which the invention is directed is the development of a method for identifying sound files containing a digital watermark, providing the ability to analyze ZF both compressed and uncompressed formats, while the probability of correct identification should not be lower than that of the prototype.
Технический результат достигается тем, что в известном способе идентификации цифрового изображения, содержащего ЦВЗ, заключающемся в том, что в документ встраивают дополнительную информацию, состоящую из двух типов ЦВЗ, выполняют многоуровневое дискретное вейвлет-преобразование, вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования, затем формируют собственный характеристический вектор, при этом в режиме "обучение" формируют массив собственных характеристических векторов изображений из обучающей выборки, обучают классификатор, а в режиме "анализ" осуществляют классифицирование изображения, дополнительно, после встраивания в ЗФ дополнительной информации, состоящей из двух типов ЦВЗ, определяют формат ЗФ, если формат сжатый, то выполняют коммутацию на декодер, при этом в декодере осуществляют преобразование сжатого звукового файла в аналоговый сигнал, после чего в цифровом измерительном устройстве считывания осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала, если формат несжатый, то выполняют коммутацию на блок дискретного многоуровневого вейвлет-преобразования.The technical result is achieved by the fact that in the known method of identifying a digital image containing a CEH, which consists in the fact that additional information consisting of two types of CEH is embedded in a document, a multi-level discrete wavelet transform is performed, high-order statistical characteristics are calculated from the distribution of wavelet coefficients at different levels of the wavelet transform, then they form their own characteristic vector, while in the "training" mode they form an array of their own hara the characteristic vectors of images from the training set, the classifier is trained, and in the “analysis” mode, the images are classified, in addition, after embedding additional information consisting of two types of CEH in the SF, the format of the SF is determined, if the format is compressed, then commutation to the decoder is performed, when this, the decoder performs the conversion of the compressed audio file into an analog signal, and then in the digital reading device, the voltage of the input analog signal is converted to digital pulses, which are converted into a code corresponding to the value of the input signal voltage, if the format is uncompressed, then they are switched to a discrete multilevel wavelet transform block.
Благодаря новой совокупности существенных признаков в способе реализована возможность идентификации звуковых файлов как сжатых (МР3, WMA), так и несжатых (WAV, PCM) форматов, содержащих ЦВЗ, при отсутствии априорных сведений о наличии ЦВЗ в ЗФ и законе его встраивания.Due to the new set of essential features in the method, it is possible to identify sound files of both compressed (MP3, WMA) and uncompressed (WAV, PCM) formats containing CEH, in the absence of a priori information about the presence of CEH in the ZF and the law of its embedding.
Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности «новизна».The analysis of the prior art made it possible to establish that analogues that are characterized by a combination of features identical to all the features of the claimed technical solution are absent, which indicates the compliance of the claimed method with the condition of patentability “novelty”.
Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность отличительных существенных признаков, обусловливающих тот же технический результат, который достигнут в заявляемом способе. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».Search results for known solutions in this and related fields of technology in order to identify features that match the distinctive features of the claimed object from the prototype showed that they do not follow explicitly from the prior art. The prior art also did not reveal the fame of the distinctive essential features that determine the same technical result, which was achieved in the claimed method. Therefore, the claimed invention meets the condition of patentability "inventive step".
Заявленный способ поясняется чертежами, на которых показано:The claimed method is illustrated by drawings, which show:
фиг.1 - общая схема реализации способа идентификации ЗФ, содержащего цифровой водяной знак;figure 1 is a General diagram of a method for identifying a ZF containing a digital watermark;
фиг.2 - график вероятности правильной идентификации ЗФ, содержащих ЦВЗ, в результате работы заявляемого способа.figure 2 is a graph of the probability of correct identification of SFs containing CEH, as a result of the operation of the proposed method.
Заявленный способ, схема которого представлена на фиг.1, осуществляют в два этапа, называемых "обучение" и "анализ". Этап "обучения" реализуется за счет того, что сначала с помощью блока 1 формируют обучающую выборку, включающую звуковые файлы, содержащие встроенные случайным образом ЦВЗ, затем с помощью блока 2 определяют формат ЗФ. Если формат сжатый, то посредством блока 3 выполняют коммутацию на декодер 4. В декодере осуществляется преобразование сжатого звукового файла в аналоговый сигнал. Данное устройство реализуется на основе однокристального цифрового аудиодекодера AT85C51SND3B3. С выхода декодера аналоговый сигнал поступает в цифровое измерительное устройство считывания 5, схема которого известна и описана в книге Б.Я.Авдеева, Е.М.Антонюка, Е.М.Душина «Основы метрологии и электрические измерения: учебник для вузов» под ред. Е.М.Душина. - 6-е изд., перераб. и доп. - Л.: Энергоатомиздат. Ленингр. отд-ние, 1987. - 480 с.: ил. (с.255, рис.8-34). При этом осуществляют преобразование напряжения входного аналогового сигнала в цифровые импульсы, которые преобразуют в код, соответствующий значению напряжения входного сигнала. Если формат ЗФ не является сжатым, то осуществляют коммутацию на блок дискретного многоуровневого вейвлет-преобразования 6. В блоке 6 оцифрованный сигнал подвергают многоуровневому одномерному дискретному вейвлет-преобразованию (необходимо не менее пяти уровней вейвлет-преобразования) с использованием биортогональных низкочастотного (НЧ) и высокочастотного (ВЧ) фильтров (Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. - С.-Петербург: Военный университет связи, 1999, с.42-49). Рекомендуется использовать фильтры с коэффициентами согласно таблице 1.The claimed method, the scheme of which is presented in figure 1, is carried out in two stages, called "training" and "analysis". The “learning” stage is implemented due to the fact that first, using the
Затем в блоке 7 вычисляют статистические характеристики высоких порядков из распределения вейвлет-коэффициентов на разных уровнях вейвлет-преобразования. Данными статистическими характеристиками являются выборочное среднее, выборочная дисперсия, асимметрия, эксцесс и центральные моменты четного порядка с четвертого по тридцатый (Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. Учеб. пособие для втузов. - 2-е изд., стер. - М.: Высш. шк., 2000. - 480 с.: ил., с.111-121), которые определяют по формулам (1, 2, 3, 4, 5) соответственно.Then, in block 7, high-order statistical characteristics are calculated from the distribution of wavelet coefficients at different levels of the wavelet transform. These statistical characteristics are sample mean, sample variance, asymmetry, excess and central moments of even order from the fourth to the thirtieth (Ventzel E.S., Ovcharov L.A. Probability theory and its engineering applications. Textbook for technical colleges. - 2- e ed., ster. - M .: Higher school, 2000. - 480 pp .: ill., pp. 111-121), which are determined by the formulas (1, 2, 3, 4, 5), respectively.
где - выборочное среднее;Where - sample mean;
n - количество коэффициентов данного уровня вейвлет-преобразования.n is the number of coefficients of a given wavelet transform level.
где DB - выборочная дисперсия;where D B is the sample variance;
n - количество коэффициентов данного уровня вейвлет-преобразования.n is the number of coefficients of a given wavelet transform level.
где AS - асимметрия теоретического распределения;where A S is the asymmetry of the theoretical distribution;
µ3 - центральный момент третьего порядка;µ 3 is the central moment of the third order;
σ3 - куб выборочного среднего квадратического отклонения.σ 3 - cube of the sample mean square deviation.
где Ek - эксцесс теоретического распределения;where E k is the excess of the theoretical distribution;
µ4 - центральный момент четвертого порядка;µ 4 is the central moment of the fourth order;
σ4 - выборочное среднее квадратическое отклонение в четвертой степени.σ 4 - sample mean square deviation to the fourth degree.
где µS - центральный момент S-го порядка;where µ S is the central moment of the Sth order;
n - количество коэффициентов данного уровня вейвлет-преобразования.n is the number of coefficients of a given wavelet transform level.
В блоке формирования собственного характеристического вектора 8 все вычисленные значения статистических характеристик включают в вектор (6).In the block for the formation of the characteristic characteristic vector 8, all calculated values of the statistical characteristics are included in the vector (6).
где N - число уровней вейвлет-преобразования.where N is the number of wavelet transform levels.
Таким образом, размерность такого вектора зависит от количества уровней вейвлет-преобразования N и равна 18N.Thus, the dimension of such a vector depends on the number of levels of the wavelet transform N and is equal to 18N.
После этого посредством блока 9 осуществляют коммутацию на блок формирования массива собственных характеристических векторов из обучающей выборки 10, где производится формирование массива собственных характеристических векторов звуковых файлов из обучающей выборки. Для этого посредством блока 11 осуществляют коммутацию на блок 2 до тех пор, пока не будет сформирован массив собственных характеристических векторов всех звуковых файлов из обучающей выборки (обучающая выборка должна содержать не менее 285 ЗФ, не содержащих ЦВЗ, и не менее 285 ЗФ, содержащих ЦВЗ, причем все ЗФ данной обучающей выборки должны быть одного формата и ЦВЗ должны встраиваться по различным законам).After that, through block 9, switching to the block for generating an array of characteristic eigenvectors from the training set 10 is performed, where the array of eigenvector characteristic vectors of sound files from the training set is generated. For this, by means of block 11, switching to block 2 is carried out until an array of eigenvectors of all sound files from the training sample is generated (the training sample must contain at least 285 SFs that do not contain CEH and at least 285 SF containing CEH , moreover, all SFs of this training sample should be of the same format and the CEH should be built in according to different laws).
После формирования массива собственных характеристических векторов всех звуковых файлов из обучающей выборки полученный массив, представленный в виде таблицы 2, коммутируют на блок обучения классификатора 12 для линейной дискриминации звуковых файлов из обучающей выборки на два класса: ЗФ, содержащие ЦВЗ, и ЗФ, не содержащие ЦВЗ. После этого этап "обучение" заканчивается и начинается второй этап - "анализ".After the formation of an array of eigenvector characteristic vectors of all sound files from the training set, the resulting array, presented in the form of table 2, is switched to the training unit of classifier 12 for linear discrimination of sound files from the training set into two classes: ZF containing CEH and ZF not containing CEH . After that, the “training” stage ends and the second stage begins - “analysis".
На этапе "анализ" с выбранным для анализа ЗФ (он должен быть одного формата с ЗФ из обучающей выборки) производят все процедуры, описанные выше, только теперь посредством блока 9 осуществляют коммутацию на блок классифицирования 13, на который одновременно с этим с блока обучения классификатора 12 подают результаты дискриминации всех собственных характеристических векторов, полученных от ЗФ из обучающей выборки на этапе "обучение".At the “analysis” stage, with the SF selected for analysis (it must be of the same format as the SF from the training set), all the procedures described above are performed, only now, by means of block 9, they are switched to classification block 13, to which at the same time from the classifier training block 12 provide the results of discrimination of all eigenvalue characteristic vectors obtained from the SF from the training sample at the “training” stage.
В блоке классифицирования ЗФ 13 на основании вычисленного расстояния Махаланобиса по формуле (7) (Калугина Т. Ф., Киселев В. Ю. Математическая статистика: Учеб. пособие/Иван. гос. энерг. ун-т. - Иваново, 2001. - 321 с., с.245) принимается решение о принадлежности анализируемого звукового файла к одному из классов: либо к классу ЗФ, содержащих ЦВЗ, либо к классу ЗФ, не содержащих ЦВЗ.In the classification block ZF 13 on the basis of the calculated Mahalanobis distance according to the formula (7) (Kalugina T.F., Kiselev V.Yu. Mathematical statistics: Textbook / Ivan. State energy University - Ivanovo, 2001. - 321 p., P.245) a decision is made on whether the analyzed sound file belongs to one of the classes: either to the class of PF containing CEH, or to the class of PF not containing CEH.
где dM(xi,xj) - расстояние Махаланобиса,where d M (x i , x j ) is the Mahalanobis distance,
K-1=С - матрица, обратная ковариационной матрице К, вычисленной по выборке х,K -1 = C is the matrix inverse to the covariance matrix K calculated from the sample x,
cpq - элементы матрицы С.c pq - elements of the matrix C.
Для проверки заявляемого способа классификатор, основанный на дискриминантном анализе, был обучен на выборке из 1710 звуковых файлов различных форматов, 855 из которых содержали ЦВЗ. С помощью набора из 1800 ЗФ формата WAV, МР3 и WMA, не принадлежащих обучающей выборке, 600 из которых содержали встроенный по неизвестному закону ЦВЗ (по 200 ЗФ каждого формата), заявляемый способ был протестирован. Результаты, представленные на фиг.2, показали, что вероятность правильной идентификации заявляемого способа не ниже, чем у прототипа.To test the proposed method, a classifier based on discriminant analysis was trained on a sample of 1710 sound files of various formats, 855 of which contained CEH. Using a set of 1800 SFs of the WAV, MP3 and WMA format that do not belong to the training set, 600 of which contained a central digital health center built in by an unknown law (200 SF of each format), the claimed method was tested. The results presented in figure 2, showed that the probability of correct identification of the proposed method is not lower than that of the prototype.
Claims (1)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2008126588/09A RU2390054C2 (en) | 2008-06-30 | 2008-06-30 | Method of identifying audio file containing digital watermark |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2008126588/09A RU2390054C2 (en) | 2008-06-30 | 2008-06-30 | Method of identifying audio file containing digital watermark |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2008126588A RU2008126588A (en) | 2010-01-10 |
| RU2390054C2 true RU2390054C2 (en) | 2010-05-20 |
Family
ID=41643688
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2008126588/09A RU2390054C2 (en) | 2008-06-30 | 2008-06-30 | Method of identifying audio file containing digital watermark |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2390054C2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5193114A (en) * | 1991-08-08 | 1993-03-09 | Moseley Donald R | Consumer oriented smart card system and authentication techniques |
| WO2002007362A1 (en) * | 2000-07-19 | 2002-01-24 | Digimarc Corporation | Wavelet domain watermarks |
| RU2304306C1 (en) * | 2006-03-06 | 2007-08-10 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Method for identification of a digital image containing a digital watermark |
-
2008
- 2008-06-30 RU RU2008126588/09A patent/RU2390054C2/en not_active IP Right Cessation
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5193114A (en) * | 1991-08-08 | 1993-03-09 | Moseley Donald R | Consumer oriented smart card system and authentication techniques |
| WO2002007362A1 (en) * | 2000-07-19 | 2002-01-24 | Digimarc Corporation | Wavelet domain watermarks |
| RU2304306C1 (en) * | 2006-03-06 | 2007-08-10 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Method for identification of a digital image containing a digital watermark |
Non-Patent Citations (1)
| Title |
|---|
| Özer H. et al. "Detection of audio covert channels using statistical footprint of hidden messages", Digital Signal Processing, 16, 2006, pp.389-401 (Найдено в Интернет по адресу:. http://www.busim.ee.boun.edu.tr/~sankur/SankurFolder/Detection-Of-Audio-Co nvert - Channels. pdf). * |
Also Published As
| Publication number | Publication date |
|---|---|
| RU2008126588A (en) | 2010-01-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110084159B (en) | Hyperspectral image classification method based on joint multi-level spatial spectral information CNN | |
| Gazor et al. | Speech probability distribution | |
| CN110059288B (en) | System and method for obtaining an optimal mother wavelet for facilitating a machine learning task | |
| CN117831570B (en) | A completely small sample class incremental audio classification method based on prototype classifier | |
| Yang et al. | Blind image quality assessment based on multi-scale KLT | |
| CN115699107A (en) | Method for determining correspondence between biological properties of cells | |
| CN113852970A (en) | Multidimensional spectrum prediction method, system, device and medium based on graph neural network | |
| Masood et al. | Differential evolution based advised SVM for histopathalogical image analysis for skin cancer detection | |
| CN117292494A (en) | A signal recognition method, system, computer equipment and medium for acoustic and vibration fusion | |
| TWI836607B (en) | Method and system for estimating levels of distortion | |
| RU2390054C2 (en) | Method of identifying audio file containing digital watermark | |
| EP3751565A1 (en) | Parameter determination device, method, program and recording medium | |
| CN111091194B (en) | Operation system identification method based on CAVWBB _ KL algorithm | |
| CN111860356B (en) | Polarization SAR image classification method based on nonlinear projection dictionary pair learning | |
| CN114118308A (en) | A hyperspectral target detection method based on constrained energy minimization variational self-encoding | |
| CN114490619A (en) | Data filling method, device, equipment and storage medium based on genetic algorithm | |
| CN106936561B (en) | Side channel attack protection capability assessment method and system | |
| CN111724810B (en) | An audio classification method and device | |
| CN109145132B (en) | Method and device for extracting hash code from image and image retrieval method and device | |
| Abdullah et al. | Support vector machine, multilayer perceptron neural network, bayes net and k-nearest neighbor in classifying gender using fingerprint features | |
| CN113948108B (en) | Method and system for automatically identifying physiological sound | |
| Saraswati et al. | Comparison of CART and discriminant analysis of morphometric data in foraminiferal taxonomy | |
| CN120015054B (en) | Natural gas pipeline abnormality detection method based on DN-A and MFF | |
| Mariajohn | Robust Experimental Design for Speech Analysis Applications | |
| Moussa et al. | Unmasking Neural Codecs: Forensic Identification of AI-compressed Speech |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20100701 |