RU2408160C1 - Method for finding vectors of part movement in dynamic images and device for its realisation - Google Patents
Method for finding vectors of part movement in dynamic images and device for its realisation Download PDFInfo
- Publication number
- RU2408160C1 RU2408160C1 RU2009130446/09A RU2009130446A RU2408160C1 RU 2408160 C1 RU2408160 C1 RU 2408160C1 RU 2009130446/09 A RU2009130446/09 A RU 2009130446/09A RU 2009130446 A RU2009130446 A RU 2009130446A RU 2408160 C1 RU2408160 C1 RU 2408160C1
- Authority
- RU
- Russia
- Prior art keywords
- macroblock
- current
- pixel
- block
- motion
- Prior art date
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
Изобретение относится к области видеоинформационной техники и может найти применение при разработке цифровых кодирующих устройств для видеотелефонии, видеоконференцсвязи, телевизионного цифрового вещания стандартной и высокой четкости.The invention relates to the field of video information technology and can find application in the development of digital encoding devices for video telephony, video conferencing, standard and high definition digital television broadcasting.
Используемые далее термины.Terms used below.
Термину Макроблок (macroblock) телевизионного изображения для стандарта MPEG-2 можно найти определение, например, в Словаре терминов «Телевидение и радиовещание», авторы В.А.Хлебородов, П.П.Олиференко / под редакцией проф. М.И.Кривошеева - «Эра», г.Жуковский, 1999, с.21, 76.The term macroblock of a television image for the MPEG-2 standard can be found in, for example, the Dictionary of Terms “Television and Radio Broadcasting”, authors V. A. Khleborodov, P. P. Oliferenko / edited by prof. M.I. Krivosheeva - "Era", Zhukovsky, 1999, p.21, 76.
Размеры макроблоков могут быть различными (16×16, 8×8 пикселов). (См., например, Mandal M.K., Chan E., Panchanathan S. "Multiresolution Motion Estimation Techniques for Video Compression", Optical Engineering, vol.35, no 1, pp.128-136, Jan., 1996).The sizes of macroblocks can be different (16 × 16, 8 × 8 pixels). (See, for example, Mandal M.K., Chan E., Panchanathan S. "Multiresolution Motion Estimation Techniques for Video Compression", Optical Engineering, vol. 35, no. 1, pp. 128-136, Jan., 1996).
Термину Вектор движения (Motion Vector) дано определение, например, в статье K.R.Rao, J.J.Hwang, "Techniques and Standards for Image, Video and Audio Coding", 1996, Prentice-Hall PTR, ISBN 0-13-309907-5.The term Motion Vector is defined, for example, in K.R. Rao, J.J. Hwang, "Techniques and Standards for Image, Video and Audio Coding", 1996, Prentice-Hall PTR, ISBN 0-13-309907-5.
Известно множество способов анализа векторов движения деталей в динамических изображениях.Many methods are known for analyzing the motion vectors of parts in dynamic images.
Наиболее простым и точным является способ поиска векторов движения макроблоков на основе алгоритма полного перебора (K.R.Rao, J.J.Hwang, "Techniques and Standards for Image, Video and Audio Coding", 1996, Prentice-Hall PTR, ISBN 0-13-309907-5).The simplest and most accurate way is to search for macroblock motion vectors based on the exhaustive search algorithm (KRRao, JJHwang, "Techniques and Standards for Image, Video and Audio Coding", 1996, Prentice-Hall PTR, ISBN 0-13-309907-5 )
Для поиска вектора движения рассматривается норма разницы сигналов яркости двух макроблоков в текущем и опорном кадрах SAD со сдвигом на вектор движения:To search for a motion vector the norm of the difference of the brightness signals of two macroblocks in the current and reference SAD frames with a shift by the motion vector is considered:
Здесь F - значение яркости, (х, у) - пространственные координаты точки в кадре, t - временной индекс кадра, суммирование производится по всем точкам макроблока. Значение для которого норма SAD имеет наименьшее значение, принимается за искомый вектор. Векторы движения ищутся методом полного перебора в некоторой ограниченной окрестности:Here F is the brightness value, (x, y) are the spatial coordinates of the point in the frame, t is the temporal index of the frame, summation is performed over all points of the macroblock. Value for which the SAD norm has the least value, is taken as the sought vector. Motion vectors are searched by exhaustive search in some limited neighborhood:
-A<Vx,Vy<A.-A <V x , V y <A.
Этот способ обычно используется в качестве эталонного для оценки качества других способов анализа векторов движения деталей в динамических изображениях.This method is usually used as a reference for assessing the quality of other methods for analyzing the motion vectors of parts in dynamic images.
Более эффективным способом анализа векторов движения с точностью до пикселя является способ (А.В.Дворкович, В.П.Дворкович, Ю.Б.Зубарев, А.Ю.Соколов, Патент РФ №2137194 «Способ анализа векторов движения деталей в динамических изображениях»), включающий преобразование последовательности кадров изображений в цифровую форму, запоминание дискретных отсчетов яркости текущего и соседнего по времени (опорного) кадров, разбиение текущего кадра на макроблоки и поиск вектора движения каждого из макроблоков текущего кадра относительно опорного кадра посредством минимизации по рассматриваемому множеству векторов движения контрольной суммы данного макроблока, являющейся суммой норм попиксельной разности уровней в текущем и опорных кадрах, причем упомянутая контрольная сумма вычисляется с учетом вектора движения, то есть при сопоставлении в соответствие пикселов в текущем макроблоке пикселам в области поиска в опорном кадре, сдвинутым относительно положения пикселов текущего макроблока на предполагаемый вектор движения, взятый с обратным знаком.A more effective way of analyzing motion vectors with accuracy to a pixel is the method (A.V. Dvorkovich, V.P. Dvorkovich, Yu.B. Zubarev, A.Yu.Sokolov, RF Patent No. 2137194 “Method for the analysis of motion vectors of parts in dynamic images ”), Which includes converting the sequence of image frames into digital form, storing discrete samples of brightness of the current and neighboring (reference) frames, dividing the current frame into macroblocks, and searching for the motion vector of each of the macroblocks of the current frame relative to the reference frame by minimizing over the considered set of motion vectors the checksum of this macroblock, which is the sum of the norms of the pixel-by-pixel level difference in the current and reference frames, and the said checksum is calculated taking into account the motion vector, that is, when matching the pixels in the current macroblock to the pixels in the search area in the reference frame shifted relative to the position of the pixels of the current macroblock by the estimated motion vector taken with the opposite sign.
Ограничением этого известного способа является нахождение векторов движения лишь с точностью до целого числа пикселов по горизонтали и вертикали, при том, что реальное движение объектов в кадре характеризуется нецелыми компонентами вектора движения. Данное ограничение проявляется в том, что на разностном сигнале, полученном между опорным и текущим кадром с учетом векторов движения, найденных с точностью до целого числа пикселов, имеются характерные двойные контуры, соответствующие движущимся объектам. Интенсивность этих контуров пропорциональна величине отбрасываемой дробной части вектора движения объекта и может быть уменьшена за счет использования опорного кадра, передискретизированного в сторону увеличения четкости.The limitation of this known method is to find the motion vectors only up to an integer number of pixels horizontally and vertically, while the real motion of the objects in the frame is characterized by non-integer components of the motion vector. This limitation manifests itself in the fact that there are characteristic double contours corresponding to moving objects on the difference signal obtained between the reference and the current frame taking into account the motion vectors found up to an integer number of pixels. The intensity of these contours is proportional to the magnitude of the discarded fractional part of the object’s motion vector and can be reduced by using a reference frame oversampled to increase the clarity.
Наиболее близким по технической сущности является способ (ISO/IEC 14496-10. ITU-T Recommendation H.264, Женева, 2008), в котором осуществляется поиск векторов движения с точностью до долей пиксела, причем промежуточные точки получают путем линейной интерполяции, в результате чего значения вычисленных отсчетов могут существенно отличаться от истинных значений, что, в свою очередь, ведет к снижению точности получаемых данных.The closest in technical essence is the method (ISO / IEC 14496-10. ITU-T Recommendation H.264, Geneva, 2008), in which the motion vectors are searched with accuracy to fractions of a pixel, the intermediate points being obtained by linear interpolation, as a result where the values of the calculated samples can differ significantly from the true values, which, in turn, leads to a decrease in the accuracy of the data obtained.
Задачей настоящего изобретения является создание способа нахождения векторов движения деталей в динамических изображениях и устройство для его реализации, позволяющих увеличить точность передискретизации области поиска в опорном кадре и, соответственно, точности определения векторов движения деталей по пространственным координатам и, вследствие этого, в уменьшении информационной энтропии кодируемого разностного сигнала и повышении качества воспроизведения быстро перемещающихся деталей при том же потоке закодированных данных.The objective of the present invention is to provide a method for finding the motion vectors of parts in dynamic images and a device for its implementation, which allows to increase the accuracy of oversampling the search area in the reference frame and, accordingly, the accuracy of determining the motion vectors of parts by spatial coordinates and, therefore, to reduce the information entropy of the encoded differential signal and improving the quality of reproduction of fast moving parts with the same stream of encoded data.
Для реализации поставленной задачи предлагается способ поиска векторов движения деталей в динамических изображениях по п.1 формулы изобретения, включающий преобразование последовательности кадров изображений в цифровую форму, запоминание дискретных отсчетов яркости текущего и опорного кадров, разбиение текущего кадра на макроблоки и поиск вектора движения с точностью до целого числа пикселов каждого из макроблоков текущего кадра относительно опорного кадра посредством минимизации по рассматриваемому множеству векторов движения контрольной суммы данного макроблока, являющейся суммой норм попиксельной разности уровней в текущем и опорных кадрах, над каждой парой опорный - текущий макроблок дополнительно производятся следующие операции:To achieve this goal, a method for searching motion vectors of parts in dynamic images according to
1) расширение на один пиксел со всех четырех сторон макроблока опорного кадра для получения области поиска уточненного вектора движения;1) an extension of one pixel from all four sides of the macroblock of the reference frame to obtain the search area of the updated motion vector;
2) осуществление двумерного дискретного преобразования Фурье (ДПФ) над расширенным макроблоком опорного кадра;2) the implementation of a two-dimensional discrete Fourier transform (DFT) over the expanded macroblock of the reference frame;
3) изменение получившейся матрицы коэффициентов Фурье добавлением в нее нулевых коэффициентов, соответствующих значениям пространственных частот, превышающих граничные частоты исходного макроблока, в таком количестве, при котором измененная матрица оказывается в N раз больше первоначальной по соответственным пространственным размерам, и по строкам, и по столбцам;3) changing the resulting matrix of Fourier coefficients by adding zero coefficients to it, corresponding to the values of spatial frequencies exceeding the boundary frequencies of the original macroblock, in such an amount that the changed matrix is N times larger than the original in the respective spatial sizes, both in rows and in columns ;
4) осуществление обратного двумерного БПФ над измененной матрицей, в результате которого получается передискретизированный опорный макроблок с числом дискретных отсчетов в N раз больше по строкам и по столбцам, содержащий истинные значения уровней изображения в промежуточных точках отсчетов, получившихся между исходными пикселами при увеличении пространственного разрешения в N раз по горизонтали и вертикали;4) the implementation of the inverse two-dimensional FFT on the changed matrix, which results in a resampled reference macroblock with the number of discrete samples N times larger in rows and columns containing the true values of the image levels at the intermediate points of the samples obtained between the original pixels with increasing spatial resolution in N times horizontally and vertically;
5) уточнение вектора движения путем перебора контрольных сумм попиксельной разности уровней в текущем и опорных кадрах, положение минимальной из которых соответствует искомому уточненному вектору движения.5) refinement of the motion vector by sorting the checksums of the pixel-by-pixel level differences in the current and reference frames, the position of the minimum of which corresponds to the desired specified motion vector.
Для реализации указанного способа предлагается устройство нахождения векторов движения деталей в динамических изображениях, содержащее подключенные к входу сигнала динамического изображения последовательно соединенные аналого-цифровой преобразователь, блок памяти сигнала яркости текущего кадра и блок памяти опорного кадра, а также подключенный к выходу блока памяти сигнала яркости текущего кадра блок памяти текущего макроблока и подключенный к выходу блока памяти опорного кадра блок памяти области поиска движения, выходы блоков памяти текущего макроблока и памяти текущего макроблока подключены к входам блока анализа движения с точностью до пиксела, выход которого, а также второй выход блока памяти области поиска движения соединен с блоком памяти расширенного опорного макроблока, к выходу которого исключены последовательно соединенные блок дискретного преобразования Фурье, блок расширения спектра Фурье, блок обратного дискретного преобразования Фурье и блок уточненного анализа движения, ко второму входу которого подсоединен второй выход блока памяти текущего макроблока, а к третьему входу - выход целочисленных векторов движения блока анализа движения с точностью до пиксела, при этом все указанные блоки соединены с блоком управления.To implement this method, a device for finding motion vectors of parts in dynamic images is proposed, comprising a series-connected analog-to-digital converter connected to the input of the dynamic image signal, a memory block of the brightness signal of the current frame and a memory block of the reference frame, and also connected to the output of the memory block of the brightness signal of the current the memory block of the current macroblock and the memory block of the motion search area connected to the output of the memory block of the reference frame, the outputs of the blocks The names of the current macroblock and the memory of the current macroblock are connected to the inputs of the motion analysis block up to a pixel, the output of which, as well as the second output of the memory block of the motion search area, is connected to the memory block of the extended reference macroblock, the output of which excludes the discrete Fourier transform block, the block expansion of the Fourier spectrum, a block of the inverse discrete Fourier transform and a block of refined analysis of motion, to the second input of which the second output of the current memory block is connected about the macroblock, and to the third input is the output of integer motion vectors of the motion analysis block accurate to a pixel, while all of these blocks are connected to the control unit.
На фиг.1 изображена блок-схема устройства для реализации заявляемого способа поиска векторов движения деталей в динамических изображениях.Figure 1 shows a block diagram of a device for implementing the inventive method of searching for motion vectors of parts in dynamic images.
На фиг.2 приведены примеры текущего (а) и опорного кадров (б) из видеопоследовательности "Сад цветов".Figure 2 shows examples of the current (a) and reference frames (b) from the video sequence "Flower Garden".
На фиг.3 в качестве примера приведены:Figure 3 shows as an example:
- фиг.3а - матрица расширенного макроблока размером 4×4 пиксела из опорного кадра, изображенного на фиг.2б;- figa - matrix expanded
- фиг.3б - матрица текущего макроблока размером 2×2 пиксела из текущего кадра, изображенного на фиг.2а;- fig.3b - matrix of the current macroblock with a size of 2 × 2 pixels from the current frame shown in figa;
- фиг.3в - изображение огибающей поверхности расширенного опорного макроблока.- figv - image of the envelope surface of the expanded reference macroblock.
На фиг.4 приведены:Figure 4 shows:
- фиг.4а - матрица коэффициентов БПФ опорного расширенного макроблока;- figa - matrix of FFT coefficients of the reference extended macroblock;
- фиг.4б - измененная матрица коэффициентов БПФ опорного макроблока, расширенная в 4 раза по строкам и в 4 раза по столбцам;- figb - a modified matrix of FFT coefficients of the reference macroblock, expanded 4 times in rows and 4 times in columns;
- фиг.4в - матрица передискретизированного макроблока;- figv - matrix resampled macroblock;
- фиг.4г - изображение огибающей поверхности передискретизированного опорного макроблока.- Fig.4g - image of the envelope surface of the oversampled reference macroblock.
На фиг.5 приведена структурная схема расширения двумерной матрицы коэффициентов Фурье, осуществляемого при передискретизации опорного макроблока.Figure 5 shows the structural diagram of the expansion of the two-dimensional matrix of Fourier coefficients, carried out by oversampling the reference macroblock.
На фиг.6 приведен пример разностных кадров при компенсации движения с использованием целочисленного вектора движения (а) и вектора движения, вычисленного с точностью до 1/4 пиксела (б).Figure 6 shows an example of difference frames during motion compensation using integer motion vector (a) and the motion vector calculated with a precision up to 1/4 pixels (b).
Устройство, изображенное на фиг.1, содержит подключенные к входу сигнала динамического изображения 1 последовательно соединенные аналого-цифровой преобразователь 2, блок памяти сигнала яркости текущего кадра 3 и блок памяти опорного кадра 4, подключенный к выходу блока памяти сигнала яркости текущего кадра блок памяти текущего макроблока 5, и подключенный к выходу блока памяти опорного кадра 4 блок памяти области поиска движения 6. Выходы блоков 5 и 6 подключены к входам блока анализа движения с точностью до пиксела 7, выход которого, а также второй выход блока памяти 6 области поиска движения соединен с блоком памяти расширенного опорного макроблока 8, к выходу которого подсоединены последовательно соединенные блок Дискретного Преобразования Фурье 9, блок расширения спектра Фурье (добавления нулевых коэффициентов) 10, блок Обратного Дискретного Преобразования Фурье 11 и блок уточненного анализа движения 12, ко второму входу которого подсоединен второй выход блока памяти 5 текущего макроблока, а к третьему входу - выход целочисленных векторов движения блока 7. Информация об уточненных векторах движения подается на выход устройства 13. Функционирование устройства регулируется блоком управления 14.The device shown in figure 1, contains connected to the input of the
Сущность предлагаемого способа нахождения векторов движения состоит в следующем.The essence of the proposed method for finding motion vectors is as follows.
Сигнал динамического изображения со входа устройства 1 (фиг.1) через аналого-цифровой преобразователь (АЦП) 2 поступает на блок сигнала яркости текущего кадра 3 и через него на блок памяти опорного (например, предыдущего) кадра 4. Положим, что в блоках 3 и 4 помещены кадры изображений, приведенные на фиг.2а и фиг.2б соответственно. Через блок памяти текущего макроблока 5 и памяти области поиска движения 6 дискретные отсчеты соответствующих пикселов поступают на блок анализа движения с точностью до пиксела 7, в котором с использованием стандартного способа осуществляется нахождение вектора движения с точностью до целого числа пикселов.The dynamic image signal from the input of the device 1 (Fig. 1) through an analog-to-digital converter (ADC) 2 is supplied to the brightness signal block of the current frame 3 and through it to the memory block of the reference (for example, the previous)
Далее происходит этап уточнения найденного вектора движения.Next, the step of refining the found motion vector occurs.
В блоке памяти расширенного опорного макроблока 8 осуществляется увеличение на один пиксел со всех четырех сторон макроблока опорного кадра для получения области поиска уточненного вектора движения путем считывания нужных данных из блока 6.In the memory block of the expanded
Например, пусть найдено соответствие положения текущей матрицы, показанной на фиг.3б, центру (обозначено на фиг.3а рамкой) расширенного на один пиксел со всех четырех сторон опорного макроблока, и контрольная сумма попиксельной разности равна:For example, let the correspondence of the position of the current matrix shown in FIG. 3b be found to the center (indicated by a frame in FIG. 3a) extended by one pixel from all four sides of the reference macroblock, and the checksum of the pixel difference is:
SAD=(|133-132|+|133-117|+|42-24|+|116-171|)=1+16+18+55=90SAD = (| 133-132 | + | 133-117 | + | 42-24 | + | 116-171 |) = 1 + 16 + 18 + 55 = 90
На фиг.3в приведено изображение огибающей поверхности данного расширенного опорного макроблока.Figure 3c shows an image of the envelope surface of this expanded reference macroblock.
Преобразование пространственного разрешения матрицы отсчетов поясняется сначала на примере обработки одномерной последовательности действительных отсчетов {х0, x1, … хК-1}, K - четное число:The spatial resolution transformation of the sample matrix is explained first with the example of processing a one-dimensional sequence of real samples {x 0 , x 1 , ... x K-1 }, K is an even number:
дискретное преобразование Фурье данной последовательности определяется соотношением:discrete Fourier transform of a given sequence is determined by the relation:
u=0,…K-1, u = 0, ... K-1,
где Where
Последовательности действительных и мнимых коэффициентов Фурье (при четном К) соответственно равны:The sequences of real and imaginary Fourier coefficients (for even K) are respectively equal:
ReFu={Re F0, Re F1,… Re FK/2-1, Re Fk/2, Re FK/2+1,… Re FK-1};ReF u = {Re F 0 , Re F 1 , ... Re F K / 2-1 , Re F k / 2, Re F K / 2 + 1 , ... Re F K-1 };
ImFu={0, Im F1,… Im FK/2-1, 0, Im FK/2+1,… Im FK-1}.ImF u = {0, Im F 1 , ... Im F K / 2-1 , 0, Im F K / 2 + 1 , ... Im F K-1 }.
При этом согласно свойствам БПФ:Moreover, according to the FFT properties:
Re FK-k=Re Fk, а Im FK-k=-Im Fk, k=1,… K/2-1,Re F Kk = Re F k , and Im F Kk = -Im F k , k = 1, ... K / 2-1,
так что имеем:so we have:
ReFu={Re F0, Re F1,… Re FK/2-1, Re FK/2, Re FK/2-1,… Re F1};ReF u = {Re F 0 , Re F 1 , ... Re F K / 2-1 , Re F K / 2 , Re F K / 2-1 , ... Re F 1 };
lmFu={0, Im F1,… Im FK/2-1, 0, -Im FK/2-1,… -Im F1}.lmF u = {0, Im F 1 , ... Im F K / 2-1 , 0, -Im F K / 2-1 , ... -Im F 1 }.
Разделив центральный коэффициент FK/2, соответствующий граничной частоте, на два и добавив между ними нули в количестве K(N-1)-1, получаем:Dividing the central coefficient F K / 2 , corresponding to the boundary frequency, by two and adding between them zeros in the amount of K (N-1) -1, we get:
To есть сформированный спектр содержит в N раз больше отсчетов, чем исходный.That is, the formed spectrum contains N times more samples than the initial one.
Передискретизированную последовательность {у0, у1, … уNK-1} можно получить, применив обратное преобразование Фурье:A resampled sequence {y 0 , y 1 , ... NK-1 } can be obtained by applying the inverse Fourier transform:
k=0,…NK-1k = 0, ... NK-1
где ,Where ,
причем уNk=xk, а число отсчетов на заданном интервале увеличилось в N раз.moreover, Nk = x k , and the number of samples in a given interval increased N times.
В случае двумерных данных ДПФ приводит к следующим соотношениям:In the case of two-dimensional data, the DFT leads to the following relations:
гдеWhere
причем везде u=0…K-1, v=0…K-1.and everywhere u = 0 ... K-1, v = 0 ... K-1.
Проведя для четырех последовательностей компонент операцию, аналогичную вышеописанной на примере одномерной модели, можно получить требуемое расширение спектра Фурье для двумерного случая.Having performed an operation for the four component sequences similar to that described above for the one-dimensional model, we can obtain the required expansion of the Fourier spectrum for the two-dimensional case.
Учитывая, что двумерное ДПФ является разделимым преобразованием, можно сначала провести одномерную операцию, например, сначала по строкам, а после дополнения строк нулевыми коэффициентами осуществить БПФ по столбцам, и добавить в середину по вертикали получившейся матрицы строки нулевых коэффициентов, получив в итоге требуемую матрицу коэффициентов Фурье.Considering that two-dimensional DFT is a separable transformation, it is possible to carry out a one-dimensional operation first, for example, first in rows, and after adding rows with zero coefficients, perform FFT in columns and add rows of zero coefficients in the vertical middle of the resulting matrix, resulting in the required coefficient matrix Fourier.
В блоке ДПФ (блок 9 фиг.1) производится операция Фурье-преобразования расширенного макроблока, полученного с выхода блока 8.In the DFT block (block 9 of FIG. 1), the Fourier transform operation of the extended macroblock obtained from the output of
Алгоритм этих преобразований поясняется на фиг.4 и в общем виде также на фиг.5.The algorithm of these transformations is illustrated in figure 4 and in General form also in figure 5.
Матрица коэффициентов спектра Фурье расширенного макроблока приведена на фиг.4а. Расширение матрицы из фиг.4а нулевыми коэффициентами спектра Фурье (осуществляемое блоком расширения спектра Фурье 10 фиг.1) приведено на фиг.4б. После обратного ДПФ матрицы фиг.4б (данная операция осуществляется в блоке обратного дискретного преобразования Фурье 11 схемы фиг.1) воспроизводится множество отсчетов передискретизированного расширенного опорного макроблока, как показано на фиг.4в, а его огибающая поверхность изображена на фиг.4г. В общем виде пространственная структура расширения макроблока иллюстрирована на фиг.5а, его ДПФ - на фиг.5(б, в), а результата передискретизации - на фиг.5г. Заметим, что размеры физического соответствия исходного расширенного (фиг.5а) и передискретизированного (фиг.5г) макроблоков остаются неизменными.The matrix of coefficients of the Fourier spectrum of the expanded macroblock is shown in figa. The expansion of the matrix of FIG. 4a by zero Fourier spectrum coefficients (performed by the Fourier
При этом расширение матриц коэффициентов Фурье путем добавления в них нулевых коэффициентов осуществляется в соответствии с формулами (размеры матрицы по горизонтали и вертикали должны быть четными):In this case, the expansion of the matrix of Fourier coefficients by adding zero coefficients to them is carried out in accordance with the formulas (the dimensions of the matrix horizontally and vertically must be even):
F1ij=F0ij при i<n/2, j<n/2;F1 ij = F0 ij for i <n / 2, j <n / 2;
F1i+n·(N-1)j+n·(N-1)=F0ij при i>n/2, j>n/2;F1 i + n · (N-1) j + n · (N-1) = F0 ij for i> n / 2, j> n / 2;
F1i+n·(N-1)j=F0ij при i>n/2, j<n/2;F1 i + n · (N-1) j = F0 ij for i> n / 2, j <n / 2;
F1ij+n·(N-1)=F0ij при i<n/2, j>n/2;F1 ij + n · (N-1) = F0 ij for i <n / 2, j> n / 2;
F1n/2j=F1n/2+n·(N-1)j=0.5·F0n/2j при j<n/2;F1 n / 2j = F1 n / 2 + n · (N-1) j = 0.5 · F0 n / 2j for j <n / 2;
F1n/2j+n·(N-1)=F1n/2+n·(N-1)j+n·(N-1)=0.5·F0n/2j при j<n/2;F1 n / 2j + n · (N-1) = F1 n / 2 + n · (N-1) j + n · (N-1) = 0.5 · F0 n / 2j for j <n / 2;
F1in/2=F1in/2+n·(N-1)=0.5·F0i n/2 при i<n/2;F1 in / 2 = F1 in / 2 + n · (N-1) = 0.5 · F0 in / 2 for i <n / 2;
F1i+n·(N-1)n/2=F1i+n·(N-1)n/2+n·(N-1)=0.5·F0in/2 при i<n/2;F1 i + n · (N-1) n / 2 = F1 i + n · (N-1) n / 2 + n · (N-1) = 0.5 · F0 in / 2 for i <n / 2;
F1n/2 n/2=F1n/2 n/2+n·(N-1)=F1n/2+n·(N-1) n/2=F1n/2+n·(N-1) n/2+n·(N-1)=0.25·F0n/2 n/2;F1 n / 2 n / 2 = F1 n / 2 n / 2 + n · (N-1) = F1 n / 2 + n · (N-1) n / 2 = F1 n / 2 + n · (N- 1) n / 2 + n · (N-1) = 0.25 · F0 n / 2 n / 2 ;
F1ij=0 при n/2<i<n/2+n·(N-1) или n/2<j<n/2+n·(N-1),F1 ij = 0 for n / 2 <i <n / 2 + n · (N-1) or n / 2 <j <n / 2 + n · (N-1),
где F0ij и F1ij - коэффициенты Фурье двумерного ДПФ над расширенным макроблоком опорного кадра до и после передискретизации соответственно, n - размер расширенного макроблока (и матрицы его коэффициентов ДПФ) опорного кадра по горизонтали и по вертикали, n·N - размер расширенного макроблока (и матрицы его коэффициентов ДПФ) опорного кадра по горизонтали и вертикали после передискретизации.where F0 ij and F1 ij are the Fourier coefficients of the two-dimensional DFT over the extended macroblock of the reference frame before and after oversampling, respectively, n is the size of the expanded macroblock (and the matrix of its DFT coefficients) of the reference frame horizontally and vertically, n · N is the size of the expanded macroblock ( and the matrix of its DFT coefficients) of the reference frame horizontally and vertically after oversampling.
Таким образом, при осуществлении обратного двумерного ДПФ над сформированной матрицей создается передискретизированный опорный макроблок.Thus, when performing the inverse two-dimensional DFT over the formed matrix, a resampled reference macroblock is created.
Смещая исходный текущий макроблок (фиг.3б) по строкам и столбцам на вновь полученные интервалы, равные 1/N-м долям исходного межпиксельного расстояния, вычисляя соответствующие контрольные суммы и найдя затем минимальную из них, можно получить значение вектора движения повышенной точности. Данная операция производится в блоке уточненного анализа движения 12 фиг.1, после чего уточненные векторы движения 13 выводятся из устройства реализации заявляемого способа для дальнейшего получения разностных сигналов и их компрессии.Shifting the original current macroblock (Fig. 3b) along the rows and columns by the newly obtained intervals equal to 1 / N-th fractions of the initial inter-pixel distance, calculating the corresponding checksums and then finding the minimum of them, you can get the value of the motion vector with increased accuracy. This operation is performed in the unit of the refined analysis of motion 12 of Fig. 1, after which the refined motion vectors 13 are derived from the device for implementing the proposed method for further receiving differential signals and their compression.
В данном примере путем оценки минимальной попиксельной разности установлено, что вектор движения должен быть смещен относительно вычисленного с точностью до целого числа пикселов на -0.5 пиксела по строке и -0.25 пиксела по столбцу. Совмещение отсчетов текущего макроблока, изображенного на фиг.3б, с отсчетами передискретизированного опорного макроблока, изображенного на фиг.3в, в соответствии с вектором движения, найденным с точностью до целого числа пикселов, и в соответствии с вектором движения, найденным с точностью до четверти пиксела, отмечено на фиг.3в выделением рамками и жирным шрифтом соответственно.In this example, by estimating the minimum pixel-by-pixel difference, it was found that the motion vector should be shifted relative to the calculated integer number of pixels by -0.5 pixels per row and -0.25 pixels per column. The combination of the samples of the current macroblock depicted in Fig.3b, with the samples of the resampled reference macroblock depicted in Fig.3c, in accordance with the motion vector found to within an integer number of pixels, and in accordance with the motion vector found to an accuracy of a quarter of a pixel , marked in figv highlighting in bold and font, respectively.
При этом контрольная сумма попиксельной разности равна:In this case, the checksum of the pixel difference is equal to:
SAD=(|133-132|+|133-133|+|42-42|+|116-106|)=1+0+0+10=11.SAD = (| 133-132 | + | 133-133 | + | 42-42 | + | 116-106 |) = 1 + 0 + 0 + 10 = 11.
Эффект уменьшения информационной энтропии разностного сигнала, получающегося при компенсации движения с применением полученных вышеописанным способом уточненных векторов движения можно наблюдать на фиг.6, сравнивая изображения (а) и (б).The effect of reducing the informational entropy of the difference signal resulting from motion compensation using the updated motion vectors obtained in the aforementioned manner can be observed in FIG. 6 by comparing images (a) and (b).
При дальнейшем увеличении разрешения опорных областей поиска движения можно получить еще большую точность определения векторов движения.With a further increase in the resolution of the support areas of the motion search, one can obtain even greater accuracy in determining motion vectors.
Таким образом, реализация данного способа нахождения векторов движения деталей в динамических изображениях с помощью описанного устройства позволяет существенно повысить эффективность обработки цифровых видеопоследовательностей.Thus, the implementation of this method of finding the motion vectors of parts in dynamic images using the described device can significantly improve the processing efficiency of digital video sequences.
На Фиг.1 представлена блок-схема устройства для реализации заявляемого способа.Figure 1 presents a block diagram of a device for implementing the proposed method.
На Фиг.2 представлен пример текущего (а) и опорного (б) кадров из видеопоследовательности «Сад цветов».Figure 2 presents an example of the current (a) and reference (b) frames from the video sequence "Flower Garden".
На Фиг.3 представлен пример текущего и расширенного опорного макроблока.Figure 3 presents an example of the current and extended reference macroblock.
На Фиг.4 представлен пример преобразования матрицы коэффициентов БПФ расширенного опорного макроблока.Figure 4 presents an example of the transformation of the matrix of FFT coefficients of the extended reference macroblock.
На Фиг.5 представлен пример схемы расширения двумерной матрицы коэффициентов Фурье, осуществляемого для передискретизации опорного макроблока.Figure 5 presents an example of an expansion scheme of a two-dimensional matrix of Fourier coefficients, implemented for oversampling the reference macroblock.
На Фиг.6 представлены разностные кадры при компенсации движения с использованием целочисленного вектора движения (а) и вектора движения, вычисленного с точностью до 1/4 пиксела (б).Figure 6 presents the difference frames in the motion compensation using integer motion vector (a) and the motion vector calculated with a precision up to 1/4 pixels (b).
Перечень позицийList of items
(Фиг.1 - Блок-схема устройства для реализации заявляемого способа)(Figure 1 - Block diagram of a device for implementing the proposed method)
1. Сигнал динамического изображения1. Dynamic image signal
2. Аналого-цифровой преобразователь (АЦП)2. An analog-to-digital converter (ADC)
3. Блок памяти сигнала яркости текущего кадра3. The memory block of the brightness signal of the current frame
4. Блок памяти опорного кадра4. The reference frame memory unit
5. Блок памяти текущего макроблока5. The memory block of the current macroblock
6. Блок памяти области поиска движения6. The memory block of the motion search area
7. Блок анализа движения с точностью до пиксела7. The block of the analysis of the movement with an accuracy of a pixel
8. Блок памяти расширенного опорного макроблока8. The memory block extended reference macroblock
9. Блок дискретного преобразования Фурье9. Block of discrete Fourier transform
10. Блок расширения спектра Фурье10. Fourier spectrum expansion unit
11. Блок обратного дикретного преобразования Фурье11. Block inverse discrete Fourier transform
12. Блок уточненного анализа движения12. Block refined motion analysis
13. Векторы движения с точностью до долей пиксела13. Motion vectors accurate to fractions of a pixel
Claims (2)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2009130446/09A RU2408160C1 (en) | 2009-08-10 | 2009-08-10 | Method for finding vectors of part movement in dynamic images and device for its realisation |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2009130446/09A RU2408160C1 (en) | 2009-08-10 | 2009-08-10 | Method for finding vectors of part movement in dynamic images and device for its realisation |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2408160C1 true RU2408160C1 (en) | 2010-12-27 |
Family
ID=44055919
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2009130446/09A RU2408160C1 (en) | 2009-08-10 | 2009-08-10 | Method for finding vectors of part movement in dynamic images and device for its realisation |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2408160C1 (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2461067C1 (en) * | 2011-05-04 | 2012-09-10 | Государственное образовательное учреждение высшего профессионального образования "Тамбовский государственный технический университет" ГОУ ВПО ТГТУ | Method of detecting moving objects |
| RU2602792C2 (en) * | 2011-01-28 | 2016-11-20 | Конинклейке Филипс Электроникс Н.В. | Motion vector based comparison of moving objects |
| US10986366B2 (en) | 2016-06-30 | 2021-04-20 | Interdigital Vc Holdings, Inc. | Video coding with adaptive motion information refinement |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1993023816A1 (en) * | 1992-05-18 | 1993-11-25 | Silicon Engines Inc. | System and method for cross correlation with application to video motion vector estimation |
| RU2117412C1 (en) * | 1992-02-08 | 1998-08-10 | Самсунг Эдектроникс Ко., Лтд. | Method and device for comparison of picture signal between adjacent frames and evaluation of image movement |
| RU2182727C2 (en) * | 2000-07-20 | 2002-05-20 | Дворкович Александр Викторович | Method for searching motion vectors of parts in amplitude images |
| WO2006112272A1 (en) * | 2005-04-13 | 2006-10-26 | Ntt Docomo, Inc. | Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, dynamic image decoding method, dynamic image encoding program, and dynamic image decoding program |
| RU2323541C2 (en) * | 2002-08-06 | 2008-04-27 | Моторола, Инк. | Method and device for conducting high quality fast search for predicted movement |
-
2009
- 2009-08-10 RU RU2009130446/09A patent/RU2408160C1/en not_active IP Right Cessation
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2117412C1 (en) * | 1992-02-08 | 1998-08-10 | Самсунг Эдектроникс Ко., Лтд. | Method and device for comparison of picture signal between adjacent frames and evaluation of image movement |
| WO1993023816A1 (en) * | 1992-05-18 | 1993-11-25 | Silicon Engines Inc. | System and method for cross correlation with application to video motion vector estimation |
| RU2182727C2 (en) * | 2000-07-20 | 2002-05-20 | Дворкович Александр Викторович | Method for searching motion vectors of parts in amplitude images |
| RU2323541C2 (en) * | 2002-08-06 | 2008-04-27 | Моторола, Инк. | Method and device for conducting high quality fast search for predicted movement |
| WO2006112272A1 (en) * | 2005-04-13 | 2006-10-26 | Ntt Docomo, Inc. | Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, dynamic image decoding method, dynamic image encoding program, and dynamic image decoding program |
Non-Patent Citations (1)
| Title |
|---|
| ЯН РИЧАРДСОН. Видеокодирование Н.264 и MPEG-4 - стандарты нового поколения. - М.: Техносфера, 2005, с.с.54-65, 159-163, 228-240. TOIVONEN T. et al. A New Algorithm for Fast Full Search Block Motion Estimation Based on Number Theoretic Transforms, Proc. 9 th International Workshop on Systems, Signals and Image Processing, 7-8 November 2002, Manchester, c.c.90-94. * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2602792C2 (en) * | 2011-01-28 | 2016-11-20 | Конинклейке Филипс Электроникс Н.В. | Motion vector based comparison of moving objects |
| RU2461067C1 (en) * | 2011-05-04 | 2012-09-10 | Государственное образовательное учреждение высшего профессионального образования "Тамбовский государственный технический университет" ГОУ ВПО ТГТУ | Method of detecting moving objects |
| US10986366B2 (en) | 2016-06-30 | 2021-04-20 | Interdigital Vc Holdings, Inc. | Video coding with adaptive motion information refinement |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1179302C (en) | Method and apparatus for motion estimation using block matching in orthogonal transform domain | |
| US20230239468A1 (en) | Method and apparatus for processing intra-prediction-based video signal | |
| JP4528441B2 (en) | Hierarchical motion estimation processing and apparatus using block matching method and integrated projection method | |
| RU2182727C2 (en) | Method for searching motion vectors of parts in amplitude images | |
| DE60307354T2 (en) | Chrominance motion vector rounding | |
| Saldanha et al. | Complexity analysis of VVC intra coding | |
| DE60306011T2 (en) | Rounding control for multi-level interpolation | |
| Montrucchio et al. | New sorting-based lossless motion estimation algorithms and a partial distortion elimination performance analysis | |
| US20170223378A1 (en) | Intra-frame pixel prediction method, encoding method and decoding method, and device thereof | |
| JP4564564B2 (en) | Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program | |
| US7471725B2 (en) | Segmented motion estimation with no search for small block sizes | |
| CN101326550A (en) | Motion Estimation Using Prediction-Guided Decimation Search | |
| Al-Najdawi et al. | Employing a novel cross-diamond search in a modified hierarchical search motion estimation algorithm for video compression | |
| US11388397B2 (en) | Video picture component prediction method and apparatus, and computer storage medium | |
| Duarte et al. | Fast affine motion estimation for VVC using machine-learning-based early search termination | |
| TW201904295A (en) | Improved non-local adaptive loop filter processing | |
| RU2408160C1 (en) | Method for finding vectors of part movement in dynamic images and device for its realisation | |
| WO2004064403A1 (en) | Efficient predictive image parameter estimation | |
| KR102415261B1 (en) | Methods for intra-coding of digital images and corresponding decoding methods | |
| US20100253854A1 (en) | Motion estimation method | |
| KR101413154B1 (en) | Device for correcting sample adaptive offset applied for high efficiency video coding decoder | |
| CN101483713A (en) | Deinterleaving method based on moving target | |
| US11528485B2 (en) | Encoding apparatus and program | |
| Soongsathitanon et al. | Fast search algorithms for video coding using orthogonal logarithmic search algorithm | |
| Kumar et al. | A novel method for image compression using spectrum |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20130811 |