WO2006121365A1

WO2006121365A1 - Formation d'images tridimensionnelles pour une videoconference

Info

Publication number: WO2006121365A1
Application number: PCT/RU2005/000258
Authority: WO
Inventors: Andrei Vladimirovich Klimov; Artem Leonidovich Yukhin
Original assignee: A4 Vision SA
Current assignee: Bioscrypt SA
Priority date: 2005-05-13
Filing date: 2005-05-13
Publication date: 2006-11-16
Anticipated expiration: 2007-11-13

Description

Формирование трехмерных образов для видеоконференции

Область техники

Изобретение относится к области информационных технологий, к формированию трехмерного образа объекта, в частности, лица человека- пользователя ПЭВМ во время сеансов связи в сети Интернет в реальном масштабе времени.

Уровень техники

Известен способ, WO 2004/082285 от 23.09.2004, обеспечения формирования трехмерного (3D) образа (стереоизображения) у пользователя при проведении видеоконференции, т.е. в реальном масштабе времени. Недостатком указанного способа является обязательное фиксированное положение пользователя относительно видеокамеры и экрана наблюдения и невозможность отображения собственно трехмерного образа на экране.

Известен способ, патентная заявка США N° 2005/0046698 от 03.03.2005, обеспечения формирования трехмерного (3D) образа (стереоизображения) у пользователя, предусматривающий передачу информации в сети Интернет в реальном масштабе времени. Способ предусматривает передачу информации о «cцeнe», которая наблюдается множеством пар видеокамер, и предусматривает свободное размещение объекта в рамках сцены. Указанный способ не позволяет формировать трехмерный образ на экране.

Известен способ, патент США N° 6028672 от 22.02.2000, формирования трехмерного (3D) образа, включающий получение изображений объекта с использованием, по крайней мере, двух видеокамер и последующую реконструкцию трехмерного образа. Этот способ обеспечивает формирование трехмерного изображения с высокой скоростью и может быть использован для видеоконференции. Недостатком данного способа, в основе которого лежит метод триангуляции, является обязательное фиксирование положение видеокамер и объекта относительно них.

Известен способ, европейская заявка JNk 1355274 от 22.10.2003, формирования трехмерного (3D) образа включающий получение изображений объекта с использованием, по крайней мере, двух видеокамер и последующую реконструкцию трехмерного образа. Недостатком данного способа, в основе которого лежит метод триангуляции, является обязательное фиксирование положение видеокамер. Хотя положение объекта относительно видеокамер не фиксируется, но большой объем вычислений не позволяет реконструировать трехмерный образ в реальном масштабе времени для видеоконференции.

Таким образом, из представленного уровня техники следует, что при использовании изображений объекта для видеоконференции либо не создают трехмерный образ на экране, либо накладываются жесткие ограничения на положение объекта перед видеокамерами. Кроме того, все известные способы предполагают фиксированное - априорно используемое в процессоре взаимное расположение видеокамер.

Известно устройство формирования трехмерного (3D) образа для видеоконференции, патент США N° 6028672 от 22.02.2000, которое включает две видеокамеры и соединенный с ними процессор. Недостатком известного устройства является обязательное фиксированное - априорно используемое в процессоре взаимное расположение видеокамер, что затрудняет их расположение при организации видеоконференции в различных условиях и при различных обстоятельствах. Кроме того, необходимо фиксированное расположение объекта - участника видеоконференции и требуется его подсветка.

Раскрытие изобретения

Изобретение направлено на обеспечение комфортного проведения видеоконференции по сети Интернет и позволяет произвольно установить видеокамеры перед началом видеоконференции, а пользователю свободно перемещаться во время видеоконференции, оставаясь в поле зрения видеокамер.

Достигаемый технический результат в способе формирования трехмерного образа для видеоконференции заключается в обеспечении формирования в ходе проведения видеоконференции, в реальном масштабе времени трехмерного образа пользователя при его перемещениях (поворотах) в поле зрения видеокамер и в определении взаимного расположения произвольно установленных перед началом видеоконференции видеокамер.

Достигаемый технический результат в обоих вариантах устройства формирования трехмерного (3D) образа для видеоконференции заключается в автоматическом определении взаимного расположения видеокамер после их произвольной установки перед началом видеоконференции и обеспечении формирования трехмерного образа пользователя (объекта) в реальном масштабе времени при его произвольном перемещении в поле зрения видеокамер.

Указанный технический результат достигается при использовании способа формирования трехмерного образа для видеоконференции, включающий регистрацию изображений объекта с использованием, по крайней мере, двух видеокамер и последующую реконструкцию в процессоре трехмерного образа отображаемого на экране. При этом получают пространственные спектры пар изображений, зарегистрированных первой и второй видеокамерами, и из них реконструируют трехмерный образ, а взаимное расположение видеокамер и объекта определяют по изменениям пространственных спектров пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер.

Реконструируют трехмерный (3D) образ путем построения томограммы из пространственных спектров ряда пар изображений, полученных первой и второй видеокамерами. Использование частотного пространства является основой алгоритма определения взаимного расположения видеокамер и объекта и реконструкции трехмерных образов в реальном масштабе времени.

Можно сначала определять взаимное расположение видеокамер и объекта с использованием пространственных спектров ряда пар изображений, а затем реконструировать его трехмерный образ.

Реконструкцию трехмерного образа объекта можно синхронизировать с кадровой разверткой видеокамер. При этом можно синхронизировать кадровые развертки первой и второй видеокамеры.

Изображение объекта может регистрироваться двумя или более пар видеокамер, тогда получают пространственные спектры каждой пары изображений, полученной соответствующей парой видеокамер, и из них реконструируют единый трехмерный образ объекта, а взаимное расположение всех видеокамер и объекта определяют по изменениям пространственных спектров пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер.

Указанный технический результат достигается при использовании устройства формирования трехмерного образа для видеоконференции, реализующего приведенный выше способ и включающего, по крайней мере, две видеокамеры и соединенный с ними процессор, а также мультиплексор, блок спектрального преобразования (сопроцессор) и блок памяти, через которые видеокамеры соединены с процессором, обеспечивающим: определение взаимного расположения видеокамер и объекта по изменениям пространственных спектров пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер и построение томограммы объекта с использованием хранящейся в блоке памяти информации о парах спектральных (пространственно — частотных) образов изображений, зарегистрированных первой и второй видеокамерами.

Блок спектрального преобразования предназначен для получения пространственных спектров изображений и может быть выполнен в виде блока быстрого преобразования Фурье.

Блок спектрального преобразования может быть выполнен также в виде блока Вейвлет - преобразования.

Устройство может включать дополнительно один или более блоков спектрального преобразования, при этом все блоки спектрального преобразования, являющиеся сопроцессорами, образуют кластер из сопроцессоров.

Устройство дополнительно может включать блок преобразования аналогового сигнала с видеокамер в цифровой перед их поступлением в мультиплексор.

Устройство дополнительно может включать соединенный с процессором дисплей, индицирующий нахождение объекта в поле зрения видеокамер и демонстрирующий его трехмерный образ.

Указанный технический результат достигается и при использовании устройства формирования трехмерного образа для видеоконференции, реализующего приведенный выше способ и включающего, по крайней мере, две видеокамеры и соединенный с ними процессор, а также мультиплексор, и блок памяти, через которые видеокамеры соединены с процессором, обеспечивающим: пространственно - частотное преобразование изображений, поступающих в процессор из мультиплексора; определение взаимного расположения видеокамер и объекта по изменениям пространственных спектров пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер и построение томограммы объекта с использованием хранящейся в блоке памяти информации о парах спектральных (пространственно - частотных) образов изображений, зарегистрированных первой и второй видеокамерами.

Краткое описание чертежей

На фиг.l изображена схема устройства, реализующего способ формирования трехмерного (3D) образа для видеоконференции.

Лучший вариант осуществления изобретения

Устройство, реализующее способ формирования трехмерных образов объекта 1, см. фиг. 1, включает видеокамеры (WЕВ-камеры) 2 и 3, мультиплексор с аналого-цифровым преобразователем 4, блок быстрого преобразования Фурье (сопроцессор) 5, блок памяти 6, процессор 7 и дисплей 8. Блок быстрого преобразования Фурье может дополняться несколькими соединенными с ним параллельно блоками быстрого преобразования Фурье (сопроцессорами), образующими, образующими вместе с сопроцессором 5 кластер 9.

Зарегистрированные двумя WЕВ-камерами изображения объекта после мультиплексора 4 последовательно поступают в блок быстрого преобразования Фурье 5, где преобразуются в пространственные спектры изображений и последовательно поступают в блок памяти 6, где хранятся попарно и используются процессором 7 для определения взаимного расположения WЕВ-камер 2 и 3 и восстановления томограммы. Работа процессора 7 по восстановлению томограммы синхронизирована с тактом регистрации пары плоских проекций, т.е. с кадровой разверткой WЕВ-камер 2 и 3.

Перед началом видеоконференции пользователь (объект) расставляет WЕВ-камеры 2 и 3 в удобном для себя положении. При этом контроль за своим нахождением в поле зрения WЕВ-камер 2 и 3 пользователь осуществляет по дисплею 8. Через дисплей 8 могут выдаваться рекомендации по последовательности поворотов и смещений пользователя 1 в поле зрения WЕВ-камер 2 и 3. В то же время можно ограничиться естественными движениями пользователя при подготовке к видеоконференции. Процессор 7 по изображениям пользователя 1, получаемых в различных ракурсах, определяет пространство Фурье образов пользователя, которое служит основой для восстановления томограммы. Чем более точно определено пространство Фурье образов, тем качественнее реконструируется трехмерное изображение пользователя. Операция восстановления томограммы осуществляется итерациями с использованием метода восстановления цифровых Фурье-голограмм, формируемых для каждой пары плоских проекций за счет выполнения вычисления преобразования Фурье от каждой проекции. Так осуществляется процесс "обучения" специализированной программы и одновременно осуществляется итерационный процесс восстановления трехмерного образа по парам плоских проекций.

Условием завершения выполнения обучения программы является согласие пользователя на завершение процесса обучения, выраженное соответствующей командой, вводимой пользователем, если последний удовлетворен полученным трехмерным изображением, которое он может наблюдать на дисплее 8. При выполнении каждого такта работы устройства (такта регистрации пары плоских изображений WЕВ-камерами) уточняется решение задачи восстановления томограммы с использованием Фурье - образов, регистрируемых со скоростью кадровой развертки каждой из WЕВ-камер. За счет применения известных методов решения задачи Радона, см. Г.Г. Левин, Г.Н. Вишняков, Оптическая томография. - M.: Радио и связь, 1989, стр. 10-12, на основе дискретной последовательности Фурье — образов проекций формируется текущая томограмма и итерационный процесс уточнения трехмерного образа объекта прерывается пользователем при достижении удовлетворительного, по его мнению, результата.

Поскольку время регистрации 2-х изображений, снимаемых с 2-х Wеb-камер, несоизмеримо мало по сравнению со временем существенного (для ухудшения качества изображений) смещения пользователя с ожидаемой скоростью в полях зрения Wеb-камер, процессы регистрации Wеb-камерами можно считать параллельными. При использовании многопроцессорной ПЭВМ параллельность обработки изображений можно считать абсолютной. Таким образом, достигается одновременная регистрация 2-х плоских проекций, по которым восстанавливается томограмма.

При произвольном перемещении пользователя в полях зрения Wеb- камер положение образа меняется, вообще говоря, случайным образом. Однако сдвиги в плоскости перпендикулярной оптической оси объектива WЕВ-камеры приводят к появлению фазовых множителей в преобразованиях Фурье, а именно: ехр [ - 2πj (υ_xΔx + υ_yΔy) ], где - υ_xΔ, υ_yΔ - соответствующие пространственные частоты, _Δx, _Δy, пространственный сдвиг системы XOY, связанной с пользователем, относительно неподвижной системы координат. Как известно, Фурье - голограмма инвариантна к положению объекта в плоскости регистрации. Цифровая Фурье-голограмма также, как и физическая, является Фурье - образом голографируемого объекта. Следовательно, передача пространственных частот в цифровых Фурье — образах инвариантна к положению объекта (пользователя). Это обстоятельство является основанием отказаться от жесткого позиционирования WЕВ-камер. Изменения касаются масштаба, определяемого линейным увеличением вдоль оптических осей каждой Wеb-камеры, однако состав пространственного спектра, т.е. взаиморасположение пространственных частот остается неизменным.

Поскольку обработка изображений может осуществляться в реальном масштабе времени, обучающая программа, может корректировать 3-х мерный образ объекта (пользователя) и в режиме эксплуатации. Иными словами, цикл "обучение - восстановление" может продолжаться многократно. Скорость формирования и передачи синтезируемых по предлагаемому способу динамических ЗD изображений существенно повышается при увеличении числа Wеb - камер, при этом число этих камер должно быть четным.

Claims

Формула изобретения

1. Способ формирования трехмерного образа для видеоконференции, включающий регистрацию изображений объекта с использованием, по крайней мере, двух видеокамер и последующую реконструкцию в процессоре трехмерного образа, отображаемого на экране, отличающийся тем, что получают пространственные спектры пар изображений, зарегистрированных первой и второй видеокамерами, и из них реконструируют трехмерный образ, при этом взаимное расположение видеокамер и объекта определяют по изменениям пространственных спектров пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер.

2. Способ по п. 1, отличающийся тем, что сначала определяют взаимное расположение видеокамер и объекта с использованием пространственных спектров ряда пар изображений, а затем реконструируют его трехмерный образ.

3. Способ по п. 2, отличающийся тем, что реконструкцию трехмерного образа объекта синхронизируют с кадровой разверткой видеокамер.

4. Способ по п. 3, отличающийся тем, что синхронизируют кадровые развертки первой и второй видеокамеры.

5. Способ по п. 1, отличающийся тем, что изображения объекта регистрируют двумя или более пар видеокамер и получают пространственные спектры каждой пары изображений, полученной соответствующей парой видеокамер, и из них реконструируют единый трехмерный образ объекта, а взаимное расположение всех видеокамер и объекта определяют по изменениям пространственных спектров пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер.

6. Устройство формирования трехмерного образа для видеоконференции, включающее, по крайней мере, две видеокамеры и соединенный с ними процессор, отличающееся тем, что дополнительно включает мультиплексор, блок спектрального преобразования и блок памяти, через которые видеокамеры соединены с процессором, обеспечивающим: определение взаимного расположения видеокамер и объекта по изменениям пространственно - частотных образов пар изображений в результате смещений и поворотов объекта в поле зрения, обоих видеокамер и построение томограммы объекта с использованием хранящейся в блоке памяти информации о парах пространственно - частотных образов изображений, зарегистрированных первой и второй видеокамерами.

7. Устройство по п. 6, отличающееся тем, что блок спектрального преобразования выполнен в виде блока быстрого преобразования Фурье.

8. Устройство по п. 6, отличающееся тем, что блок спектрального преобразования выполнен в виде блока Вейвлет — преобразования.

9. Устройство по п. 6, отличающееся тем, что дополнительно включает блок преобразования аналогового сигнала с видеокамер в цифровой перед их поступлением в мультиплексор.

10. Устройство формирования трехмерного образа для видеоконференции, включающее, по крайней мере, две видеокамеры и соединенный с ними пpoцeccop,oтличaющeecя тем, что дополнительно включает мультиплексор, и блок памяти, через которые видеокамеры соединены с процессором, обеспечивающим: быстрое преобразование Фурье изображений, поступающих в процессор из мультиплексора; определение взаимного расположения видеокамер и объекта по изменениям Фурье - образов пар изображений в результате смещений и поворотов объекта в поле зрения обоих видеокамер и построение томограммы объекта с использованием хранящейся в блоке памяти информации о парах Фурье - образов изображений, зарегистрированных первой и второй видеокамерами.