[go: up one dir, main page]

BG112856A - Система и метод за разпознаване на геометрични форми - Google Patents

Система и метод за разпознаване на геометрични форми Download PDF

Info

Publication number
BG112856A
BG112856A BG112856A BG11285618A BG112856A BG 112856 A BG112856 A BG 112856A BG 112856 A BG112856 A BG 112856A BG 11285618 A BG11285618 A BG 11285618A BG 112856 A BG112856 A BG 112856A
Authority
BG
Bulgaria
Prior art keywords
parallelogram
image
images
space
vertices
Prior art date
Application number
BG112856A
Other languages
English (en)
Inventor
Daniele RANZATO
Ranzato Daniele
Original Assignee
"Ecomagic" Оод
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by "Ecomagic" Оод filed Critical "Ecomagic" Оод
Priority to BG112856A priority Critical patent/BG112856A/bg
Priority to EP19845830.9A priority patent/EP3903229B1/en
Priority to PCT/IB2019/061162 priority patent/WO2020136523A1/en
Publication of BG112856A publication Critical patent/BG112856A/bg

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

Настоящото изобретение се отнася до система и метод за разпознаване и измерване на геометрични форми. По-специално, изобретението има за цел бързо и ефективно разпознаване на геометрични форми, такива като правоъгълници или паралелограми, присъстващи в снимка или друго цифрово придобиване на изображение и за възстановяване на неговите размери и позиция. Методът може да се използва за измерване на отвори, като например за врати или прозорци, присъстващи върху фасадата на сграда, които са част от рамкирани изображения и получени от смартфон или подобни устройства. Също така, методът има възможност да осигури средство за обработване на изображенията, придобити чрез добавяне на цифрови графични елементи, кохерентни на изображението, обработено по размери и перспектива.

Description

СИСТЕМА И МЕТОД ЗА РАЗПОЗНАВАНЕ НА ГЕОМЕТРИЧНИ ФОРМИ
Област на изобретението
Настоящото изобретение и предпочитаните изпълнения, описани по-долу, по принцип се отнасят до система и до метод за разпознаване и измерване на геометрични форми. Поспециално, изобретението има за цел да разпознае геометрични форми, такива като правоъгълници или паралелограми, присъстващи на снимка, или получени в друго цифрово изображение и да възстанови неговите размери и позиция. По-специално, предложеното тук решение, може да се използва за бързо и ефикасно измерване на отвори, като например, на врати или на прозорци, които се намират на фасадата на сграда и са рамкирани със смартфон и, също така, е подходящо за осигуряване на инструмент за обработване на получените изображенията, чрез добавяне на цифрови графични елементи, съответстващи на изображението, обработено по размер и перспектива.
Предшестващо състояние на техниката
В технката са известни някои решения, които позволяват разпознаването и измерването на обекти, рамкирани, например, със смартфон.
Известни са и други решения за разпознаване на обекти и форми, които позволяват да се идентифицират характерни точки или референтни точки.
Документ CN107369150A осигурява метод и устройство за откриване на правоъгълен обект. Извършва се адаптацията, за да се получи многоъгълник, въз основа на контура на двоичното изображение и съседния ъгъл, включен в правоъгълния обект, а характеристиките за дължините на страните на включения ъгъл се използват за осигуряване откриването на целевия правоъгълник. Целевият правоъгълник се открива въз основа на включения съседен ъгъл и дължините на страните на включения ъгъл, дори ако частта от страните или частта от върха на правоъгълника е екранирана, залепена или повредена, при включване само на два съседни ъгъла и дължините на страните на включените ъгли. Методът и устройството за откриване на правоъгълния обект могат да определят целевия правоъгълник и следователно те могат действително да открият обекта, за да се подобри надеждността на откриването на целта.
Документ US5808623A разкрива многоходов алгоритъм за прилагане на трансформация на перспективна при четиристранни изображения, чрез най-малко двуфазен процес за вземане на проби едномерно за всяко измерение. Всяка фаза представлява трансформация на перспективата от правоъгълник до трапец с паралелни страни, които са паралелни на съответните страни на правоъгълника. По-конкретно, всяка фаза включва преминаване на ракурса в измерение (вертикално за хоризонталните паралелни страни, хоризонтално за вертикалните паралелни страни), последвано от преминаване на трапецовидния псевдо-разрез в другото измерение. Следователно, в първата фаза, изходният правоъгълник се трансформира в един първи междинен трапец с пралелни хоризонтални или паралелни вертикални страни. Във втората фаза, ограничителната рамка на този междинен трапец (т.е. най-малкият правоъгълник, ориентиран по оста, съдържаща трапеца) се трансформира във втора трапецовидна цел с паралелни вертикални или паралелни хоризонтални страни (т.е. противоположна на междинния трапец), която ограничава крайния четириъгълник.
По този начин, чрез трансформиране на ограничаващата рамка на междинния трапец, ъглите на междинния трапец се картографират в ъгли на целевия четириъгълник. Изобретението има две предимства по отношение на процесите от предшестващото ниво на техниката: макар че за всеки ред или колона трябва да се извършат някои сложни изчисления, изчисленията за пиксел са много по-прости; и тъй като резултатната форма е прост трапец (напомняме, че правоъгълникът е трапец) лесно е, процесът да се контролира във всяка фаза на повторно вземане на проба, за да се гарантира, че тези форми са постигнати и, резултатът изглежда стабилен.
Документ US20130335575А1 описва как референция в непозната среда се генерира в движение за позициониране и проследяване. Референцията се произвежда в процес отгоренадолу, чрез улавяне на изображението на равнинен обект с предварително зададена геометрична форма, откриване на пикселите на края на равнинния обект и, след това, откриване на множество линейни сегменти от крайните пиксели. Множеството линейни сегменти могат след това да се използват за откриване на равнинния обект в изображението, въз основа на предварително зададената геометрична форма. Определя се начална поза на телекамерата по отношение на равнинния обект и се нанася с помощта на краищата на равнинния обект.
Оказва се, въз основа на извършения анализ, че алгоритмите, които работят в тази област, не осигуряват ни най-малка специфичност, поради не така простото определяне на търсената информация и липсата на „генерални“ методи за постигане на оптимални резултати.
Техническа същност на изобретението
Следователно, с настоящата заявка за патент са осигурени система и метод, които включват форми за реализация, решаващи по-горе споменатите и други ограничения на известните предшестващи решения.
Описана е система за обработка на цифрова информация, включваща система за получаване на изображения, получени от триизмерна среда, съдържаща обекти и форми, които са прехвърлени в полученото изображение, чрез трансформация на перспектива.
Тази система прилага различни методи, за да се стигне до определяне на информацията за размерите и позициите на елементарни геометрични фигури, идентифицирани в самите изображения.
Системата осигурява използването на информацията, обработвана от изходните изображения, в множество форми, като при всички се откроява възможността за създаване на триизмерно цифрово съдържание, което да се интегрира в оригиналните изображения, за да се разшири визуалното съдържание на същите. Обаче, не по-малко важна е възможността за използване на информацията за размера, позицията и ориентацията на идентифицираните геометрични форми, за получаване на метричното описание на възстановената сцена.
По-специално, тук предложеното решение позволява да се извършват линейни изчисления за определяне на размерите на идентифицираната геометрична форма. По този начин, става въможно, решението да се използва и с устройства с намален изчислителен капацитет, такива като например смартфонит.
Един специфичен случай на реализация показа, че след като, даден отвор, е рамкиран със смартфон, като врата или прозорец на фасадата на сграда и е направена снимка, е възможно на екрана да се появи мрежа от четири върха, които могат да се преместват по екрана, така че да се позиционират в съответствие с върховете на рамкирания обект. След тази операция, решението позволява да се разпознае рамкираната и снимана геометрична форма и е в състояние да възстанови размерите на тази геометрична форма. Тези разработки предвиждат, че снимката и рамката на обекта (отвор - помещение) се променят следствие на перспективата, тъй като не винаги е възможно позиционирането да е напълно успоредно на измерваните обекти.
В края на обработката, решението позволява да се получат размерите на представляващия интерес обект и позволява да се наслагват всякакви отвори от идентифицираните обекти, избрани от дадена библиотека или каталог, като например парапети, порти, врати, завеси или други артфакти, изобщо.
Следователно, благодарение на тук описаното решение, е възможно да се визуализират припокриващи се обекти, които да бъдат оразмерени и позиционирани, без да се деформират, така че да се адаптират към отвора, както е сниман (т.е. да бъдат показани в съответствие със същата перспектива), за да покажат крайния ефект, който би могъл да се получи, например, чрез позициониране на прозорец в този отвор. По този начин е възможно да се обмисли всеки детайл, например да се прецени използването на единична врата или на двойна врата, и крайният потребител да е в състояние да види ефекта, който може да се получи чрез монтиране на такива обекти върху отворите, представляващи интерес, така че да бъде в състояние да избере вида продукт, който създава най-добро впечатление у потребителя.
Описаното решение позволява да се получат необходимите данни за размера на отвора (рамкираният обект), чрез прилагане на изчисления и чисто линейни връзки, като се избягва използването на тежки квадратични изчисления, които не се изпълняват лесно с такива инструменти, като смартфоните, които са с ограничен изчислителен капацитет.
Кратко описание на фигурите
Другите характеристики и предимства на изобретението ще станат очевидни след прочита на следващото описание, дадено като пример, а не за ограничаване, с помощта на фигурите, илюстрирани в приложените таблици, на които:
Фигура 1 показва поточната диаграма за анализ на изображения с идентификация на геометрични фигури;
Фигура 2 показва представянето на пинхол модела;
Фигура 3 показва ограниченията на една примерна конструкция на паралелограм;
Фигура 4 показва изображението на използваната координатна система;
Фигура 5 показва първата стъпка за получаване на изображение;
Фигура 6 показва пример за автоматично извличане на върхове; и
Фигура 7 показва пример за приложение.
Частите на компонентите на апарата, съгласно настоящото описание, са представени на чертежите, когато е уместно, с конвенционални символи, показващи само онези специфични детайли, които имат отношение към разбирането на начините за реализация на настоящото изобретение, така че да не се подчертават детайли, които стават очевидни веднага за специалистите в областта на техниката, във връзка с тук докладваното описание.
Подробно описание на изобретението
На стъпка 1, от Фигура 1, се описва система за анализ на изображения от идентифицирани геометрични фигури и въвеждане на графично съдържание.
На стъпка 2 присъства система за получаване на единични, множествени или стереоскопични изображения. Първият компонент на системата за обработка е система за получаване на едно или повече изображения от триизмерна сцена. Фотографското заснемане може да бъде осъществено по начин да се запише единично изображение или времева последователност от изображения от единична фотокамера, или от двойка, или от множество фотокамери, които откриват двойки / множество кадри едновременно (виж Фигура 5).
На стъпка 3 присъства система за разпознаване на четириъгълници в изображенията (виж Фигура 6).
По-нататък, на стъпка 4 присъства проекторна система за изчисляване на размерите, позициите и ориентациите в пространството на паралелограмите.
По-нататък, на стъпка 5 присъства система за налагане на елементите, идентифицирани в различните обработени изображения.
По-нататък, на стъпка 6 присъства система за генериране на графичното съдържание и кохерентно въвеждане в изображенията.
И накрая, на стъпка 7 присъстват обработените изображения и данните, свързани с геометрични фигури, идентифицирани в заснетото пространство.
Описан е метод за обработка на цифрова информация, характеризиращ се със система за получаване на изображения, получени от триизмерна среда, съдържаща обекти и форми, които се прехвърлят, чрез трансформация на перспектива, в полученото изображение. Този метод прилага различни методи, за да се стигне до определянето на информацията за размерите и позициите на елементарни геометрични фигури, идентифицирани в самите изображения.
Методът на изчисление включва използването на информацията, обработена от изходните изображения, в множество форми, сред които се откроява възможността за създаване на триизмерно цифрово съдържание, което да се интегрира в оригиналните изображения, за да се разшири визуалното съдържание на същото, но не по-малко важна е и възможността да се използва информацията за размера, позицията и ориентацията на идентифицираните геометрични форми, за да има метрично описание на заснетата сцена.
На стъпка 2, първият компонент на метода, това е една система за получаване на едно или повече изображения от триизмерна сцена, която сега ще бъде описана по-подробно.
Фотографското заснемане може да се реализира така, че да се запише единично изображение или времева последователност от изображения, от една идинствена фотокамера, или от двойка фотокамери, които едновременно разкриват двойка фотограми. Примерите за такива сценарии са илюстрирани на Фигура 5.
Като известни, принципни параметри, присъщи на телекамерите се считат, по-специално, начинът на възприемане от сензора на размера, зрителното поле, фокусното разстояние, разделителната способност на изображенията и, в случай на стереовизуално заснемане, положението и относителната ориентация на двете фотокамери, (виж Фигура 2).
Получената цифрова информация, под формата на изображение, времевата информация и евентуално геометричните параметри се записват по подходящ начин и се предоставят за преминаване към следващите стъпки на обработката.
Системата се реализира и се калибрира с подходяща калибровка, която компенсира ефектите от промените на геометрията на изображението, произведени от оптичната система на фотокамерите, по такъв начин, че получената сцена разполага с нужните характеристики, за да бъде разработена със средства, принадлежащи към евклидовата геометрия.
На стъпка 3 е описана частта от метода за обработка, която има за цел да разкрие геометричното съдържание в рамките на получените изображения.
След като е зададена референтната система за равнинно изображение, обикновено в центъра на същата, с ос за хоризонталната абсциса и с ос за вертикалната ордината, се пристъпва към търсене на геометрична информация, която да се представи с координатите на изображението.
Чрез използването на техники за обработване на изображения, или е приноса на самия потребител, се пристъпва към идентифициране, във всяко изображение, на върховете на генеричните четириъгълници, присъстващи в същото, чрез ефекта за проекция на перспективата на краищата на обектите, присъстващи в триизмерната сцена, заснета от телекамерите.
Ако идентифицирането на върховете е получено със съдействието на потребителя, компютърният метод осигурява най-интерактивните инструменти за точно посочване на избраните точки от изображението, като върхове на присъстващия четириъгълник. Ако, вместо това, се продължи с автоматични инструменти, могат да се приложат множество познати техники за обработване на изображението до степен за определяне на координатите на въпросните върхове в изображението. Като неизчерпателен пример и с позоваване на Фигура 6, е възможно да се осъществи детектор за ръбове, например, посредством алгоритъма на Sobel, който произвежда изображение, съдържанието на което е информация, свързана с градиента на светлинния интензитет или с промените в хроматиката, което манифестира наличието на контури, свързани с обекти в записаната сцена. Така че, може да се процедира с търсене на сегменти направо в изображението, получени с цел да се идентифицират четирите страни, съставляващи генеричните четириъгълници, присъстващи в сцената; реализира се, например, чрез прилагане на трансформацията на Hough- техника, способна да произведе пространство, описващо ориентираните прави линии, представени в изображението на контурите, за да се идентифицират точките на пресичане на линиите на сегментите и, след това, точките на върховете на четириъгълниците.
След получаване на четирите двойки координати, представляващи върховете на всеки четириъгълник, разпознат в изображенията, тази информация се подготвя за преминаване към изчисляване на величините, характеризиращи идентифицираните геометрични фигури..
На стъпка 4 е приложена техника за обработка, наречена депроекция, разработена специално за това приложение, чиято цел се състои в прилагане на последователност от изчисления, които могат да определят параметрите за размерите и позициите на геометричната фигура, присъстваща в сцената, заснета от фотокамерите, която, в резултат на проекцията на перспективата, е генерирала четириъгълника, идентифициран в изображението, чрез изчислителната система на предходната стъпка.
Осъществяването на устройството за обработка по депроекция, основава своя принцип на действие на математически модел, който демонстрира съществуването на двукомпонентна връзка между елемент от семейството на равнинните фигури, идентифициран в множеството паралелограми, и четиристранния резултат от проекцията на споменатите паралелограми, идентифициран в получените изображения. По-специално, четириъгълникът е продукт от проекцията на перспективата от сензора на фотокамерата, чрез множество паралелограми, характеризиращи се с различни разстояния и размери, които произвеждат една и съща проектирана фигура или въпросният четириъгълник. За да се идентифицира един и само един от тях, е необходимо на алгоритъма да се предоставят, освен координатите на четирите върха в координатното пространство на изображението, но, също така, и мярката за характеристичната дължина на паралелограма, като например, дължината на една от страните или, за по-голяма практичност, разстоянието на един от върховете от началото на координатите, поставено за улеснение в ночката на фокуса на фотоапарата, която е получила изображението. Очевидно тази стойност е неизвестна, защото тя представлява степента на свобода, предизвикана от проекцията на едно триизмерно пространство върху простраството на двуизмерното изображението, поради което трябва да се предположи, или да се измери, или да се изчисли, или да се наложи по друг начин при липсата на допълнителна информация, полезна за определянето й.
В крайна сметка, на системата за депроектно изчисление са предоставени четири двойки координати на изображението по отношение на четирите върха на четириъгълника, идентифициран в изображението и измерени в заснетата среда на разстояние от фотокамерата на първия от четирите върха на заснетия паралелограм.
По-долу е описана изчислителната процедура, използвана за прилагане на алгоритъма за депроекция, както и математическия модел, който е в основата за надеждност на резултатите от обработката.
Изпълнението на системата за обработка, наречена депроекция, завършва, с осигуряването на видим набор от информации за паралелограма, което води до проекция с образа на идентифицирания генеричен четириъгълник. Всяко измерване се отнася до пространството, заснето от фотокамерата, в сравнение с референтната система, позиционирана в точката на фокуса на фотокамерата.
Сред получените резултати могат да се изброят: позициониране в пространството на върховете на паралелограма и следователно на неговата централна точка; размерът на страните на паралелограма; степента на правоъгълност на паралелограма, определена от ъгъла в основата на две съседни страни; ориентиране в пространството, по отношение на ориентацията на фотокамерата, към повърхността на паралелограма, изложен към фотокамерата за снимане, предоставено във всяко едно познато представяне (ротационен кватернион, посока на вектора и ъгъл на завъртане, ъгли на Ейлер и др.); хомографска матрица, която поставя в двупосочно отношение точките на пространството на изображението и точките, принадлежащи към равнината на паралелограма.
Цялата тази информация е резултат на разработването на системата за депроекция, приложена към данните на единичен четириъгълник, идентифициран в единично изображение.
Подобен информационен пакет се получава за всеки четириъгълник, идентифициран във всяко изображение, получено от обработващото устройство.
На стъпка 5 е описан обработващият блок на устройство, който свързва резултатите, получени под формата на информационни пакети, отнасящи се до всички идентифицирани четириъгълници, във всяко получено изображение.
Ако се работи с едно изображение, получените информационни пакети са най-пълното описание, получено от изследванията, като по този начин може да се продължи със следващата стъпка, като се действа директно върху тях.
Ако се работи е поредица от изображения, заснети от една фотокамера в предварително определени интервали от време, идентифицираните във всяко изображение паралелограми могат да се свържат една е друга. В тази ситуация могат да бъдат идентифицирани три случая.
Фотокамерата да е фиксирана в заснетото пространство и околната среда и може да показва наличието на неподвижни или движещи се геометрии: В този случай, идентифицираните паралелограми, свързани с едни и същи обекти във всяко изображение от получената последователност, означават определяне на кинематиката на обекта, открит в заснетото пространство.
Фотокамерата се движи в сцената и нейната позиция и ориентация по време на движението й са известни. В този случай, все още е възможно да се идентифицират хомоложните паралелограми в последователността на изображенията и да се определи кинематиката на движението. В по-специални случаи, освен това, е възможно да се изчисли допълнителна информация за разстоянията на паралелограмите по начин, подобен на този, използван при стереовизуалните изображения, описани по-долу.
Фотокамерата е в свободно движение на сцената и няма информация за нейното движение. В този случай, идентифицирането на хомоложните паралелограми в последователността от изображения, по принцип, не позволява да се изведе кинематиката на движението, но ако има информация, че една или повече паралелограми в сцената са неподвижни или кинематиката е известна, тогава е възможно да се определи кинематиката на движение на фотокамерата в пространството (позата), тъй като е противоположна на идентифицираното движение на паралелограма.
Ако се работи със стереовизуални изображения или те са получени от две (или повече) фотокамери, чието относително разстояние и относителна ориентация са известни, може да се извлече допълнителна информация от резултатите, изчислени на предишната стъпка. Трябва да се каже, че дори ако методът е приложим за променливи разстояния и ориентации между двете фотокамери, със сигурност е по-често да се намерят стереовизуални приложения, основани на асемблирането на двете фотокамери върху опора, която поддържа тяхното относително разстояние непроменливо и, която им позволява да бъдат ориентирани от гледна точка на паралелния изглед.
В по-често срещаните системи за обработка на стереовизуални изображения, разстоянието на някои ключови точки се определя, чрез идентифициране на двойката изображения от точките, които принадлежат към една и съща зона на същия обект в сцената, като се знае, че двете точки в двете изображения са хомоложни една на друга и, като се знае разстоянието, което разделя двете фотокамери, веднага може да се намери триъгълното положение на тези точки в пространството. В случая на такъв обработващ инструмент, прилагането на същия известен метод към върховете на хомоложните паралелограми, идентифицирани в двете изображения, означава определяне на разстоянието между тези точки.
Системата за депроективно изчисление, изисква собствената дистанция дори само за един от върховете на паралелограма в пространството на сцената, за да се определи еднозначно един единствен паралелограм (от една безкрайност от паралелограми, различни по мащабен фактор, свързан с разстоянието им). Следователно, използването на стереовизуални системи позволява да се извлече тази информация от двойка изображения, вместо конкретно да се изчислява или измерва.
Сега ще опишем стъпка 6, която осъществява обработката на графичното съдържание, свързано с получените изображения, характеризиращи се с това, че са размерно и позиционно координирани и кохерентни с изгледа в перспектива на изображенията.
Резултатът се получи, като се произведоха графични елементи, чието реализиране и позициониране се ръководеше от паралелограмите, идентифицирани с обработването на предходните стъпки. Например, ако четириъгълникът, присъстващ в изображението е проекция на правоъгълния борд на прозореца на жилище, е възможно да се начертае графичен елемент, представляващ завеса, която може да се вмъкне вътре в помещението, поради познаването на размерите на геометрията на прозореца и нейното позициониране и пространствена ориентация.
Информацията, обработена на предходната стъпка осигурява всички геометрични и кинематични елементи на всеки паралелограм, изведен от обектите, присъстващи в пространството на сцената, така че е възможно тази информация да се използва за получаване на метрични познания относно разпределението на обектите, които могат да бъдат открити в пространството.
Това позволява, тази информация да се използва директно в приложения, базирани на разбирането на съдържанието на изображението, които са типични за компютърното зрение, но също така и да се реализира среда, подходяща за изграждането на триизмерни цифрови графични елементи, подходящи по размер и по позициониране и пространствена ориентация, така че да се осигури интегриране в първоначалните изображения, като същевременно се запази последователността, както на пропорциите, така и на перспективата. Също така, придобивайки информация, свързана с кинематиката на паралелограма и следователно на обекта, която го характеризира, става възможно да се произведат и анимирани графики, които имат такава кохерентност и, следователно, интегрираност в получената последователност, което е типична дейност за приложения с повишена реалност.
Създаването на графично съдържание може да се извърши по начин, който не е съгласуван с изпълнението на тази система за обработка, т.е. получените числени резултати могат да бъдат използвани от оператор на CAD чертожен апарат за реализиране на желаното цифрово съдържание, за да се използва след това софтуер за редактиране на снимки за интегриране на реализираното съдържание в изходните изображения на обработката.
Настоящата система за обработка обикновено предвижда интегрирано прилагане на среда за създаване на такова съдържание в реално време, като се въззползва от предимствата на намаленото време за изчисление на обработката на депроекция. Следователно, тази стъпка включва създаването или интегрирането на съществуваща триизмерна среда, за проектиране на цифрово съдържание, способно да създава и след това да позиционира в чертожното пространство обекти с характеристиките, посочени в резултатите от предишни стъпки, и да генерира чрез интерпретация изображение, което е проекция на тези компютърни графични елементи, кохерентни на идентифицираните паралелограми, които направляват създаването на тези елементи и, по този начин, тази графична продукция да се смеси с изображенията на обекта, предмет на обработката.
Сега, стъпка 6 ще бъде описана по-подробно с позоваване на Фигура 7. По-специално, върху изходното изображение се наслагва най-напред системата за ръчно избиране на върха, а след това произведената графика, кохерентна на резултатите. Изображение от дясно показва припокриването на изходното изображение с графиката, генерирана в съответствие с метричната информация, получена от резултатите.
Неразделна част от системата за обработка е възможността за получаване на части от изходните изображения за да се използват, като текстури, приложими към повърхностите на триизмерните елементи, създадени посредствм операция за премахване на перспективата.
Тази операция, обикновено наричана bird’s eye 1гапз1Ьгт/трасформиране на птиче око/, е гарантирана от прилагането на хомографската трансформация между равнината, идентифицирана от откриването на паралелограма (по-специално, когато това е правоъгълник), и равнината на изображението, която е перпендикулярна на изгледа на фотокамерата. Матрицата за хомографска трансформация е част от информационния пакет, получен от обработката на четириъгълниците.
След успешно получаване на изображение без перспектива, триизмерната среда за проектиране се прилага правилно към изчертаните обекти. Например, ако се вземе предишния пример, ако изображението съдържа прозорец на жилище с дървени капаци, ще бъде възможно да се проектира отваряемо крило, което може да се позиционира в изображението в съответствие е формата на щората, с текстурен образ на дървена щора и да се анимира крилото, правейки го да изглежда като истински отвор за прозорец.
Тук стъпка 4 е описана подробно и по-специално системата за обработка, наречена депроектор, способна да определи паралелограма, представен в пространството, получено от информацията за позицията на върховете на четириъгълника, произведен от проекцията на паралелограма върху сензора за заснемане и от една допълнителна информация за измерването, свързана с размерите или разстоянията на паралелограма.
Еднозначното определяне на информацията за размерите и позицията на паралелограма, идентифициран в пространството, е гарантирано от математическия модел, описан по-долу, разработен специално за това приложение. Съществуването на тази двузначност между проектираните паралелограми и четириъгълници, в резултат на проекцията, позволява да се управлява, по принципен начин, търсенето на решения в множеството паралелограми, макар и често цел на търсенето да са правоъгълниците в пространството- най-често срещаните геометрични форми и често представляващи обичайни обекти на сцената.
Обработката на системата, става в последователност от стъпки, описани по-долу.
На стъпка 10 се получават параметрите и се формализира приложеният модел.
Изчислителната система е разработена с оглед на геометричната среда, в която е внедрено устройството за получаване на изображения, наречено камера, заедно с генеричен набор от обекти, представящи субектите за възстановяване на изображението, съгласно каноните на познатия модел на р1пйо1е'7пинхол- много малката дупчица (виж Фигура 2). Сред структурните параметри на системата за получаване на изображения, като известни се считат: размерът на оптичния сензор и фокусното разстояние или, алтернативно, полето на видимост (обикновено наричано FOV), от което се определя фокусното разстояние.
В пространството, наречено пространство на околната среда, се считат за присъстващи две координатни системи: една триизмерна по отношение на пространството на обектите и една двуизмерна по отношение на пространството на точките на изображението, такова пространство се нарича екран. Координатната система на пространството на околната среда (х, у, z) е разположена във фокусната точка на камерата за възстановяване, с ос z, насочена към екрана и перпендикулярна на него.
Координатната система на изображението (u, v) е разположена в центъра на екрана с двете оси, успоредни на съответните първи две оси на координатна система на околната среда. Екранът е поставен на разстояние, равно на фокусното разстояние на координатата z на референтната система на пространството на околната среда.
Позициите на върховете на четириъгълника, които трябва да се изработят, изразени в координатите на изображението, т.е. четирите двойки стойности, отнасящи се до разглежданите четири върха, се получават с алгоритъм. Обикновено, тази информация се установява от цифрово изображение, което се характеризира със специфична резолюция в пиксели, като в този случай, тъй като са известни размерите на сензора, който е уловил изображението, позициите в пикселите могат да бъдат директно преобразувани в мерки за дължина и, използвани в следващите изчисления. Редът на последователността от точките няма влияние, стига всички стъпки на обработката да поддържат една и съща последователност. В това описание е избран следният ред: първата точка от разглеждания екран е долната лява, а следващите точки се разглеждат по посока на часовниковата стрелка. Точките от пространството на изображението са означени с a, b, с, d, а съответстващите им, от паралелограма в пространството на околната среда, са означени е А, В, С, D.
Получи се мярка за дължина, която е необходима за еднозначно идентифициране на паралелограма, който проектира фигурата от разглеждания четириъгълник. Тази мярка е разстоянието от началото на координатната система от пространството на околната среда, за един от върховете на паралелограма, намиращ се в това пространство. В този случай, също така, няма значение кой връх се разглежда.
В това описание е избрано разстоянието от първата точка на получения екран, т.е. А.
На стъпка 20 се стига до изчисляване на единичните вектори, свързани с върховете на четириъгълника. Изчислява се първата информация, взета от параметрите, предоставени на системата, т.е. единичните вектори, които представят посоката, по отношение на началото на координатите от пространството на околната среда, за точките, свързани с върховете на четириъгълника, присъстващ на екрана. С подходящо линиране на координатната система от пространството на изображението, с тази от пространството на околната среда, координатите на точките, предоставени от параметрите могат да се използват, като първи две координати на системата от пространството на околната среда, а след това, вместо да се извличат осите от пространството на изображението и и v - да бъдат директно посочени като х и у.
Освен това, взема се под внимание, че позицията на екрана в пространството на околната среда, по конструкция е равна на фокусното разстояние на заснемащите камери.
За да се получат единични вектори, се определя коефициент за нормализиране на вектора (например за точка а):
Na = Sqrt(ax 2 + ау 2 + f2)
Където ах и ау са декартовите компоненти на точка а, Г е фокусното разстояние на системата за получаване на изображението, a Sqrt е извличането на квадратния корен.
След това се преминава към изчисляване на единичния вектор на тази точка, която е означена с Нл, отнасящо се до точка а:
da = (ax/Na, ay/Na, 1
Алтернативно, същото се прави и е останалите точки:
db = (bx/Nb. bv/Nb. 1 Nb = Sqrt(bx 2+by 2+^) de = (cx/Nc. cv/Nc. Nc = Sqrt(cx 2+cy 2+f2) dd = (dx/Nd. dv/Nd. Nd = Sqrt(dx 2+dy 2+f2)
Всеки вектор идентифицира права линия в пространството на средата, минаваща през началото на координатната система, която има особената характеристика да преминава през съответната точка в пространството на изображението, резултат, получен от конструирането на единичния вектор, но също и от съответстващия връх на паралелограма в пространството на околната среда, следствие на факта, че по дефиниция на проекцията, паралелограмът оговаря точка по точка на четириъгълника в пространството на изображението.
Следователно, позицията на върховете на паралелограма в пространството на околната среда се определя от съответстващия единичен вектор, умножен с коефициент, който не е нищо друго освен разстоянието на тази точка от началото на координатната система в пространството. Съответните коефициенти, необходими за изчисляване на позициите на върховете на паралелограма са означени с LA, LB, LC, LD, които представляват неизвестните на проблема, с изключение на първия, LA, който е предварително избран като мярка за допълнително разстояние, и минава като параметър.
На стъпка 30 са установени разчетните ограничения, удовлетворяващи модела.
Идентифицирането на точното решение на проблема минава през налагането на адекватни ограничения върху представянето на фигурата, очаквана като решение, т.е паралелограмът.
В разглежданият случай, връзката между четирите върха, взети от пространството на изображението е набор от паралелограми, не е произволен избор, а специфичното заключение на математически модел, който строго гарантира идентифицирането на паралелограмите, т.е. поелементарните четириъгълници, в които да се търси решението, демонстрацията на съществуващо и уникално. Най-простият случай, т.е. този на правоъгълниците, не е цел, а в действителност, по-специално е случай на паралелограм. Чрез изследване на ъгъла между две съседни страни на паралелограма е възможно да се определят случаите, т.е. групите от четири точки, които представляват проектирания правоъгълник.
Подходящите ограничения за идентифициране на паралелограма са следните (за по-точно обяснение вижте демонстрацията, описана по-нататък):
Ах - Вх + Сх - Dx = 0
Ay - By + Cy - Dy = 0
Az - Bz + Cz - Dz = 0 където точките А, В, C, D са изразени чрез техните компоненти. Векторно:
А-В+С-D=
На стъпка 40 е показана резолюцията на системата от уравнения и нейната валидност.
Както е споменато на стъпка 20, векторните уравнения за точките на върховете на паралелограма в пространството са:
A = LA .da В = LB . db С = LC . de
Взети за компоненти, заместващи тези уравнения в предишните уравнения на ограничението и обяснението по отношение на LA, се получава следното уравнение в матрична форма:
dbx dby db.
—de
-de —de.
dd dd dd.
LB
LC
LD
Това е нехомогенна система от линейни уравнения и, като такава, е възможно да се изчисли детерминантата на матрицата, за да се провери валидността на получените параметри. Ако изследваният четириъгълник не е дегенериран, математическият модел гарантира обратимостта на матрицата. Следователно, на тази стъпка, изчислителната система може да сигнализира, без да пристъпва към следващи изчисления, неадекватността на предоставените данни. В противен случай, ако данните са адекватни, условията за разрешимост гарантират съществуването на уникалното решение на проблема, както е посочено по-подробно при демонстрацията на математическия модел.
Техниките за решаване на системата от уравнения са множество и се отнасят до познати и широко използвани методи. Например, може да се процедира с инверсия на матрицата или с метода на Cramer, както и с използването на LU факторизацията или още по-добрата - QR факторизацията.
В края на крайщата, стойностите на LB, LC, LD се получават като решение, чрез техники за резолючия на 3x3 линейни системи, като по този начин се поддържа много нисък броят на операциите, необходими за числовото изчисление.
На стъпка 50 става определянето на върха в пространството на околната средата на паралелограма от решението.
След получаване на стойностите на неизвестните LB, LC, LD и вече се притежава стойността на LA, незабавно се определя точната позиция на върховете на идентифицирания паралелограм:
Ax = LA. dax Βχ = LB . dbx Cx = LC . dcxD
Ay = LA. day By = LB . dby Cy = LC . dcyD
A_ = LA da_ TL = LR dh. CL = T Cdr.П
Също така е възможно да се изчисли централната точка, тук означена с PC, на геометричната фигура, например посредством:
РСХ = (LA. dax + LC . dcx) / 2
РСУ = (LA. day + LC . dcy) / 2
PCZ = (LA. daz + LC . dcz) / 2
Следователно, полезно за идентифициране на барицентричната позиция на фигурата в пространството на околната среда, е нейното средно разстояние.
На стъпка 60 става определянето на геометричните величини, дефиниращи паралелограма от решението.
Резултатите, изчислени на предходните стъпки, позволяват да се определят, с прости геометрични отношения, всички величини, свързани с идентифицирания паралелограм.
Размерите на паралелограма са дадени от модула на векторите на две от съседните страни, например като се вземат предвид сегментите АВ и AD:
АВ = В - А да кажем, че това е височината: Н = | АВ |
AD = D - А да кажем, че това е ширината: L = | AD |
Могат да бъдат изчислени, векторите на диагоналите, чието равенство би означавало, че присъства правоъгълен паралелограм:
АС = С - А Дължина на диагонала кореспондент D1 = | АС |
BD = D - В Дължина на диагонала кореспондент D2 = | BD |
Ориентацията на повърхността на паралелограма, екпонирана по отношение на централната ос, снимана с камерата, т.е. оста z, може да бъде представена в множество форми. Например, може да бъде изчислен единичният вектор перпендикулярен на повърхността на паралелограма, за да се осигури посоката на видимата страна на същия и единичния вектор, паралелен на страната спрямо височината, т.е. АВ, за да се посочи въртенето по предишната ос по отношение на вертикалната ос на референтната система в пространството на околната среда, т.е. у.
Това са изчисленията на векторите:
FRONT = ( АС /1 АС | ) X ( BD/1 BD | ) ЦР = АВ/|АВ| където X представлява векторния продукт. Очевидно е, че е възможно да се изрази ориентацията на паралелограма по отношение на координатната система на камерата в много други форми, като например, осигуряване на поредица от ъгли на Euler или посредством ротационен кватернион. Във всички случаи, правилата за трансформация са известни и могат да се използват за удобство.
Изчислява се стойност, която позволява да се измери степента на перпендикулярност на съседните страни на паралелограма. Тези данни са полезни по отношение на факта, че често целта на търсенето на решение не е генеричен паралелограм, а по-специално правоъгълник. Поради неизбежните грешки, въведени от квантуването, дължащо се на резолюцията на обработените изображения, е възможно паралелограмът да е едно приближение на търсения правоъгълник и, като такъв, макар и да не е правоъгълник, съседните страни трябва да бъдат разумно близко до ъгъл от 90°.
Една стойност между 0 и 1, като индекс за тази перпендикулярност, може да се изчисли по следния начин:
ORTHO = < АВ /1 АВ |, AD /1 където “< , >” представлява скаларния продукт между векторите. Следователно, на тази стъпка, системата за изчисление е в състояние да определи дали резултатът идентифицира паралелограм на успоредник, само ако индексът за грешка не е изготвен правилно: ORTHO < ε, различаващ, за случаите при които е интересно да се идентифицират само правоъгълници, които представляват четириъгълник, присъстващ в изображението.
На стъпка 70 се дава дефиниция на хомографията, представена от паралелограма на решението.
Познаването на паралелограма, присъстващ в пространството на околната среда и, поспециално, неговата позиция и ориентация, позволява да се постигне един по-нататъшен резултат, т.е. възможността да се установи хомографската връзка между равнината на паралелограма и равнината на изображението.
Обикновено идентифицирането на хомографската матрица преминава през създаването на системи от уравнения със значителни по размер матрици, понякога в лошо физическо състояние, основани на познаването на хомоложните точки, както на изходната равнина, така и на дестинацията.
В разглежданият случай, от резултатите се знаят единичните вектори на равнините на паралелограма, т.е. векторите на съседните страни в точка А, както и позицията на вектора в паралелограма. Това позволява незабавно да се запише матрицата за ротационно транслиране от равнината на изображението и мястото на паралелограма.
Естествено, да се оперира с правоъгълници е по-подходящо, тъй като единичните вектори ще бъдат ортогонални, но нищо не пречи, при присъствието на паралелограм, да се ортогонализира, чрез модифициране на един от двата вектора (или дори и двата, при определени случаи), за да се получи подходяща декартова референция, като например:
(u', ν'): u' = AD; ν' = АВ; ν = ν'; u = u' - ν' * < u', ν' > / < ν', ν' >
(u, ν): ν = ν' / II ν II; u = и /1| и ||; Ортонормални единични вектори.
Тъй като осите в пространството на изображението умишлено са линирани с тези в пространството на околната среда, ротационната матрица R е в действителност матрицата, която има като колона вектори, идентифицираните единични вектори, докато векторната позиция на центъра на паралелограма, известна от решенията, е означена с t,
Преминавайки към използване на хомогенни координати, точката в равнината на изображението х=(х, у, 1), подобно на трансформираната точка Х=(Х, Y, 1) от равнината на паралелограма и трансформацията се указват с представянето на матричната хомография Н=К [R 11] (пропуска се мултипликативният параметър, който не оказва влияние):
х = К [ и, v, t ] X или дори х = Η X, където К е матрицата от присъщите параметри на камерата, които се считат за предварително известни. Естествено, тъй като това е хомография, матрицата Н е обратима, така че е лесно да се получи обратна връзка от картографията.
Използването на изчислителната процедура на депроектора е от особено значение и предимство не само за спецификата и пълнотата на предвиденото решение, но и за значителната простота на необходимите изчисления. Всъщност, тъй като е част от един много малък модел на линейно изчисление, целият алгоритъм може да бъде реализиран с малък брой операции с плаваща запетая, позволяващ при модерните микропроцесори да се получат времена за изчисление от порядъка на десетки или стотици микросекунди, особено полезен аспект за приложения в реално време и при мобилни устройства.
Описан е модел за улавяне на изображения, кйто се характеризира се с двуизмерен равнинен сензор с размери h х w и оптична система, характеризираща се с присъствието на фокусна точка на разстояние f от равнината на сензора, което моделира типичното устройство за получаване на изображенията от пространството на околната среда, обикновено наричано модел рт-1то1е7модел на малката дупчица/пинхол модел, както е илюстрирано на Фигура 2.
Една 3D координатната система се поставя в кореспонденция с точката на фокуса на тази оптична система, която има ос z, перпендикулярна на равнината на сензора и, насочена към заснетото пространство, така че равнината на сензора да е позиционирана по отрицателната посока на оста z, равна на фокусното разстояние, но има също така ос у, насочена към размера h на сензора и ос х, насочена към размера w на сензора. Нарича се екран, една равнина, която е със същите геометрични размери и ориентация на сензора и е паралелна на него, но е позиционирана по положителната посака на оста z, равна на фокусната дължина, характеризираща се с това, че е мястото на проекцията на точките, взети от пространството на околната среда, които ще имат позиция, идентична с тази на точките, проектирани в равнината на сензора, но без да страдат от отражението на осите, получено от преминаването на лъчите през точката на фокуса.
Позицията на точките върху повърхността на екрана се отнася до 2D координатна система, позиционирана в централната точка на екрана, осите и и v” на 2D лежат върху равнината на екрана и са такива, че да имат ос v” паралелна на оста у и ос и паралелна на оста х от 3D системата.
При дадената система от описания тип пинхол, всяко от двете Q на всички възможни четириъгълници е планирано в 2D върху равнината на екрана и всяко от двете Р на всички възможни паралелограми е планирано в 3D върху пространството на околната среда. Ако даден елемент е Q е a=(au,av), b=(bu,bv), c=(cu,cv), d=(du,dv) точките идентифицирани от върховете на q са изразени като координати на референтната система в 2D и, ако един елемент р е Р е A=(Ax,Ay,Az), B=(Bx,By,Bz), C=(Cx,Cy,Cz), D=(Dx,Dy,Dz), точките идентифицирани от върховете на р са изразени в 3D координатната система. След това, като се приеме елемент q □ □2 и при известни стойностите на координатите на неговите точки a, b, с, d и, ако к е разстоянието от началото но координатна система в 3D, дори само при една от тези точки, след това, маже да се получи един единствен паралелограм р □ UP, чиято проекция в равнината на екрана, генерира четириъгълника q
V д G Q con k=d(OR 3, A), 3! д G Р: pro
Като се вземе под внимание измерването на разстоянието к и зададеният четириъгълник ”q, който се намира на екрана, се демонстрира наличието на един единствен паралелограм р, присъстващ в пространството на околната среда, чиято проекция генерира q, характеризиращо се с разстояние ”к на един от неговите върхове от началото на координатна система в 3D. Разстоянието по отношение на точка А се разглежда като ”к, по произволен избор, но очевидно същите изводи ще се направят при избора на всеки друг връх на ”р.
Това дефинира четирите единични вектора, означени с da, db, de, dd, маркирани от началото на координатната система в 3D, насочени към точките a, b, е, d на екрана, идентифициращи върховете на четириъгълника q, или еквивалентно насочени към точките А, В, С, D в пространството на околната среда, идентифициращи върховете на търсения паралелограм. Тази еквивалентност е такава защото, точките a, b, с, d, по хипотеза, се явяват проекция върху екрана на точките А, В, С, D, тогава двойката точки а и А принадлежат към една и съща права линия, минаваща през началото Or3, както и двойките точки Ь и В, с и С, d и D.
След това, точките А, В, С и D се идентифицират от продукта от четирите единични вектора da, db, de, dd, респективно от четирите скалара, означени като LA, LB, LC и LD. Изчисляването на векторите е, както следва:
у = a, b, с, d
Ny = sqrt(yu 2 + yv 2 + f2) <ry = (y^ywf)/Ny
Сега ще се наложат множество условия, които да свържат точките А, В, С, D, за да се представят върховете на един равнинен паралелограм в 3D. За тази цел се процедира с конструирането на генеричен паралелограм, което започва от генеричен сегмент от линия L, чиито краища са означени с точките m=(mx,my,mz) и n=(nx,ny,nz) и с генеричен вектор S=(Sx,Sy,Sz), използван като вектор на изместването, виж Фигура 3.
Ако се разгледа втори сегмент от линията L', с краища m'=(m'x,m'y,m'z) и n'=(n'x,n'y,n'z), паралелен на L, но транслиран в пространството по такъв начин, че силният вектор S в точка ш от L идентифицира точка т' от L', като, следствие на паралелността на L и L', ще може да се каже, че точка п, също така, се премества в п' поради прилагането на същия вектор S за п. По този начин, чрез съединяване на линейните сегменти в едно и прилагане на двата вектора S към екстремните точки на L, се съставя равнинен паралелограм. Всеки равнинен паралелограм, в пространството, може да бъде съставен от подходящ сегмент L и подходящ вектор S.
С алгебрични термини, би могло да се каже, че е приложено следното:
т'= m + S : m'x = mx + Sx m'y = my + Sy m'z = mz + Sz di = |ac| n'= n + S : n'x = nx + Sx n'y = ny + Sy n'z = nz + Sz D2 = |BD|
Тогава m'x - n'x = mx + Sx - nx - Sx = mx - nx m'y - n'y = my + Sy - ny - Sy = my - nY m'z - n'z = mz + Sz - nz - Sz = mz - nz
C приемане на буквите А, В, C, D, съответно за точките m, η, η', ш', се получава системата:
Dx - Сх = Ах - Вх
Dy - Су — Ay - By
0,-^ = ^-8,
Или, с векторни термини:
A + С = В +
Това са уравненията, които заставят четириъгълната равнина да стане паралелограм.
С други думи, важи главното правило, че за един равнинен паралелограм в триизмерно пространство, сумата от векторите на върховете на големия диагонал е равна на сумата от векторите на върховете на малкия диагонал.
Ако представянето на точките А, В, С, D се обясни чрез единичните вектори da, db, de, dd, във векторна форма се получават:
LA . da - LB . db + LC . de - LD . dd = 0
Или, три уравнения в четирите неизвестни LA, LB, LC, LD. Последните, обаче, представляваат разстоянията на четирите съответни точки от началото на координатната система на пространството от околната среда и, тъй като, измежду тези хипотези, като известно се разглежда едно от тези разстояния, ако хипотетично това е LA, тогава, системата може да се пренапише по следния начин, за удобство, в матрична форма:
| dbx -dcxddx I
I dby -dcydd
I dbz -dczdd
I LB I I dax I
I LC I = LA I day I
I LD I I daz I
Резолюцията на линейната нехомогенна система от три уравнения с три неизвестни гарантира съществуването и уникалността на решението, ако рангът на пълната матрица е максимален. В този случай се определят всички неизвестни LB, LC, LD, а с тях и позицията на точките в пространството, представляващи върховете на паралелограма:
A = LA . da В = LB . db С = LC . de D = LD . dd
Ако пълната матрица няма максимален ранг, това би означавало наличие на линейна зависимост между колоните на пълната матрица, взети в групи по три. Тези колони, обаче, са единичните вектори, насочени към върховете на четириъгълника q. Тази линейна зависимост предполага линиране между върховете, присъстващи в равнината на екрана. Тъй като четириъгълникът се дегенерира, ако са линирани поне три от четирите му върха, при наличието на валиден четириъгълник, рангът винаги ще бъде максимален. Оказа се тогава, че винаги има едно и само едно решение, идентифицирано в множеството паралелограми.

Claims (13)

  1. ПАТЕНТНИ ПРЕТЕНЦИИ
    1. Метод за разпознаване на геометрични форми, включващ следните стъпки:
    - получаване на едно или повече изображения от триизмерна сцена,
    - откриване на най-малко един четириъгълник, ако присъства, в рамките на едно или повече получени изображения,
    - изпълняване на последователност от изчисления, способни да определят параметрите за размерите и позициите на геометричната форма, присъстваща в триизмерната сцена, като се поставят ограничения върху характеристиките на търсената геометрична форма, която, поради ефекта на проекционната перспектива, генерира четириъгълник, идентифициран в изображението от предходната стъпка;
    - извършване на свързване един с друг на получените резултати под формата на информационни пакети, свързани с всички четириъгълници, идентифицирани във всяко получено изображение, по начин да се реконструира разположението в пространството на обработените геометрични фигури.
  2. 2. Метод съгласно претенция 1, включващ следващата стъпка:
    - обработване на графичното съдържание, свързано с едно или повече получени изображения, като споменатото графично съдържание се характеризира с това, че е измерено и координатно позиционирано и кохерентно с изгледа в перспектива на едно или повече от получените изображения;
  3. 3. Метод съгласно една или повече от предходните претенции, при който на стъпка а) се получават единични, множество или стереоскопични изображения и фотографското заснемане се извършва така, че да се запише едно единствено изображение, или времева последователност от изображения от една единствена фотокамера, или от двойка, или от множество фотокамери, които едновременно разкриват двойки / множества кадри.
  4. 4. Метод съгласно една или повече от предходните претенции, при който на стъпка Ь) геометричното съдържание се идентифицира от потребител или с автоматични инструменти, които използват техники за обработване на изображения, способни да определят координатите на върховете на изображението, чрез прилагане на метод за детекция.
  5. 5. Метод съгласно претенция 4, при който на стъпка Ь) се извършва търсене на сегменти от права линия, вътре в полученото изображение, с цел идентифициране на четирите страни, съставляващи четириъгълниците, присъстващи в сцената, чрез прилагане на детектори за контури, последвано от трансформация по Hough.
  6. 6. Метод съгласно една или повече от предходните претенции, при който на стъпка с) се осигуряват четири двойки от координатите на изображението, свързани с четирите върха на четириъгълника, идентифициран в изображението и с измерването, в заснетата среда, на разстоянието на фотокамерата от един от четирите върха на заснетия четириъгълник.
  7. 7. Метод съгласно една или повече от предходните претенции, при който на стъпка с) като резултат се осигуряват, позицията в пространството на върховете на идентифицирания паралелограм, размерите на страните на паралелограма, степента на перпендикулярност на две съседни страни на паралелограма, ориентацията в пространството спрямо ориентацията на фотокамерата, от повърхността на паралелограма и хомографската матрица.
  8. 8. Метод съгласно една или повече от предходните претенции, при който стъпка d) се провежда в условия на избор в групата, включваща:
    dl) ако фотокамерата е фиксирана в пространството, кинематиката на обекта, открит в пространството се определя, посредством идентифициране на паралелограмата по отношение на обекта, открит в последователността от получените изображения;
    d2) ако фотокамерата е в движение в сцената и нейната позиция и нейната ориентация по време на движението са известни, кинематиката на обекта, открит в пространството, се определя посредством идентифициране на паралелограма по отношение на обекта, открит в последователността от получените изображения;
    d3) ако фотокамерата е в свободно движение в сцената, няма информация за движението на фотокамерата, но има информация за кинематиката на най-малко един открит паралелограм, кинематиката на движението на фотокамерата се определя в пространството.
  9. 9. Метод съгласно една или повече от предходните претенции, при който, в случай на стереовизуални изображения, се определя разстоянието до някои точки по отношение на обекти, присъстващи в двете изображения чрез триангулация, пригодена да осигури измерването на разстоянието на фотокамерата от един от четирите върха на заснетия паралелограм.
  10. 10. Метод съгласно една или повече от предходните претенции, при който на стъпка е) се произвежда поне един графичен елемент, чието оразмеряване и позициониране се определя от геометрията, позиционирането и ориентацията на идентифицирания паралелограм.
  11. 11. Метод съгласно предходната претенция 10, при който споменатият поне един графичен елемент е комбиниран с получените изображения.
  12. 12. Метод съгласно една или повече от предходните претенции, при който споменатата стъпка с) съдържа:
    - получаване (10) на изображението и на параметрите и формализиране на приложения модел;
    - на стъпка (20) изчисляването на единичните вектори, свързани с върховете на четириъгълника, намерен на стъпка Ь);
    - настройката (30) на уравненията, които ограничават откриването на четириъгълника в геометрията на паралелограма;
    - резолюцията (40) на системата от уравнения и проверка на нейната валидност;
    - определяне (50) на върховете в пространството на околната среда на паралелограма от решението;
    - определяне (60) на геометричните величини, определящи паралелограма от решението; и - дефиниране (70) на хомографията, представена от паралелограма от решението.
  13. 13. Система за разпознаване на геометрични форми, съдържаща една или повече фотокамери за рамкиране на триизмерна сцена и едно или повече устройства за обработване, за изпълнение на стъпките на метода, съгласно една или повече от претенциите от 1 до 12;
BG112856A 2018-12-28 2018-12-28 Система и метод за разпознаване на геометрични форми BG112856A (bg)

Priority Applications (3)

Application Number Priority Date Filing Date Title
BG112856A BG112856A (bg) 2018-12-28 2018-12-28 Система и метод за разпознаване на геометрични форми
EP19845830.9A EP3903229B1 (en) 2018-12-28 2019-12-20 System and method for the recognition of geometric shapes
PCT/IB2019/061162 WO2020136523A1 (en) 2018-12-28 2019-12-20 System and method for the recognition of geometric shapes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BG112856A BG112856A (bg) 2018-12-28 2018-12-28 Система и метод за разпознаване на геометрични форми

Publications (1)

Publication Number Publication Date
BG112856A true BG112856A (bg) 2020-06-30

Family

ID=69411479

Family Applications (1)

Application Number Title Priority Date Filing Date
BG112856A BG112856A (bg) 2018-12-28 2018-12-28 Система и метод за разпознаване на геометрични форми

Country Status (3)

Country Link
EP (1) EP3903229B1 (bg)
BG (1) BG112856A (bg)
WO (1) WO2020136523A1 (bg)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511501A (zh) * 2021-12-29 2022-05-17 杭州电子科技大学 利用图像点阵解析平面几何图形元素相关关系的方法
CN114898540A (zh) * 2022-04-02 2022-08-12 大连九州创智科技有限公司 一种基于几何部件模型的散料货场设备防碰撞预警方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114092690B (zh) 2020-08-06 2024-11-26 杭州睿琪软件有限公司 对象边缘识别和处理方法、系统及计算机可读存储介质
CN112139854B (zh) * 2020-09-28 2022-04-19 深圳数马电子技术有限公司 一种钥匙齿识别方法以及装置
CN112308946B (zh) * 2020-11-09 2023-08-18 电子科技大学中山学院 题目生成方法、装置、电子设备及可读存储介质
CN115375717A (zh) * 2021-05-17 2022-11-22 广州视源电子科技股份有限公司 一种几何图形信息提取方法、装置、设备及存储介质
CN119646953B (zh) * 2025-02-17 2025-04-29 杭州数盟脉搏科技有限公司 基于造景特征迁移的造景方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2501921B (en) * 2012-05-11 2017-05-03 Sony Computer Entertainment Europe Ltd Augmented reality system
US10909719B2 (en) * 2016-12-21 2021-02-02 Huawei Technologies Co., Ltd. Image processing method and apparatus
EP3416092A1 (en) * 2017-06-16 2018-12-19 Thomson Licensing Method and devices to optimize marker management for pose estimation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511501A (zh) * 2021-12-29 2022-05-17 杭州电子科技大学 利用图像点阵解析平面几何图形元素相关关系的方法
CN114898540A (zh) * 2022-04-02 2022-08-12 大连九州创智科技有限公司 一种基于几何部件模型的散料货场设备防碰撞预警方法
CN114898540B (zh) * 2022-04-02 2024-01-09 大连九州创智科技有限公司 一种基于几何部件模型的散料货场设备防碰撞预警方法

Also Published As

Publication number Publication date
WO2020136523A1 (en) 2020-07-02
EP3903229C0 (en) 2024-10-30
EP3903229B1 (en) 2024-10-30
EP3903229A1 (en) 2021-11-03

Similar Documents

Publication Publication Date Title
BG112856A (bg) Система и метод за разпознаване на геометрични форми
US10916033B2 (en) System and method for determining a camera pose
Weber et al. Automatic registration of unordered point clouds acquired by Kinect sensors using an overlap heuristic
Prescott et al. Line-based correction of radial lens distortion
US9965870B2 (en) Camera calibration method using a calibration target
JP5580164B2 (ja) 光学情報処理装置、光学情報処理方法、光学情報処理システム、光学情報処理プログラム
US7106898B2 (en) 3D scanning using shadows
US10762654B2 (en) Method and system for three-dimensional model reconstruction
Bouguet et al. 3D photography using shadows in dual-space geometry
JP2011253376A (ja) 画像処理装置、および画像処理方法、並びにプログラム
KR19990028281A (ko) 패럴랙스에 기반을 둔 기술을 사용한 이미지 조합 방법 및 시스템
CN111627071B (zh) 一种测量电机旋转精度的方法、装置和存储介质
CN113706635B (zh) 一种基于点特征和线特征融合的长焦距相机标定方法
Gonzalez‐Aguilera et al. Forensic terrestrial photogrammetry from a single image
Maimone et al. A taxonomy for stereo computer vision experiments
Uyanik et al. A method for determining 3D surface points of objects by a single camera and rotary stage
Zhu et al. Gamma/X-ray linear pushbroom stereo for 3D cargo inspection
Martins et al. Camera calibration using reflections in planar mirrors and object reconstruction using volume carving method
Ahmadabadian Photogrammetric multi-view stereo and imaging network design
Aslan et al. Automatic calibration of camera networks based on local motion features
Todorov Multi-camera Calibration
Klette et al. On design and applications of cylindrical panoramas
Remondino et al. Photogrammetric calibration of image sequences acquired with a rotating camera
Fusiello Three-dimensional vision for structure and motion estimation
CN116597000A (zh) 一种基于cnn模型的多相机融合方法