KR102603424B1 - 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법, 장치 및 컴퓨터-판독가능 매체 - Google Patents
뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법, 장치 및 컴퓨터-판독가능 매체 Download PDFInfo
- Publication number
- KR102603424B1 KR102603424B1 KR1020220077453A KR20220077453A KR102603424B1 KR 102603424 B1 KR102603424 B1 KR 102603424B1 KR 1020220077453 A KR1020220077453 A KR 1020220077453A KR 20220077453 A KR20220077453 A KR 20220077453A KR 102603424 B1 KR102603424 B1 KR 102603424B1
- Authority
- KR
- South Korea
- Prior art keywords
- event
- image
- landmark
- event classification
- reliability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2a 내지 2b는 일 실시예에 따른 이미지 내 얼굴 영역을 검출하는 방법을 설명하기 위한 예시적인 도면이다.
도 3은 일 실시예에 따른 얼굴 영역 내 랜드마크를 검출하는 방법을 설명하기 위한 예시적인 도면이다.
도 4는 일 실시예에 따른 이미지의 이벤트를 분류하는 방법을 설명하기 위한 예시적인 도면이다.
도 5는 일 실시예에 따른 이미지에 대한 이벤트 분류 결과 예시를 설명하기 위한 도면이다.
도 6a 및 6b는 일 실시예에 따른 랜드마크 포인트의 신뢰도 정보를 산출하는 방법을 설명하기 위한 예시적인 도면이다.
도 7a 및 7b는 일 실시예에 따른 이미지에 대한 신규 이벤트 분류를 결정하는 방법을 설명하기 위한 예시적인 도면이다.
도 8a 및 8b는 일 실시예에 따른 랜드마크 포인트의 신뢰도를 산출하는 방법을 설명하기 위한 예시적인 도면이다.
도 9는 일 실시예에 따른 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법을 설명하기 위한 흐름도이다.
도 10은 일 실시예에 따른 이미지 이벤트 분류 결정 장치의 블록도이다.
110: 얼굴 검출 모델
121: 랜드마크 검출 모델
122: 이벤트 분류 모델
130: 후처리 모듈
200: 이미지
210: 슬라이딩 윈도우
220: 얼굴 영역
300: 얼굴 영역
310: 랜드마크
410: normal
420: phone
430: smoke
440: mask
510: 이미지 이벤트 분류 결과가 명확한 그룹의 이미지
530: 이미지 이벤트 분류 결과가 불명확한 그룹의 이미지
610: 원본 이미지
631: 복수의 랜드마크 포인트들
651: 신뢰도 정보
620: 이미지 이벤트 분류 결과
632: 타켓 랜드마크 포인트
652: 타겟 랜드마크 포인트의 신뢰도 정보
710: 이미지 이벤트 분류 결과
711: mask 이벤트 분류 결과
712: mask 이벤트 분류 결과
730: 랜드마크 포인트의 신뢰도 정보
731: 제1 랜드마크 포인트의 신뢰도 정보
732: 입이 가려졌다는 가려짐 정보
733: 제2 랜드마크 포인트의 신뢰도 정보
734: 입이 가려지지 않았다는 가려짐 정보
750: 신규 이벤트 분류
751: 마스크 착용 중 신규 이벤트 분류
752: 턱스크 착용 중 신규 이벤트 분류
1000: 이미지 이벤트 분류 결정 장치
1010: 통신부
1020: 프로세서
1030: DB
Claims (11)
- 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법에 있어서,
제1 뉴럴 네트워크 모델에 입력 데이터로써 이미지를 입력하고, 상기 제1 뉴럴 네트워크 모델의 출력 데이터로써 상기 이미지에 대한 이벤트 분류 및 상기 이벤트 분류에 관한 신뢰도를 획득하는 단계; 및
상기 획득된 이벤트 분류가 제1 이벤트인 것에 응답하여, 상기 제1 이벤트에 매칭되는 랜드마크 포인트의 신뢰도 정보를 획득하고, 상기 신뢰도 정보에 기초하여 상기 랜드마크 포인트의 가려짐 정보를 획득하는 단계; - 상기 가려짐 정보는 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 높은 신뢰도 정보에 기초하여 획득되는 제1 가려짐 정보와 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 낮은 신뢰도 정보에 기초하여 획득되는 제2 가려짐 정보를 포함함 - 및
상기 이벤트 분류, 상기 이벤트 분류에 관한 신뢰도 및 상기 랜드마크의 가려짐 정보를 조합하여 상기 이미지에 대한 이벤트를 상기 제1 이벤트 또는 상기 제1 이벤트와 연관되는 제2 이벤트 중 어느 하나로 결정하는 단계; 를 포함하고,
상기 결정하는 단계는,
상기 제1 뉴럴 네트워크 모델에 의해 상기 이미지에 대한 상기 이벤트가 상기 제1 이벤트로 분류된 것에 관한 신뢰도가 소정의 값 이상인 경우에, 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 제2 가려짐 정보를 더 고려하여 상기 이미지에 대한 상기 이벤트를 상기 제2 이벤트로 변경하거나
상기 제1 이벤트로 분류된 것에 관한 신뢰도가 소정의 값 이하인 경우에, 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 제1 가려짐 정보를 더 고려하여 상기 이미지에 대한 상기 이벤트를 상기 제2 이벤트로 변경하는 단계를 포함하며,
상기 제2 이벤트는, 제1 뉴럴 네트워크 모델이 상기 이미지에 대해 분류할 수 없었던 신규 이벤트 분류인, 방법. - 삭제
- 삭제
- 제1 항에 있어서,
상기 랜드마크 포인트의 신뢰도 정보는,
제2 뉴럴 네트워크 모델에 입력 데이터로써 상기 이미지와 관련된 관련 이미지를 입력하고, 상기 관련 이미지에서 복수의 랜드마크 포인트들을 탐지하여, 상기 복수의 랜드마크 포인트들 각각에 대해 산출되는 신뢰도 정보인, 방법. - 제4 항에 있어서,
상기 랜드마크 포인트의 신뢰도 정보는,
상기 이벤트 분류 결과에 기초하여, 상기 복수의 랜드마크 포인트들 중에서 결정된 타겟(target) 랜드마크 포인트의 신뢰도 정보인, 방법. - 제5 항에 있어서,
상기 타겟 랜드마크 포인트는,
상기 복수의 랜드마크 포인트들을 하나 이상의 영역으로 구분하고, 상기 영역 중에서 상기 이벤트 분류 결과에 기초하여 적어도 어느 하나의 영역을 선택하여, 상기 선택된 영역에 포함되는 랜드마크 포인트로써 결정되는 것인, 방법. - 제4 항에 있어서,
상기 랜드마크 포인트의 신뢰도 정보는,
상기 복수의 랜드마크 포인트들 각각에 대한 회귀 분석(regression) 과정을 통해 산출되는 신뢰도 정보인, 방법. - 제7 항에 있어서,
상기 회귀 분석 과정은,
상기 복수의 랜드마크 포인트들 각각에 대해 복수의 좌표를 결정하고, 상기 복수의 좌표 각각에 대한 신뢰도를 산출하여, 상기 복수의 좌표 각각에 대한 신뢰도 중 가장 높은 신뢰도를 상기 복수의 랜드마크 포인트들 각각에 대해 산출되는 신뢰도 정보로 결정하는 과정인, 방법. - 제7 항에 있어서,
상기 회귀 분석 과정은,
상기 복수의 랜드마크 포인트들 각각에 대해 히트맵(heat map) 분포를 찾고, 상기 히트맵 분포상에서 중심이 되는 좌표를 연산하여, 상기 중심이 되는 좌표를 기준으로 상기 히트맵 분포의 확산 정도에 따라 상기 복수의 랜드마크 포인트들 각각에 대해 산출되는 신뢰도 정보를 결정하는 과정인, 방법. - 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 장치에 있어서,
적어도 하나의 프로그램이 저장된 메모리; 및
상기 적어도 하나의 프로그램을 실행함으로써 뉴럴 네트워크 모델을 구동하는 적어도 하나의 프로세서를 포함하고,
상기 적어도 하나의 프로세서는,
제1 뉴럴 네트워크 모델에 입력 데이터로써 이미지를 입력하고, 상기 제1 뉴럴 네트워크 모델의 출력 데이터로써 상기 이미지에 대한 이벤트 분류 및 상기 이벤트 분류에 관한 신뢰도를 획득하고,
상기 획득된 이벤트 분류가 제1 이벤트인 것에 응답하여, 상기 제1 이벤트에 매칭되는 랜드마크 포인트의 신뢰도 정보를 획득하여, 상기 신뢰도 정보에 기초하여 상기 랜드마크 포인트의 가려짐 정보 - 상기 가려짐 정보는 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 높은 신뢰도 정보에 기초하여 획득되는 제1 가려짐 정보와 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 낮은 신뢰도 정보에 기초하여 획득되는 제2 가려짐 정보를 포함함 - 를 획득하고,
상기 이벤트 분류, 상기 이벤트 분류에 관한 신뢰도 및 상기 랜드마크의 가려짐 정보를 조합하여 상기 이미지에 대한 이벤트를 상기 제1 이벤트 또는 상기 제1 이벤트와 연관되는 제2 이벤트 중 어느 하나로 결정하며,
상기 프로세서는,
상기 제1 뉴럴 네트워크 모델에 의해 상기 이미지에 대한 상기 이벤트가 상기 제1 이벤트로 분류된 것에 관한 신뢰도가 소정의 값 이상인 경우에, 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 제2 가려짐 정보를 더 고려하여 상기 이미지에 대한 상기 이벤트를 상기 제2 이벤트로 변경하거나
상기 제1 이벤트로 분류된 것에 관한 신뢰도가 소정의 값 이하인 경우에, 상기 제1 이벤트에 매칭되는 상기 랜드마크 포인트의 제1 가려짐 정보를 더 고려하여 상기 이미지에 대한 상기 이벤트를 상기 제2 이벤트로 변경하는 것을 포함하고,
상기 제2 이벤트는, 상기 제1 뉴럴 네트워크 모델이 상기 이미지에 대해 분류할 수 없었던 신규 이벤트 분류인, 장치. - 제1 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020220077453A KR102603424B1 (ko) | 2022-06-24 | 2022-06-24 | 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법, 장치 및 컴퓨터-판독가능 매체 |
| PCT/KR2023/008136 WO2023249307A1 (ko) | 2022-06-23 | 2023-06-13 | 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 장치 및 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020220077453A KR102603424B1 (ko) | 2022-06-24 | 2022-06-24 | 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법, 장치 및 컴퓨터-판독가능 매체 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR102603424B1 true KR102603424B1 (ko) | 2023-11-20 |
Family
ID=88974059
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020220077453A Active KR102603424B1 (ko) | 2022-06-23 | 2022-06-24 | 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법, 장치 및 컴퓨터-판독가능 매체 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102603424B1 (ko) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140240479A1 (en) * | 2013-02-28 | 2014-08-28 | Nk Works Co., Ltd. | Information processing apparatus for watching, information processing method and non-transitory recording medium recorded with program |
| KR102005150B1 (ko) | 2017-09-29 | 2019-10-01 | 이인규 | 머신 러닝을 이용한 얼굴 표정 인식 시스템 및 방법 |
| JP2021095117A (ja) * | 2019-12-16 | 2021-06-24 | エヌビディア コーポレーション | 顔のランドマーク及び関連する信頼値を使用したニューラルネットワークベースの顔分析 |
| US20220188537A1 (en) * | 2020-12-14 | 2022-06-16 | Shenzhen Horizon Robotics Technology Co., Ltd. | Behavior recognition method and apparatus, medium, and electronic device |
-
2022
- 2022-06-24 KR KR1020220077453A patent/KR102603424B1/ko active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140240479A1 (en) * | 2013-02-28 | 2014-08-28 | Nk Works Co., Ltd. | Information processing apparatus for watching, information processing method and non-transitory recording medium recorded with program |
| KR102005150B1 (ko) | 2017-09-29 | 2019-10-01 | 이인규 | 머신 러닝을 이용한 얼굴 표정 인식 시스템 및 방법 |
| JP2021095117A (ja) * | 2019-12-16 | 2021-06-24 | エヌビディア コーポレーション | 顔のランドマーク及び関連する信頼値を使用したニューラルネットワークベースの顔分析 |
| US20220188537A1 (en) * | 2020-12-14 | 2022-06-16 | Shenzhen Horizon Robotics Technology Co., Ltd. | Behavior recognition method and apparatus, medium, and electronic device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110249360B (zh) | 用于推荐产品的装置和方法 | |
| US12008686B2 (en) | Augmented reality map curation | |
| US11887215B2 (en) | Image processing apparatus and method for style transformation | |
| KR102400017B1 (ko) | 객체를 식별하는 방법 및 디바이스 | |
| US11126833B2 (en) | Artificial intelligence apparatus for recognizing user from image data and method for the same | |
| KR20230066300A (ko) | 전자 장치 및 그 동작 방법 | |
| US20210390673A1 (en) | Image-capturing device and method for controlling same | |
| KR102663375B1 (ko) | 음성 및 영상 자동 포커싱 방법 및 장치 | |
| CN110447232B (zh) | 用于确定用户情绪的电子设备及其控制方法 | |
| KR20220133147A (ko) | 이미지를 암호화하여 외부 서버에 업로드하기 위한 전자 장치 및 이의 제어 방법 | |
| KR102530045B1 (ko) | 전자 장치 및 그 동작 방법 | |
| CN113015984A (zh) | 卷积神经网络中的错误校正 | |
| KR102607208B1 (ko) | 뉴럴 네트워크 학습 방법 및 디바이스 | |
| KR102474246B1 (ko) | 복수 개의 전자 디바이스를 이용하여 신경망 모델을 처리하는 방법 및 시스템 | |
| WO2020226696A1 (en) | System and method of generating a video dataset with varying fatigue levels by transfer learning | |
| KR20190140519A (ko) | 전자 장치 및 그의 제어방법 | |
| US11327320B2 (en) | Electronic device and method of controlling the same | |
| US20230419721A1 (en) | Electronic device for improving quality of image and method for improving quality of image by using same | |
| KR102384878B1 (ko) | 동영상을 필터링하는 방법 및 장치 | |
| KR20190096752A (ko) | 컨텐츠에 대한 텍스트 코멘트를 생성하는 방법 및 전자 장치 | |
| KR102396794B1 (ko) | 전자 장치 및 이의 제어 방법 | |
| KR20210048271A (ko) | 복수 객체에 대한 자동 오디오 포커싱 방법 및 장치 | |
| KR102603424B1 (ko) | 뉴럴 네트워크 모델을 이용하여 이미지 이벤트 분류를 결정하는 방법, 장치 및 컴퓨터-판독가능 매체 | |
| KR102603425B1 (ko) | 이미지의 헤드 포즈를 결정하는 장치 및 방법 | |
| KR102697346B1 (ko) | 영상에서 오브젝트를 인식하는 전자 장치 및 그 동작 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220624 |
|
| PA0201 | Request for examination | ||
| PA0302 | Request for accelerated examination |
Patent event date: 20221205 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20220624 Patent event code: PA03021R01I Comment text: Patent Application |
|
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230215 Patent event code: PE09021S01D |
|
| AMND | Amendment | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20230629 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20230215 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
| X091 | Application refused [patent] | ||
| AMND | Amendment | ||
| PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20230629 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20230407 Comment text: Amendment to Specification, etc. |
|
| PX0701 | Decision of registration after re-examination |
Patent event date: 20231027 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20230927 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20230629 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20230407 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
| X701 | Decision to grant (after re-examination) | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20231114 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20231115 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |