KR102082816B1 - 스트리밍 파일의 해상도 개선 방법 - Google Patents
스트리밍 파일의 해상도 개선 방법 Download PDFInfo
- Publication number
- KR102082816B1 KR102082816B1 KR1020190046954A KR20190046954A KR102082816B1 KR 102082816 B1 KR102082816 B1 KR 102082816B1 KR 1020190046954 A KR1020190046954 A KR 1020190046954A KR 20190046954 A KR20190046954 A KR 20190046954A KR 102082816 B1 KR102082816 B1 KR 102082816B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- neural network
- video data
- learning
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47202—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/222—Secondary servers, e.g. proxy server, cable television Head-end
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/239—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
- H04N21/2393—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2408—Monitoring of the upstream path of the transmission network, e.g. client requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
- H04N21/4666—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명의 실시 예에 따른 화질 개선 동작의 예시를 도시한 도면이다.
도 3은 본 발명의 실시 예에 따른 서버의 구성을 도시한 블록도이다.
도 4는 본 발명의 실시 예에 따른 자료 가공부의 구성을 도시한 도면이다.
도 5는 본 발명의 실시 예예 따른 신경망 학습부의 구성을 도시하는 도면이다.
도 6은 본 발명의 실시 예에 따른 사이즈 변경부에서 수행하는 사이즈 변경 동작의 예시를 도시한 도면이다.
도 7은 본 발명의 실시 예에 따른 딥러닝 학습 동작의 예시를 설명하기 위한 도면이다.
도 8은 본 발명의 실시 예에 따른 사용자 기기의 구성을 도시한 도면이다.
도 9는 본 발명의 실시 예에 따른 화질 개선용 신경망 파일의 생성 및 전송 과정을 도시한 도면이다.
도 10은 본 발명의 실시 예에 따른 추가 학습 기반의 특화 신경망 파일 생성 과정에 대하여 도시한 순서도이다.
110 : 통신부
120 : 저장부
130 : 제어부
131 : 자료 가공부
132 : 신경망 학습부
133 : 결과 평가부
131a: 사이즈 변경부
131b: 영상 분할부
131c: 특징영역 추출부
132a: 학습 중요도 확인부
132b: 유사 데이터 학습 지원부
132c: 신경망 파일 산출부
Claims (8)
- 스트리밍용 비디오 데이터를 제공하는 서버에서, 비디오 데이터를 가공하는 가공 단계;
상기 가공된 비디오 데이터에 기반하여 격자 생성 패턴 정보를 획득하고, 격자 생성 패턴 정보에 기반하여 상기 비디오 데이터의 해상도를 개선하기 위해 요구되는 신경망 파일을 생성하는 생성 단계;
사용자 기기로부터 스트리밍 요청을 수신하면, 요청된 비디오 데이터 및 상기 요청된 비디오 데이터의 해상도를 복원하는 데 요구되는 신경망 파일을 분할하여 상기 사용자 기기로 전송하는 전송 단계;를 포함하고
상기 생성 단계는
학습용 비디오 데이터의 특징 영역 또는 특정 프레임 묶음에 대하여 부여된 학습 중요도를 확인하고, 상기 학습 중요도가 의미하는 옵션 정보를 추출하는 학습 중요도 확인 단계; 및
학습용 비디오 데이터 중 원본 사이즈인 원본 데이터와, 기 설정된 비율로 축소된 데이터인 가공 데이터를 CNN 알고리즘에 투입하여 학습시키되,
인공 신경망에 상기 가공 데이터를 입력하여 얻은 연산 결과값와 상기 원본 데이터와의 일치율을 판단하여, 일치율이 기 설정된 값 이상이 되게 하는 인공 신경망의 파라미터 및 활성화 함수를 포함하는 신경망 파일을 생성하는 신경망 파일 산출 단계;를 포함하고,
상기 옵션 정보는 학습 횟수 및 유사 데이터를 통한 학습 수행 여부에 관한 정보를 포함하는 것을 특징으로 하는 해상도 개선 방법. - 제 1항에 있어서,
상기 생성 단계는
기 설정된 데이터 셋에 포함된 다수의 비디오 데이터를 기반으로 기본 신경망 파일을 생성하는 기본 신경망 파일 생성 단계;
획득된 임의의 신규 비디오 데이터가 추가 학습 조건을 만족하는 것으로 판단되는 경우, 상기 신규 비디오 데이터에 대한 추가학습을 수행하되, 상기 기본 신경망 파일을 적용한 인공신경망 알고리즘을 통해 추가학습을 수행하는 추가 학습 단계;
상기 추가 학습의 결과로 상기 신규 비디오 데이터의 다운스케일링 파일과, 상기 신규 비디오 데이터에 대응하는 특화 신경망 파일을 생성하는 특화 신경망 파일 생성 단계;를 포함하는 것을 특징으로 하는 해상도 개선 방법 - 제 2항에 있어서,
상기 추가 학습 단계는
상기 신규 비디오 데이터의 다운스케일링 파일을 상기 기본 신경망 파일에 기반한 해상도 복원 동작을 수행한 결과물의 SSIM(Structural Similarity), PSNR(Peak Signal-to-Noise Ration)의 값에 따라 추가 학습 조건을 만족하는지 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 해상도 개선 방법. - ◈청구항 4은(는) 설정등록료 납부시 포기되었습니다.◈제 1항에 있어서,
상기 가공 단계는
비디오 데이터를 분할하되, 이미지 객체의 일치율에 기반하여 일치율이 기 설정된 기준치 이상인 다수의 프레임들을 하나의 청크로 묶어, 다수개의 청크로 분할하는 분할 단계; 및
비디오 데이터를 구성하는 이미지의 사이즈를 원본 사이즈로부터 기 설정된 값만큼 축소시키는 1차 변경 동작을 수행하며, 선택적으로 1차 변경된 이미지를 원본 사이즈로 확대시키는 2차 변경 동작을 수행하는 사이즈 변경 단계;를 포함하는 것을 특징으로 하는 해상도 개선 방법. - ◈청구항 5은(는) 설정등록료 납부시 포기되었습니다.◈제 3항에 있어서,
상기 가공 단계는
비디오 데이터의 각 프레임 또는 분할 단위를 기준으로 특징 이미지가 포함된 특징 영역을 추출하고, 추출된 특징 영역에 대하여 학습 중요도를 부여하는 특징 영역 추출 단계를 포함하고,
상기 특징 영역은 콘텐츠 분야에 대응하는 이미지 객체 중요도가 기 설정값 이상인 이미지 객체를 포함하는 영역인 것을 특징으로 하는 해상도 개선 방법. - 삭제
- 제 1항에 있어서,
상기 생성 단계는
학습 중요도가 설정된 학습용 데이터를 학습할 시, 유사 데이터를 이용한 학습 수행 명령이 확인됨에 따라 학습 대상 이미지와 유사한 유사 데이터를 획득하는 동작을 수행하되, 해상도 및 색상 조합의 유사도에 기반하여 유사 데이터를 획득하는 유사 데이터 획득 단계;를 포함하는 것을 특징으로 하는 해상도 개선 방법. - 스트리밍용 비디오 데이터를 제공하는 서버에서, 비디오 데이터를 가공하는 가공 단계;
상기 가공된 비디오 데이터에 기반하여 격자 생성 패턴 정보를 획득하고, 격자 생성 패턴 정보에 기반하여 상기 비디오 데이터의 해상도를 개선하기 위해 요구되는 신경망 파일을 생성하는 생성 단계;
사용자 기기로부터 스트리밍 요청을 수신하면, 요청된 비디오 데이터 및 상기 요청된 비디오 데이터의 해상도를 복원하는 데 요구되는 신경망 파일을 분할하여 상기 사용자 기기로 전송하는 전송 단계;및
상기 사용자 기기로 전송된 분할된 비디오 데이터와, 상기 비디오 데이터의 해상도를 복원하는 데 요구되는 신경망 파일을 매칭하고, 상기 분할된 비디오 데이터를 상기 매칭된 신경망 파일로 인공 신경망 알고리즘 연산을 수행하여, 상기 분할된 비디오 데이터의 해상도를 복원하는 단계;를 포함하고
상기 생성 단계는
학습용 비디오 데이터의 특징 영역 또는 특정 프레임 묶음에 대하여 부여된 학습 중요도를 확인하고, 상기 학습 중요도가 의미하는 옵션 정보를 추출하는 학습 중요도 확인 단계; 및
학습용 비디오 데이터 중 원본 사이즈인 원본 데이터와, 기 설정된 비율로 축소된 데이터인 가공 데이터를 CNN 알고리즘에 투입하여 학습시키되,
인공 신경망에 상기 가공 데이터를 입력하여 얻은 연산 결과값와 상기 원본 데이터와의 일치율을 판단하여, 일치율이 기 설정된 값 이상이 되게 하는 인공 신경망의 파라미터 및 활성화 함수를 포함하는 신경망 파일을 생성하는 신경망 파일 산출 단계;를 포함하고,
상기 옵션 정보는 학습 횟수 및 유사 데이터를 통한 학습 수행 여부에 관한 정보를 포함하는 것을 특징으로 하는 해상도 개선 방법.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/KR2019/004891 WO2019209006A1 (ko) | 2018-04-24 | 2019-04-23 | 스트리밍 파일의 해상도 개선 방법 |
| US16/618,335 US20210160556A1 (en) | 2018-04-24 | 2019-04-23 | Method for enhancing resolution of streaming file |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020180047305 | 2018-04-24 | ||
| KR20180047305 | 2018-04-24 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020200020608A Division KR102130076B1 (ko) | 2020-02-19 | 2020-02-19 | 특징 영역의 학습 중요도를 바탕으로 스트리밍 파일의 해상도를 개선하는 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20190140825A KR20190140825A (ko) | 2019-12-20 |
| KR102082816B1 true KR102082816B1 (ko) | 2020-02-28 |
Family
ID=68731071
Family Applications (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020190046955A Active KR102190483B1 (ko) | 2018-04-24 | 2019-04-22 | Ai 기반의 영상 압축 및 복원 시스템 |
| KR1020190046957A Active KR102179436B1 (ko) | 2018-04-24 | 2019-04-22 | 변화 매크로블록 추출 기법을 이용한 동영상 화질 개선 시스템 |
| KR1020190046953A Active KR102082815B1 (ko) | 2018-04-24 | 2019-04-22 | 인공지능 기반 해상도 개선 시스템 |
| KR1020190046954A Active KR102082816B1 (ko) | 2018-04-24 | 2019-04-22 | 스트리밍 파일의 해상도 개선 방법 |
Family Applications Before (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020190046955A Active KR102190483B1 (ko) | 2018-04-24 | 2019-04-22 | Ai 기반의 영상 압축 및 복원 시스템 |
| KR1020190046957A Active KR102179436B1 (ko) | 2018-04-24 | 2019-04-22 | 변화 매크로블록 추출 기법을 이용한 동영상 화질 개선 시스템 |
| KR1020190046953A Active KR102082815B1 (ko) | 2018-04-24 | 2019-04-22 | 인공지능 기반 해상도 개선 시스템 |
Country Status (4)
| Country | Link |
|---|---|
| US (2) | US20210160556A1 (ko) |
| EP (1) | EP3787302A4 (ko) |
| JP (1) | JP7385286B2 (ko) |
| KR (4) | KR102190483B1 (ko) |
Families Citing this family (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110337813B (zh) | 2017-07-06 | 2023-04-18 | 三星电子株式会社 | 用于对图像进行编码/解码的方法及其装置 |
| CN110754093A (zh) * | 2018-05-21 | 2020-02-04 | Gdf实验室株式会社 | 基于人工智能影像学习平台的视频点播服务系统 |
| US20190392312A1 (en) * | 2018-06-21 | 2019-12-26 | Deep Force Ltd. | Method for quantizing a histogram of an image, method for training a neural network and neural network training system |
| WO2020080765A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image |
| KR102525576B1 (ko) | 2018-10-19 | 2023-04-26 | 삼성전자주식회사 | 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
| EP3884434A4 (en) * | 2018-11-19 | 2022-10-19 | Deeplite Inc. | SYSTEM AND METHOD FOR DETERMINING AUTOMATED DESIGN SPACE FOR DEEP NEURAL NETWORKS |
| US11877018B2 (en) * | 2019-11-15 | 2024-01-16 | Korea Advanced Institute Of Science And Technology | Live video ingest system and method |
| KR102524547B1 (ko) * | 2019-11-28 | 2023-04-24 | 울산과학기술원 | 무손실 이미지 압축을 위한 데이터 압축 및 복원 장치 |
| WO2021163022A1 (en) * | 2020-02-11 | 2021-08-19 | Subtle Medical, Inc. | Systems and methods for real-time video enhancement |
| KR102718126B1 (ko) * | 2020-02-14 | 2024-10-16 | 삼성전자주식회사 | Vr 영상을 스트리밍하는 방법 및 장치 |
| KR102287942B1 (ko) | 2020-02-24 | 2021-08-09 | 삼성전자주식회사 | 전처리를 이용한 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
| KR102782798B1 (ko) * | 2020-04-14 | 2025-03-19 | 삼성전자주식회사 | Ai 다운스케일 장치 및 그 동작방법, 및 ai 업스케일 장치 및 그 동작방법 |
| CN113556496B (zh) | 2020-04-23 | 2022-08-09 | 京东方科技集团股份有限公司 | 视频分辨率提升方法及装置、存储介质及电子设备 |
| US11436703B2 (en) * | 2020-06-12 | 2022-09-06 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptive artificial intelligence downscaling for upscaling during video telephone call |
| US20220121916A1 (en) * | 2020-10-21 | 2022-04-21 | Samsung Electronics Co., Ltd. | Electronic device and operating method thereof |
| EP4195154A4 (en) | 2020-12-09 | 2024-01-17 | Samsung Electronics Co., Ltd. | ARTIFICIAL INTELLIGENCE CODING APPARATUS AND OPERATION METHOD THEREFOR, AND ARTIFICIAL INTELLIGENCE DECODING APPARATUS AND OPERATION METHOD THEREFOR |
| KR102853858B1 (ko) * | 2020-12-09 | 2025-09-01 | 삼성전자주식회사 | Ai 부호화 장치 및 그 동작방법, 및 ai 복호화 장치 및 그 동작방법 |
| US11943271B2 (en) | 2020-12-17 | 2024-03-26 | Tencent America LLC | Reference of neural network model by immersive media for adaptation of media for streaming to heterogenous client end-points |
| KR102271371B1 (ko) * | 2020-12-24 | 2021-06-30 | 전남대학교산학협력단 | 네트워크 트래픽 절감을 위한 모바일 엣지 컴퓨팅 기반 슈퍼-레졸루션 스트리밍 영상 전송 시스템 |
| CN112802338B (zh) * | 2020-12-31 | 2022-07-12 | 山东奥邦交通设施工程有限公司 | 一种基于深度学习的高速公路实时预警方法及系统 |
| KR102537163B1 (ko) * | 2021-06-16 | 2023-05-26 | 주식회사 엘지유플러스 | 단말기, 클라우드 서버 및 클라우드 증강현실(ar) 플랫폼의 영상 송수신 시스템 및 그 방법 |
| WO2023286881A1 (ko) * | 2021-07-12 | 2023-01-19 | 엘지전자 주식회사 | 영상표시장치 및 이를 포함하는 시스템 |
| KR20230023460A (ko) * | 2021-08-10 | 2023-02-17 | 삼성전자주식회사 | 어플리케이션에 따라 ai 기반으로 영상을 재생하는 전자 장치 및 이에 의한 영상 재생 방법 |
| KR102827987B1 (ko) * | 2021-11-22 | 2025-07-02 | 서울대학교산학협력단 | 심층신경망 기반의 데이터 압축 및 복원 방법과 그 시스템 |
| US12185029B2 (en) | 2021-12-13 | 2024-12-31 | Hanwha Vision Co., Ltd. | Apparatus and method for transmitting images and apparatus and method for receiving images |
| KR102634627B1 (ko) * | 2021-12-14 | 2024-02-08 | 주식회사 카이 | 라이브 스트리밍 방법 및 장치 |
| TWI809727B (zh) * | 2022-02-22 | 2023-07-21 | 國立陽明交通大學 | 利用三維重建地圖搜尋路徑之方法 |
| CN114845138A (zh) * | 2022-04-26 | 2022-08-02 | 三星电子(中国)研发中心 | 自适应流媒体的超分辨率重建方法和装置及服务器 |
| US12361514B2 (en) | 2022-08-23 | 2025-07-15 | Tmrw Group Ip | System and method for transmission and receiving of image frames |
| KR102810887B1 (ko) * | 2022-12-13 | 2025-05-20 | 한국광기술원 | 고화질 실시간 카메라 영상 압축 및 복원 지원 시스템과 그 압축 및 복원 방법 |
| KR102596384B1 (ko) * | 2023-02-22 | 2023-10-30 | 진병선 | 인공 지능 연산을 위한 신경망 처리 유닛이 구비된 카메라 장비 |
| KR102647960B1 (ko) * | 2023-10-11 | 2024-03-15 | 주식회사 지솔 | AI Vision 기반의 객체 이미지 고해상도 고화질 변환 기법을 적용한 초지능 객체 분석 방법 및 시스템 |
| WO2025121997A1 (ko) * | 2023-12-06 | 2025-06-12 | 한화비전 주식회사 | 기계를 위한 비디오 코딩을 위한 적응적 리샘플링 및 복원 방법 |
| KR102779994B1 (ko) * | 2024-02-07 | 2025-03-13 | 주식회사 스피나이 | 척추 내시경 수술을 위한 실시간 비전 ai 기반 이미지 분석 및 광학 흐름 기술이 적용된 출혈 인식 시스템 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20170347061A1 (en) * | 2015-02-19 | 2017-11-30 | Magic Pony Technology Limited | Machine Learning for Visual Processing |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5293454A (en) * | 1989-03-08 | 1994-03-08 | Sharp Kabushiki Kaisha | Learning method of neural network |
| US6735253B1 (en) * | 1997-05-16 | 2004-05-11 | The Trustees Of Columbia University In The City Of New York | Methods and architecture for indexing and editing compressed video over the world wide web |
| US7149262B1 (en) * | 2000-07-06 | 2006-12-12 | The Trustees Of Columbia University In The City Of New York | Method and apparatus for enhancing data resolution |
| EP1438673B1 (en) * | 2001-09-26 | 2012-11-21 | Interact Devices Inc. | System and method for communicating media signals |
| JP4784190B2 (ja) | 2005-07-28 | 2011-10-05 | カシオ計算機株式会社 | コンテンツ再生装置、コンテンツ配信装置及びプログラム |
| CN101053249B (zh) | 2005-09-09 | 2011-02-16 | 松下电器产业株式会社 | 图像处理方法、图像存储方法、图像处理装置及文件格式 |
| WO2011090790A1 (en) * | 2010-01-22 | 2011-07-28 | Thomson Licensing | Methods and apparatus for sampling -based super resolution vido encoding and decoding |
| KR101344828B1 (ko) * | 2012-02-27 | 2013-12-26 | (주)티그레이프 | 디지털 콘텐츠 유통 방법 및 시스템 |
| KR102450971B1 (ko) | 2015-05-08 | 2022-10-05 | 삼성전자주식회사 | 객체 인식 장치 및 방법 |
| US9940539B2 (en) | 2015-05-08 | 2018-04-10 | Samsung Electronics Co., Ltd. | Object recognition apparatus and method |
| US9609307B1 (en) * | 2015-09-17 | 2017-03-28 | Legend3D, Inc. | Method of converting 2D video to 3D video using machine learning |
| JP2017103744A (ja) | 2015-12-04 | 2017-06-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、及び画像符号化復号装置 |
| KR101803471B1 (ko) * | 2016-02-15 | 2017-12-01 | 성균관대학교 산학협력단 | 컨볼루션 신경망 기반의 영상 패턴화를 이용한 딥러닝 시스템 및 이를 이용한 영상 학습방법 |
| JP6689656B2 (ja) | 2016-04-18 | 2020-04-28 | ルネサスエレクトロニクス株式会社 | 画像処理システム、画像処理方法及び画像送信装置 |
| US10432685B2 (en) * | 2016-05-31 | 2019-10-01 | Brightcove, Inc. | Limiting key request rates for streaming media |
| KR101780057B1 (ko) | 2016-08-02 | 2017-09-19 | 한양대학교 에리카산학협력단 | 고해상도 영상 복원 방법 및 장치 |
| CN106791927A (zh) | 2016-12-23 | 2017-05-31 | 福建帝视信息科技有限公司 | 一种基于深度学习的视频增强与传输方法 |
| JP6276901B1 (ja) | 2017-05-26 | 2018-02-07 | 楽天株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
-
2019
- 2019-04-22 KR KR1020190046955A patent/KR102190483B1/ko active Active
- 2019-04-22 KR KR1020190046957A patent/KR102179436B1/ko active Active
- 2019-04-22 KR KR1020190046953A patent/KR102082815B1/ko active Active
- 2019-04-22 KR KR1020190046954A patent/KR102082816B1/ko active Active
- 2019-04-23 JP JP2020560196A patent/JP7385286B2/ja active Active
- 2019-04-23 US US16/618,335 patent/US20210160556A1/en not_active Abandoned
- 2019-04-23 US US17/050,371 patent/US11095925B2/en active Active
- 2019-04-23 EP EP19792005.1A patent/EP3787302A4/en not_active Withdrawn
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20170347061A1 (en) * | 2015-02-19 | 2017-11-30 | Magic Pony Technology Limited | Machine Learning for Visual Processing |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7385286B2 (ja) | 2023-11-22 |
| EP3787302A4 (en) | 2022-04-20 |
| JP2021522723A (ja) | 2021-08-30 |
| KR102190483B1 (ko) | 2020-12-11 |
| US11095925B2 (en) | 2021-08-17 |
| KR102179436B1 (ko) | 2020-11-16 |
| KR20190130480A (ko) | 2019-11-22 |
| EP3787302A1 (en) | 2021-03-03 |
| KR20190140825A (ko) | 2019-12-20 |
| US20210160556A1 (en) | 2021-05-27 |
| KR20190130479A (ko) | 2019-11-22 |
| KR102082815B1 (ko) | 2020-02-28 |
| US20210058653A1 (en) | 2021-02-25 |
| KR20190130478A (ko) | 2019-11-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102082816B1 (ko) | 스트리밍 파일의 해상도 개선 방법 | |
| CN108062780A (zh) | 图像压缩方法和装置 | |
| KR101933696B1 (ko) | Ai 영상학습 플랫폼 기반 vod 서비스 시스템 | |
| KR102130076B1 (ko) | 특징 영역의 학습 중요도를 바탕으로 스트리밍 파일의 해상도를 개선하는 방법 | |
| CN117237843A (zh) | 视频精彩片段提取方法、装置、计算机设备及存储介质 | |
| KR20220070866A (ko) | 딥러닝 기술이 적용된 영상 개선 방법, 장치 및 프로그램 | |
| CN116415019B (zh) | 虚拟现实vr图像识别方法及装置、电子设备、存储介质 | |
| KR102130077B1 (ko) | 격자 생성 패턴 정보를 바탕으로 해상도를 개선하는 시스템 | |
| US11368758B2 (en) | VOD service system based on AI video learning platform | |
| KR20190140813A (ko) | 객체 중심의 해상도 복원 기능을 수행하는 영상 학습 시스템 | |
| KR20220021495A (ko) | Ai에 기반하여 스트리밍 파일의 해상도를 개선하는 방법 | |
| KR20220021494A (ko) | Ai 기반 해상도 개선 시스템 | |
| WO2019209006A1 (ko) | 스트리밍 파일의 해상도 개선 방법 | |
| KR102130078B1 (ko) | 해상도 향상도를 바탕으로 인공지능 파라미터를 변경하는 시스템 | |
| CN113542780A (zh) | 一种网络直播视频的压缩伪影去除方法及装置 | |
| KR101997909B1 (ko) | 해상도 복원을 위한 ai 영상학습 파라미터 추출 프로그램 및 기록매체 | |
| CN116797466B (zh) | 一种图像处理方法、装置、设备及可读存储介质 | |
| KR20220070868A (ko) | 전자 장치의 제어 방법, 장치 및 프로그램 | |
| CN117391961A (zh) | 画质增强模型训练方法、装置、计算机设备和存储介质 | |
| CN116091862A (zh) | 一种画质识别方法、装置、设备、存储介质及产品 | |
| WO2019209005A1 (ko) | 인공지능 기반 해상도 개선 시스템 | |
| KR20210120358A (ko) | 시각적 저손실 영상 압축 시스템 및 그 방법 | |
| CN113628121A (zh) | 数据处理、训练多媒体数据的方法和装置 | |
| KR20190140815A (ko) | 사용자 시청 취향 정보를 활용한 해상도 복원용 영상학습 지원 시스템 | |
| JP7752353B2 (ja) | 低解像度画像を高解像度画像で表示する端末、プログラム及び情報処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190422 |
|
| PA0201 | Request for examination | ||
| A302 | Request for accelerated examination | ||
| PA0302 | Request for accelerated examination |
Patent event date: 20190508 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20190422 Patent event code: PA03021R01I Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190827 Patent event code: PE09021S01D |
|
| PG1501 | Laying open of application | ||
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20191221 |
|
| PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20200219 Patent event code: PA01071R01D |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200224 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20200224 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20230109 Start annual number: 4 End annual number: 4 |
|
| PR1001 | Payment of annual fee |
Payment date: 20250114 Start annual number: 6 End annual number: 6 |