KR20140042637A - Image processing apparatus and control method thereof, image processing system - Google Patents
Image processing apparatus and control method thereof, image processing system Download PDFInfo
- Publication number
- KR20140042637A KR20140042637A KR1020130057262A KR20130057262A KR20140042637A KR 20140042637 A KR20140042637 A KR 20140042637A KR 1020130057262 A KR1020130057262 A KR 1020130057262A KR 20130057262 A KR20130057262 A KR 20130057262A KR 20140042637 A KR20140042637 A KR 20140042637A
- Authority
- KR
- South Korea
- Prior art keywords
- server
- voice
- voice command
- call sign
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4227—Providing Remote input by a user located remotely from the client device, e.g. at work
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
- Facsimiles In General (AREA)
- Details Of Television Systems (AREA)
Abstract
본 발명의 실시예에 따른 영상처리장치는, 외부로부터 수신되는 방송신호를 영상으로 표시되게 처리하는 영상처리부와; 서버에 통신 가능하게 접속되는 통신부와; 사용자의 발화가 입력되는 음성입력부와; 발화에 대응하는 음성 명령에 따라서 기 설정된 대응 동작이 수행되게 처리하는 음성처리부와; 음성입력부를 통해 발화가 입력되면 음성처리부 및 서버 중 어느 하나에 의해 발화에 대응하는 음성 명령이 처리되게 제어하는 제어부를 포함하며, 제어부는, 음성 명령이 방송 채널의 콜사인(call sign)에 관련된 키워드를 포함하는 경우에 음성처리부 및 서버 중 어느 하나에 의해 키워드에 대응하는 추천 콜사인이 기 설정된 선택조건에 따라서 선택되게 제어하고, 추천 콜사인의 방송 채널에 대하여 음성 명령에 따른 대응 동작을 수행하는 것을 특징으로 한다.An image processing apparatus according to an embodiment of the present invention includes an image processing unit for processing a broadcast signal received from the outside to be displayed as an image; A communication unit communicatively connected to the server; A voice input unit to which a user's utterance is input; A voice processing unit for processing a predetermined corresponding action according to a voice command corresponding to the utterance; And a controller for controlling a voice command corresponding to a utterance by any one of the voice processor and the server when a utterance is input through the voice input unit, wherein the controller includes a keyword related to a call sign of a broadcast channel. In the case of including the control unit to control the recommended call sign corresponding to the keyword selected by any one of the voice processing unit and the server according to the preset selection conditions, and performs a corresponding operation according to the voice command for the broadcast channel of the recommended call sign It is done.
Description
본 발명은 외부로부터 수신되는 방송신호 등의 영상신호를 영상으로 표시되게 처리하는 영상처리장치 및 그 제어방법, 영상처리 시스템에 관한 것으로서, 상세하게는 사용자의 음성 명령을 인식함으로써 해당 음성 명령에 대응하는 기능 또는 동작을 실행할 수 있는 구조의 영상처리장치 및 그 제어방법, 영상처리 시스템에 관한 것이다.The present invention relates to an image processing apparatus for processing a video signal such as a broadcast signal received from the outside to be displayed as an image, a control method thereof, and an image processing system. More particularly, And a control method thereof, and an image processing system.
영상처리장치는 외부로부터 수신되는 영상신호/영상데이터를 다양한 영상처리 프로세스에 따라서 처리한다. 영상처리장치는 처리된 영상신호를 자체 구비한 디스플레이 패널 상에 영상으로 표시하거나, 또는 패널을 구비한 타 디스플레이장치에서 영상으로 표시되도록 이 처리된 영상신호를 해당 디스플레이장치에 출력할 수 있다. 즉, 영상처리장치는 영상신호를 처리 가능한 장치라면 영상을 표시 가능한 패널을 포함하는 경우 및 패널을 포함하지 않는 경우 모두 포함할 수 있는 바, 전자의 경우의 예시로는 TV가 있으며, 후자의 경우의 예시로는 셋탑박스(set-top box)가 있다.The image processing apparatus processes image signal / image data received from the outside according to various image processing processes. The image processing apparatus can display the processed video signal on the display panel on its own display panel or output the processed video signal to the corresponding display device so as to be displayed as an image on the other display device having the panel. That is, the image processing apparatus can include both a case including a panel capable of displaying an image and a case not including a panel, as long as the apparatus can process a video signal. An example of the former case is a TV, An example of a set-top box is a set-top box.
영상처리장치는 기술의 발전에 따라서 다양한 기능의 추가 및 확장이 계속적으로 반영되고 있는 바, 이러한 추세에 따라서 영상처리장치에 있어서 사용자의 의도를 반영한 커맨드를 영상처리장치에 입력하는 구성도 다양한 구조 또는 방법이 제안되고 있다. 예를 들면, 종래에는 사용자 리모트 컨트롤러(remote controller) 상의 키/버튼을 누르면 리모트 컨트롤러가 사용자가 원하는 동작이 실행되도록 하는 제어신호를 영상처리장치에 전송하는 구성이었으나, 근래에는 영상처리장치가 사용자에 의한 모션 또는 발화 등을 감지하고, 감지된 내용을 분석하여 대응 동작을 실행시키는 등, 사용자의 의도를 반영하여 영상처리장치를 제어하는 다양한 구성이 제안되고 있다.As image processing apparatuses continue to reflect the addition and expansion of various functions in accordance with the development of the technology, a configuration in which a command reflecting the intention of the user in the image processing apparatus is input to the image processing apparatus in accordance with this trend may be variously structured A method has been proposed. For example, conventionally, when the user presses a key / button on a remote controller, the remote controller transmits a control signal to the image processing apparatus to allow the user to perform an operation desired by the user. In recent years, however, There have been proposed various configurations in which the image processing apparatus is controlled to reflect the user's intention, such as detecting motion or ignition by the user, analyzing the detected content, and executing a corresponding operation.
본 발명의 실시예에 따른 영상처리장치는, 외부로부터 수신되는 방송신호를 영상으로 표시되게 처리하는 영상처리부와; 서버에 통신 가능하게 접속되는 통신부와; 사용자의 발화가 입력되는 음성입력부와; 상기 발화에 대응하는 음성 명령에 따라서 기 설정된 대응 동작이 수행되게 처리하는 음성처리부와; 상기 음성입력부를 통해 상기 발화가 입력되면 상기 음성처리부 및 상기 서버 중 어느 하나에 의해 상기 발화에 대응하는 상기 음성 명령이 처리되게 제어하는 제어부를 포함하며, 상기 제어부는, 상기 음성 명령이 방송 채널의 콜사인(call sign)에 관련된 키워드를 포함하는 경우에 상기 음성처리부 및 상기 서버 중 어느 하나에 의해 상기 키워드에 대응하는 추천 콜사인이 기 설정된 선택조건에 따라서 선택되게 제어하고, 상기 추천 콜사인의 방송 채널에 대하여 상기 음성 명령에 따른 대응 동작을 수행하는 것을 특징으로 한다.
An image processing apparatus according to an embodiment of the present invention includes an image processing unit for processing a broadcast signal received from the outside to be displayed as an image; A communication unit communicatively connected to the server; A voice input unit to which a user's utterance is input; A voice processing unit for performing a predetermined corresponding operation according to a voice command corresponding to the utterance; And a controller configured to control the voice command corresponding to the utterance by any one of the voice processor and the server when the utterance is input through the voice input unit. In the case of including a keyword related to a call sign, one of the voice processor and the server controls the recommended call sign corresponding to the keyword to be selected according to a preset selection condition, and to the broadcast channel of the recommended call sign. It is characterized in that for performing the corresponding operation according to the voice command.
여기서, 상기 키워드에 대응하는 적어도 하나의 콜사인 후보의 데이터베이스가 상기 영상처리장치 및 상기 서버에 저장되며, 상기 추천 콜사인은 상기 데이터베이스로부터 검색된 복수의 상기 콜사인 후보 중에서 상기 선택조건에 따라서 선택될 수 있다.Here, a database of at least one call sign candidate corresponding to the keyword is stored in the image processing apparatus and the server, and the recommendation call sign may be selected according to the selection condition from the plurality of call sign candidates searched from the database.
여기서, 상기 선택조건은, 상기 영상처리장치의 사용 이력 정보에 기초하여 상기 복수의 콜사인 후보 중에서 선택 빈도가 기 설정 순위 이상인 콜사인 후보가 상기 추천 콜사인으로 선택될 수 있다.The selection condition may include selecting a call sign candidate having a selection frequency equal to or greater than a predetermined rank from among the plurality of call sign candidates based on usage history information of the image processing apparatus as the recommended call sign.
또는, 상기 선택조건은, 상기 복수의 콜사인 후보 중에서 상기 서버와 통신하는 복수의 타 영상처리장치에서의 선택 빈도가 기 설정 순위 이상인 콜사인 후보가 상기 추천 콜사인으로 선택될 수 있다.Alternatively, the selection condition may include selecting a call sign candidate having a predetermined frequency or more from a plurality of other image processing apparatuses communicating with the server from among the plurality of call sign candidates as the recommended call sign.
또한, 상기 추천 콜사인은 상기 복수의 콜사인 후보 중에서 하나 이상을 선택 가능하며, 상기 제어부는, 복수의 상기 콜사인 후보가 선택되면, 상기 선택된 복수의 콜사인 후보 중에서 어느 하나를 선택 가능하도록 제공하는 유아이 영상을 표시할 수 있다.The recommendation callsign may select one or more of the plurality of callsign candidates, and the controller may provide an image for the infant to select one of the plurality of selected callsign candidates when a plurality of callsign candidates are selected. I can display it.
여기서, 상기 제어부는, 상기 유아이 영상이 표시된 이후 기 설정된 시간 동안에 어느 하나의 상기 콜사인 후보를 선택하는 입력이 수행되지 않은 경우에, 상기 기 설정된 선택조건에 기초하여 어느 하나의 상기 추천 콜사인을 선택할 수 있다.The controller may select one of the recommended call signs based on the preset selection condition when the input for selecting one of the call sign candidates is not performed for a preset time after the image is displayed. have.
또한, 상기 통신부는 상기 발화를 텍스트의 음성 명령으로 변환하는 STT(speech-to-text)서버와 통신하며, 상기 제어부는, 상기 음성입력부에 상기 발화가 입력되면 상기 발화의 음성신호를 상기 STT서버로 전송하며, 상기 STT서버로부터 상기 발화에 대응하는 상기 음성 명령을 수신할 수 있다.The communication unit may communicate with a speech-to-text (STT) server that converts the speech into a voice command of text, and the controller may transmit the speech signal of the speech to the STT server when the speech is input to the voice input unit. The voice command corresponding to the utterance may be received from the STT server.
여기서, 상기 제어부는, 상기 음성 명령이 단문일 경우에 상기 음성 명령을 상기 음성처리부에 의해 처리되고, 상기 음성 명령이 대화문일 경우에 상기 음성 명령을 상기 서버에 의해 처리되게 제어할 수 있다.Here, the controller may control the voice command to be processed by the voice processing unit when the voice command is a short text, and to process the voice command by the server when the voice command is a conversation text.
또한, 상기 영상처리부에 의해 처리되는 방송신호를 영상으로 표시하는 디스플레이부를 더 포함할 수 있다.The display apparatus may further include a display unit configured to display a broadcast signal processed by the image processor as an image.
또한, 본 발명의 실시예에 따른 서버와 통신하는 영상처리장치의 제어방법은, 사용자의 발화가 입력되는 단계와; 상기 영상처리장치 및 상기 서버 중 어느 하나에 의해 상기 발화에 대응하는 음성 명령이 처리되게 제어하고, 상기 음성 명령에 따라서 기 설정된 대응 동작을 수행하는 단계를 포함하며, 상기 음성 명령에 따라서 기 설정된 대응 동작을 수행하는 단계는, 상기 음성 명령이 방송 채널의 콜사인에 관련된 키워드를 포함하는 경우에, 상기 영상처리장치 및 상기 서버 중 어느 하나에 의해 상기 키워드에 대응하는 추천 콜사인이 기 설정된 선택조건에 따라서 선택되게 제어하는 단계와; 상기 추천 콜사인의 방송 채널에 대하여 상기 음성 명령에 따른 대응 동작을 수행하는 단계를 포함하는 것을 특징으로 한다.In addition, the control method of the image processing apparatus communicating with the server according to an embodiment of the present invention, the step of inputting the user's speech; Controlling the voice command corresponding to the speech to be processed by any one of the image processing apparatus and the server, and performing a preset corresponding operation according to the voice command, wherein the preset response according to the voice command In the performing of the operation, when the voice command includes a keyword related to a call sign of a broadcast channel, the recommendation call sign corresponding to the keyword is set by one of the image processing apparatus and the server according to a preset condition. Controlling to be selected; And performing a corresponding operation according to the voice command on the broadcast channel of the recommended call sign.
여기서, 상기 키워드에 대응하는 적어도 하나의 콜사인 후보의 데이터베이스가 상기 영상처리장치 및 상기 서버에 저장되며, 상기 추천 콜사인은 상기 데이터베이스로부터 검색된 복수의 상기 콜사인 후보 중에서 상기 선택조건에 따라서 선택될 수 있다.Here, a database of at least one call sign candidate corresponding to the keyword is stored in the image processing apparatus and the server, and the recommendation call sign may be selected according to the selection condition from the plurality of call sign candidates searched from the database.
여기서, 상기 선택조건은, 상기 영상처리장치의 사용 이력 정보에 기초하여 상기 복수의 콜사인 후보 중에서 선택 빈도가 기 설정 순위 이상인 콜사인 후보가 상기 추천 콜사인으로 선택될 수 있다.The selection condition may include selecting a call sign candidate having a selection frequency equal to or greater than a predetermined rank from among the plurality of call sign candidates based on usage history information of the image processing apparatus as the recommended call sign.
또는, 상기 선택조건은, 상기 복수의 콜사인 후보 중에서 상기 서버와 통신하는 복수의 타 영상처리장치에서의 선택 빈도가 기 설정 순위 이상인 콜사인 후보가 상기 추천 콜사인으로 선택될 수 있다.Alternatively, the selection condition may include selecting a call sign candidate having a predetermined frequency or more from a plurality of other image processing apparatuses communicating with the server from among the plurality of call sign candidates as the recommended call sign.
또한, 상기 추천 콜사인은 상기 복수의 콜사인 후보 중에서 하나 이상을 선택 가능하며, 상기 음성 명령에 따라서 기 설정된 대응 동작을 수행하는 단계는, 복수의 상기 콜사인 후보가 선택된 경우에 상기 선택된 복수의 콜사인 후보 중에서 어느 하나를 선택 가능하도록 제공하는 유아이 영상을 표시하는 단계를 포함할 수 있다.The recommendation callsign may select one or more of the plurality of callsign candidates, and the performing of a preset corresponding operation according to the voice command may include selecting among the selected callsign candidates when a plurality of callsign candidates are selected. The infant may be configured to display an image.
여기서, 상기 유아이 영상을 표시하는 단계는, 상기 유아이 영상이 표시된 이후 기 설정된 시간 동안에 어느 하나의 상기 콜사인 후보를 선택하는 입력이 수행되지 않은 경우에, 상기 기 설정된 선택조건에 기초하여 어느 하나의 상기 추천 콜사인을 선택하는 단계를 포함할 수 있다.The displaying of the image by the infant may include performing any one of the ones based on the predetermined selection condition when an input for selecting one of the call sign candidates is not performed for a preset time after the image is displayed. The method may include selecting a recommended call sign.
또한, 상기 영상처리장치는 상기 발화를 텍스트의 음성 명령으로 변환하는 STT서버와 통신하며, 상기 사용자의 발화가 입력되는 단계는, 상기 발화의 음성신호를 상기 STT서버로 전송하는 단계와; 상기 STT서버로부터 상기 발화에 대응하는 상기 음성 명령을 수신하는 단계를 포함할 수 있다.In addition, the image processing apparatus communicates with the STT server for converting the speech into a voice command of the text, the step of inputting the user's speech, the step of transmitting the speech signal of the speech to the STT server; And receiving the voice command corresponding to the utterance from the STT server.
여기서, 상기 음성 명령에 따라서 기 설정된 대응 동작을 수행하는 단계는, 상기 음성 명령이 단문일 경우에 상기 음성 명령을 상기 영상처리장치에 의해 처리되고, 상기 음성 명령이 대화문일 경우에 상기 음성 명령을 상기 서버에 의해 처리되게 제어하는 단계를 포함할 수 있다.The performing of the preset corresponding operation according to the voice command may include processing the voice command by the image processing apparatus when the voice command is a short message, and executing the voice command when the voice command is a conversation text. And controlling to be processed by the server.
또한, 본 발명의 실시예에 따른 영상처리 시스템은, 외부로부터 수신되는 방송신호를 영상으로 표시되게 처리하는 영상처리장치와; 상기 영상처리장치와 통신하는 서버를 포함하며, 상기 영상처리장치는, 사용자의 발화가 입력되는 음성입력부와; 상기 발화에 대응하는 음성 명령에 따라서 기 설정된 대응 동작이 수행되게 처리하는 음성처리부와; 상기 음성입력부를 통해 상기 발화가 입력되면 상기 음성처리부 및 상기 서버 중 어느 하나에 의해 상기 발화에 대응하는 상기 음성 명령이 처리되게 제어하는 제어부를 포함하며, 상기 제어부는, 상기 음성 명령이 방송 채널의 콜사인에 관련된 키워드를 포함하는 경우에 상기 음성처리부 및 상기 서버 중 어느 하나에 의해 상기 키워드에 대응하는 추천 콜사인이 기 설정된 선택조건에 따라서 선택되게 제어하고, 상기 추천 콜사인의 방송 채널에 대하여 상기 음성 명령에 따른 대응 동작을 수행하는 것을 특징으로 한다.In addition, the image processing system according to an embodiment of the present invention, the image processing apparatus for processing a broadcast signal received from the outside to be displayed as an image; And a server for communicating with the image processing apparatus, wherein the image processing apparatus comprises: a voice input unit to which a user's utterance is input; A voice processing unit for performing a predetermined corresponding operation according to a voice command corresponding to the utterance; And a controller configured to control the voice command corresponding to the utterance by any one of the voice processor and the server when the utterance is input through the voice input unit. In the case of including a keyword related to a call sign, either the voice processor or the server controls the recommended call sign corresponding to the keyword to be selected according to a preset selection condition, and the voice command is directed to a broadcast channel of the recommended call sign. It characterized in that to perform a corresponding operation according to.
여기서, 상기 발화를 텍스트의 음성 명령으로 변환하는 STT서버를 더 포함하며, 상기 제어부는, 상기 음성입력부에 상기 발화가 입력되면 상기 발화의 음성신호를 상기 STT서버로 전송하며, 상기 STT서버로부터 상기 발화에 대응하는 상기 음성 명령을 수신할 수 있다.The STT server may further include converting the utterance into a voice command of text, wherein the controller transmits the voice signal of the utterance to the STT server when the utterance is input to the voice input unit. The voice command corresponding to the utterance may be received.
도 1은 본 발명의 제1실시예에 따른 디스플레이장치의 구성 블록도,
도 2는 키워드 및 콜사인 후보에 관한 데이터베이스의 구조를 개략적으로 나타내는 예시도,
도 3은 도 1의 디스플레이장치 및 서버의 인터랙션 구조를 나타내는 구성 블록도,
도 4는 도 3의 디스플레이장치 및 서버의 인터랙션 과정을 나타내는 예시도,
도 5 및 도 6은 도 1의 디스플레이장치에서 복수의 추천 콜사인 중 어느 하나를 선택 가능하게 제공하는 유아이 영상의 예시도,
도 7은 본 발명의 제2실시예에 따른 디스플레이장치 및 서버의 인터랙션 과정을 나타내는 예시도,
도 8은 본 발명의 제3실시예에 따른 디스플레이장치 및 서버의 인터랙션 구조를 나타내는 구성 블록도,
도 9는 도 8의 디스플레이장치 및 서버의 인터랙션 과정을 나타내는 예시도,
도 10은 본 발명의 제4실시예에 따른 디스플레이장치의 음성처리부의 신호 전달 구조를 나타내는 구성 블록도이다.1 is a block diagram of a display device according to a first embodiment of the present invention;
2 is an exemplary diagram schematically showing the structure of a database relating to keyword and callsign candidates;
3 is a block diagram illustrating an interaction structure between the display apparatus and the server of FIG. 1;
4 is an exemplary diagram illustrating an interaction process between a display apparatus and a server of FIG. 3;
5 and 6 are views illustrating an example of an infant image to selectably provide any one of a plurality of recommended call signs in the display device of FIG. 1;
7 is an exemplary view illustrating an interaction process between a display apparatus and a server according to a second embodiment of the present invention;
8 is a block diagram illustrating an interaction structure between a display apparatus and a server according to a third exemplary embodiment of the present invention;
9 is an exemplary diagram illustrating an interaction process between a display apparatus and a server of FIG. 8;
10 is a block diagram illustrating a signal transmission structure of a voice processing unit of a display device according to a fourth embodiment of the present invention.
이하에서는 첨부도면을 참조하여 본 발명에 대해 상세히 설명한다. 이하 실시예에서는 본 발명의 사상과 직접적인 관련이 있는 구성들에 관해서만 설명하며, 그 외의 구성에 관해서는 설명을 생략한다. 그러나, 본 발명의 사상이 적용된 장치 또는 시스템을 구현함에 있어서, 이와 같이 설명이 생략된 구성이 불필요함을 의미하는 것이 아님을 밝힌다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings. In the following embodiments, only configurations directly related to the concept of the present invention will be described, and description of other configurations will be omitted. However, it is to be understood that, in the implementation of the apparatus or system to which the spirit of the present invention is applied, it is not meant that the configuration omitted from the description is unnecessary.
도 1은 본 발명의 제1실시예에 따른 영상처리장치(100)의 구성 블록도이다.1 is a block diagram of a configuration of an
이하 실시예는 영상처리장치(100)가 자체적으로 영상을 표시할 수 있는 구조의 디스플레이장치인 경우에 관해 설명하나, 본 발명의 사상은 영상처리장치(100)가 자체적으로 영상을 표시하지 않고 타 디스플레이장치에 영상신호/제어신호를 출력 가능한 구조의 장치인 경우에도 적용이 가능한 바, 이하 설명하는 실시예에 한정되지 않는다. 본 실시예는 영상처리장치(100)가 TV인 경우에 관해 설명하지만, 이러한 이유에 따라서 그 구현 방식이 다양하게 변경되어 적용될 수 있다.Although the embodiment will be described with reference to the case where the
도 1에 도시된 바와 같이, 본 실시예에 따른 영상처리장치(100) 또는 디스플레이장치(100)는 영상공급원(미도시)으로부터 영상신호를 수신한다. 디스플레이장치(100)가 수신 가능한 영상신호는 그 종류 또는 특성이 한정되지 않으며, 예를 들면 디스플레이장치(100)는 방송국의 송출장비(미도시)로부터 송출되는 방송신호를 수신하고, 해당 방송신호를 튜닝하여 방송영상을 표시할 수 있다.As shown in FIG. 1, the
디스플레이장치(100)는 영상공급원(미도시)으로부터 영상신호를 수신하는 영상수신부(110)와, 영상수신부(110)에 수신되는 영상신호를 기 설정된 영상처리 프로세스에 따라서 처리하는 영상처리부(120)와, 영상처리부(120)에서 처리되는 영상신호에 기초하여 영상을 표시하는 디스플레이부(130)와, 서버(10)와 같은 외부장치와 통신하는 통신부(140)와, 사용자에 의해 조작되는 사용자입력부(150)와, 외부로부터의 음성 또는 소리가 입력되는 음성입력부(160)와, 음성입력부(160)에 입력되는 음성/소리를 해석 및 처리하는 음성처리부(170)와, 데이터/정보가 저장되는 저장부(180)와, 디스플레이장치(100)의 제반 동작을 제어하는 제어부(190)를 포함한다.The
영상수신부(110)는 영상신호/영상데이터를 유선 또는 무선으로 수신하여 영상처리부(120)에 전달한다. 영상수신부(110)는 수신하는 영상신호의 규격 및 디스플레이장치(100)의 구현 형태에 대응하여 다양한 방식으로 마련될 수 있다. 예를 들면, 영상수신부(110)는 RF(radio frequency)신호를 수신하거나, 컴포지트(composite) 비디오, 컴포넌트(component) 비디오, 슈퍼 비디오(super video), SCART, HDMI(high definition multimedia interface), 디스플레이포트(DisplayPort), UDI(unified display interface), 또는 와이어리스(wireless) HD 규격 등에 의한 영상신호를 수신할 수 있다. 영상수신부(110)는 영상신호가 방송신호인 경우, 이 방송신호를 채널 별로 튜닝하는 튜너(tuner)를 포함한다.The
영상처리부(120)는 영상수신부(110)에 수신되는 영상신호에 대해 다양한 영상처리 프로세스를 수행한다. 영상처리부(120)는 이러한 프로세스를 수행한 영상신호를 디스플레이부(130)에 출력함으로써, 디스플레이부(130)에 해당 영상신호에 기초하는 영상이 표시되게 한다. 예를 들면, 영상처리부(120)는 영상수신부(110)에서 특정 채널로 방송신호가 튜닝되면, 방송신호로부터 해당 채널에 대응하는 영상, 음성 및 부가데이터를 추출하고 기 설정된 해상도로 조정하여 디스플레이부(130)에 표시한다.The
영상처리부(120)가 수행하는 영상처리 프로세스의 종류는 한정되지 않으며, 예를 들면 영상데이터의 영상 포맷에 대응하는 디코딩(decoding), 인터레이스(interlace) 방식의 영상데이터를 프로그레시브(progressive) 방식으로 변환하는 디인터레이싱(de-interlacing), 영상데이터를 기 설정된 해상도로 조정하는 스케일링(scaling), 영상 화질 개선을 위한 노이즈 감소(noise reduction), 디테일 강화(detail enhancement), 프레임 리프레시 레이트(frame refresh rate) 변환 등을 포함할 수 있다.The type of the image processing process performed by the
영상처리부(120)는 이러한 여러 기능을 통합시킨 SOC(system-on-chip), 또는 이러한 각 프로세스를 독자적으로 수행할 수 있는 개별적인 구성들이 인쇄회로기판 상에 장착됨으로써 영상처리보드(미도시)로 구현되어 디스플레이장치(100)에 내장된다.The
디스플레이부(130)는 영상처리부(120)로부터 출력되는 영상신호에 기초하여 영상을 표시한다. 디스플레이부(130)의 구현 방식은 한정되지 않는 바, 액정(liquid crystal), 플라즈마(plasma), 발광 다이오드(light-emitting diode), 유기발광 다이오드(organic light-emitting diode), 면전도 전자총(surface-conduction electron-emitter), 탄소 나노 튜브(carbon nano-tube), 나노 크리스탈(nano-crystal) 등의 다양한 디스플레이 방식으로 구현될 수 있다.The
디스플레이부(130)는 그 구현 방식에 따라서 부가적인 구성을 추가적으로 포함할 수 있다. 예를 들면, 디스플레이부(130)가 액정 방식인 경우, 디스플레이부(130)는 액정 디스플레이 패널(미도시)과, 이에 광을 공급하는 백라이트유닛(미도시)과, 패널(미도시)을 구동시키는 패널구동기판(미도시)을 포함한다.The
통신부(140)는 디스플레이장치(100)가 서버(10)와 양방향 통신을 수행하도록 데이터의 송수신을 수행한다. 통신부(140)는 서버(10)의 통신 프로토콜(protocol)에 따라서, 유선/무선을 통한 광역/근거리 네트워크나 또는 로컬 접속 방식으로 서버(10)에 접속한다.The
사용자입력부(150)는 사용자의 조작 및 입력에 따라서 기 설정된 다양한 제어 커맨드 또는 정보를 제어부(190)에 전달한다. 사용자입력부(150)는 디스플레이장치(100) 외측에 설치된 메뉴 키(menu-key) 또는 입력 패널(panel)이나, 디스플레이장치(100)와 분리 이격된 리모트 컨트롤러(remote controller) 등으로 구현된다. 또는, 사용자입력부(150)는 디스플레이부(130)와 일체형으로 구현될 수 있는 바, 디스플레이부(130)가 터치스크린(touch-screen)인 경우에 사용자는 디스플레이부(130)에 표시된 입력메뉴(미도시)를 터치함으로써 기 설정된 커맨드를 제어부(190)에 전달할 수 있다.The
음성입력부(160)는 마이크로 구현되며, 디스플레이장치(100)의 외부 환경에서 발생하는 다양한 소리를 감지한다. 음성입력부(160)가 감지하는 소리는 사용자에 의한 발화와, 사용자 이외에 다양한 요인에 의해 발생하는 소리를 포함한다.The
음성처리부(170)는 디스플레이장치(100)에서 수행되는 다양한 기 설정된 프로세스 중에서, 음성입력부(160)에 입력되는 음성/소리에 대한 프로세스를 수행한다. 여기서, 음성처리부(170)가 처리하는 "음성"은 음성입력부(160)에 입력되는 음성을 의미한다. 영상처리부(120)가 영상신호를 처리할 때에 해당 영상신호는 음성데이터를 포함할 수 있는 바, 영상신호에 포함된 음성데이터는 영상처리부(120)에 의해 처리된다.The
음성처리부(170)는 음성입력부(160)에 음성/소리가 입력되면, 입력된 음성/소리가 사용자에 의한 발화인지 아니면 기타 요인에 의하여 발생한 소리인지 여부를 판단한다. 이러한 판단 방법은 다양한 구조가 적용될 수 있으므로 특정할 수 없으며, 예를 들면 입력된 음성/소리가 사람의 목소리에 대응하는 파장/주파수 대역에 해당하는지 판단하거나, 또는 사전에 지정된 사용자의 음성의 프로파일에 해당하는지 판단하는 등의 방법이 가능하다.When the voice / sound is input to the
음성처리부(170)는 사용자의 발화가 입력된 것으로 판단하면, 해당 발화에 대응하는 음성 명령에 따라서 기 설정된 대응 동작이 수행되게 처리한다. 여기서, 음성 명령은 사용자의 발화의 내용을 의미한다. 이에 관한 자세한 내용은 후술한다.If the
저장부(180)는 제어부(190)의 제어에 따라서 한정되지 않은 데이터가 저장된다. 저장부(180)는 플래시메모리(flash-memory), 하드디스크 드라이브(hard-disc drive)와 같은 비휘발성 메모리로 구현된다. 저장부(180)는 제어부(190), 영상처리부(120) 또는 음성처리부(170) 등에 의해 액세스되며, 데이터의 독취/기록/수정/삭제/갱신 등이 수행된다.The
제어부(190)는 음성입력부(160)를 통해 사용자의 발화가 입력되면, 입력된 발화를 처리하도록 음성처리부(170)를 제어한다. 영상처리부(120)가 영상수신부(110)에 수신되는 방송신호를 처리함으로써 디스플레이부(130)에 방송영상이 표시될 때, 제어부(190)는 음성입력부(160)를 통해 채널 전환을 명령하는 사용자의 발화가 수신되면, 해당 발화의 내용에 따라서 채널을 변경시킨다.The
"채널 전환"에 관련된 음성 명령의 방식은, 사용자가 원하는 방송채널의 채널번호를 말하거나, 또는 원하는 방송채널의 콜사인(call sign)을 발화하는 방법이 가능하다. 채널번호 및 콜사인은 어느 한 채널을 타 채널과 구분하는 미리 약속된 표현방식이다. 채널번호는 6, 7, 11 등과 같은 정수로 표현한다.The method of voice command related to "channel switching" may be a method of speaking a channel number of a broadcast channel desired by a user or uttering a call sign of a desired broadcast channel. Channel numbers and callsigns are pre-defined expressions that distinguish one channel from another. The channel number is expressed by an integer such as 6, 7, 11, or the like.
콜사인은 특정 채널을 제공하는 제공자(provider)의 식별명이며, 일반적으로 해당 채널을 방송하는 방송국의 식별명이다. 여기서, 하나의 채널의 콜사인은 복수 개가 있을 수 있으며, 또한 하나의 방송국이 복수의 채널을 제공하는 경우에 각 채널은 상호 구분을 위해 서로 상이한 콜사인을 가진다.The call sign is an identification name of a provider providing a specific channel, and is generally an identification name of a broadcasting station broadcasting the channel. Here, there may be a plurality of callsigns of one channel, and when one broadcasting station provides a plurality of channels, each channel has a different callsign for mutual distinction.
전자의 예를 들면 다음과 같다. 소정의 제1채널의 콜사인이 "KBS"라고 할 때에, "한국방송"이라는 콜사인 또한 "KBS"와 동일하게 제1채널을 지칭하는 것일 수 있다. 또는, 어느 지역에서는 소정의 제2채널의 콜사인이 "MBC"인 것에 비해, 타 지역에서는 제2채널의 콜사인이 이와 상이한 "TNN"일 수도 있다. 즉, 특정 채널의 콜사인은 하나가 아닌 복수 개가 있을 수 있다.An example of the former is as follows. When the call sign of a predetermined first channel is "KBS", the call sign of "Korean broadcast" may also refer to the first channel in the same way as "KBS". Alternatively, the call sign of the second channel may be different from the call sign of the second channel in another region, whereas the call sign of the second channel may be different from that of the second channel. That is, there may be a plurality of call signs of a specific channel instead of one.
후자의 예를 들면 다음과 같다. "KBS"라는 콜사인을 가지는 방송국은 소정의 제3채널 및 제4채널에 각기 방송신호를 제공할 수 있다. 이 경우, 제3채널의 콜사인은 "KBS-1"이고, 제4채널의 콜사인은 "KBS-2"로 각기 상이하다. "KBS"는 해당 방송국의 대표 콜사인으로 볼 수 있으며, "KBS-1" 및 "KBS-2"는 "KBS"와 관련된 하위 콜사인이다. 즉, "KBS"라는 콜사인은 제3채널 및 제4채널과 모두 관련된다.An example of the latter is as follows. Broadcasting stations having a call sign of "KBS" may provide broadcast signals to predetermined third and fourth channels, respectively. In this case, the call sign of the third channel is "KBS-1", and the call sign of the fourth channel is different from "KBS-2". "KBS" may be regarded as a representative call sign of the broadcasting station, and "KBS-1" and "KBS-2" are sub-call signs related to "KBS". That is, a call sign of "KBS" is associated with both the third channel and the fourth channel.
따라서, 만일 음성입력부(160)를 통해 입력된 사용자의 발화가 "KBS 틀어줘"라는 음성 명령이라면, "KBS-1"의 제3채널 및 "KBS-2"의 제4채널 중에서 어떠한 채널을 의미하는 것인지 불명료할 수 있다.Therefore, if the user's speech input through the
이에, 본 실시예에 따르면, 제어부(190)는 사용자의 발화에 대응하는 음성 명령이 방송채널의 콜사인에 관련된 키워드(key-word)를 포함하는지 여부를 판단한다.Accordingly, according to the present exemplary embodiment, the
제어부(190)는 음성 명령이 콜사인 관련 키워드를 포함하는 것으로 판단하면, 복수의 콜사인을 포함하는 데이터베이스에서 해당 키워드에 대응하는 콜사인을 검색하도록 음성처리부(170)를 제어한다. 여기서, 데이터베이스는 저장부(180)에 저장되며, 이와 같이 검색된 콜사인을 콜사인 후보라고 지칭한다. 이 때, 제어부(190)는 해당 키워드에 대응하는 복수의 콜사인 후보가 검색된 경우, 기 설정된 선택조건에 기초하여 복수의 콜사인 후보 중에서 추천 콜사인을 선택한다.If it is determined that the voice command includes a call sign related keyword, the
또는, 제어부(190)는 상기한 데이터베이스가 저장된 서버(10)에 키워드 및 음성 명령을 전송할 수도 있다. 이 경우, 서버(10)는 앞서 설명한 구성과 유사한 원리로 추천 콜사인을 선택하며 음성 명령에 따른 대응 동작을 분석하고, 이러한 선택 및 분석 결과에 따른 제어신호를 디스플레이장치(100)에 전송한다.Alternatively, the
제어부(190)는 이와 같이 선택된 추천 콜사인의 방송 채널에 대하여 음성 명령에 따른 대응 동작을 수행한다.The
이하, 데이터베이스(200)의 구성과, 데이터베이스(200)를 검색하여 콜사인 후보(230)를 검색하는 방법에 관해 도 2를 참조하여 설명한다.Hereinafter, a configuration of the
도 2는 데이터베이스(200)의 구조를 개략적으로 나타내는 예시도이다.2 is an exemplary view schematically showing the structure of the
도 2에 도시된 바와 같이, 제어부(190)는 사용자의 발화를 텍스트로 변환한 음성 명령인 "KBS 틀어줘"에 콜사인 관련 키워드가 포함되는지 판단한다. 저장부(180)가 키워드 및 콜사인이 상호 대응하게 맵핑(mapping)된 관계 데이터베이스(200)를 저장하고 있으며, 제어부(190)는 소정 키워드를 가지고 데이터베이스(200)를 검색함으로써 해당 키워드가 콜사인 관련 키워드인지 여부를 판단할 수 있다.As illustrated in FIG. 2, the
데이터베이스(200)는 복수의 키워드(220) 및 복수의 콜사인(230)을 상호 맵핑시킴으로써, 어느 하나의 키워드(220)를 가지고 하나 이상의 콜사인 후보(230)를 검색하기 위해 사용된다. 본 도면에서는 데이터베이스(200) 중에서 "KBS" 및 "FTV"의 두 대표 콜사인(210)에 관련된 항목의 관계만을 나타낸 것이다.The
대표 콜사인(210)은 키워드(220) 및 콜사인 후보(230)를 상호 관련시키기 위한 링크 역할을 수행한다. 구체적으로, 소정 키워드(220)가 입력되었을 때에, 우선 해당 키워드(220)가 어느 대표 콜사인(210)과 관련되는지가 데이터베이스(200) 상에서 1차적으로 검색된다. 대표 콜사인(210)이 검색되면, 검색된 대표 콜사인(210)의 하부 콜사인(230) 또는 관련된 콜사인 후보(230)가 2차적으로 검색된다.The
키워드(220)는 대표 콜사인(210)과 관련된 동의어, 유사어 등을 포함하는 다양한 용어가 대표 콜사인(210)에 대해 그룹화/카테고리화된다. 또한, 콜사인 후보(230)는 대표 콜사인(210)과 연관된 하나 이상의 채널의 콜사인을 포함하며, 이러한 콜사인은 대표 콜사인(210)에 대해 그룹화/카테고리화된다.The
예를 들면, "낚시채널"이라는 키워드(220)가 입력되는 경우, "낚시채널"과 연관된 대표 콜사인(210)은 "FTV"이며, 대표 콜사인(210) "FTV"에 관련된 콜사인 후보(230)는 "FTV" 하나이다. 즉, 데이터베이스(200)에 의해 검색된 바로는, "낚시채널"이라는 키워드(220)에 대응하는 채널의 콜사인은 "FTV" 하나이다.For example, when the
한편, "KBS"라는 키워드(220)가 입력되는 경우, "KBS"와 연관된 대표 콜사인(210)은 "KBS"이며, 대표 콜사인 "KBS"에 관련된 콜사인 후보(230)는 "KBS-1", "KBS-2", "KBS-sports", "KBS-movie"의 네 가지가 있다.Meanwhile, when the
이러한 방법으로 데이터베이스(200)를 검색함으로써 키워드(220)와 관련된 적어도 하나 이상의 콜사인 후보(230)를 얻을 수 있다. 다만, 상기한 방법은 데이터베이스(200)를 구현하는 하나의 예시에 불과할 뿐인 바, 데이터베이스(200)의 구현 방식은 다양하게 적용될 수 있으며 상기한 예시로 한정되지 않는다.By searching the
도 3은 디스플레이장치(100) 및 서버(20, 30)의 인터랙션 구조를 나타내는 구성 블록도이다.3 is a block diagram illustrating an interaction structure between the
도 3에 도시된 바와 같이, 디스플레이장치(100)는 통신부(140)와, 음성입력부(160)와, 음성처리부(170)와, 제어부(190)를 포함한다. 이러한 구성은 앞선 도 1에서 설명한 바와 같다. 여기서, 통신부(140)는 사용자의 발화를 음성 명령으로 변환하는 STT(speech-to-text)서버(20)와, 음성 명령을 분석함으로써 음성 명령에 대응하는 대응 동작을 판단하는 대화형 서버(30)에 접속된다.As shown in FIG. 3, the
STT서버(20)는 음성신호가 수신되면 해당 음성신호의 파형을 분석함으로써 음성신호의 내용을 텍스트로 생성한다. STT서버(20)는 디스플레이장치(100)로부터 사용자의 발화의 음성신호를 수신하면, 이를 음성 명령으로 변환한다.When the voice signal is received, the
대화형 서버(30)는 음성 명령에 대응하는 다양한 디스플레이장치(100)의 동작이 맵핑된 데이터베이스를 포함한다. 대화형 서버(30)는 디스플레이장치(100)로부터 수신한 음성 명령을 분석하고, 분석 결과에 따라서 해당 음성 명령에 대응하는 동작을 수행하기 위한 제어신호를 디스플레이장치(100)에 전송한다.The
제어부(190)는 음성입력부(160)에 사용자의 발화가 입력되면, 해당 발화의 음성신호를 STT서버(20)에 전송하고, STT서버(20)로부터 해당 발화에 대응하는 음성 명령을 수신한다.The
제어부(190)는 STT서버(20)로부터 수신된 음성 명령이 단문 및 대화문 중에서 어느 쪽에 해당하는지를 판단한다. 제어부(190)는 음성 명령이 단문이면 음성처리부(170)에 의해 처리되도록 하고, 음성 명령이 대화문이면 대화형 서버(30)에 의해 처리되도록 한다.The
이러한 과정은, 대화문이 자연어이기 때문에, 대화문인 음성 명령 내에서 사용자가 원하는 대응 동작을 기계적으로 추출하는 것이 상대적으로 용이하지 않기 때문이다. 예를 들면, 사용자의 음성 명령이 "KBS 틀어"라는 단문인 경우, 음성처리부(170)는 "KBS"라는 콜사인 키워드와 "틀어"라는 동작 키워드를 가지고 해당 동작을 바로 수행할 수 있다.This is because, since the dialogue is a natural language, it is relatively easy to mechanically extract the corresponding action desired by the user in the dialogue command. For example, when the user's voice command is a short sentence of "KBS", the
그런데, 이와 실질적으로 동일한 내용의 음성 명령인 "지금 보고 있는 채널을 한국방송으로 변경해 주세요"와 같은 대화문인 경우, "한국방송"에 대응하는 "KBS"의 콜사인 키워드를 도출하고, "변경해 주세요"에 대응하는 "틀어"라는 동작 키워드를 도출하는 과정이 필요하다. 시스템의 부하 또는 데이터베이스의 정보량 등과 같은 다양한 요인으로 인해, 음성처리부(170)가 이러한 대화문을 처리하는 것은 용이하지 않을 수 있다.However, in the case of a dialogue such as "Please change the channel you are watching to Korean broadcast", which is the same voice command, the call sign keyword of "KBS" corresponding to "Korean broadcast" is derived and "Please change". There is a need for a process of deriving an action keyword corresponding to "twist". Due to various factors such as the load of the system or the amount of information in the database, it may not be easy for the
도 4는 본 실시예에 따른 디스플레이장치(100) 및 서버(20, 30)의 인터랙션 과정을 나타내는 예시도이다.4 is an exemplary diagram illustrating an interaction process between the
도 4에 도시된 바와 같이, 디스플레이장치(100)는 사용자로부터 발화가 입력되면(600), 해당 발화의 음성신호를 STT서버(20)에 전달한다(610).As shown in FIG. 4, when a utterance is input from the user (600), the
STT서버(20)는 음성신호를 음성 명령으로 변환하고(620), 변환된 음성 명령을 디스플레이장치(100)에 전달한다(630).The
디스플레이장치(100)는 STT서버(30)로부터 수신한 음성 명령을 분석하여, 음성 명령으로부터 콜사인 관련 키워드를 추출한다(640). 여기서, 디스플레이장치(100)는 음성 명령의 단문/대화문 여부를 판단한다.The
만일, 음성 명령이 대화문으로 판단되면, 디스플레이장치(100)는 음성 명령 및 콜사인 관련 키워드를 대화형 서버(30)에 전송한다(650).If the voice command is determined to be a conversation, the
대화형 서버(30)는 디스플레이장치(100)로부터 수신된 음성 명령 및 콜사인 관련 키워드에 의한 콜사인 분석 프로세스를 수행한다(660). 콜사인 분석 프로세스에서는 콜사인 관련 키워드에 대응하는 콜사인 후보를 검색하는 단계, 검색된 콜사인 후보들 중에서 추천 콜사인을 선택하는 단계, 텍스트 내에서 추천 콜사인에 대응하는 디스플레이장치(100)의 동작을 판별하는 단계 등이 수행되며, 이에 관한 자세한 내용은 후술한다.The
대화형 서버(30)는 추천 콜사인의 선택과 음성 명령의 대응 동작의 판별이 완료되면, 이러한 선택 및 판별 결과에 따른 제어신호를 디스플레이장치(100)에 전송한다. 이에, 디스플레이장치(100)는 제어신호에 따라서 추천 콜사인에 대한 대응 동작을 수행할 수 있다.When the selection of the recommended call sign and the determination of the corresponding operation of the voice command are completed, the
예를 들면, 추천 콜사인이 "KBS-1"이고, 대응 동작이 채널 전환이라고 분석되면, 대화형 서버(30)는 이러한 내용을 지시하는 제어신호를 디스플레이장치(100)에 전송함으로써 디스플레이장치(100)가 "KBS-1" 채널로 전환하도록 한다.For example, if the recommended call sign is "KBS-1" and the corresponding operation is analyzed to be channel switching, the
한편, 앞선 640 단계에서 음성 명령이 단문으로 판단되면, 디스플레이장치(100)는 수신된 음성 명령 및 콜사인 관련 키워드에 의한 콜사인 분석 프로세스를 수행한다. 이러한 프로세스는 앞선 대화형 서버(30)에서 수행되는 프로세스와 실질적으로 동일한 원리에 따라서 이루어진다.On the other hand, if it is determined in step 640 that the voice command is short, the
이하, 콜사인 관련 키워드에 의한 콜사인 분석 프로세스에 관해 설명한다.Hereinafter, the callsign analysis process using callsign related keywords will be described.
대화형 서버(30)는 콜사인 관련 키워드에 대응하는 콜사인 후보를 검색하고, 검색된 콜사인 후보가 복수 개인지 판단한다.The
콜사인에 관련된 키워드 포함 여부의 판단 및 해당 키워드에 대응하는 콜사인 후보의 검색은, 앞선 도 2에서 설명한 바와 같은 방법을 통해 수행될 수 있다. 즉, 대화형 서버(30)는 음성 명령으로부터 추출된 단어를 데이터베이스(200, 도 2 참조) 상에 검색하여 매칭되는 단어(220, 도 2 참조)가 있는지 여부를 판단하고, 매칭되는 단어가 있다면 해당 대표 콜사인(210, 도 2 참조)의 콜사인 후보(230, 도 2 참조)를 얻을 수 있다.The determination of whether to include the keyword related to the call sign and the search of the call sign candidate corresponding to the keyword may be performed by the method described with reference to FIG. 2. That is, the
한편, 음성 명령에서 키워드를 추출하는 과정에서, 음성 명령의 오기에 대한 수정 또는 필터링이 수행될 수도 있다. 예를 들면, "안국방송 틀어줘"라는 음성 명령이 있다고 할 때, "안국방송"이란 단어가 데이터베이스 상에 없다고 하더라도, 데이터베이스 상의 "한국방송"이란 단어가 "안국방송"이란 단어와 유사하다고 판단되면 "한국방송"이란 단어가 선택될 수 있다. 단어의 유사도를 판단하는 방법은 다양하게 결정될 수 있는 바, 본 발명의 사상을 한정하지 않는다.On the other hand, in the process of extracting a keyword from the voice command, correction or filtering may be performed for misunderstanding of the voice command. For example, if there is a voice command of "broadcasting Anguk Broadcasting", the word "Korean Broadcasting" in the database is judged to be similar to the word "Anguk Broadcasting" even if the word "Anguk Broadcasting" is not in the database. The word "Korean broadcast" can be selected. The method of determining the similarity of words may be variously determined and does not limit the spirit of the present invention.
한편, 검색된 콜사인 후보가 하나라면, 대화형 서버(30)는 해당 콜사인 후보를 추천 콜사인으로 선택한다.On the other hand, if there is only one retrieved callsign candidate, the
반면, 검색된 콜사인 후보가 복수 개라면, 대화형 서버(30)는 기 설정된 선택조건에 따라서 추천 콜사인을 선택한다.On the other hand, if there are a plurality of retrieved call sign candidates, the
콜사인 후보들 중에서 추천 콜사인을 선택하는 선택조건은 다양한 조건이 미리 설정될 수 있다. 예를 들면, 대화형 서버(30)는 디스플레이장치(100)의 사용 이력 정보에 기초하여, 콜사인 후보 중에서 선택 빈도가 기 설정 순위 이상으로 높은 복수 개의 콜사인을 추천 콜사인으로 선택하거나, 또는 선택 빈도가 가장 높은 하나의 콜사인을 추천 콜사인으로 선택할 수 있다.As the selection condition for selecting the recommended callsign from among the callsign candidates, various conditions may be set in advance. For example, the
콜사인 후보 내에 "KBS-1", "KBS-2", "KBS-sports", "KBS-movie"의 네 콜사인이 있다고 할 때, 제어부(190)는 사용 이력 정보에 기초하여 이들 채널이 소정 기간 동안에 디스플레이장치(100)에서 선택된 빈도를 판단한다. 예를 들어, "KBS-sports", "KBS-movie", "KBS-2", "KBS-1"의 순서대로 선택 빈도가 높다고 할 때, 제어부(190)는 선택 빈도의 순서대로 복수 개의 콜사인을 선택하거나, 또는 하나의 콜사인을 선택할 수 있다.When there are four callsigns of "KBS-1", "KBS-2", "KBS-sports", and "KBS-movie" in the callsign candidate, the
여기서, 제어부(190)는 복수의 콜사인 후보 중에서 어느 하나를 사용자가 선택 가능하도록 제공하는 유아이 영상(UI, user interface)을 표시할 수 있다.Herein, the
도 5 및 도 6은 복수의 추천 콜사인 중 어느 하나를 선택 가능하게 제공하는 유아이 영상(310, 320)의 예시도이다.5 and 6 are exemplary diagrams of an
도 5에 도시된 바와 같이, 제어부(190)는 사용 이력 정보에 기초하여 디스플레이장치(100)에서 선택 빈도가 가장 높은 "KBS-sports" 및 "KBS-movie"을 추천 콜사인으로 선택하고, 선택한 추천 콜사인 중에서 사용자가 원하는 채널을 선택하도록 유아이 영상(310)을 제공한다. 사용자는 유아이 영상(310)을 통하여 "KBS-sports" 및 "KBS-movie" 중에서 어느 하나의 콜사인 및 방송채널을 선택할 수 있다.As shown in FIG. 5, the
또는, 도 6에 도시된 바와 같이, 제어부(190)는 "KBS-sports", "KBS-movie", "KBS-2", "KBS-1"의 모든 콜사인 후보 중에서 어느 하나를 선택 가능하게 제공하는 유아이 영상(320)을 제공할 수도 있다. 유아이 영상(320)에 검색된 모든 콜사인 후보를 표시하되, 제어부(190)는 선택 빈도에 따라서 각 콜사인들의 표시 순서를 결정할 수 있다. 예를 들면, 유아이 영상(320)은 가장 선택 빈도가 높은 순서대로 각 콜사인 후보들이 정렬되어 표시될 수 있다.Alternatively, as shown in FIG. 6, the
만일, 이와 같은 유아이 영상(310, 320)이 표시된 시점에서 기 설정된 시간 동안에 사용자에 의한 선택이 수행되지 않으면, 제어부(190)는 콜사인 후보들 중에서 최우선순위의 채널, 예를 들면 가장 높은 선택 빈도의 "KBS-sports"를 선택하여 대응 동작을 수행한다.If the infant is not selected by the user for a preset time at the time when the
콜사인 후보들 중에서 추천 콜사인을 선택하는 선택조건은 상기한 예시와 상이한 실시예가 적용될 수 있다. 서버(10, 도 1 참조)에는 디스플레이장치(100) 이외의 다양한 타 디스플레이장치가 접속된다. 여기서, 해당 서버(10)는 STT서버(20) 또는 대화형 서버(30)와 동일한 서버이거나, 상이한 서버일 수 있다. 또한, STT서버(20) 및 대화형 서버(30)는 상이한 서버인 것으로 표현하였으나, 동일한 서버로 구현될 수도 있다.As a selection condition for selecting the recommended callsign from among the callsign candidates, an embodiment different from the above example may be applied. Various other display apparatuses other than the
이들 타 디스플레이장치는 각기 사용 이력 정보를 서버(10)에 전송한다. 서버(10)는 각각의 타 디스플레이장치로부터 수집한 사용 이력 정보에 기초하여 콜사인 후보 내의 "KBS-1", "KBS-2", "KBS-sports", "KBS-movie" 각각의 선택 빈도를 판단한다.These other display apparatuses respectively transmit usage history information to the
제어부(190)는 "KBS-1", "KBS-2", "KBS-sports", "KBS-movie" 의 콜사인 후보를 서버(10)에 전송하고, 콜사인 후보 내에서 추천 후보를 선택해 줄 것으로 요청할 수 있다.The
이에, 서버(10)는 콜사인 후보 내에서, 타 디스플레이장치로부터의 사용 이력 정보에 기초한 선택 빈도 순위를 결정한다. 선택 빈도 순위가 "KBS-movie", "KBS-2", "KBS-sports", "KBS-1"이고, 디스플레이장치(100)로부터 요청받은 추천 후보의 수가 하나라고 할 때, 서버(10)는 선택 빈도 순위가 가장 높은 "KBS-movie"를 추천 후보로 결정하여 디스플레이장치(100)에게 알린다. 이에, 제어부(190)는 "KBS-movie"에 관련된 정보를 영상으로 표시할 수 있다.Accordingly, the
여기서, 제어부(190)는 하나의 추천 콜사인만을 선택하면, 자동으로 추천 콜사인의 방송채널 영상을 표시할 수 있다. 그런데, 지역 별로 콜사인에 대응하는 채널번호가 동일하지 않을 수 있다.In this case, when only one recommendation call sign is selected, the
따라서, 제어부(190)는 디스플레이장치(100)가 위치하는 지역정보를 취득하여, 해당 징역에 맞는 콜사인의 채널번호를 판단한다. 디스플레이장치(100)의 지역을 판단하는 방법은 다양하게 적용될 수 있는 바, 예를 들면 방송신호의 헤더 또는 메타데이터에 포함된 지역/국가 ID를 추출하거나, 통신부(140)의 맥 어드레스를 기초로 하여 서버(10)가 판단하거나, 또는 디스플레이장치(100)에 미리 사용자가 지역정보를 입력해 둘 수도 있다.Therefore, the
이상 설명한 바와 같이, 디스플레이장치(100)는 사용자의 발화에 대응하는 음성 명령이 콜사인 관련 키워드를 포함하면 해당 키워드에 대응하는 추천 콜사인이 선택되도록 하고, 선택된 추천 콜사인의 방송 채널에 대하여 음성 명령에 따른 대응 동작을 수행할 수 있다.As described above, if the voice command corresponding to the user's utterance includes a call sign related keyword, the
도 7은 본 발명의 제2실시예에 따른 디스플레이장치(100) 및 서버(20, 30)의 인터랙션 과정을 나타내는 예시도이다.7 is an exemplary diagram illustrating an interaction process between the
도 7에 도시된 바와 같이, 디스플레이장치(100)는 사용자로부터 발화가 입력되면(700), 해당 발화의 음성신호를 STT서버(20)에 전송한다(710).As illustrated in FIG. 7, when an utterance is input from the user (700), the
STT서버(20)는 수신된 음성신호를 음성 명령으로 변환한다(720). 이 단계까지는 앞선 도 4의 경우와 동일하다.The
STT서버(20)는 음성 명령을 대화형 서버(30)에 전달한다(730).The
대화형 서버(30)는 콜사인 후보의 검색, 추천 콜사인 선택과 같은 일련의 콜사인 분석 프로세스를 진행한다(740). 이에 관한 자세한 내용은 앞선 실시예의 경우를 응용할 수 있는 바, 자세한 설명을 생략한다. 다만, 본 실시예에서의 콜사인 분석 프로세스는 도 4의 경우와 달리, 대화형 서버(30)가 음성 명령에서 콜사인 키워드의 추출하여 진행된다.The
대화형 서버(30)는 추천 콜사인 및 대응 동작을 지시하는 제어신호를 디스플레이장치(100)에 전송함으로써, 디스플레이장치(100)가 해당 제어신호에 따라서 동작하도록 한다(750).The
한편, 앞선 실시예에서는 디스플레이장치(100)에 입력된 사용자의 발화를 STT서버(20)에 의해 음성 명령으로 변환하고, 음성 명령이 단문이면 디스플레이장치(100)에서 처리되며 음성 명령이 대화문이면 대화형 서버(30)에 의해 처리되는 구성에 관하여 설명하였다.On the other hand, in the above embodiment, the user's utterance input to the
그러나, 본 발명의 사상이 이에 한정되지 않으며, 발화를 음성 명령으로 변환하는 구성과, 음성 명령의 단문/대화문 여부에 따라서 해당 음성 명령을 처리하는 주체에 관한 구성은 앞선 실시예와 상이한 구조로 구현될 수도 있다.However, the idea of the present invention is not limited to this, and a structure for converting a speech to a voice command and a subject for processing the voice command according to whether a voice command is a short message or a dialogue is different from the previous embodiment .
도 8은 제3실시예에 따른 디스플레이장치(100a) 및 서버(40)의 인터랙션 구조를 나타내는 구성 블록도이며, 도 9는 도 8의 디스플레이장치(100a) 및 서버(40)의 인터랙션 과정을 나타내는 예시도이다.FIG. 8 is a block diagram illustrating an interaction structure between the
도 8에 도시된 바와 같이, 디스플레이장치(100a)는 통신부(140a)와, 음성입력부(160a)와, 음성처리부(170a)와, 제어부(190a)를 포함한다.8, the
여기서, 음성처리부(170a)는 음성입력부(160a)로부터 전달되는 발화를 음성 명령으로 변환하는 STT변환부(171a)와, 음성 명령이 단문일 경우에 이를 처리하는 단문 명령 처리부(172a)를 포함한다. Here, the
음성입력부(160a)는 사용자로부터 발화가 입력되면, 입력된 발화의 음성신호를 STT변환부(171a)에 전달한다. STT변환부(171a)는 음성입력부(160a)로부터 전달된 음성신호를 분석하여, 해당 음성의 내용을 포함하는 음성 명령으로 변환한다. STT변환부(171a)는 변환한 음성 명령 제어부(190a)에 전달한다. 즉, STT변환부(171a)는 앞선 제1실시예의 STT서버(20)의 기능을 수행한다.The
제어부(190a)는 음성 명령의 단문/대화문 여부를 판단한다. 제어부(190a)는 음성 명령이 단문이면 음성 명령을 단문 명령 처리부(172a)에 전달한다. 단문 명령 처리부(172a)는 제어부(190a)의 제어에 따라서 음성 명령을 분석하고, 분석 결과에 따라서 대응 동작을 실행한다. 음성 명령의 분석 및 실행에 관한 내용은 앞선 실시예를 응용할 수 있는 바, 자세한 설명을 생략한다.The
반면, 제어부(190a)는 음성 명령이 대화문이면, 해당 음성 명령을 단문 명령 처리부(172a)에 전달하지 않고, 통신부(140a)를 통해 대화형 서버(40)에 전송한다. 대화형 서버(20)는 앞선 제1실시예의 대화형 서버(30)와 동일한 기능을 수행한다.On the other hand, if the voice command is a conversation text, the
이에, 디스플레이장치(100a)는 대화형 서버(20)로부터 수신한 제어신호에 대응하는 동작을 수행한다.Accordingly, the
도 9에 도시된 바와 같이, 디스플레이장치(100a)는 대화형 서버(40)에 통신 가능하게 접속한다. 디스플레이장치(100a)는 사용자로부터 발화가 입력되면(810), 해당 발화에 대응하는 음성 명령의 단문/대화문 여부를 판단한다(820). 디스플레이장치(100a)는 음성 명령이 대화문인 것으로 판단하면, 해당 음성 명령을 대화형 서버(40)에 전송한다(830).As shown in FIG. 9, the
대화형 서버(40)는 디스플레이장치(100)로부터 음성 명령을 수신하면(910), 음성 명령으로부터 콜사인 관련 키워드를 추출한다(920).When the
또는, 콜사인 관련 키워드가 대화형 서버(40)에 의해 추출되는 것이 아닌, 디스플레이장치(100a)에 의해 추출될 수도 있다. 이 경우, 디스플레이장치(100a)는 대화형 서버(40)에 대해 콜사인 관련 키워드 및 음성 명령을 함께 전송한다.Alternatively, the call sign related keyword may not be extracted by the
대화형 서버(40)는 키워드에 대응하는 콜사인 후보를 검색한다(930). 대화형 서버(40)는 복수의 콜사인 후보가 검색되면, 검색된 복수의 콜사인 후보 중에서 앞서 설명한 바와 같은 선택조건에 따라서 추천 콜사인을 선택한다(940). 또한, 대화형 서버(40)는 음성 명령을 분석하여, 음성 명령에 따른 대응 동작을 판별한다.The
대화형 서버(40)는 추천 콜사인 및 대응 동작을 지시하는 제어신호를 디스플레이장치(100a)에 전송한다(950).The
디스플레이장치(100a)는 대화형 서버(40)로부터 수신한 제어신호에 따라서, 추천 콜사인의 방송 채널에 대한 대응 동작을 실행한다(840).The
한편, 디스플레이장치(100a)는 앞선 820 단계에서 음성 명령이 단문인 것으로 판단되면, 디스플레이장치(100a) 자체적으로 추천 콜사인 및 대응 동작을 분석한다.On the other hand, if it is determined in
도 10은 본 발명의 제4실시예에 따른 디스플레이장치(100b)의 음성처리부(171b)의 신호 전달 구조를 나타내는 구성 블록도이다.10 is a block diagram illustrating a signal transmission structure of the
도 10에 도시된 바와 같이, 음성처리부(170b)는 음성입력부(160b)로부터 전달되는 사용자의 발화를 음성 명령으로 변환하는 STT변환부(171b)와, STT변환부(171b)에 의해 변환된 음성 명령이 단문일 경우에 이를 처리하는 단문 명령 처리부(172b)와, STT변환부(171b)에 의해 변환된 음성 명령이 대화문/자연어일 경우에 이를 처리하는 대화형 명령 처리부(173b)를 포함한다. 음성처리부(170b)의 구조는 본 예시에 의해 한정되지 않으며, 본 예시는 본 발명의 실시예와 직접적인 연관이 있는 사항만을 간략히 표현한 것이다.As shown in FIG. 10, the
음성입력부(160b)는 사용자로부터 발화가 입력되면, 입력된 발화의 음성신호를 STT변환부(171b)에 전달한다. STT변환부(171b)는 음성입력부(160b)로부터 전달된 발화를, 해당 발화의 내용을 포함하는 음성 명령으로 변환한다. STT변환부(171b)는 변환한 음성 명령을 제어부(190b)에 전달한다.The
제어부(190b)는 음성 명령이 단문인지 아니면 대화문인지 여부를 판단한다. 이 때, 단문 또는 대화문의 판단 여부는 다양한 알고리즘에 따라서 처리될 수 있다.The
제어부(190b)는 음성 명령이 단문인 경우에는 해당 음성 명령을 단문 명령 처리부(172b)로 전달되게 한다. 반면, 제어부(190b)는 음성 명령이 대화문인 경우에는 해당 음성 명령을 대화형 명령 처리부(173b)로 전달한다.If the voice command is a short message, the
단문 명령 처리부(172b)는 앞선 도 8의 단문 명령 처리부(172a)와 실질적으로 동일한 기능을 수행한다. 또한, 대화형 명령 처리부(173b)는 앞선 실시예들의 대화형 서버(30, 40)가 수행하는 기능을 수행한다.The
즉, 본 실시예에 따른 디스플레이장치(100b)는 앞선 실시예들과 달리, 외부 서버(20 내지 40)와의 데이터/신호 전송을 수행하지 않고, 디스플레이장치(100b) 자체적으로 사용자의 발화에 따른 음성 명령의 변환과, 해당 음성 명령에 대응하는 동작을 분석할 수 있다.That is, unlike the previous embodiments, the
한편, 디스플레이장치가 콜사인 분석 프로세스를 실행하는 별도의 서버(미도시)에 접속되어 있는 경우, 단문 명령 처리부(172a) 또는 대화형 명령 처리부(173b)는 키워드 및 음성 명령을 해당 서버(미도시)에 전송함으로써, 해당 서버(미도시)에서 콜사인 분석 프로세스가 수행되도록 할 수도 있다.On the other hand, when the display device is connected to a separate server (not shown) that executes a callsign analysis process, the short
즉, 앞선 실시예들에서는 대화형 서버(30, 40) 또는 음성처리부(170, 170a, 170b)에서 콜사인 분석 프로세스가 수행되는 것으로 표현하였으나, 콜사인 분석 프로세스를 수행하는 별도의 서버(미도시)에 의해 해당 프로세스가 수행될 수도 있다.That is, in the above embodiments, although the call sign analysis process is expressed as being performed in the
상기한 실시예는 예시적인 것에 불과한 것으로, 당해 기술 분야의 통상의 지식을 가진 자라면 다양한 변형 및 균등한 타 실시예가 가능하다. 따라서, 본 발명의 진정한 기술적 보호범위는 하기의 특허청구범위에 기재된 발명의 기술적 사상에 의해 정해져야 할 것이다.The above-described embodiments are merely illustrative, and various modifications and equivalents may be made by those skilled in the art. Accordingly, the true scope of protection of the present invention should be determined by the technical idea of the invention described in the following claims.
10 : 서버
100 : 영상처리장치/디스플레이장치
110 : 영상수신부
120 : 영상처리부
130 : 디스플레이부
140 : 통신부
150 : 사용자입력부
160 : 음성입력부
170 : 음성처리부
180 : 저장부
190 : 제어부10: Server
100: image processing device / display device
110:
120:
130:
140:
150: User input
160:
170:
180:
190:
Claims (23)
외부로부터 수신되는 방송신호를 영상으로 표시되게 처리하는 영상처리부와;
서버에 통신 가능하게 접속되는 통신부와;
사용자의 발화가 입력되는 음성입력부와;
상기 발화에 대응하는 음성 명령에 따라서 기 설정된 대응 동작이 수행되게 처리하는 음성처리부와;
상기 음성입력부를 통해 상기 발화가 입력되면 상기 음성처리부 및 상기 서버 중 어느 하나에 의해 상기 발화에 대응하는 상기 음성 명령이 처리되게 제어하는 제어부를 포함하며,
상기 제어부는, 상기 음성 명령이 방송 채널의 콜사인(call sign)에 관련된 키워드를 포함하는 경우에, 상기 음성처리부 및 상기 서버 중 어느 하나에 저장된, 상기 키워드에 대응하는 적어도 하나의 콜사인을 표시하는 것을 특징으로 하는 영상처리장치.An image processing apparatus comprising:
An image processor which processes a broadcast signal received from the outside to be displayed as an image;
A communication unit communicatively connected to the server;
A voice input unit to which a user's utterance is input;
A voice processing unit for performing a predetermined corresponding operation according to a voice command corresponding to the utterance;
And a control unit for controlling the voice processing unit and the server to process the voice command corresponding to the utterance when the utterance is input through the voice input unit,
The controller may be configured to display at least one call sign corresponding to the keyword stored in either the voice processor or the server when the voice command includes a keyword related to a call sign of a broadcast channel. An image processing apparatus characterized by the above.
상기 키워드에 대응하는 적어도 하나의 콜사인 후보 데이터베이스가 상기 영상처리장치 및 상기 서버 중 어느 하나에 저장되며, 상기 키워드에 대응하는 적어도 하나의 콜사인은 상기 데이터베이스로부터의 검색을 통해 선택되는 것을 특징으로 하는 영상처리장치.The method of claim 1,
At least one callsign candidate database corresponding to the keyword is stored in one of the image processing apparatus and the server, and at least one callsign corresponding to the keyword is selected through a search from the database. Processing unit.
상기 기 설정된 선택조건은, 상기 영상처리장치의 사용 이력 정보에 기초하여 상기 적어도 하나의 콜사인 중에서 선택 빈도가 가장 높은 콜사인이 선택되는 것을 특징으로 하는 영상처리장치.The method of claim 1,
The preset selection condition may include selecting a call sign having the highest frequency of selection from the at least one call sign based on usage history information of the image processing apparatus.
상기 기 설정된 선택조건은, 상기 서버와 통신하는 복수의 타 영상처리장치에서의 선택 빈도가 기 설정 순위 이상인 콜사인을 선택하는 것을 특징으로 하는 영상처리장치.The method of claim 1,
The preset selection condition may include selecting a call sign whose frequency of selection is greater than or equal to a predetermined order in a plurality of other image processing apparatuses communicating with the server.
상기 제어부는, 상기 적어도 하나의 콜사인을 표시하고, 상기 적어도 하나의 콜사인 중에서 어느 하나를 사용자가 선택할 수 있도록 제공하는 유아이 영상을 표시하는 것을 특징으로 하는 영상처리장치.3. The method of claim 2,
The controller may be configured to display the at least one call sign and to display an image of an infant providing the user to select one of the at least one call sign.
상기 제어부는, 상기 적어도 하나의 콜사인을 상기 기 설정된 선택조건의 순으로 표시하는 것을 특징으로 하는 영상처리장치.The method of claim 5, wherein
And the control unit displays the at least one call sign in the order of the predetermined selection condition.
상기 제어부는, 상기 기 설정된 선택조건의 순으로 표시된 상기 적어도 하나의 콜사인 중 가장 순위가 높은 콜사인에 커서를 표시하는 것을 특징으로 하는 영상처리장치.The method of claim 6, wherein
And the controller is configured to display a cursor on a callsign having the highest rank among the at least one callsign displayed in the order of the predetermined selection condition.
상기 제어부는, 상기 유아이 영상이 표시된 이후 기 설정된 시간 동안에 사용자로부터 상기 적어도 하나의 콜사인 중 어느 하나를 선택하는 입력이 수행되지 않은 경우에, 상기 기 설정된 선택조건과 상이하도록 마련된 선택조건에 기초하여 어느 하나의 상기 콜사인을 선택하는 것을 특징으로 하는 영상처리장치.The method of claim 5, wherein
The controller may be further configured to determine which one of the at least one call sign is selected from the user during a preset time after the image is displayed, based on a selection condition provided to be different from the preset selection condition. The image processing apparatus, characterized in that for selecting one of the call sign.
상기 통신부는 상기 발화를 텍스트의 음성 명령으로 변환하는 STT(speech-to-text)서버와 통신하며,
상기 제어부는, 상기 음성입력부에 상기 발화가 입력되면 상기 발화의 음성신호를 상기 STT서버로 전송하며, 상기 STT서버로부터 상기 발화에 대응하는 상기 음성 명령을 수신하는 것을 특징으로 하는 영상처리장치.The method of claim 1,
The communication unit communicates with a speech-to-text (STT) server that converts the utterance into a voice command of text,
Wherein the control unit transmits the voice signal of the utterance to the STT server when the utterance is input to the voice input unit and receives the voice command corresponding to the utterance from the STT server.
상기 제어부는, 상기 음성 명령이 단문일 경우에 상기 음성 명령을 상기 음성처리부에 의해 처리되고, 상기 음성 명령이 대화문일 경우에 상기 음성 명령을 상기 서버에 의해 처리되게 제어하는 것을 특징으로 하는 영상처리장치.10. The method of claim 9,
Wherein the control unit controls the voice command to be processed by the voice processing unit when the voice command is a short message and the voice command to be processed by the server when the voice command is a conversation. Device.
상기 영상처리부에 의해 처리되는 방송신호를 영상으로 표시하는 디스플레이부를 더 포함하는 것을 특징으로 하는 영상처리장치.The method of claim 1,
And a display unit for displaying a broadcast signal processed by the image processor as an image.
사용자의 발화가 입력되는 단계와;
상기 영상처리장치 및 상기 서버 중 어느 하나에 의해 상기 발화에 대응하는 음성 명령이 처리되게 제어하고, 상기 음성 명령에 따라서 기 설정된 대응 동작을 수행하는 단계를 포함하며,
상기 음성 명령에 따라서 기 설정된 대응 동작을 수행하는 단계는,
상기 음성 명령이 방송 채널의 콜사인에 관련된 키워드를 포함하는 경우에, 상기 영상처리장치 및 상기 서버 중 어느 하나에 의해 저장된, 상기 키워드에 대응하는 적어도 하나의 콜사인을 표시하는 단계를 포함하는 것을 특징으로 하는 영상처리장치의 제어방법.In the control method of the image processing apparatus to communicate with the server,
Inputting a user's utterance;
Controlling the voice command corresponding to the speech to be processed by any one of the image processing apparatus and the server, and performing a preset corresponding operation according to the voice command;
The performing of the preset corresponding operation according to the voice command may include:
If the voice command includes a keyword related to a call sign of a broadcast channel, displaying at least one call sign corresponding to the keyword stored by either the image processing apparatus or the server. Control method of an image processing apparatus.
상기 키워드에 대응하는 적어도 하나의 콜사인 후보 데이터베이스가 상기 영상처리장치 및 상기 서버 중 어느 하나에 저장되며, 상기 키워드에 대응하는 적어도 하나의 콜사인은 상기 데이터베이스로부터의 검색을 통해 선택되는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 12,
At least one callsign candidate database corresponding to the keyword is stored in one of the image processing apparatus and the server, and at least one callsign corresponding to the keyword is selected through a search from the database. Control method of processing device.
상기 기 설정된 선택조건은, 상기 영상처리장치의 사용 이력 정보에 기초하여 상기 적어도 하나의 콜사인 중에서 선택 빈도가 가장 높은 콜사인이 선택되는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 12,
The preset selection condition is a control method of the image processing apparatus, characterized in that the call frequency having the highest selection frequency among the at least one call sign is selected based on the usage history information of the image processing apparatus.
상기 기 설정된 선택조건은, 상기 서버와 통신하는 복수의 타 영상처리장치에서의 선택 빈도가 기 설정 순위 이상인 콜사인을 선택하는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 12,
The preset selection condition is a control method of an image processing apparatus, characterized in that for selecting a call sign of the frequency of selection in the plurality of other image processing apparatuses communicating with the server or more than a predetermined order.
상기 적어도 하나의 콜사인을 표시하는 경우에 상기 적어도 하나의 콜사인 중에서 어느 하나를 사용자가 선택할 수 있도록 제공하는 유아이 영상을 표시하는 단계를 더 포함하는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 12,
And displaying the image by the infant providing the user to select any one of the at least one call sign when the at least one call sign is displayed.
상기 유아이 영상에서 상기 적어도 하나의 콜사인을 상기 기 설정된 선택조건의 순으로 표시하는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 16, wherein
And the infant displays the at least one call sign in the order of the predetermined selection condition in the image.
상기 유아이 영상에서 상기 기 설정된 선택조건의 순으로 표시된 상기 적어도 하나의 콜사인 중 가장 순위가 높은 콜사인에 커서를 표시하는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 17, wherein
And displaying a cursor on a callsign having the highest rank among the at least one callsign displayed in the order of the predetermined selection condition in the image.
상기 유아이 영상을 표시하는 단계는, 상기 유아이 영상이 표시된 이후 기 설정된 시간 동안에 사용자로부터 상기 적어도 하나의 콜사인 중 어느 하나를 선택하는 입력이 수행되지 않은 경우에, 상기 기 설정된 선택조건과 상이하도록 마련된 선택조건에 기초하여 어느 하나의 상기 콜사인을 선택하는 단계를 포함하는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 16, wherein
The displaying of the image by the infant may include selecting to be different from the preset selection condition when an input for selecting one of the at least one call sign is not performed by the user during a preset time after the image is displayed. And selecting one of the call signs based on a condition.
상기 영상처리장치는 상기 발화를 텍스트의 음성 명령으로 변환하는 STT서버와 통신하며,
상기 사용자의 발화가 입력되는 단계는,
상기 발화의 음성신호를 상기 STT서버로 전송하는 단계와;
상기 STT서버로부터 상기 발화에 대응하는 상기 음성 명령을 수신하는 단계를 포함하는 것을 특징으로 하는 영상처리장치의 제어방법.The method of claim 12,
The image processing apparatus communicates with the STT server for converting the speech into a voice command of the text,
Wherein the inputting of the user's utterance comprises:
Transmitting the voice signal of the utterance to the STT server;
And receiving the voice command corresponding to the utterance from the STT server.
상기 음성 명령이 단문일 경우에 상기 음성 명령을 상기 영상처리장치에 의해 처리되고, 상기 음성 명령이 대화문일 경우에 상기 음성 명령을 상기 서버에 의해 처리되게 제어하는 단계를 더 포함하는 것을 특징으로 하는 영상처리장치의 제어방법.21. The method of claim 20,
Controlling the voice command to be processed by the image processing apparatus when the voice command is a short text, and processing the voice command by the server when the voice command is a conversation text. Control method of an image processing apparatus.
외부로부터 수신되는 방송신호를 영상으로 표시되게 처리하는 영상처리장치와;
상기 영상처리장치와 통신하는 서버를 포함하며,
상기 영상처리장치는,
사용자의 발화가 입력되는 음성입력부와;
상기 발화에 대응하는 음성 명령에 따라서 기 설정된 대응 동작이 수행되게 처리하는 음성처리부와;
상기 음성입력부를 통해 상기 발화가 입력되면 상기 음성처리부 및 상기 서버 중 어느 하나에 의해 상기 발화에 대응하는 상기 음성 명령이 처리되게 제어하는 제어부를 포함하며,
상기 제어부는, 상기 음성 명령이 방송 채널의 콜사인에 관련된 키워드를 포함하는 경우에, 상기 음성처리부 및 상기 서버 중 어느 하나에 저장된, 상기 키워드에 대응하는 적어도 하나의 콜사인을 표시하는 것을 특징으로 하는 영상처리 시스템.In an image processing system,
An image processing apparatus for processing a broadcast signal received from the outside to be displayed as an image;
And a server for communicating with the image processing apparatus,
The image processing apparatus comprising:
A voice input unit to which a user's utterance is input;
A voice processing unit for performing a predetermined corresponding operation according to a voice command corresponding to the utterance;
And a control unit for controlling the voice processing unit and the server to process the voice command corresponding to the utterance when the utterance is input through the voice input unit,
The controller may be further configured to display at least one call sign corresponding to the keyword stored in one of the voice processor and the server when the voice command includes a keyword related to a call sign of a broadcast channel. Processing system.
상기 발화를 텍스트의 음성 명령으로 변환하는 STT서버를 더 포함하며,
상기 제어부는, 상기 음성입력부에 상기 발화가 입력되면 상기 발화의 음성신호를 상기 STT서버로 전송하며, 상기 STT서버로부터 상기 발화에 대응하는 상기 음성 명령을 수신하는 것을 특징으로 하는 영상처리 시스템.The method of claim 22,
Further comprising a STT server for converting the speech into a voice command of the text,
The controller may be configured to transmit a voice signal of the speech to the STT server when the speech is input to the speech input unit, and receive the speech command corresponding to the speech from the STT server.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020120109454 | 2012-09-28 | ||
| KR20120109454 | 2012-09-28 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020120115783A Division KR20140039946A (en) | 2012-09-28 | 2012-10-18 | Image processing apparatus and control method thereof, image processing system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20140042637A true KR20140042637A (en) | 2014-04-07 |
| KR101877430B1 KR101877430B1 (en) | 2018-07-12 |
Family
ID=50650455
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020120115783A Ceased KR20140039946A (en) | 2012-09-28 | 2012-10-18 | Image processing apparatus and control method thereof, image processing system |
| KR1020130057262A Expired - Fee Related KR101877430B1 (en) | 2012-09-28 | 2013-05-21 | Image processing apparatus and control method thereof, image processing system |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020120115783A Ceased KR20140039946A (en) | 2012-09-28 | 2012-10-18 | Image processing apparatus and control method thereof, image processing system |
Country Status (5)
| Country | Link |
|---|---|
| JP (2) | JP2022008691A (en) |
| KR (2) | KR20140039946A (en) |
| BR (1) | BR102013002349A2 (en) |
| MX (1) | MX341560B (en) |
| RU (1) | RU2571520C2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9922648B2 (en) * | 2016-03-01 | 2018-03-20 | Google Llc | Developer voice actions system |
| JP6801539B2 (en) * | 2017-03-17 | 2020-12-16 | 株式会社リコー | Information processing system, information processing device, information processing program and information processing method |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6757718B1 (en) * | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
| JP2005249829A (en) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | Computer network system performing speech recognition |
| JP2007142840A (en) * | 2005-11-18 | 2007-06-07 | Canon Inc | Information processing apparatus and information processing method |
| KR20070087910A (en) * | 2006-02-01 | 2007-08-29 | 삼성전자주식회사 | Apparatus and method for controlling data broadcasting content using speech recognition |
| JP5771002B2 (en) * | 2010-12-22 | 2015-08-26 | 株式会社東芝 | Speech recognition apparatus, speech recognition method, and television receiver equipped with speech recognition apparatus |
-
2012
- 2012-10-18 KR KR1020120115783A patent/KR20140039946A/en not_active Ceased
-
2013
- 2013-01-18 MX MX2015003890A patent/MX341560B/en active IP Right Grant
- 2013-01-23 JP JP2013010622A patent/JP2022008691A/en active Pending
- 2013-01-25 RU RU2013103490/08A patent/RU2571520C2/en active
- 2013-01-30 BR BR102013002349-3A patent/BR102013002349A2/en not_active Application Discontinuation
- 2013-05-21 KR KR1020130057262A patent/KR101877430B1/en not_active Expired - Fee Related
-
2014
- 2014-04-17 JP JP2014085816A patent/JP2014149548A/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| RU2013103490A (en) | 2014-07-27 |
| KR101877430B1 (en) | 2018-07-12 |
| JP2014149548A (en) | 2014-08-21 |
| BR102013002349A2 (en) | 2014-07-08 |
| RU2571520C2 (en) | 2015-12-20 |
| KR20140039946A (en) | 2014-04-02 |
| MX2015003890A (en) | 2015-07-06 |
| JP2022008691A (en) | 2022-01-14 |
| MX341560B (en) | 2016-08-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8838456B2 (en) | Image processing apparatus and control method thereof and image processing system | |
| JP6824316B2 (en) | Video processing equipment, its control method, and video processing system | |
| US8000972B2 (en) | Remote controller with speech recognition | |
| US20140122089A1 (en) | Image processing apparatus and control method thereof and image processing system | |
| US10140985B2 (en) | Server for processing speech, control method thereof, image processing apparatus, and control method thereof | |
| KR20130134545A (en) | System and method for digital television voice search using remote control | |
| KR101877430B1 (en) | Image processing apparatus and control method thereof, image processing system | |
| KR102175135B1 (en) | Server and control method thereof, and image processing apparatus and control method thereof | |
| KR20140053760A (en) | Image processing apparatus and control method thereof, image processing system | |
| KR20170027563A (en) | Image processing apparutus and control method of the same | |
| AU2018202888B2 (en) | Image processing apparatus, control method thereof, and image processing system | |
| KR102317742B1 (en) | Server and control method thereof, and image processing apparatus and control method thereof | |
| KR102418798B1 (en) | Server and control method thereof, and image processing apparatus and control method thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A107 | Divisional application of patent | ||
| PA0107 | Divisional application |
St.27 status event code: A-0-1-A10-A16-div-PA0107 St.27 status event code: A-0-1-A10-A18-div-PA0107 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
Fee payment year number: 1 St.27 status event code: A-2-2-U10-U11-oth-PR1002 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 4 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| PC1903 | Unpaid annual fee |
Not in force date: 20220706 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE St.27 status event code: A-4-4-U10-U13-oth-PC1903 |
|
| PC1903 | Unpaid annual fee |
Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20220706 St.27 status event code: N-4-6-H10-H13-oth-PC1903 |