[go: up one dir, main page]

KR102803468B1 - Common device, method and computer program for providing service based on voice command - Google Patents

Common device, method and computer program for providing service based on voice command Download PDF

Info

Publication number
KR102803468B1
KR102803468B1 KR1020180083553A KR20180083553A KR102803468B1 KR 102803468 B1 KR102803468 B1 KR 102803468B1 KR 1020180083553 A KR1020180083553 A KR 1020180083553A KR 20180083553 A KR20180083553 A KR 20180083553A KR 102803468 B1 KR102803468 B1 KR 102803468B1
Authority
KR
South Korea
Prior art keywords
service
user
agent
voice command
agents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020180083553A
Other languages
Korean (ko)
Other versions
KR20200009332A (en
Inventor
이지인
김원우
임미숙
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020180083553A priority Critical patent/KR102803468B1/en
Publication of KR20200009332A publication Critical patent/KR20200009332A/en
Application granted granted Critical
Publication of KR102803468B1 publication Critical patent/KR102803468B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

음성 명령 기반의 서비스를 제공하는 공용 단말은 공용 단말에서 제공하는 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 서비스 분류부, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 카테고리 분류부, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 에이전트 설정부 및 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 서비스 제공부를 포함한다. A public terminal providing a voice command-based service includes a service classification unit that classifies a plurality of services provided by the public terminal based on a user's history data, a category classification unit that classifies the classified plurality of services into a plurality of categories according to the type of each service, an agent setting unit that sets agents corresponding to the classified plurality of categories, and a service providing unit that provides a service corresponding to a voice command input from the user through the set agent.

Description

음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램{COMMON DEVICE, METHOD AND COMPUTER PROGRAM FOR PROVIDING SERVICE BASED ON VOICE COMMAND}COMMON DEVICE, METHOD AND COMPUTER PROGRAM FOR PROVIDING SERVICE BASED ON VOICE COMMAND

본 발명은 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램에 관한 것이다. The present invention relates to a common terminal, method and computer program for providing a voice command-based service.

지능형 개인 비서는 사용자가 요구하는 작업을 처리하고, 사용자에게 특화된 서비스를 제공하는 소프트웨어 에이전트이다. 지능형 개인 비서는 인공 지능(AI) 엔진과 음성 인식을 기반으로 사용자에게 맞춤 정보를 수집하여 제공하고, 사용자의 음성 명령에 따라 일정 관리, 이메일 전송, 식당 예약 등 여러 기능을 수행하는 점에서 사용자의 편의성을 향상시키는 장점을 갖는다. An intelligent personal assistant is a software agent that processes tasks requested by users and provides customized services to users. An intelligent personal assistant has the advantage of improving user convenience by collecting and providing customized information to users based on artificial intelligence (AI) engines and voice recognition, and performing various functions such as schedule management, sending emails, and making restaurant reservations according to the user's voice commands.

이러한 지능형 개인 비서는 주로 스마트폰에서 맞춤형 개인 서비스의 형태로 제공되고 있으며, 대표적으로 애플의 시리(siri), 구글의 나우(now), 삼성의 빅스비 등이 이에 포함된다. 이와 관련하여, 선행기술인 한국공개특허 제 2016-0071111호는 전자 장치에서의 개인 비서 서비스 제공 방법을 개시하고 있다. These intelligent personal assistants are mainly provided in the form of customized personal services on smartphones, and representative examples include Apple's Siri, Google's Now, and Samsung's Bixby. In this regard, prior art Korean Publication No. 2016-0071111 discloses a method for providing personal assistant services on electronic devices.

그러나 지능형 개인 비서는 지능형 개인 비서에서 제공하는 각 서비스마다 사용 명령어가 상이하며, 사용자는 각 서비스를 제공받기 위해 모든 사용 명령어를 기억해야 한다. 이로 인해, 사용자는 지능형 개인 비서의 사용법에 불편함을 느끼게 된다는 단점을 갖는다. However, the intelligent personal assistant has different usage commands for each service provided by the intelligent personal assistant, and the user must remember all usage commands to receive each service. This has the disadvantage of making the user feel uncomfortable when using the intelligent personal assistant.

공용 단말에서 제공하는 복수의 서비스를 유형별로 카테고리화여 분류하고, 분류된 카테고리 별로 에이전트를 부여함으로써, 사용자에게 사용 편의성 및 지속성을 향상시키는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다. The present invention provides a common terminal, method and computer program that provide a voice command-based service that improves the convenience and sustainability of use to users by categorizing and classifying multiple services provided by a common terminal by type and assigning agents to each classified category.

사용자가 각 서비스의 유형별로 에이전트를 설정함으로써, 개인 맞춤형의 음성 명령 기반의 서비스를 통해 사용자에게 기기 친밀도 및 수용도를 높일 수 있도록 하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다. The present invention provides a common terminal, method and computer program for providing a voice command-based service, which enables users to increase device intimacy and acceptance through personalized voice command-based services by setting agents according to the type of each service.

사용자의 히스토리 데이터와 상황 데이터의 조합을 통해 사용자의 상황에 맞는 서비스를 에이전트가 능동적으로 추천하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다. The present invention provides a common terminal, method and computer program that provide a voice command-based service in which an agent actively recommends a service suitable for the user's situation by combining the user's history data and situation data.

사용자가 에이전트명을 호출하고, 호출된 에이전트명에 대응하는 에이전트가 실행되어 사용자의 상황에 맞는 서비스를 자동으로 제공되도록 함으로써, 서비스의 진입까지의 뎁스(depth)를 단축시킬 수 있는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다. The present invention provides a common terminal, method and computer program that provide a voice command-based service capable of shortening the depth of entry into the service by allowing a user to call an agent name and have an agent corresponding to the called agent name executed to automatically provide a service appropriate to the user's situation.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. However, the technical tasks that this embodiment seeks to accomplish are not limited to the technical tasks described above, and other technical tasks may exist.

상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 공용 단말에서 제공하는 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 서비스 분류부, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 카테고리 분류부, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 에이전트 설정부 및 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 서비스 제공부를 포함하는 공용 단말을 제공할 수 있다. As a means for achieving the above-described technical task, one embodiment of the present invention can provide a common terminal including a service classification unit that classifies a plurality of services provided by a common terminal based on a user's history data, a category classification unit that classifies the classified plurality of services into a plurality of categories according to the type of each service, an agent setting unit that sets agents corresponding to the classified plurality of categories, and a service providing unit that provides a service corresponding to a voice command input from the user through the set agent.

본 발명의 다른 실시예는, 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 단계, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 단계, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 단계 및 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 단계를 포함하는 서비스 제공 방법을 제공할 수 있다. Another embodiment of the present invention can provide a service providing method including a step of classifying a plurality of services based on a user's history data, a step of classifying the classified plurality of services into a plurality of categories according to the type of each service, a step of setting an agent corresponding to each of the classified plurality of categories, and a step of providing a service corresponding to a voice command input from the user through the set agent.

본 발명의 또 다른 실시예는, 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하고, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하고, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하고, 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하도록 하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램을 제공할 수 있다. Another embodiment of the present invention provides a computer program stored on a medium including a sequence of commands that, when executed by a computing device, causes the computer program to classify a plurality of services based on history data of a user, classify the classified plurality of services into a plurality of categories according to the type of each service, set agents corresponding to each of the classified plurality of categories, and provide a service corresponding to a voice command input from the user through the set agents.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary and should not be construed as limiting the present invention. In addition to the above-described exemplary embodiments, there may be additional embodiments described in the drawings and detailed description of the invention.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 공용 단말에서 제공하는 복수의 서비스를 유형별로 카테고리화여 분류하고, 분류된 카테고리별로 에이전트를 부여함으로써, 사용자에게 사용 편의성 및 지속성을 향상시키는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다. According to any one of the problem solving means of the present invention described above, a common terminal, method and computer program can be provided that provide a voice command-based service that improves convenience and continuity of use to a user by categorizing and classifying a plurality of services provided by a common terminal by type and assigning an agent for each classified category.

사용자가 각 서비스의 유형별로 에이전트를 설정함으로써, 개인 맞춤형의 음성 명령 기반의 서비스를 통해 사용자에게 기기 친밀도 및 수용도를 높일 수 있도록 하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다. A common terminal, method and computer program for providing a voice command-based service can be provided, which allows users to increase device intimacy and acceptance through personalized voice command-based services by setting agents for each type of service.

사용자의 히스토리 데이터와 상황 데이터의 조합을 통해 사용자의 상황에 맞는 서비스를 에이전트가 능동적으로 추천하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다. A common terminal, method and computer program can be provided for providing a voice command-based service in which an agent actively recommends a service suitable for the user's situation by combining the user's history data and situation data.

사용자가 에이전트명을 호출하고, 호출된 에이전트명에 대응하는 에이전트가 실행되어 사용자의 상황에 맞는 서비스를 자동으로 제공되도록 함으로써, 서비스의 진입까지의 뎁스(depth)를 단축시킬 수 있는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다.A common terminal, method and computer program for providing a voice command-based service that can shorten the depth until entry into the service by allowing a user to call an agent name and have an agent corresponding to the called agent name executed to automatically provide a service suitable for the user's situation can be provided.

도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 공용 단말의 구성도이다.
도 3은 본 발명의 일 실시예에 따른 공용 단말에서 제공하는 복수의 서비스를 복수의 카테고리로 분류하는 과정을 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 공용 단말에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법의 순서도이다.
도 5는 본 발명의 일 실시예에 따른 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법의 순서도이다.
Figure 1 is a configuration diagram of a service providing system according to one embodiment of the present invention.
Figure 2 is a configuration diagram of a public terminal according to one embodiment of the present invention.
FIG. 3 is an exemplary drawing for explaining a process of classifying multiple services provided by a public terminal into multiple categories according to one embodiment of the present invention.
FIG. 4 is a flowchart of a method for setting attribute information for multiple agents in a public terminal according to one embodiment of the present invention.
FIG. 5 is a flowchart of a method for providing a voice command-based service in a public terminal according to one embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. Hereinafter, with reference to the attached drawings, embodiments of the present invention will be described in detail so that those skilled in the art can easily practice the present invention. However, the present invention may be implemented in various different forms and is not limited to the embodiments described herein. In addition, in order to clearly describe the present invention in the drawings, parts that are not related to the description are omitted, and similar parts are assigned similar drawing reference numerals throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. Throughout the specification, when a part is said to be "connected" to another part, this includes not only the case where it is "directly connected" but also the case where it is "electrically connected" with another element in between. Also, when a part is said to "include" a component, this should be understood to mean that it may further include other components, unless specifically stated to the contrary, and does not preclude the presence or possibility of one or more other features, numbers, steps, operations, components, parts, or combinations thereof.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.In this specification, the term 'unit' includes a unit realized by hardware, a unit realized by software, and a unit realized using both. In addition, one unit may be realized using two or more pieces of hardware, and two or more units may be realized by one piece of hardware.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.Some of the operations or functions described as being performed by a terminal or device in this specification may instead be performed by a server connected to the terminal or device. Similarly, some of the operations or functions described as being performed by a server may also be performed by a terminal or device connected to the server.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. Hereinafter, an embodiment of the present invention will be described in detail with reference to the attached drawings.

도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템의 구성도이다. 도 1을 참조하면, 서비스 제공 시스템(1)은 공용 단말(110), 디스플레이 장치(115) 및 대화 서버(120)를 포함할 수 있다. 공용 단말(110), 디스플레이 장치(115) 및 대화 서버(120)는 서비스 제공 시스템(1)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것이다. FIG. 1 is a configuration diagram of a service providing system according to one embodiment of the present invention. Referring to FIG. 1, the service providing system (1) may include a public terminal (110), a display device (115), and a conversation server (120). The public terminal (110), the display device (115), and the conversation server (120) are exemplary components that can be controlled by the service providing system (1).

도 1의 서비스 제공 시스템(1)의 각 구성요소들은 일반적으로 네트워크(network)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 공용 단말(110)은 디스플레이 장치(115) 또는 대화 서버(120)와 동시에 또는 시간 간격을 두고 연결될 수 있다. Each component of the service provision system (1) of Fig. 1 is generally connected via a network. For example, as shown in Fig. 1, a public terminal (110) may be connected to a display device (115) or a conversation server (120) simultaneously or at time intervals.

네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다. A network is a connection structure that enables information exchange between each node, such as terminals and servers, and includes a local area network (LAN), a wide area network (WAN), the Internet (WWW: World Wide Web), wired and wireless data communication networks, telephone networks, and wired and wireless television communication networks. Examples of wireless data communication networks include, but are not limited to, 3G, 4G, 5G, 3GPP (3rd Generation Partnership Project), LTE (Long Term Evolution), WIMAX (World Interoperability for Microwave Access), Wi-Fi, Bluetooth communication, infrared communication, ultrasonic communication, visible light communication (VLC), LiFi, etc.

공용 단말(110)은 음성 AI를 기반으로 하여 복수의 서비스를 사용자(100)에게 제공할 수 있다. 사용자(100)는 예를 들어, 리모트 컨트롤과 같은 외부 제어 장치를 통해 공용 단말(110)을 제어할 수 있지만, 사용자(100)가 발화하는 음성 명령에 의해서도 공용 단말(110)을 제어할 수 있다.The public terminal (110) can provide multiple services to the user (100) based on voice AI. The user (100) can control the public terminal (110) through an external control device, such as a remote control, for example, but can also control the public terminal (110) by voice commands uttered by the user (100).

공용 단말(110)은 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. 히스토리 데이터는 예를 들어, 서비스 제공 이력, 사용자(100)로부터 수신한 음성 명령 및 사용자(100)에게 제공된 음성 대화 이력 등을 포함할 수 있다. 예를 들어, 공용 단말(110)은 사용자(100)의 히스토리 데이터에 기초하여 공용 단말(110)에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고, 부여된 가중치에 기초하여 복수의 서비스를 분류할 수 있다. The public terminal (110) can classify multiple services provided by the public terminal (110) based on the history data of the user (100). The history data can include, for example, service provision history, voice commands received from the user (100), and voice conversation history provided to the user (100). For example, the public terminal (110) can assign weights to multiple services provided by the public terminal (110) based on the history data of the user (100) according to the frequency with which each service is used, and classify the multiple services based on the assigned weights.

공용 단말(110)은 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다. A public terminal (110) can classify multiple classified services into multiple categories according to the type of each service.

공용 단말(110)은 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다. The public terminal (110) can set agents corresponding to each of the classified categories.

공용 단말(110)은 사용자(100)로부터 복수의 에이전트 각각에 대해 속성 정보를 설정받을 수 있다. 예를 들어, 공용 단말(110)은 사용자(100)로부터 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형, 에이전트명 등을 설정받을 수 있다. The public terminal (110) can set attribute information for each of a plurality of agents from the user (100). For example, the public terminal (110) can set characters, images, voice types, agent names, etc. for each of a plurality of agents from the user (100).

공용 단말(110)은 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공할 수 있다. A public terminal (110) can provide a service corresponding to a voice command received from a user (100) through a set agent.

공용 단말(110)은 음성 명령에 에이전트명이 포함된 경우, 에이전트명에 대응하는 에이전트를 통해 서비스를 제공할 수 있다. The public terminal (110) can provide a service through an agent corresponding to the agent name when an agent name is included in a voice command.

공용 단말(110)은 에이전트명에 대응하는 에이전트를 통해 히스토리 데이터 및 상황 데이터에 기초하여 이용 가능한 서비스를 추천할 수 있다. 여기서, 상황 데이터는 예를 들어, 사용자(100)의 위치 정보 및 주변 소음 정도 등을 포함할 수 있다. The public terminal (110) can recommend available services based on history data and situation data through an agent corresponding to the agent name. Here, the situation data can include, for example, location information of the user (100) and the level of ambient noise.

공용 단말(110)은 사용자(100)로부터 발화된 음성 명령을 입력받을 수 있다. The public terminal (110) can receive a voice command spoken from a user (100).

이러한 공용 단말(110)은 음성 명령 기반의 서비스를 제공하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 의해 실행될 수 있다. 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류하고, 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하고, 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하고, 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공하도록 하는 명령어들의 시퀀스를 포함할 수 있다.Such a public terminal (110) can be executed by a computer program stored on a medium including a sequence of commands for providing a voice command-based service. When executed by a computing device, the computer program can include a sequence of commands for classifying a plurality of services based on the history data of the user (100), classifying the classified plurality of services into a plurality of categories according to the type of each service, setting an agent corresponding to each of the classified plurality of categories, and providing a service corresponding to a voice command input from the user (100) through the set agent.

디스플레이 장치(115)는 공용 단말(110)에서 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 디스플레이를 통해 표시할 수 있다.The display device (115) can display a service corresponding to a voice command received from a user (100) through a display at a public terminal (110).

디스플레이 장치(115)는 공용 단말(110)에서 사용자(100)로부터 에이전트명을 포함하는 음성 명령을 수신한 경우, 에이전트명에 대응하는 에이전트를 실행시키고, 해당 에이전트에 설정된 캐릭터 또는 이미지를 디스플레이에 표시할 수 있다. When the display device (115) receives a voice command including an agent name from a user (100) at a public terminal (110), it can execute an agent corresponding to the agent name and display a character or image set for the corresponding agent on the display.

대화 서버(120)는 공용 단말(110)로부터 사용자(100)의 음성 명령을 수신할 수 있다. 대화 서버(120)는 수신한 사용자(100)의 음성 명령을 텍스트로 변환하고, 변환된 음성 명령에 대응하는 텍스트를 공용 단말(110)로 제공할 수 있다. The conversation server (120) can receive a voice command of a user (100) from a public terminal (110). The conversation server (120) can convert the received voice command of the user (100) into text and provide a text corresponding to the converted voice command to the public terminal (110).

대화 서버(120)는 텍스트로 변환된 사용자(100)의 음성 명령에 대해 문맥 분석 및 해석을 통해 답변을 도출할 수 있고, 도출된 답변을 텍스트로 변환하여 공용 단말(110)로 제공할 수 있다.The conversation server (120) can derive an answer through context analysis and interpretation of a user's (100) voice command converted into text, and can convert the derived answer into text and provide it to a public terminal (110).

이와 같이, 대화 서버(120)는 공용 단말(110)로 사용자(100)로부터 입력된 음성 명령에 대한 답변을 생성하고, 생성된 음성 명령에 대한 답변을 공용 단말(110)로 제공함으로써, 사용자(100)에게 대화 서비스 기능을 제공할 수 있다. In this way, the conversation server (120) can provide a conversation service function to the user (100) by generating a response to a voice command input from the user (100) to the public terminal (110) and providing the response to the generated voice command to the public terminal (110).

공용 단말(110)로부터 제공되는 대화 서비스 기능에 의해 사용자(100) 및 대화 서버(120) 간의 대화 이력이 저장되어 본원 발명이 제안하는 기술을 위해 사용될 수 있다.The conversation history between a user (100) and a conversation server (120) is stored by the conversation service function provided from a public terminal (110) and can be used for the technology proposed by the present invention.

도 2는 본 발명의 일 실시예에 따른 공용 단말의 구성도이다. 도 2를 참조하면, 공용 단말(110)은 서비스 분류부(210), 카테고리 분류부(220), 에이전트 설정부(230), 설정부(240), 서비스 제공부(250) 및 입력부(260)를 포함할 수 있다. Figure 2 is a configuration diagram of a public terminal according to one embodiment of the present invention. Referring to Figure 2, the public terminal (110) may include a service classification unit (210), a category classification unit (220), an agent setting unit (230), a setting unit (240), a service provision unit (250), and an input unit (260).

서비스 분류부(210)는 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. 히스토리 데이터는 예를 들어, 서비스 제공 이력, 사용자(100)로부터 수신한 음성 명령 및 사용자(100)에게 제공된 음성 대화 이력 등을 포함할 수 있다. The service classification unit (210) can classify multiple services provided by the public terminal (110) based on the history data of the user (100). The history data can include, for example, service provision history, voice commands received from the user (100), and voice conversation history provided to the user (100).

서비스 분류부(210)는 사용자(100)의 히스토리 데이터에 기초하여 공용 단말(110)에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고, 부여된 가중치에 기초하여 복수의 서비스를 분류할 수 있다. The service classification unit (210) can assign weights to multiple services provided by the public terminal (110) based on the history data of the user (100) according to the frequency with which each service is used, and can classify the multiple services based on the assigned weights.

카테고리 분류부(220)는 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다. 복수의 카테고리는 예를 들어, 정보성, 유희성 및 편의성으로 구성될 수 있다. 이 때, 분류된 서비스는 사용자(100)의 목적에 의해 서비스가 다른 카테고리로 변경되거나, 추가될 수도 있다. The category classification unit (220) can classify the classified multiple services into multiple categories according to the type of each service. The multiple categories can be composed of, for example, information, entertainment, and convenience. At this time, the classified services can be changed to other categories or added depending on the purpose of the user (100).

에이전트 설정부(230)는 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다. 예를 들어, 에이전트 설정부(230)는 정보성 카테고리에 대해 제 1 에이전트를 설정하고, 유희성 카테고리에 대해 제 2 에이전트를 설정하고, 편의성 카테고리에 대해 제 3 에이전트를 설정할 수 있다. The agent setting unit (230) can set agents corresponding to each of the classified categories. For example, the agent setting unit (230) can set a first agent for the information category, a second agent for the entertainment category, and a third agent for the convenience category.

설정부(240)는 사용자(100)로부터 복수의 에이전트 각각에 대해 속성 정보를 설정받을 수 있다. 설정부(240)는 사용자(100)로부터 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형 등을 설정받을 수 있다. The setting unit (240) can receive attribute information for each of a plurality of agents from the user (100). The setting unit (240) can receive character, image, voice type, etc., for each of a plurality of agents from the user (100).

이 때, 공용 단말(110)이 디스플레이를 구비하거나 디스플레이 장치(115)와 연동됨으로써 화면을 구비한 경우, 복수의 에이전트 각각은 캐릭터, 아바타, 이미지 등을 설정받을 수 있으며, 공용 단말(110)이 디스플레이를 구비하지 않거나 디스플레이 장치(115)와 연동되지 않음으로써 화면을 구비하지 않은 경우, 복수의 에이전트 각각은 목소리, 톤, 어조, 억양 등을 설정받아 각 에이전트 별로 음성에 변화를 주도록 할 수 있다. At this time, if the common terminal (110) has a display or is connected to a display device (115) and thus has a screen, each of the plurality of agents can be set with a character, avatar, image, etc., and if the common terminal (110) does not have a display or is not connected to a display device (115) and thus does not have a screen, each of the plurality of agents can be set with a voice, tone, intonation, intonation, etc., so that each agent can have a change in voice.

설정부(240)는 사용자(100)로부터 복수의 에이전트 각각에 대해 에이전트명을 설정받을 수 있다. 예를 들어, 설정부(240)는 사용자(100)로부터 제 1 에이전트에 대해 '토끼'라는 에이전트명을 설정받고, 제 2 에이전트에 대해 '거북이'라는 에이전트명을 설정받고, 제 3 에이전트에 대해 '코끼리'라는 에이전트명을 설정받을 수 있다. The setting unit (240) can receive an agent name set for each of a plurality of agents from the user (100). For example, the setting unit (240) can receive an agent name set as 'rabbit' for the first agent, an agent name set as 'turtle' for the second agent, and an agent name set as 'elephant' for the third agent from the user (100).

서비스 제공부(250)는 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공할 수 있다. The service provider (250) can provide a service that responds to a voice command received from a user (100) through a set agent.

서비스 제공부(250)는 음성 명령에 에이전트명이 포함된 경우, 에이전트명에 대응하는 에이전트를 통해 서비스를 제공할 수 있다. 예를 들어, 서비스 제공부(250)는 음성 명령에 '코끼리'라는 에이전트명이 포함된 경우, '코끼리'라는 에이전트명에 대응하는 제 3 에이전트를 실행시켜 서비스를 제공하도록 할 수 있다. If an agent name is included in a voice command, the service provider (250) can provide a service through an agent corresponding to the agent name. For example, if an agent name of 'elephant' is included in a voice command, the service provider (250) can execute a third agent corresponding to the agent name of 'elephant' to provide a service.

서비스 제공부(250)는 에이전트명에 대응하는 에이전트를 통해 히스토리 데이터 및 상황 데이터에 기초하여 사용자(100)에게 장소 및 시간 별로 상황에 따라 이용 가능한 서비스를 추천할 수 있다. 여기서, 상황 데이터는 예를 들어, 사용자(100)의 위치 정보 및 주변 소음 정도 등을 포함할 수 있다. 예를 들어, 입력부(260)에서 사용자(100)로부터 "거북이"라는 에이전트명을 포함하는 음성 명령을 입력받고, 사용자(100)가 주말 2시에 집에 있는 상황인 경우, 서비스 제공부(250)는 "거북이"라는 에이전트명에 대응하는 제 2 에이전트에서 사용자(100)가 주말 2시에 집에서 주로 이용한 서비스인 '게임 서비스'를 추천할 수 있다. The service provider (250) can recommend available services to the user (100) according to the situation by location and time based on the history data and situation data through the agent corresponding to the agent name. Here, the situation data can include, for example, the location information of the user (100) and the level of surrounding noise. For example, if the input unit (260) receives a voice command including the agent name "turtle" from the user (100) and the user (100) is at home at 2 o'clock on the weekend, the service provider (250) can recommend the 'game service', which is the service that the user (100) mainly used at home at 2 o'clock on the weekend, through the second agent corresponding to the agent name "turtle."

입력부(260)는 사용자(100)로부터 발화된 음성 명령을 입력받을 수 있다. 이 때, 입력부(260)는 사용자(100)로부터 에이전트명을 포함하는 음성 명령을 입력받을 수 있다. 예를 들어, 입력부(260)는 사용자(100)로부터 제 1 에이전트를 호출하기 위한 "토끼야"라는 음성 명령을 입력받을 수 있다. The input unit (260) can receive a voice command spoken by the user (100). At this time, the input unit (260) can receive a voice command including an agent name from the user (100). For example, the input unit (260) can receive a voice command “rabbit” to call the first agent from the user (100).

도 3은 본 발명의 일 실시예에 따른 공용 단말에서 제공하는 복수의 서비스를 복수의 카테고리로 분류하는 과정을 설명하기 위한 예시적인 도면이다. 도 3을 참조하면, 공용 단말(110)은 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. 예를 들어, 공용 단말(110)은 사용자(100)의 히스토리 데이터에 기초하여 공용 단말(110)에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고, 부여된 가중치에 기초하여 복수의 서비스를 분류할 수 있다. FIG. 3 is an exemplary diagram for explaining a process of classifying multiple services provided by a public terminal into multiple categories according to one embodiment of the present invention. Referring to FIG. 3, the public terminal (110) can classify multiple services provided by the public terminal (110) based on the history data of the user (100). For example, the public terminal (110) can assign weights to multiple services provided by the public terminal (110) based on the frequency with which each service is used, and can classify the multiple services based on the assigned weights.

이후, 공용 단말(110)은 분류된 복수의 서비스(310)를 각 서비스의 유형에 따라 복수의 카테고리(300)로 분류할 수 있다. 복수의 카테고리(300)는 예를 들어, 제 1 유형(301), 제 2 유형(302), 제 3 유형(303)으로 구성될 수 있다. Thereafter, the public terminal (110) can classify the classified multiple services (310) into multiple categories (300) according to the type of each service. The multiple categories (300) can be composed of, for example, a first type (301), a second type (302), and a third type (303).

제 1 유형(301)은 정보성 서비스로, 예를 들어, 날씨, 교통 및 생활 정보, 뉴스, 사전, 교육, 어학 등의 서비스를 포함할 수 있다. The first type (301) is an information service, which may include, for example, services such as weather, traffic and lifestyle information, news, dictionaries, education, and language services.

제 2 유형(302)은 유희성 서비스로, 음악, 라디오, 영상 재생, 게임, 감성 대화 등의 서비스를 포함할 수 있다. The second type (302) is a recreational service, which may include services such as music, radio, video playback, games, and emotional conversation.

제 3 유형(303)은 편의성 서비스로, 타이머, 알람, 일정관리, IoT 기기 제어, 쇼핑 및 주문, 금융 등의 서비스를 포함할 수 있다. The third type (303) is a convenience service, which may include services such as timers, alarms, schedule management, IoT device control, shopping and ordering, and finance.

도 4는 본 발명의 일 실시예에 따른 공용 단말에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법의 순서도이다. 도 4에 도시된 공용 단말(110)에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법은 도 1 내지 도 3에 도시된 실시예에 따른 서비스 제공 시스템(1)에 의해 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 3에 도시된 실시예에 따른 공용 단말(110)에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법에도 적용된다. FIG. 4 is a flowchart of a method for setting attribute information for a plurality of agents in a public terminal according to one embodiment of the present invention. The method for setting attribute information for a plurality of agents in a public terminal (110) illustrated in FIG. 4 includes steps that are processed in time series by the service providing system (1) according to the embodiment illustrated in FIGS. 1 to 3. Therefore, even if the content is omitted below, it is also applied to the method for setting attribute information for a plurality of agents in a public terminal (110) according to the embodiment illustrated in FIGS. 1 to 3.

공용 단말(110)은 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류한 후, 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다(S410). The public terminal (110) can classify multiple services provided by the public terminal (110) based on the history data of the user (100), and then classify the classified multiple services into multiple categories according to the type of each service (S410).

공용 단말(110)은 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다(S420). The public terminal (110) can set agents corresponding to each of the classified categories (S420).

공용 단말(110)은 공용 단말(110)의 UI 화면이 존재하는지 여부를 판단할 수 있다(S430). 예를 들어, 공용 단말(110)의 UI 화면이 존재하는 경우(S431), 공용 단말(110)은 에이전트별로 캐릭터 또는 이미지를 설정하고(S440), 에이전트별로 목소리 유형을 설정하고(S450), 에이전트별로 에이전트명을 설정할 수 있다(S460). 다른 예를 들어, 공용 단말(110)의 UI 화면이 존재하지 않는 경우(S432), 공용 단말(110)은 에이전트별로 목소리 유형을 설정하고(S450), 에이전트별로 에이전트명을 설정할 수 있다(S460).The public terminal (110) can determine whether the UI screen of the public terminal (110) exists (S430). For example, if the UI screen of the public terminal (110) exists (S431), the public terminal (110) can set a character or image for each agent (S440), set a voice type for each agent (S450), and set an agent name for each agent (S460). For another example, if the UI screen of the public terminal (110) does not exist (S432), the public terminal (110) can set a voice type for each agent (S450), and set an agent name for each agent (S460).

상술한 설명에서, 단계 S410 내지 S460은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.In the above description, steps S410 to S460 may be further divided into additional steps or combined into fewer steps, depending on the implementation of the present invention. In addition, some steps may be omitted as needed, or the order between the steps may be switched.

도 5는 본 발명의 일 실시예에 따른 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법의 순서도이다. 도 5에 도시된 공용 단말(110)에서 음성 명령 기반의 서비스를 제공하는 방법은 도 1 내지 도 4에 도시된 실시예에 따른 서비스 제공 시스템(1)에 의해 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 4에 도시된 실시예에 따른 공용 단말(110)에서 음성 명령 기반의 서비스를 제공하는 방법에도 적용된다. FIG. 5 is a flowchart of a method for providing a voice command-based service in a public terminal according to one embodiment of the present invention. The method for providing a voice command-based service in a public terminal (110) illustrated in FIG. 5 includes steps that are processed in time series by the service providing system (1) according to the embodiments illustrated in FIGS. 1 to 4. Therefore, even if the content is omitted below, it is also applied to the method for providing a voice command-based service in a public terminal (110) according to the embodiments illustrated in FIGS. 1 to 4.

단계 S510에서 공용 단말(110)은 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. In step S510, the public terminal (110) can classify multiple services based on the history data of the user (100).

단계 S520에서 공용 단말(110)은 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다. In step S520, the public terminal (110) can classify multiple classified services into multiple categories according to the type of each service.

단계 S530에서 공용 단말(110)은 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다. In step S530, the public terminal (110) can set agents corresponding to each of the classified categories.

단계 S540에서 공용 단말(110)은 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공할 수 있다. In step S540, the public terminal (110) can provide a service corresponding to a voice command received from a user (100) through a set agent.

상술한 설명에서, 단계 S510 내지 S540은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.In the above description, steps S510 to S540 may be further divided into additional steps or combined into fewer steps, depending on the implementation of the present invention. In addition, some steps may be omitted as needed, or the order between the steps may be switched.

도 1 내지 도 5를 통해 설명된 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 5를 통해 설명된 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다. The method for providing a voice command-based service in a public terminal described through FIGS. 1 to 5 can also be implemented in the form of a computer program stored in a medium executed by a computer or a recording medium including commands executable by a computer. In addition, the method for providing a voice command-based service in a public terminal described through FIGS. 1 to 5 can also be implemented in the form of a computer program stored in a medium executed by a computer.

컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. Computer-readable media can be any available media that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. Additionally, computer-readable media can include computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer-readable instructions, data structures, program modules or other data.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. The above description of the present invention is for illustrative purposes, and those skilled in the art will understand that the present invention can be easily modified into other specific forms without changing the technical idea or essential characteristics of the present invention. Therefore, it should be understood that the embodiments described above are exemplary in all respects and not restrictive. For example, each component described as a single component may be implemented in a distributed manner, and likewise, components described as distributed may be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다. The scope of the present invention is indicated by the claims described below rather than the detailed description above, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention.

100: 사용자
110: 미디어 재생 장치
115: 디스플레이 장치
120: 대화 서버
210: 서비스 분류부
220: 카테고리 분류부
230: 에이전트 설정부
240: 설정부
250: 서비스 제공부
260: 입력부
100: User
110: Media playback device
115: Display device
120: Chat Server
210: Service Classification Department
220: Category Classification Department
230: Agent Settings
240: Settings section
250: Service Provider
260: Input section

Claims (17)

음성 명령 기반의 서비스를 제공하는 공용 단말에 있어서,
공용 단말에서 제공하는 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 서비스 분류부;
상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 카테고리 분류부;
상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 에이전트 설정부; 및
상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 서비스 제공부
를 포함하고,
상기 서비스 제공부는 카테고리별로 설정된 복수의 에이전트 중 어느 하나의 에이전트를 통해 상기 음성 명령에 대응하는 서비스를 제공하는 것인, 공용 단말.
In a public terminal that provides voice command-based services,
A service classification unit that classifies multiple services provided by a public terminal based on the user's history data;
A category classification unit that classifies the above-mentioned multiple services into multiple categories according to the type of each service;
An agent setting section for setting agents corresponding to each of the above-mentioned multiple categories; and
A service provider that provides a service that responds to voice commands received from the user through the above-described agent.
Including,
A common terminal, wherein the above service provider provides a service responding to the voice command through one of multiple agents set by category.
제 1 항에 있어서,
상기 히스토리 데이터는 서비스 제공 이력, 상기 사용자로부터 수신한 음성 명령 및 상기 사용자에게 제공된 음성 대화 이력 중 어느 하나 이상을 포함하는 것인, 공용 단말.
In paragraph 1,
A common terminal, wherein the above history data includes at least one of service provision history, voice commands received from the user, and voice conversation history provided to the user.
제 2 항에 있어서,
상기 서비스 분류부는 상기 사용자의 히스토리 데이터에 기초하여 상기 공용 단말에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고,
상기 부여된 가중치에 기초하여 상기 복수의 서비스를 분류하는 것인, 공용 단말.
In the second paragraph,
The above service classification unit assigns weights to multiple services provided by the public terminal based on the user's history data according to the frequency with which each service is used.
A common terminal that classifies the plurality of services based on the weights assigned above.
제 1 항에 있어서,
상기 사용자로부터 상기 복수의 에이전트 각각에 대해 속성 정보를 설정받는 설정부를 더 포함하는, 공용 단말.
In paragraph 1,
A common terminal further comprising a setting unit that sets attribute information for each of the plurality of agents from the user.
제 4 항에 있어서,
상기 설정부는 상기 사용자로부터 상기 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형, 에이전트명 중 어느 하나 이상을 설정받는 것인, 공용 단말.
In paragraph 4,
A common terminal, wherein the above setting section receives from the user at least one of character, image, voice type, and agent name for each of the plurality of agents.
제 5 항에 있어서,
상기 사용자로부터 발화된 음성 명령을 입력받는 입력부를 더 포함하되,
상기 서비스 제공부는 상기 음성 명령에 상기 에이전트명이 포함된 경우, 상기 에이전트명에 대응하는 에이전트를 통해 서비스를 제공하는 것인, 공용 단말.
In paragraph 5,
Further comprising an input unit for receiving a voice command spoken by the user,
The above service providing unit is a common terminal that provides a service through an agent corresponding to the agent name when the agent name is included in the above voice command.
제 6 항에 있어서,
상기 서비스 제공부는 상기 에이전트명에 대응하는 에이전트를 통해 상기 히스토리 데이터 및 상황 데이터에 기초하여 이용 가능한 서비스를 추천하는 것인, 공용 단말.
In paragraph 6,
A common terminal in which the above service providing unit recommends available services based on the above history data and situation data through an agent corresponding to the above agent name.
제 7 항에 있어서,
상기 상황 데이터는 상기 사용자의 위치 정보 및 주변 소음 정도 중 어느 하나를 포함하는 것인, 공용 단말.
In paragraph 7,
A public terminal, wherein the above situation data includes one of the user's location information and the level of ambient noise.
공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법에 있어서,
복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 단계;
상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 단계;
상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 단계; 및
상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 단계
를 포함하고,
상기 서비스를 제공하는 단계는,
카테고리별로 설정된 복수의 에이전트 중 어느 하나의 에이전트를 통해 상기 음성 명령에 대응하는 서비스를 제공하는 단계를 포함하는 것인, 서비스 제공 방법.
A method for providing a voice command-based service on a public terminal,
A step of classifying multiple services based on the user's history data;
A step of classifying the above-mentioned classified multiple services into multiple categories according to the type of each service;
A step of setting agents corresponding to each of the above-mentioned multiple categories; and
A step for providing a service that responds to a voice command received from the user through the above-described agent.
Including,
The steps for providing the above service are:
A service providing method, comprising the step of providing a service corresponding to the voice command through one of a plurality of agents set by category.
제 9 항에 있어서,
상기 히스토리 데이터는 서비스 제공 이력, 상기 사용자로부터 수신한 음성 명령 및 상기 사용자에게 제공된 음성 대화 이력 중 어느 하나 이상을 포함하는 것인, 서비스 제공 방법.
In Article 9,
A service providing method, wherein the above history data includes at least one of a service provision history, a voice command received from the user, and a voice conversation history provided to the user.
제 10 항에 있어서,
상기 복수의 서비스를 분류하는 단계는, 상기 사용자의 히스토리 데이터에 기초하여 상기 공용 단말에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고,
상기 부여된 가중치에 기초하여 상기 복수의 서비스를 분류하는 것인, 서비스 제공 방법.
In Article 10,
The step of classifying the above multiple services is to assign weights to the multiple services provided by the public terminal based on the user's history data according to the frequency with which each service is used.
A service providing method that classifies the plurality of services based on the weights assigned above.
제 9 항에 있어서,
상기 사용자로부터 상기 복수의 에이전트 각각에 대해 속성 정보를 설정받는 단계를 더 포함하는, 서비스 제공 방법.
In Article 9,
A service providing method further comprising a step of receiving attribute information for each of the plurality of agents from the user.
제 12 항에 있어서,
상기 속성 정보를 설정받는 단계는 상기 사용자로부터 상기 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형, 에이전트명 중 어느 하나 이상을 설정받는 것인, 서비스 제공 방법.
In Article 12,
A service providing method, wherein the step of setting the above attribute information comprises setting at least one of a character, an image, a voice type, and an agent name for each of the plurality of agents from the user.
제 13 항에 있어서,
상기 사용자로부터 발화된 음성 명령을 입력받는 단계를 더 포함하되,
상기 서비스를 제공하는 단계는 상기 음성 명령에 상기 에이전트명이 포함된 경우, 상기 에이전트명에 대응하는 에이전트를 통해 서비스를 제공하는 것인, 서비스 제공 방법.
In Article 13,
Further comprising a step of receiving a voice command spoken by the user,
A service providing method, wherein the step of providing the above service comprises providing the service through an agent corresponding to the agent name when the agent name is included in the above voice command.
제 14 항에 있어서,
상기 서비스를 제공하는 단계는 상기 에이전트명에 대응하는 에이전트를 통해 상기 사용자의 히스토리 데이터 및 상황 데이터에 기초하여 이용 가능한 서비스를 추천하는 것인, 서비스 제공 방법.
In Article 14,
A service providing method, wherein the step of providing the above service is to recommend available services based on the user's history data and situation data through an agent corresponding to the agent name.
제 15 항에 있어서,
상기 상황 데이터는 상기 사용자의 위치 정보 및 주변 소음 정도 중 어느 하나를 포함하는 것인, 서비스 제공 방법.
In Article 15,
A service providing method, wherein the above situation data includes one of the user's location information and the level of ambient noise.
음성 명령 기반의 서비스를 제공하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하고,
상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하고,
상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하고,
상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하고,
카테고리별로 설정된 복수의 에이전트 중 어느 하나의 에이전트를 통해 상기 음성 명령에 대응하는 서비스를 제공하도록 하는 명령어들의 시퀀스를 포함하는, 매체에 저장된 컴퓨터 프로그램.
A computer program stored on a medium containing a sequence of commands for providing a voice command-based service,
When the above computer program is executed by a computing device,
Classify multiple services based on the user's history data,
The above-mentioned multiple services are classified into multiple categories according to the type of each service,
Set up agents corresponding to each of the above-mentioned multiple categories,
Provides a service that responds to voice commands received from the user through the above-described agent,
A computer program stored on a medium, comprising a sequence of commands that cause a service to be provided in response to said voice command through any one of a plurality of agents set by category.
KR1020180083553A 2018-07-18 2018-07-18 Common device, method and computer program for providing service based on voice command Active KR102803468B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180083553A KR102803468B1 (en) 2018-07-18 2018-07-18 Common device, method and computer program for providing service based on voice command

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180083553A KR102803468B1 (en) 2018-07-18 2018-07-18 Common device, method and computer program for providing service based on voice command

Publications (2)

Publication Number Publication Date
KR20200009332A KR20200009332A (en) 2020-01-30
KR102803468B1 true KR102803468B1 (en) 2025-05-08

Family

ID=69321515

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180083553A Active KR102803468B1 (en) 2018-07-18 2018-07-18 Common device, method and computer program for providing service based on voice command

Country Status (1)

Country Link
KR (1) KR102803468B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220099344A (en) * 2021-01-06 2022-07-13 (주)헤이스타즈 Method and apparatus for providing language learning contents using an avatar generated from portrait photos
EP4064279B1 (en) * 2021-01-28 2025-09-17 Samsung Electronics Co., Ltd. Device and method for providing recommended sentences related to user's speech input

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140366058A1 (en) * 2008-10-27 2014-12-11 At&T Intellectual Property I, Lp Method and apparatus for creating dynamic webpages in a media communication system
WO2018009397A1 (en) * 2016-07-06 2018-01-11 Pcms Holdings, Inc. System and method for customizing smart home speech interfaces using personalized speech profiles

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160114442A (en) * 2015-03-24 2016-10-05 주식회사 케이티 Method, computer program, and user device for managing applications
KR102021773B1 (en) * 2015-10-12 2019-09-17 주식회사 케이티 Contents recommendation method, server and computing device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140366058A1 (en) * 2008-10-27 2014-12-11 At&T Intellectual Property I, Lp Method and apparatus for creating dynamic webpages in a media communication system
WO2018009397A1 (en) * 2016-07-06 2018-01-11 Pcms Holdings, Inc. System and method for customizing smart home speech interfaces using personalized speech profiles

Also Published As

Publication number Publication date
KR20200009332A (en) 2020-01-30

Similar Documents

Publication Publication Date Title
US20240096345A1 (en) Electronic device providing response to voice input, and method and computer readable medium thereof
US12008318B2 (en) Automatic personalized story generation for visual media
US11874904B2 (en) Electronic device including mode for using an artificial intelligence assistant function of another electronic device
KR101777392B1 (en) Central server and method for processing of voice of user
KR20170115501A (en) Techniques to update the language understanding categorizer model for digital personal assistants based on crowdsourcing
US20190197315A1 (en) Automatic story generation for live media
US12033629B2 (en) Systems and methods for automating voice commands
Jimenez et al. Alexa-based voice assistant for smart home applications
CN111090733B (en) Human-computer interaction method, device, equipment and readable storage medium
CN113724036B (en) Method for providing problem consultation service and electronic equipment
CN106713467A (en) Terminal control method and device based on cloud server
US11265621B2 (en) Video push method, device and computer-readable storage medium
CN112351350B (en) Content display method, device, system, equipment and storage medium
WO2018031743A1 (en) Methods, systems, and media for presenting a user interface customized for a predicted user activity
CN110992937A (en) Language offline recognition method, terminal and readable storage medium
WO2023185166A1 (en) Service call method and apparatus, device and storage medium
KR102803468B1 (en) Common device, method and computer program for providing service based on voice command
CN115982331A (en) Information interaction method, device and equipment in conversation scene
CN117424956A (en) Setting item processing method and device, electronic equipment and storage medium
US20230379763A1 (en) Dynamic continuous quality of service adjustment system
CN118210407B (en) Virtual interactive object configuration method, device, equipment and medium
US12443390B2 (en) Electronic device and control method therefor
CN112861007A (en) Screen saver display method, device, equipment, medium and program product
CN112486602A (en) Interface switching method and device, terminal equipment and storage medium
US20180176100A1 (en) Method for using an extended workstation, and an associated system for using an extended workstation

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20180718

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20210719

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20180718

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20240430

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20250331

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20250429

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20250430

End annual number: 3

Start annual number: 1

PG1601 Publication of registration