[go: up one dir, main page]

KR100488112B1 - Apparatus For Converting Document and Searching in Voice Portal System - Google Patents

Apparatus For Converting Document and Searching in Voice Portal System Download PDF

Info

Publication number
KR100488112B1
KR100488112B1 KR10-2001-0087376A KR20010087376A KR100488112B1 KR 100488112 B1 KR100488112 B1 KR 100488112B1 KR 20010087376 A KR20010087376 A KR 20010087376A KR 100488112 B1 KR100488112 B1 KR 100488112B1
Authority
KR
South Korea
Prior art keywords
document
voice
search
vxml
scenario
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR10-2001-0087376A
Other languages
Korean (ko)
Other versions
KR20030057005A (en
Inventor
조은일
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR10-2001-0087376A priority Critical patent/KR100488112B1/en
Publication of KR20030057005A publication Critical patent/KR20030057005A/en
Application granted granted Critical
Publication of KR100488112B1 publication Critical patent/KR100488112B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 음성 포탈 시스템에서 검색한 결과를 제시하는 장치에 관한 것이다.The present invention relates to an apparatus for presenting a search result in a voice portal system.

그러므로, 본 발명은 VXML 기반 음성 포탈 시스템에 색인어 인덱싱을 위한 인덱서와, 키워드 또는 질의어와 색인어를 매치시켜 키워드의 목적지 또는 시나리오의 URI(Uniform Resource Indentifier)를 찾아내는 정보 검색 엔진과, 검색된 결과를 토대로 메뉴로의 이동이라든지 자동 호 연결등의 부가 서비스를 제공할 수 있는 시나리오를 자동으로 작성하고 실행하는 시나리오 생성기를 추가하여 VXML 문서를 쉽고 빠르게 선택하고 체계적으로 시나리오를 저장 및 관리하는 일종의 문서 처리 기능을 제공한다.Therefore, the present invention provides an indexer for indexing index in a VXML-based speech portal system, an information search engine that matches a keyword or query word with an index word, and finds a URI (Uniform Resource Indentifier) of a keyword's destination or scenario, and a menu based on the search results. Adds a scenario generator that automatically creates and executes scenarios that can provide additional services such as moving to or automatic call connection, and provides a kind of document processing function to quickly and easily select VXML documents and systematically store and manage scenarios. do.

따라서, 본 발명은 사용자가 전화를 걸어 정보의 키워드를 말하면, 인터넷상의 해당 정보를 음성으로 들을 수 있으며, 자동 호 연결까지 가능한 음성 포탈 서비스를 제공할 수 있다. Therefore, when the user makes a phone call and speaks a keyword of information, the user can listen to the corresponding information on the Internet by voice, and can provide a voice portal service capable of automatic call connection.

Description

음성 포탈 시스템에서의 검색 및 문서 변환 장치{Apparatus For Converting Document and Searching in Voice Portal System} Apparatus For Converting Document and Searching in Voice Portal System

본 발명은 음성 포탈 시스템에서 검색 및 결과 제시 장치에 관한 것으로, 특히 사용자가 음성 포탈 시스템을 좀더 빠르고 편리하게 사용할 수 있도록 서비스 검색하여 그 결과를 제시하는 장치에 관한 것이다. BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a search and result presentation apparatus in a voice portal system, and more particularly, to an apparatus for searching for a service and presenting the results so that a user can use the voice portal system more quickly and conveniently.

종래의 텍스트를 기반으로 한 인터넷 환경을 음성 인터넷 환경으로 확장함에 있어서 브이엑스엠엘(Voice eXensible Markup Language:이하 VXML이라고 함)이라는 대화명 마크업 언어를 사용하여 구축된 시스템이 고급화된 수준의 음성 서비스를 실현하기 위한 가장 유력한 방안으로 기대를 모으고 있다. In extending the conventional text-based internet environment to the voice internet environment, a system built using the nickname markup language called Voice eXensible Markup Language (hereinafter referred to as VXML) provides an advanced level of voice service. Expectations are the most powerful way to realize this.

VXML는 음성 애플리케이션 개발을 위해 고안된 XML 문서 형식의 일종이다. 여기서, 음성 애플리케이션이라는 것은 디지털화된 오디오, 음성 인식, DTMF키 입력, 음성 입력, 전화등과 같은 음성 기반의 사용자 인터페이스를 CTI(Computer Telephony Integration), WEB, DB등에서 사용할 수 있게 하는 것을 말한다. 이러한 VXML 기술은 AT&T, 루슨트 테크놀로지스, 모토롤러 등 3사가 개발한 기술로, 전화와 음성 인식 소프트웨어를 통해 인터넷의 다양한 정보를 검색할 수 있는 음성 기반 기술을 말한다. 그리고, VXML은 PC, 노트북 등의 인터넷 접속 장치 없이 전화를 통해 인터넷의 전자 우편, 날씨 정보, 교통 정보 등의 내용을 검색할 수 있고, 웹페이지에 다양한 음성 정보를 실을 수 있게 하는 기술이다. 음성 합성, 인식, 인증 등의 기술이 실용화되어 있는 현시점에서, VXML 기술을 적용한 음성 정보 서비스가 확산되고 있는 추세이다.VXML is a type of XML document designed for voice application development. Here, the voice application means that a voice-based user interface such as digitized audio, voice recognition, DTMF key input, voice input, telephone, or the like can be used in computer telephony integration (CTI), WEB, and DB. The VXML technology was developed by three companies, AT & T, Lucent Technologies, and Motorola, and is a voice-based technology that can search various information on the Internet through telephone and voice recognition software. In addition, VXML is a technology for retrieving contents such as e-mail, weather information, traffic information, etc. of the Internet through a telephone without an Internet access device such as a PC or a notebook, and loading various voice information on a web page. At the present time when technologies such as speech synthesis, recognition, and authentication are put into practical use, voice information services using VXML technology are spreading.

이러한 VXML를 이용하게 되면서 기존의 음성 서비스 제공자들은 다양하고 쉽게 새로운 서비스를 제공할 수 있게 되며, 음성 서비스 저작에 대한 업무 분할이 분명하게 일어난다. With the use of such VXML, existing voice service providers can easily provide a variety of new services, and the division of work on voice service authoring clearly occurs.

기존에는 음성 서비스를 제공하기 위해서 서비스 저작자가 음성 입력과 출력에 대한 기술적인 문제를 실제 시나리오와 함께 고려하여 저작을 하여야 했다. 그러나, VXML를 이용하게 되면서 서비스 저작자는 자신이 제공하려는 서비스를 문서 형식에 맞추어 저작만 하면 되고 나머지 음성 관련 기술들은 VXML 브라우저가 자동으로 처리하게 된다. In the past, in order to provide a voice service, a service author had to work on a technical scenario regarding voice input and output along with a real scenario. However, with the use of VXML, service authors only need to author their services according to the document format, and the remaining voice related technologies are automatically handled by the VXML browser.

VXML은 XML을 근간으로 하고 있지만 기존 웹 문서와 VXML 문서의 성격은 태그를 이용하는 형태가 유사할 뿐이지 판이하게 다르다. VXML is based on XML, but the characteristics of existing web documents and VXML documents are similar, using tags only.

따라서, 음성 미디어의 특징을 잘 살려주는 새로운 컨텐츠의 구축 내지 기존 컨텐츠의 새로운 형태로의 변환은 불가피하며, 이를 위한 종래의 VXML 기반 음성 포탈 시스템은 도 2에 도시된 것과 같이 VXML 인터프리터(VoiceXML Interpreter; 230)와 VXML 인터프리터 컨텍스트(VoiceXML Interpreter Context; 210)와 임플리멘테이션 플랫폼(Implementation Platform), 다큐멘트 서버(Document Server;220)로 구성되어 있다.Therefore, construction of new content or conversion of existing content into a new form that makes good use of the characteristics of voice media is inevitable, and a conventional VXML-based voice portal system for this purpose is shown in FIG. 2 as a VXML interpreter (VoiceXML Interpreter; 230, a VXML Interpreter Context 210, an Implementation Platform, and a Document Server 220.

도 2를 참조하면, VXML 인터프리터(VoiceXML Interpreter;230)는 실행 환경의 가장 핵심적인 요소로서, VXML 문서를 적재하고, 그 내용을 해석해 실행하는 역할을 맡는다. 즉, 47종의 각종 태그에 설정된 기능에 따라 문서 실행의 순차적 흐름을 제어하고 음성 입출력 내용을 결정해 음성 플랫폼에 필요한 명령을 내린다.Referring to FIG. 2, the VXML interpreter 230 is the most essential element of an execution environment, and is responsible for loading a VXML document, interpreting the contents, and executing the content. That is, according to the functions set in 47 kinds of tags, the sequential flow of document execution is controlled, the voice input / output contents are determined, and the commands required for the voice platform are issued.

VXML 인터프리터 콘텍스트(VoiceXML Interpreter Context;210)는 시스템 제반 환경에 따라 VXML 인터프리터(VoiceXML Interpreter;230)를 통제, 관리하는 역할을 맡는다. 특히, ASR 서비스나 음성 포털 지원을 위한 멀티 채널 인터프리터의 경우 사용자 접속 및 해제를 감지해 인터프리터 쓰레드의 할당, 가동, 중지등을 제어하며, 시작 문서의 지정, 환경 변수와 시스템 옵션의 설정등을 관리한다. 즉, 인터프리터의 환경 독립성을 극대화하기 위해 설정된 외곽 요소이다.The VXML Interpreter Context 210 is responsible for controlling and managing the VXML Interpreter 230 according to the system-wide environment. In particular, in case of multi-channel interpreter for ASR service or voice portal support, it detects user access and release and controls the allocation, start, and stop of interpreter thread, and manages start document specification, environment variable and system option setting. do. In other words, it is an outer element set to maximize the interpreter's environmental independence.

도규멘트 서버(Document Server;220)는 URI(Uniform Resource Identifier) 형태로 전송되는 VXML 인터프리터(VoiceXML Interpreter;230)가 요청하는 문서나 자원을 인터프리터에게 전송하는 역할을 수행한다. 서브미트(submit) 구조에 의한 문서 전이 요청의 경우 새로운 VoiceXML 문서가 오디오나 문법 구조의 경우 음성 파일이나 문법 파일이 전송된다.The document server 220 transmits a document or resource requested by the VXML interpreter 230 transmitted in the form of a Uniform Resource Identifier (URI) to the interpreter. In case of document transfer request by submit structure, voice file or grammar file is transmitted in case of audio or grammar structure.

임플리멘테이션 플랫폼(Implementation Platform)은 VXML 인터프리터(VoiceXML Interpreter;230)나 VXMLL 인터프리터 콘텍스트(VoiceXML Interpreter Context;210)에 의해 제어되면서 음성 입출력과 호 관리를 지원한다. 음성 출력 기능으로는 오디오 파일의 재생 및 TTS 음성 합성어, 음성 입력 기능으로는 DTMF 버튼 입력, ARS 기능에 의한 음성 인식, 오디오 입력의 녹음이 지원된다.The implementation platform supports voice input / output and call management while being controlled by the VXML interpreter 230 or the VXMLL interpreter context 210. The audio output function supports audio file playback, TTS speech synthesizer, DTMF button input, voice recognition by ARS function, and audio input recording.

도 1 및 도 2를 참조하여 종래 기술 장치의 동작을 설명하면 다음과 같다.Referring to Figures 1 and 2 the operation of the prior art device will be described.

먼저, 전화망(10)상에 있는 전화 사용자(1, 2)가 음성 포탈 서비스를 받기 위해 특정한 번호로 전화를 건다.First, telephone users 1 and 2 on telephone network 10 dial a specific number to receive voice portal service.

그러면, VXML 서버(20)의 세션 매니져(session Manager;212)는 전화 호를 받아 새로운 세션을 구성하고, 이후 발생되는 이벤트를 핸들링하기 위해 이벤트 핸들러(Event Handler;215)를 기동한다.Then, the session manager 212 of the VXML server 20 receives a phone call, establishes a new session, and starts an event handler 215 to handle subsequent events.

VXML 서버(20)의 도규멘트 매니져먼트(Document Management)는 사용자가 원하는 시나리오(VXML 문서)를 도규멘트 서버(DOC Server;220)에서 가져와 인터프리터(Interpreter;230)로 전달한다.The document management of the VXML server 20 obtains a scenario (VXML document) desired by the user from the document server (DOC Server) 220 and delivers it to the interpreter 230.

VXML 서버(20)의 인터프리터(Interpreter;230)는 VXML 문서를 분석(Parsing)하여 시나리오를 수행할 준비를 끝낸다.The interpreter 230 of the VXML server 20 parses the VXML document and finishes preparing to execute the scenario.

시나리오상에서 문장에 대한 음성 합성이 요구되면, 인터프리터(Interpreter;230)는 이를 이벤트 핸들러(Event Handler;215)에게 요청한다.When the speech synthesis for the sentence is required in the scenario, the interpreter 230 requests the event handler 215.

이벤트 핸들러(Event Handler;215)는 이를 TTS 인터페이스(TTS Interface;216)를 통해 음성 합성을 수행한 후 그 결과를 전화 인터페이스(Telephony Interface;211)에 넘겨 사용자가 전화기(1, 2)를 통해 들을 수 있도록 한다.The event handler 215 performs the speech synthesis through the TTS interface 216 and passes the result to the telephone interface 211 so that the user can listen through the telephones 1 and 2. To help.

음성 인식에 대한 요구가 발생하면, 인터프리터(Interpreter;230)는 이를 이벤트 핸들러(215)에게 요청한다.When a request for speech recognition occurs, the interpreter 230 requests the event handler 215.

이벤트 핸들러(Event Handler;215)는 이를 ASR 인터페이스(ASR Interface;216)를 통해 인식할 준비를 하고, 전화 인터페이스(Telephony Interface;211)를 통해 들어오는 음성에 대한 인식 결과를 ASR(260)로부터 넘겨받아 이를 인터프리터(Interpreter;230)에게 리턴한다.The event handler 215 prepares to recognize this through the ASR interface 216 and receives a result of recognizing a voice received through the telephony interface 211 from the ASR 260. This is returned to the interpreter 230.

인터프리터(Interpreter;230)는 인식 결과에 따라 다음 서비스를 진행하며 상기 과정을 반복한다.The interpreter 230 proceeds to the next service according to the recognition result and repeats the above process.

사용자가 전화를 끊으면, 전화 인터페이스(Telephony Interface;211)는 이를 이벤트 핸들러(Event Handler;215)에게 통보하고 최종적으로 세션 매니저(Session Manager;212)가 세션을 닫음으로써 서비스가 종료된다.When the user hangs up, the telephone interface 211 notifies the event handler 215 and finally the service is terminated by the session manager 212 closing the session.

요즘 인터넷에 익숙해진 사용자들은 정보에 대한 욕구가 상승하지만 인내심은 하락했다. 즉, 대부분의 음성 서비스들을 제공하는 계층적 메뉴 구조에서 사용자들은 하위 메뉴로 이동하는데 필요한 대기시간이나 단계별로 안내 메시지를 듣고 거쳐가는 과정들을 부담스러워 하게 되었다. 이는 이용시간에 비례해서 적용되는 과금에도 그 이유가 있지만 복잡한 것을 싫어하고 직접적이고 즉각적인 반응을 선호하는 요즘 사용자들의 성향에도 기인한다. Users who have become accustomed to the Internet these days have increased their appetite for information, but have lost their patience. In other words, in the hierarchical menu structure that provides most voice services, users are burdened with the process of listening to and passing the guidance message by the waiting time or step required to move to the lower menu. This is due to the charges that are applied in proportion to the usage time, but also due to the propensity of users who dislike complicated and prefer direct and immediate response.

따라서 본 발명의 목적은 VXML 기반 환경에서 일반 사용자들이 좀더 빠르고 간편하게 음성 포탈 시스템을 사용할 수 있도록 검색 및 결과 제시 장치를 제공함과 동시에 서비스 제공자들 역시 좀더 자유롭게 새로운 서비스를 창출할 수 있는 기반을 제공함에 있다.Accordingly, an object of the present invention is to provide a search and result presentation device so that general users can use the voice portal system in a VXML-based environment more quickly and easily, and at the same time, provide a base for service providers to create new services more freely. .

이러한 목적을 달성하기 위한 본 발명은 기존의 VXML 기반 음성 포탈 시스템에 색인어 인덱싱을 위한 인덱서와, 키워드 또는 질의어와 색인어를 매치시켜 키워드의 목적지 또는 시나리오의 URI(Uniform Resource Indent)를 찾아내는 정보 검색 엔진(Retrieval Engine)과, 검색된 결과를 토대로 메뉴로의 이동이라든지 자동 호 연결등의 부가 서비스를 제공할 수 있는 시나리오를 자동으로 작성하고 실행하는 시나리오 생성기(Generator)를 추가하여 VXML 문서를 쉽고 빠르게 선택하고 체계적으로 시나리오를 저장 및 관리하는 일종의 문서 처리 기능을 제공함을 특징으로 한다. In order to achieve the above object, the present invention provides an information retrieval engine that finds a URI (Uniform Resource Indent) of a keyword's destination or scenario by matching an indexer for indexing with an existing VXML-based voice portal system and a keyword or a query and an index. Retrieval Engine) and a Scenario Generator that automatically creates and executes scenarios that can provide additional services such as navigation to menus or automatic call connections based on the search results. It provides a kind of document processing function to save and manage scenarios.

이하 본 발명을 첨부된 도면들을 참조하여 상세히 설명한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

도 3은 본 발명에 따른 음성 검색 및 자동 호 연결이 가능한 VXML 기반 음성 포탈 시스템의 구조도로서, 기존 음성 포탈 시스템에서 정보 검색 서버(300)를 추가하여 구성한다.3 is a structural diagram of a VXML-based voice portal system capable of voice search and automatic call connection according to the present invention, and is configured by adding an information retrieval server 300 in the existing voice portal system.

본 발명은 기존의 VXML 기반 음성 포탈 시스템에서 도 3에 도시된 것과 같은 색인어 인덱싱을 위한 인덱서(indexer;320)와, 키워드 또는 질의어와 색인어를 매치시켜 키워드의 목적지 또는 시나리오의 URI(Uniform Resource Indentifier)를 찾아내는 정보 검색 엔진(Retrieval Engine;310)과, 검색된 결과를 토대로 메뉴로의 이동이라든지 자동 호 연결등의 부가 서비스를 제공할 수 있는 시나리오를 자동으로 작성하고 실행하는 시나리오 발생기(Generator;330)를 추가하여 VXML 문서를 쉽고 빠르게 선택하고 체계적으로 시나리오를 저장 및 관리하는 일종의 문서 처리 기능을 제공한다.The present invention is an indexer (320) for indexing the index, such as shown in Figure 3 in the existing VXML-based speech portal system, match the keyword or the query and the index word, the URI (Uniform Resource Indentifier) of the destination or scenario of the keyword A search engine (Retrieval Engine) 310 for finding a search engine and a scenario generator (330) that automatically creates and executes a scenario that can provide additional services such as moving to a menu or an automatic call connection based on the search results. In addition, it provides a kind of document processing function for selecting VXML documents quickly and easily and systematically storing and managing scenarios.

본 발명에 따른 VXML 기반 음성 포탈 시스템에서의 검색 시스템은 키워드 검색과 내용 기반 검색의 2가지 종류의 검색을 지원한다. 키워드 검색은 사용자가 서비스의 내용을 알고 있고 계층 구조상의 메뉴 패스를 노드마다 거치지 않고 곧바로 검색하여 자동 호 연결까지 확장하는 서비스이다. 그리고, 내용 기반 검색은 VXML 문서로 제공하는 컨텐츠와 질의어의 유사성에 의거하여 적합한 시나리오를 찾아내고 실행까지 제공하는 서비스이다. The search system in the VXML-based speech portal system according to the present invention supports two kinds of searches: keyword search and content-based search. Keyword search is a service that the user knows the contents of the service and searches directly without hierarchical menu paths for each node and extends to automatic call connection. And, content-based search is a service that finds and executes a suitable scenario based on the similarity between the content provided by the VXML document and the query.

본 발명에 따른 인덱서(Indexer;320), 정보 검색 엔진(Retrieval Engine;310), 시나리오 생성기(Generator;330)는 키워드 검색 또는 내용 기반 검색의 검색 목적에 따라 수행하는 동작이 각기 다르다. The indexer 320, the information retrieval engine 310, and the scenario generator 330 according to the present invention have different operations according to a search purpose of a keyword search or a content-based search.

인덱서(Indexer;320)는 VXML 인터프리터(Interpreter; 230)의 XML 문서 분석기(XML Parser;232)를 이용하여 문서구조와 문서내 검색 대상 단어 및 목적지를 색인한다.The indexer 320 uses the XML Parser 232 of the VXML Interpreter 230 to index the document structure, the word to be searched in the document, and the destination.

먼저 키워드 검색인 경우는 다음과 같다.First, keyword search is as follows.

키워드 검색의 대상이 되는 문서 구조는 완벽한 계층 구조의 시나리오별로 하나의 인덱스 파일이 존재하는데 완벽한 계층구조라 함은 서비스 오류 또는 사용자의 입력 오류등으로 인한 루프 구조를 제외한 그 어떤 논리적 루프 구조도 허용하지 않는 구조의 시나리오를 말한다. 이는 인덱서(320)가 노드마다 루프 검출 방법을 통해 인위적으로 루프 구조를 해제하여야 함을 의미한다. There is one index file for each scenario of the keyword hierarchy. The perfect hierarchy does not allow any logical loop structure except the loop structure due to service error or user input error. Refer to the scenario of rescue. This means that the indexer 320 must artificially release the loop structure through the loop detection method for each node.

음성 인식의 대상이되는 단어인 색인어는 시나리오상에서 사용자가 선택할 수 있는 메뉴에 해당되며, 이는 VXML 문서내에서 태그(grammar, choice, filed, menu)에 의해 정의된다.Index words, which are words that are subject to speech recognition, correspond to user selectable menus in a scenario, which are defined by tags (grammar, choice, filed, menu) in a VXML document.

목적지 ID라 함은 메뉴에 매핑되는 목적지 즉, 사용자가 음성으로 선택하는 메뉴에 대해 제공할 서비스의 identifier를 의미한다. 모든 VXML 문서는 인터넷상에서 유일한 id를 갖고 있으며 form, block, menu등의 엘리먼트(element) 역시 한 시나리오에서 유일한 id를 갖고 있으므로 목적지 ID는 "VXML 문서_URI#Element_ID"의 형식으로 부여하여 색인어와 함께 인덱스 파일에 저장한다.The destination ID means an identifier of a service to be provided for a destination mapped to a menu, that is, a menu selected by a user by voice. Every VXML document has a unique id on the Internet, and elements such as forms, blocks, and menus also have unique ids in one scenario, so the destination ID is given in the form of "VXML document_URI # Element_ID" with the index word. Store in an index file.

한편, 내용 기반 검색은 다음과 같다.Meanwhile, the content-based search is as follows.

문서 구조는 CP가 제공하는 전체 사이트를 대상으로 하나의 인덱스 파일이 존재하여 키워드 검색처럼 별도의 문서 구조 색인 과정을 거치지 않는다.Document structure does not go through separate document structure indexing process like keyword search because one index file exists for all sites provided by CP.

음성 인식의 대상뿐만 아니라 서비스의 컨텐츠로 제공되는 정보들도 색인이 대상이 되며, 이는 태그(grammar, choice, menu, block, prompt)를 분석하여 색인어로 추출한다.Not only the object of speech recognition but also the information provided as the contents of the service are indexed, which analyzes tags (grammar, choice, menu, block, prompt) and extracts them with index words.

색인어들이 포함되어 있는 시나리오 즉, 분석(parsing)하고 있는 현재의 VXML 문서의 URI가 색인어의 목적지 ID가 된다. 색인어와 그 목적지 ID가 저장되는 인덱스 파일은 키워드 검색과 달리 보통 웹 검색 엔진들이 사용하는 Inverted file[William B. Frakes, "Information Retrival", prentice Hall 1992, pp. 377~380 참조]의 구조로 저장한다.  The scenario that contains the index words, that is, the URI of the current VXML document being parsed, becomes the destination ID of the index word. Unlike keyword search, the index file that stores the index word and its destination ID is an Inverted file [William B. Frakes, "Information Retrival", prentice Hall 1992, pp. 377 ~ 380].

인식기(ASR Engine;260)를 통해 음성이 인식되면, 그 결과로 텍스트 형태의 단어를 전달하는데 이때 인식 단어가 정보 검색 엔진(Retrieval Engine;310)의 질의어가 된다. 자세한 검색의 과정은 검색의 목적에 따라 다음과 같이 수행된다.When the voice is recognized through the recognizer (ASR Engine) 260, as a result, the word is transmitted in a text form, and the recognized word becomes a query of the information search engine 310. The detailed search process is performed as follows according to the purpose of the search.

먼저 키워드 검색은 인덱스 파일에서 질의어와 완벽하게 매치(Fully Match)한 색인어를 검색하여 색인어와 목적지 ID를 찾아낸다.First, the keyword search finds the index word and the destination ID by searching the index word that matches perfectly with the query word in the index file.

한편, 내용 기반 검색에서 정보 검색 엔진(Retrieval Engine;310)은 색인 과정에서 생성된 인버티드 인덱스 파일(Inverted Index File)을 바탕으로 질의어와 문서 사이의 유사도를 계산하여 질의어에 적합한 후보 문서들을 유사도가 높은 순서로 나열한다. Meanwhile, in content-based retrieval, the information retrieval engine 310 calculates the similarity between the query word and the document based on the inverted index file generated during the indexing process, and selects candidate documents suitable for the query word. List them in high order.

본 발명에서 사용되는 유사도 계산법은 일반적인 내용 기반 검색 엔진에서 사용하는 Inverted File에 기반한 유사도 계산 방법[William B. Frakes, "Information Retrival", prentice Hall 1992, pp. 370~375 참조]을 사용한다.Similarity calculation method used in the present invention is similarity calculation method based on Inverted File used in general content-based search engine [William B. Frakes, "Information Retrival", prentice Hall 1992, pp. 370–375].

시나리오 생성기(Generator;330)는 인덱스 파일(Index File)에 정의된 색인어중 검색 과정에 의해 결정된 색인어와 그 목적지를 새로운 VXML 문서로 구성되어 사용자에게 서비스한다.Scenario generator 330 is composed of a new VXML document to serve the user the index word and the destination determined by the search process among the index words defined in the index file.

먼저, 키워드 검색은 다음과 같다.First, keyword search is as follows.

색인어의 목적지 ID가 VXML 문서이거나 문서내의 특정 element인 경우 새롭게 구성되는 VXML 문서는 다음과 같이 문서를 구성하여 자동을 서비스 연결이 이루어지도록 한다.When the destination ID of the index word is a VXML document or a specific element in the document, the newly formed VXML document forms a document as follows so that service connection is automatically made.

<goto next="VXML 문서_URI#Element_ID"><goto next = "VXML document_URI # Element_ID">

목적지 ID가 외부 전화번호인 경우에는 다음과 같이 문서를 구성하여 자동 호 연결을 지원한다.If the destination ID is an external phone number, the document is configured as follows to support automatic call connection.

<transfer name = "Retrieval_Result" dest = "phone://028181234" connecttimeout = "30s" bridge = "true"><transfer name = "Retrieval_Result" dest = "phone: // 028181234" connecttimeout = "30s" bridge = "true">

<filed><filed>

<assign name='R_res_dur' expr="Retrieval_Reseult$.duration"/><assign name = 'R_res_dur' expr = "Retrieval_Reseult $ .duration" />

<if cond="'Retrieval_Result'='busy'"/><if cond = "'Retrieval_Result' = 'busy'" />

<elseif cond="'Retrieval_Result'='noanswer'"/></if></filled><elseif cond = "'Retrieval_Result' = 'noanswer'" /> </ if> </ filled>

</transfer></ transfer>

한편, 내용 기반 검색에서는 흔히 웹 검색에서 보듯 유사도가 높은 순서로 다수의 문서들이 검색된다. 이를 사용자에게 전달하기 위해서 시나리오 생성기(330)는 다음과 같은 VXML 문서를 구성하여 사용자로 하여금 적절한 사이트를 선택하도록 한다. 하기에서 rank2는 전화번호가 목적지 ID인 문서가 검색된 것임을 의미한다.On the other hand, in content-based search, a plurality of documents are searched in the order of high similarity as shown in web search. In order to convey this to the user, the scenario generator 330 constructs the following VXML document to allow the user to select an appropriate site. In the following rank2 means that a document whose telephone number is a destination ID is retrieved.

<form id="Retrieval_Result"><form id = "Retrieval_Result">

<block><prompt> 검색된 결과를 듣고 선택하시면 시나리오를 이동합니다.</prompt><block> <prompt> Listen to the search results and select to move the scenario. </ prompt>

<goto next="#List"/><goto next = "# List" />

</block></ block>

</form></ form>

<menu id="List"><menu id = "List">

<choice next="#rank1"> 문서 1의 색인 정보 </choice><choice next = "# rank1"> Index Information for Document 1 </ choice>

<choice next="#rank2"> 문서 2의 색인 정보 </choice><choice next = "# rank2"> Index Information for Document 2 </ choice>

<catch event="nomatch noinput"><exit/></catch><catch event = "nomatch noinput"> <exit /> </ catch>

</menu></ menu>

<form id="rank1"><form id = "rank1">

<goto next="문서1의 URI"><goto next = "uri in document1">

</form></ form>

<form id="rank2"><form id = "rank2">

<transfer name="Retrieval_Result" dest="phone://028181234" connecttimeout="30s" bridge="true"><transfer name = "Retrieval_Result" dest = "phone: // 028181234" connecttimeout = "30s" bridge = "true">

<filed><filed>

<assign name='R_res_dur' expr="Retrieval_Reseult$.duration"/><assign name = 'R_res_dur' expr = "Retrieval_Reseult $ .duration" />

<if cond="'Retrieval_Result'='busy'"/><if cond = "'Retrieval_Result' = 'busy'" />

<elseif cond="'Retrieval_Result'='noanswer'"/></if></filled><elseif cond = "'Retrieval_Result' = 'noanswer'" /> </ if> </ filled>

</transfer></ transfer>

</form></ form>

상술한 바와 같이 본 발명은 VXML 기반 음성 포탈 시스템에서 XML 형태의 정보를 음성으로 검색 및 변환하여 제공할 수 있다. As described above, the present invention can provide information by searching and converting XML-type information into voice in a VXML-based voice portal system.

따라서, 본 발명은 사용자가 전화를 걸어 정보의 키워드를 말하면, 인터넷상의 해당 정보를 음성으로 들을 수 있으며, 자동 호 연결까지 가능한 음성 포탈 서비스를 제공할 수 있다. Therefore, when the user makes a phone call and speaks a keyword of information, the user can listen to the corresponding information on the Internet by voice, and can provide a voice portal service capable of automatic call connection.

또한, 본 발명은 사용자가 서비스를 이용하는데 있어 하위 메뉴로 이동하는데 소요되는 대기 시간이나 안내 메시지 청취 시간을 절약할 수 있다.In addition, the present invention can save the waiting time or listening time of the guidance message for the user to move to the lower menu in using the service.

아울러, 본 발명은 향후 VXML 기반 음성 포탈 서비스가 확장되고 보편화되면 인터넷을 검색하여 그 결과를 음성으로 듣고, 특정 서비스 사업자의 시나리오로 이동하는 서비스까지 가능하게 한다. In addition, when the VXML-based voice portal service is expanded and generalized in the future, the present invention enables the service to search the Internet, listen to the result by voice, and move to a scenario of a specific service provider.

도 1은 음성 메일 서비스를 제공하기 위한 연결 관계를 나타내는 도면.1 is a diagram showing a connection relationship for providing a voice mail service.

도 2는 종래 음성 포탈 시스템의 구성도.2 is a block diagram of a conventional voice portal system.

도 3은 본 발명에 따른 음성 포탈 시스템의 구성도.3 is a block diagram of a voice portal system according to the present invention.

Claims (4)

브이엑스엠엘(VXML:Voice eXensible Markup Language) 기반 음성 포탈 시스템에서 서비스 검색하여 그 결과를 제시하는 장치에 있어서,In an apparatus for searching for a service in a voice eXensible Markup Language (VXML) -based voice portal system and presenting the result, 색인어 인덱싱을 위한 인덱서와;An indexer for indexing indexing; 키워드 또는 질의어와 색인어를 매치시켜 키워드의 목적지 또는 시나리오의 유알아(URI:Uniform Resource Indent)를 찾아내는 정보 검색 엔진과; An information search engine that matches a keyword or query word with an index word and finds a Uniform Resource Indent (URI) of the destination or scenario of the keyword; 검색된 결과를 토대로 메뉴로의 이동이라든지 자동 호 연결등의 부가 서비스를 제공할 수 있는 시나리오를 자동으로 작성하고 실행하는 시나리오 생성기를 포함하는 정보 검색 서버가 구비되며,An information retrieval server is provided that includes a scenario generator that automatically creates and executes a scenario that can provide an additional service such as moving to a menu or an automatic call connection based on the retrieved result. 상기 검색 서버는 키워드 검색 및 내용 기반 검색의 2가지 종류의 검색을 지원하고, 상기 검색 종류에 따라 상기 인덱서, 정보 검색 엔진, 시나리오 생성기의 동작이 서로 다르게 수행됨을 특징으로 하는 음성 포탈 시스템에서의 검색 및 문서 변환 장치.The search server supports two types of searches, keyword search and content-based search, and operations of the indexer, information search engine, and scenario generator are performed differently according to the search type. And document conversion device. 제1항에 있어서, 상기 인덱서는,The method of claim 1, wherein the indexer, 브이엑스엠엘 인터프리터의 브이엑스엠엘 문서 분석기를 이용하여 문서구조와 문서내 검색 대상 단어 및 목적지를 색인하는 것을 특징으로 하는 장치.An apparatus characterized by indexing a document structure, a search target word and a destination in a document by using a VMS document analyzer of the VMS interpreter. 제1항에 있어서, 상기 정보 검색 엔진은,The method of claim 1, wherein the information search engine, 색인 과정에서 생성된 인버티드 인덱스 파일을 바탕으로 질의어와 문서 사이의 유사도를 계산하여 질의어에 적합한 후보 문서들을 유사도가 높은 순서로 나열하는 것을 특징으로 하는 장치.And calculating candidate similarities between the query word and the document based on the inverted index file generated during the indexing process, and listing candidate documents suitable for the query word in the order of high similarity. 제1항에 있어서, 시나리오 생성기는;The system of claim 1, further comprising: a scenario generator; 인덱스 파일에 정의된 색인어중 검색 과정에 의해 결정된 색인어와 그 목적지를 새로운 브이엑스엠엘 문서로 구성되어 사용자에게 서비스를 제공하는 것을 특징으로 하는 장치.An apparatus comprising a new VXM document to provide a service to a user, the index word determined by a searching process among the index words defined in the index file, and a destination thereof.
KR10-2001-0087376A 2001-12-28 2001-12-28 Apparatus For Converting Document and Searching in Voice Portal System Expired - Fee Related KR100488112B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0087376A KR100488112B1 (en) 2001-12-28 2001-12-28 Apparatus For Converting Document and Searching in Voice Portal System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0087376A KR100488112B1 (en) 2001-12-28 2001-12-28 Apparatus For Converting Document and Searching in Voice Portal System

Publications (2)

Publication Number Publication Date
KR20030057005A KR20030057005A (en) 2003-07-04
KR100488112B1 true KR100488112B1 (en) 2005-05-06

Family

ID=32215144

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0087376A Expired - Fee Related KR100488112B1 (en) 2001-12-28 2001-12-28 Apparatus For Converting Document and Searching in Voice Portal System

Country Status (1)

Country Link
KR (1) KR100488112B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100731283B1 (en) * 2005-05-04 2007-06-21 주식회사 알에스엔 Mass document-based propensity analysis system according to query word
US8386259B2 (en) * 2006-12-28 2013-02-26 Intel Corporation Voice interface to NFC applications
US7797311B2 (en) 2007-03-19 2010-09-14 Microsoft Corporation Organizing scenario-related information and controlling access thereto
US8078604B2 (en) * 2007-03-19 2011-12-13 Microsoft Corporation Identifying executable scenarios in response to search queries

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177468A (en) * 1996-12-16 1998-06-30 Casio Comput Co Ltd Mobile terminal voice recognition and data base retrieving communication system
JPH11110186A (en) * 1997-10-02 1999-04-23 Nippon Telegr & Teleph Corp <Ntt> Browser system, voice proxy server, link item reading method, and storage medium storing link item reading program
KR20000051460A (en) * 1999-01-22 2000-08-16 이세제 Internet system and internet data service method using text/speech transformation
JP2001022756A (en) * 1999-07-05 2001-01-26 Pfu Ltd Voice interactive information retrieval system and recording medium
KR20010048015A (en) * 1999-11-24 2001-06-15 박종태 System for retrieving e-mail using voice processing and natural language understanding and method using the same
KR20010064061A (en) * 1999-12-24 2001-07-09 이경목 Search Engine with Voice Recognition
KR20020012362A (en) * 2000-08-07 2002-02-16 최중인 Voice-web system based on voice recognition
KR20020012821A (en) * 2000-08-09 2002-02-20 강준환 Furnishing system with certain reguired information through E-mail requested by telephone capable of voice recognition
KR20030006837A (en) * 2001-07-16 2003-01-23 주식회사 윈커머스 Method for Information Searching using Voice in Wire/Wireless Network
KR20030008551A (en) * 2001-07-18 2003-01-29 박종태 system and method for e-mail searching and hearing using VoiceXML

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177468A (en) * 1996-12-16 1998-06-30 Casio Comput Co Ltd Mobile terminal voice recognition and data base retrieving communication system
JPH11110186A (en) * 1997-10-02 1999-04-23 Nippon Telegr & Teleph Corp <Ntt> Browser system, voice proxy server, link item reading method, and storage medium storing link item reading program
KR20000051460A (en) * 1999-01-22 2000-08-16 이세제 Internet system and internet data service method using text/speech transformation
JP2001022756A (en) * 1999-07-05 2001-01-26 Pfu Ltd Voice interactive information retrieval system and recording medium
KR20010048015A (en) * 1999-11-24 2001-06-15 박종태 System for retrieving e-mail using voice processing and natural language understanding and method using the same
KR20010064061A (en) * 1999-12-24 2001-07-09 이경목 Search Engine with Voice Recognition
KR20020012362A (en) * 2000-08-07 2002-02-16 최중인 Voice-web system based on voice recognition
KR20020012821A (en) * 2000-08-09 2002-02-20 강준환 Furnishing system with certain reguired information through E-mail requested by telephone capable of voice recognition
KR20030006837A (en) * 2001-07-16 2003-01-23 주식회사 윈커머스 Method for Information Searching using Voice in Wire/Wireless Network
KR20030008551A (en) * 2001-07-18 2003-01-29 박종태 system and method for e-mail searching and hearing using VoiceXML

Also Published As

Publication number Publication date
KR20030057005A (en) 2003-07-04

Similar Documents

Publication Publication Date Title
JP3936718B2 (en) System and method for accessing Internet content
US10320981B2 (en) Personal voice-based information retrieval system
US7016845B2 (en) Method and apparatus for providing speech recognition resolution on an application server
US8768711B2 (en) Method and apparatus for voice-enabling an application
US8046220B2 (en) Systems and methods to index and search voice sites
US8046228B2 (en) Voice activated hypermedia systems using grammatical metadata
US8712778B1 (en) Systems and methods for archiving and retrieving navigation points in a voice command platform
CA2293780C (en) Method of using a natural language interface to retrieve information from one or more data resources
US8170881B2 (en) Distributed voice browser
US20060064302A1 (en) Method and system for voice-enabled autofill
US8204956B2 (en) Computer-implemented voice application indexing web site
US10474425B2 (en) Binary caching for XML documents with embedded executable code
KR20020004931A (en) Conversational browser and conversational systems
KR100488112B1 (en) Apparatus For Converting Document and Searching in Voice Portal System
Pargellis et al. An automatic dialogue generation platform for personalized dialogue applications
US8149999B1 (en) Generating reference variations
KR0183140B1 (en) Search method of voice information service using consonant
JP4015513B2 (en) Guidance mediating apparatus and guidance mediating method
EP1564659A1 (en) Method and system of bookmarking and retrieving electronic documents
Demesticha et al. Aspects of design and implementation of a multi-channel and multi-modal information system
Lukas et al. Position Statement for Multi-Modal Access

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

N231 Notification of change of applicant
PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R13-asn-PN2301

St.27 status event code: A-3-3-R10-R11-asn-PN2301

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R14-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

FPAY Annual fee payment

Payment date: 20130319

Year of fee payment: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R14-asn-PN2301

FPAY Annual fee payment

Payment date: 20140317

Year of fee payment: 10

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 10

FPAY Annual fee payment

Payment date: 20150313

Year of fee payment: 11

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 11

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

FPAY Annual fee payment

Payment date: 20160311

Year of fee payment: 12

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 12

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20170429

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20170429

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301