KR20240081201A - Language Learing Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library - Google Patents
Language Learing Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library Download PDFInfo
- Publication number
- KR20240081201A KR20240081201A KR1020220165227A KR20220165227A KR20240081201A KR 20240081201 A KR20240081201 A KR 20240081201A KR 1020220165227 A KR1020220165227 A KR 1020220165227A KR 20220165227 A KR20220165227 A KR 20220165227A KR 20240081201 A KR20240081201 A KR 20240081201A
- Authority
- KR
- South Korea
- Prior art keywords
- learning
- language
- pattern
- lesson
- reference library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Educational Technology (AREA)
- Computer Security & Cryptography (AREA)
- Educational Administration (AREA)
- Human Resources & Organizations (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Economics (AREA)
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
Abstract
Description
본 발명은 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 이용한 언어학습 방법에 관한 것으로, 더욱 상세하게는, 외국어를 배우는 개인이나 모국어를 사용하는 학생을 위한 학습 보조도구로 설계된 컴퓨터기반 시스템으로서, 탐색을 가능하게 하고, 타겟 언어에 대해 발생된 인스턴스가 인공지능(AI)과 자연어 처리 컴포넌트에 의하여 분석되고, 그리고나서 연계되는 참조 라이브러리의 적절한 항목에 자동으로 매핑하는 자가 학습 모드로서, 사용자가 해당 언어 인스턴스에서 사용되는 품사, 단어 의미, 구문 구조, 문법 및 관용구 패턴을 탐색할 수 있도록 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 이용하여 사용자가 원하는 언어를 기반으로 한 문장을 학습할 수 있도록 하는 새로운 형태의 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 이용한 언어학습방법에 관한 것이다.The present invention relates to a language learning method using machine learning, natural language processing, and a pattern-based reference library-based exploratory language learning system. More specifically, it relates to a computer designed as a learning aid for individuals learning a foreign language or students using their native language. As a base system, it enables navigation and a self-learning mode in which instances generated for the target language are analyzed by artificial intelligence (AI) and natural language processing components and then automatically mapped to appropriate items in the associated reference library. , a language learning system based on machine learning, natural language processing, and pattern-based reference libraries that allows users to explore parts of speech, word meanings, syntactic structures, grammar, and idiom patterns used in the language instance. It is about a language learning method using a new form of machine learning, natural language processing, and a pattern-based reference library-based exploratory language learning system that allows learning based sentences.
인터넷 서비스의 발달로 다른 나라의 동영상 컨텐츠를 개인 단말기기 혹은 전자장치를 이용하여 즐기는 인구가 늘고 있다.With the development of Internet services, the number of people enjoying video content from other countries using personal terminals or electronic devices is increasing.
특히 K-POP의 영향으로 영어권 국가에서 한국어 가요영상 뿐만 아니라고 영화등 다양한 영상컨텐츠를 시청하는 경우가 늘고 있다.In particular, due to the influence of K-POP, the number of people in English-speaking countries watching not only Korean pop videos but also various video contents such as movies is increasing.
그런데, 예를 들어 영어를 사용하는 Viki등의 동영상 시청프로그램을 사용하여 한국어 영상을 시청하면서 자막을 통해 서비스되는 한국어를 학습하거나 해당 한국어의 영어를 찾아보고자 할 때 그에 대응하는 즉각적인 서비스가 되지 않고 있는 실정이다.However, for example, when you want to learn Korean through subtitles or look up the English version of the Korean language while watching a Korean video using a video viewing program such as Viki, which uses English, there is no immediate corresponding service. This is the situation.
[선행기술문헌][Prior art literature]
대한민국 특허 등록번호 제10-1578991호(2015년12월14일 등록)(발명의 명칭: Republic of Korea Patent Registration No. 10-1578991 (registered on December 14, 2015) (Name of invention:
DOM기반 동형을 이용하여 웹브라우징 연산을 메모라이징)Memorizing web browsing operations using DOM isomorphism)
본 발명은 상술한 종래의 실정을 감안하여 제안된 것으로서, 본 발명의 목적은 외국어를 배우는 개인이나 모국어를 사용하는 학생을 위한 학습 보조도구로 설계된 컴퓨터기반 시스템으로서, 탐색을 가능하게 하고, 타겟 언어에 대해 발생된 인스턴스가 인공지능(AI)과 자연어 처리 컴포넌트에 의하여 분석되고, 그리고나서 연계되는 참조 라이브러리의 적절한 항목에 자동으로 매핑하는 자가 학습 모드로서, 사용자가 해당 언어 인스턴스에서 사용되는 품사, 단어 의미, 구문 구조, 문법 및 관용구 패턴을 탐색할 수 있도록 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 이용하여 사용자가 원하는 언어를 기반으로 한 문장을 학습할 수 있도록 하는 새로운 형태의 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 제공하는 것이다.The present invention was proposed in consideration of the above-described conventional situation, and the purpose of the present invention is to provide a computer-based system designed as a learning aid for individuals learning a foreign language or students using their native language, enabling navigation and learning the target language. A self-learning mode in which instances generated for a language are analyzed by artificial intelligence (AI) and natural language processing components and then automatically mapped to appropriate items in a linked reference library, allowing the user to identify parts of speech and words used in the language instance. A new form that allows users to learn sentences based on their desired language using a search language learning system based on machine learning, natural language processing, and pattern-based reference libraries that enable exploration of meaning, syntactic structure, grammar, and idiom patterns. It provides an exploratory language learning system based on machine learning, natural language processing, and pattern-based reference libraries.
본 발명의 실시예에 따른 계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 이용한 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법에 있어서, In the language learning method using machine learning, natural language processing, and pattern-based reference library-based search language learning system using system learning, natural language processing, and pattern-based reference library-based search language learning system according to an embodiment of the present invention,
로그인한 사용자가 학습문장을 선택했는지 판단하는 제1 단계,The first step is to determine whether the logged in user has selected a learning sentence,
제1단계 후에, 사용자가 학습문장을 선택한 경우 문장 분해를 하는 제2 단계,After the first step, a second step of sentence decomposition when the user selects a learning sentence,
화면에 문장안 패턴과 일치하는 레슨을 표시하는 제3 단계,The third step of displaying lessons matching the pattern in the sentence on the screen,
상기 제3단계에서, 사용자가 레슨을 진행하여, 학습한 후에는 학습레슨 결과가 표시되는 제4 단계,In the third step, the user proceeds with the lesson and, after learning, the fourth step in which the results of the learning lesson are displayed,
상기 제4 단계 이후, 사용자가 퀴즈 요청한 경우에는 사용자 문장학습 레슨학습 관심사를 데이터베이스를 조회하여 퀴즈생성봇이 퀴즈를 생성하는 제5 단계,After the fourth step, if the user requests a quiz, a fifth step in which the quiz creation bot creates a quiz by searching the database for the user's sentence learning, lesson learning interests,
사용자가 퀴즈를 수신하고, 퀴즈학습 단계를 수행하게 되고, 이후, 학습이력은 데이터베이스로 저장되는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법이 제공된다.A language learning method is provided through machine learning, natural language processing, and pattern-based reference library-based navigation language learning system, where the user receives the quiz, performs the quiz learning step, and then the learning history is stored in a database. do.
또한, 4개의 데이터베이스(패턴 DB, 형태소 DB, 문법 GLR(Generalized LR Parser), 참조 DB)를 통해 문장분해를 하고, 학습 가능하게 분해된 문장을 메시지 형태로 표시하게 되는 것을 특징으로 한다.In addition, it is characterized by decomposing sentences through four databases (pattern DB, morpheme DB, grammar GLR (Generalized LR Parser), and reference DB), and displaying the decomposed sentences in the form of a message so that they can be learned.
또한, 사용자가 레슨 진행을 진행한 후에는 학습한 학습레슨 결과가 메시지로 전달되면, 학습레슨 이력이 ML용 학습레슨 이력 데이터베이스에 저장되게 되는 것을 특징으로 한다.In addition, after the user proceeds with the lesson, the learned learning lesson results are sent as a message, and the learning lesson history is stored in the learning lesson history database for ML.
또한, 상기 레슨학습은 사용자의 초기 입력정보에 맞게 수준도 고려하여 제시되고, 데이터베이스에 수준별로 레슨학습 자료가 저장관리되고 업데이트되는 것을 특징으로 한다.In addition, the lesson learning is presented in consideration of the level according to the user's initial input information, and the lesson learning material is stored and updated by level in the database.
또한, 상기 퀴즈생성봇이 인터넷을 조회하여 퀴즈를 생성하게 되는 것을 특징으로 한다.Additionally, the quiz creation bot is characterized in that it searches the Internet and creates a quiz.
또한, 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템은In addition, the exploratory language learning system based on machine learning, natural language processing, and pattern-based reference libraries is
언어에서 발생된 인스턴스를 수집하거나 입력하기 위한 입력수단,An input means for collecting or inputting instances occurring in a language;
상기 입력수단을 통해 입력된 문장을 언어적 단위, 단어, 어간, 접사 및 발음기호 입력문자의 어형 축소와 품사를 생성하는 어형 분석기(morphological analyzer),A morphological analyzer that generates linguistic units, words, stems, affixes, and pronunciation symbols from sentences input through the above input means, as well as morphological reductions and parts of speech;
어형 및 구문구조 패턴에 의해 색인된 참조 라이브러리(reference library),a reference library indexed by word morphology and syntactic structure patterns;
상기 어형 분석기에 의해 처리된 내용을 참조 라이브러리를 참조로 하여 처리하는 어휘 패턴 매칭기(lexical pattern match),A lexical pattern matcher that processes the content processed by the word form analyzer with reference to a reference library,
상기 어휘 패턴 매칭기에서 처리된 어형 구조를 구문 구조를 처리하여 더 큰 구문 및 절 구조를 인식하는 구문구조 파서(phrase-structure parser),A phrase-structure parser that recognizes larger phrases and clause structures by processing the word structure processed by the vocabulary pattern matcher into a syntactic structure;
상기 구문구조 파서를 통해 처리된 구문 구조를 상기 참조 라이브러리를 참조로 하여 처리하는 라이브러리 패턴매칭기(library pattern-match), 및A library pattern-matcher that processes the syntax structure processed through the syntax structure parser by referring to the reference library, and
사용자가 관련 참조 자료를 보고 탐색할 수 있는 참조 익스플로러(reference explorer)를 포함하는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법이 제공된다.A language learning method is provided through a machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system that includes a reference explorer that allows users to view and explore related reference materials.
상술한 바와 같이, 본 발명에 따른 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템 및 방법에 의하면, 외국어를 배우는 개인이나 모국어를 사용하는 학생을 위한 학습 보조도구로 설계된 컴퓨터기반 시스템으로서, 탐색을 가능하게 하고, 타겟 언어에 대해 발생된 인스턴스가 인공지능(AI)과 자연어 처리 컴포넌트에 의하여 분석되고, 그리고나서 연계되는 참조 라이브러리의 적절한 항목에 자동으로 매핑하는 자가 학습 모드로서, 사용자가 해당 언어 인스턴스에서 사용되는 품사, 단어 의미, 구문 구조, 문법 및 관용구 패턴을 탐색할 수 있도록 하는 효과가 있다.As described above, according to the machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system and method according to the present invention, it is a computer-based system designed as a learning aid for individuals learning a foreign language or students using their native language. , a self-learning mode that enables navigation and where instances generated for the target language are analyzed by artificial intelligence (AI) and natural language processing components and then automatically mapped to appropriate items in the associated reference library, allowing the user to It has the effect of allowing you to explore the parts of speech, word meanings, syntactic structures, grammar, and idiom patterns used in that language instance.
도 1은 본 발명에 따른 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템에서의 학습 과정을 개략적으로 설명하는 기능 설명도이다.
도 2 및 도 3은 도 1의 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어 학습 방법의 일예를 나타낸 흐름도이다.Figure 1 is a functional diagram schematically explaining the learning process in the machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system according to the present invention.
Figures 2 and 3 are flowcharts showing an example of a language learning method through the machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system of Figure 1.
이하, 본 발명에 따른 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 이용한 언어학습 방법을 첨부도면을 참조로 상세히 설명한다.Hereinafter, a language learning method using machine learning, natural language processing, and a pattern-based reference library-based exploratory language learning system according to the present invention will be described in detail with reference to the accompanying drawings.
본 발명의 출원인(미리내테크놀로지)은 외국인이 기계 번역 등을 활용해 한국어를 공부할 때, 자체 개발한 문장 분석 도구와 수준별 한국어 레슨, 질의응답 등을 통해 학습을 돕는다.The applicant of the present invention (Mirinae Technology) helps foreigners learn Korean through machine translation, etc. through self-developed sentence analysis tools, Korean lessons by level, and Q&A when foreigners study Korean using machine translation.
최근 K팝, K드라마 등을 통해 한국 문화를 접한 외국인들이 구글, 파파고 번역 등을 활용해 한국어 공부를 시작하는 경우가 많은데, 기존 번역기로는 파악하기 어려운 한국어 고유의 특징과 문장 구성까지 세세하게 짚어내 학습을 돕는다.Recently, many foreigners who have been exposed to Korean culture through K-pop and K-drama have started studying Korean using Google and Papago Translate. Helps me learn.
현재의 종랙기술에서의 번역 기능은 기계학습과 자연어 처리를 합친 결과물이다. The translation function in current conventional technology is the result of combining machine learning and natural language processing.
이 방식은 라틴어 계열 간의 번역에는 문제가 없지만 문법과 규칙이 다른 한글과는 호환되지 않는다. This method has no problems with translation between Latin languages, but it is not compatible with Hangul, which has different grammar and rules.
그래서 본 발명에서는 기계학습과 자연어 처리에 독자 개발한 한국어 컴파일러인 정음 언어 엔진까지 활용해 문장을 번역하는 걸 넘어 95%까지 분해한다.Therefore, the present invention uses machine learning, natural language processing, and the Jeongum language engine, a proprietary Korean compiler, to not only translate sentences but also decompose them by up to 95%.
한국어 컴파일러는 한글 문법을 구성하는 규칙을 다른 언어로 변환할 때 사용하는 도구로, 그 구성이 고도화할수록 규칙 기반으로 번역이 이뤄진다. The Korean compiler is a tool used to convert the rules that make up Korean grammar into other languages. As the structure becomes more sophisticated, translation is done based on rules.
기존의 기계학습과 인공신경망은 번역돼있는 문장을 토대로 분석하는데, 컴파일러는 고유한 규칙을 기반으로 분석한다.Existing machine learning and artificial neural networks analyze based on translated sentences, but compilers analyze based on unique rules.
기존 한국어 번역 기술은 가까운 단어 중 가능한 의미를 가져와 제공하는 수준이며, 내포된 뜻까지 설명하지 못한다.Existing Korean translation technology only provides possible meanings from nearby words and cannot even explain the implied meaning.
학습자에게 필요한 문장의 통사적, 문법적 구조 등을 이해하기엔 부족하다. It is insufficient to understand the syntactic and grammatical structures of sentences necessary for learners.
미리내의 기술은 한국어에서 사용되는 600여 가지의 문장 패턴을 조합해 문장의 구문을 심층적, 생태학적으로 분석한다. Mirinae's technology combines over 600 sentence patterns used in the Korean language to analyze the syntax of sentences in an in-depth and ecological way.
현재 업계에서 이 분석 방식은 유일하다”며 본 발명의 출원인(미리내테크놀로지)의 한글 정음 엔진에 대해 소개했다.“Currently, this analysis method is the only one in the industry,” he said, introducing the Hangul static sound engine of the applicant (Mirinae Technology) of the present invention.
특히 컴퓨터 언어를 만들 수 있는 능력, 한국어를 학습하는 사람의 시각으로 만들다 보니 독보적일 수밖에 없다.In particular, it has the ability to create a computer language and is created from the perspective of a person learning Korean, so it is bound to be unrivaled.
가령 ‘저는 한국어를 할 수 있어요’를 분석하면, 저는, 한국어, 를, 하ㄹ수있,어요로 나눈 뒤 각 문장의 주제문과 목적어, 동사 등을 따로 분석한 다음 문법 규칙까지 낱낱히 구분한다. 또 뜻 하나하나가 어떻게 변하는지, 어떤 의미를 담고 있는지까지 해석해낸다.For example, when analyzing ‘I can speak Korean,’ I divide it into ‘I can speak Korean’, ‘I can speak Korean’, ‘I can speak Korean’, ‘I can speak Korean’, and then the subject sentence, object, and verb of each sentence are analyzed separately, and even the grammar rules are classified one by one. It also interprets how each meaning changes and what meaning it contains.
덕분에 K팝 가사나 영화 대사 등의 숨은 뜻까지도 파악하며 학습할 수 있고, 별도의 레슨과 라이브러리를 통해서도 심화학습을 들을 수 있다. Thanks to this, you can learn by understanding the hidden meaning of K-pop lyrics or movie lines, and you can also take in-depth learning through separate lessons and libraries.
또한 기존의 교육 방식은 신조어가 반영되기까지 몇 년 이상 걸리지만, 본 발명의 출원인(미리내 테크놀로지스)의 학습 방법은 곧바로 신조어를 반영하는 등 최신 트렌드에도 빠르게 대응할 수 있다. In addition, existing education methods take several years or more to reflect new words, but the learning method of the applicant of the present invention (Mirienae Technologies) can quickly respond to the latest trends, such as immediately reflecting new words.
웹 브라우저 기반은 물론 브라우저 확장 프로그램 방식까지 도입해 서비스를 제공하는 것도 접근성을 높이기 위한 전략이다.A strategy to increase accessibility is to provide services not only based on web browsers but also by introducing browser extensions.
도 1은 본 발명에 따른 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템에서의 학습 과정을 개략적으로 설명하는 기능 설명도이다.Figure 1 is a functional diagram schematically explaining the learning process in the machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system according to the present invention.
도 1을 참조하면, 본 발명은 외국어를 배우는 개인이나 모국어를 사용하는 학생을 위한 학습 보조도구로 설계된 컴퓨터기반 시스템이다. 본 발명에 따르면, 탐색을 가능하게 하고, 타겟 언어에 대해 발생된 인스턴스가 인공지능(AI)과 자연어 처리 컴포넌트에 의하여 분석되고, 그리고 나서 연계되는 참조 라이브러리의 적절한 항목에 자동으로 매핑하는 자가 학습 모드로서, 사용자가 해당 언어 인스턴스에서 사용되는 품사, 단어 의미, 구문 구조, 문법 및 관용구 패턴을 탐색할 수 있도록 한다.Referring to Figure 1, the present invention is a computer-based system designed as a learning aid for individuals learning a foreign language or students using their native language. According to the invention, a self-learning mode that enables navigation and where instances generated for the target language are analyzed by artificial intelligence (AI) and natural language processing components and then automatically mapped to appropriate items in the associated reference library. It allows users to explore the parts of speech, word meanings, syntactic structures, grammar, and idiom patterns used in that language instance.
참조 라이브러리에는 타겟 언어의 각 요소에 대한 광범위한 자료가 포함될 수 있는데, 이용 노트, 대체 예제 사용, 외부 참조 사이트 링크, 도서 인용 등이 이에 포함된다. 그것은 ML(Machine Learning) 및 NLP(Natural Language Processing) 컴포넌트가 찾은 어형 및 구문 패턴에 의해 색인되고, 상향식 학습의 한 형태가 가능하게 하며, 유기적으로 생성된 텍스트가 학습 및 디스커버리 프로세스를 구동하여, 구조화된 교육용 프로그램(courseware) 및 수업 커리큘럼의 일반적인 하향식 접근 방식을 확장하는 방식으로 구성된다.A reference library can contain extensive material on each element of the target language, including usage notes, alternative example uses, links to external reference sites, and book citations. It is indexed by morphological and syntactic patterns found by Machine Learning (ML) and Natural Language Processing (NLP) components, enabling a form of bottom-up learning, where organically generated text drives the learning and discovery process, creating structured It is structured as an extension of the typical top-down approach of courseware and class curriculum.
여기에 제시된 발명은 적절하게 학습된 분석기, 파서(parser) 및 라이브러리 항목, 각 학습자 언어로 참조 자료를 복제하는 것만으로 특정 타겟 언어의 여러 학습자 언어를 포함함으로써, 타겟 언어와 학습자 언어의 모든 조합에 적용될 수 있다. 타겟 언어 자체의 참고 자료 버전은 학교 및 기타 교육적인 컨텍스트에서 타겟 언어 원어민이 사용할 수 있다.The invention presented herein can be applied to any combination of target and learner languages by covering multiple learner languages in a particular target language simply by replicating appropriately trained analyzers, parsers and library items, and reference material in each learner language. It can be applied. Versions of the reference material in the target language itself can be used by native speakers of the target language in schools and other educational contexts.
작동 원리How it Works
본 발명의 일 실시 예는 다음 컴포넌트를 포함한다; 아래의 실시 예 부분에서 설명된 바와 같이 다른 실시 예가 가능하다.One embodiment of the invention includes the following components; Other embodiments are possible, as described in the Examples section below.
1. 언어에서 발생된 인스턴스를 수집하거나 입력하기 위한 입력시스템(input system)1. An input system for collecting or inputting instances occurring in a language.
2. 언어적 단위, 단어, 어간, 접사, 발음기호 등 입력문자의 어형 축소와 품사를 생성하는 어형 분석기(morphological analyzer)2. A morphological analyzer that reduces the form of input characters such as linguistic units, words, stems, affixes, and phonetic symbols and generates parts of speech.
3. 상기 어형 축소에서 더 큰 구문 및 절 구조를 인식하는 구문구조 파서(phrase-structure parser)3. A phrase-structure parser that recognizes larger phrase and clause structures from the above word reductions.
4. 어형 및 구문구조 패턴에 의해 색인된 참조 라이브러리(reference library)4. Reference library indexed by morphological and syntactic patterns.
5. 탐색한 인스턴스의 분석 및 파싱(구문분석)에서 패턴이 존재하고 있는 참조 라이브러리 항목을 찾아 주는 패턴매칭 시스템(pattern-matching system)5. Pattern-matching system that finds reference library items in which patterns exist through analysis and parsing of searched instances.
6. 사용자가 관련 참조 자료를 보고 탐색할 수 있는 프레젠테이션 시스템(presentation system).6. A presentation system that allows users to view and navigate related reference material.
도 1에서, 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템은 언어에서 발생된 인스턴스를 수집하거나 입력하기 위한 입력수단, 상기 입력수단을 통해 입력된 문장을 언어적 단위, 단어, 어간, 접사 및 발음기호 입력문자의 어형 축소와 품사를 생성하는 어형 분석기(morphological analyzer)(10),In Figure 1, a machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system includes an input means for collecting or inputting instances generated in a language, and sentences input through the input means into linguistic units, words, and stems. , a morphological analyzer (10) that reduces the morphological form of input characters with affixes and phonetic symbols and generates parts of speech;
어형 및 구문구조 패턴에 의해 색인된 참조 라이브러리(reference library)(50),a reference library indexed by word morphology and syntactic structure patterns (50);
상기 어형 분석기에 의해 처리된 내용을 참조 라이브러리를 참조로 하여 처리하는 어형 패턴 매칭기(lexical pattern match)(20),A lexical pattern matcher (20) that processes the content processed by the lexical analyzer with reference to a reference library,
상기 어형 패턴 매칭기(20)에서 처리된 어형 구조를 구문 구조를 처리하여 더 큰 구문 및 절 구조를 인식하는 구문구조 파서(phrase-structure parser)(30),A phrase-structure parser (30) that recognizes larger phrases and clause structures by processing the word structure processed by the word pattern matcher (20) into a syntactic structure;
상기 구문구조 파서(30)를 통해 처리된 구문 구조를 상기 참조 라이브러리를 참조로 하여 처리하는 라이브러리 패턴매칭기(library pattern-match)(40), 및A library pattern-matcher (40) that processes the syntax structure processed through the syntax structure parser (30) by referring to the reference library, and
사용자가 관련 참조 자료를 보고 탐색할 수 있는 참조 익스플로러(reference explorer)(60)를 포함한다.Includes a reference explorer 60 that allows users to view and navigate related reference materials.
상기 입력수단은 특정한 영상(스트리밍 혹은 이에 제한되지 않음)(장치)내에 프로그래밍적으로 혹은 하드웨어적으로 특정언어의 표시가 가능하도록 하는 수단 혹은 영화나 연극 및 각종 영상을 출력하는 서비스를 제공하는 영상속에서 문자화면의 출력과 연관되어 작동가능한 입력장치 일 수 있다. 그러나 이에 제한되지 않으며, 별도로 영상을 출력하는 장치에 외부 입력장치로 연결되어 영상에 문자를 오버레이 방식 혹은 화면내 특정위치에 표시하는 방식으로 작동되는 입력장치일 수도 있다. 이 입력장치는 본 발명에 따른 언어학습시스템과 연동되어 작동될 수 있다.The input means is a means that allows a specific language to be displayed programmatically or hardware-wise within a specific video (streaming or not limited thereto) (device), or a video input device that provides a service for outputting movies, plays, and various videos. It may be an input device that can be operated in connection with the output of the text screen. However, it is not limited to this, and may be an input device that is connected to a separate video output device as an external input device and operates by overlaying text on the video or displaying it at a specific location on the screen. This input device can be operated in conjunction with the language learning system according to the present invention.
이러한 컴포넌트는 도 1과 같이 작동한다. These components operate as shown in Figure 1.
①단계, 사용자는 탐색하려는 텍스트를 입력한다. 위의 예에서 학생은 한국어를 학습 중이고, 한국어로 “나는 자전거를 탈 수 있다(I can ride a bicycle)”이라는 문장을 입력한다.Step ①, the user enters the text they want to search for. In the example above, the student is learning Korean and types the sentence “I can ride a bicycle” in Korean.
② 단계, 형태소 분석기는 입력된 문장을 처리하고 문장의 어형 분류(breakdown) 생성한다. ③ 단계, 다양한 종류의 접사(affixes)들을 분리하고 라벨을 붙이며, 동사의 어간을 분리하고, 모든 형태소에 적절한 품사를 할당한다. 현재 형태소 분석기는 일반적으로 심층(deep) 신경망(neural network)이며, 본 발명은 기존 분석기 또는 이러한 목적을 위해 특별히 학습된 새 분석기의 사용을 허용한다. 이것은 아래의 어형 분석기 부분에서 더 자세히 다룬다.② Step, the morpheme analyzer processes the input sentence and generates a breakdown of the sentence. Step ③, separate and label various types of affixes, separate verb stems, and assign appropriate parts of speech to all morphemes. Current morphological analyzers are typically deep neural networks, and the present invention allows the use of existing analyzers or new analyzers specifically trained for this purpose. This is covered in more detail in the word form analyzer section below.
④ 단계, 패턴 일치장치(pattern-matcher)의 초기 "어휘(lexical)" 패스(pass)는 라이브러리의 형태소기반 패턴에 대하여 형성된다. 일치된 패턴은 형태소 구조에 주석을 달고 변형할 수 있으며, ⑤에서의 “ㄹ 수있”(= 할 수 있(can do)) 조동사 패턴과 같은 잠재적인 복합 형태소 구조를 생성한다. 이러한 주석 및 변환은 참조 탐색기로 전달되지만, 다음 구문구조 파서(Parser) 단계에 중요한 도움이 될 수도 있다.Step ④, an initial “lexical” pass of the pattern-matcher is formed over the morpheme-based patterns of the library. Matched patterns can annotate and transform morpheme structures, creating potential complex morpheme structures, such as the “ㄹ can” (= can do) auxiliary verb pattern in ⑤. These annotations and translations are passed on to the reference explorer, but can also be of great help in the next syntactic parser step.
⑥ 단계, 주석이 달린 변형된 어형 구조에 구문구조 파싱(구문분석)이 적용되고, ⑦ 단계에서 보이는 것처럼, 보다 크고 중첩될 수 있는 구문 및 절 구조를 식별한다. 이 파싱 단계는 표준 NLP 또는 청킹(chunking) 문법 또는 재귀하강(recursive-descent) 파서와 같은 컴퓨터언어 파싱 방법을 이용하여 수행한다. 본 발명은 이러한 파싱 기술의 사용을 허용한다. 본 발명의 일부 실시 예는, 일반성을 잃지 않고, ④ 단계 또는 ⑥ 단계를 생략할 수 있지만 둘 다 모두 생략할 수는 없다.In
⑧ 단계, 패턴 일치장치(pattern-matcher)의 다른 패스가 적용되는데, 이때 구문 구조와 형태소 구조를 참조하는 패턴을 포함한다. 이는 형태소와 파싱 구조에 다른 주석 세트를 첨부하고, 참조 탐색기에서 표시와 탐색을 대비하여, 라이브러리의 모든 참조 항목에 그 주석세트를 다시 연결한다.Step ⑧, another pass of the pattern-matcher is applied, which includes patterns referencing syntactic structures and morphological structures. It attaches a different set of annotations to morphemes and parsing structures, and links that set of annotations back to every referenced item in the library, ready for display and navigation in the reference explorer.
⑨ 단계, 모든 분석 및 패턴 매칭 결과를 사용자가 검토할 수 있다. 본 발명의 일 실시 예에서, 결과는 그래픽으로, 점차적인 대화형 형태로 제공되어, 사용자가 가장 관심있는 분석의 부분으로 드릴 다운(drill-down)(더 많은 정보를 찾기 위해 관련 텍스트나 아이콘등을 클릭하여 마치 뚫고 들어가듯이 검색하는 것) 되도록 한다. 프리젠테이션 시스템은 사용자가 추후에 계속 학습할 수 있도록, 입력된 텍스트의 일부 또는 전부의 분석 및 탐색 상태를 저장할 수 있다.⑨ Steps, all analysis and pattern matching results can be reviewed by the user. In one embodiment of the invention, results are presented graphically and in a progressively interactive format, allowing the user to drill-down to the parts of the analysis that are most interesting (such as related text or icons to find more information). Click to search as if you were penetrating. The presentation system can save the analysis and navigation status of some or all of the input text so that the user can continue learning at a later time.
다른 실시 예에서, 분석의 일부 요소는 긴 대기시간이 발생할 수 있고(외부 서비스에서 번역 및 단어 조회), 이 경우 전체 분석은 ⑨ 단계 디스플레이 시스템에 부분적으로 전달될 수 있으며, 즉각적인 디스플레이(표시)를 위해 대기시간이 짧은 요소가 제공되고, 대기시간이 보다 긴 요소(longer-latency)는 비동기식으로 제공되는데, 그 요소들이 이용가능할 때 디스플레이될 수 있다.In other embodiments, some elements of the analysis may incur long latencies (translation and word lookup from external services), in which case the entire analysis may be passed in parts to the ⑨ stage display system for immediate display. For this purpose, low-latency elements are provided, and longer-latency elements are provided asynchronously so that they can be displayed when they are available.
실시 예Example
본 발명의 다양한 요소는 다수의 실시 예에 존재할 수 있다. 아래는 그 중 일부를 더 자세히 제시한 것이다.Various elements of the invention may exist in multiple embodiments. Some of them are presented in more detail below.
어형 분석기(The morphological analyzer)The morphological analyzer
어형 분석기는 자연어처리 분야에서 잘 알려진 작업을 수행하며, 이는 여러 구현 방식이 있다. 현재 가장 인기있는 접근 방식은 기존 어형 파싱의 말뭉치(corpuse)에 대해 학습된 심층(deep) 신경망(neural-net) 모델을 사용하는 것이다. 다양한 언어로 사용할 수 있는 기존 모델이 있거나, 새로운 모델을 학습시킬 수 있다. Form analyzers perform a well-known task in the field of natural language processing, and there are several implementations of them. Currently, the most popular approach is to use deep neural-net models trained on a corpus of existing word-form parsing. There are existing models available in a variety of languages, or new models can be trained.
대부분의 어형 분석기는 완벽하지 않다. CNN(Convolutional Neural Network)기반 분석기의 최신 기술은 97%~98%범위로, 일반적으로 오류 수정(error-correction) 또는 조정 스키마(accommodation schemes)를 사용해야 한다. 본 발명에서 발생되는 어형 분석 오류는 패턴 라이브러리에서 변형 패턴으로 캡처될 수 있으므로(captured), 이러한 종류의 오류 수정은 상기 작동 개요의 ④ 단계에서 다루어진 어형구조 변환에서 일부분이 된다.Most word-form analyzers are not perfect. The state-of-the-art of CNN (Convolutional Neural Network)-based analyzers ranges from 97% to 98%, and generally requires the use of error-correction or accommodation schemes. Since the word-form analysis errors that occur in the present invention can be captured as transformation patterns in the pattern library, this type of error correction becomes part of the word-type structure transformation covered in step ④ of the above operation overview.
본 발명은 기존의 어형 분석기 구성 기술을 추가하는 것이 아니라, 언어 학습에 대한 새로운 접근 방식에서 최첨단(state-of-the-art) 분석기를 사용한다.Rather than adding to existing word-analyzer construction techniques, the present invention uses state-of-the-art analyzers in a new approach to language learning.
구문구조 파서(Phrase-structure parser)Phrase-structure parser
어형 분석기 컴포넌트와 유사한 방식으로, 구문구조 파싱(parsing)은 자연어 처리 및 컴퓨터 언어 구현의 잘 알려진 요소이며, 청킹 문법, 평서문의(/선언적) 파서 생성기(declarative parser generators) 또는 애드혹 재귀하강(ad-hoc recursive-descent) 파서와 같은 이러한 컴포넌트를 구현하는데 일반적 접근 방식으로 사용할 수 있다. In a similar way to the word shaper component, syntactic parsing is a well-known element of natural language processing and computer language implementations, as well as chunking grammars, declarative parser generators or ad-hoc recursive descent. hoc recursive-descent) can be used as a general approach to implementing such components, such as parsers.
애드혹 재귀하강(ad-hoc recursive-descent) 파서는 자연어 파싱의 컨텍스트에서, 일부 문법에 필요할 수 있는 컨텍스트(context-sensitive)에 민감한 파싱을 수용하는 이점이 있다.Ad-hoc recursive-descent parsers have the advantage of accommodating context-sensitive parsing, which may be necessary for some grammars, in the context of natural language parsing.
또한, 인코딩한 학습 데이터가 주어지면, 어형 구조분해 및 구문 구조화를 모두 인식하고 출력하기 위한 신경망 기반 분석기를 학습시킬 수 있다. Additionally, given encoded learning data, a neural network-based analyzer can be trained to recognize and output both word-form destructuring and syntactic structuring.
광범위하고 완전한 구문구조 파싱은 이 응용프로그램(application)에서 필수적인 것은 아니며, 파싱은 주로 교육적 목적을 가지고 있고, 종종 더 간단하며, 거친 구조는 학생들이 이해하기 더 쉽다. 다른 목적은 문법 또는 관용구 패턴인식을 돕는 것이므로, 파서가 인식할 수 있게 해당 목적에 필수적인 구문구조만 필요하다. Extensive and complete syntactic parsing is not essential for this application; parsing has primarily an educational purpose, and often simpler, coarse-grained structures are easier for students to understand. Another purpose is to help recognize grammar or idiom patterns, so only syntactic structures essential for that purpose are needed so that the parser can recognize them.
패턴 기반 참조 라이브러리(Pattern-based reference library)Pattern-based reference library
패턴기반 참조 라이브러리는 본 발명의 핵심 컴포넌트이며, 본 발명 내에서 새로우며 전개할 만한 가치가 있는 여러 측면 및 가능한 실시 예를 갖는다.The pattern-based reference library is a core component of the present invention and has many aspects and possible embodiments that are novel and worthy of development within the present invention.
패턴 스키마(Pattern schemes)Pattern schemes
학습중인 텍스트의 구조는 해당 텍스트의 어형과 구문 구조에서 패턴을 구별하는 방식으로 라이브러리내 변형 또는 설명하는 항목과 연계된다. 이러한 패턴 정의 및 매칭은 본 발명의 핵심 메커니즘이며, 이를 안정적이고 효율적으로 수행하는 모든 스키마를 수용한다. The structure of the text being studied is linked to the transformation or explanation items in the library by distinguishing patterns in the word morphology and syntactic structure of the text. This pattern definition and matching is the core mechanism of the present invention, and it accommodates all schemas that perform this reliably and efficiently.
일 실시 예는 일부 텍스트의 어형구조를 단일 문자열로 인코딩하고, 라이브러리 항목의 패턴은 해당 문자열의 토큰에 대한 정규식(regular-expressions)으로 표현된다. 예를 들면, 위 다이어그램의 샘플 한국어 문장의 형태소 구조(=“나는 자전거를 탈 수있 다”)는 다음과 같이 나타낼 수 있다.:One embodiment encodes the morphological structure of some text into a single string, and the patterns of library items are expressed as regular-expressions for tokens of the string. For example, the morpheme structure of the sample Korean sentence in the diagram above (=“I can ride a bicycle”) can be expressed as follows:
;저: NP;는: J X;자전거: NNG;를: J KO;타: VV;ㄹ: ETM;수: NNB;있: VV;어요: EF;;that: NP;is: J
형태소 + 품사의 쌍으로 구성되어 세미콜론으로 분리된 시퀀스(sequence), 품사는 NLP에서 사용되는 공통 태그 코드로, NP = 고유 명사, NNG = 일반 명사, VV = 동사 등.A sequence consisting of a pair of morpheme + part of speech separated by a semicolon. Part of speech is a common tag code used in NLP, where NP = proper noun, NNG = common noun, VV = verb, etc.
그리고 나서, ‘ㄹ /을 수 있다’ 형식을 인식하는 일반화된 패턴은 정규식이 될 수 있다:Then, a generalized pattern that recognizes the ‘ㄹ/may’ form can be a regular expression:
( ( [ ^: ] +) : V[ A- Z] +) (ㄹ|을) : ETM;수: NNB;있: VV( ( [ ^: ] +) : V[ A- Z] +) (ㄹ|eul) : ETM;Number: NNB;Be: VV
의존명사 ‘수’ 앞에 ‘ㄹ’ 또는 ‘을’ 파티클(particles)(불변화사)이 앞에 오는 모든 동사와 조동사 ‘있다’의 모든 활용동사(conjugation)를 일치시킨다.It matches all verbs preceded by ‘ㄹ’ or ‘eul’ particles (particles) in front of the dependent noun ‘number’ and all conjugations of the auxiliary verb ‘to be’.
패턴 라이브러리 수가 증가함에 따라, 모든 패턴의 순차적인 테스트는 계산상 거부될 수 있으므로 검색 최적화가 필요하다. 최적화의 간단한 실시 예는 공통 접두사(prefixes)에 대한 모든 패턴의 트리 코딩(trie-coding)이 될 수 있다.(트리는 명령 트리 데이터 구조(ordered tree data structure)를 말한다.)As the number of pattern libraries increases, sequential testing of all patterns may be computationally rejected, so search optimization is necessary. A simple example of optimization could be trie-coding of all patterns for common prefixes (tree refers to an ordered tree data structure).
안내 및 샘플학습된 패턴 (Guided- and sample-trained patterns)Guided- and sample-trained patterns
타겟 언어에서 교육학적인 가치의 각 구성을 구별하는 패턴은 여러 가지 방법으로 구성될 수 있다. 일 실시 예에서, 패턴은 타겟 언어의 문법 및 교육 전문가에 의해 수작업으로 코딩된다(hand-coded). 또 다른 경우에는, 전문가가 특정 패턴의 사례를 포함하는 텍스트의 예를 사용하고 해당 패턴의 학습을 가이드한다. 또 다른 실시 예에서, 패턴의 인스턴스를 포함하는 텍스트의 많은 예시들이 패턴에 대한 신경망기반 정규식 생성기를 학습시키는 데 사용된다.The patterns that distinguish each construct of pedagogical value in the target language can be constructed in several ways. In one embodiment, the patterns are hand-coded by a grammar and education expert in the target language. In other cases, an expert uses examples from text that contain instances of a particular pattern and guides the learning of that pattern. In another embodiment, many examples of text containing instances of a pattern are used to train a neural network-based regular expression generator for the pattern.
직접 신경망 구조 인식(Direct neural-net structure recognition)Direct neural-net structure recognition
원본 문장의 교육학적 구조는 참조 라이브러리 인덱싱 스키마의 또 다른 실시 예에서 특별히 학습된 신경망에 의해 직접 발견될 수도 있다. 이 경우, 학습 데이터는 참조 라이브러리 항목에 대하여 직접 링크로 레이블이 지정된 텍스트 컴포넌트 문장을 구성하는 하나의 말뭉치(corpus)이다. 두 단계 접근 방식도 가능하여, 가이드된 세트의 패턴 또는 수동 세트의 패턴이 라이브러리 항목 인덱스로 레이블이 지정된 큰 말뭉치를 생성하기 위해 이용되는 방식, 대량의 정규식 검색보다 훨씬 성능이 좋은 훈련된 신경망을 생성하는 방식이 가능하다.The pedagogical structure of the original sentence may also be discovered directly by a specially trained neural network in another embodiment of the reference library indexing scheme. In this case, the training data is a corpus of text component sentences labeled with direct links to reference library items. A two-step approach is also possible, in which a guided set of patterns or a manual set of patterns are exploited to generate a large corpus labeled with an index of library items, resulting in a trained neural network that performs significantly better than bulk regular expression searches. This method is possible.
다중 학습자 언어(Multiple learner languages)Multiple learner languages
형태소 분석기, 구문 파서 및 패턴세트는 각 타겟언어(학습중인 언어)에 따라 다르며 해당 언어에 대해 한 번 개발된다. 모든 설명, 라벨링 및 번역이 벡터(vectors)의 식으로 구성된 참조 라이브러리의 일 실시 예로, 학습자 언어(학생의 모국어 또는 유창한 언어)별로 분할됨으로써 동일한 라이브러리 및 타겟언어 컴포넌트가 다중 학습자 언어를 쉽게 지원할 수 있다.The morphological analyzer, syntactic parser, and pattern set are specific to each target language (the language being studied) and are developed once for that language. An example of a reference library where all descriptions, labeling, and translations are organized as vectors, split by learner language (student's native language or fluent language) so that the same library and target language component can easily support multiple learner languages. .
관용구 및 문장 패턴 및 형식 문법(Idiom and sentence patterns as well as formal grammar)Idiom and sentence patterns as well as formal grammar
본 발명의 일부 실시 예에서 참조 라이브러리는 타겟 언어의 유용한 표준 어휘, 구문 및 문법 구조의 대부분 또는 전부를 포함할 것이다. 다른 실시 예에서, 라이브러리는 관용구 또는 속어 구문에 대한 패턴 및 설명을 포함하도록 확장될 수 있는데, 언어로부터 생성된 인스턴스에서 이러한 형태의 존재는 언어 학습자에게 공통적인 어려움의 근원이 되기 때문이다. 문법 패턴을 정의, 인식 및 설명하는데 이용하는 동일한 메커니즘은 관용적 형식에 사용될 수 있다.In some embodiments of the invention, the reference library will contain most or all of the useful standard vocabulary, syntax, and grammatical structures of the target language. In other embodiments, the library could be expanded to include patterns and descriptions for idioms or slang phrases, since the presence of these forms in instances created from a language is a common source of difficulty for language learners. The same mechanisms used to define, recognize, and describe grammatical patterns can be used for idiomatic forms.
또한, 두 언어 사이의 일반적인 표현 중 일반적으로 잘 알려진 등가물(equivalent)인 문장레벨의 패턴들이 있다. 예를 들어, "I hope X"라는 일반적인 형식은, "I hope you can come” 처럼, 영어에서는 한국어로 "만약 X이면 좋을 것이다"(“If X, it will be good”)에 상당하는 공통 문자 형식을 가진다. 이러한 문장레벨 패턴은 또한 본 발명의 메커니즘에 의해 정의되고 인식될 수 있으며, 따라서 일부 실시 예에서 참조 라이브러리에도 추가될 것이다.Additionally, there are sentence-level patterns that are generally well-known equivalents of common expressions between the two languages. For example, the general form “I hope These sentence-level patterns can also be defined and recognized by the mechanism of the present invention, and thus will also be added to the reference library in some embodiments.
NLP에서 발견된 예제 사용(NLP-discovered example uses)NLP-discovered example uses
여기 설명한 것처럼 학습 도구에서 특히 유용한 교육적 요소는 학습중인 구성체(construct,단어들)의 사용에 대한 많은 예제를 제공하는 것이다. 이 시스템의 일 실시 예는 패턴 정의를 사용하여 타겟 언어의 기존 말뭉치에서 이러한 예제를 자동으로 발견한다.A particularly useful pedagogical element of a learning tool, as described here, is to provide many examples of the use of the constructs (words) being studied. One embodiment of this system uses pattern definitions to automatically discover such examples in existing corpora of the target language.
외부 참조 (External references)External references
본 발명의 네트워크 연결 실시 예에서 다른 유용한 요소는 추가 교육 또는 배경 정보의 외부 소스에 대하여 참조 라이브러리 항목 내에 링크를 제공하는 것이다. 여기에는 전통적 학습 사이트의 관련 페이지 링크가 포함되며, 또는 Youtube 비디오 또는 온라인 참고 서적 또는 문화적 또는 역사적 사이트도 포함된다. 외부 참조를 지원하는 본 발명의 실시 예는 유용한 것으로 간주 될 수 있는 이러한 종류의 링크 및 다른 인용을 포함할 수 있다.Another useful element in networked embodiments of the present invention is to provide links within reference library items to external sources of additional training or background information. This includes links to relevant pages on traditional learning sites, YouTube videos, online reference books, or cultural or historical sites. Embodiments of the invention that support external references may include these types of links and other citations that may be deemed useful.
크라우드 소싱(Crowd-sourcing)Crowd-sourcing
언어의 표준 어휘, 구문 및 문법 구조를 포함하는 참조 라이브러리의 구성은 상대적으로 제한된 훈련이며, 언어에 대한 문법 교과서를 만드는 데 필요한 것과 유사하다. 관용구, 속어, 문장 패턴, 광범위한 예제 및 외부 참조 링크와 같은 다른 자료를 포함하도록 라이브러리를 확장하는 것은 시간이 지남에 따라 점진적으로 구현될 수 있는 보다 많은 작업이 된다. The construction of a reference library containing the standard vocabulary, syntax, and grammatical structures of a language is a relatively limited exercise, similar to that required to create a grammar textbook for a language. Extending the library to include other material such as idioms, slang, sentence patterns, extensive examples and external reference links becomes more of a task that can be implemented incrementally over time.
본 발명의 가능한 실시 예는 Wikipedia 또는 Wiktionary와 같은 다른 크라우드 소싱 콘텐츠 서비스에서 발견되는 품질 및 콘텐츠에 대한 전형적인 크라우드 소싱 제어와 함께 모든 사용자로부터 라이브러리에 대한 기여를 초대하는 크라우드 소싱 시스템을 포함한다. 이러한 아이디어의 중간적인(intermediate) 실시예는 라이브러리를 추출하고(extract) 라이브러리에 진입하기 위해(enter) 서비스의 언어-교육 전문가들에 의해 검토되고 준비된(curated) 일반적인 오픈-텍스트-피드백 시스템을 포함한다Possible embodiments of the invention include a crowdsourcing system that invites contributions to the library from all users, with typical crowdsourcing control over quality and content found in other crowdsourcing content services such as Wikipedia or Wiktionary. An intermediate embodiment of this idea involves a generic open-text-feedback system reviewed and curated by the service's language-teaching experts to extract and enter the library. do
크라우드 소싱 기술은 또한, 위의 다중 학습자 언어 섹션에서 언급된 학습자 언어 참조 자료 번역을 소싱하기 위해 본 발명의 실시 예에 사용될 수 있다.Crowdsourcing techniques may also be used in embodiments of the present invention to source translations of learner language reference material as mentioned in the Multiple Learner Languages section above.
도 2 및 도 3은 도 1의 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어 학습 방법의 일예를 나타낸 흐름도이다.Figures 2 and 3 are flowcharts showing an example of a language learning method through the machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system of Figure 1.
도 2 및 도 3을 참조하면,Referring to Figures 2 and 3,
먼저, 사용자가 회원가입을 하면(S2), 시스템은 사용자DB에 저장하게 된다.First, when a user signs up (S2), the system stores it in the user DB.
사용자는 미리 관심사를 선택할 수 있고(S4), 이 정보는 사용자 로그인(S6)과정을 거쳐 운영자(예,"미리내 테크놀로지스"가 운영하는 홈페이지 첫화면,https://mirinae.io/#/)에서, 학습하고자 하는 학습문장을 입력하면(S8),Users can select interests in advance (S4), and this information is collected from the operator (e.g., the first screen of the website operated by “Miri Nae Technologies”, https://mirinae.io/#/) through the user login (S6) process. , if you enter the learning sentence you want to learn (S8),
시스템은 학습문장을 수신하고, 문장 분해를 한다. 이때, 4개의 데이터베이스(패턴 DB, 형태소 DB, 문법 GLR(Generalized LR Parser), 참조 DB)를 통해 문장분해를 하고, 학습 가능하게 분해된 문장을 메시지 형태로 표시하게 된다(S10)(참조로 도면에서 작은 원문자와 점선으로 시작하여 편지모양으로 표시된 결과는 모두 메시지 형태로 표시된다는 것을 표현한 것이다).The system receives training sentences and decomposes the sentences. At this time, the sentence is decomposed through four databases (pattern DB, morpheme DB, grammar GLR (Generalized LR Parser), reference DB), and the decomposed sentence is displayed in the form of a message so that it can be learned (S10) (see drawing for reference) This indicates that all results displayed in the shape of a letter, starting with a small original letter and a dotted line, are displayed in the form of a message).
이후 사용자는 문장을 학습하게 되고(S12), 학습한 문장은 시스템에 보내져서 학습이력으로 저장되게 된다. 즉 ML용 학습이력 DB에 저장되게 된다.Afterwards, the user learns the sentence (S12), and the learned sentence is sent to the system and stored as a learning history. In other words, it is stored in the learning history DB for ML.
상기 단계 S12이후에, 화면에 문장안 패턴과 일치하는 레슨을 표시하게 된다(S14). 이후 사용자가 레슨 진행을 원하게 되면(S16), 레슨 학습 화면이 표시되게 된다(S18). 레슨학습(S16) 단계후에는 학습한 학습레슨 결과가 메시지로 전달되면, 학습레슨 이력이 ML용 학습레슨 이력 데이터베이스에 저장되게된다.After step S12, a lesson matching the pattern in the sentence is displayed on the screen (S14). Afterwards, when the user wants to proceed with the lesson (S16), the lesson learning screen is displayed (S18). After the lesson learning (S16) step, when the learned lesson results are delivered as a message, the learning lesson history is stored in the learning lesson history database for ML.
(한편, 상기 레슨학습은 사용자의 초기 입력정보에 맞게 수준도 고려하여 제시될 수 있음은 물론 가능할 것이다. 데이터베이스에 수준별로 레슨학습 자료가 저장관리되고 업데이트된다).(On the other hand, it is of course possible that the lesson learning can be presented considering the level according to the user's initial input information. The lesson learning material is stored and updated by level in the database.)
상기 단계 S18이후에 퀴즈 요청이 있는지 판단하여(S20), 퀴즈 요청이 있는 경우에는 퀴즈요청 메시지가 시스템으로 전송되고, 사용자 문장학습 레슨학습 관심사를 데이터베이스를 통해 조회하여 퀴즈생성봇이 인터넷을 조회하여 퀴즈를 생성하게 된다.After step S18, it is determined whether there is a quiz request (S20). If there is a quiz request, a quiz request message is sent to the system, and the user's interest in sentence learning and lesson learning is searched through the database and the quiz creation bot searches the Internet. Create a quiz.
사용자는 퀴즈를 수신하게 되면(S24), 퀴즈학습 단계를 수행하게 되고(S26), 이후, 학습이력은 데이터베이스로 저장되며(S28), 이후 학습계속진행 여부를 판단하여(S30), 레슨학습(S18)이 계속 진행될 수 있다.When the user receives the quiz (S24), the user performs the quiz learning step (S26). Afterwards, the learning history is stored in the database (S28), and then it is determined whether to continue learning (S30), and the lesson learning (S26) is performed. S18) can continue.
본 발명의 기술 사상은 상기 바람직한 실시 예에 따라 구체적으로 기술되었으나, 상기한 실시 예는 그 설명을 위한 것이며 그 제한을 위한 것이 아님을 주의하여야 한다. 또한, 본 발명의 기술 분야의 통상의 전문가라면 본 발명의 기술 사상의 범위 내에서 다양한 실시 예가 가능함을 이해할 수 있을 것이다.Although the technical idea of the present invention has been described in detail according to the above preferred embodiments, it should be noted that the above-described embodiments are for illustrative purposes only and are not intended for limitation. Additionally, an expert in the technical field of the present invention will understand that various embodiments are possible within the scope of the technical idea of the present invention.
10: 어형 분석기(morphological analyzer)
20: 어휘 패턴 매칭기(lexical pattern match)
30: 구문구조 파서(phrase-structure parser)
40: 라이브러리 패턴 매칭기(Library Pattern match)
50: 참조 라이브러리(reference library)
60: 참조 익스플로러(reference explorer)10: Morphological analyzer
20: Lexical pattern match
30: Phrase-structure parser
40: Library Pattern match
50: reference library
60: reference explorer
Claims (6)
로그인한 사용자가 학습문장을 선택했는지 판단하는 제1 단계,
제1단계 후에, 사용자가 학습문장을 선택한 경우 문장 분해를 하는 제2 단계,
화면에 문장안 패턴과 일치하는 레슨을 표시하는 제3 단계,
상기 제3단계에서, 사용자가 레슨을 진행하여, 학습한 후에는 학습레슨 결과가 표시되는 제4 단계,
상기 제4 단계 이후, 사용자가 퀴즈 요청한 경우에는 사용자 문장학습 레슨학습 관심사를 데이터베이스를 조회하여 퀴즈생성봇이 퀴즈를 생성하는 제5 단계,
사용자가 퀴즈를 수신하고, 퀴즈학습 단계를 수행하게 되고, 이후, 학습이력은 데이터베이스로 저장되는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법.Machine learning, natural language processing, and pattern-based reference library-based search using a language learning system. In the language learning method using machine learning, natural language processing, and pattern-based reference library-based search language learning system,
The first step is to determine whether the logged in user has selected a learning sentence,
After the first step, a second step of sentence decomposition when the user selects a learning sentence,
The third step of displaying lessons matching the pattern in the sentence on the screen,
In the third step, the user proceeds with the lesson and, after learning, the fourth step in which the results of the learning lesson are displayed,
After the fourth step, if the user requests a quiz, a fifth step in which the quiz creation bot creates a quiz by searching the database for the user's sentence learning, lesson learning interests,
A language learning method through machine learning, natural language processing, and pattern-based reference library-based exploration language learning system, wherein the user receives a quiz, performs a quiz learning step, and then the learning history is saved in a database.
4개의 데이터베이스(패턴 DB, 형태소 DB, 문법 GLR(Generalized LR Parser), 참조 DB)를 통해 문장분해를 하고, 학습 가능하게 분해된 문장을 메시지 형태로 표시하게 되는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법.According to claim 1,
Machine learning and natural language processing that decomposes sentences through four databases (pattern DB, morpheme DB, grammar GLR (Generalized LR Parser), reference DB) and displays the decomposed sentences in the form of a message so that they can be learned. and a language learning method using a pattern-based reference library-based exploratory language learning system.
사용자가 레슨 진행을 진행한 후에는 학습한 학습레슨 결과가 메시지로 전달되면, 학습레슨 이력이 ML용 학습레슨 이력 데이터베이스에 저장되게 되는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법.According to claim 1,
Machine learning, natural language processing, and pattern-based reference library-based search, characterized in that after the user proceeds with the lesson, the learned learning lesson results are sent as a message, and the learning lesson history is stored in the learning lesson history database for ML. Language learning method through language learning system.
상기 레슨학습은 사용자의 초기 입력정보에 맞게 수준도 고려하여 제시되고, 데이터베이스에 수준별로 레슨학습 자료가 저장관리되고 업데이트되는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법.According to claim 1,
The lesson learning is presented in consideration of the level according to the user's initial input information, and the lesson learning material is stored and updated by level in the database. A machine learning, natural language processing, and pattern-based reference library-based search language learning system. Language learning method through.
상기 퀴즈생성봇이 인터넷을 조회하여 퀴즈를 생성하게 되는 것을 특징으로하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법.According to claim 1,
A language learning method through a machine learning, natural language processing, and pattern-based reference library-based exploratory language learning system, wherein the quiz creation bot searches the Internet and generates a quiz.
언어에서 발생된 인스턴스를 수집하거나 입력하기 위한 입력수단,
상기 입력수단을 통해 입력된 문장을 언어적 단위, 단어, 어간, 접사 및 발음기호 입력문자의 어형 축소와 품사를 생성하는 어형 분석기(morphological analyzer),
어형 및 구문구조 패턴에 의해 색인된 참조 라이브러리(reference library),
상기 어형 분석기에 의해 처리된 내용을 참조 라이브러리를 참조로 하여 처리하는 어휘 패턴 매칭기(lexical pattern match),
상기 어휘 패턴 매칭기에서 처리된 어형 구조를 구문 구조를 처리하여 더 큰 구문 및 절 구조를 인식하는 구문구조 파서(phrase-structure parser),
상기 구문구조 파서를 통해 처리된 구문 구조를 상기 참조 라이브러리를 참조로 하여 처리하는 라이브러리 패턴매칭기(library pattern-match), 및
사용자가 관련 참조 자료를 보고 탐색할 수 있는 참조 익스플로러(reference explorer)를 포함하는 것을 특징으로 하는 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템을 통한 언어학습 방법.The method of claim 1, wherein the exploratory language learning system based on machine learning, natural language processing, and pattern-based reference libraries is
An input means for collecting or inputting instances occurring in a language;
A morphological analyzer that generates linguistic units, words, stems, affixes, and pronunciation symbols from sentences input through the above input means, as well as morphological reductions and parts of speech;
a reference library indexed by word morphology and syntactic structure patterns;
A lexical pattern matcher that processes the content processed by the word form analyzer with reference to a reference library,
A phrase-structure parser that recognizes larger phrases and clause structures by processing the word structure processed by the vocabulary pattern matcher into a syntactic structure;
A library pattern-matcher that processes the syntax structure processed through the syntax structure parser by referring to the reference library, and
A language learning method through a machine learning, natural language processing, and pattern-based reference library-based navigation language learning system that includes a reference explorer that allows users to view and explore related reference materials.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020220165227A KR20240081201A (en) | 2022-11-30 | 2022-11-30 | Language Learing Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library |
| PCT/KR2022/019304 WO2024117313A1 (en) | 2022-11-30 | 2022-11-30 | Language learning method using exploratory language learning system based on machine learning, natural language processing, and pattern-based reference library |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020220165227A KR20240081201A (en) | 2022-11-30 | 2022-11-30 | Language Learing Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20240081201A true KR20240081201A (en) | 2024-06-07 |
Family
ID=91323904
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020220165227A Pending KR20240081201A (en) | 2022-11-30 | 2022-11-30 | Language Learing Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library |
Country Status (2)
| Country | Link |
|---|---|
| KR (1) | KR20240081201A (en) |
| WO (1) | WO2024117313A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119417673A (en) * | 2025-01-08 | 2025-02-11 | 北京策腾数字科技集团有限公司 | An intelligent learning assistance system and method based on NLP and speech processing |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7210938B2 (en) * | 2001-05-09 | 2007-05-01 | K12.Com | System and method of virtual schooling |
| KR20160039505A (en) * | 2014-10-01 | 2016-04-11 | 주식회사 삼성경제연구소 | Learning contents configuring apparatus and method for thereof |
| KR20210019712A (en) * | 2019-08-13 | 2021-02-23 | 연세대학교 원주산학협력단 | System and method for training of listening ability for hard of hearing patient |
| KR102864149B1 (en) * | 2020-03-08 | 2025-09-25 | 주식회사 미리내테크놀로지스 | Exploratory language-learning system based on ML, NLP and a pattern-based reference library And the Method thereof |
| KR20220001748A (en) * | 2020-06-30 | 2022-01-06 | 주식회사 넥스링고 | Method and apparatus for autonomous repetitive learning of a foreign language |
-
2022
- 2022-11-30 KR KR1020220165227A patent/KR20240081201A/en active Pending
- 2022-11-30 WO PCT/KR2022/019304 patent/WO2024117313A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2024117313A1 (en) | 2024-06-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102864149B1 (en) | Exploratory language-learning system based on ML, NLP and a pattern-based reference library And the Method thereof | |
| Darwish et al. | A panoramic survey of natural language processing in the Arab world | |
| Shaalan 1 | An intelligent computer assisted language learning system for Arabic learners | |
| Davydov et al. | Mathematical method of translation into Ukrainian sign language based on ontologies | |
| Shei et al. | Linkit: a CALL system for learning Chinese characters, words, and phrases | |
| Ardini et al. | Development of mobile application through the concept of artificial intelligence to enhance pronunciation skill in EFL | |
| Rose et al. | Overcoming the knowledge engineering bottleneck for understanding student language input | |
| KR20240081201A (en) | Language Learing Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library | |
| Hughes | What a corpus tells us about grammar teaching materials | |
| KR20240081737A (en) | Babel Analyzer With Compile Function Based on Exploratory language-learning system based on ML, NLP and a pattern-based reference library | |
| Pirmanova et al. | Potential of Using Abai's Poetic Corpara for Research, Educational and Methodical Purposes | |
| Bhagat et al. | Wordprep: Word-based preposition prediction tool | |
| KR20240081202A (en) | Jeongum Engine Building Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library | |
| KR20240081203A (en) | Knowledge Engine Building Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library | |
| KR20240081206A (en) | Interest Learning Method Using Exploratory language-learning system based on ML, NLP and a pattern-based reference library | |
| Winiwarter | Mastering Japanese through augmented browsing | |
| US20230112674A1 (en) | Exploratory language-learning system based on ml, nlp and pattern-based reference library | |
| Saxena | A systematic Survey of Natural Language Processing (NLP) Models & it’s Application | |
| Minn et al. | Using the BNC to create and develop educational materials and a website for learners of English | |
| WO2021182828A1 (en) | Exploratory language-learning system and method based on machine learning, natural language processing, and pattern-based reference library | |
| Jerlina et al. | Introduction of the Rudiments of NLP: A Survey of Methods and Approaches to Natural Language Processing | |
| Mahira et al. | Enriching grammatical understanding of using Japanese part of speech in dokkai learning with the ai-powered oyomi application | |
| Jia | The generation of textual entailment with NLML in an intelligent dialogue system for language learning CSIEC | |
| Fang | INTERPRETING AND TRANSLATING THE KOREAN LANGUAGE BASED ON THE MACHINE TRANSLATION MODEL FOR COLLEGE STUDENTS | |
| Liu et al. | A Hybrid Method for Automatic Simplification of Japanese Sentence Patterns Based on Morphological Analysis and Grammatical Rules |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| D21 | Rejection of application intended |
Free format text: ST27 STATUS EVENT CODE: A-1-2-D10-D21-EXM-PE0902 (AS PROVIDED BY THE NATIONAL OFFICE) |
|
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |