[go: up one dir, main page]

KR100853022B1 - Article automatic generation method and device - Google Patents

Article automatic generation method and device Download PDF

Info

Publication number
KR100853022B1
KR100853022B1 KR1020060117823A KR20060117823A KR100853022B1 KR 100853022 B1 KR100853022 B1 KR 100853022B1 KR 1020060117823 A KR1020060117823 A KR 1020060117823A KR 20060117823 A KR20060117823 A KR 20060117823A KR 100853022 B1 KR100853022 B1 KR 100853022B1
Authority
KR
South Korea
Prior art keywords
data
article
information
parsing
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020060117823A
Other languages
Korean (ko)
Other versions
KR20080047859A (en
Inventor
김동진
김정민
박광수
정준섭
김백중
박경하
이창원
Original Assignee
주식회사 씽크풀
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씽크풀 filed Critical 주식회사 씽크풀
Priority to KR1020060117823A priority Critical patent/KR100853022B1/en
Publication of KR20080047859A publication Critical patent/KR20080047859A/en
Application granted granted Critical
Publication of KR100853022B1 publication Critical patent/KR100853022B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 기업공시와 관련된 기사 생성 및 보도에 있어서 정보이용자의 이해를 돕는 풍부한 부가자료와 유용한 분석의견을 첨부하면서도 전 과정을 자동화하여 시급한 보도자료에 대하여 기존의 편집방식보다 정확하고 월등히 빠른 실시간개념의 기사를 제공하는 기사 자동 생성 방법 및 그 장치에 관한 것이다. The present invention is a more accurate and significantly faster real-time concept than the existing editing method for urgent press releases by automating the whole process while attaching abundant additional data and useful analytical opinions to help information users in creating and reporting articles related to company disclosure. The article relates to a method for automatically generating articles and apparatus thereof.

본 발명에서는 통신망을 통해 연결된 정보 제공원으로부터 제공된 데이터를 검색하고 분류한다. 상기 데이터에 대한 메타 데이터를 생성하여 저장한다. 상기 데이터의 내용을 파싱하여 누락 데이터가 존재하는지 여부를 판단하여 상기 메타 데이터의 해당 항목에 기록한다. 상기 판단 결과 누락 데이터가 존재하지 않는 경우, 상기 데이터의 파싱 내용을 저장한다. 상기 데이터를 기초로 가공 데이터를 생성한다. 상기 가공 데이터에 포함된 수치 데이터를 문장 데이터로 변환한다.In the present invention, search and classify data provided from information sources connected through a communication network. Generate and store meta data about the data. The content of the data is parsed to determine whether missing data is present and recorded in the corresponding item of the metadata. If there is no missing data as a result of the determination, the parsing content of the data is stored. Processing data is generated based on the data. Numerical data included in the processed data is converted into sentence data.

뉴스, 공시 정보, 주식, 실시간 News, Disclosure Information, Stocks, Real Time

Description

기사 자동 생성 방법 및 그 장치{METHOD AND APPARATUS FOR AUTOMATICALLY GENERATING ARTICLES}METHOD AND APPARATUS FOR AUTOMATICALLY GENERATING ARTICLES}

도 1은 종래에 수동으로 제공되던 기사의 일 예를 도시한 것이다.1 illustrates an example of a conventionally provided article.

도 2는 본 발명의 일 실시예에 따른 개략적인 기사 자동 제공 시스템의 블록도이다.2 is a block diagram of a schematic automatic article providing system according to an embodiment of the present invention.

도 3은 본 발명의 일 실시예에 따른 기사 자동 생성 장치의 개략적인 블록도이다.3 is a schematic block diagram of an automatic article generating apparatus according to an embodiment of the present invention.

도 4는 본 발명의 일 실시예에 따른 기사 자동 생성 방법을 설명하기 위한 순서도이다.4 is a flowchart illustrating a method for automatically generating articles according to an embodiment of the present invention.

도 5 내지 도 10은 실적공시의 경우에 본 발명에 따른 기사 자동 생성 과정에서 생성 및 참조되는 데이터의 일 예를 도시한 것이다.5 to 10 show an example of data generated and referenced in the article automatic generation process according to the present invention in the case of performance disclosure.

도 11은 수주공시의 경우에 본 발명에 따라 작성된 기사를 나타낸 예이다.11 is an example showing an article created according to the present invention in the case of order disclosure.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

100 : 기사 생성 장치100: article generator

200 : 정보 제공원200: information provider

300 : 통신망300: communication network

400 : 고객 단말기400: customer terminal

500 : 관리자 단말기500: administrator terminal

본 발명은 기사를 자동으로 생성하여 제공하는 방법 및 장치에 관한 것으로, 더욱 상세하게는 기업공시와 관련된 기사의 생성 및 보도에 있어서 정보 이용자의 이해를 돕는 부가자료 및 분석의견을 첨부하면서도 전 과정을 자동화하여 신속하게 기사를 제공하는 기사 자동 생성 방법 및 그 장치에 관한 것이다.The present invention relates to a method and apparatus for automatically generating and providing an article, and more particularly, in the generation and reporting of an article related to a company disclosure, while additional information and analytical opinions are added to help an understanding of information users. The present invention relates to a method for automatically generating articles and a device for providing articles quickly.

증권에 관련된 기사를 제공하는 온라인 신문사의 보도기사는 기존의 오프라인 신문사의 해설 기사 또는 인터뷰 기사를 기본적으로 포함하고 있더라도 시급히 보도해야하는 보도 기사(스트레이트 기사)의 비중이 큰데, 종래에는 상기 보도 기사를 작성하는 데 하기의 도 1과 같이 대부분 기자의 손에 의해 수작업으로 이루어지기 때문에 많은 시간, 노동력 및 비용이 소요되어 왔다.Press articles of online newspapers that provide articles related to securities have a large proportion of press articles (straight articles) that should be urgently reported even though they include commentary articles or interview articles of existing offline newspapers. As shown in Figure 1 below, most of the manual work by the hand of the reporter has been a lot of time, labor and cost has been taken.

상기 스트레이트 기사의 일 예로는 기업의 실적관련기사, 수주관련기사, 지분공시관련기사, 특허 공시관련 기사, 기타 기업의 중요한 경영사항을 알리는 기사 등이 있다. Examples of the straight article include articles related to the company's performance, order related articles, equity disclosure related articles, patent disclosure related articles, and other articles stating important management matters of the company.

도 1은 상기 내용을 실례를 들어 설명하기 위하여 실적관련 공시정보와 이에 기초하여 제작된 기사를 나타낸 것이다.Figure 1 shows the performance-related disclosure information and the article produced based on this in order to illustrate the above example by way of example.

도 1을 참조하면, 한독약품(종목고유번호: 002390)의 실적관련공시정보(10)는 2006년 10월 23일 15시 26분 57초에 제공되었다. 기존 온라인 신문사들은 한독 약품(종목고유번호: 002390)의 실적관련공시정보(10)를 기반으로 보도 기사를 작성하여 고객 단말기로 제공하였고, 보도 시각은 공시 정보를 인용한 단문 기사임에도 불구하고 공시 발생 후 최소 3~55분이 지나서야 보도하고 있고 있는 것을 알 수 있다.Referring to FIG. 1, the performance-related disclosure information 10 of Handok Pharmaceuticals (stock unique number: 002390) was provided on October 23, 2006 at 15:26:57. Existing online newspapers have prepared a press article based on the performance-related disclosure information (10) of Handok Pharmaceuticals (stock unique number: 002390) and provided it to the customer terminal.The reporting time is a short article citing the disclosure information. After at least 3 to 55 minutes, you can see that you are reporting.

즉, A 신문(12)의 경우 보도 시각은 2006년 10월 23일 15시 29분 59초, B 신문(14)의 경우 보도 시각은 2006년 10월 23일 15시 35분 18초, C 신문(16)의 경우 보도 시각은 2006년 10월 23일 16시 22분 17초로서, 공시발생 후 각각 3분 2초, 8분 21초 및 55분 30초가 소요되었으며, 부가자료나 분석의견도 없이 공시 원본을 한번 더 보도한 것에 지나지 않아 정보를 이용하고자 하는 자로 하여금 기사에 대한 만족도를 높이지 못한다는 문제점이 있어 왔다. That is, in the case of A newspaper 12, the reporting time is 15:29:59 seconds on October 23, 2006, and in the case of B newspaper 14, the reporting time is 15:35:18 seconds on October 23, 2006 In the case of (16), the reporting time was 16:22:17 on October 23, 2006, and it took 3 minutes, 2 seconds, 8 minutes, 21 seconds, and 55 minutes and 30 seconds, respectively. There has been a problem that only those who reported the original disclosure once more cannot use the information to increase satisfaction with the article.

설령 신문사가 편집기사를 생성 전달하는 일부 과정을 자동화하더라도 나머지 부분에서 수동 작업이 개입되면 그만큼 시간이 지연되고, 그로 인하여 분초를 다투는 증권기사 생성에 있어서 기사로서의 가치가 훼손된다는 한계점이 있다. Even if newspapers automate some of the processes of creating and delivering editors, there is a limitation that time is delayed if manual work is involved in the rest, thereby degrading the value as an article in the creation of a securities article that struggles for minutes and seconds.

한편, 종래의 선행기술로서 특허 제0416953호 "시스템 뉴스 제공 시스템 및 그 방법(이하 선행 특허라 한다)"가 있다. 상기 선행 특허는 투자정보에 대하여 '사용자 또는 시스템 운영자'에 의해 미리 설정된 로직에 대응되는 뉴스를 발생시키는 구조로 되어 있다.On the other hand, as a prior art, there is patent No. 0416953, "System News Providing System and Method thereof (hereinafter referred to as Prior Patent)". The preceding patent has a structure for generating news corresponding to logic preset by the 'user or system operator' with respect to the investment information.

그러나 상기 선행 특허의 경우에서는 상시로 흘러나오는 정보를 사용자 또는 시스템 운영자가 설정해 둔 소정의 로직에 상응하는 이벤트에 대해 고정화된 문구 정도를 발생시키는 구조이므로 그것이 기사라고 할 수 있을 만큼 양적으로나 질적 으로나 완결성이 떨어진다. 또한, 사용자가 설정한 로직에 대해 그 해당 사용자만 받아보는 구조로 사용한다면 그것은 뉴스라기보다는 현재 홈트레이딩시스템(HTS)에서 사용하는 실시간 검색 기능과 별다를 바가 없다는 것이다. 그리고 그것이 보여줄 결과물도 단편적인 내용으로서, 주식거래를 하고 있는 일부 사용자들에게만 의미 있는 내용, 예컨대 상한가, 하한가 정보, 매도량 정보 등으로 기사라고 보기 어렵다. 또한, 뉴스생성의 근본이 되는 기반 데이터도 시세정보 등과 같이 단일 데이터를 기반으로 하므로, 생성되는 기사가 단순하고 뉴스라기보다는 알람(alarm) 장치에 불과하다고 볼 수 있다. However, in the case of the prior patent, since the structure of generating a fixed phrase for the event corresponding to the predetermined logic set by the user or the system operator to always flow the information flowing out, it is complete and quantitatively and qualitatively enough to be called an article. Falls. In addition, if you use the structure that only the user receives the logic set by the user, it is no different from the real-time search function used in the current home trading system (HTS) rather than news. And the result it shows is fragmentary, and it is hard to say that it is an article that is meaningful only to some users who are trading stocks, such as the upper and lower limit information, and the selling amount information. In addition, since the base data, which is the basis of news generation, is also based on a single data such as quote information, the generated article may be regarded as a simple alarm device rather than a news.

또한, 상기 선행 특허는 단일 데이터 내에서 로직에 해당하느냐 해당하지 않느냐가 뉴스 발생 여부를 결정짓는데, 이는 결국, '시스템 운영자 또는 사용자가 의미가 있다고 생각하는 정보'만을 기사로 생성시킨다는 것을 의미한다. 이것은 '기사 발생 여부'를 시스템운영자 또는 사용자의 자의적 판단에 맡기는 것이며 자칫 중요한 기사를 상당수 놓칠 수 있고 또한 클라이언트마다 서로 다른 뉴스가 생성되어 실제로는 정보의 비대칭성이 발생하는바, 뉴스라고 하기 어렵다는 문제점이 있다. 또한, 상기 선행 특허는 '로직에 해당하는 사건이 있느냐?' 가 뉴스생성의 중요한 결정인자이자 내용이므로 전달할 내용이 '로직에 해당하는 사건발생'이기 때문에 내용에서 객관성이 떨어지고 6하 원칙의 필수요소들이 빠질 가능성이 높다.In addition, the preceding patent determines whether news is generated or not, corresponding to logic in a single data, which means that only 'information that a system operator or user thinks to be meaningful' is produced as an article. This is to leave 'articles' at the discretion of the system operator or the user, and to miss a lot of important articles, and to generate different news for each client, which causes information asymmetry. There is this. In addition, the preceding patent asks 'is there a case corresponding to logic?' Is an important determinant and content of news creation, so the content to be delivered is the occurrence of logic-related events.

더욱이, 상기 선행 특허는 시스템 뉴스를 6자리로 코드화하여 클라이언트에 전달하여 해독하게 함으로써 네트워크에 부하를 일으키지 않는다는 점을 장점으로 내세우고 있으나, 역설적으로 이는 종목 개수도 3자리 이내에서 구분되어야 하고 로직도 3자리 내에서 구분되어야 하므로 1000개 이상의 종목 혹은 1000개 이상의 다양한 로직은 처리할 수 없다는 치명적인 단점이 있다. 또한, 이러한 구조에서는 매번 클라이언트가 서버에 접속할 때마다 종목이나 로직의 변동사항을 다운로드 받아야 하는 부하는 감안하지 않았다는 한계점이 있다.Moreover, the preceding patent has the advantage that it does not cause a load on the network by encoding the system news to 6 digits and delivering it to the client, but, paradoxically, the number of items should be separated within 3 digits and the logic is 3 There is a fatal shortcoming that it cannot handle more than 1000 sports or more than 1000 different logic because they must be distinguished within the seat. In addition, this structure has a limitation in that it does not take into account the load of downloading items or logic changes every time the client connects to the server.

덧붙여, 현재 자동화 시스템을 이용하는 증권정보업체마저도 공시정보를 가공하여 신문기사와 같은 보도성 자료를 낼 수 없었던 이유로 첫째, 공시정보들은 단순 시세정보 내지는 시세가공정보와는 달리 그 내용의 복잡성, 다양성으로 인하여 자동화 내지는 서버구성 및 관리가 어려운 점, 둘째, 기업들이 공시하는 내용에 있어서 기재오류가 존재하는데 정보제공자가 대량의 데이터에 섞인 오류를 찾아내기란 쉽지 않다는 점, 셋째, 단순히 수치정보(시세정보 등)를 보여주는 이외의 분석의견이나 가공정보는 복잡한 로직관리와 문장의 의미파싱, 합성 등 상당한 수준의 기술이 필요하지만 현재 상용서비스를 위한 언어처리기술이 일반화되지 않았다는 점 등을 들 수 있다.In addition, even securities information companies that currently use automated systems could not process press releases to produce press releases such as newspaper articles. First, disclosure information, unlike simple quotes or quotes processing information, is characterized by the complexity and variety of its contents. Due to the difficulty of automating or configuring and managing the server, and secondly, there are errors in description in the contents disclosed by companies, but it is not easy for an information provider to find errors mixed in a large amount of data. Others, such as analytical opinions and processing information, require considerable skills such as complex logic management, sentence semantic parsing, and synthesis, but the language processing technology for commercial services is not generalized.

본 발명은 상기한 사정을 감안하여 창출된 것으로서, 그 목적은 기업공시와 관련된 뉴스 생성에 있어서 정보이용자의 이해를 돕는 풍부한 부가자료와 분석의견을 첨부하면서도 전 과정을 자동화하여 기존의 수동 편집방식보다 정확하고 월등히 빠른 실시간개념의 기사를 제공하기 위한 자동 기사 자동 생성 방법 및 그 장치를 제공하는 데 있다. The present invention has been made in view of the above circumstances, and its purpose is to automate the whole process by attaching abundant additional data and analytical opinions to help the users of information in the creation of news related to company disclosure, rather than the conventional manual editing method. The present invention provides an automatic article automatic generation method and apparatus for providing an accurate and extremely fast real-time article.

본 발명의 다른 목적은 기반데이타, 과거누적데이타, 가공데이타 등의 연동 을 통해 사용자가 찾아보아야 할 모든 데이터들을 정리해 보여줌으로써 풍부하고 종합적인 의견 내지는 투자판단의 근거자료로 활용할 수 있는 분석 기사를 제공하기 위한 기사 자동 생성 방법 및 그 장치를 제공하는 데 있다. Another object of the present invention is to provide an analysis article that can be used as a basis for rich and comprehensive opinions or investment decisions by showing all the data to be searched by the user through linkage of base data, past cumulative data, and processed data. To provide an article for automatic generation method and apparatus therefor.

본 발명의 또 다른 목적은 모든 공시건에 대해 오류가 없는 한 모두 기사를 발생시킴에 의해 자의성을 배제하며 장치에서 처리된 기사는 모든 클라이언트에게 동등하게 공개되어 정보의 비대칭성이 발생하지 않는 기사 자동 생성 방법 및 그 장치를 제공하는 데 있다. It is another object of the present invention to exclude any arbitrariness by generating articles for all disclosures unless there is an error, and articles processed in the device are published to all clients equally so that information asymmetry does not occur. The present invention provides a method and an apparatus.

본 발명의 다른 목적은 6하 원칙의 필수요소들을 빠트리지 않고 기사의 보도원칙에 충실하며 풍부한 내용을 제공할 수 있는 기사 자동 생성 방법 및 그 장치를 제공하는 데 있다. Another object of the present invention is to provide a method and apparatus for automatically generating articles that can provide abundant contents and adhere to the principle of reporting without missing the essential elements of the 6th principle.

본 발명의 또 다른 목적은 모든 과정을 일괄적으로 처리하여 클라이언트에게 불필요한 부하를 발생시키지 않으며 네트워크의 부하문제도 통상적인 웹페이지 1개 수준에서 해결되므로 통상적인 웹서버라면 무난히 서비스가 가능하고, 또한 예상치 못하게 많은 사용자가 동시에 접속하는 경우에도 별도의 뉴스제공업체 혹은 별도의 서버를 두어 문제를 해결할 수 있는 기사 자동 생성 방법 및 그 장치를 제공하는 데 있다. Another object of the present invention is to process all the processes in a batch does not cause unnecessary load on the client, and the network load problem is solved at the level of a normal web page, so a normal web server can be serviced without difficulty. In the unlikely event that a large number of users are connected at the same time, a separate news provider or a separate server to solve the problem to provide a method for automatic article generation and its device.

상기 목적을 달성하기 위한 본 발명의 제 1 관점에 따른 기사 자동 생성 방법은, Article automatic generation method according to a first aspect of the present invention for achieving the above object,

a) 통신망을 통해 연결된 정보 제공원으로부터 제공된 데이터를 검색하여 수 집하고 분류하는 단계; a) retrieving, collecting and classifying data provided from information sources connected through a communication network;

b) 상기 데이터에 대한 메타 데이터를 생성하여 저장하는 단계;b) generating and storing metadata about the data;

c) 상기 데이터의 내용을 파싱한 후, 누락 데이터가 존재하는지 여부를 판단하여 상기 메타 데이터의 해당 항목에 기록하는 단계;c) after parsing the contents of the data, determining whether missing data exists and recording the corresponding item in the metadata;

d) 상기 단계 c)의 판단 결과 누락 데이터가 존재하지 않는 경우, 상기 데이터의 파싱 내용을 저장하는 단계;d) if there is no missing data as a result of the determination of step c), storing the parsing content of the data;

e) 상기 데이터를 기초로 가공 데이터를 생성하는 단계; 및e) generating processing data based on the data; And

f) 상기 가공 데이터에 포함된 수치 데이터를 문장 데이터로 변환하는 단계를 포함하는 것을 특징으로 한다.f) converting numerical data contained in the processed data into sentence data.

이 경우 상기 단계 d)에서, 상기 데이터의 파싱 결과 상기 데이터가 누적하여 저장되는 경우 상기 메타 데이터의 누적 데이터 생성 여부 항목에 소정의 상태 표시를 기록하는 것이 바람직하다.In this case, in the step d), when the data is accumulated and stored as a result of parsing the data, it is preferable to record a predetermined status indication on whether to generate the accumulated data of the metadata.

또한, 상기 단계 d)에서, 상기 파싱 내용에 대하여 기재 오류 여부를 검사하고 기재에 오류가 없는 경우 상기 단계 e)를 수행하는 것이 바람직하다.In addition, in step d), it is preferable to check whether there is an error in description of the parsing content and to perform step e) when there is no error in the description.

더욱이, 상기 단계 e)에서 상기 데이터가 분기 실적 데이터인 경우, 과거 분기 실적과 연동하여 가공 데이터를 생성하는 단계를 더 포함할 수 있다.Furthermore, when the data is quarterly earnings data in step e), the method may further include generating processing data in association with past quarterly earnings.

상기 단계 f)는, 상기 수치 데이터에서 체언을 추출하고 상기 수치 데이터의 증감에 따른 용언을 선택하며 상기 선택된 체언과 용언의 조합에 따라 분석 정보를 결정하는 단계; 및 상기 체언 및 용언 사이에 미리 설정된 규칙에 따른 조사 및 어미를 삽입하여 문장을 완성하는 단계를 포함한다.The step f) may include extracting a spoken word from the numerical data, selecting a spoken word according to the increase and decrease of the numerical data, and determining analysis information according to a combination of the selected spoken word and the spoken word; And completing a sentence by inserting a search and a mother according to a preset rule between the idiom and the verb.

상기 가공 데이터는 주가 수익 비율, 영업 이익률, 및 자기 자본 이익률 중 적어도 하나를 포함할 수 있다.The processing data may include at least one of a stock price return ratio, an operating profit margin, and a equity return.

상기 목적을 달성하기 위한 본 발명의 제 2 관점에 따른 기사 자동 생성 장치는, Article automatic generation device according to a second aspect of the present invention for achieving the above object,

통신망에 연결된 적어도 하나의 공시 정보를 제공하는 정보 제공원으로부터 발생한 데이터를 주어진 색인어를 기준으로 검색하여 수집하고 분류하는 검색 및 분류 모듈; A search and classification module for searching, collecting, and classifying data generated from an information provider providing at least one disclosure information connected to a communication network based on a given index word;

상기 검색된 데이터로부터 원하는 내용을 파싱하고 상기 파싱된 데이터의 유효성을 검사하는 파싱 및 유효성 검사 모듈; A parsing and validation module for parsing desired content from the retrieved data and validating the parsed data;

상기 유효성 검사가 이루어진 데이터를 기초로 가공 데이터를 생성하는 가공 모듈을 포함하는 데이터 가공부; 및A data processing unit including a processing module for generating processing data based on the data on which the validity check has been performed; And

상기 데이터 가공부로부터 제공된 가공 데이터에 포함된 수치 데이터를 문장 데이터로 변환하는 기사 생성부를 포함하는 것을 특징으로 한다. And an article generation unit for converting numerical data included in the processing data provided from the data processing unit into sentence data.

상기 데이터 가공부는 상기 데이터 중 일부를 누적 저장하는 누적 데이터 DB 및 상기 가공 모듈에서 가공된 가공 데이터를 저장하는 가공 데이터 DB를 더 포함할 수 있다.The data processing unit may further include a cumulative data DB for accumulating and storing a part of the data and a processing data DB for storing processing data processed by the processing module.

또한, 상기 기사 생성부는 상기 누적 데이터 DB 및 상기 가공 데이터 DB의 데이터를 기초로 표 및 그래프 중 적어도 하나를 생성하는 도표화 모듈을 더 포함할 수 있다.The article generator may further include a tabulation module that generates at least one of a table and a graph based on data of the cumulative data DB and the processed data DB.

상기 기사 생성부는 상기 수치 데이터에서 체언을 추출하고 상기 수치 데이 터의 증감에 따른 용언을 선택하며 상기 선택된 체언과 용언의 조합에 따라 분석 정보를 결정한 후, 상기 체언 및 용언 사이에 미리 설정된 규칙에 따른 조사 및 어미를 삽입함으로써 상기 수치 데이터를 문장 데이터로 변환한다.The article generating unit extracts a statement from the numerical data, selects a word according to the increase or decrease of the numerical data, determines analysis information according to the combination of the selected word and the word, and then follows the preset rule between the word and the word. The numerical data is converted into sentence data by inserting a search and a mother.

(실시예)(Example)

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 관하여 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 2는 본 발명의 일 실시예에 따른 개략적인 기사 자동 제공 시스템의 블록도이고, 도 3은 본 발명의 일 실시예에 따른 기사 자동 생성 장치의 개략적인 블록도이다.2 is a block diagram of a schematic automatic article providing system according to an embodiment of the present invention, Figure 3 is a schematic block diagram of the automatic article generation apparatus according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 기사 자동 제공 시스템은 기사 생성 장치(100), 정보 제공원(200), 고객 단말기(400), 상기 기사 생성 장치(100)와 연결된 관리자 단말기(500) 및 통신망(300)을 포함하여 구성된다.Referring to FIG. 2, the automatic article providing system of the present invention includes an article generating apparatus 100, an information provider 200, a customer terminal 400, an administrator terminal 500 connected to the article generating apparatus 100, and a communication network. And 300.

상기 정보 제공원(200)은 예를 들어, 증권 거래소, 코스닥, 금융감독원 외에 증권과 관련된 정형적인 정보를 제공하는 모든 기관을 포함한다. The information provider 200 includes, for example, stock exchanges, KOSDAQ, the Financial Supervisory Service, and any other institution that provides formal information related to securities.

상기 정보 제공원(200)에서 게시하는 정보는 정보 통신망(300)을 통해 기사 생성 장치(100)에 의해 모니터링 후 가공되어 고객 단말기(400)로 제공된다. The information posted by the information provider 200 is processed and monitored by the article generating apparatus 100 through the information communication network 300 and provided to the customer terminal 400.

고객 단말기(400)는 통신망(300)에 접속한 개인용 컴퓨터 또는 뉴스 제공 업체이다.The customer terminal 400 is a personal computer or news provider connected to the communication network 300.

상기 기사 생성 장치(100), 정보 제공원(200), 고객 단말기(400)는 인터넷 또는 LAN을 통하여 유선 또는 무선 방식으로 접근 가능한 통신망(300)에 연결되어 있으며, 상기 고객 단말기(400)는 인터넷 접속이 가능한 단말기라면 어떤 것도 가능하다. The article generating apparatus 100, the information provider 200, and the customer terminal 400 are connected to a communication network 300 that can be accessed in a wired or wireless manner through the Internet or a LAN, and the customer terminal 400 is connected to the Internet. Any terminal can be connected.

기사 생성 장치(100)는 상기 정보 제공원(200)이 게시하는 정보를 실시간 감시하고, 정보가 유효한 것인지를 판단한 후 소정의 가공 과정을 거쳐 고객 단말기로 제공하며, 고객 단말기(400)가 뉴스 제공업체인 경우 전달된 기사는 개인용 컴퓨터(PC)로 인터넷에 접속한 개인들에게 전달된다.The article generating apparatus 100 monitors the information posted by the information provider 200 in real time, determines whether the information is valid, and provides the article to the customer terminal through a predetermined process, and the customer terminal 400 provides the news. In the case of businesses, the delivered articles are delivered to individuals who have access to the Internet through a personal computer (PC).

도 3을 참조하면, 상기 본 발명의 기사 생성 장치(100)는 중앙처리장치, 램(RAM), 외부 저장장치, 통신모듈을 포함하는 하드웨어(미도시)와 이들에서 실행되는 소프트웨어들을 포함하며, 저장부(120), 데이터 가공부(140), 및 기사 생성부(160)를 포함하여 구성된다.Referring to FIG. 3, the article generating apparatus 100 of the present invention includes a hardware including a central processing unit, a RAM, an external storage device, a communication module, and software executed thereon. The storage unit 120, the data processing unit 140, and the article generation unit 160 are configured to be included.

상기 저장부(120)는 검색어 DB(121), 메타 데이터 DB(123), 누적 데이터 DB(125), 가공 데이터 DB(127), 및 주식 시세 데이터 DB(129)를 포함한다. 상기 데이터 가공부(140)는 타이머(141), 검색 및 분류 모듈(143), 파싱 및 유효성 검사 모듈(145), 및 가공 모듈(147)을 포함하며, 뉴스 생성부(160)는 분석모듈(162), 도표화 모듈(164), 및 시소러스 DB(168)를 포함한다. The storage unit 120 includes a search word DB 121, a metadata DB 123, a cumulative data DB 125, a processed data DB 127, and a stock quote data DB 129. The data processor 140 includes a timer 141, a search and classification module 143, a parsing and validation module 145, and a processing module 147. The news generator 160 includes an analysis module ( 162, tabulation module 164, and thesaurus DB 168.

이하에 본 발명의 기사 생성 장치(100)를 상세히 설명한다.Hereinafter, the article generating apparatus 100 of the present invention will be described in detail.

상기 데이터 가공부(140)의 타이머(141)는 검색 및 분류 모듈(143)과 연동하여 상기 검색 및 분류 모듈(143)이 실시간 또는 주기적으로 정보 제공원(200)의 서버에 접속하여 공시 정보에 대하여 검색하는 데 필요한 시간정보를 제공한다.Timer 141 of the data processing unit 140 is linked to the search and classification module 143, the search and classification module 143 in real time or periodically connected to the server of the information provider 200 to the disclosure information Provides time information needed to search for

상기 공시 정보는 예를 들어, 기업실적에 관련된 실적공시, 수주와 관련된 수주공시, 지분변동과 관련된 지분공시, 기타 광범위한 종류의 공시 등을 포함하며, 이하에서는 상기 공시 정보 중 "실적 공시"가 게시된 경우를 예를 들어 설명한다.The disclosure information includes, for example, performance disclosures related to corporate performance, order disclosures related to orders, equity disclosures related to equity changes, and other broad types of disclosures. An example will be described.

검색 및 분류 모듈(143)은 타이머(141)에 의해 설정된 시각에 통신망을 통해 정보 제공원(200)의 서버에 접속하거나 상기 정보 제공원(200)으로부터 제공된 데이터를 실시간 또는 주기적으로 검색하여 색인어 목록과 일치하는 항목이 발생하면 공시류와 고유번호 등을 담은 메타 데이터(meta data)를 생성하여 메타 데이터 DB(123)에 저장한다. 상기 검색 및 분류 모듈(143)은 검색어 DB(121)에 저장된 색인어 목록을 이용하여 상기 데이터를 검색하며, 상기 검색어 DB(121)에 저장된 색인어 목록의 일 예가 도 5의 참조번호 510으로 도시되어 있으며, 상기 데이터의 검색 및 분류 결과의 일 예가 도 5의 참조번호 520으로 도시되어 있다.The search and classification module 143 connects to the server of the information provider 200 through the communication network at a time set by the timer 141 or searches the data provided from the information provider 200 in real time or periodically to index the list. When a match is generated with the generated metadata (Meta data) containing the announcement and the unique number and stored in the metadata DB (123). The search and classification module 143 searches the data by using the index word list stored in the search word DB 121. An example of the index word list stored in the search word DB 121 is shown at 510 in FIG. 5. An example of the search and classification result of the data is shown by reference numeral 520 of FIG. 5.

파싱 및 유효성 검사 모듈(145)은 검색 및 분류된 데이터에 대해 그 내용의 파싱을 수행하고, 파싱 중 누락된 데이터가 있으면 메타 데이터 누적 데이터 생성 여부에 "누락"으로 기록하고 유효하지 않은 데이터로 판단해 해당 고유번호에 대해서는 이후 과정을 처리하지 않고 종료한다. 내용의 파싱이 시작되면 누적할 가치가 없는 공시정보(도 7의 참조번호 705)로 판단되는 경우는 도 7의 참조번호 715와 같이 가공되지 않은 공시원문의 데이터를 그대로 인용한 표 형식으로 표현하는 데 사용하고, 누적하여 저장할 가치가 있는 당기 실적 데이터(725)는 도 7의 참조번호 735와 같이 누적데이터 DB(125)에 저장한다. 그리고 이 경우 도 6의 메타 데이터 중 누적 데이터 유효 여부컬럼(610)에 "검사중"임을 기록한다.The parsing and validation module 145 parses the contents of the searched and classified data, and if there is missing data during parsing, it records as "missing" whether or not the metadata accumulation data is generated and judges it as invalid data. Solution The unique number is terminated without any further processing. When parsing starts, if it is determined that the disclosure information is not worth accumulating (reference numeral 705 of FIG. 7), data of raw disclosure text is expressed in a tabular form as it is, as indicated by reference numeral 715 of FIG. 7. The current performance data 725, which is used to store and accumulate, is stored in the cumulative data DB 125 as shown by reference numeral 735 of FIG. In this case, it is recorded as "in inspection" in the accumulated data validity column 610 in the metadata of FIG. 6.

또한, 상기 파싱 및 유효성 검사 모듈(145)은 누락없이 파싱된 데이터에 대하여 기재 오류 여부를 판단하는데, 도 6의 메타 데이터의 "누적 데이터 유효 여부컬럼(610)" 항목 중 "검사 전" 에 해당하는 종목의 고유번호를 참조하여 공시 정보에 대한 검사 로직을 수행하며, 상기 검사 로직은 공시 정보에 따라 상이하다. In addition, the parsing and validation module 145 determines whether there is a description error with respect to the parsed data without omission, and corresponds to "before inspection" in the "cumulative data validity column 610" item of FIG. The inspection logic for the disclosure information is performed by referring to the unique number of the item, and the inspection logic is different according to the disclosure information.

예를 들어, 상기 공시 정보 중 실적 공시에 대한 검사 로직은 재무제표에 대한 종적 검사 및 횡적 검사가 있으며, 횡적인 검사는 기업의 매출액이 전분기 대비 이상 급변하는 경우가 통계상 매우 드물다는 전제 하에, 관리자에 의해 설정된 일정 범위를 벗어나면 오류로 인식한다. 상기 오류는 기업이 공시 내용을 입력할 때에 단위를 잘못 기재함으로써 종종 발생한다(억 원->백 만원으로 기재하는 경우 등).For example, the inspection logic of performance disclosure among the disclosure information includes longitudinal inspection and horizontal inspection of financial statements, and the horizontal inspection is based on the assumption that the company's sales rarely change more than the previous quarter. If it is out of a certain range set by, it is recognized as an error. This error is often caused by mis-entering the unit when the company enters the disclosure (eg, when it is stated between 100 million won and 1 million won).

상기 횡적 방식에 의해 자칫 매출이 이상 급변한 기업에 대해 뉴스를 생성하지 못하는 경우가 생길 수 있으나 본 발명에서는 잘못된 정보제공을 막기 위한 목적을 우선하므로 후술의 방법으로 종료한다. 종적인 검사는 회계원리를 이용한 항목간 차감의 값이 일치하는 지의 여부로 검사한다.Although the news may not be generated for a company whose sales are abnormally changed by the horizontal method, the present invention prioritizes the purpose of preventing wrong information and thus ends the method described below. Longitudinal inspection is to check whether the value of the deduction between items using accounting principles is consistent.

가공 모듈(147)은 상기 메타 데이터 DB(123)에 저장된 "누적 데이터 유효 여부컬럼(610)"에 유효로 기록되어 있는 종목의 고유 번호를 참조하여 공시 정보에 대한 가공을 수행한다. The processing module 147 performs processing on the disclosure information by referring to the unique number of the item that is recorded as valid in the "cumulative data validity column 610" stored in the metadata DB 123.

이때 가공 모듈(147)은 과거 실적이 분기 실적이면 해당 종목의 누적 데이터 DB(125)의 과거분기실적을 참조하여 과거 분기 실적 연동과정을 거쳐 연간환산 재무비율 등의 가공데이터를 산출하고, 연간 실적이면 상기 누적 데이터 DB(125)와의 연동 없이 바로 가공 데이터를 산출한다. 가공이 완료된 데이터에 대해서는 도 6의 메타 데이터에서 가공 데이터 생성 여부컬럼(620) 항목에 "완료"임을 기록한다.At this time, if the past performance is quarterly performance, the processing module 147 calculates processed data such as annualized financial ratio through the past quarterly performance linkage process by referring to the past quarterly performance of the cumulative data DB 125 of the corresponding item. When the data is processed immediately without interlocking with the cumulative data DB (125). Regarding the processed data, it is recorded in the metadata of FIG. 6 in the processing data generation column 620 item as "complete".

상기 가공 데이터란 투자정보에서 사용되는 주가수익비율(PER), 영업이익률 및 자기자본이익률(ROE) 중 적어도 하나를 포함하는 데이터이다.The processed data is data including at least one of a stock price return ratio (PER), an operating margin and a return on equity (ROE) used in the investment information.

또한, 가공 모듈(147)은 동일 DB가 아닌 서로 다른 DB와의 연동을 통해 상기 가공 데이터를 생성하는데, 예를 들면 자기자본이익률(ROE)을 구하기 위해서는 현재 파싱된 도 7의 당기순이익 데이터와 과거에 다른 공시에서 파싱하여 누적된 데이터 중 대차대조표의 자본총계 항목을 참조한다. In addition, the processing module 147 generates the processing data through interworking with different DBs rather than the same DB. For example, in order to obtain a return on equity, the net profit data of FIG. References to the total equity items in the balance sheet of data accumulated by parsing in other disclosures.

상기 가공 데이터는 통상적으로 시계 열적인 기업의 경영성과 판단이나 타 기업과의 비교를 위한 투자정보로서 유용하며, 그 데이터로 생성된 문구와 그래프의 실시예가 도 8에 도시된다.The processing data is typically useful as investment information for judging business performance of a time-series company or comparing it with other companies, and examples of phrases and graphs generated from the data are shown in FIG. 8.

상술한 바와 같이 데이터 가공부(140)에서 가공된 데이터는 기사 생성부(160)에서 참조 된다.As described above, the data processed by the data processing unit 140 is referred to by the article generation unit 160.

분석 모듈(162)은 시계 열적 분석 및 기업 간 비교의 기능을 포함하며 각각의 상황에 따른 분석을 위해 분석 모듈(162) 내에 "개별 로직"이 설정되어 있고, 그 결과에 대한 조사처리는 분석 모듈(162)의 "범용 로직"이 시소러스 DB(168)를 참조하여 최종 문장을 생성한다. 여기서 "개별 로직" 이란 관리자가 관리자 단말기(500)를 통하여 입력한 내용으로서, 체언과 용언의 조합에 따라 다수의 분석정보(H) 중 하나를 얻기 위한 로직이고, "범용 로직"은 "개별 로직"으로 얻어진 체언과 용언으로 구성된 결과에 대응하여 조사와 어미 등을 자동으로 처리하는 로직이 며, 시스템 최초 구성시에 설정되며 이후에는 간단한 업 데이트 정도의 관리과정을 거친다. 도 9의 순서도는 상기 분석 모듈(162)이 간단한 로직을 분석하여 문장을 생성하는 실시예를 도시한 도면이다. The analysis module 162 includes functions of time series analysis and inter-company comparison, and "individual logic" is set in the analysis module 162 for analysis according to each situation, and the processing of the result is analyzed module. "Universal logic" at 162 refers to thesaurus DB 168 to generate the final sentence. Here, the "individual logic" is inputted by the administrator through the administrator terminal 500, and is a logic for obtaining one of the plurality of analysis information (H) according to the combination of the talk and the verb, and the "general logic" is the "individual logic". It is the logic to automatically process the survey and the mother in response to the result composed of the message and the verb obtained by ". It is set at the initial configuration of the system, and then goes through a simple update management process. 9 is a diagram illustrating an embodiment in which the analysis module 162 generates a sentence by analyzing simple logic.

분석모듈(162)은 누적 데이터 DB(125)의 데이터 혹은 가공데이터 DB(127)의 데이터를 미리 입력된 "개별 로직"에 의해 분석하여 이 결과를 도 9의 순서도의 출력단에서와 같이 보여준다. 상기 출력단에서의 데이터는 분석 모듈(162)의 "범용 로직"이 문장 생성용 시소러스 DB(168)를 참조하여 각 상황에 맞는 문장을 생성한다. The analysis module 162 analyzes the data of the cumulative data DB 125 or the data of the processed data DB 127 by inputting " individual logic " in advance and shows the result as shown in the output of FIG. As for the data at the output terminal, the "general logic" of the analysis module 162 refers to the sentence generation thesaurus DB 168 to generate a sentence suitable for each situation.

도표화 모듈(164)은 별도의 데이터 가공과정 없이 누적 데이터(125) 및 가공 데이터 DB(127)의 데이터를 참조하여 그래프 및/또는 표를 생성한다. 상기 도표화 모듈(164)은 도 6의 메타데이터 상의 누적데이터가 "유효"하고 가공데이터가 "완료"인 고유번호의 종목을 참조하여 해당하는 종목의 그래프 및/또는 표를 생성하고 상기 과정으로 생성된 문장과 함께 기사를 생성한다.The tabulation module 164 generates graphs and / or tables by referring to the accumulated data 125 and the data of the processed data DB 127 without any separate data processing. The tabulation module 164 generates a graph and / or a table of the corresponding item by referring to the item of the unique number whose cumulative data on the metadata of FIG. 6 is "valid" and the processed data is "complete", and generates by the above process. Create articles with printed sentences.

도 11은 수주공시에 관한 자료를 본 발명의 기사 생성 장치(100)를 통하여 수주공시 원문을 파싱하여 기사로 생성한 예시도이다.11 is an exemplary view of parsing the original document of the order disclosure through the article generating device 100 of the present invention to the article relating to the order disclosure.

기사 생성 장치(100)의 데이터 가공부(140)는 수주공시의 핵심 내용, 즉, 공시 데이터(즉, 계약 물품, 계약금액, 최근 매출액, 매출액 대비 (%) 및 계약상대방)(T10)를 파싱하여, 우선 수주공시 원문에 포함된 공시 데이터(T10)를 문장 형태의 기사(T20)로 변환하여 디스플레이하며, 또한 공시 데이터(T10)에 기초하여 데이터 가공부(140)에서 가공된 가공 또는 분석의견(T30)을 디스플레이한다. The data processing unit 140 of the article generating apparatus 100 parses the core content of the order disclosure, that is, the disclosure data (that is, the contracted goods, the contracted amount, the recent sales, the percentage of the sales, and the counterpart) T10. First, the processed or analyzed opinions processed by the data processing unit 140 based on the published data T10 are converted and displayed by converting the disclosure data (T10) included in the original text of the order to the article (T20) in the sentence form. (T30) is displayed.

또한, 참조번호 T40은 공시 데이터(T10)와 같은 공시원문들이 누적되어 있는 누적 데이터 DB(125)에서 가져온 데이터를 나열해서 생성된 누적 공시 데이터를 표 형태로 표시한 것이고, 참조번호 T50은 정보 제공원(200)으로부터 제공되는 데이터와 관계없는 별도의 데이터, 예컨대, 주식 시세 데이터 DB(129)와 연동하여 만들어진 주가 데이터 기사의 일부이다. In addition, reference numeral T40 indicates the cumulative disclosure data generated by listing data obtained from the cumulative data DB 125 in which the disclosure texts such as the disclosure data T10 are accumulated, and the reference number T50 provides information. It is part of a stock price data article created in conjunction with separate data, such as stock quote data DB 129, that is not associated with data provided from the circle 200.

상기한 바와 같이 본 발명에 있어서는 수주공시인 경우에도 공시 데이터(T10)에 기초한 문장 형태의 기사(T20)는 물론 가공 또는 분석의견(T30), 누적 공시 데이터(T40) 및 주가 데이터 기사(T50)를 동시에 제공하는 것이 가능하다.As described above, in the present invention, even in the case of an order disclosure, the processing or analysis opinion (T30), the cumulative disclosure data (T40), and the stock price data article (T50), as well as the article (T20) in sentence form based on the disclosure data (T10). It is possible to provide at the same time.

따라서, 본 발명에서는 기반데이터, 과거누적데이터, 및 가공데이터 등의 연동을 통해 분석의견 등을 알려주며 사용자가 찾아보아야 할 모든 데이터들을 정리하여 디스플레이함으로써 사용자는 풍부하고 종합적인 의견 내지는 투자판단의 근거자료로 활용할 수 있게 된다.Therefore, in the present invention, the user is informed of analytical opinions and the like by linking the base data, the historical cumulative data, and the processed data, and displays all the data to be searched by the user. It can be used as.

상술한 바와 같이 구성된 본 발명의 기사 생성 장치의 작용을 도 4를 참고하여 상세하게 설명한다.The operation of the article generating device of the present invention configured as described above will be described in detail with reference to FIG.

도 4는 본 발명의 일 실시예에 따른 기사 자동 생성 방법을 설명하기 위한 순서도이다.4 is a flowchart illustrating a method for automatically generating articles according to an embodiment of the present invention.

기사 생성 장치(100)를 가동하기 이전에 관리자는 관리자 단말기(500)를 통해 상기 기사 생성 장치(100)에 접속하여 기사화할 공시류가 게시되었는지 여부를 판단하기 위한 검색어 색인입력, 데이터플랫폼 정의, 문장생성용 시소러스, 타이머설정 및 메타 데이터 정의, 각 모듈 내에 개별모듈 삽입을 수행한다. 상술한 입력 작업이 완료된 이후부터는 해당 공시류에 대해서 공시가 발생할 때마다 자동으로 기사가 생성된다. 상기 관리자 단말기(500)는 상기 기사 생성 장치(100)에 접속하여 상술한 입력 작업의 변경 및 삭제가 가능하다.Prior to operating the article generating apparatus 100, the administrator accesses the article generating apparatus 100 through the manager terminal 500 and inputs a search term index, a data platform definition, for determining whether a publication to be published is published or not. It performs sentence generation thesaurus, timer setting, meta data definition, and individual module insertion in each module. After the above-mentioned input work is completed, an article is automatically generated whenever a publication occurs for the corresponding disclosure. The manager terminal 500 may be connected to the article generating apparatus 100 to change or delete the above-described input work.

기사 생성 장치(100)의 타이머(141)는 정해진 시간이 되면 통신망(300)을 통해 연결된 정보 제공원(200)으로부터 제공된 데이터를 소정의 색인어를 기준으로 검색하고 검색된 데이터를 분류하도록 검색 및 분류 모듈(143)을 작동시킨다(S400).The timer 141 of the article generating apparatus 100 may search and classify the data provided from the information provider 200 connected through the communication network 300 based on a predetermined index word and classify the searched data when the predetermined time is reached. Operation 143 (S400).

상기 검색 및 분류 모듈(143)은 속보성이 요구되는 기사를 생성하기 위해 실시간으로 작동되어 실시간성이 요구되는 공시류의 목록을 검색한다. The search and classification module 143 is operated in real time to generate articles requiring breaking news, and searches for a list of documents that require real time.

또한, 상기 검색 및 분류 모듈(143)은 긴급성이 요구되지 않거나 대량의 데이터를 모아서 처리 및 보도해야 할 필요성이 있는 기사에 대하여 소정의 주기를 가지고 작동되며 주로 증권시장이 열리지 않는 시간에 동작한다. In addition, the retrieval and classification module 143 operates with a predetermined period for articles that are not urgently required or need to collect and process and report a large amount of data, and mainly operate at a time when the stock market is not opened. .

응용 예에서, 상기 타이머(141)는 공시가 발생될 가능성이 있는 근무 시간(예컨대 오전 9시부터 오후 6시까지, 또는 오전 9시부터 오후 3시까지 등) 동안에만 상기 검색 및 분류 모듈(143)이 실시간으로 동작하도록 설정되고, 상기 근무 시간을 초과하면 소정의 주기를 가지고 상기 검색 및 분류 모듈(143)이 동작하도록 설정하는 것이 가능하다.In an application example, the timer 141 may be configured for the search and classification module 143 only during office hours during which disclosures are likely to occur (eg, from 9 am to 6 pm, or from 9 am to 3 pm, etc.). ) Is set to operate in real time, it is possible to set the search and classification module 143 to operate with a predetermined period when the working time is exceeded.

상기 검색 및 분류 모듈(143)에서 정보 제공원(200)의 서버를 실시간(예를 들어, 5초 주기) 또는 주기적으로 검색하여 색인 상의 목록과 일치하는 항목이 발생하면, 공시류와 고유번호 등을 담은 메타데이터를 생성하여 메타데이터 DB(123) 에 저장한다(S410).The search and classification module 143 searches the server of the information provider 200 in real time (for example, for 5 seconds) or periodically to generate an item that matches the list on the index. Generate the metadata containing the stored in the metadata DB (123) (S410).

이는 공시의 분류를 나누어 이후 과정에서 어떤 종류의 기사를 생성하게 될지를 결정하는 역할을 하며 고유번호는 같은 내용에 대해 중복처리를 방지하는 역할을 한다. 도 6에는 생성된 메타 데이터의 일 예가 도시되어 있으며, 처음으로 메타 데이터를 생성하여 메타데이터 DB(120)에 저장할 때에는 누적 데이터 유효 여부컬럼(610)에 "최초"라고 기록한다.It divides the classification of disclosure and decides what kind of article will be created in the later process, and the unique number prevents duplication of the same contents. 6 illustrates an example of the generated metadata. When the metadata is generated and stored in the metadata DB 120 for the first time, it is recorded as “first” in the accumulated data validity column 610.

파싱 및 유효성 검사 모듈(145)은 검색 및 분류된 데이터에 대해 그 내용의 파싱을 수행하고, 파싱 중 누락된 데이터가 있으면 메타 데이터 누적 데이터 생성 여부에 "누락"으로 기록하고 유효하지 않은 데이터로 판단해 해당 고유번호에 대해서는 이후 과정을 처리하지 않고 종료한다. The parsing and validation module 145 parses the contents of the searched and classified data, and if there is missing data during parsing, it records as "missing" whether or not the metadata accumulation data is generated and judges it as invalid data. Solution The unique number is terminated without any further processing.

상기 파싱 및 유효성 검사 모듈(145)에서 내용의 파싱을 수행한 결과 누락된 데이터가 존재하지 않는 경우, 상기 데이터 중 누적할 가치가 있는 데이터(도 7의 725 및 735)는 단위를 통일(예컨대, 억 원 등) 하여 3분기실적데이터(735)로서 누적 데이터 DB(125)에 저장한다(S420). 그리고, 도 6의 메타 데이터에서 누적 데이터 생성 여부컬럼(610)에 "검사중"임을 기록한다.When there is no missing data as a result of parsing the content in the parsing and validating module 145, the data (725 and 735 of FIG. 7) that are worth accumulating among the data are unified (eg, 100 million won) and stored in the cumulative data DB (125) as the third quarter performance data (735) (S420). In the metadata of FIG. 6, it is recorded in the column 610 whether cumulative data is generated.

또한, 상기 파싱 및 유효성 검사 모듈(145)은 누락없이 파싱된 데이터에 대하여 기재 오류 여부를 판단한다(S430).In addition, the parsing and validity checking module 145 determines whether there is a description error with respect to the parsed data without omission (S430).

상기 파싱 및 유효성 검사 모듈(145)은 도 6의 메타 데이터에서 "누적 데이터 유효 여부컬럼(610)" 항목 중 "검사 전" 에 해당하는 종목의 고유번호를 참조하여 공시 정보에 대한 검사 로직을 수행하며, 상기 검사 로직은 상술한 바와 같이 공시 정보에 따라 상이하다. The parsing and validation module 145 performs inspection logic on the disclosure information by referring to a unique number of an item corresponding to "before inspection" in the "cumulative data validity column 610" item in the metadata of FIG. 6. The inspection logic is different according to the disclosure information as described above.

횡적 검사 또는 종적 검사에서 오류가 발생하면 기업의 공시담당자가 공시도중 데이터의 기재오류를 발생시킨 것으로 보고 상기 파싱 및 유효성 검사 모듈(145)은 메타데이터의 "누적 데이터 생성 여부컬럼(610)"에 "오류"라고 기록(미도시)하며 누적데이터 DB(125)에서 해당 데이터의 년월을 참조하여 삭제하고 해당 고유번호에 대해서는 이후 과정을 처리하지 않는다. 파싱 및 유효성 검사 모듈(145)은 데이터에 이상이 없으면 메타데이터의 "누적 데이터 생성 여부컬럼(610)"에 "유효"로 기록(미도시)한다.When an error occurs in the horizontal inspection or longitudinal inspection, the disclosure officer of the company reports that the data misrepresentation error occurred during the disclosure, and the parsing and validation module 145 checks the "cumulative data generation column 610" of metadata. "Error" is recorded (not shown) and is deleted by referring to the year and month of the data in the cumulative data DB (125) and does not process subsequent processes for the unique number. The parsing and validity checking module 145 writes (valid) to the " cumulative data generation column 610 "

가공 모듈(147)은 상기 메타 데이터 DB(123)에 저장된 "누적 데이터 유효 여부컬럼(610)"에 유효로 기록되어 있는 종목의 고유 번호를 참조하여 공시 정보에 대한 가공을 수행하여 도 8과 같이 가공 데이터를 생성한다(S440). The processing module 147 performs the processing on the disclosure information by referring to the unique number of the item recorded as valid in the "cumulative data validity column 610" stored in the metadata DB 123, as shown in FIG. Process data is generated (S440).

이때 가공 모듈(147)은 과거 실적이 분기 실적이면 해당 종목의 누적 데이터 DB(125)의 과거분기실적을 참조하여 과거 분기 실적 연동과정을 거쳐 연간환산 재무비율 등의 가공데이터를 산출하고, 연간 실적이면 상기 누적 데이터 DB(125)와의 연동 없이 바로 가공 데이터를 산출한다. 가공이 완료된 데이터에 대해서는 도 6의 메타 데이터에서 가공 데이터 생성 여부컬럼(620) 항목에 "생성전" 상태를 "완료"로 기록한다.At this time, if the past performance is quarterly performance, the processing module 147 calculates processed data such as annualized financial ratio through the past quarterly performance linkage process by referring to the past quarterly performance of the cumulative data DB 125 of the corresponding item. When the data is processed immediately without interlocking with the cumulative data DB (125). Regarding the completed data, the state "before generation" is recorded as "complete" in the processing data generation column 620 in the metadata of FIG. 6.

이렇게 생성된 가공데이터는 기사 생성부(160)의 분석 모듈(162) 및 도표화 모듈(164)에서 참조하게 된다. The processed data generated in this way is referred to by the analysis module 162 and the tabulation module 164 of the article generator 160.

기사 생성부(160)의 분석 모듈(162)은 시계 열적 분석 및 기업 간 비교의 기 능을 포함하며, 각각의 상황에 따른 분석은 분석 모듈(162) 내의 "개별 로직"에 의해 이루어지고, 그 결과에 대한 조사 및 어미의 처리는 분석 모듈(162)의 "범용 로직"이 시소러스 DB(168)를 참조하여 수치 데이터를 문장 데이터로 변환하는 방식으로 최종 문장을 생성한다(S450). The analysis module 162 of the article generator 160 includes functions of time series analysis and intercompany comparison, and the analysis according to each situation is performed by “individual logic” in the analysis module 162. Investigation of the result and processing of the mother generate the final sentence in such a manner that "general logic" of the analysis module 162 converts numerical data into sentence data with reference to the thesaurus DB 168 (S450).

분석 모듈(162)은 누적데이터 DB(125)의 데이터 또는 가공데이터 DB(127)의 데이터를 미리 입력된 "개별 로직"에 의해 분석하여 그 분석 결과를 도 9의 순서도의 출력단에서와 같이 보여준다. 상기 출력단에서의 분석데이터(901-904)는 문장생성용 시소러스 DB(168)를 참조하여 각 상황에 맞는 문장을 생성하는데, 상기 분석 모듈(162)은 용언과 체언에 알맞은 조사와 어미 등을 자동으로 처리한다. The analysis module 162 analyzes the data of the cumulative data DB 125 or the data of the processed data DB 127 by pre-input "individual logic" and shows the analysis result as shown in the output stage of the flowchart of FIG. 9. The analysis data (901-904) at the output terminal generates sentences for each situation with reference to the sentence generation thesaurus DB (168), and the analysis module (162) automatically searches for the word and the message, etc. To be processed.

도 9의 순서도는 예를 들어, 분기별 매출액과 영업이익 각각의 감소/증가 여부를 판단하여 총 4가지 결과를 도시한 것이고, 도 10은 문장생성용 시소러스(thesaurus) DB의 내부 구조를 보여주는 도표와 분석 정보가 얻어지는 과정을 나타내는 설명도이다.The flowchart of FIG. 9 shows, for example, a total of four results by judging whether the quarterly sales and operating profits decrease or increase, respectively, and FIG. 10 is a diagram showing the internal structure of a sentence generation thesaurus DB. And explanatory drawing which shows the process of obtaining analysis information.

먼저 매출액(A)으로 규정된 체언에 대해, 그 데이터 항목을 DB에서 참조하여 상기 매출액의 증감 여부에 따라 매출액이 증가한 경우 용언이 C1로 결정되고, 상기 매출액이 감소하는 경우 용언이 C2로 결정되며, 상술한 방법과 동일하게, 영업이익 E에 관해서도 증가하는 경우 용언이 G1로 결정되고 감소하는 경우 G2로 결정된다.First, for the statement defined as sales (A), if the sales increase according to whether the sales increase or decrease by referring to the data item from the DB, the proverb is determined to be C1, and if the sales decreases, the proverb is determined to be C2. In the same way as described above, the wording is determined as G1 when increasing with respect to the operating profit E, and as G2 when decreasing.

C1 및 G1이 결정되면 분석 정보(H)는 "활황기 도래"(H1)로 결정되고, C1 및 G2로 결정되면 분석정보(H)는 "기업체질 개선 요망"(H2)으로 결정되며, C2 및 G1이 결정되면 분석정보(H)는 "이익률 개선"(H3)으로 결정되고, C2 및 G2가 결정되면 분석정보(H)는 "침체국면 도래"(H4)로 결정된다.When C1 and G1 are determined, the analysis information (H) is determined as "coming boom" (H1), when C1 and G2 is determined, the analysis information (H) is determined as "business quality improvement" (H2), C2 and When G1 is determined, analysis information H is determined as "profit margin improvement" (H3), and when C2 and G2 are determined, analysis information H is determined as "coming recession phase" (H4).

예컨대, 매출액이 증가하고 영업이익이 증가했을 경우 A1, C1, E1, G1, H1의 결과가 도출되는데, 다시 설명하자면 체언(A)과 체언(E)에 대하여 용언(C)과 용언(G)을 적용하여 결과값 분석정보(H)를 도출해 내는 것이 "개별 로직"의 역할이다. 또한, 이렇게 나온 최종결과 A1, C1, E1, G1, H1에 대하여 체언(A,E)과 용언(C,G) 사이에 각각 조사(b1,f1)를 적용하고 용언(C) 다음에 어미(d1)를 적용하는 것이 "범용 로직"이다. For example, if the sales increase and the operating profit increase, the result of A1, C1, E1, G1, H1 is derived. In other words, the word (C) and the word (G) for the word (A) and the word (E). It is the role of "individual logic" to derive the result analysis information (H) by applying. Also, for the final results A1, C1, E1, G1, and H1, the surveys (b1, f1) are applied between the verbs (A, E) and the verbs (C, G), respectively. d1) is the "general purpose logic".

결과적으로, 상기와 같이 매출액이 증가하고 영업이익이 증가했을 경우 본 발명의 문장생성용 시소러스(thesaurus)에 따른 개별 로직과 범용 로직의 적용에 의해 수치 데이터로부터 "매출액이 증가하였으며 영업이익도 증가."와 같은 문장이 자동적으로 생성되며, 그 결과로서 "활황기 도래"라는 분석정보(H)가 도출된다. 즉, 본 발명의 문장생성용 시소러스(thesaurus)를 이용하면 개별 로직과 범용 로직의 순차적 진행에 의하여 자연스러운 문장이 생성된다. As a result, when the sales increase and the operating profit increases as described above, "the amount of sales increased and the operating profit also increased from the numerical data by the application of individual logic and general-purpose logic according to the thesaurus for generating sentences of the present invention. A sentence such as "" is automatically generated, and as a result, the analysis information "H" of "coming active stage" is derived. That is, using the sentence generation thesaurus of the present invention, natural sentences are generated by sequential progress of individual logic and general purpose logic.

상기한 바와 같이, 본 발명에서는 수치 데이터에서 체언을 추출하고 상기 수치 데이터의 증감에 따른 용언을 선택하며 상기 선택된 체언과 용언의 조합에 따라 분석 정보를 결정한 후, 상기 체언 및 용언 사이에 소정 규칙에 따른 조사 및 어미를 삽입함으로써 상기 수치 데이터를 문장 데이터로 변환할 수 있게 된다.As described above, in the present invention, after extracting the statement from the numerical data, selecting the word according to the increase or decrease of the numerical data, determining the analysis information according to the combination of the selected word and the word, and then applying a predetermined rule between the word and the word. It is possible to convert the numerical data into sentence data by inserting the survey and the ending.

또한, 상기 분석 모듈(162)에서 수치 데이터를 문장 데이터로 변환한 후, 또는 상기 단계 S450과는 무관하게 누적 데이터 DB(125) 및 가공 데이터 DB(127)를 참조하여 상기 수치 데이터에 대한 표 및/또는 그래프를 생성한다(S460).Further, after converting the numerical data into sentence data in the analysis module 162, or referring to the cumulative data DB 125 and the processing data DB 127 irrespective of the step S450, / Or generates a graph (S460).

상기 단계 S450에서 생성된 문장 데이터 및 상기 단계 S460에서 생성된 표 및/또는 그래프를 결합하여 기사를 생성하고 통신망을 통하여 고객 단말기(400)에 제공한다(S470).The article data is generated by combining the sentence data generated in step S450 and the table and / or graph generated in step S460 and provided to the customer terminal 400 through a communication network (S470).

상기한 실시예에서는 주식 거래에 참고가 되는 금융감독원 공시, 전자공시 등을 예를 들어 설명하였으나, 본원발명은 상기한 공시자료 이외에도 부동산 시세, 날씨 정보, 생명보험협회 상품정보, 자산운용협회 펀드관련 정보 등에 대하여 적용하는 것도 당업자에 의해 가능하다.In the above embodiment, the Financial Supervisory Service disclosure, electronic disclosure, etc., which are referred to for stock trading, are described as examples. However, the present invention relates to real estate prices, weather information, life insurance association product information, and asset management association funds. Application to information and the like is also possible by those skilled in the art.

이상에서 상세히 설명한 바와 같이, 본 발명의 기사 자동 생성 방법 및 그 장치에 의하면, 기업공시와 관련된 뉴스 생성에 있어서 정보이용자의 이해를 돕는 풍부한 부가자료와 분석의견을 첨부하면서도 전 과정을 자동화하여 기존의 수동 편집방식보다 정확하고 월등히 빠른 실시간개념의 기사를 제공할 수 있다. As described in detail above, according to the method and apparatus for automatically generating articles of the present invention, in addition to abundant additional data and analytical opinions for the information user's understanding in generating news related to company disclosure, the entire process may be automated. You can provide articles with real-time concepts that are more accurate and faster than manual editing.

또한, 본 발명에서는 기반데이터, 과거누적데이터 및 가공데이터 등의 연동을 통해 분석의견 등을 알려주며 사용자가 찾아보아야 할 모든 데이터들을 정리하여 디스플레이함으로써 풍부하고 종합적인 의견 내지는 투자판단의 근거자료로 활용할 수 있는 분석 기사를 제공한다. In addition, the present invention informs the analysis opinion through the linkage of the base data, the historical cumulative data and the processed data, and displays all the data to be searched by the user so that they can be utilized as a basis for rich and comprehensive opinions or investment decisions. Provide an analysis article.

본 발명의 기사생성장치에서는 해당 공시 내에서는 모든 공시 정보에 대하여 모든 공시 정보를 기사로 변환하여 자의성을 배제하였고 장치에서 처리된 기사는 모든 클라이언트에게 동등하게 공개되어 정보의 비대칭성이 발생하지 않는다는 장 점이 있다.In the article generating apparatus of the present invention, all disclosure information is converted into articles for all disclosure information within the disclosure, and the arbitrary processing is excluded, and the article processed by the apparatus is disclosed to all clients equally so that information asymmetry does not occur. There is a point.

또한, 종래의 뉴스 생성 시스템은 로직에 해당하는 사건의 유무가 뉴스생성의 중요한 결정인자이자 내용이고, 전달할 내용이 로직에 해당하는 사건발생이므로 내용에서 객관성이 떨어지고 6하 원칙의 필수요소들이 빠질 가능성이 크지만 본 발명에서는 사건에 대한 부가 자료제공과 분석을 목적으로 하기 때문에 기사의 보도원칙에도 충실하며 풍부한 내용을 제공한다는 효과가 성취된다.In addition, in the conventional news generation system, the presence or absence of an event corresponding to logic is an important determinant and content of news generation, and the content to be delivered is an occurrence of an event corresponding to logic. In the present invention, however, the present invention is faithful to the reporting principle of the article and provides abundant contents because of the purpose of providing additional data and analyzing the incident.

지금까지 본 발명을 바람직한 실시예를 참조하여 상세히 설명하였지만, 본 발명이 상기한 실시예에 한정되는 것은 아니며, 이하의 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 또는 수정이 가능한 범위까지 본 발명의 기술적 사상이 미친다 할 것이다.Although the present invention has been described in detail with reference to the preferred embodiments, the present invention is not limited to the above-described embodiments, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the following claims. Anyone skilled in the art will have the technical idea of the present invention to the extent that various modifications or changes are possible.

Claims (10)

a) 통신망을 통해 연결된 정보 제공원으로부터 제공된 데이터를 검색하여 수집하고 분류하는 단계; a) retrieving, collecting and classifying data provided from information sources connected through a communication network; b) 상기 정보 제공원으로부터 제공된 데이터에 대한 메타 데이터를 생성하여 메타 데이터 DB에 저장하는 단계;b) generating metadata about the data provided from the information provider and storing the metadata in the metadata DB; c) 상기 정보 제공원으로부터 제공된 데이터의 내용을 파싱한 후, 누락 데이터가 존재하는지 여부를 판단하여 상기 메타 데이터의 해당 항목에 "누락"으로 기록하는 단계;c) parsing the contents of the data provided from the information provider, determining whether there is missing data and recording it as "missing" in the corresponding item of metadata; d) 상기 단계 c)의 판단 결과 누락 데이터가 존재하지 않는 경우, 상기 정보 제공원으로부터 제공된 데이터의 파싱 내용 중 누적할 가치가 있는 누적 데이터를 추출하여 누적 데이터 DB에 저장하는 단계;d) extracting and storing the cumulative data worth accumulating among the parsing contents of the data provided from the information provider if the missing data does not exist as a result of the determination of step c); e) 상기 누적 데이터를 기초로 기사생성에 사용되는 가공 데이터를 생성하는 단계; 및e) generating processing data used for article generation based on the accumulated data; And f) 상기 가공 데이터에 포함된 수치 데이터를 문장 데이터로 변환하여 기사를 생성하는 단계를 포함하는 것을 특징으로 하는 기사 자동 생성 방법.f) generating an article by converting the numerical data contained in the processed data into sentence data. 제 1 항에 있어서, 상기 단계 d)에서,The method of claim 1, wherein in step d) 상기 정보 제공원으로부터 제공된 데이터의 파싱 결과 상기 파싱 데이터가 누적하여 저장되는 경우 상기 메타 데이터의 누적 데이터 생성 여부 항목에 소정의 표시를 기록하는 것을 특징으로 하는 기사 자동 생성 방법.And when the parsing data is accumulated and stored as a result of parsing the data provided from the information provider, recording a predetermined mark on whether to generate the cumulative data of the metadata. 제 1 항에 있어서, 상기 단계 d)에서,The method of claim 1, wherein in step d) 상기 파싱 내용에 대하여 기재 오류 여부를 검사하고 기재에 오류가 없는 경 우 상기 단계 e)를 수행하는 것을 특징으로 하는 기사 자동 생성 방법.Checking whether there is an error in the description of the parsing content, and if there is no error in the description step e) characterized in that the automatic generation of articles. 제 1 항에 있어서, 상기 단계 e)에서,The method of claim 1, wherein in step e), 상기 누적 데이터가 분기 실적 데이터인 경우, 과거 분기 실적과 연동하여 가공 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 기사 자동 생성 방법.And when the cumulative data is quarterly performance data, generating processing data in association with past quarterly earnings. 제 4 항에 있어서, 상기 가공 데이터는,The method of claim 4, wherein the processing data, 주가 수익 비율, 영업 이익률, 및 자기 자본 이익률 중 적어도 하나를 포함하는 것을 특징으로 하는 기사 자동 생성 방법.And at least one of a stock price return ratio, an operating profit margin, and a return on equity. 제 1 항에 있어서, 상기 단계 f)는,The method of claim 1, wherein step f) 상기 수치 데이터에서 체언을 추출하고 상기 수치 데이터의 증감에 따른 용언을 선택하며 상기 선택된 체언과 용언의 조합에 따라 분석 정보를 결정하는 단계; 및Extracting a spoken word from the numerical data, selecting a spoken word according to the increase and decrease of the numerical data, and determining analysis information according to a combination of the selected spoken word and the spoken word; And 상기 체언 및 용언 사이에 미리 설정된 규칙에 따른 조사 및 어미를 삽입하여 문장을 완성하는 단계를 포함하는 것을 특징으로 하는 기사 자동 생성 방법.And inserting a search and a parent according to a predetermined rule between the spoken word and the used word to complete a sentence. 통신망에 연결된 적어도 하나의 공시 정보를 제공하는 정보 제공원으로부터 발생한 데이터를 주어진 색인어를 기준으로 검색하여 수집하고 분류하는 검색 및 분류 모듈;A search and classification module for searching, collecting, and classifying data generated from an information provider providing at least one disclosure information connected to a communication network based on a given index word; 상기 검색된 정보 제공원으로부터 발생한 데이터로부터 원하는 내용을 파싱하고 상기 파싱된 데이터의 유효성을 검사하는 파싱 및 유효성 검사 모듈; A parsing and validation module for parsing desired content from data generated from the retrieved information provider and validating the parsed data; 상기 유효성 검사가 이루어진 파싱된 데이터를 기초로 기사생성에 사용되는 가공 데이터를 생성하는 가공 모듈을 포함하는 데이터 가공부; 및A data processing unit including a processing module configured to generate processing data used for article generation based on the parsed data on which the validity check is performed; And 상기 데이터 가공부로부터 제공된 가공 데이터에 포함된 수치 데이터를 문장 데이터로 변환하여 기사를 생성하는 기사 생성부를 포함하는 것을 특징으로 하는 기사 자동 생성 장치.And an article generation unit for generating an article by converting numerical data included in the processing data provided from the data processing unit into sentence data. 제 7 항에 있어서, 상기 데이터 가공부는,The method of claim 7, wherein the data processing unit, 상기 파싱된 데이터 중 일부를 누적 저장하는 누적 데이터 DB 및 상기 가공 모듈에서 가공된 가공 데이터를 저장하는 가공 데이터 DB를 더 포함하는 것을 특징으로 하는 기사 자동 생성 장치.And an accumulating data DB for accumulating and storing some of the parsed data and a machining data DB for storing machining data processed by the machining module. 제 8 항에 있어서, 상기 기사 생성부는,The method of claim 8, wherein the article generating unit, 상기 누적 데이터 DB 및 상기 가공 데이터 DB의 데이터를 기초로 표 및 그래프 중 적어도 하나를 생성하는 도표화 모듈을 더 포함하는 것을 특징으로 하는 기사 자동 생성 장치.And a tabulation module for generating at least one of a table and a graph based on the data of the cumulative data DB and the processed data DB. 제 7 항 내지 제 9 항 중 어느 한 항에 있어서, 상기 기사 생성부는,The article generating unit according to any one of claims 7 to 9, 상기 수치 데이터에서 체언을 추출하고 상기 수치 데이터의 증감에 따른 용 언을 선택하며 상기 선택된 체언과 용언의 조합에 따라 분석 정보를 결정한 후, 상기 체언 및 용언 사이에 미리 설정된 규칙에 따른 조사 및 어미를 삽입함으로써 상기 수치 데이터를 문장 데이터로 변환하는 것을 특징으로 하는 기사 자동 생성 장치.After extracting the statement from the numerical data, selecting the term according to the increase and decrease of the numerical data, determining the analysis information according to the combination of the selected term and the term, and then searching and ending according to a preset rule between the term and the term. And automatically inserting the numerical data into sentence data by inserting the article.
KR1020060117823A 2006-11-27 2006-11-27 Article automatic generation method and device Active KR100853022B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060117823A KR100853022B1 (en) 2006-11-27 2006-11-27 Article automatic generation method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060117823A KR100853022B1 (en) 2006-11-27 2006-11-27 Article automatic generation method and device

Publications (2)

Publication Number Publication Date
KR20080047859A KR20080047859A (en) 2008-05-30
KR100853022B1 true KR100853022B1 (en) 2008-08-20

Family

ID=39664172

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060117823A Active KR100853022B1 (en) 2006-11-27 2006-11-27 Article automatic generation method and device

Country Status (1)

Country Link
KR (1) KR100853022B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101962407B1 (en) 2018-11-08 2019-03-26 한전케이디엔주식회사 System for Supporting Generation Electrical Approval Document using Artificial Intelligence and Method thereof
KR102613621B1 (en) 2023-08-24 2023-12-14 주식회사 더블유더블유디코리아 Method, device and system for generating articles for company promotion using generative artificial intelligence model

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102135712B1 (en) * 2017-12-29 2020-07-20 (주)엠로보 Apparatus and method for generating stock article
KR102020012B1 (en) * 2018-06-08 2019-09-11 (주)에이피케이어플킹 System method for writing sports article based on bigdata analysis
KR101973642B1 (en) * 2018-08-31 2019-09-02 서울대학교산학협력단 Method and interactive system for algorithm-driven text generation
KR102210149B1 (en) * 2019-01-31 2021-01-29 홍덕기 System and method for providing disclosure article

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060075798A (en) * 2004-12-29 2006-07-04 한국과학기술정보연구원 Record media storing overseas scientific and technical electronic text collection / index / extraction system and method and computer program for the method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060075798A (en) * 2004-12-29 2006-07-04 한국과학기술정보연구원 Record media storing overseas scientific and technical electronic text collection / index / extraction system and method and computer program for the method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101962407B1 (en) 2018-11-08 2019-03-26 한전케이디엔주식회사 System for Supporting Generation Electrical Approval Document using Artificial Intelligence and Method thereof
KR102613621B1 (en) 2023-08-24 2023-12-14 주식회사 더블유더블유디코리아 Method, device and system for generating articles for company promotion using generative artificial intelligence model
KR102644865B1 (en) 2023-08-24 2024-03-07 주식회사 더블유더블유디코리아 Method, device and system for providing artificial intelligence model service for generating articles for corporate promotion

Also Published As

Publication number Publication date
KR20080047859A (en) 2008-05-30

Similar Documents

Publication Publication Date Title
US10896392B2 (en) Methods and systems for generating supply chain representations
US7860872B2 (en) Automated media analysis and document management system
US11257161B2 (en) Methods and systems for predicting market behavior based on news and sentiment analysis
CN104137128B (en) Method and system for generating green scores using data and sentiment analysis
US7716228B2 (en) Content quality apparatus, systems, and methods
US7877678B2 (en) System and method for rendering of financial data
US20080228574A1 (en) System And Method For Conveying Content Changes Over A Network
MXPA03009815A (en) Dynamic generation of personalized presentations of domain-specific information content.
US8082208B2 (en) Compilation and analysis of company information
US20110251977A1 (en) Ad Hoc Document Parsing
CN104995650A (en) Method and system for generating a composite index using data from social media and sentiment analysis
KR100853022B1 (en) Article automatic generation method and device
JP7223549B2 (en) Information operation device and information operation method
US8126790B2 (en) System for cost-sensitive autonomous information retrieval and extraction
Gerdes Jr EDGAR-Analyzer: automating the analysis of corporate data contained in the SEC's EDGAR database
CN110337648B (en) System and method for efficiently distributing alert messages
KR101145818B1 (en) Method and apparutus for automatic contents generation
Alles et al. The case for an app-based financial reporting system
US20180357227A1 (en) System and method for analyzing popularity of one or more user defined topics among the big data
Moosa et al. The frequency and severity of operational losses: a cross-country comparison
KR101020138B1 (en) Automatic content generation method and device
CN115187122A (en) An enterprise policy deduction method, device, equipment and medium
JP7473718B2 (en) Article generation system, article generation device, article generation method, and computer program
KR20110012545A (en) Online Buzz Analysis System and Methods
US20070088679A1 (en) Method and apparatus for facilitating shareholder claims compensation

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

P22-X000 Classification modified

St.27 status event code: A-2-2-P10-P22-nap-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

FPAY Annual fee payment

Payment date: 20120810

Year of fee payment: 5

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

FPAY Annual fee payment

Payment date: 20130812

Year of fee payment: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

FPAY Annual fee payment

Payment date: 20150804

Year of fee payment: 8

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

FPAY Annual fee payment

Payment date: 20160811

Year of fee payment: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

FPAY Annual fee payment

Payment date: 20170808

Year of fee payment: 10

L13-X000 Limitation or reissue of ip right requested

St.27 status event code: A-2-3-L10-L13-lim-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 10

U15-X000 Partial renewal or maintenance fee paid modifying the ip right scope

St.27 status event code: A-4-4-U10-U15-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 11

FPAY Annual fee payment

Payment date: 20190813

Year of fee payment: 12

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 12

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 13

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 14

L13-X000 Limitation or reissue of ip right requested

St.27 status event code: A-2-3-L10-L13-lim-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 15

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 16

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 17

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 18