[go: up one dir, main page]

WO2020230309A1 - 業務文書提示装置、業務文書提示方法および業務文書提示プログラム - Google Patents

業務文書提示装置、業務文書提示方法および業務文書提示プログラム Download PDF

Info

Publication number
WO2020230309A1
WO2020230309A1 PCT/JP2019/019401 JP2019019401W WO2020230309A1 WO 2020230309 A1 WO2020230309 A1 WO 2020230309A1 JP 2019019401 W JP2019019401 W JP 2019019401W WO 2020230309 A1 WO2020230309 A1 WO 2020230309A1
Authority
WO
WIPO (PCT)
Prior art keywords
text information
business document
business
storage unit
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2019/019401
Other languages
English (en)
French (fr)
Inventor
有記 卜部
志朗 小笠原
友則 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to EP19929014.9A priority Critical patent/EP3955194B1/en
Priority to JP2021519219A priority patent/JP7338679B2/ja
Priority to PCT/JP2019/019401 priority patent/WO2020230309A1/ja
Priority to US17/610,889 priority patent/US11874881B2/en
Priority to CN201980096367.9A priority patent/CN113892120B/zh
Priority to ES19929014T priority patent/ES2984333T3/es
Publication of WO2020230309A1 publication Critical patent/WO2020230309A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Definitions

  • the present invention relates to a business document presentation device, a business document presentation method, and a business document presentation program.
  • Business documents are stored in various places such as shared servers and internal sites of companies, and as business documents, not only information on target businesses but also a lot of information on various topics is created. Therefore, it is difficult for the operator to find a business document that describes the matter being processed.
  • Non-Patent Document 1 a technique for entering a keyword to search for a highly relevant business document is disclosed so that the operator can easily find the business document (see Non-Patent Document 1).
  • the operator does not think or search for keywords, but compares all the words in the text information displayed on the screen during operation with the words in the business document, and extracts highly relevant business documents.
  • a technique has been proposed for presenting to the operator (see Non-Patent Document 2).
  • Non-Patent Document 3 discloses IDF (Inverse Document Frequency) that represents the characteristics of words in a document.
  • Non-Patent Document 4 discloses a DOM (Document Object Model) that models a Web page as an object.
  • Non-Patent Document 5 discloses MSAA (Microsoft Active Accessibility) that controls Web accessibility.
  • Non-Patent Document 6 discloses Office XML SDK.
  • Non-Patent Document 7 discloses UIA (UI Automation) that automates screen operations.
  • Non-Patent Document 8 discloses MeCab that divides Japanese text information into words.
  • Non-Patent Document 9 discloses an open source full-text search server Fess.
  • Non-Patent Document 10 discloses a topic model of a document classification technique.
  • the present invention has been made in view of the above, and an object of the present invention is to present a business document according to a variation of a handling case to a user.
  • the business document presentation device has a storage unit that stores text information displayed on the terminal screen during processing of a matter in the past, and displays on the terminal screen.
  • An extraction unit that compares the acquired text information with the text information in the storage unit with the acquisition unit that acquires the text information inside, and extracts the text information that differs depending on the matter as a keyword for searching the business document. It is characterized by having.
  • FIG. 1 is a diagram for explaining a processing outline of the business document presenting apparatus according to the present embodiment.
  • FIG. 2 is a schematic diagram illustrating a schematic configuration of the business document presentation device of the present embodiment.
  • FIG. 3 is a diagram illustrating the data structure of the information storage unit.
  • FIG. 4 is a diagram for explaining the processing of the extraction unit.
  • FIG. 5 is a diagram for explaining the processing of the extraction unit.
  • FIG. 6 is a flowchart showing a business document presentation processing procedure.
  • FIG. 7 is a diagram for explaining the effect of the business document presentation process.
  • FIG. 8 is a diagram for explaining the effect of the business document presentation process.
  • FIG. 9 is a diagram showing an example of a computer that executes a business document presentation program.
  • FIG. 1 is a diagram for explaining a processing outline of the business document presenting apparatus according to the present embodiment.
  • the business document presenting device extracts the text information displayed on the terminal screen during operation as target information and provides the information. Compare with the information in the storage section. In the information storage unit, text information displayed on the terminal screen during the operation of the business system in the past is stored. The business document presentation device extracts text information that differs depending on the case from the target information as a keyword. Then, the business document presenting device searches the business document using the extracted keywords, and presents the business document to the operator according to the variation of the handling matter being processed by the operator.
  • FIG. 1 illustrates a case where the operator signals that an unknown part has occurred while inputting on the service application reception screen in the business system A, for example.
  • the extracted target information includes text information that does not change depending on the project such as name, address, city, service, etc., and text information that differs depending on the project such as Denden, Taro, FLET'S Hikari, 2 years, discount, etc. It has been.
  • the information storage unit stores text information extracted from the displayed screen at appropriate timings such as periodical or screen transition timing during normal operation of the past business system A. ..
  • the business document presentation device identifies different text information depending on the case by comparing the target information with the text information of the information storage unit, and extracts it as a keyword for searching the business document. As a result, in the example shown in FIG. 1, the business document presentation device extracts the target information, Denden, Taro, FLET'S Hikari, 2 years, and discount, which differ depending on the project, as keywords.
  • the business document presentation device searches for a business document containing the extracted keyword using, for example, crawling technology, and presents the business document including Denden, Taro, FLET'S Hikari, 2 years, discount, etc. to the operator.
  • the operator can refer to the business document according to the variation of the handling case.
  • FIG. 2 is a schematic diagram illustrating a schematic configuration of the business document presentation device of the present embodiment.
  • the business document presentation device 10 of the present embodiment is realized by a general-purpose computer such as a personal computer, and includes an input unit 11, an output unit 12, a communication control unit 13, a storage unit 14, and a control unit 15. Be prepared.
  • the input unit 11 is realized by using an input device such as a keyboard or a mouse, and inputs various instruction information such as processing start to the control unit 15 in response to an input operation by the operator.
  • the output unit 12 is realized by a display device such as a liquid crystal display, a printing device such as a printer, or the like. For example, the output unit 12 displays the business document presented to the user, which is the result of the business document presentation process described later.
  • the communication control unit 13 is realized by a NIC (Network Interface Card) or the like, and controls communication between an external device and the control unit 15 via a telecommunication line such as a LAN (Local Area Network) or the Internet.
  • a telecommunication line such as a LAN (Local Area Network) or the Internet.
  • the communication control unit 13 controls communication between the control unit 15 and a shared server or the like that manages business documents such as in-house emails and various reports.
  • the storage unit 14 is realized by a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk.
  • the storage unit 14 stores in advance a processing program for operating the business document presentation device 10, data used during execution of the processing program, and the like, or temporarily stores each time the processing is performed.
  • the storage unit 14 may be configured to communicate with the control unit 15 via the communication control unit 13.
  • the storage unit 14 stores the text information displayed on the terminal screen during the processing of the matter in the past.
  • the storage unit 14 includes an information storage unit 14a.
  • FIG. 3 is a diagram illustrating the data structure of the information storage unit 14a.
  • each information of the information storage unit 14a includes an ID, a window being operated, and a text.
  • the ID is information that identifies each piece of information, and is issued each time it is stored in the information storage unit 14a.
  • the window being operated represents the window that was being operated when processing the past matter.
  • the text is text information displayed on the terminal screen, and is divided into words and stored in the information storage unit 14a, for example.
  • Pieces of information are, for example, periodically prior to the business document presentation process described later by the acquisition unit 15a described later, or at an appropriate timing such as a screen transition timing or a user issuing a search signal. It is acquired and stored in the information storage unit 14a.
  • the control unit 15 is realized by using a CPU (Central Processing Unit) or the like, and executes a processing program stored in a memory.
  • the control unit 15 functions as an acquisition unit 15a, an extraction unit 15b, and a search unit 15c, as illustrated in FIG.
  • these functional parts may be implemented in different hardware, respectively or in part.
  • the search unit 15c may be implemented in hardware different from the acquisition unit 15a and the extraction unit 15b.
  • the control unit 15 may include other functional units.
  • the acquisition unit 15a acquires the text information displayed on the terminal screen during the processing of the matter in the past, and stores it in the information storage unit 14a of the storage unit 14.
  • the acquisition unit 15a periodically, or at an appropriate timing such as the timing when the screen transitions or the timing when the user gives a search signal, the text information displayed on the terminal screen during the operation of the past business system A. To get.
  • the acquisition unit 15a acquires the text information displayed on the terminal screen. For example, at the timing when the operator signals that an unknown part has occurred during the operation of the business system via the GUI (Graphical User Interface), the acquisition unit 15a displays the text displayed on the terminal screen being operated by the operator. Get information.
  • GUI Graphic User Interface
  • the acquisition unit 15a acquires the text information displayed on the operation screen for all the active and inactive windows. For example, the acquisition unit 15a acquires text information at a timing when it detects an OS event or a change in the GUI state of UIA (see Non-Patent Document 7). In that case, the acquisition unit 15a uses techniques such as DOM (see Non-Patent Document 4), MSAA (see Non-Patent Document 5), Office XML SDK (see Non-Patent Document 6), and UIA (see Non-Patent Document 7). Apply to get the text information displayed on the operation screen. Further, the acquisition unit 15a applies a technique such as MeCab (see Non-Patent Document 8) to divide the acquired text information into words.
  • DOM see Non-Patent Document 4
  • MSAA see Non-Patent Document 5
  • Office XML SDK see Non-Patent Document 6
  • UIA see Non-Patent Document 7
  • the extraction unit 15b compares the acquired text information with the text information stored in the storage unit 14, and extracts text information that differs depending on the matter as a keyword for searching a business document.
  • the extraction unit 15b can be compared only with the text information acquired when operating the same window as the active window from which the text information is acquired, or can be compared with all the information stored in the storage unit 14. You can also.
  • FIGS. 4 and 5 are diagrams for explaining the processing of the extraction unit 15b.
  • the extraction unit 15b extracts text information that is not included in the text information stored in the information storage unit 14a of the storage unit 14 from the acquired text information as a keyword.
  • the acquired target information is compared with the information d 1 , d 2 , ... d N stored in the information storage unit 14a, and NTT, Yokosuka, which has never appeared in the past, Kanagawa and condominium discounts have been extracted.
  • the extraction unit 15b extracts the text information that is not included in the information storage unit 14a from the target information as text information that differs depending on the matter.
  • keywords that represent variations of the cases handled excluding words that represent the target business such as words that frequently appear on the terminal screen and words that do not change.
  • the extraction unit 15b extracts as a keyword text information whose frequency of appearing in the text information stored in the information storage unit 14a of the storage unit 14 is lower than a predetermined threshold value among the acquired text information.
  • the extraction unit 15b uses the IDF value, as shown in the following equation (1) to calculate the degree of low frequency of occurrence with respect to the information storage unit 14a of each word t i of the target information.
  • the IDF value represents the degree of low frequency of appearance of words, and the lower the frequency of appearance, the larger the value. Therefore, the extraction unit 15b extracts the word of the target information whose IDF value is larger than the predetermined value as a keyword.
  • the acquired target information is compared with the information d 1 , d 2 , ... d N stored in the information storage unit 14a, and NTT, Kanagawa, prefecture, Yokosuka, city, condominium, FLET'S Hikari, discounts have been extracted.
  • the extraction unit 15b extracts text information whose appearance frequency with respect to the information storage unit 14a is lower than a predetermined threshold value among the words of the target information as text information different depending on the case.
  • keywords that represent variations of the cases handled excluding words that represent the target business such as words that frequently appear on the terminal screen and words that do not change.
  • the extraction unit 15b weights the acquired text information as the frequency of appearance in the text information stored in the information storage unit 14a of the storage unit 14 decreases. It may be extracted as a keyword.
  • the extraction unit 15b according to IDF value of each word t i of the target information calculated by the above formula (1) may be weighted to each keyword.
  • the weight for "NTT" is 1, and the weight for "FLET'S Hikari" is 0.48.
  • the extraction unit 15b has a low frequency of text information that does not change depending on the case, such as "customer name” and "address” that always appear in the same window of the information storage unit 14a, as shown in italics in FIG. The degree is 0. As a result, the extraction unit 15b can exclude text information that does not change depending on the matter from the extraction keywords as a stop word.
  • the search unit 15c searches for a business document containing the extracted keyword and presents it to the user. For example, the search unit 15c searches for a business document containing the extracted keyword via the communication control unit 13 using the existing crawling technique. Further, the search unit 15c uses a keyword weighted by the IDF value, applies a technique such as Fess (see Non-Patent Document 9), and weights according to the weight given to the keyword by the extraction unit 15b. Search business documents with more emphasis on keywords with a larger value.
  • the search unit 15c presents the business document of the search result to the operator who is the user to the output unit 12 or to another device via the communication control unit 13.
  • the search unit 15c can present the business document according to the variation of the handled matter to the user.
  • the search unit 15c may classify the business document by using the appearance probability of the text information appearing in the business document. In that case, the search unit 15c identifies the classification of the business document using the text information common to the matter excluding the extracted keyword from the acquired text information, and from the business document in the specified classification, You may search the business document containing the extracted keyword.
  • the search unit 15c classifies the business document into topics based on the appearance probability of the words in the business document by using a document classification technique such as a topic model (see Non-Patent Document 10), and the words related to each topic. Is extracted. Further, the search unit 15c extracts a word representing the target business by removing the word representing the variation of the handling case extracted as the keyword from the word of the target information. Then, the search unit 15c compares the words related to the topic with the words representing the target business of the target information, and identifies the topic having many matching words as the topic of the target information.
  • a document classification technique such as a topic model (see Non-Patent Document 10)
  • the search unit 15c searches for business documents containing the extracted keywords from the business documents in the specified topic.
  • the business document presenting device 10 is limited to the target business and can present a more appropriate business document to the user.
  • FIG. 6 is a flowchart showing a business document presentation processing procedure.
  • the flowchart of FIG. 6 is started, for example, at the timing when the operator inputs an operation signal to signal the occurrence of an unknown portion.
  • the acquisition unit 15a acquires the text information displayed on the terminal screen being operated by the operator (step S1).
  • the extraction unit 15b compares the acquired text information with the text information stored in the storage unit 14, and extracts text information that differs depending on the matter as a keyword for searching a business document (step). S2).
  • the extraction unit 15b extracts text information that is not included in the text information stored in the information storage unit 14a of the storage unit 14 from the acquired text information as a keyword.
  • the extraction unit 15b uses keywords such as text information in which the frequency of appearance in the text information stored in the information storage unit 14a of the storage unit 14 is lower than a predetermined threshold value among the acquired text information. Extract as. In that case, the extraction unit 15b uses, among the acquired text information, the text information with a greater weight as the frequency of appearance in the text information stored in the information storage unit 14a of the storage unit 14 as a keyword. It may be extracted.
  • the search unit 15e searches for the business document containing the extracted keyword, and presents the business document of the search result to the operator who is the user (step S3).
  • the search unit 15c may classify the business document by topic using the appearance probability of the text information appearing in the business document. In that case, the search unit 15c identifies the topic using the text information common to the matter excluding the extracted keywords from the acquired text information, and extracts it from the business document in the specified topic. You may search for business documents that include keywords. As a result, a series of business document presentation processes is completed.
  • the storage unit 14 stores the text information displayed on the terminal screen during the processing of the matter in the past.
  • the acquisition unit 15a acquires the text information displayed on the terminal screen.
  • the extraction unit 15b compares the acquired text information with the text information stored in the storage unit 14, and extracts text information that differs depending on the matter as a keyword for searching a business document.
  • the business document presenting device 10 can extract keywords representing variations of the handling cases of the user. Therefore, the business document including the extracted keywords is searched, and the business documents corresponding to the variations of the handling cases are searched by the user. It becomes possible to present to.
  • FIGS. 7 and 8 are diagrams for explaining the effect of the business document presentation process.
  • FIG. 7 illustrates a case where an operator wants to refer to a business document such as an in-house email or a report in order to input a delivery date indicated by a shade on the input screen for project A while operating an infrastructure maintenance construction system. ing.
  • business documents containing frequently occurring words are extracted as highly relevant business documents. Therefore, for example, "customer name”, “address”, “contact information”, etc. shown in italics in FIG. 7 are used.
  • a business document, enclosed in dashed lines, containing universal textual information is presented to the operator. Since most of the business documents presented to the operator are business documents containing universal information that does not depend on the variation of the case, it is difficult for the operator to arrive at the business document that matches the variation of the case to be handled.
  • the business document including the information peculiar to the matter A "Hikari no Oka 2 in Yokosuka City, Kanagawa Prefecture” is given to the operator.
  • the business document including the information peculiar to the matter B "1 Kurokawahontori, Kita-ku, Nagoya-shi, Aichi". The document is presented to the operator.
  • the business document presentation device 10 preferentially extracts business documents that depend on the project by utilizing text information that differs depending on the project as an important keyword. Therefore, according to the business document presentation device 10, it is possible to present an appropriate business document according to the variation of the user's handling case to the user without the user having to think about a keyword or repeatedly searching. As a result, smooth operation of operation work becomes possible.
  • the business document presentation device 10 can be implemented by installing a business document presentation program that executes the above-mentioned business document presentation process as package software or online software on a desired computer.
  • the information processing device can function as the business document presentation device 10.
  • the information processing device referred to here includes a desktop type or notebook type personal computer.
  • the information processing device includes smartphones, mobile communication terminals such as mobile phones and PHS (Personal Handyphone System), and slate terminals such as PDA (Personal Digital Assistant).
  • the function of the business document presentation device 10 may be implemented in the cloud server.
  • FIG. 9 is a diagram showing an example of a computer that executes a business document presentation program.
  • the computer 1000 has, for example, a memory 1010, a CPU 1020, a hard disk drive interface 1030, a disk drive interface 1040, a serial port interface 1050, a video adapter 1060, and a network interface 1070. Each of these parts is connected by a bus 1080.
  • the memory 1010 includes a ROM (Read Only Memory) 1011 and a RAM 1012.
  • the ROM 1011 stores, for example, a boot program such as a BIOS (Basic Input Output System).
  • BIOS Basic Input Output System
  • the hard disk drive interface 1030 is connected to the hard disk drive 1031.
  • the disk drive interface 1040 is connected to the disk drive 1041.
  • a removable storage medium such as a magnetic disk or an optical disk is inserted into the disk drive 1041.
  • a mouse 1051 and a keyboard 1052 are connected to the serial port interface 1050.
  • a display 1061 is connected to the video adapter 1060.
  • the hard disk drive 1031 stores, for example, the OS 1091, the application program 1092, the program module 1093, and the program data 1094. Each piece of information described in the above embodiment is stored in, for example, the hard disk drive 1031 or the memory 1010.
  • the business document presentation program is stored in the hard disk drive 1031 as, for example, a program module 1093 in which a command executed by the computer 1000 is described.
  • the program module 1093 in which each process executed by the business document presenting apparatus 10 described in the above embodiment is described is stored in the hard disk drive 1031.
  • the data used for information processing by the business document presentation program is stored as program data 1094 in, for example, the hard disk drive 1031.
  • the CPU 1020 reads the program module 1093 and the program data 1094 stored in the hard disk drive 1031 into the RAM 1012 as needed, and executes each of the above-described procedures.
  • the program module 1093 and the program data 1094 related to the business document presentation program are not limited to the case where they are stored in the hard disk drive 1031. For example, they are stored in a removable storage medium and are stored by the CPU 1020 via the disk drive 1041 or the like. It may be read out. Alternatively, the program module 1093 and the program data 1094 related to the business document presentation program are stored in another computer connected via a network such as LAN or WAN (Wide Area Network), and are read by the CPU 1020 via the network interface 1070. It may be issued.
  • LAN Local Area Network

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

記憶部(14)が、過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する。取得部(15a)が、端末画面に表示中のテキスト情報を取得する。抽出部(15b)が、取得されたテキスト情報と記憶部(14)に記憶されているテキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する。

Description

業務文書提示装置、業務文書提示方法および業務文書提示プログラム
 本発明は、業務文書提示装置、業務文書提示方法および業務文書提示プログラムに関する。
 一般に、顧客の要望、設備、サービス等の様々な要因から、操作中のウィンドウへの投入内容や操作を行う企業のオペレータ業務において、オペレータがスムーズに運用できるよう、運用知識が業務文書として共有されている。
 業務文書は、共有サーバや企業の内部サイト等の様々なところに保管され、また業務文書として、対象業務に関する情報のみならず、様々なトピックに関する多数の情報が作成される。そのため、オペレータが処理中の案件に関して記載された業務文書を見つけることは困難である。
 そこで、オペレータが容易に業務文書を見つけられるように、キーワードを入力して関連性の高い業務文書を検索する技術が開示されている(非特許文献1参照)。また、オペレータがキーワードを考えたり検索したりせずに、操作中の画面に表示されているテキスト情報内の全ての単語と業務文書内の単語とを比較し、関連度の高い業務文書を抽出してオペレータに提示する技術が提案されている(非特許文献2参照)。
 なお、非特許文献3には、文書中の単語の特徴を表すIDF(Inverse Document Frequency)について開示されている。また、非特許文献4には、WebページをオブジェクトとしてモデリングするDOM(Document Object Model)について、開示されている。また、非特許文献5には、Webアクセシビリティを制御するMSAA(Microsoft Active Accessibility)について開示されている。また、非特許文献6には、Office XML SDKについて開示されている。また、非特許文献7には、画面操作を自動化するUIA(UI Automation)について開示されている。また、非特許文献8には、日本語のテキスト情報を単語に分割するMeCabについて開示されている。また、非特許文献9には、オープンソース全文検索サーバFessについて開示されている。また、非特許文献10には、文書分類技術のトピックモデルについて開示されている。
"QuickSolution"、[online]、住友電工情報システム、[2019年4月3日検索]、インターネット<URL:https://www.sei-info.co.jp/quicksolution/> 卜部有記、小笠原志朗、掘田健太郎、井上晃、"企業文書の内容に基づいたOpS操作画面に対する文書推薦方式の検討"、電子情報通信学会技術研究報告、2018年3月8日、信学技報 117 (491)、pp.25-30 K.Sparck Jones、"A Statistical Interpretation of Term Specificity and its Application in Retrieval"、Journal of Documentation、1972年、Vol.28、pp.11-21 "Document Object Model (DOM)"、[online]、2005年、W3C、[2019年4月3日検索]、インターネット<URL:https://www.w3.org/DOM/> "Microsoft Active Accessibility (MSAA)"、[online]、Microsoft Docs、[2019年4月3日検索]、インターネット<URL:https://docs.microsoft.com/en-us/windows/desktop/winauto/microsoft-active-accessibility> "Open XML SDK",[online]、GitHub、[2019年4月3日検索]、インターネット<URL:https://github.com/OfficeDev/Open-XML-SDK> "UI Automation"、[online]、Microsoft Docs、[2019年4月3日検索]、インターネット<URL:https://docs.microsoft.com/en-us/windows/desktop/winauto/entry-uiauto-win32> "MeCab: Yet Another Part-of-Speech and Morphological Analyzer", [online]、2013年、[2019年4月3日検索]、インターネット<URL:http://taku910.github.io/mecab/> "オープンソース全文検索サーバーFess"、[online]、[2019年4月3日検索]、インターネット<URL:https://fess.codelibs.org/ja/> D.M.Blei、A.Y.Ng、M.I.Jordan、"Latent Dirichlet Allocation"、The Journal of Machine Learning Research、2003年、Vol.3、pp.993-1022
 しかしながら、従来の技術では、操作画面中に表示されている単語のうち、出現頻度の高い単語を含む業務文書が関連度の高い文書として抽出される。この場合には、対象業務に関して、画面の「顧客名」「住所」等の不変の情報を含み、取扱案件のバリエーションによらない普遍的な情報が記載された、運用マニュアルや業務システムの操作マニュアル等の業務文書が中心に抽出される。そのため、普遍的な運用方法を習熟しているオペレータが対応中の業務での不明箇所を解消するために必要とするような、取扱案件のバリエーションに応じた業務文書を、オペレータすなわち業務システムのユーザが参照しやすく提示することは困難である。
 本発明は、上記に鑑みてなされたものであって、取扱案件のバリエーションに応じた業務文書をユーザに提示すること目的とする。
 上述した課題を解決し、目的を達成するために、本発明に係る業務文書提示装置は、過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する記憶部と、端末画面に表示中のテキスト情報を取得する取得部と、取得された前記テキスト情報と記憶部の前記テキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する抽出部と、を備えることを特徴とする。
 本発明によれば、取扱案件のバリエーションに応じた業務文書をユーザに提示することができる。
図1は、本実施形態に係る業務文書提示装置の処理概要を説明するための図である。 図2は、本実施形態の業務文書提示装置の概略構成を例示する模式図である。 図3は、情報蓄積部のデータ構成を例示する図である。 図4は、抽出部の処理を説明するための図である。 図5は、抽出部の処理を説明するための図である。 図6は、業務文書提示処理手順を示すフローチャートである。 図7は、業務文書提示処理の効果を説明するための図である。 図8は、業務文書提示処理の効果を説明するための図である。 図9は、業務文書提示プログラムを実行するコンピュータの一例を示す図である。
 以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
[業務文書提示装置の処理概要]
 図1は、本実施形態に係る業務文書提示装置の処理概要を説明するための図である。例えば、オペレータが、業務システムを操作中に、不明箇所が発生したことを合図した場合に、業務文書提示装置は、操作中の端末画面に表示されているテキスト情報をターゲット情報として抽出し、情報蓄積部の情報と比較する。情報蓄積部には、過去に業務システムの操作中に端末画面に表示されたテキスト情報が蓄積されている。業務文書提示装置は、ターゲット情報のうち、案件に応じて異なるテキスト情報を、キーワードとして抽出する。そして、業務文書提示装置は、抽出したキーワードを用いて業務文書を検索することにより、オペレータが処理中である取扱案件のバリエーションに応じた業務文書をオペレータに提示する。
 図1には、オペレータが、業務システムAで、例えばサービス申込受付画面に入力中に不明箇所が発生したことを合図した場合が例示されている。この場合に、抽出されたターゲット情報には、氏名、住所、市、サービス等の案件によって不変のテキスト情報と、電電、太郎、フレッツ光、2年、割引等の案件によって異なるテキスト情報とが含まれている。また、情報蓄積部には、過去の業務システムAの通常の操作中に、定期的あるいは画面が遷移したタイミング等の適宜なタイミングで、表示された画面から抽出されたテキスト情報が蓄積されている。
 業務文書提示装置は、ターゲット情報と情報蓄積部のテキスト情報とを比較することにより、案件によって異なるテキスト情報を特定し、業務文書を検索するためのキーワードとして抽出する。これにより、図1に示す例では、業務文書提示装置は、ターゲット情報のうち、案件によって異なる電電、太郎、フレッツ光、2年、割引を、キーワードとして抽出している。
 そして、業務文書提示装置は、例えばクローリングの技術を用いて、抽出したキーワードを含む業務文書を検索し、電電、太郎、フレッツ光、2年、割引等を含む業務文書をオペレータに提示する。これにより、オペレータは、取扱案件のバリエーションに応じた業務文書を参照することが可能となる。
[業務文書提示装置の構成]
 図2は、本実施形態の業務文書提示装置の概略構成を例示する模式図である。図2に例示するように、本実施形態の業務文書提示装置10は、パソコン等の汎用コンピュータで実現され、入力部11、出力部12、通信制御部13、記憶部14、および制御部15を備える。
 入力部11は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部15に対して処理開始などの各種指示情報を入力する。出力部12は、液晶ディスプレイなどの表示装置、プリンター等の印刷装置等によって実現される。例えば、出力部12には、後述する業務文書提示処理の結果である、ユーザに提示される業務文書が表示される。
 通信制御部13は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネットなどの電気通信回線を介した外部の装置と制御部15との通信を制御する。例えば、通信制御部13は、社内メールや各種の報告書等の業務文書を管理する共有サーバ等と制御部15との通信を制御する。
 記憶部14は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14には、業務文書提示装置10を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータなどが予め記憶され、あるいは処理の都度一時的に記憶される。なお、記憶部14は、通信制御部13を介して制御部15と通信する構成でもよい。
 本実施形態において、記憶部14は、過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する。具体的には、記憶部14は、情報蓄積部14aを含む。ここで、図3は、情報蓄積部14aのデータ構成を例示する図である。図3に示すように、情報蓄積部14aの各情報は、ID、操作中のウィンドウ、テキストを含む。IDは、各情報を識別する情報であり、情報蓄積部14aに蓄積される度に発行される。操作中のウィンドウは、過去の案件の処理時に操作中であったウィンドウを表す。テキストは、端末画面に表示されたテキスト情報であり、例えば、単語ごとに分割されて情報蓄積部14aに蓄積される。
 これらの情報は、例えば、後述する取得部15aが、後述する業務文書提示処理に先立って、定期的に、あるいは画面が遷移したタイミング、ユーザが検索の合図を出したタイミング等の適宜なタイミングで取得して、情報蓄積部14aに蓄積する。
 図3には、例えば、ID=1の情報は、業務システムAの操作中に、前述したタイミングで取得されたことが示されている。テキスト情報には、例えば、氏名、AA株式会社、住所等が含まれていることが示されている。
 図2の説明に戻る。制御部15は、CPU(Central Processing Unit)等を用いて実現され、メモリに記憶された処理プログラムを実行する。これにより、制御部15は、図2に例示するように、取得部15a、抽出部15bおよび検索部15cとして機能する。なお、これらの機能部は、それぞれ、あるいは一部が異なるハードウェアに実装されてもよい。例えば、検索部15cは、取得部15aおよび抽出部15bとは異なるハードウェアに実装されてもよい。また、制御部15は、その他の機能部を備えてもよい。
 取得部15aは、過去に案件の処理中に端末画面に表示されたテキスト情報を取得して、記憶部14の情報蓄積部14aに記憶させる。取得部15aは、過去の業務システムAの操作中に、定期的に、あるいは画面が遷移したタイミング、ユーザが検索の合図を出したタイミング等の適宜なタイミングで、端末画面に表示されたテキスト情報を取得する。
 また、取得部15aは、端末画面に表示中のテキスト情報を取得する。例えば、オペレータが、業務システムの操作中に不明箇所が発生したことをGUI(Graphical User Interface)を介して合図したタイミングに、取得部15aは、オペレータが操作中の端末画面に表示されているテキスト情報を取得する。
 なお、取得部15aは、アクティブ、非アクティブのウィンドウの全てのウィンドウを対象に、操作画面に表示されているテキスト情報を取得する。例えば、取得部15aは、OSイベントやUIA(非特許文献7参照)のGUIの状態が変更されたことを検知したタイミング等に、テキスト情報を取得する。その場合に、取得部15aは、DOM(非特許文献4参照)、MSAA(非特許文献5参照)、Office XML SDK(非特許文献6参照)、UIA(非特許文献7参照)等の技術を適用して、操作画面に表示されているテキスト情報を取得する。また、取得部15aは、例えばMeCab(非特許文献8参照)等の技術を適用して、取得したテキスト情報を単語ごとに分割する。
 抽出部15bは、取得されたテキスト情報と記憶部14に記憶されているテキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する。抽出部15bは、テキスト情報の取得先であるアクティブのウィンドウと同一のウィンドウの操作時に取得されたテキスト情報のみと比較することもできるし、記憶部14に記憶されたすべての情報と比較することもできる。ここで、図4および図5は、抽出部15bの処理を説明するための図である。
 例えば、抽出部15bは、取得されたテキスト情報のうち、記憶部14の情報蓄積部14aに記憶されているテキスト情報に含まれないテキスト情報を、キーワードとして抽出する。図4に示す例では、取得されたターゲット情報と、情報蓄積部14aに蓄積された情報d、d、…dとを比較して、過去に一度も出現していないNTT、横須賀、神奈川、マンション割引が抽出されている。
 このように、抽出部15bは、ターゲット情報のうち、情報蓄積部14aに含まれないテキスト情報を、案件によって異なるテキスト情報として抽出する。これにより、端末画面に頻出する単語や不変の単語等の対象業務を表す単語を除いて、取扱案件のバリエーションを表すキーワードを抽出することが可能となる。
 あるいは、抽出部15bは、取得されたテキスト情報のうち、記憶部14の情報蓄積部14aに記憶されているテキスト情報に出現する頻度が所定の閾値より低いテキスト情報を、キーワードとして抽出する。
 例えば、抽出部15bは、IDF値を用いて、次式(1)に示すように、ターゲット情報の各単語tの情報蓄積部14aに対する出現頻度の低さの度合いを算出する。ここで、IDF値は、単語の出現頻度の低さの度合いを表し、出現頻度が低いほど大きい値となる。したがって、抽出部15bは、IDF値が所定の値より大きいターゲット情報の単語を、キーワードとして抽出する。
Figure JPOXMLDOC01-appb-M000001
 図5に示す例では、取得されたターゲット情報と、情報蓄積部14aに蓄積された情報d、d、…dとを比較して、NTT、神奈川、県、横須賀、市、マンション、フレッツ光、割引が抽出されている。このように、抽出部15bは、ターゲット情報の各単語のうち、情報蓄積部14aに対する出現頻度が所定の閾値より低いテキスト情報を、案件によって異なるテキスト情報として抽出する。これにより、端末画面に頻出する単語や不変の単語等の対象業務を表す単語を除いて、取扱案件のバリエーションを表すキーワードを抽出することが可能となる。
 また、この場合に、抽出部15bは、取得されたテキスト情報のうち、記憶部14の情報蓄積部14aに記憶されているテキスト情報に出現する頻度が低いほど大きい重みを付けたテキスト情報を、キーワードとして抽出してもよい。例えば、抽出部15bは、上記式(1)で算出されたターゲット情報の各単語tのIDF値に応じて、各キーワードに重み付けをしてもよい。図5に示す例では、例えば、「NTT」に対する重みは1とされ、「フレッツ光」に対する重みは0.48とされている。これにより、より適切に、取扱案件のバリエーションを表すキーワードが抽出される。
 また、抽出部15bは、図5に斜体字で示すような、情報蓄積部14aの同一のウィンドウに必ず出現する「顧客名」「住所」等の、案件により不変のテキスト情報について、低頻出の度合いを0とする。これにより、抽出部15bは、案件により不変のテキスト情報をストップワードとして抽出キーワードから除外することができる。
 図2の説明に戻る。検索部15cは、抽出されたキーワードが含まれる業務文書を検索し、ユーザに提示する。例えば、検索部15cは、既存のクローリング技術を用いて、通信制御部13を介して、抽出されたキーワードが含まれる業務文書を検索する。また、検索部15cは、IDF値で重み付けされたキーワードを用いて、例えば、Fess(非特許文献9参照)等の技術を適用して、抽出部15bによってキーワードに付与された重みに応じ、重みが大きいキーワードほど重視して、業務文書を検索する。
 そして、検索部15cは、出力部12に、あるいは通信制御部13を介して他の装置に、検索結果の業務文書をユーザであるオペレータに提示する。これにより、検索部15cは、取扱案件のバリエーションに応じた業務文書をユーザに提示することが可能となる。
 また、検索部15cは、業務文書に出現するテキスト情報の出現確率を用いて該業務文書を分類してもよい。その場合に、検索部15cは、取得されたテキスト情報のうち、抽出されたキーワードを除いた案件に共通するテキスト情報を用いて業務文書の分類を特定し、特定した分類内の業務文書から、抽出されたキーワードを含む業務文書を検索してもよい。
 例えば、検索部15cは、トピックモデル(非特許文献10参照)等の文書分類技術を用いて、業務文書の単語の出現確率に基づいて業務文書をトピックごとに分類し、各トピックに関連する単語を抽出する。また、検索部15cは、ターゲット情報の単語から、キーワードとして抽出された取扱案件のバリエーションを表す単語を除くことにより、対象業務を表す単語を抽出する。そして、検索部15cは、トピックに関連する単語とターゲット情報の対象業務を表す単語とを比較して、一致する単語が多いトピックをターゲット情報のトピックとして特定する。
 また、検索部15cは、特定したトピック内の業務文書から、抽出されたキーワードを含む業務文書を検索する。これにより、業務文書提示装置10は、対象業務に限定し、より適切な業務文書をユーザに提示することが可能となる。
[業務文書提示処理]
 次に、図6を参照して、本実施形態に係る業務文書提示装置10による業務文書提示処理について説明する。図6は、業務文書提示処理手順を示すフローチャートである。図6のフローチャートは、例えば、オペレータが不明箇所の発生を合図する操作入力を行ったタイミングで開始される。
 まず、取得部15aが、オペレータが操作中の端末画面に表示されているテキスト情報を取得する(ステップS1)。
 次に、抽出部15bが、取得されたテキスト情報と記憶部14に記憶されているテキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する(ステップS2)。
 例えば、抽出部15bは、取得されたテキスト情報のうち、記憶部14の情報蓄積部14aに記憶されているテキスト情報に含まれないテキスト情報を、キーワードとして抽出する。
 あるいは、抽出部15bは、抽出部15bは、取得されたテキスト情報のうち、記憶部14の情報蓄積部14aに記憶されているテキスト情報に出現する頻度が所定の閾値より低いテキスト情報を、キーワードとして抽出する。その場合に、抽出部15bは、取得されたテキスト情報のうち、記憶部14の情報蓄積部14aに記憶されているテキスト情報に出現する頻度が低いほど大きい重みを付けたテキスト情報を、キーワードとして抽出してもよい。
 そして、検索部15eが、抽出されたキーワードが含まれる業務文書を検索し、検索結果の業務文書をユーザであるオペレータに提示する(ステップS3)。
 検索部15cは、業務文書に出現するテキスト情報の出現確率を用いて該業務文書をトピックごとに分類してもよい。その場合に、検索部15cは、取得されたテキスト情報のうち、抽出されたキーワードを除いた案件に共通するテキスト情報を用いてトピックを特定し、特定したトピック内の業務文書から、抽出されたキーワードを含む業務文書を検索してもよい。これにより、一連の業務文書提示処理が終了する。
 以上、説明したように、本実施形態の業務文書提示装置10において、記憶部14が、過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する。また、取得部15aが、端末画面に表示中のテキスト情報を取得する。また、抽出部15bが、取得されたテキスト情報と記憶部14に記憶されているテキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する。
 これにより、業務文書提示装置10は、ユーザの取扱案件のバリエーションを表すキーワードを抽出することができるので、抽出されたキーワードを含む業務文書を検索し、取扱案件のバリエーションに応じた業務文書をユーザに提示することが可能となる。
 ここで、図7および図8は、業務文書提示処理の効果を説明するための図である。図7には、オペレータが、インフラ整備の工事システムを操作中に、案件Aに関する入力画面において網掛で示す納期を入力するために、社内メールや報告書等の業務文書を参照したい場合が例示されている。
 従来の情報では、出現頻度の高い単語を含む業務文書を関連度の高い業務文書として抽出するため、例えば、図7に斜体字で示す「顧客名」、「住所」、「連絡先」等の普遍的なテキスト情報を含む、破線で囲んで示す業務文書がオペレータに提示される。オペレータに提示される業務文書の多くが案件のバリエーションによらない普遍的な情報を含む業務文書であるため、オペレータが取扱案件のバリエーションに適合した業務文書に辿りつくことが困難である。
 これに対し、本発明によれば、「AA株式会社」、「神奈川県横須賀市光の丘2」等のように、案件によって異なる情報を多く含む業務文書がオペレータに提示される。
 特に、図8に例示するように、各地域の業務文書を参照して、インフラ整備の工事の納期を入力したい場合に、各地域の道路工事や水道工事等の予定日時を通知する業務文書が提示される。
 例えば、オペレータが案件Aに関する入力画面において網掛で示す納期を入力するために業務文書を参照したい場合には、案件Aに特有な情報「神奈川県横須賀市光の丘2」が含まれる業務文書がオペレータに提示される。また、オペレータが案件Bに関する入力画面において網掛で示す納期を入力するために業務文書を参照したい場合には、案件Bに特有な情報「愛知県名古屋市北区黒川本通1」が含まれる業務文書がオペレータに提示される。
 これにより、オペレータは、各地域の道路工事や水道工事等の予定日時を通知する業務文書を参照して、インフラ整備の工事の納期を入力することができる。このように、業務文書提示処理によれば、地域によって異なる業務文書が参照されるべきである場合にも、適切な業務文書がオペレータに提示される。
 このように、業務文書提示装置10は、案件によって異なるテキスト情報を重要なキーワードとして活用することにより、案件に依存する業務文書が優先的に抽出される。したがって、業務文書提示装置10によれば、ユーザがキーワードを考えたり繰り返し検索したりせずに、ユーザの取扱案件のバリエーションに応じた適切な業務文書をユーザに提示することが可能となる。その結果、オペレーション業務のスムーズな運用が可能となる。
[プログラム]
 上記実施形態に係る業務文書提示装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。一実施形態として、業務文書提示装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の業務文書提示処理を実行する業務文書提示プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の業務文書提示プログラムを情報処理装置に実行させることにより、情報処理装置を業務文書提示装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistant)などのスレート端末などがその範疇に含まれる。また、業務文書提示装置10の機能を、クラウドサーバに実装してもよい。
 図9は、業務文書提示プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
 メモリ1010は、ROM(Read Only Memory)1011およびRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1041に接続される。ディスクドライブ1041には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1051およびキーボード1052が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1061が接続される。
 ここで、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。上記実施形態で説明した各情報は、例えばハードディスクドライブ1031やメモリ1010に記憶される。
 また、業務文書提示プログラムは、例えば、コンピュータ1000によって実行される指令が記述されたプログラムモジュール1093として、ハードディスクドライブ1031に記憶される。具体的には、上記実施形態で説明した業務文書提示装置10が実行する各処理が記述されたプログラムモジュール1093が、ハードディスクドライブ1031に記憶される。
 また、業務文書提示プログラムによる情報処理に用いられるデータは、プログラムデータ1094として、例えば、ハードディスクドライブ1031に記憶される。そして、CPU1020が、ハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した各手順を実行する。
 なお、業務文書提示プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1041等を介してCPU1020によって読み出されてもよい。あるいは、業務文書提示プログラムに係るプログラムモジュール1093やプログラムデータ1094は、LANやWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
 以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施形態による本発明の開示の一部をなす記述および図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例および運用技術等は全て本発明の範疇に含まれる。
 10 業務文書提示装置
 11 入力部
 12 出力部
 13 通信制御部
 14 記憶部
 14a 情報蓄積部
 15 制御部
 15a 取得部
 15b 抽出部
 15c 検索部

Claims (7)

  1.  過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する記憶部と、
     端末画面に表示中のテキスト情報を取得する取得部と、
     取得された前記テキスト情報と前記記憶部に記憶されている前記テキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する抽出部と、
     を備えることを特徴とする業務文書提示装置。
  2.  前記抽出部は、取得された前記テキスト情報のうち、前記記憶部に記憶されている前記テキスト情報に含まれないテキスト情報を、前記キーワードとして抽出することを特徴とする請求項1に記載の業務文書提示装置。
  3.  前記抽出部は、取得された前記テキスト情報のうち、前記記憶部に記憶されている前記テキスト情報に出現する頻度が所定の閾値より低いテキスト情報を、前記キーワードとして抽出することを特徴とする請求項1に記載の業務文書提示装置。
  4.  前記抽出部は、取得された前記テキスト情報のうち、前記記憶部に記憶されている前記テキスト情報に出現する頻度が低いほど大きい重みを付けたテキスト情報を、前記キーワードとして抽出することを特徴とする請求項3に記載の業務文書提示装置。
  5.  業務文書に出現するテキスト情報の出現確率を用いて該業務文書を分類し、取得された前記テキスト情報のうち、抽出された前記キーワードを除いた案件に共通するテキスト情報を用いて該業務文書の分類を特定し、特定した該分類内の業務文書から、抽出された前記キーワードを含む業務文書を検索する検索部をさらに備えることを特徴とする請求項1に記載の業務文書提示装置。
  6.  業務文書提示装置で実行される業務文書提示方法であって、
     前記業務文書提示装置は、過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する記憶部を備え、
     端末画面に表示中のテキスト情報を取得する取得工程と、
     取得された前記テキスト情報と前記記憶部に記憶されている前記テキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する抽出工程と、
     を含んだことを特徴とする業務文書提示方法。
  7.  端末画面に表示中のテキスト情報を取得する取得ステップと、
     過去に案件の処理中に端末画面に表示されたテキスト情報を記憶する記憶部を参照し、取得された前記テキスト情報と前記記憶部に記憶されている前記テキスト情報とを比較して、案件によって異なるテキスト情報を、業務文書を検索するためのキーワードとして抽出する抽出
    する判定ステップと、
     をコンピュータに実行させるための業務文書提示プログラム。
PCT/JP2019/019401 2019-05-15 2019-05-15 業務文書提示装置、業務文書提示方法および業務文書提示プログラム Ceased WO2020230309A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
EP19929014.9A EP3955194B1 (en) 2019-05-15 2019-05-15 Business document presenting device, business document presenting method, and business document presenting program
JP2021519219A JP7338679B2 (ja) 2019-05-15 2019-05-15 業務文書提示装置、業務文書提示方法および業務文書提示プログラム
PCT/JP2019/019401 WO2020230309A1 (ja) 2019-05-15 2019-05-15 業務文書提示装置、業務文書提示方法および業務文書提示プログラム
US17/610,889 US11874881B2 (en) 2019-05-15 2019-05-15 Business documents presentation device, business documents presentation method and business documents presentation program
CN201980096367.9A CN113892120B (zh) 2019-05-15 2019-05-15 业务文档提示装置、业务文档提示方法和记录介质
ES19929014T ES2984333T3 (es) 2019-05-15 2019-05-15 Dispositivo de presentación de documentos comerciales, método de presentación de documentos comerciales y programa de presentación de documentos comerciales

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/019401 WO2020230309A1 (ja) 2019-05-15 2019-05-15 業務文書提示装置、業務文書提示方法および業務文書提示プログラム

Publications (1)

Publication Number Publication Date
WO2020230309A1 true WO2020230309A1 (ja) 2020-11-19

Family

ID=73289842

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/019401 Ceased WO2020230309A1 (ja) 2019-05-15 2019-05-15 業務文書提示装置、業務文書提示方法および業務文書提示プログラム

Country Status (6)

Country Link
US (1) US11874881B2 (ja)
EP (1) EP3955194B1 (ja)
JP (1) JP7338679B2 (ja)
CN (1) CN113892120B (ja)
ES (1) ES2984333T3 (ja)
WO (1) WO2020230309A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561912A (ja) * 1991-09-02 1993-03-12 Toshiba Corp 情報フアイリング装置
JP2000148787A (ja) * 1998-11-18 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 分散型文書検索装置
JP2009541893A (ja) * 2006-06-30 2009-11-26 エヌエイチエヌ コーポレーション オンライン電子メールサービスシステム及びその方法
US20110307245A1 (en) * 2010-06-14 2011-12-15 Xerox Corporation Word alignment method and system for improved vocabulary coverage in statistical machine translation
US20140283097A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Anonymizing Sensitive Identifying Information Based on Relational Context Across a Group

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003242176A (ja) * 2001-12-13 2003-08-29 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
CN100419753C (zh) * 2005-12-19 2008-09-17 株式会社理光 数字化数据集中按照分类信息搜索目标文档的方法和装置
JP5022319B2 (ja) 2008-08-04 2012-09-12 日本電信電話株式会社 テキストマイニング装置、方法、プログラム及びその記録媒体
US8316030B2 (en) * 2010-11-05 2012-11-20 Nextgen Datacom, Inc. Method and system for document classification or search using discrete words
JP5624970B2 (ja) * 2011-10-31 2014-11-12 京セラドキュメントソリューションズ株式会社 画像読取装置、画像形成装置、画像処理方法
CN103020164B (zh) * 2012-11-26 2015-06-10 华北电力大学 一种基于多语义分析和个性化排序的语义检索方法
CN103020213B (zh) * 2012-12-07 2015-07-22 福建亿榕信息技术有限公司 具有明显类别划分的非结构化电子文档的检索方法和系统
WO2016103451A1 (ja) * 2014-12-26 2016-06-30 株式会社日立製作所 関連情報取得方法及び装置並びに記憶媒体
CN106570075A (zh) * 2016-10-11 2017-04-19 深圳大学 一种计算机文本检索分类特征选择方法
US20180150555A1 (en) * 2016-11-28 2018-05-31 Wipro Limited Method and system for providing resolution to tickets in an incident management system
CN108920454A (zh) * 2018-06-13 2018-11-30 北京信息科技大学 一种主题短语抽取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561912A (ja) * 1991-09-02 1993-03-12 Toshiba Corp 情報フアイリング装置
JP2000148787A (ja) * 1998-11-18 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 分散型文書検索装置
JP2009541893A (ja) * 2006-06-30 2009-11-26 エヌエイチエヌ コーポレーション オンライン電子メールサービスシステム及びその方法
US20110307245A1 (en) * 2010-06-14 2011-12-15 Xerox Corporation Word alignment method and system for improved vocabulary coverage in statistical machine translation
US20140283097A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Anonymizing Sensitive Identifying Information Based on Relational Context Across a Group

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
"Microsoft Active Accessibility (MSAA", MICROSOFT DOCS, 3 April 2019 (2019-04-03), Retrieved from the Internet <URL:https://docs.microsoft.com/en-us/windows/desktop/winauto/microsoft-active-accessibility>>
"Open XML SDK", GITHUB, 3 April 2019 (2019-04-03), Retrieved from the Internet <URL:https://github.com/OfficeDev/Open-XML-SDK>>
"UI Automation", MICROSOFT DOCS, 3 April 2019 (2019-04-03), Retrieved from the Internet <URL:https://docs.microsoft.com/en-us/windows/desktop/winauto/entry-uiauto-win32>>
D.M.BLEIA.Y.NGM.I.JORDAN: "Latent Dirichlet Allocation", THE JOURNAL OF MACHINE LEARNING RESEARCH, vol. 3, 2003, pages 993 - 1022
DOCUMENT OBJECT MODEL (DOM, 2005, Retrieved from the Internet <URL:https://www.w3.org/DOM>
K. SPARCK JONES: "A Statistical Interpretation of Term Specificity and its Application in Retrieval", JOURNAL OF DOCUMENTATION, vol. 28, 1972, pages 11 - 21
MECAB: YET ANOTHER PART-OF-SPEECH AND MORPHOLOGICAL ANALYZER, 2013, Retrieved from the Internet <URL:http://taku910.github.io/mecab/>>
OPEN-SOURCE FULL-TEXT SEARCH SERVER FESS, 3 April 2019 (2019-04-03), Retrieved from the Internet <URL:https://fess.codelibs.org/ja/>>
URABE YUKIOGASAWARA SHIROHOTTA KENTAROINOUE AKIRA: "IEICE technical report", vol. 117, 8 March 2018, article "Document Recommendation Method based on the Content of Enterprise Documents for OSS Screen", pages: 25 - 30

Also Published As

Publication number Publication date
US20220207091A1 (en) 2022-06-30
CN113892120B (zh) 2025-09-16
CN113892120A (zh) 2022-01-04
JPWO2020230309A1 (ja) 2020-11-19
EP3955194B1 (en) 2024-04-17
EP3955194A4 (en) 2022-11-30
US11874881B2 (en) 2024-01-16
ES2984333T3 (es) 2024-10-29
EP3955194A1 (en) 2022-02-16
JP7338679B2 (ja) 2023-09-05

Similar Documents

Publication Publication Date Title
RU2573209C2 (ru) Автоматический поиск контекстно-связанных элементов задачи
US11954173B2 (en) Data processing method, electronic device and computer program product
CN104102639B (zh) 基于文本分类的推广触发方法和装置
US20210256221A1 (en) System and method for automatic summarization of content with event based analysis
US11900046B2 (en) Intelligent feature identification and presentation
US11281737B2 (en) Unbiasing search results
EP3683695A1 (en) Synonym dictionary creation device, synonym dictionary creation program, and synonym dictionary creation method
CN113641933B (zh) 异常网页识别方法、异常站点识别方法及装置
US11526575B2 (en) Web browser with enhanced history classification
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
US11416907B2 (en) Unbiased search and user feedback analytics
CN114722137A (zh) 基于敏感数据识别的安全策略配置方法、装置及电子设备
Li et al. Mining user reviews for mobile app comparisons
US20130246520A1 (en) Recognizing Social Media Posts, Comments, or other Texts as Business Recommendations or Referrals
CN114595686B (zh) 知识抽取方法、知识抽取模型的训练方法及装置
CN116150497A (zh) 文本信息推荐方法、装置、电子设备及存储介质
US8370346B2 (en) Micro-browser viewers and searching
US11657228B2 (en) Recording and analyzing user interactions for collaboration and consumption
NL2025417B1 (en) Intelligent Content Identification and Transformation
US20210373728A1 (en) Machine learning-assisted graphical user interface for content organization
Lotan et al. Issues and challenges faced by mobile application users and developers
WO2019151502A1 (ja) 提示装置、提示方法および提示プログラム
JP7338679B2 (ja) 業務文書提示装置、業務文書提示方法および業務文書提示プログラム
US10878005B2 (en) Context aware document advising
CN105408896A (zh) 信息管理装置和信息管理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19929014

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021519219

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019929014

Country of ref document: EP

Effective date: 20211112

WWG Wipo information: grant in national office

Ref document number: 201980096367.9

Country of ref document: CN