[go: up one dir, main page]

KR101771524B1 - Method for extracting price information from a receipt and method for providing price information - Google Patents

Method for extracting price information from a receipt and method for providing price information Download PDF

Info

Publication number
KR101771524B1
KR101771524B1 KR1020150112999A KR20150112999A KR101771524B1 KR 101771524 B1 KR101771524 B1 KR 101771524B1 KR 1020150112999 A KR1020150112999 A KR 1020150112999A KR 20150112999 A KR20150112999 A KR 20150112999A KR 101771524 B1 KR101771524 B1 KR 101771524B1
Authority
KR
South Korea
Prior art keywords
information
extracting
price
extracted
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020150112999A
Other languages
Korean (ko)
Other versions
KR20170019087A (en
Inventor
김지훈
Original Assignee
주식회사 쿼리젯
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 쿼리젯 filed Critical 주식회사 쿼리젯
Priority to KR1020150112999A priority Critical patent/KR101771524B1/en
Publication of KR20170019087A publication Critical patent/KR20170019087A/en
Application granted granted Critical
Publication of KR101771524B1 publication Critical patent/KR101771524B1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06K9/00442
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/12Payment architectures specially adapted for electronic shopping systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/209Specified transaction journal output feature, e.g. printed receipt or voice output
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

사용자들이 촬영한 영수증 이미지로부터 매장 및 상품 가격에 관한 정보를 추출하는 방법과, 사용자들이 제공한 영수증 이미지로부터 추출된 정보를 가공하여 특정 상품에 대한 매장별 가격 정보를 제공하는 방법이 제공된다. 본 발명의 일 실시예에 따른 영수증에서 추출한 가격정보 제공방법은, 단말로부터 영수증 이미지를 수신하는 단계와, 영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와, 추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와, 추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계와, 상품가격 검색요청을 수신하면 상품가격 검색요청에 포함된 검색조건에 맞는 가격정보를 포함하는 검색결과를 상품가격 데이터베이스에서 추출하여 사용자에게 제공하는 검색단계를 구비한다. 본 발명에 따르면, 영수증에서 상품의 가격 정보를 추출하므로 다수의 상품에 대한 가격을 한번에 획득할 수 있을 뿐만 아니라 실제로 판매된 가격을 획득할 수 있다. There is provided a method of extracting information on a store and a commodity price from a receipt image taken by users and a method of processing information extracted from a receipt image provided by users to provide price information for each commodity for each commodity. A method of providing price information extracted from a receipt according to an embodiment of the present invention includes receiving a receipt image from a terminal, extracting text from the receipt image, extracting store information from the extracted text, Extracting product information including a product name and a price from the extracted text, storing the retrieved store information in association with product information in a product price database, receiving a product price search request And a search step of extracting a search result including price information matching the search condition included in the goods price search request from the goods price database and providing the search result to the user. According to the present invention, since the price information of the goods is extracted from the receipt, it is possible not only to obtain prices for a plurality of goods at once, but also to obtain the actually sold prices.

Description

영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법 {Method for extracting price information from a receipt and method for providing price information}TECHNICAL FIELD The present invention relates to a method for extracting price information from a receipt and a method for providing price information using the method.

본 발명은 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법에 관한 것으로서, 더욱 상세하게는 사용자들이 촬영한 영수증 이미지로부터 매장 및 상품 가격에 관한 정보를 추출하는 방법과, 사용자들이 제공한 영수증 이미지로부터 추출된 정보를 가공하여 특정 상품에 대한 매장별 가격 정보를 제공하는 방법에 관한 것이다.The present invention relates to a method for extracting price information from a receipt and a method for providing price information using the method. More particularly, the present invention relates to a method for extracting information on a store and a commodity price from a receipt image taken by users, The present invention relates to a method for processing information extracted from a receipt image and providing price information for each specific product.

상품 구매를 결정함에 있어서 중요한 요소는 가격이다. 따라서 다양한 상품의 여러 판매처에서의 가격을 비교해주는 가격비교 사이트가 많이 운용되고 있다. 예를 들면, 등록특허 제10-1336151호에서는 온라인 쇼핑몰에 구매자의 관심상품으로 저장되어 있는 정보를 이용하여 용이하게 가격비교를 할 수 있도록 하고, 관심상품 정보를 이용하여 가격비교 사이트의 상품정보를 갱신하도록 하는 방법이 개시되어 있다.An important factor in deciding to purchase a product is price. Therefore, a lot of price comparison sites that compare prices at various sales points of various products are being operated. For example, in the Korean Patent Registration No. 10-1336151, it is possible to easily make a price comparison using information stored as an item of interest of a buyer in an online shopping mall, A method for updating the information is disclosed.

그러나, 기존의 가격비교 사이트는 가격 정보를 쉽게 획득할 수 있는 온라인 쇼핑몰을 대상으로 한 것이다. 오프라인 매장에 대한 가격 비교 서비스를 제공하기 어려운 것은 시시각각으로 변하는 오프라인 매장들에서의 가격 정보를 신뢰성 있게 획득하기가 어렵기 때문이다. However, existing price comparison sites are aimed at online shopping malls where price information can be acquired easily. The reason why it is difficult to provide price comparison service for offline stores is that it is difficult to reliably acquire price information in the offline shops which is changing every moment.

한편, 등록특허 제10-1137541호 "온라인/오프라인 통합가격비교 서비스 방법 및 시스템"에서는, 오프라인 매장을 방문한 사용자에 의해 촬영된 특정 제품의 가격 정보를 사용자 단말에 의해 촬영된 특정 제품의 바코드와 가격태그 이미지 정보를 이용하여 획득하도록 구성하고 있다. 그러나, 사용자들이 오프라인 매장의 모든 제품의 바코드와 가격태그 이미지를 일일이 촬영하여 업로드 하기를 기대하기는 어려우며, 바코드에 기록된 정보는 동일 제품에 대해서도 매장마다 관리 코드를 다르게 사용하는 경우가 많아서 정확한 제품 정보를 획득하기가 어렵다. 또한, 사용자가 제품 가격 이미지를 업로드 하였다 하더라고 이 정보가 최신의 정보인지를 확인할 수 있는 방법이 없으므로, 가격이 시시각각 변하는 상황에서는 유용한 정보가 되기 어렵다. 또한, 가격태그에 기재된 가격에서 할인을 적용받아서 결제가 이루어지는 경우가 많이 있으므로, 가격태그에 기재된 가격이 실제로 판매되는 가격이라는 보장이 없다.On the other hand, in the "online / offline integrated price comparison service method and system" of Patent No. 10-1137541, price information of a specific product photographed by a user who visited a local store is stored in a bar code of a specific product Tag image information. However, it is difficult for users to expect to upload and record barcodes and price tag images of all the products in the in-store, and the information recorded in the barcode often uses different management codes for the same products in each store, It is difficult to obtain information. Also, even if the user uploads the product price image, there is no way to confirm whether this information is the latest information, and therefore, it is difficult to obtain useful information in a situation where the price changes instantaneously. In addition, there are many cases where settlement is made by applying the discount at the price described in the price tag, so that there is no guarantee that the price described in the price tag is the actual selling price.

본 발명은 이러한 점을 감안하여 이루어진 것으로서, 다수의 상품에 대한 오프라인 매장별 가격정보를 정확하게 획득할 수 있도록 영수증에서 매장 정보, 날짜 정보 및 상품의 가격 정보 등의 정보를 추출하는 방법과, 영수증으로부터 추출된 정보를 이용하여 매장별 가격정보를 제공하는 방법을 제공하는 것을 목적으로 한다. SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and it is an object of the present invention to provide a method of extracting information such as store information, date information, and price information of goods on a receipt so as to accurately acquire price information of each store, And a method for providing price information for each store using the extracted information.

본 발명의 일 실시예에 따른 영수증 가격정보 추출방법은, 단말로부터 영수증 이미지를 수신하는 단계와, 영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와, 추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와, 추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계를 포함한다.A method for extracting receipt price information according to an embodiment of the present invention includes receiving a receipt image from a terminal, extracting text from a receipt image, extracting store information from the extracted text, A product information extracting step of extracting product information including a product name and a price from the extracted text, and storing the extracted store information in association with the product information in a product price database.

본 발명의 일 실시예에 따른 영수증에서 추출한 가격정보 제공방법은, 단말로부터 영수증 이미지를 수신하는 단계와, 영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와, 추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와, 추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계와, 상품가격 검색요청을 수신하면 상품가격 검색요청에 포함된 검색조건에 맞는 가격정보를 포함하는 검색결과를 상품가격 데이터베이스에서 추출하여 사용자에게 제공하는 검색단계를 구비한다. 검색결과를 사용자에게 제공할 때에 검색조건에 관련된 광고도 함께 제공할 수 있다. 또한, 검색결과에 포함된 가격정보를 업로드한 사용자에게 포인트를 적립하도록 구성할 수도 있다.A method of providing price information extracted from a receipt according to an embodiment of the present invention includes receiving a receipt image from a terminal, extracting text from the receipt image, extracting store information from the extracted text, Extracting product information including a product name and a price from the extracted text, storing the retrieved store information in association with product information in a product price database, receiving a product price search request And a search step of extracting a search result including price information matching the search condition included in the goods price search request from the goods price database and providing the search result to the user. When providing search results to a user, they may also provide advertisements related to search conditions. In addition, it is also possible to configure the point to be accumulated to the user who uploaded the price information included in the search result.

매장정보 추출단계는, 추출된 텍스트로부터 사업자 등록번호 패턴을 찾아서 사업자 등록번호를 추출하는 단계와, 추출된 사업자 등록번호를 사용하여 사업자 데이터베이스에서 해당 사업자의 매장에 관한 정보를 추출하는 단계를 포함할 수 있다. 추출된 사업자 등록번호와 동일한 사업자 등록번호가 상기 사업자 데이터베이스에 없는 경우에는 상기 추출된 텍스트로부터 주소 패턴, 전화번호 패턴 중의 적어도 하나를 찾아서 주소, 전화번호 중의 적어도 하나를 추출하고, 추출된 주소, 전화번호 중의 적어도 하나를 사용하여 상기 사업자 데이터베이스에서 일치하는 매장에 관한 정보를 추출할 수 있다.The step of extracting the store information includes a step of extracting the business registration number from the extracted text and extracting information on the store of the business in the business entity database using the extracted business registration number . Extracts at least one of an address and a telephone number from the extracted text and searches for at least one of an address pattern and a telephone number pattern and extracts at least one of an address and a telephone number from the extracted text, The information on the matching stores in the business entity database can be extracted using at least one of the numbers.

단말로부터 영수증 이미지를 수신할 때에 단말의 위치정보도 함께 수신하는 것이 바람직하다. 또한, 상기 추출된 주소, 전화번호 중의 적어도 하나와 일치하는 매장이 상기 사업자 데이터베이스에 없는 경우에는 상기 위치정보에 해당하는 좌표로부터 소정 반경 이내에 존재하는 매장들을 상기 사업자 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장에 관한 정보를 추출할 수 있다.When receiving the receipt image from the terminal, it is also desirable to receive the location information of the terminal as well. If a store matching at least one of the extracted address and telephone number is not present in the business entity database, the business entity database is searched in the business entity database for stores that are located within a predetermined radius from coordinates corresponding to the location information and extracted from the receipt image It is possible to extract information on the store with the highest matching rate.

상품정보 추출단계는, 추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행만 남기고 나머지 행은 제거하는 단계와, 남은 각 행의 상기 제2 문자열에 대해서 상품명 사전 데이터베이스를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득하는 단계를 포함할 수 있다. 이때, '제2 문자열 + 공백 + 숫자'의 패턴을 가진 행 중에서 제2 문자열에 청구액, 총액, 합계를 포함하는 상품명과 관련없는 불용어가 포함된 행을 제거하는 것이 바람직하다.In the product information extracting step, only a line having a pattern of a string (referred to as a "second string") + space + number ' among the strings of one line (hereinafter referred to as "first string" Obtaining a product name using the product name dictionary database for the second character string of each of the remaining lines, and obtaining a price for the product using the number. At this time, it is preferable to remove a row including an abbreviation not related to a product name including a claim amount, a total amount, and a sum in the second character string among the lines having the pattern of 'second character string + space + number'.

실시예에 따라서는, 추출된 텍스트로부터 날짜정보를 추출하여, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장할 때에 날짜정보도 함께 연계하여 상품가격 데이터베이스에 저장하도록 구성할 수 있다.According to an embodiment, when date information is extracted from the extracted text, and the extracted store information and product information are linked and stored in the product price database, the date information may be linked together and stored in the product price database.

본 발명에 따르면, 영수증에서 상품의 가격 정보를 추출하므로 다수의 상품에 대한 가격을 한번에 획득할 수 있을 뿐만 아니라 실제로 판매된 가격을 획득할 수 있다. 또한, 영수증에 기재된 날짜정보를 이용하여 가장 최신의 가격 정보를 파악할 수 있을 뿐만 아니라, 가격 변동의 흐름을 파악할 수 있다.According to the present invention, since the price information of the goods is extracted from the receipt, it is possible not only to obtain prices for a plurality of goods at once, but also to obtain the actually sold prices. Further, not only the latest price information can be grasped by using the date information described in the receipt, but also the flow of price fluctuation can be grasped.

도 1은 본 발명의 방법을 설명하기 위한 네트워크 다이아그램이다.
도 2는 가격정보 제공서버의 내부 구성을 보여주는 블록도이다.
도 3은 영수증으로부터 매장정보, 상품정보, 날짜정보를 추출하여 저장하는 절차를 보여주는 흐름도이다.
도 4는 매장정보를 추출하는 방법을 보여주는 흐름도이다.
도 5는 상품정보를 추출하는 방법을 보여주는 흐름도이다.
도 6은 상품가격 검색요청에 따라 상품가격정보와 광고를 보여주고 리워드를 제공하는 절차를 보여주는 흐름도이다.
Figure 1 is a network diagram for illustrating the method of the present invention.
2 is a block diagram showing an internal configuration of a price information providing server.
FIG. 3 is a flowchart illustrating a procedure for extracting and storing store information, product information, and date information from a receipt.
4 is a flowchart showing a method of extracting store information.
5 is a flowchart showing a method of extracting product information.
FIG. 6 is a flowchart showing a procedure of displaying product price information and advertisements according to a product price search request and providing a reward.

이하, 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings.

도 1은 본 발명의 방법을 설명하기 위한 네트워크 다이아그램이다.Figure 1 is a network diagram for illustrating the method of the present invention.

오프라인 매장에서 상품을 구입한 (또는 서비스를 이용한) 사용자는 모바일 단말(200)을 이용하여 영수증을 촬영하여 가격정보 제공서버(100)로 영수증 이미지를 전송한다. 모바일 단말(200)로는 스마트폰, 태블릿 PC, 노트북 컴퓨터 등 카메라가 내장된 이동정보단말장치가 사용될 수 있다. 바람직하게는 모바일 단말(200)에 이를 위한 전용 어플리케이션을 설치하여, 영수증 촬영 및 전송을 전용 어플리케이션을 사용하여 수행하도록 하는 것이 좋지만, 본 발명은 이에 한정되는 것은 아니며, 이메일이나 SNS(Social Network Service) 도구를 사용하여 촬영된 이미지를 전송하도록 구성하는 것도 가능하다. 또한, 전용 어플리케이션은 촬영된 영수증 이미지를 그대로 전송할 수도 있고, 전송 데이터를 줄이기 위하여 또는 서버에서의 처리시간을 줄이기 위하여 영수증 이미지를 2진화(binarization), 세그멘테이션(segmentation) 등의 전처리 작업을 수행한 이후에 전송하도록 구성하는 것도 가능하다. 실시예에 따라서는 모바일 단말에서 문자 인식을 수행한 후에 인식된 텍스트 정보만을 전송하도록 구성하는 것도 가능하다.A user who purchases a product (or uses a service) in an offline store takes a receipt by using the mobile terminal 200 and transmits the receipt image to the price information providing server 100. As the mobile terminal 200, a mobile information terminal device including a camera such as a smart phone, a tablet PC, and a notebook computer can be used. Preferably, the mobile terminal 200 is provided with a dedicated application for performing the receipt photographing and transmission using a dedicated application. However, the present invention is not limited to this, and an email or an SNS (Social Network Service) It is also possible to configure to transmit the photographed image using a tool. In addition, the dedicated application may transmit the photographed receipt image as it is, or may perform preprocessing such as binarization and segmentation to reduce transmission data or to reduce processing time in the server As shown in FIG. According to an embodiment, it is also possible to transmit only the recognized text information after character recognition is performed in the mobile terminal.

가격정보 제공서버(100)는 모바일 단말(200)로부터 수신한 영수증 이미지로부터 구매한 매장의 정보, 상품명 및 가격을 포함하는 상품정보, 구매한 날짜정보 등을 추출하여 데이터베이스화 한다. 그리고, 가격정보 제공서버(100)는 검색단말(300)로부터 특정 상품에 대한 가격정보에 대한 검색요청을 수신하면, 데이터베이스로부터 조건에 맞는 데이터를 검색하여 검색단말(300)에게 제공한다. 검색단말(300)로는 데스크탑 PC, 스마트폰, 태블릿 PC, 노트북 컴퓨터 등 다양한 정보단말장치가 사용될 수 있다.The price information providing server 100 extracts the information of the shop, the product information including the product name and the price, the purchased date information and the like from the receipt image received from the mobile terminal 200 and converts it into a database. When the price information providing server 100 receives a search request for price information on a specific product from the search terminal 300, the price information providing server 100 searches the database for data satisfying the condition and provides the data to the search terminal 300. As the search terminal 300, various information terminal devices such as a desktop PC, a smart phone, a tablet PC, and a notebook computer can be used.

사용자의 영수증 이미지 업로드를 촉진하기 위하여, 검색요청에 대하여 가격정보를 제공할 때에 요청된 상품 또는 지역에 관련된 광고를 함께 제공하고, 가격정보 제공에 사용된 영수증 이미지를 업로드 하였던 사용자에게 리워드를 제공하도록 구성할 수 있다.In order to facilitate the uploading of the receipt image of the user, in providing the price information for the search request, an advertisement related to the requested product or area is provided together, and a reward is provided to the user who uploaded the receipt image used for providing the price information Can be configured.

다음으로, 도 2를 참조하여 가격정보 제공서버(100)의 구성을 설명한다.Next, the configuration of the price information providing server 100 will be described with reference to FIG.

가격정보 제공서버(100)는 사용자로부터 영수증 이미지를 등록받기 위한 영수증등록 인터페이스(110)를 구비한다. 영수증등록 인터페이스(110)는 사용자의 모바일 단말(200)에 설치되어 있는 전용 어플리케이션과의 통신을 위한 인터페이스일 수도 있고, 이메일 또는 SNS를 통해 전송되어 오는 영수증 이미지를 수신하기 위한 인터페이스일 수도 있다. 매장에 관한 보다 정확한 정보 획득을 위하여 가격정보 제공서버(100)는 사용자로부터 영수증 이미지를 받을 때 사용자의 위치정보도 함께 받을 수 있다. 사용자가 영수증 이미지를 전송할 때의 위치가 매장 위치와 다른 경우에는 사용자가 이를 표시할 수 있도록 전용 어플리케이션을 구성할 수도 있다.The price information providing server 100 includes a receipt registration interface 110 for receiving a receipt image from a user. The receipt registration interface 110 may be an interface for communicating with a dedicated application installed in the user's mobile terminal 200 or an interface for receiving a receipt image transmitted via e-mail or SNS. In order to obtain more accurate information about the store, the price information providing server 100 may receive the location information of the user when receiving the receipt image from the user. A dedicated application may be configured so that the user can display the position when the user transfers the receipt image to the store location.

영수증 인식부(120)는 사용자로부터 수신한 영수증 이미지로부터 문자를 인식하여 문자열(텍스트)을 추출하고, 추출된 문자열로부터 매장정보 DB(121)와 상품명 사전 DB(122)를 이용하여 매장정보, 상품명 및 가격을 포함하는 상품정보, 구매한 날짜정보 등을 추출한다. 매장정보, 상품정보 등의 구체적인 추출방법은 후술한다.The receipt recognizing unit 120 extracts a character string from the receipt image received from the user and extracts a character string from the extracted character string and stores the store information, And product information including the price, information on the date of purchase, and the like. Specific methods of extracting the store information, product information, etc. will be described later.

추출된 매장정보와 상품정보는 연계되어 상품가격 DB(130)에 저장된다. 즉, 특정 매장에서 특정 상품이 얼마의 가격에 판매가 되었는지에 관한 정보가 저장된다. 또한, 바람직하게는 해당 상품이 해당 매장에서 판매된 날짜에 관한 정보가 함께 연계되어 저장된다. 이로부터 사용자는 가장 최근의 판매가와, 판매가의 변동 현황을 파악할 수 있다.The extracted store information and product information are linked and stored in the goods price database 130. [ That is, information on how much a specific product is sold at a particular store is stored. Preferably, the information on the date when the commodity is sold in the store is stored in association with the commodity. From this, the user can ascertain the most recent sales price and the change in sales price.

검색사용자 인터페이스(160)는 인터넷 등을 통해 접속한 사용자로부터의 검색요청에 따라 검색엔진(140)에 검색을 요청하고, 검색엔진(140)으로부터의 검색결과를 사용자의 검색단말(300)에 맞는 형태로 가공하여 검색단말(300)에 제공한다. 사용자로부터의 검색요청은 사용자의 현재 위치에서 가장 가까운 곳에 위치한 몇 개의 매장에서의 특정 상품에 대한 가격정보일 수 있다. 예를 들면, "사용자의 위치에서 가장 가까운 3군데의 주유소의 휘발유 가격"일 수 있다. 이를 위하여 검색사용자 인터페이스(160)는 사용자로부터 검색요청을 받을 때에 사용자의 위치정보도 함께 받을 수 있다.The search user interface 160 requests the search engine 140 to search according to a search request from a user connected through the Internet or the like and transmits a search result from the search engine 140 to the search terminal 300 And provides it to the search terminal 300. The search request from the user may be price information for a specific product in a few stores located closest to the user's current location. For example, it may be "the gasoline price of the three closest gas stations at the location of the user ". To this end, the search user interface 160 may receive the location information of the user when receiving the search request from the user.

검색엔진(140)은 검색사용자 인터페이스(160)로부터의 검색요청에 따라 상품가격 DB(130)에서 검색요청에 포함된 검색 조건에 부합하는 가격정보를 추출하여 검색사용자 인터페이스(160)에 제공한다. 검색 조건에는 위치에 관한 조건, 가격대에 관한 조건, 상품명에 관한 조건, 매장에 관한 조건 등이 포함될 수 있다.The search engine 140 extracts price information corresponding to the search conditions included in the search request from the goods price DB 130 according to the search request from the search user interface 160 and provides the extracted price information to the search user interface 160. The search condition may include a condition regarding a position, a condition relating to a price range, a condition relating to a product name, a condition relating to a store, and the like.

검색사용자 인터페이스(160)는 검색결과를 검색단말(300)에 제공할 때에 광고를 삽입하여 제공할 수 있다. 이를 위하여 광고 삽입부(150)는 검색 조건에 부합되는 광고를 광고 DB(151)에서 추출하여 검색사용자 인터페이스(160)에 제공하고, 검색사용자 인터페이스(160)는 검색엔진(140)으로부터의 검색결과와 광고 삽입부(150)로부터의 광고 정보를 결합한 페이지를 생성하여 검색단말(300)에게 제공한다.The search user interface 160 may insert and provide advertisements when providing search results to the search terminal 300. The advertisement insertion unit 150 extracts advertisements corresponding to the search conditions from the advertisement DB 151 and provides the extracted advertisements to the search user interface 160. The search user interface 160 searches the search results And advertisement information from the advertisement inserting unit 150, and provides the generated page to the search terminal 300.

한편, 이와 같이 검색결과에 사용된 가격정보를 업로드한 사용자에 대해서는 리워드를 제공할 수 있다. 이를 위하여 상품가격 DB에는 가격정보(영수증 이미지)를 업로드한 사용자에 관한 정보도 같이 저장되어 있다. 광고 정산부(170)는 광고 노출에 따른 소정의 포인트 또는 금액을 가격정보를 제공한 사용자에게 부여한다.On the other hand, the reward can be provided to the user who uploaded the price information used in the search result. To this end, the commodity price DB also stores information about the user who has uploaded the price information (receipt image). The advertisement settlement unit 170 gives a predetermined point or amount according to the advertisement exposure to the user who provided the price information.

다음으로 도 3 내지 도 5를 참조하여 영수증 인식부(120)에서의 동작에 대해서 설명한다. Next, the operation of the receipt recognizing unit 120 will be described with reference to FIG. 3 to FIG.

도 3은 영수증으로부터 매장정보, 상품정보, 날짜정보를 추출하여 저장하는 절차를 보여주는 흐름도이다.FIG. 3 is a flowchart illustrating a procedure for extracting and storing store information, product information, and date information from a receipt.

영수증 인식부(120)는 영수증등록 인터페이스(110)를 통해 영수증 이미지를 수신하고(S310), 수신된 영수증 이미지에서 문자를 인식한다(S320). 문자 인식율을 높이기 위하여 영수증에서 일반적으로 사용되는 문자열에 대한 사전 데이터베이스를 활용할 수도 있다. The receipt recognition unit 120 receives the receipt image through the receipt registration interface 110 (S310), and recognizes the character in the received receipt image (S320). To increase the character recognition rate, you can also use a dictionary database for commonly used strings in receipts.

영수증에는 매장정보, 상품정보, 날짜정보와는 관련없이 일반적으로 사용되는 불용어가 있다. 불용어의 예로는 '신용승인', '감사합니다', '일시불', '카드번호', '승인번호', '매입', '회원용', '고객용', '단말기NO' 등이 있다. 단계 S320에서 추출된 문자열에서 이러한 불용어를 제거한다(단계 S330). 한편 불용어의 제거는 매장정보 추출단계(S340), 상품정보 추출단계(S350) 등에서 수행하도록 하는 것도 가능하다. 또한, 불용어를 제거할 때에 불용어에 수단되어 있는 숫자열 등도 함께 제거할 수 있다. 예를 들면, '카드번호'라는 불용어 옆에는 결제에 사용된 신용카드번호가 기재되게 되는데, '카드번호'라는 불용어를 제거할 때에 그 옆의 신용카드번호도 함께 제거하는 것이다.The receipt has a commonly used idiom, regardless of store information, product information, or date information. Examples of abbreviations include 'credit approval', 'thank you', 'lump sum', 'card number', 'approval number', 'purchase', 'for members', 'for customers', 'terminal NO'. And removes such an abbreviation from the character string extracted in step S320 (step S330). On the other hand, the removal of the insoluble words can be performed in the store information extracting step (S340), the product information extracting step (S350), and the like. It is also possible to remove the numeral strings and the like, which are used in the abbreviated terms, when removing the stopwords. For example, the credit card number used for settlement is written next to the abbreviation of 'card number', and when the abbreviation of 'card number' is removed, the credit card number beside it is also removed.

영수증 인식부(120)는 불용어가 제거된 문자열로부터 매장에 관한 정보(매장정보)와, 상품명 및 해당 상품의 가격에 관한 정보(상품정보), 그리고 날짜정보를 추출한다(단계 S340, S350, S360). 매장정보, 상품정보, 날짜정보의 추출 순서는 임의로 설계할 수 있다. 즉, 문자열의 처음부터 마지막까지 순서대로 정보를 추출할 수도 있고, 매장정보와 날짜정보를 추출한 후에 상품정보를 추출하도록 구성할 수도 있으며, 본 발명은 특정 순서에 한정되지 않는다.The receipt recognizing unit 120 extracts information on the store (store information), information on the name of the commodity, information on the price of the commodity (commodity information), and date information from the string in which the abbreviations are removed (steps S340, S350, S360 ). The order of extracting store information, product information and date information can be arbitrarily designed. That is, the information may be extracted in order from the beginning to the end of the character string, or the product information may be extracted after extracting the store information and the date information, and the present invention is not limited to the specific order.

영수증 인식부(120)는 추출된 매장정보, 상품정보, 날짜정보를 서로 연계하여 상품가격 DB(130)에 저장한다.The receipt recognizer 120 stores the extracted store information, product information, and date information in the product price database 130 in association with each other.

도 4를 참조하여 영수증에서 매장정보를 추출하는 한가지 예를 설명한다.One example of extracting the store information from the receipt will be described with reference to FIG.

먼저, 영수증에서 추출한 전체 문자열 중에 사업자등록번호 패턴이 존재하는지를 확인한다(단계 S410). 사업자등록번호는 '사업자'라는 문자열 뒤에 나타날 수도 있고, 그러한 문자열 없이 바로 사업자등록번호가 나타날 수도 있다. 사업자등록번호는 "3자리 숫자 + '-' + 두자리 숫자 + '-' + 다섯자리 숫자"로 구성되므로, 이러한 패턴을 가진 문자열이 있는지를 확인한다.First, it is confirmed whether there is a business registration number pattern in the entire string extracted from the receipt (step S410). The business registration number may appear after the string "business", and the business registration number may appear directly without such a string. The business registration number consists of three digits + '-' + two digits + '-' + five digits', so make sure you have a string with this pattern.

사업자등록번호 패턴이 있는 경우에는 단계 S420에서 해당 사업자등록번호가 매장정보 DB(121)에 존재하는지를 확인한다. 매장정보 DB(121)에 해당 사업자등록번호가 있는 경우에는 단계 S470에서 해당 매장의 정보(매장 ID, 상호명, 매장주소, 매장전화번호 중의 일부 또는 전부)를 임시로 저장해둔다.If there is a business registration number pattern, it is confirmed in step S420 whether the business registration number exists in the store information DB 121. [ If there is a corresponding business registration number in the store information DB 121, information (store ID, business name, store address, part or all of the store telephone number) of the store is temporarily stored in step S470.

사업자등록번호를 추출하는데 실패하였거나 매장정보 DB(121)에 해당 사업자등록번호가 없는 경우에는 단계 S430에서 전체 문자열에 주소정보가 존재하는지를 확인한다. 주소정보로는 주소와 전화번호가 포함될 수 있다. 전체 문자열에 주소 패턴 또는 전화번호 패턴을 갖는 문자열이 있으면 매장정보 DB(121)에 해당 주소 또는 전화번호를 갖는 매장이 존재하는지를 확인한다(단계 S440). 매장정보 DB(121)에 해당 주소정보가 있는 경우에는 단계 S470에서 해당 매장의 정보(매장 ID, 상호명, 매장주소, 매장전화번호 중의 일부 또는 전부)를 임시로 저장해둔다.If it is unsuccessful to extract the business registration number or if there is no corresponding business registration number in the store information DB 121, it is confirmed in step S430 whether address information exists in the entire character string. The address information may include an address and a telephone number. If there is a character string having an address pattern or a telephone number pattern in the entire character string, it is confirmed whether a store having the corresponding address or telephone number exists in the store information DB 121 (step S440). If there is such address information in the store information DB 121, information (store ID, business name, store address, part or all of the store telephone number) of the store is temporarily stored in step S470.

주소정보를 추출하는데 실패하였거나 매장정보 DB(121)에 일치하는 주소정보가 없는 경우에는 단계 S450에서 사용자의 모바일 단말(200)로부터 수신한 위치정보로부터 해당 단말의 위치에서 소정의 반경 내에 존재하는 매장이 매장정보 DB(121)에 등록되어 있는지를 확인한다. 소정의 반경 내에 매장이 존재하고 해당 매장정보와 전체 문자열에 일치하는 정보가 있는 경우에는 단계 S470에서 해당 매장의 정보(매장 ID, 상호명, 매장주소, 매장전화번호 중의 일부 또는 전부)를 임시로 저장해둔다. 실시예에 따라서는, 소정 반경 이내에 존재하는 매장들을 상기 매장정보 DB에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장을 선택하도록 구성할 수도 있다.If address information has not been extracted or there is no matching address information in the store information DB 121, it is determined in step S450 that the location information of the store located within a predetermined radius from the location of the terminal Is registered in the store information DB (121). If there is a store within a predetermined radius and there is information matching the store information and the entire string, the information (store ID, business name, store address, part or all of the store telephone number) of the store is temporarily stored I will. According to an embodiment of the present invention, the stores located within a predetermined radius may be searched in the store information DB and compared with the texts extracted from the receipt image, thereby selecting the store with the highest matching rate.

이러한 과정을 거쳐서도 매장정보를 획득하지 못한 경우에는 따로 분류하여 두었다가 추후에 관리자가 영수증 이미지를 보고 수기로 매장정보를 입력하도록 구성할 수 있다(단계 S460). 또는 단계 S460을 생략하고 매장정보 획득에 실패한 영수증 이미지를 폐기하도록 구성하는 것도 가능하다.If the store information can not be obtained through such a process, the store information may be separately classified, and the manager may later display the receipt image and input the store information by hand (step S460). Alternatively, it is possible to omit step S460 and discard the receipt image which failed to obtain the store information.

도 5를 참조하여 상품정보를 추출하는 한가지 예를 설명한다.One example of extracting product information will be described with reference to FIG.

먼저, 전체 문자열에서 가격 패턴을 갖는 행을 추출한다(단계 S510). 가격 패턴을 갖는 행이란, 추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행을 말한다. 즉, 전체 문자열에서 가격 패턴을 갖지 않는 행을 삭제함으로써 가격 패턴을 갖는 행만을 추출한다.First, a row having a price pattern in the entire character string is extracted (step S510). A row having a price pattern means a line having a pattern of a string (referred to as "second string") + space + number 'among the strings of one row (hereinafter referred to as "first string" It says. That is, only the row having the price pattern is extracted by deleting the row having no price pattern in the entire character string.

이어서, 상품명 불용어가 포함된 행을 제거한다(단계 S520). 상품명 불용어로는 '청구액', '총액', '합계' 등을 들 수 있다. 즉, 가격 패턴을 갖는 행들 중에서 개별 상품의 가격을 나타내는 행이 아닌 행들을 제거하는 것이다.Subsequently, a line including a product name inscription is removed (step S520). Examples of abbreviated product names include 'bill amount', 'total amount', and 'total'. That is, it removes rows that are not rows representing the price of an individual commodity among rows having a price pattern.

이와 같이 상품의 가격을 나타내는 행만을 추출한 후에 남은 각 행에 대하여 상기 제2 문자열에 대해서 상품명 사전 DB(122)를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득한다. 상품명 사전 DB(122)는 상품명으로 사용될 가능성이 높은 단어 또는 문자열들을 그에 대한 표준적인 상품명에 매핑하여 놓은 데이터베이스이다. 또한, 상품명 사전 DB(122)는 매장별로 사용되는 상품명을 데이터베이스화하여 놓은 것일 수도 있으며, 이 경우에는 단계 S340에서 획득한 매장정보에 따라 적절한 데이터베이스를 사용하여 상품명을 획득할 수 있다. 이렇게 획득한 상품정보는 단계 S470에서 임시로 저장된 매장정보와 함께 연계하여 상품가격 DB(130)에 저장된다.After extracting only the row representing the price of the product, the product name is acquired using the product name dictionary DB 122 for the second character string for each remaining row, and the price for the product is obtained using the number. The product name dictionary DB 122 is a database in which words or strings that are likely to be used as product names are mapped to standard product names. In addition, the product name dictionary DB 122 may be a database in which a product name used for each store is converted into a database. In this case, a product name can be obtained using an appropriate database according to the store information acquired in step S340. The acquired product information is stored in the goods price database 130 in association with the store information temporarily stored in step S470.

다음으로 도 6을 참조하여, 사용자로부터의 상품가격 검색요청에 따라 상품가격정보와 광고를 보여주고 리워드를 제공하는 절차를 설명한다.Next, referring to FIG. 6, a procedure for displaying product price information and advertisements and providing rewards according to a product price search request from a user will be described.

검색단말(300)로부터 상품가격 검색요청을 접수하면(단계 S610), 검색사용자 인터페이스(160)는 수신된 검색요청에서 검색조건을 추출하여 검색엔진(140)에 전달하여 검색조건에 맞는 가격정보를 검색하도록 한다(단계 S620). 검색 조건에는 매장의 위치에 관한 조건, 상품의 가격대에 관한 조건, 상품에 관한 조건, 매장에 관한 조건 등이 포함될 수 있다.Upon receiving a goods price search request from the search terminal 300 (step S610), the search user interface 160 extracts search conditions from the received search request and transmits the search conditions to the search engine 140 to obtain price information corresponding to the search conditions (Step S620). The search conditions may include conditions relating to the location of the store, conditions relating to the price range of the goods, conditions relating to the goods, conditions relating to the stores, and the like.

또한, 검색사용자 인터페이스(160)는 검색조건을 광고 삽입부(150)에 전달하여 검색조건과 관련된 광고를 조회하도록 한다(S630). 검색조건과 관련된 광고로는 예를 들면, 사용자가 요청한 상품에 관련된 광고, 사용자가 요청한 위치와 관련된 광고, 사용자가 요청한 매장에 관련된 광고 등이 될 수 있다.In addition, the search user interface 160 transmits the search condition to the advertisement inserting unit 150 to inquire the advertisement related to the search condition (S630). Examples of the advertisement related to the search condition include an advertisement related to a product requested by a user, an advertisement related to a location requested by the user, an advertisement related to a store requested by the user, and the like.

검색엔진(140)으로부터 검색결과를 수신하고, 광고 삽입부(150)로부터 광고 정보를 수신한 검색사용자 인터페이스(160)는 검색단말(300)에 맞도록 광고가 포함된 가격정보 페이지를 구성하여 검색단말(300)에 제공한다(단계 S640).The search user interface 160 receiving the search results from the search engine 140 and receiving the advertisement information from the advertisement inserting unit 150 constructs a price information page including the advertisement to fit the search terminal 300, To the terminal 300 (step S640).

그리고, 검색사용자 인터페이스(160)는 검색결과에 사용된 가격정보를 업로드한 사용자에 관한 정보를 상품가격 DB(130)로부터 획득하여 광고 정산부(170)에 전달하고, 광고 정산부(170)는 소정의 포인트 또는 리워드를 해당 사용자에게 적립한다(단계 S650).The search user interface 160 acquires information on the user who has uploaded the price information used in the search result from the goods price database 130 and transmits the acquired information to the advertisement settlement unit 170. The advertisement settlement unit 170 And a predetermined point or reward is accumulated for the user (step S650).

이상, 본 발명을 몇가지 예를 들어 설명하였으나, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 반도체 기록매체, 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.While the present invention has been described with reference to exemplary embodiments, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. That is, within the scope of the present invention, all of the components may be selectively coupled to one or more of them. In addition, although all of the components may be implemented as one independent hardware, some or all of the components may be selectively combined to perform a part or all of the functions in one or a plurality of hardware. As shown in FIG. The codes and code segments constituting the computer program may be easily deduced by those skilled in the art. Such a computer program can be stored in a computer-readable storage medium, readable and executed by a computer, thereby realizing an embodiment of the present invention. The storage medium of the computer program may include a semiconductor recording medium, a magnetic recording medium, an optical recording medium, a carrier wave medium, and the like.

또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. Furthermore, the terms "comprises", "comprising", or "having" described above mean that a component can be implanted unless otherwise specifically stated, But should be construed as including other elements.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are intended to illustrate rather than limit the scope of the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents should be construed as falling within the scope of the present invention.

100 가격정보 제공서버,
120 영수증 인식부,
130 상품가격 DB,
140 검색엔진,
150 광고삽입부,
170 광고정산부,
200 모바일 단말,
300 검색단말.
100 Price information server,
120 Receipt Recognition Department,
130 Product Price DB,
140 search engine,
150 advertisement insertion unit,
170 Advertisement settlement part,
200 mobile terminal,
300 search terminal.

Claims (20)

단말로부터 영수증 이미지와 단말의 위치정보를 수신하는 단계와,
영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와,
추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와,
추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와,
추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계를 구비하며,
상기 매장정보 추출단계는, 추출된 텍스트로부터 사업자등록번호 패턴을 찾아서 사업자등록번호를 추출하는 단계와, 추출된 사업자등록번호를 사용하여 매장정보 데이터베이스에서 해당 사업자등록번호를 갖는 매장정보를 추출하는 단계와, 추출된 사업자등록번호와 일치하는 사업자등록번호가 상기 매장정보 데이터베이스에 없는 경우에는 상기 추출된 텍스트로부터 주소 패턴, 전화번호 패턴 중의 적어도 하나를 찾아서 주소, 전화번호 중의 적어도 하나를 추출하고, 추출된 주소, 전화번호 중의 적어도 하나를 사용하여 상기 매장정보 데이터베이스에서 주소 또는 전화번호가 일치하는 매장의 매장정보를 추출하는 단계와, 상기 추출된 주소, 전화번호 중의 적어도 하나와 일치하는 매장이 상기 매장정보 데이터베이스에 없는 경우에는 상기 위치정보에 해당하는 좌표로부터 소정 반경 이내에 존재하는 매장들을 상기 매장정보 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장의 매장정보를 추출하는 단계를 포함하며,
상기 상품정보 추출단계는, 추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행만 남기고 나머지 행은 제거하는 단계와, 남은 각 행의 상기 제2 문자열에 대해서, 상품명으로 사용될 가능성이 높은 단어 또는 문자열들을 그에 대한 표준적인 상품명에 매핑하여 놓은 데이터베이스인 상품명 사전 데이터베이스를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득하는 단계를 포함하는,
영수증 가격정보 추출방법.
Receiving a receipt image and location information of the terminal from the terminal,
A text extracting step of extracting text from the receipt image,
A store information extracting step of extracting store information from the extracted text,
A product information extracting step of extracting product information including a product name and a price from the extracted text,
And storing the extracted store information and product information in association with each other in a product price database,
The step of extracting the store information may include extracting a business registration number from the extracted text and extracting store information having a business registration number from the store information database using the extracted business registration number And extracts at least one of an address and a telephone number from the extracted text and finds out at least one of the address pattern and the telephone number pattern and extracts at least one of the address and the telephone number if the business registration number matches the extracted business registration number, Extracting store information of a store matching an address or a telephone number in the store information database by using at least one of the extracted address and the telephone number; If it is not in the information database, From the corresponding coordinates in the beam compared to the buried existing within a predetermined radius and the text extracted from the receipt of the image search in the store information database, comprising the step of matching the rate of extraction stores information of the highest store,
In the product information extracting step, only a line having a pattern of a string (referred to as a "second string") + space + number 'among the strings of one line (hereinafter referred to as "first string" Removing the remaining lines; obtaining a product name using the product name dictionary database, which is a database in which words or strings that are likely to be used as product names are mapped to standard product names for the second strings in each of the remaining rows; And obtaining a price for the product using the number,
How to extract receipt pricing information.
삭제delete 삭제delete 삭제delete 제1항에 있어서, 매칭율이 가장 높은 매장의 매칭율이 소정의 기준 이상인 경우에만 매장정보를 추출하는 것을 특징으로 하는 영수증 가격정보 추출방법.The method according to claim 1, wherein the store information is extracted only when the matching rate of the store with the highest matching rate is equal to or greater than a predetermined reference value. 삭제delete 삭제delete 제1항에 있어서,
'제2 문자열 + 공백 + 숫자'의 패턴을 가진 행 중에서 제2 문자열에 청구액, 총액, 합계를 포함하는 상품명과 관련없는 불용어가 포함된 행을 제거하는 단계를 더 포함하는 영수증 가격정보 추출방법.
The method according to claim 1,
Removing a line including an abbreviation not related to a product name including a bill amount, a total amount, and a sum in a second character string among the lines having a pattern of 'second character string + space + number'.
제1항, 제5항, 제8항 중 어느 한 항에 있어서,
추출된 텍스트로부터 날짜정보를 추출하는 날짜정보 추출단계를 더 포함하며,
추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장할 때에 날짜정보도 함께 연계하여 상품가격 데이터베이스에 저장하는 것을 특징으로 하는 영수증 가격정보 추출방법.
The method according to any one of claims 1, 5, and 8,
And a date information extracting step of extracting date information from the extracted text,
When the extracted store information and the merchandise information are linked and stored in the merchandise price database, date information is also linked together and stored in the merchandise price database.
제1항, 제5항, 제8항 중 어느 한 항에 있어서, 텍스트 추출단계 이후에 추출된 텍스트 중에서 명시적으로 추출대상이 아닌 불용단어를 제거하는 단계를 더 포함하는 영수증 가격정보 추출방법.The method of any one of claims 1, 5, and 8, further comprising removing an insoluble word that is not explicitly extracted from the extracted text after the text extracting step. 단말로부터 영수증 이미지와 단말의 위치정보를 수신하는 단계와,
영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와,
추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와,
추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와,
추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계와,
상품가격 검색요청을 수신하면 상품가격 검색요청에 포함된 검색조건에 맞는 가격정보를 포함하는 검색결과를 상품가격 데이터베이스에서 추출하여 사용자에게 제공하는 검색단계를 구비하며,
상기 매장정보 추출단계는, 추출된 텍스트로부터 사업자등록번호 패턴을 찾아서 사업자등록번호를 추출하는 단계와, 추출된 사업자등록번호를 사용하여 매장정보 데이터베이스에서 해당 사업자등록번호를 갖는 매장정보를 추출하는 단계와, 추출된 사업자등록번호와 일치하는 사업자등록번호가 상기 매장정보 데이터베이스에 없는 경우에는 상기 추출된 텍스트로부터 주소 패턴, 전화번호 패턴 중의 적어도 하나를 찾아서 주소, 전화번호 중의 적어도 하나를 추출하고, 추출된 주소, 전화번호 중의 적어도 하나를 사용하여 상기 매장정보 데이터베이스에서 주소 또는 전화번호가 일치하는 매장의 매장정보를 추출하는 단계와, 상기 추출된 주소, 전화번호 중의 적어도 하나와 일치하는 매장이 상기 매장정보 데이터베이스에 없는 경우에는 상기 위치정보에 해당하는 좌표로부터 소정 반경 이내에 존재하는 매장들을 상기 매장정보 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장의 매장정보를 추출하는 단계를 포함하며,
상기 상품정보 추출단계는, 추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행만 남기고 나머지 행은 제거하는 단계와, 남은 각 행의 상기 제2 문자열에 대해서, 상품명으로 사용될 가능성이 높은 단어 또는 문자열들을 그에 대한 표준적인 상품명에 매핑하여 놓은 데이터베이스인 상품명 사전 데이터베이스를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득하는 단계를 포함하는, 영수증에서 추출한 가격정보 제공방법.
Receiving a receipt image and location information of the terminal from the terminal,
A text extracting step of extracting text from the receipt image,
A store information extracting step of extracting store information from the extracted text,
A product information extracting step of extracting product information including a product name and a price from the extracted text,
Storing the extracted store information and product information in a product price database in association with each other;
And a retrieval step of extracting, from the commodity price database, the retrieval result including the price information corresponding to the retrieval condition included in the retrieval request for the commodity price, upon receiving the commodity price retrieval request,
The step of extracting the store information may include extracting a business registration number from the extracted text and extracting store information having a business registration number from the store information database using the extracted business registration number And extracts at least one of an address and a telephone number from the extracted text and finds out at least one of the address pattern and the telephone number pattern and extracts at least one of the address and the telephone number if the business registration number matches the extracted business registration number, Extracting store information of a store matching an address or a telephone number in the store information database by using at least one of the extracted address and the telephone number; If it is not in the information database, From the corresponding coordinates in the beam compared to the buried existing within a predetermined radius and the text extracted from the receipt of the image search in the store information database, comprising the step of matching the rate of extraction stores information of the highest store,
In the product information extracting step, only a line having a pattern of a string (referred to as a "second string") + space + number 'among the strings of one line (hereinafter referred to as "first string" Removing the remaining lines; obtaining a product name using the product name dictionary database, which is a database in which words or strings that are likely to be used as product names are mapped to standard product names for the second strings in each of the remaining rows; , And obtaining the price for the product using the number.
삭제delete 삭제delete 삭제delete 삭제delete 제11항에 있어서,
'제2 문자열 + 공백 + 숫자'의 패턴을 가진 행 중에서 제2 문자열에 청구액, 총액, 합계를 포함하는 상품명과 관련없는 불용어가 포함된 행을 제거하는 단계를 더 포함하는 영수증에서 추출한 가격정보 제공방법.
12. The method of claim 11,
Removing a line including an illegal word not related to a product name including a charge amount, a total amount, and a sum in a second character string of a line having a pattern of 'second character string + space + number' Way.
제11항에 있어서,
추출된 텍스트로부터 날짜정보를 추출하는 날짜정보 추출단계를 더 포함하며,
추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장할 때에 날짜정보도 함께 연계하여 상품가격 데이터베이스에 저장하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
12. The method of claim 11,
And a date information extracting step of extracting date information from the extracted text,
When the extracted store information and the merchandise information are linked and stored in the merchandise price database, the date information is also linked together and stored in the merchandise price database.
제11항, 제16항, 제17항 중 어느 한 항에 있어서,
상기 검색조건에는 매장의 위치에 관한 조건, 상품의 가격대에 관한 조건, 상품에 관한 조건, 매장에 관한 조건 중의 적어도 하나가 포함되는, 영수증에서 추출한 가격정보 제공방법.
18. The method according to any one of claims 11, 16, and 17,
Wherein the search condition includes at least one of a condition regarding a location of a store, a condition relating to a price range of a commodity, a condition relating to a commodity, and a condition relating to a commodity.
제11항, 제16항, 제17항 중 어느 한 항에 있어서,
검색결과를 사용자에게 제공할 때에 검색조건에 관련된 광고도 함께 제공하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
18. The method according to any one of claims 11, 16, and 17,
And providing an advertisement related to the search condition when providing the search result to the user.
제19항에 있어서,
검색결과에 포함된 가격정보를 업로드한 사용자에게 포인트를 적립하는 단계를 더 포함하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
20. The method of claim 19,
Further comprising the step of: accumulating points to the user who uploaded the price information included in the search result.
KR1020150112999A 2015-08-11 2015-08-11 Method for extracting price information from a receipt and method for providing price information Expired - Fee Related KR101771524B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150112999A KR101771524B1 (en) 2015-08-11 2015-08-11 Method for extracting price information from a receipt and method for providing price information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150112999A KR101771524B1 (en) 2015-08-11 2015-08-11 Method for extracting price information from a receipt and method for providing price information

Publications (2)

Publication Number Publication Date
KR20170019087A KR20170019087A (en) 2017-02-21
KR101771524B1 true KR101771524B1 (en) 2017-08-25

Family

ID=58314000

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150112999A Expired - Fee Related KR101771524B1 (en) 2015-08-11 2015-08-11 Method for extracting price information from a receipt and method for providing price information

Country Status (1)

Country Link
KR (1) KR101771524B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020230939A1 (en) * 2019-05-14 2020-11-19 주식회사 슈퍼갈땐슈퍼맨 Receipt information management device for changing product name in receipt issued from supermarket to standardized product name and storing receipt information

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102253603B1 (en) * 2019-07-10 2021-05-18 다인에프씨 주식회사 Method of supporting food source supply for non-franchise
KR102304921B1 (en) * 2021-02-10 2021-09-27 주식회사 모비노마 Method for management of vehicle maintenance history by registering estimate
CN113205359B (en) * 2021-04-27 2024-04-05 金蝶软件(中国)有限公司 Method and device for determining commodity price in bill and computer equipment
KR102619969B1 (en) * 2021-08-05 2023-12-29 문희태 User interface for sharing local-based product information and product information sharing method using the user interface

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020230939A1 (en) * 2019-05-14 2020-11-19 주식회사 슈퍼갈땐슈퍼맨 Receipt information management device for changing product name in receipt issued from supermarket to standardized product name and storing receipt information
KR20200131585A (en) * 2019-05-14 2020-11-24 조성호 Receipt information management apparatus saving receipt information by changing product name in receipt issued at supermarket to standardized product name
KR102226864B1 (en) * 2019-05-14 2021-03-11 조성호 Receipt information management apparatus saving receipt information by changing product name in receipt issued at supermarket to standardized product name

Also Published As

Publication number Publication date
KR20170019087A (en) 2017-02-21

Similar Documents

Publication Publication Date Title
US10223668B2 (en) Contextual searching via a mobile computing device
US8117071B1 (en) Method and system for matching via an image search query at a point of sale
US9646286B2 (en) System and method for automated retail product accounting
CN107291732B (en) Information pushing method and device
US20150006326A1 (en) Search Method and Apparatus Based on E-commerce Platform
KR101771524B1 (en) Method for extracting price information from a receipt and method for providing price information
US9129276B1 (en) Inventory management
CN107111832B (en) Exclusively licensed imported goods price information providing system device for price comparison of parallel imported goods
US10102537B2 (en) Methods, systems and computer readable media for utilizing payment card transaction data to conduct product price comparisons
KR20120114444A (en) Method and apparatus for managing and providing user's purchase information
US20190333077A1 (en) Purchase information utilization system, purchase information utilization method, and program
KR20200000605A (en) Method for settlement of delivery order sales and payment terminal thereof
US20210073752A1 (en) Method, device and program for managing proofs of purchase
US20080071553A1 (en) Generation of Commercial Presentations
US20140046760A1 (en) Methods, systems, and computer readable media for identifying qualifying consumer offers
CN105469258A (en) Online shopping system and corresponding method for realizing ordering based on image
US20150379573A1 (en) Electronic content filtering server between a mobile computing device and an electronic receipt server
KR20120076489A (en) System and method for providing promotion and price comparison service based on code
KR20160095362A (en) Program for pushing purchase notice and platform server implementing the same
KR102359000B1 (en) Customer and small business matching method
KR102564646B1 (en) Method and system for automatically generating online product information
CN112036865A (en) Service providing method, device and equipment
KR101894928B1 (en) Bonus calculating apparatus using number of visit and method thereof
KR101815558B1 (en) Consumption pattern analysis and marketing system and method for the same
KR20110137274A (en) How to Provide Merchant Specialized Services

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

AMND Amendment
E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E601 Decision to refuse application
PE0601 Decision on rejection of patent

St.27 status event code: N-2-6-B10-B15-exm-PE0601

AMND Amendment
E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PX0901 Re-examination

St.27 status event code: A-2-3-E10-E12-rex-PX0901

PX0701 Decision of registration after re-examination

St.27 status event code: A-3-4-F10-F13-rex-PX0701

X701 Decision to grant (after re-examination)
P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

R15-X000 Change to inventor requested

St.27 status event code: A-3-3-R10-R15-oth-X000

R16-X000 Change to inventor recorded

St.27 status event code: A-3-3-R10-R16-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20210822

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20210822

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000