JP2026014281A - system - Google Patents
systemInfo
- Publication number
- JP2026014281A JP2026014281A JP2024115278A JP2024115278A JP2026014281A JP 2026014281 A JP2026014281 A JP 2026014281A JP 2024115278 A JP2024115278 A JP 2024115278A JP 2024115278 A JP2024115278 A JP 2024115278A JP 2026014281 A JP2026014281 A JP 2026014281A
- Authority
- JP
- Japan
- Prior art keywords
- review
- comments
- server
- reviews
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】システムを提供する。
【解決手段】レビューコメントを収集する手段と、
レビューコメントのデータ前処理を行う手段と、
レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、
レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、
を含むシステム。
【選択図】図1
A system is provided.
A method for collecting review comments;
a means for performing data preprocessing of review comments;
A means for determining product relevance by comparing the review comments with a feature word list;
A means for analyzing patterns of review comments and determining unnatural reviews;
A method for comparing review comments and determining whether comments with the same content are copy-paste reviews,
A means of providing feedback on the relevance, unnaturalness, and copy-paste judgment results of reviews,
A system including:
[Selected Figure] Figure 1
Description
本開示の技術は、システムに関する。 The technology disclosed herein relates to a system.
特許文献1には、少なくとも一つのプロセッサにより遂行される、ペルソナチャットボット制御方法であって、ユーザ発話を受信するステップと、前記ユーザ発話を、チャットボットのキャラクターに関する説明と関連した指示文を含むプロンプトに追加するステップと前記プロンプトをエンコードするステップと、前記エンコードしたプロンプトを言語モデルに入力して、前記ユーザ発話に応答するチャットボット発話を生成するステップ、を含む、方法が開示されている。 Patent document 1 discloses a persona chatbot control method executed by at least one processor, the method including the steps of receiving a user utterance, adding the user utterance to a prompt including an instruction sentence related to a description of the chatbot's character, encoding the prompt, and inputting the encoded prompt into a language model to generate a chatbot utterance in response to the user utterance.
オンラインショッピングプラットフォームでは、商品レビューが購入者にとって重要な情報源となる。しかし、一部のレビューには、サクラレビュー、不自然なレビュー、コピペされたレビューなどの問題が発生し、これによりレビューの信頼性が低下している。これらの不正なレビューは、商品の実際の評価を歪め、消費者にとって誤解を招くことがある。このため、正確で信頼性の高いレビュー情報を提供するシステムが求められている。 On online shopping platforms, product reviews are an important source of information for buyers. However, some reviews have problems such as fake reviews, unnatural reviews, and copied and pasted reviews, which reduces the reliability of the reviews. These fraudulent reviews can distort the actual evaluation of a product and be misleading to consumers. For this reason, there is a need for a system that provides accurate and reliable review information.
本発明は、レビューコメントを収集し、データ前処理を行った後、各レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段を備える。また、レビューコメントのパターンを解析し、不自然なレビューを判定する手段及びレビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段を含む。さらに、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段を備えることにより、正確かつ信頼性の高いレビュー情報を提供するシステムを提供する。本発明のシステムは、消費者がより正確な情報に基づいて購買判断を行うことを可能にし、オンラインショッピングプラットフォーム全体の品質改善に寄与する。 The present invention includes a means for collecting review comments, performing data preprocessing, and then comparing each review comment with a list of characteristic words to determine product relevance. It also includes a means for analyzing the patterns of the review comments to determine unnatural reviews, and a means for comparing review comments to determine whether comments with identical content are copy-and-paste reviews. Furthermore, by providing feedback on the review relevance, unnaturalness, and copy-and-paste determination results, a system is provided that provides accurate and reliable review information. The system of the present invention enables consumers to make purchasing decisions based on more accurate information, contributing to improving the quality of the entire online shopping platform.
「レビューコメント」とは、ユーザが購入した商品について評価や意見を記入したテキスト情報である。 "Review comments" are text information in which users write their ratings and opinions about products they have purchased.
「データ前処理」とは、収集したテキストデータから不要な情報を除去し、解析可能な形に整える工程である。 "Data preprocessing" is the process of removing unnecessary information from collected text data and preparing it in an analyzable form.
「特徴ワードリスト」とは、特定の商品属性や特徴に基づいて予め設定された単語のリストであり、商品関連性を判定するために使用される。 A "feature word list" is a list of pre-defined words based on specific product attributes or characteristics, and is used to determine product relevance.
「商品関連性の判定」とは、レビューコメントが特定の商品に関連しているかどうかを判断するプロセスである。 "Product relevance determination" is the process of determining whether a review comment is relevant to a particular product.
「パターン解析」とは、複数のレビューコメントの内容やパターンを解析し、類似性や異常を検出する手法である。 "Pattern analysis" is a method of analyzing the content and patterns of multiple review comments to detect similarities and anomalies.
「不自然なレビュー」とは、内容が似通っており、短期間に連続して投稿されるなどの不自然さが見受けられるレビューコメントである。 "Unnatural reviews" are review comments that have similar content and are posted consecutively within a short period of time, which may appear unnatural.
「コピペレビュー」とは、既存のレビューコメントと全く同じ内容のテキストがコピー&ペーストされて投稿されたレビューコメントである。 A "copy-and-paste review" is a review comment that is posted by copying and pasting the exact same text as an existing review comment.
「フィードバック手段」とは、関連性、不自然さ、コピペの判定結果をレビュー投稿者および管理者に通知する機能を含むシステム部分である。 "Feedback means" refers to the system part that includes a function to notify the reviewer and administrator of the results of the assessment of relevance, unnaturalness, and copy-and-paste.
以下、添付図面に従って本開示の技術に係るシステムの実施形態の一例について説明する。 Below, an example of an embodiment of a system relating to the technology disclosed herein will be described with reference to the accompanying drawings.
先ず、以下の説明で使用される文言について説明する。 First, let me explain the terminology used in the following explanation.
以下の実施形態において、符号付きのプロセッサ(以下、単に「プロセッサ」と称する)は、1つの演算装置であってもよいし、複数の演算装置の組み合わせであってもよい。また、プロセッサは、1種類の演算装置であってもよいし、複数種類の演算装置の組み合わせであってもよい。演算装置の一例としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、GPGPU(General-Purpose computing on Graphics Processing Units)、APU(Accelerated Processing Unit)等が挙げられる。 In the following embodiments, a coded processor (hereinafter simply referred to as a "processor") may be a single arithmetic unit or a combination of multiple arithmetic units. Furthermore, a processor may be a single type of arithmetic unit or a combination of multiple types of arithmetic units. Examples of arithmetic units include a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), a GPGPU (General-Purpose Computing on Graphics Processing Units), an APU (Accelerated Processing Unit), etc.
以下の実施形態において、符号付きのRAM(Random Access Memory)は、一時的に情報が格納されるメモリであり、プロセッサによってワークメモリとして用いられる。 In the following embodiments, coded random access memory (RAM) is memory in which information is temporarily stored and is used as work memory by the processor.
以下の実施形態において、符号付きのストレージは、各種プログラム及び各種パラメータ等を記憶する1つ又は複数の不揮発性の記憶装置である。不揮発性の記憶装置の一例としては、フラッシュメモリ(SSD(Solid State Drive))、磁気ディスク(例えば、ハードディスク)、又は磁気テープ等が挙げられる。 In the following embodiments, the coded storage refers to one or more non-volatile storage devices that store various programs, parameters, etc. Examples of non-volatile storage devices include flash memory (SSD (Solid State Drive)), magnetic disks (e.g., hard disks), and magnetic tapes.
以下の実施形態において、符号付きの通信I/F(Interface)は、通信プロセッサ及びアンテナ等を含むインタフェースである。通信I/Fは、複数のコンピュータ間での通信を司る。通信I/Fに対して適用される通信規格の一例としては、5G(5th Generation Mobile Communication System)、Wi-Fi(登録商標)、又はBluetooth(登録商標)等を含む無線通信規格が挙げられる。 In the following embodiments, a communication I/F (Interface) with a symbol is an interface that includes a communication processor, an antenna, etc. The communication I/F controls communication between multiple computers. Examples of communication standards that can be applied to the communication I/F include wireless communication standards such as 5G (5th Generation Mobile Communication System), Wi-Fi (registered trademark), or Bluetooth (registered trademark).
以下の実施形態において、「A及び/又はB」は、「A及びBのうちの少なくとも1つ」と同義である。つまり、「A及び/又はB」は、Aだけであってもよいし、Bだけであってもよいし、A及びBの組み合わせであってもよい、という意味である。また、本明細書において、3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「A及び/又はB」と同様の考え方が適用される。 In the following embodiments, "A and/or B" is synonymous with "at least one of A and B." In other words, "A and/or B" means that it may be just A, just B, or a combination of A and B. Furthermore, in this specification, the same concept as "A and/or B" also applies when three or more things are expressed connected by "and/or."
[第1実施形態] [First embodiment]
図1には、第1実施形態に係るデータ処理システム10の構成の一例が示されている。 Figure 1 shows an example of the configuration of a data processing system 10 according to the first embodiment.
図1に示すように、データ処理システム10は、データ処理装置12及びスマートデバイス14を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 1, the data processing system 10 includes a data processing device 12 and a smart device 14. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
スマートデバイス14は、コンピュータ36、受付装置38、出力装置40、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、受付装置38、出力装置40、及びカメラ42も、バス52に接続されている。 The smart device 14 includes a computer 36, a reception device 38, an output device 40, a camera 42, and a communication I/F 44. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The reception device 38, output device 40, and camera 42 are also connected to the bus 52.
受付装置38は、タッチパネル38A及びマイクロフォン38B等を備えており、ユーザ入力を受け付ける。タッチパネル38Aは、指示体(例えば、ペン又は指等)の接触を検出することにより、指示体の接触によるユーザ入力を受け付ける。マイクロフォン38Bは、ユーザの音声を検出することにより、音声によるユーザ入力を受け付ける。制御部46Aは、タッチパネル38A及びマイクロフォン38Bによって受け付けたユーザ入力を示すデータをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が、ユーザ入力を示すデータを取得する。 The reception device 38 is equipped with a touch panel 38A, a microphone 38B, etc., and receives user input. The touch panel 38A detects contact with an indicator (e.g., a pen or finger) to receive user input via the indicator. The microphone 38B detects the user's voice to receive user input via voice. The control unit 46A transmits data indicating the user input received by the touch panel 38A and the microphone 38B to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the data indicating the user input.
出力装置40は、ディスプレイ40A及びスピーカ40B等を備えており、データをユーザ20が知覚可能な表現形(例えば、音声及び/又はテキスト)で出力することでデータをユーザ20に対して提示する。ディスプレイ40Aは、プロセッサ46からの指示に従ってテキスト及び画像等の可視情報を表示する。スピーカ40Bは、プロセッサ46からの指示に従って音声を出力する。カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラである。 The output device 40 is equipped with a display 40A and a speaker 40B, and presents data to the user 20 by outputting the data in a form perceptible by the user 20 (e.g., audio and/or text). The display 40A displays visible information such as text and images in accordance with instructions from the processor 46. The speaker 40B outputs audio in accordance with instructions from the processor 46. The camera 42 is a compact digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor.
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54.
図2には、データ処理装置12及びスマートデバイス14の要部機能の一例が示されている。 Figure 2 shows an example of the main functions of the data processing device 12 and smart device 14.
図2に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って特定処理部290として動作することによって実現される。 As shown in FIG. 2, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32. The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as a specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
スマートデバイス14では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。受付出力プログラム60は、データ処理システム10によって特定処理プログラム56と併用される。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the smart device 14, the processor 46 performs the reception output processing. The storage 50 stores a reception output program 60. The reception output program 60 is used in conjunction with the specific processing program 56 by the data processing system 10. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output processing is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain the specific processing performed by the specific processing unit 290 of the data processing device 12. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、適切なフィードバックを行うことにより、ユーザがより正確なレビュー情報を得られるようにするためのものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and provides appropriate feedback, allowing users to obtain more accurate review information. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。これにより、新しいレビューコメントがシステムに取り込まれる。 The server periodically retrieves all review comments from the shopping platform via API, allowing new review comments to be added to the system.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the collected review comment data. Preprocessing includes removing unnecessary spaces and special characters, splitting review comments, and standardizing language.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのワードリストが設定される。 The server compares the review comment with a feature word list based on product attributes. For example, if the review is about a smartphone, a word list such as "image quality," "battery," and "operability" will be set.
サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is determined to be a "review with high product relevance."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似通ったレビューが連続して投稿されていないかを確認する。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server will flag reviews if any unusual patterns are detected.
具体例: Example:
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、レビューコメントが新しく投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。 Every time a new review comment is posted, the server compares it with all existing review comments to see if any have the exact same content.
サーバは、完全一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 If the server finds an exact match, it will flag the review as a "copy-and-paste review."
具体例: Example:
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。 When a review is submitted, the server will only allow it to be submitted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted.
サーバは、不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者に対してもレビュー内容と判定結果を通知する。 The server filters out inappropriate reviews and displays an error message to the user. It also notifies the administrator of the review content and the judgment result.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This system allows users to select products based on reliable review information, improving the quality of reviews across the entire online shopping platform.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームからAPIを利用し、全てのレビューコメントを一定期間ごとに取得する。この収集には、全商品のレビューコメントが含まれる。 The server uses an API from the shopping platform to periodically retrieve all review comments. This collection includes review comments for all products.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをテキストデータとして保存する。次に、レビューコメントから不要な空白、特殊文字、HTMLタグを除去するためのクリーニング処理を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server stores the collected review comments as text data. Next, it performs a cleaning process to remove unnecessary spaces, special characters, and HTML tags from the review comments. It then tokenizes the review comments into words and sentences, converting them into an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを事前に設定しておく。レビューコメントが投稿されると、サーバはそのコメント内の単語とワードリストを比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが使用される。サーバは、ワードリストに含まれる単語がコメント内にどの程度出現するかをスコア化し、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server pre-sets a word list based on the characteristics and attributes of each product. When a review comment is posted, the server compares the words in the comment with the word list. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" is used. The server scores how often words from the word list appear in the comment, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。似通った内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. If the server detects an unnatural pattern, it flags the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかを判定する。サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Each time a new review comment is submitted, the server compares it with all existing review comments. It uses sophisticated text comparison algorithms to determine whether a review comment with the exact same content already exists. If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ、投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。また、サーバは不正なレビューについて管理者に通知し、管理者がレビューを再確認する手助けを行う。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the posting. The server will also notify administrators of the fraudulent review and help them review the review.
この具体的なステップに基づき、信頼性の高いレビュー情報をユーザに提供し、ショッピングプラットフォーム全体の品質向上を図ることができるものである。 Based on these concrete steps, we will be able to provide users with reliable review information and improve the quality of the entire shopping platform.
(実施例1) (Example 1)
次に、実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 1. In the following explanation, the data processing device 12 will be referred to as a "server" and the smart device 14 will be referred to as a "terminal."
オンラインショッピングプラットフォームにおいて、ユーザが商品選定の参考にするレビューコメントは、その信頼性が重要である。しかし、偽レビューやコピペレビュー、不自然なパターンのレビューが横行しており、ユーザが正確な情報を得ることが困難である。このため、レビューコメントの信頼性を評価し、ユーザに正確なレビュー情報を提供する仕組みが求められている。 On online shopping platforms, the reliability of review comments, which users use as a reference when selecting products, is important. However, fake reviews, copy-and-paste reviews, and reviews with unnatural patterns are rampant, making it difficult for users to obtain accurate information. For this reason, there is a need for a system that can evaluate the reliability of review comments and provide users with accurate review information.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴語リストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報に基づいて商品を選定することが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a feature word list to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, and means for providing feedback on the review relevance, unnaturalness, and copy-and-paste determination results. This enables users to select products based on highly reliable review information.
「レビューコメント」とは、オンラインショッピングプラットフォームにおいてユーザが商品について投稿する意見や評価である。 "Review comments" are opinions and ratings posted by users about products on online shopping platforms.
「データ前処理」とは、収集したレビューコメントのテキストデータから不要な空白や特殊文字を除去し、トークン化や言語統一を行う処理である。 "Data preprocessing" refers to the process of removing unnecessary spaces and special characters from the text data of collected review comments, and performing tokenization and language standardization.
「特徴語リスト」とは、商品に関するレビューコメントの信頼性を評価するために設定された、商品属性に基づくキーワードのリストである。 A "characteristic word list" is a list of keywords based on product attributes that are set up to evaluate the reliability of review comments about a product.
「商品関連性」とは、レビューコメントが特定の商品について言及している度合いや、特徴語リストとの一致度を示す指標である。 "Product relevance" is an indicator that shows the degree to which review comments mention a specific product and the degree of match with the feature word list.
「パターン解析」とは、レビューコメントの投稿パターンを分析し、一定期間内に連続して同一または類似の内容が投稿されているかを判定するプロセスである。 "Pattern analysis" is the process of analyzing the posting patterns of review comments and determining whether the same or similar content has been posted consecutively within a certain period of time.
「不自然なレビュー」とは、通常のユーザ行動から逸脱していると判断されるレビューのことで、短期間に似た内容のコメントが連続して投稿される場合などを指す。 An "unnatural review" is a review that is deemed to deviate from normal user behavior, such as when similar comments are posted in succession within a short period of time.
「コピペレビュー」とは、既存のレビューコメントをそのままコピーして投稿されたコメントのことであり、内容が全く同一であるレビューを指す。 A "copy-and-paste review" is a comment that is posted by simply copying an existing review comment, and refers to a review with exactly the same content.
「フィードバック」とは、レビューコメントの関連性、不自然さ、コピペ判定結果をユーザおよび管理者に通知し、適切なレビューのみを許可する処理である。 "Feedback" is a process that notifies users and administrators of the relevance, unnaturalness, and copy-and-paste judgment results of review comments, allowing only appropriate reviews.
本発明は、オンラインショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザがより正確なレビュー情報を得られるようにするシステムである。以下に、具体的な実施形態を詳述する。 The present invention is a system that evaluates the reliability of review comments on online shopping platforms, allowing users to obtain more accurate review information. Specific embodiments are described in detail below.
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを利用して定期的に全てのレビューコメントを取得する。これにより、最新のレビューコメントも含めてデータベースに定期的に保存される。使用する具体的なソフトウェアとしては、Pythonのrequestsライブラリを用いる。 The server periodically retrieves all review comments using the shopping platform's API. This periodically saves the comments, including the most recent ones, to the database. The specific software used is the Python requests library.
データ前処理 Data preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、テキストデータのトークン化、言語統一などが含まれる。この処理には、Pythonのnltkライブラリおよびreモジュールが使用される。 The server preprocesses the collected review comment data. This includes removing unnecessary whitespace and special characters, tokenizing the text data, and unifying the language. This process uses the Python nltk library and re module.
商品関連性の判定 Product relevance determination
サーバは、レビューコメントと商品属性に基づく特徴語リストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などの特徴語リストが設定される。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。具体的なソフトウェアとしては、Pythonのscikit-learnライブラリを使用する。 The server compares the review comments with a feature word list based on product attributes. For example, for a review about a smartphone, a feature word list such as "image quality," "battery," and "operability" is set. The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is deemed to be "highly relevant to the product." The specific software used is the Python scikit-learn library.
具体例 Specific examples
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
ワードリストに「画質」が含まれるため、高スコアと判定される。 Since "image quality" is included in the word list, it is judged to have a high score.
不自然なレビューの判定 Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似た内容のレビューが連続して投稿されていないかを確認する。サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。この工程には、PythonのPandasライブラリおよび時系列解析が用いられる。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time. If the server detects an unnatural pattern, it flags those reviews. This process uses Python's Pandas library and time series analysis.
具体例 Specific examples
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
サーバは、これらを不自然なレビューと判定し、フラグを付ける。 The server will identify these as unnatural reviews and flag them.
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。ソフトウェアとして、Pythonのdifflibライブラリを使用する。 Every time a new review comment is posted, the server compares it with all existing review comments to see if there are any identical comments. If the server finds a matching comment, it flags the review as a "copy-and-paste review." The software uses the Python difflib library.
具体例 Specific examples
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
サーバは、レビュー2をコピペレビューと判定し、フラグを付ける。 The server determines that Review 2 is a copy-and-paste review and flags it.
フィードバック Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者にはレビュー内容と判定結果を通知する。この処理には、PythonのFlaskまたはDjangoフレームワークおよび通知用のメールサーバ(SMTP)が使用される。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. Inappropriate reviews are filtered out and an error message is displayed to the user. The server also notifies the administrator of the review content and the result of the judgment. This process uses the Python Flask or Django framework and an email server (SMTP) for notifications.
プロンプト文の例 Example prompt
ユーザーが投稿したレビューコメント「このスマホのバッテリー持ちは優れています。」を評価し、以下の条件に基づいてフィードバックを行ってください。 Please rate the user-submitted review comment, "This phone has excellent battery life." and provide feedback based on the following criteria:
条件: Conditions:
1. 商品関連性の高いレビューかどうかを判定するため、「バッテリー」「持ち」「優れています」などの特徴語リストに基づいてスコアリングを行う。 1. To determine whether a review is highly relevant to the product, it is scored based on a list of characteristic words such as "battery," "lifespan," and "excellent."
2. 一定期間内に似たレビューが連続して投稿されていないか確認する。 2. Check to see if similar reviews have been posted consecutively within a certain period of time.
3. 既存のレビューコメントと比較し、コピペレビューかどうかをチェックする。 3. Compare with existing review comments to check if the review is a copy-and-paste one.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上することが期待される。 This system will enable users to select products based on reliable review information, and is expected to improve the quality of reviews across online shopping platforms.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
レビューコメントの収集を行う。サーバは、ショッピングプラットフォームのAPIを通じて定期的に全てのレビューコメントを取得する。入力はAPIリクエストであり、出力は取得されたJSON形式のレビューコメントデータである。サーバは、APIリクエストを送信し、受信したデータをデータベースに保存する。 Collects review comments. The server periodically retrieves all review comments through the shopping platform's API. The input is the API request, and the output is the retrieved review comment data in JSON format. The server sends the API request and stores the received data in a database.
ステップ2: Step 2:
データ前処理を行う。サーバは、収集したレビューコメントのデータに対して前処理を実行する。入力はJSON形式のレビューコメントデータであり、出力は前処理されたテキストデータである。サーバは、不要な空白や特殊文字を除去し、テキストデータをトークン化し、言語統一を行う。 Performs data preprocessing. The server performs preprocessing on the collected review comment data. The input is JSON-formatted review comment data, and the output is preprocessed text data. The server removes unnecessary whitespace and special characters, tokenizes the text data, and standardizes the language.
ステップ3: Step 3:
商品関連性の判定を行う。サーバは、前処理されたレビューコメントと商品属性に基づく特徴語リストを比較する。入力は前処理されたテキストデータと特徴語リストであり、出力はスコアリングされたレビューコメントデータである。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 Determines product relevance. The server compares preprocessed review comments with a feature word list based on product attributes. The input is preprocessed text data and a feature word list, and the output is scored review comment data. The server scores how often words included in the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定を行う。サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。入力は特定期間内のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、短期間に似た内容のレビューが連続して投稿されていないかを確認し、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 Identifies unnatural reviews. The server analyzes patterns in review comments posted within a certain period of time. The input is review comment data from a specific period of time, and the output is the judgment result and flagged data. The server checks whether reviews with similar content have been posted in succession within a short period of time, and if an unnatural pattern is detected, it flags those reviews.
ステップ5: Step 5:
コピペレビューの判定を行う。サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。入力は新しいレビューコメントと既存のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 Determines copy-and-paste reviews. Every time a new review comment is posted, the server compares it with all existing review comments. The input is the new review comment and existing review comment data, and the output is the determination result and flagged data. If the server finds a matching comment, it flags the review as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックを行う。サーバは、レビュー投稿時にそのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。入力はレビューコメントとそれに対する各種判定結果であり、出力はユーザおよび管理者への通知結果である。サーバは、不適切なレビューについてフィルタリングを行い、エラーメッセージをユーザに表示し、管理者に対してもレビュー内容と判定結果を通知する。 Provides feedback. The server will only allow a review to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. The input is the review comment and various judgment results, and the output is notifications to the user and administrator. The server filters out inappropriate reviews, displays an error message to the user, and notifies the administrator of the review content and judgment results.
(応用例1) (Application Example 1)
次に、応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来のショッピングプラットフォームでは、信頼性の低いレビューコメントが多く投稿され、それがユーザーの購買判断を誤らせる原因となっていた。また、短期間に似通ったレビューやコピペレビューが投稿されることにより、レビューの信頼性が低下する問題があった。従って、信頼性の高いレビュー情報をユーザーに提供し、より正確な購買判断を支援するシステムの開発が求められていた。 On conventional shopping platforms, many unreliable review comments were posted, causing users to make incorrect purchasing decisions. There was also the problem of similar reviews and copy-paste reviews being posted within a short period of time, reducing the reliability of the reviews. Therefore, there was a need to develop a system that could provide users with reliable review information and help them make more accurate purchasing decisions.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、レビューコメントの信頼性をリアルタイムで評価しフィードバックする手段と、信頼性の高い順にレビューを表示する手段と、を含む。これにより、ユーザーは信頼性の高いレビューをリアルタイムで受け取り、それに基づいてより正確な購買判断を行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for providing feedback on the relevance, unnaturalness, and copy-and-paste determination results of the reviews, means for evaluating and providing feedback on the reliability of the review comments in real time, and means for displaying reviews in order of reliability. This allows users to receive reliable reviews in real time and make more accurate purchasing decisions based on them.
「レビューコメント」とは、ユーザーが商品やサービスに対して評価や感想を文章形式で記述したものである。 A "review comment" is a written comment written by a user expressing their evaluation or opinion of a product or service.
「収集する手段」とは、オンラインプラットフォームからデータを取得し、システムに取り込む方法を指す。 "Means of collection" refers to the method by which data is obtained from online platforms and entered into the system.
「データ前処理」とは、取得されたデータを解析しやすくするために、不要な情報を削除し、整形するプロセスである。 "Data preprocessing" is the process of removing unnecessary information and formatting acquired data to make it easier to analyze.
「特徴ワードリスト」とは、特定の商品やサービスに関連する重要なキーワードを集めたリストである。 A "characteristic word list" is a list of important keywords related to a specific product or service.
「商品関連性」とは、レビューコメントが特定の商品やサービスにどれだけ関連しているかを示す度合いである。 "Product relevance" is the degree to which a review comment relates to a particular product or service.
「パターンを解析する手段」とは、レビューコメントの中の一定のテンプレートや類似性を検出する方法である。 "Pattern analysis methods" are methods for detecting certain templates or similarities in review comments.
「不自然なレビュー」とは、短期間に大量に投稿されたり、同じ内容が繰り返されるなど、通常のユーザー行動とは異なるコメントである。 "Unnatural reviews" are comments that deviate from normal user behavior, such as those posted in large numbers in a short period of time or those that contain repeated, repeated comments.
「コピペレビュー」とは、他のコメントと完全に同一の内容がコピー&ペーストされたレビューコメントである。 A "copy-and-paste review" is a review comment in which the exact same content as another comment is copied and pasted.
「フィードバックする手段」とは、ユーザーや管理者に対して評価結果を通知し、適切なアクションを促すための方法である。 "Means of providing feedback" refers to methods for notifying users and administrators of evaluation results and encouraging them to take appropriate action.
「信頼性をリアルタイムで評価する手段」とは、レビューが投稿される瞬間に、その評価の正確性や信用度を自動的に判定する方法である。 "Means for assessing trustworthiness in real time" refers to a method that automatically determines the accuracy and credibility of a review the moment it is posted.
「信頼性の高い順に表示する手段」とは、評価が高いレビューコメントを上位に表示することで、ユーザーが参考にしやすくする方法である。 "Displaying in order of reliability" is a method of displaying highly rated review comments at the top, making them easier for users to refer to.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザーがより正確なレビュー情報を得られるようにするものである。このシステムは、以下のプロセスを通じて実施される。 The system of the present invention evaluates the reliability of review comments on shopping platforms, allowing users to obtain more accurate review information. This system is implemented through the following process:
使用するハードウェア Hardware to use
スマートフォン: ユーザーがレビューコメントを投稿するための端末として用いる。 Smartphone: Used by users as a device to post review comments.
サーバ: レビューコメントの収集、データ前処理、解析、評価、フィードバックを行う中枢的なコンピュータ。 Server: A central computer that collects review comments, preprocesses data, analyzes, evaluates, and provides feedback.
APIサーバ: ショッピングプラットフォームからレビューコメントを取得するためのインターフェースとして用いる。 API server: Used as an interface to retrieve review comments from the shopping platform.
使用するソフトウェア Software used
Python: サーバサイドのデータ処理及び解析に使用。 Python: Used for server-side data processing and analysis.
Flask: PythonのWebフレームワークとしてAPIサーバを構築するために用いる。 Flask: A Python web framework used to build API servers.
MySQL: データベース管理システムとして収集したレビューコメントを保存するために使用。 MySQL: Used as a database management system to store collected review comments.
自然言語処理ライブラリ: レビューコメントの前処理および解析に使用。 Natural language processing library: Used for preprocessing and parsing review comments.
データ加工およびデータ演算の流れ Data processing and calculation flow
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから定期的にAPIを介してレビューコメントを取得する。このAPIサーバはFlaskを用いて構築されており、取得したデータはMySQLデータベースに保存される。 The server periodically retrieves review comments from the shopping platform via API. This API server is built using Flask, and the retrieved data is stored in a MySQL database.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントのデータを前処理する。前処理には、Pythonの自然言語処理ライブラリを用いて、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the retrieved review comment data. This preprocessing includes removing unnecessary whitespace and special characters, splitting review comments, and standardizing language using a Python natural language processing library.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのキーワードが用いられる。サーバはスコアリングを行い、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server compares the review comment with a list of characteristic words based on product attributes. For example, a review about a smartphone would use keywords such as "image quality," "battery," and "operability." The server then scores the review comment, and if it scores above a certain level, it determines that the review comment is "highly relevant to the product."
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントを解析し、短期間に似通ったレビューが連続して投稿されていないかを確認する。不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server analyzes review comments posted within a certain period of time to see if similar reviews have been posted in succession within a short period of time. If an unnatural pattern is detected, those reviews are flagged.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックし、完全一致するコメントがあった場合、それを「コピペレビュー」としてフラグ付けする。 The server compares the newly posted review comment with all existing review comments. It checks to see if there are any identical comments, and if there is an exact match, it flags it as a "copy-and-paste review."
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可し、ユーザーにリアルタイムでフィードバックする。また、信頼性の高い順にレビューを表示する機能も持つ。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted, and will provide real-time feedback to the user. It also has a function to display reviews in order of reliability.
具体例とプロンプト文の例 Specific examples and prompt sentence examples
具体例として、以下のようなレビューコメントを考慮する。 As a concrete example, consider the following review comment:
商品: スマートフォン Product: Smartphone
投稿レビュー: 「このスマホのバッテリーは長持ちします。」 Review: "This phone's battery lasts a long time."
プロンプト文の例は以下である。 An example of a prompt is as follows:
「このレビューが製品に関連しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review is relevant to the product: 'This phone's battery lasts a long time.'"
「このレビューが不自然なパターンに該当しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review fits any unnatural pattern: 'This phone's battery lasts a long time.'"
「このレビューが既存のレビューと完全一致しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review exactly matches an existing review: 'This phone's battery lasts a long time.'"
これにより、ユーザーは信頼性の高いレビューを基に商品を選ぶことができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This will allow users to choose products based on reliable reviews, improving the quality of ratings across online shopping platforms.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
サーバは、ショッピングプラットフォーム提供のAPIを使用してレビューコメントを定期的に収集する。サーバは、APIを介して取得したレビューコメントをJSON形式で受け取り、MySQLデータベースに保存する。入力はAPIから取得したJSONデータであり、出力はデータベースに保存されたレビューコメントである。 The server periodically collects review comments using an API provided by the shopping platform. The server receives the review comments obtained via the API in JSON format and stores them in a MySQL database. The input is the JSON data obtained from the API, and the output is the review comments stored in the database.
ステップ2: Step 2:
データ前処理: Data preprocessing:
サーバは、収集したレビューコメントのデータを前処理する。サーバは、Pythonの正規表現ライブラリを使用し、不要な空白や特殊文字を除去し、レビューコメントを文単位に分割する。さらに、異なる形式のデータを統一形式に変換する。入力は生のレビューコメントであり、出力は前処理されたクリーンデータである。 The server preprocesses the collected review comment data. It uses Python's regular expression library to remove unnecessary whitespace and special characters and split the review comments into sentences. It also converts data in different formats into a unified format. The input is the raw review comments, and the output is the preprocessed, clean data.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
サーバは、前処理されたレビューコメントと事前に設定した特徴ワードリストを比較する。サーバは、特徴ワードリストに含まれる単語の出現頻度を計算し、一定のスコア以上であれば商品関連性が高いと判定する。入力は前処理されたレビューコメントと特徴ワードリストであり、出力は関連性の高いレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with a pre-set feature word list. The server calculates the frequency of occurrence of words included in the feature word list, and determines that a product is highly relevant if the frequency is above a certain score. The input is the preprocessed review comments and the feature word list, and the output is data flagged as highly relevant reviews.
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
サーバは、前処理されたレビューコメントを一定期間内に投稿された他のレビューコメントと比較し、パターンを解析する。サーバは、類似のレビューコメントが短期間に大量に投稿されている場合、それを不自然なレビューとして判定し、フラグを立てる。入力は前処理されたレビューコメントと過去のレビューコメントであり、出力は不自然なレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with other review comments posted within a certain period of time and analyzes patterns. If a large number of similar review comments are posted in a short period of time, the server determines that they are unnatural reviews and flags them. The input is the preprocessed review comments and past review comments, and the output is data flagged as unnatural reviews.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと内容一致度で比較する。サーバは、全く同じ内容のレビューコメントを見つけた場合、これをコピペレビューとしてフラグ付けする。入力は新しいレビューコメントと既存のレビューコメントであり、出力はコピペレビューとして判定されたデータである。 The server compares the newly posted review comment with all existing review comments based on content similarity. If the server finds a review comment with exactly the same content, it flags it as a copy-and-paste review. The input is the new review comment and the existing review comment, and the output is the data determined to be a copy-and-paste review.
ステップ6: Step 6:
フィードバック: Feedback:
サーバは、レビューの関連性、不自然さ、コピペの各判定結果をもとに、レビュー投稿者にリアルタイムでフィードバックを行う。ユーザーの端末には、レビューが信頼性の高い順に表示される。また、信頼性の低いレビューは投稿が拒否され、その理由がユーザーに通知される。入力はレビュー判定の各結果であり、出力はフィードバックメッセージである。 The server provides real-time feedback to reviewers based on the review's relevance, unnaturalness, and copy-and-paste assessment results. Reviews are displayed on the user's device in order of reliability. Reviews with low reliability are rejected, and the user is notified of the reason. The input is the review assessment results, and the output is a feedback message.
これにより、ユーザーは信頼性の高いレビューコメントを基に、より正確な購買判断を行うことが可能となる。 This allows users to make more accurate purchasing decisions based on reliable review comments.
更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 Furthermore, an emotion engine that estimates the user's emotion may be combined. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、さらにユーザの感情を認識してレビュー情報を最適化するものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and further optimizes review information by recognizing user sentiment. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントをクリーニングする。不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments, removing unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, making them easier to analyze.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが用意される。 The server compares review comments with a word list based on the features and attributes of each product. For example, for a review about a smartphone, a word list would be prepared, including "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores the number of times the words in the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は抜群です。」 Review comment: "The image quality of this smartphone is outstanding."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
具体例: Example:
レビュー1:「素晴らしい商品です!」 Review 1: "This is a great product!"
レビュー2:「素晴らしい商品です!」 Review 2: "This is a great product!"
レビュー3:「素晴らしい商品です!」 Review 3: "This is a great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
具体例: Example:
レビュー1:「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2:「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, or neutral sentiment.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
具体例: Example:
レビューコメント:「このスマホのバッテリーはすぐに切れるので使い物になりません。」 Review comment: "This phone's battery dies so quickly it's useless."
感情分析結果:ネガティブ Sentiment analysis result: Negative
スコア:低評価として反映。 Score: Reflected as a low rating.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the post.
サーバは、フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知する。一方、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 The server notifies the user and administrator of the feedback along with the emotion score generated by the emotion engine. Administrators are also notified to further review and respond to the review.
これにより、本発明のシステムは、レビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供するものである。感情エンジンの導入によって、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 As a result, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with peace of mind. The introduction of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary spaces, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, preparing them in an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントを比較する。レビューコメント内の単語とワードリストを比較し、スコア化する。例えば、スマートフォンに関連するワードリストには「画質」「バッテリー」「操作性」などが含まれる。 The server compares review comments using a word list based on the features and attributes of each product. It compares the words in the review comments with the word list and generates a score. For example, a word list related to smartphones might include "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。特に文の長さ、使用される単語、文の構造などを比較する。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. In particular, it compares sentence length, the words used, sentence structure, etc.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
感情エンジンによる感情認識 Emotion recognition using an emotion engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。具体的には、自然言語処理アルゴリズムを用いて、文中に含まれる感情表現を抽出し、スコアリングする。 The server uses an emotion engine to analyze review comments and classify them into positive, negative, or neutral sentiment. Specifically, it uses a natural language processing algorithm to extract and score emotional expressions contained in the sentences.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿が拒否された理由を説明する。 The server will only allow a review comment to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If any flags are raised, the server will display an error message to the user explaining why the post was rejected.
サーバは、不適切なレビューについてはフィルタリングを行い、さらに感情エンジンによる感情スコアも含めてユーザおよび管理者に通知する。管理者にはレビュー内容とフラグ立ちの理由、感情スコアなどの詳細情報が送信され、必要な場合にはレビューを再確認するための手助けが提供される。 The server filters out inappropriate reviews and notifies users and administrators, including the sentiment score generated by the sentiment engine. Administrators are sent detailed information such as the review content, the reason it was flagged, and the sentiment score, and are offered help in re-checking the review if necessary.
この具体的なステップに基づき、本発明のシステムはレビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供する。感情エンジンの統合により、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 Based on these specific steps, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with confidence. The integration of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
(実施例2) (Example 2)
次に、実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 2. In the following explanation, the data processing device 12 will be referred to as a "server" and the smart device 14 will be referred to as a "terminal."
従来のショッピングプラットフォームにおいては、レビューコメントの真偽を判断するための適切なメカニズムが欠如しており、ユーザが不正確な情報に基づいて購買決定を行うリスクがあった。このため、レビューコメントの信頼性を向上させ、ユーザが安心して利用できる環境を提供することが求められている。また、レビューコメントの感情を正確に把握することで、商品の評価情報をより正確に反映させる必要がある。 Traditional shopping platforms lacked an appropriate mechanism for determining the authenticity of review comments, leaving users at risk of making purchasing decisions based on inaccurate information. This has created a need to improve the reliability of review comments and provide an environment where users can use them with peace of mind. It is also necessary to accurately understand the sentiment behind review comments in order to more accurately reflect product evaluation information.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情を分析する手段と、レビューの関連性、不自然さ、コピペ判定結果および感情分析結果をフィードバックする手段と、レビューコメントが不自然な場合やコピペの場合、投稿を拒否する手段と、を含む。これにより、レビューコメントの信頼性を向上させ、ユーザが安心してレビューを参照できる環境を提供し、商品の評価情報をより正確に反映させることが可能となる。 The identification process by the identification processing unit 290 of the data processing device 12 in Example 2 is realized by the following means. In this invention, the server includes means for collecting review comments, means for performing data preprocessing of the review comments, means for determining product relevance by comparing the review comments with a characteristic word list, means for analyzing the patterns of the review comments to determine unnatural reviews, means for comparing the review comments to determine comments with identical content as copy-and-paste reviews, means for analyzing the sentiment of the review comments, means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results, and means for rejecting the posting of review comments that are unnatural or copy-and-paste. This improves the reliability of review comments, provides an environment where users can refer to reviews with confidence, and makes it possible to more accurately reflect product evaluation information.
「レビューコメント」とは、ショッピングプラットフォーム上でユーザが商品やサービスに対して記述する意見や評価のテキストである。 "Review comments" are textual opinions and evaluations written by users on shopping platforms about products and services.
「データ前処理」とは、収集したレビューコメントから不要な要素を取り除き、解析に適した形式に変換する処理である。 "Data preprocessing" is the process of removing unnecessary elements from collected review comments and converting them into a format suitable for analysis.
「特徴ワードリスト」とは、特定の商品やサービスに関連するキーワードのリストで、レビューコメントと比較するために使用されるものである。 A "characteristic word list" is a list of keywords related to a specific product or service that is used to compare with review comments.
「商品関連性判定」とは、レビューコメントが特定の商品やサービスに関連するかを判断するプロセスである。 "Product relevance determination" is the process of determining whether a review comment is relevant to a specific product or service.
「パターン解析」とは、レビューコメントの内容や形式を解析し、特定のパターンや異常を検出するプロセスである。 "Pattern analysis" is the process of analyzing the content and format of review comments to detect specific patterns or anomalies.
「不自然なレビュー」とは、内容や書き方が短期間内に連続して投稿されるなど、通常と異なるパターンを示すレビューコメントである。 "Unnatural reviews" are review comments that show an unusual pattern, such as content or writing style being posted repeatedly within a short period of time.
「コピペレビュー」とは、既存のレビューコメントと全く同じ内容のレビューコメントを指すものである。 A "copy-and-paste review" refers to a review comment that has exactly the same content as an existing review comment.
「感情分析」とは、レビューコメントの内容を解析し、ポジティブ、ネガティブ、中立といった感情の分類を行うプロセスである。 "Sentiment analysis" is the process of analyzing the content of review comments and classifying their sentiments as positive, negative, or neutral.
「フィードバック」とは、解析結果や判定結果をユーザまたは管理者に対して通知し、必要な対応を促す情報の提供である。 "Feedback" refers to the provision of information to notify users or administrators of analysis and judgment results, and to encourage them to take necessary action.
「投稿拒否」とは、不自然なレビューやコピペレビューが投稿されるのを防ぐために、ユーザに対して投稿を許可しない動作を指す。 "Posting refusal" refers to the action of not allowing users to post in order to prevent unnatural reviews or copy-and-paste reviews from being posted.
「サーバ」とは、レビューコメントの収集、前処理、解析、判定、フィードバック、投稿拒否などの一連の処理を管理・実行するコンピュータシステムである。 A "server" is a computer system that manages and executes a series of processes, including the collection, preprocessing, analysis, judgment, feedback, and rejection of review comments.
本発明のシステムは、ショッピングプラットフォーム上でレビューコメントの信頼性を評価し、ユーザの感情を認識してレビュー情報を最適化するものである。そのための具体的な動作や処理を以下に示す。 The system of the present invention evaluates the reliability of review comments on a shopping platform, recognizes user emotions, and optimizes review information. The specific operations and processes for this purpose are described below.
1. レビューコメントの収集 1. Collecting review comments
システムは、ショッピングプラットフォームのAPIを通じてレビューコメントを取得する。サーバは定期的にAPIエンドポイントにリクエストを送り、取得したレビューコメントをデータベースに保存する。具体的には、データベースとしてMySQLやPostgreSQLを使用することができる。 The system retrieves review comments through the shopping platform's API. The server periodically sends requests to the API endpoint and stores the retrieved review comments in a database. Specifically, MySQL or PostgreSQL can be used as the database.
例えば、サーバがAPIエンドポイント "https://example.com/api/reviews" にアクセスして、取得したレビューコメントを "reviews" テーブルに格納する。 For example, the server accesses the API endpoint "https://example.com/api/reviews" and stores the retrieved review comments in the "reviews" table.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化する。PythonのNLPライブラリであるNLPKを使用して、この前処理を行うことができる。 The server cleans the retrieved review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences. This preprocessing can be performed using NLPK, a Python NLP library.
例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にテキストクリーニングを行い、その後トークン化する。 For example, a comment such as "This product is <p>great</p>!" is text cleaned to "This product is great!" and then tokenized.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを生成し、レビューコメントと比較する。例えば、スマートフォンのレビューに「画質」「バッテリー」「操作性」といったキーワードを含むワードリストを使用する。 The server generates a word list based on the features and attributes of each product and compares it with the review comments. For example, for smartphone reviews, a word list containing keywords such as "image quality," "battery," and "operability" is used.
具体的には、レビューコメント内のキーワードの出現頻度をスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。例えば、サーバが「このスマホの画質は抜群です」というコメントを解析し、ワードリストに「画質」が含まれていることで高いスコアを付与する。 Specifically, the frequency of keywords appearing in review comments is scored, and if the score is above a certain level, it is determined to be a "review with high product relevance." For example, the server analyzes a comment such as "The image quality of this smartphone is outstanding," and assigns a high score because "image quality" is included in the word list.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたすべてのレビューコメントを解析し、内容のパターンを確認する。具体的には、同じような内容や形式のレビューコメントが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. Specifically, it checks to see if review comments with similar content or format have been posted consecutively within a short period of time.
不自然なパターンが検出された場合、そのレビューコメントにフラグを付与する。例えば、サーバが「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿されている場合、それらに不自然さのフラグを付ける。 If an unnatural pattern is detected, the review comment is flagged. For example, if the server sees multiple reviews with the same content, such as "Great product!", posted within a short period of time, it will flag them as unnatural.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用し、一致するかどうかを判定する。 Each time a new review comment is submitted, the server compares it with all existing review comments, using sophisticated text comparison algorithms (e.g., Python's difflib library) to determine whether there is a match.
一致が見つかった場合、サーバはそのレビューコメントに「コピペレビュー」としてフラグを立てる。例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 If a match is found, the server will flag the review comment as a "copy-and-paste review." For example, if a comment already exists that says "This product is amazing!", the server will add a flag.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情解析エンジンに投入し、ポジティブ、ネガティブ、中立といった感情に分類する。具体的には、TextBlobやVADERなどの感情解析ライブラリを使用することができる。 The server inputs the review comments into a sentiment analysis engine and classifies them into positive, negative, or neutral sentiment. Specifically, sentiment analysis libraries such as TextBlob and VADER can be used.
これにより、感情スコアを計算し、そのスコアを商品の総合評価に反映する。例えば、TextBlobを使用して「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントを解析し、ネガティブスコアを付与する。 This allows us to calculate an emotional score, which is then reflected in the overall rating of the product. For example, we can use TextBlob to analyze a comment such as "This phone's battery runs out quickly, so it's useless" and assign it a negative score.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合は、エラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user explaining the reason for the post.
また、感情エンジンによる感情スコアをユーザおよび管理者に通知し、レビューの信頼性向上を図る。例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促す。また、管理者には「新しい不自然なレビューが検出されました。確認してください」と通知する。 The emotion engine also notifies users and administrators of the emotion score, helping to improve the reliability of reviews. For example, the server may notify users that "this review has been flagged as unnatural" and encourage them to resubmit. It may also notify administrators that "a new unnatural review has been detected. Please check it."
生成AIモデルへのプロンプト文の例 Example prompt for a generative AI model
「このレビューコメントが特定の商品に関連しているか、そしてその感情を分類してください。例: 'このスマホの画質は抜群です。'」 "Please classify whether this review comment relates to a specific product and its sentiment. Example: 'The image quality of this phone is outstanding.'"
「このリストのレビューコメントが不自然であるかどうか判定してください。例: '素晴らしい商品です!', '素晴らしい商品です!'」 "Please determine whether the review comments on this listing are unnatural. Example: 'Great product!', 'Great product!'"
「このレビューコメントが既存のコメントと一致するか、コピペレビューであるかどうかチェックしてください。例: 'この商品はとても素晴らしいです!'」 "Check if this review comment matches an existing comment or is a copypasta review. Example: 'This product is amazing!'"
以上が、本発明のシステムを実施するための形態である。 The above is a form for implementing the system of the present invention.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
入力:ショッピングプラットフォームのAPIエンドポイントURL Input: Shopping platform API endpoint URL
具体的な動作:サーバは、定期的にAPIエンドポイントにリクエストを送信して、レビューコメントを取得する。例えば、APIエンドポイント "https://example.com/api/reviews" にアクセスする。 Specific behavior: The server periodically sends requests to an API endpoint to retrieve review comments. For example, it accesses the API endpoint "https://example.com/api/reviews".
データ加工:取得したレビューコメントにメタデータ(ユーザID、商品ID、投稿日時など)を付与する。 Data processing: Metadata (user ID, product ID, posting date and time, etc.) is added to the acquired review comments.
出力:レビューコメントおよびメタデータが含まれたデータセット Output: Dataset containing review comments and metadata
具体的な動作:サーバは取得したデータセットをデータベース(例:MySQLやPostgreSQL)に保存する。 Specific operation: The server stores the acquired dataset in a database (e.g., MySQL or PostgreSQL).
ステップ2: Step 2:
データ前処理: Data preprocessing:
入力:データベースに保存されたレビューコメント Input: Review comments stored in the database
具体的な動作:サーバはレビューコメントをクリーニングする。具体的には、不要な空白、特殊文字、HTMLタグの除去を行うため、PythonのNLPライブラリ(例:NLPK)を使用する。 What it does: The server cleans the review comments. Specifically, it uses a Python NLP library (e.g., NLPK) to remove unnecessary whitespace, special characters, and HTML tags.
データ加工:レビューコメントを単語や文単位でトークン化する。 Data processing: Tokenize review comments into words and sentences.
出力:クリーンでトークン化されたレビューコメント Output: Clean, tokenized review comments
具体的な動作:例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にクリーニングし、単語ごとに分ける。 Specific operation: For example, a comment such as "This product is <p>great</p>!" is cleaned to "This product is great!" and separated into individual words.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
入力:クリーンでトークン化されたレビューコメント、商品の特徴ワードリスト Input: Clean, tokenized review comments, product feature word list
具体的な動作:サーバはレビューコメントと特徴ワードリストを比較する。ワードリストには、「画質」「バッテリー」「操作性」などの製品属性に基づくキーワードが含まれる。 Specific operation: The server compares the review comments with the feature word list. The word list includes keywords based on product attributes such as "image quality," "battery," and "operability."
データ演算:レビューコメント内のキーワードの出現頻度をスコアリングする。 Data calculation: Score the frequency of keywords appearing in review comments.
出力:商品関連性スコア Output: Product relevance score
具体的な動作:例えば、「このスマホの画質は抜群です」というコメントに対し、ワードリストに「画質」が含まれていることで高スコアを付与する。 Specific behavior: For example, a comment such as "The image quality of this smartphone is outstanding" will be given a high score if the word list includes "image quality."
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
入力:一定期間内に投稿された全てのレビューコメント Input: All review comments posted within a certain period
具体的な動作:サーバはレビューコメントの内容のパターンを解析する。同じ内容や書き方のレビューが連続して投稿されていないかチェックする。 Specific operation: The server analyzes the content patterns of review comments. It checks whether reviews with the same content or writing style have been posted consecutively.
データ演算:不自然なパターンを検出するための解析 Data calculations: Analysis to detect unnatural patterns
出力:不自然さのフラグが立ったレビューコメント Output: Review comments flagged as unnatural
具体的な動作:例えば、「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿された場合、それらに不自然さのフラグを付ける。 Specific behavior: For example, if the same review saying "This is a great product!" is posted multiple times within a short period of time, it will be flagged as unnatural.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
入力:新しいレビューコメント、既存のレビューコメント Input: New review comment, Existing review comment
具体的な動作:サーバは高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用して、新しいコメントを既存のレビューコメントと比較する。 What it does: The server uses advanced text comparison algorithms (e.g., Python's difflib library) to compare the new comment with existing review comments.
データ演算:コメントの内容の一致を確認するプロセス Data calculation: The process of checking whether the content of comments matches.
出力:コピペレビューとしてフラグが立ったレビューコメント Output: Review comments flagged as copy-paste reviews
具体的な動作:例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 Specific behavior: For example, if a comment saying "This product is amazing!" already exists, add a flag.
ステップ6: Step 6:
感情エンジンによる感情認識: Emotion recognition using the emotion engine:
入力:レビューコメント Enter: Review comment
具体的な動作:サーバはレビューコメントを感情解析エンジン(例:TextBlobやVADER)に投入し、感情を分類する。 Specific operation: The server inputs the review comments into a sentiment analysis engine (e.g., TextBlob or VADER) and classifies the sentiment.
データ演算:感情スコアの計算 Data calculation: Calculating emotion scores
出力:感情スコア付きレビューコメント Output: Review comments with sentiment scores
具体的な動作:例えば、「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントをネガティブとしてスコア付けする。 Specific behavior: For example, a comment such as "This smartphone's battery runs out quickly, making it useless" is scored as negative.
ステップ7: Step 7:
フィードバックとフィルタリング: Feedback and filtering:
入力:レビューコメント(関連性、不自然さ、コピペのフラグ付き)、感情スコア Input: Review comments (with flags for relevance, unnaturalness, and copy-paste), sentiment score
具体的な動作:サーバはレビューコメントの投稿が試みられた際、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合はエラーメッセージをユーザに表示する。 Specific behavior: When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user.
データ演算:フィードバックおよび投稿判定 Data calculation: feedback and submission evaluation
出力:ユーザおよび管理者への通知 Output: Notification to users and administrators
具体的な動作:例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促し、同時に管理者には「新しい不自然なレビューが検出されました」と通知する。 Specific behavior: For example, the server notifies the user that "this review has been flagged as unnatural" and encourages them to resubmit, while simultaneously notifying the administrator that "a new unnatural review has been detected."
以上が、このシステムのプログラムの具体的な処理ステップである。 The above are the specific processing steps of this system's program.
(応用例2) (Application Example 2)
次に、応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来のレビューコメント評価システムには、レビューの信頼性を十分に保証するための機能が不足している場合が多い。例えば、商品に関連しないレビューや、不自然なレビュー、コピペレビューなどが混在してしまい、ユーザが正確な情報を得ることが困難である。また、レビューコメントの感情分析を行うことで、より精度の高い商品の評価を提供することが求められている。しかし、現行のシステムには感情分析機能が欠如しているため、レビューの質と信頼性を向上させることができない。 Traditional review comment rating systems often lack the functionality to fully guarantee the reliability of reviews. For example, they often contain a mixture of reviews that are unrelated to the product, unnatural reviews, and copy-and-paste reviews, making it difficult for users to obtain accurate information. There is also a demand for more accurate product ratings through sentiment analysis of review comments. However, current systems lack sentiment analysis functionality, making it impossible to improve the quality and reliability of reviews.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情分析を行う手段と、レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報を得られ、商品の評価をより正確に行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for performing sentiment analysis on the review comments, and means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results. This allows users to obtain highly reliable review information and more accurately evaluate products.
「レビューコメント」とは、商品やサービスに対してユーザが記入する感想や評価を指す。 "Review comments" refer to impressions and evaluations written by users about products and services.
「収集する手段」とは、特定の情報をインターネットやデータベースから取得するプロセスや機能を指す。 "Means of collection" refers to the process or function of obtaining specific information from the Internet or a database.
「データ前処理」とは、収集したデータを解析や解析前の処理を施し、不要な部分を削除したり形式を整えたりする工程を指す。 "Data preprocessing" refers to the process of analyzing collected data or performing pre-analysis processing to remove unnecessary parts and format the data.
「特徴ワードリスト」とは、特定の商品やカテゴリに関連する重要なキーワードをまとめたリストを指す。 A "characteristic word list" refers to a list of important keywords related to a specific product or category.
「商品関連性を判定する手段」とは、レビューコメントが特定の商品にどれだけ関連しているかを評価するための方法やアルゴリズムを指す。 "Means for determining product relevance" refers to the methods or algorithms used to evaluate how relevant a review comment is to a particular product.
「パターンを解析し不自然なレビューを判定する手段」とは、レビューコメントの内容や投稿パターンを分析し、不自然な内容や典型的な操作を検出する方法を指す。 "Methods of analyzing patterns to identify unnatural reviews" refers to methods of analyzing the content and posting patterns of review comments to detect unnatural content and typical actions.
「コピペレビュー」とは、他のレビューコメントをコピーしてそのまま貼り付けた、同一内容のレビューコメントを指す。 A "copy-and-paste review" refers to a review comment that contains the same content as another review comment, copied and pasted exactly as is.
「感情分析」とは、テキストデータからユーザの感情や意図を解析して、ポジティブ、ネガティブ、または中立などの分類を行う技術を指す。 "Sentiment analysis" refers to the technology of analyzing user emotions and intentions from text data and classifying them as positive, negative, or neutral.
「フィードバック」とは、解析結果や評価結果をユーザやシステムに返すプロセスを指す。 "Feedback" refers to the process of returning analysis and evaluation results to the user or system.
発明を実施するための形態 Form for implementing the invention
本発明は、ショッピングプラットフォームにおいてレビューコメントの信頼性を向上させ、ユーザに最適な情報を提供するシステムである。このシステムは、レビューコメントを収集し、データ前処理を行い、商品関連性、不自然さ、コピペの有無、感情分析を実施した上で、フィードバックを行うものである。 This invention is a system that improves the reliability of review comments on shopping platforms and provides users with optimal information. This system collects review comments, performs data preprocessing, and analyzes product relevance, unnaturalness, whether or not they have been copied and pasted, and sentiment before providing feedback.
システム概要 System Overview
サーバは以下の手段を含む: The server includes the following means:
1. レビューコメントを収集する手段: 1. How to collect review comments:
サーバは、APIを介してショッピングプラットフォームから定期的に全てのレビューコメントを取得する。この収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. These collected review comments are stored in a database.
2. レビューコメントのデータ前処理を行う手段: 2. Methods for preprocessing review comment data:
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行い、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, tokenizes the review comments into words and sentences, and prepares them in an analyzable form.
3. レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段: 3. How to determine product relevance by comparing review comments with a list of characteristic words:
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば“画質”、“バッテリー”、“操作性”などのワードリストが用意される。ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server compares review comments with a word list based on the characteristics and attributes of each product. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" would be prepared. The server scores the number of times words from the word list appear in the review comments, and if the score is above a certain level, it is determined to be a "review highly relevant to the product."
4. レビューコメントのパターンを解析し不自然なレビューを判定する手段: 4. How to analyze review comment patterns and identify unnatural reviews:
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックし、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time, and if an unnatural pattern is detected, it flags the review comment.
5. レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段: 5. How to compare review comments and identify comments with identical content as copy-and-paste reviews:
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックし、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Every time a new review comment is submitted, the server compares it with all existing review comments. Using sophisticated text comparison algorithms, it checks whether an identical review comment already exists, and if a match is found, it flags the review comment as a "copy-and-paste review."
6. レビューコメントの感情分析を行う手段: 6. How to perform sentiment analysis on review comments:
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, and neutral emotions. Based on the scoring by the emotion engine, the emotion score of the review comments is calculated and reflected in the overall rating of the product.
7. レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段: 7. Means of providing feedback on review relevance, unnaturalness, copy-paste determination results, and sentiment analysis results:
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、エラーメッセージをユーザに表示し、投稿の理由を説明する。フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知し、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, an error message will be displayed to the user, explaining the reason for the post. Feedback will be provided to the user and administrator, along with the sentiment score calculated by the sentiment engine, and administrators will be notified, urging them to further review and take action.
使用するハードウェア及びソフトウェア Hardware and software used
ハードウェア: サーバ、クラウドストレージデバイス Hardware: Servers, cloud storage devices
ソフトウェア: Python、requests、BeautifulSoup、re、nltk、textblob、scikit-learn、感情エンジン(TextBlobなど) Software: Python, requests, BeautifulSoup, re, nltk, textblob, scikit-learn, emotion engine (TextBlob, etc.)
具体例 Specific examples
具体例として、レビューコメント「このスマホの画質は抜群です。」を処理する手順を示す。このコメントは、キーワードである“画質”が含まれているため商品関連性が高いと判定され、不自然なレビューやコピペレビューとの一致もないため承認される。 As a concrete example, we will show the steps for processing the review comment "The image quality of this smartphone is outstanding." This comment is determined to be highly relevant to the product because it contains the keyword "image quality," and is approved because it does not match unnatural reviews or copy-paste reviews.
プロンプト文の例 Example prompt
生成AIモデルへ入力するプロンプト文の例: Example of a prompt to input to a generative AI model:
新しいレビューコメント「このスマホの画質は抜群です。」を解析してください。以下の基準で評価します: Analyze the new review comment, "The image quality of this phone is outstanding." We'll rate it based on the following criteria:
1. 商品関連性 1. Product Relevance
2. 不自然なパターン 2. Unnatural patterns
3. コピペ 3. Copy and paste
4. 感情分析 4. Sentiment analysis
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを定期的に呼び出し、各商品のレビューコメントを取得する。入力として、APIのエンドポイントURLと認証情報を使用する。出力として、取得したレビューコメントを含むJSONデータが生成される。このデータはサーバのデータベースに保存される。 The server periodically calls the shopping platform's API to retrieve review comments for each product. As input, it uses the API endpoint URL and authentication information. As output, it generates JSON data containing the retrieved review comments. This data is stored in the server's database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集されたレビューコメントをクリーニングする。入力として、データベースに保存されたレビューコメントのテキストデータを使用する。具体的な動作として、不要な空白や特殊文字、HTMLタグを除去し、レビューコメントを単語や文単位でトークン化する。出力として、クリーンなテキストデータが生成され、次のステップに渡される。 The server cleans the collected review comments. As input, it uses the text data of the review comments stored in the database. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, and tokenizes the review comments into words and sentences. As output, clean text data is generated and passed to the next step.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用して、レビューコメントの関連性を評価する。入力として、クリーンなレビューコメントと特徴ワードリストを使用する。具体的な動作として、特徴ワードリストに含まれる単語がレビューコメントにどれだけ出現するかをスコアリングする。出力として、各レビューコメントの関連性スコアが生成される。 The server evaluates the relevance of review comments using a word list based on the features and attributes of each product. As input, it uses the clean review comments and the feature word list. Specifically, it scores how often words included in the feature word list appear in the review comments. As output, it generates a relevance score for each review comment.
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、パターンを確認する。入力として、過去一定期間のレビューコメントのテキストデータと現在のレビューコメントを使用する。具体的な動作として、テキストのパターンマッチングアルゴリズムを適用し、類似度を評価する。出力として、不自然なレビューかどうかを示すフラグが生成される。 The server analyzes all review comments posted within a certain period of time and checks for patterns. As input, it uses text data from review comments over a certain period of time in the past and the current review comment. Specifically, it applies a text pattern matching algorithm to evaluate the similarity. As output, it generates a flag indicating whether the review is unnatural.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。入力として、新しいレビューコメントと既存のレビューコメントのデータを使用する。具体的な動作として、高度なテキスト比較アルゴリズム(例:コサイン類似度)を使用して、全く同じ内容のレビューコメントが存在するかチェックする。出力として、コピペレビュー判定結果のフラグが生成される。 Each time a new review comment is posted, the server compares it with all existing review comments. It uses the data of the new review comment and the existing review comments as input. Specifically, it uses an advanced text comparison algorithm (e.g., cosine similarity) to check whether a review comment with the exact same content exists. As output, it generates a flag indicating whether the review is a copy-and-paste review.
ステップ6: Step 6:
感情分析 sentiment analysis
サーバは、レビューコメントを感情エンジンに解析させる。入力として、クリーンなレビューコメントを使用する。具体的な動作として、感情エンジン(例:TextBlob)にテキストを送信し、ポジティブ、ネガティブ、中立の感情スコアを取得する。出力として、レビューコメントごとの感情スコアが生成される。 The server parses the review comments into the sentiment engine. It uses the clean review comments as input. Specifically, it sends the text to the sentiment engine (e.g., TextBlob) and obtains a sentiment score: positive, negative, or neutral. The output is a sentiment score for each review comment.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、これまでのステップで得られた判定結果を元にフィードバックを行う。入力として、すべての判定結果(関連性、不自然さ、コピペ判定結果、感情スコア)を使用する。具体的な動作として、フラグが立たない場合のみ投稿を許可し、フラグが立った場合はエラーメッセージをユーザに表示する。管理者にはさらに詳細なフィードバックが通知される。出力として、ユーザにはエラーメッセージまたは承認メッセージが表示され、レビューコメントがデータベースに保存される。 When an attempt is made to post a review comment, the server provides feedback based on the judgment results obtained in the previous steps. All judgment results (relevance, unnaturalness, copy-paste judgment results, and sentiment score) are used as input. Specific behavior is to allow posting only if no flags are raised, and to display an error message to the user if a flag is raised. More detailed feedback is then provided to the administrator. As output, an error message or approval message is displayed to the user, and the review comment is saved in the database.
特定処理部290は、特定処理の結果をスマートデバイス14に送信する。スマートデバイス14では、制御部46Aが、出力装置40に対して特定処理の結果を出力させる。マイクロフォン38Bは、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン38Bによって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the smart device 14. In the smart device 14, the control unit 46A causes the output device 40 to output the results of the specific processing. The microphone 38B acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 38B to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成系AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). Examples of data generation model 58 include generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>) and Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating speech, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマートデバイス14によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the smart device 14.
[第2実施形態] [Second embodiment]
図3には、第2実施形態に係るデータ処理システム210の構成の一例が示されている。 Figure 3 shows an example of the configuration of a data processing system 210 according to the second embodiment.
図3に示すように、データ処理システム210は、データ処理装置12及びスマート眼鏡214を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 3, the data processing system 210 includes a data processing device 12 and smart glasses 214. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
スマート眼鏡214は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、及びカメラ42も、バス52に接続されている。 The smart glasses 214 include a computer 36, a microphone 238, a speaker 240, a camera 42, and a communication I/F 44. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, speaker 240, and camera 42 are also connected to the bus 52.
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.
図4には、データ処理装置12及びスマート眼鏡214の要部機能の一例が示されている。図4に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 4 shows an example of the main functions of the data processing device 12 and smart glasses 214. As shown in Figure 4, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
スマート眼鏡214では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the smart glasses 214, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、適切なフィードバックを行うことにより、ユーザがより正確なレビュー情報を得られるようにするためのものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and provides appropriate feedback, allowing users to obtain more accurate review information. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。これにより、新しいレビューコメントがシステムに取り込まれる。 The server periodically retrieves all review comments from the shopping platform via API, allowing new review comments to be added to the system.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the collected review comment data. Preprocessing includes removing unnecessary spaces and special characters, splitting review comments, and standardizing language.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのワードリストが設定される。 The server compares the review comment with a feature word list based on product attributes. For example, if the review is about a smartphone, a word list such as "image quality," "battery," and "operability" will be set.
サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is determined to be a "review with high product relevance."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似通ったレビューが連続して投稿されていないかを確認する。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server will flag reviews if any unusual patterns are detected.
具体例: Example:
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、レビューコメントが新しく投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。 Every time a new review comment is posted, the server compares it with all existing review comments to see if any have the exact same content.
サーバは、完全一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 If the server finds an exact match, it will flag the review as a "copy-and-paste review."
具体例: Example:
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。 When a review is submitted, the server will only allow it to be submitted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted.
サーバは、不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者に対してもレビュー内容と判定結果を通知する。 The server filters out inappropriate reviews and displays an error message to the user. It also notifies the administrator of the review content and the judgment result.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This system allows users to select products based on reliable review information, improving the quality of reviews across the entire online shopping platform.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームからAPIを利用し、全てのレビューコメントを一定期間ごとに取得する。この収集には、全商品のレビューコメントが含まれる。 The server uses an API from the shopping platform to periodically retrieve all review comments. This collection includes review comments for all products.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをテキストデータとして保存する。次に、レビューコメントから不要な空白、特殊文字、HTMLタグを除去するためのクリーニング処理を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server stores the collected review comments as text data. Next, it performs a cleaning process to remove unnecessary spaces, special characters, and HTML tags from the review comments. It then tokenizes the review comments into words and sentences, converting them into an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを事前に設定しておく。レビューコメントが投稿されると、サーバはそのコメント内の単語とワードリストを比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが使用される。サーバは、ワードリストに含まれる単語がコメント内にどの程度出現するかをスコア化し、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server pre-sets a word list based on the characteristics and attributes of each product. When a review comment is posted, the server compares the words in the comment with the word list. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" is used. The server scores how often words from the word list appear in the comment, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。似通った内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. If the server detects an unnatural pattern, it flags the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかを判定する。サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Each time a new review comment is submitted, the server compares it with all existing review comments. It uses sophisticated text comparison algorithms to determine whether a review comment with the exact same content already exists. If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ、投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。また、サーバは不正なレビューについて管理者に通知し、管理者がレビューを再確認する手助けを行う。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the posting. The server will also notify administrators of the fraudulent review and help them review the review.
この具体的なステップに基づき、信頼性の高いレビュー情報をユーザに提供し、ショッピングプラットフォーム全体の品質向上を図ることができるものである。 Based on these concrete steps, we will be able to provide users with reliable review information and improve the quality of the entire shopping platform.
(実施例1) (Example 1)
次に、実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
オンラインショッピングプラットフォームにおいて、ユーザが商品選定の参考にするレビューコメントは、その信頼性が重要である。しかし、偽レビューやコピペレビュー、不自然なパターンのレビューが横行しており、ユーザが正確な情報を得ることが困難である。このため、レビューコメントの信頼性を評価し、ユーザに正確なレビュー情報を提供する仕組みが求められている。 On online shopping platforms, the reliability of review comments, which users use as a reference when selecting products, is important. However, fake reviews, copy-and-paste reviews, and reviews with unnatural patterns are rampant, making it difficult for users to obtain accurate information. For this reason, there is a need for a system that can evaluate the reliability of review comments and provide users with accurate review information.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴語リストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報に基づいて商品を選定することが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a feature word list to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, and means for providing feedback on the review relevance, unnaturalness, and copy-and-paste determination results. This enables users to select products based on highly reliable review information.
「レビューコメント」とは、オンラインショッピングプラットフォームにおいてユーザが商品について投稿する意見や評価である。 "Review comments" are opinions and ratings posted by users about products on online shopping platforms.
「データ前処理」とは、収集したレビューコメントのテキストデータから不要な空白や特殊文字を除去し、トークン化や言語統一を行う処理である。 "Data preprocessing" refers to the process of removing unnecessary spaces and special characters from the text data of collected review comments, and performing tokenization and language standardization.
「特徴語リスト」とは、商品に関するレビューコメントの信頼性を評価するために設定された、商品属性に基づくキーワードのリストである。 A "characteristic word list" is a list of keywords based on product attributes that are set up to evaluate the reliability of review comments about a product.
「商品関連性」とは、レビューコメントが特定の商品について言及している度合いや、特徴語リストとの一致度を示す指標である。 "Product relevance" is an indicator that shows the degree to which review comments mention a specific product and the degree of match with the feature word list.
「パターン解析」とは、レビューコメントの投稿パターンを分析し、一定期間内に連続して同一または類似の内容が投稿されているかを判定するプロセスである。 "Pattern analysis" is the process of analyzing the posting patterns of review comments and determining whether the same or similar content has been posted consecutively within a certain period of time.
「不自然なレビュー」とは、通常のユーザ行動から逸脱していると判断されるレビューのことで、短期間に似た内容のコメントが連続して投稿される場合などを指す。 An "unnatural review" is a review that is deemed to deviate from normal user behavior, such as when similar comments are posted in succession within a short period of time.
「コピペレビュー」とは、既存のレビューコメントをそのままコピーして投稿されたコメントのことであり、内容が全く同一であるレビューを指す。 A "copy-and-paste review" is a comment that is posted by simply copying an existing review comment, and refers to a review with exactly the same content.
「フィードバック」とは、レビューコメントの関連性、不自然さ、コピペ判定結果をユーザおよび管理者に通知し、適切なレビューのみを許可する処理である。 "Feedback" is a process that notifies users and administrators of the relevance, unnaturalness, and copy-and-paste judgment results of review comments, allowing only appropriate reviews.
本発明は、オンラインショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザがより正確なレビュー情報を得られるようにするシステムである。以下に、具体的な実施形態を詳述する。 The present invention is a system that evaluates the reliability of review comments on online shopping platforms, allowing users to obtain more accurate review information. Specific embodiments are described in detail below.
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを利用して定期的に全てのレビューコメントを取得する。これにより、最新のレビューコメントも含めてデータベースに定期的に保存される。使用する具体的なソフトウェアとしては、Pythonのrequestsライブラリを用いる。 The server periodically retrieves all review comments using the shopping platform's API. This periodically saves the comments, including the most recent ones, to the database. The specific software used is the Python requests library.
データ前処理 Data preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、テキストデータのトークン化、言語統一などが含まれる。この処理には、Pythonのnltkライブラリおよびreモジュールが使用される。 The server preprocesses the collected review comment data. This includes removing unnecessary whitespace and special characters, tokenizing the text data, and unifying the language. This process uses the Python nltk library and re module.
商品関連性の判定 Product relevance determination
サーバは、レビューコメントと商品属性に基づく特徴語リストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などの特徴語リストが設定される。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。具体的なソフトウェアとしては、Pythonのscikit-learnライブラリを使用する。 The server compares the review comments with a feature word list based on product attributes. For example, for a review about a smartphone, a feature word list such as "image quality," "battery," and "operability" is set. The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is deemed to be "highly relevant to the product." The specific software used is the Python scikit-learn library.
具体例 Specific examples
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
ワードリストに「画質」が含まれるため、高スコアと判定される。 Since "image quality" is included in the word list, it is judged to have a high score.
不自然なレビューの判定 Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似た内容のレビューが連続して投稿されていないかを確認する。サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。この工程には、PythonのPandasライブラリおよび時系列解析が用いられる。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time. If the server detects an unnatural pattern, it flags those reviews. This process uses Python's Pandas library and time series analysis.
具体例 Specific examples
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
サーバは、これらを不自然なレビューと判定し、フラグを付ける。 The server will flag these as unnatural reviews.
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。ソフトウェアとして、Pythonのdifflibライブラリを使用する。 Every time a new review comment is posted, the server compares it with all existing review comments to see if there are any identical comments. If the server finds a matching comment, it flags the review as a "copy-and-paste review." The software uses the Python difflib library.
具体例 Specific examples
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
サーバは、レビュー2をコピペレビューと判定し、フラグを付ける。 The server determines that Review 2 is a copy-and-paste review and flags it.
フィードバック Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者にはレビュー内容と判定結果を通知する。この処理には、PythonのFlaskまたはDjangoフレームワークおよび通知用のメールサーバ(SMTP)が使用される。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. Inappropriate reviews are filtered out and an error message is displayed to the user. The server also notifies the administrator of the review content and the result of the judgment. This process uses the Python Flask or Django framework and an email server (SMTP) for notifications.
プロンプト文の例 Example prompt
ユーザーが投稿したレビューコメント「このスマホのバッテリー持ちは優れています。」を評価し、以下の条件に基づいてフィードバックを行ってください。 Please rate the user-submitted review comment, "This phone has excellent battery life." and provide feedback based on the following criteria:
条件: Conditions:
1. 商品関連性の高いレビューかどうかを判定するため、「バッテリー」「持ち」「優れています」などの特徴語リストに基づいてスコアリングを行う。 1. To determine whether a review is highly relevant to the product, it is scored based on a list of characteristic words such as "battery," "lifespan," and "excellent."
2. 一定期間内に似たレビューが連続して投稿されていないか確認する。 2. Check to see if similar reviews have been posted consecutively within a certain period of time.
3. 既存のレビューコメントと比較し、コピペレビューかどうかをチェックする。 3. Compare with existing review comments to check if the review is a copy-and-paste one.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上することが期待される。 This system will enable users to select products based on reliable review information, and is expected to improve the quality of reviews across online shopping platforms.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
レビューコメントの収集を行う。サーバは、ショッピングプラットフォームのAPIを通じて定期的に全てのレビューコメントを取得する。入力はAPIリクエストであり、出力は取得されたJSON形式のレビューコメントデータである。サーバは、APIリクエストを送信し、受信したデータをデータベースに保存する。 Collects review comments. The server periodically retrieves all review comments through the shopping platform's API. The input is the API request, and the output is the retrieved review comment data in JSON format. The server sends the API request and stores the received data in a database.
ステップ2: Step 2:
データ前処理を行う。サーバは、収集したレビューコメントのデータに対して前処理を実行する。入力はJSON形式のレビューコメントデータであり、出力は前処理されたテキストデータである。サーバは、不要な空白や特殊文字を除去し、テキストデータをトークン化し、言語統一を行う。 Performs data preprocessing. The server performs preprocessing on the collected review comment data. The input is JSON-formatted review comment data, and the output is preprocessed text data. The server removes unnecessary whitespace and special characters, tokenizes the text data, and standardizes the language.
ステップ3: Step 3:
商品関連性の判定を行う。サーバは、前処理されたレビューコメントと商品属性に基づく特徴語リストを比較する。入力は前処理されたテキストデータと特徴語リストであり、出力はスコアリングされたレビューコメントデータである。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 Determines product relevance. The server compares preprocessed review comments with a feature word list based on product attributes. The input is preprocessed text data and a feature word list, and the output is scored review comment data. The server scores how often words included in the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定を行う。サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。入力は特定期間内のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、短期間に似た内容のレビューが連続して投稿されていないかを確認し、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 Identifies unnatural reviews. The server analyzes patterns in review comments posted within a certain period of time. The input is review comment data from a specific period of time, and the output is the judgment result and flagged data. The server checks whether reviews with similar content have been posted in succession within a short period of time, and if an unnatural pattern is detected, it flags those reviews.
ステップ5: Step 5:
コピペレビューの判定を行う。サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。入力は新しいレビューコメントと既存のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 Determines copy-and-paste reviews. Every time a new review comment is posted, the server compares it with all existing review comments. The input is the new review comment and existing review comment data, and the output is the determination result and flagged data. If the server finds a matching comment, it flags the review as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックを行う。サーバは、レビュー投稿時にそのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。入力はレビューコメントとそれに対する各種判定結果であり、出力はユーザおよび管理者への通知結果である。サーバは、不適切なレビューについてフィルタリングを行い、エラーメッセージをユーザに表示し、管理者に対してもレビュー内容と判定結果を通知する。 Provides feedback. The server will only allow a review to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. The input is the review comment and various judgment results, and the output is notifications to the user and administrator. The server filters out inappropriate reviews, displays an error message to the user, and notifies the administrator of the review content and judgment results.
(応用例1) (Application Example 1)
次に、応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来のショッピングプラットフォームでは、信頼性の低いレビューコメントが多く投稿され、それがユーザーの購買判断を誤らせる原因となっていた。また、短期間に似通ったレビューやコピペレビューが投稿されることにより、レビューの信頼性が低下する問題があった。従って、信頼性の高いレビュー情報をユーザーに提供し、より正確な購買判断を支援するシステムの開発が求められていた。 On conventional shopping platforms, many unreliable review comments were posted, causing users to make incorrect purchasing decisions. There was also the problem of similar reviews and copy-paste reviews being posted within a short period of time, reducing the reliability of the reviews. Therefore, there was a need to develop a system that could provide users with reliable review information and help them make more accurate purchasing decisions.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、レビューコメントの信頼性をリアルタイムで評価しフィードバックする手段と、信頼性の高い順にレビューを表示する手段と、を含む。これにより、ユーザーは信頼性の高いレビューをリアルタイムで受け取り、それに基づいてより正確な購買判断を行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for providing feedback on the relevance, unnaturalness, and copy-and-paste determination results of the reviews, means for evaluating and providing feedback on the reliability of the review comments in real time, and means for displaying reviews in order of reliability. This allows users to receive reliable reviews in real time and make more accurate purchasing decisions based on them.
「レビューコメント」とは、ユーザーが商品やサービスに対して評価や感想を文章形式で記述したものである。 A "review comment" is a written comment written by a user expressing their evaluation or opinion of a product or service.
「収集する手段」とは、オンラインプラットフォームからデータを取得し、システムに取り込む方法を指す。 "Means of collection" refers to the method by which data is obtained from online platforms and entered into the system.
「データ前処理」とは、取得されたデータを解析しやすくするために、不要な情報を削除し、整形するプロセスである。 "Data preprocessing" is the process of removing unnecessary information and formatting acquired data to make it easier to analyze.
「特徴ワードリスト」とは、特定の商品やサービスに関連する重要なキーワードを集めたリストである。 A "characteristic word list" is a list of important keywords related to a specific product or service.
「商品関連性」とは、レビューコメントが特定の商品やサービスにどれだけ関連しているかを示す度合いである。 "Product relevance" is the degree to which a review comment relates to a particular product or service.
「パターンを解析する手段」とは、レビューコメントの中の一定のテンプレートや類似性を検出する方法である。 "Pattern analysis methods" are methods for detecting certain templates or similarities in review comments.
「不自然なレビュー」とは、短期間に大量に投稿されたり、同じ内容が繰り返されるなど、通常のユーザー行動とは異なるコメントである。 "Unnatural reviews" are comments that deviate from normal user behavior, such as those posted in large numbers in a short period of time or those that contain repeated, repeated comments.
「コピペレビュー」とは、他のコメントと完全に同一の内容がコピー&ペーストされたレビューコメントである。 A "copy-and-paste review" is a review comment in which the exact same content as another comment is copied and pasted.
「フィードバックする手段」とは、ユーザーや管理者に対して評価結果を通知し、適切なアクションを促すための方法である。 "Means of providing feedback" refers to methods for notifying users and administrators of evaluation results and encouraging them to take appropriate action.
「信頼性をリアルタイムで評価する手段」とは、レビューが投稿される瞬間に、その評価の正確性や信用度を自動的に判定する方法である。 "Means for assessing trustworthiness in real time" refers to a method that automatically determines the accuracy and credibility of a review the moment it is posted.
「信頼性の高い順に表示する手段」とは、評価が高いレビューコメントを上位に表示することで、ユーザーが参考にしやすくする方法である。 "Displaying in order of reliability" is a method of displaying highly rated review comments at the top, making them easier for users to refer to.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザーがより正確なレビュー情報を得られるようにするものである。このシステムは、以下のプロセスを通じて実施される。 The system of the present invention evaluates the reliability of review comments on shopping platforms, allowing users to obtain more accurate review information. This system is implemented through the following process:
使用するハードウェア Hardware to use
スマートフォン: ユーザーがレビューコメントを投稿するための端末として用いる。 Smartphone: Used by users as a device to post review comments.
サーバ: レビューコメントの収集、データ前処理、解析、評価、フィードバックを行う中枢的なコンピュータ。 Server: A central computer that collects review comments, preprocesses data, analyzes, evaluates, and provides feedback.
APIサーバ: ショッピングプラットフォームからレビューコメントを取得するためのインターフェースとして用いる。 API server: Used as an interface to retrieve review comments from the shopping platform.
使用するソフトウェア Software used
Python: サーバサイドのデータ処理及び解析に使用。 Python: Used for server-side data processing and analysis.
Flask: PythonのWebフレームワークとしてAPIサーバを構築するために用いる。 Flask: A Python web framework used to build API servers.
MySQL: データベース管理システムとして収集したレビューコメントを保存するために使用。 MySQL: Used as a database management system to store collected review comments.
自然言語処理ライブラリ: レビューコメントの前処理および解析に使用。 Natural language processing library: Used for preprocessing and parsing review comments.
データ加工およびデータ演算の流れ Data processing and calculation flow
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから定期的にAPIを介してレビューコメントを取得する。このAPIサーバはFlaskを用いて構築されており、取得したデータはMySQLデータベースに保存される。 The server periodically retrieves review comments from the shopping platform via API. This API server is built using Flask, and the retrieved data is stored in a MySQL database.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントのデータを前処理する。前処理には、Pythonの自然言語処理ライブラリを用いて、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the retrieved review comment data. This preprocessing includes removing unnecessary whitespace and special characters, splitting review comments, and standardizing language using a Python natural language processing library.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのキーワードが用いられる。サーバはスコアリングを行い、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server compares the review comment with a list of characteristic words based on product attributes. For example, a review about a smartphone would use keywords such as "image quality," "battery," and "operability." The server then scores the review comment, and if it scores above a certain level, it determines that the review comment is "highly relevant to the product."
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントを解析し、短期間に似通ったレビューが連続して投稿されていないかを確認する。不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server analyzes review comments posted within a certain period of time to see if similar reviews have been posted in succession within a short period of time. If an unnatural pattern is detected, those reviews are flagged.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックし、完全一致するコメントがあった場合、それを「コピペレビュー」としてフラグ付けする。 The server compares the newly posted review comment with all existing review comments. It checks to see if there are any identical comments, and if there is an exact match, it flags it as a "copy-and-paste review."
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可し、ユーザーにリアルタイムでフィードバックする。また、信頼性の高い順にレビューを表示する機能も持つ。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted, and will provide real-time feedback to the user. It also has a function to display reviews in order of reliability.
具体例とプロンプト文の例 Specific examples and prompt sentence examples
具体例として、以下のようなレビューコメントを考慮する。 As a concrete example, consider the following review comment:
商品: スマートフォン Product: Smartphone
投稿レビュー: 「このスマホのバッテリーは長持ちします。」 Review: "This phone's battery lasts a long time."
プロンプト文の例は以下である。 An example of a prompt is as follows:
「このレビューが製品に関連しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review is relevant to the product: 'This phone's battery lasts a long time.'"
「このレビューが不自然なパターンに該当しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review fits any unnatural pattern: 'This phone's battery lasts a long time.'"
「このレビューが既存のレビューと完全一致しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review exactly matches an existing review: 'This phone's battery lasts a long time.'"
これにより、ユーザーは信頼性の高いレビューを基に商品を選ぶことができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This will allow users to choose products based on reliable reviews, improving the quality of ratings across online shopping platforms.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
サーバは、ショッピングプラットフォーム提供のAPIを使用してレビューコメントを定期的に収集する。サーバは、APIを介して取得したレビューコメントをJSON形式で受け取り、MySQLデータベースに保存する。入力はAPIから取得したJSONデータであり、出力はデータベースに保存されたレビューコメントである。 The server periodically collects review comments using an API provided by the shopping platform. The server receives the review comments obtained via the API in JSON format and stores them in a MySQL database. The input is the JSON data obtained from the API, and the output is the review comments stored in the database.
ステップ2: Step 2:
データ前処理: Data preprocessing:
サーバは、収集したレビューコメントのデータを前処理する。サーバは、Pythonの正規表現ライブラリを使用し、不要な空白や特殊文字を除去し、レビューコメントを文単位に分割する。さらに、異なる形式のデータを統一形式に変換する。入力は生のレビューコメントであり、出力は前処理されたクリーンデータである。 The server preprocesses the collected review comment data. It uses Python's regular expression library to remove unnecessary whitespace and special characters and split the review comments into sentences. It also converts data in different formats into a unified format. The input is the raw review comments, and the output is the preprocessed, clean data.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
サーバは、前処理されたレビューコメントと事前に設定した特徴ワードリストを比較する。サーバは、特徴ワードリストに含まれる単語の出現頻度を計算し、一定のスコア以上であれば商品関連性が高いと判定する。入力は前処理されたレビューコメントと特徴ワードリストであり、出力は関連性の高いレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with a pre-set feature word list. The server calculates the frequency of occurrence of words included in the feature word list, and determines that a product is highly relevant if the frequency is above a certain score. The input is the preprocessed review comments and the feature word list, and the output is data flagged as highly relevant reviews.
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
サーバは、前処理されたレビューコメントを一定期間内に投稿された他のレビューコメントと比較し、パターンを解析する。サーバは、類似のレビューコメントが短期間に大量に投稿されている場合、それを不自然なレビューとして判定し、フラグを立てる。入力は前処理されたレビューコメントと過去のレビューコメントであり、出力は不自然なレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with other review comments posted within a certain period of time and analyzes patterns. If a large number of similar review comments are posted in a short period of time, the server determines that they are unnatural reviews and flags them. The input is the preprocessed review comments and past review comments, and the output is data flagged as unnatural reviews.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと内容一致度で比較する。サーバは、全く同じ内容のレビューコメントを見つけた場合、これをコピペレビューとしてフラグ付けする。入力は新しいレビューコメントと既存のレビューコメントであり、出力はコピペレビューとして判定されたデータである。 The server compares the newly posted review comment with all existing review comments based on content similarity. If the server finds a review comment with exactly the same content, it flags it as a copy-and-paste review. The input is the new review comment and the existing review comment, and the output is the data determined to be a copy-and-paste review.
ステップ6: Step 6:
フィードバック: Feedback:
サーバは、レビューの関連性、不自然さ、コピペの各判定結果をもとに、レビュー投稿者にリアルタイムでフィードバックを行う。ユーザーの端末には、レビューが信頼性の高い順に表示される。また、信頼性の低いレビューは投稿が拒否され、その理由がユーザーに通知される。入力はレビュー判定の各結果であり、出力はフィードバックメッセージである。 The server provides real-time feedback to reviewers based on the review's relevance, unnaturalness, and copy-and-paste assessment results. Reviews are displayed on the user's device in order of reliability. Reviews with low reliability are rejected, and the user is notified of the reason. The input is the review assessment results, and the output is a feedback message.
これにより、ユーザーは信頼性の高いレビューコメントを基に、より正確な購買判断を行うことが可能となる。 This allows users to make more accurate purchasing decisions based on reliable review comments.
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、さらにユーザの感情を認識してレビュー情報を最適化するものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and further optimizes review information by recognizing user sentiment. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントをクリーニングする。不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments, removing unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, making them easier to analyze.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが用意される。 The server compares review comments with a word list based on the features and attributes of each product. For example, for a review about a smartphone, a word list would be prepared, including "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores how often words from the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は抜群です。」 Review comment: "The image quality of this smartphone is outstanding."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
具体例: Example:
レビュー1:「素晴らしい商品です!」 Review 1: "This is a great product!"
レビュー2:「素晴らしい商品です!」 Review 2: "This is a great product!"
レビュー3:「素晴らしい商品です!」 Review 3: "This is a great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
具体例: Example:
レビュー1:「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2:「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, or neutral sentiment.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
具体例: Example:
レビューコメント:「このスマホのバッテリーはすぐに切れるので使い物になりません。」 Review comment: "This phone's battery dies so quickly it's useless."
感情分析結果:ネガティブ Sentiment analysis result: Negative
スコア:低評価として反映。 Score: Reflected as a low rating.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the post.
サーバは、フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知する。一方、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 The server notifies the user and administrator of the feedback along with the emotion score generated by the emotion engine. Administrators are also notified to further review and respond to the review.
これにより、本発明のシステムは、レビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供するものである。感情エンジンの導入によって、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 As a result, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with peace of mind. The introduction of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary spaces, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, preparing them in an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントを比較する。レビューコメント内の単語とワードリストを比較し、スコア化する。例えば、スマートフォンに関連するワードリストには「画質」「バッテリー」「操作性」などが含まれる。 The server compares review comments using a word list based on the features and attributes of each product. It compares the words in the review comments with the word list and generates a score. For example, a word list related to smartphones might include "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。特に文の長さ、使用される単語、文の構造などを比較する。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. In particular, it compares sentence length, the words used, sentence structure, etc.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
感情エンジンによる感情認識 Emotion recognition using an emotion engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。具体的には、自然言語処理アルゴリズムを用いて、文中に含まれる感情表現を抽出し、スコアリングする。 The server uses an emotion engine to analyze review comments and classify them into positive, negative, or neutral sentiment. Specifically, it uses a natural language processing algorithm to extract and score emotional expressions contained in the sentences.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿が拒否された理由を説明する。 The server will only allow a review comment to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If any flags are raised, the server will display an error message to the user explaining why the post was rejected.
サーバは、不適切なレビューについてはフィルタリングを行い、さらに感情エンジンによる感情スコアも含めてユーザおよび管理者に通知する。管理者にはレビュー内容とフラグ立ちの理由、感情スコアなどの詳細情報が送信され、必要な場合にはレビューを再確認するための手助けが提供される。 The server filters out inappropriate reviews and notifies users and administrators, including the sentiment score generated by the sentiment engine. Administrators are sent detailed information such as the review content, the reason it was flagged, and the sentiment score, and are offered help in re-checking the review if necessary.
この具体的なステップに基づき、本発明のシステムはレビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供する。感情エンジンの統合により、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 Based on these specific steps, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with confidence. The integration of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
(実施例2) (Example 2)
次に、実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来のショッピングプラットフォームにおいては、レビューコメントの真偽を判断するための適切なメカニズムが欠如しており、ユーザが不正確な情報に基づいて購買決定を行うリスクがあった。このため、レビューコメントの信頼性を向上させ、ユーザが安心して利用できる環境を提供することが求められている。また、レビューコメントの感情を正確に把握することで、商品の評価情報をより正確に反映させる必要がある。 Traditional shopping platforms lacked an appropriate mechanism for determining the authenticity of review comments, leaving users at risk of making purchasing decisions based on inaccurate information. This has created a need to improve the reliability of review comments and provide an environment where users can use them with peace of mind. It is also necessary to accurately understand the sentiment behind review comments in order to more accurately reflect product evaluation information.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情を分析する手段と、レビューの関連性、不自然さ、コピペ判定結果および感情分析結果をフィードバックする手段と、レビューコメントが不自然な場合やコピペの場合、投稿を拒否する手段と、を含む。これにより、レビューコメントの信頼性を向上させ、ユーザが安心してレビューを参照できる環境を提供し、商品の評価情報をより正確に反映させることが可能となる。 The identification process by the identification processing unit 290 of the data processing device 12 in Example 2 is realized by the following means. In this invention, the server includes means for collecting review comments, means for performing data preprocessing of the review comments, means for determining product relevance by comparing the review comments with a characteristic word list, means for analyzing the patterns of the review comments to determine unnatural reviews, means for comparing the review comments to determine comments with identical content as copy-and-paste reviews, means for analyzing the sentiment of the review comments, means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results, and means for rejecting the posting of review comments that are unnatural or copy-and-paste. This improves the reliability of review comments, provides an environment where users can refer to reviews with confidence, and makes it possible to more accurately reflect product evaluation information.
「レビューコメント」とは、ショッピングプラットフォーム上でユーザが商品やサービスに対して記述する意見や評価のテキストである。 "Review comments" are textual opinions and evaluations written by users on shopping platforms about products and services.
「データ前処理」とは、収集したレビューコメントから不要な要素を取り除き、解析に適した形式に変換する処理である。 "Data preprocessing" is the process of removing unnecessary elements from collected review comments and converting them into a format suitable for analysis.
「特徴ワードリスト」とは、特定の商品やサービスに関連するキーワードのリストで、レビューコメントと比較するために使用されるものである。 A "characteristic word list" is a list of keywords related to a specific product or service that is used to compare with review comments.
「商品関連性判定」とは、レビューコメントが特定の商品やサービスに関連するかを判断するプロセスである。 "Product relevance determination" is the process of determining whether a review comment is relevant to a specific product or service.
「パターン解析」とは、レビューコメントの内容や形式を解析し、特定のパターンや異常を検出するプロセスである。 "Pattern analysis" is the process of analyzing the content and format of review comments to detect specific patterns or anomalies.
「不自然なレビュー」とは、内容や書き方が短期間内に連続して投稿されるなど、通常と異なるパターンを示すレビューコメントである。 "Unnatural reviews" are review comments that show an unusual pattern, such as content or writing style being posted repeatedly within a short period of time.
「コピペレビュー」とは、既存のレビューコメントと全く同じ内容のレビューコメントを指すものである。 A "copy-and-paste review" refers to a review comment that has exactly the same content as an existing review comment.
「感情分析」とは、レビューコメントの内容を解析し、ポジティブ、ネガティブ、中立といった感情の分類を行うプロセスである。 "Sentiment analysis" is the process of analyzing the content of review comments and classifying their sentiments as positive, negative, or neutral.
「フィードバック」とは、解析結果や判定結果をユーザまたは管理者に対して通知し、必要な対応を促す情報の提供である。 "Feedback" refers to the provision of information to notify users or administrators of analysis and judgment results, and to encourage them to take necessary action.
「投稿拒否」とは、不自然なレビューやコピペレビューが投稿されるのを防ぐために、ユーザに対して投稿を許可しない動作を指す。 "Posting refusal" refers to the action of not allowing users to post in order to prevent unnatural reviews or copy-and-paste reviews from being posted.
「サーバ」とは、レビューコメントの収集、前処理、解析、判定、フィードバック、投稿拒否などの一連の処理を管理・実行するコンピュータシステムである。 A "server" is a computer system that manages and executes a series of processes, including the collection, preprocessing, analysis, judgment, feedback, and rejection of review comments.
本発明のシステムは、ショッピングプラットフォーム上でレビューコメントの信頼性を評価し、ユーザの感情を認識してレビュー情報を最適化するものである。そのための具体的な動作や処理を以下に示す。 The system of the present invention evaluates the reliability of review comments on a shopping platform, recognizes user emotions, and optimizes review information. The specific operations and processes for this purpose are described below.
1. レビューコメントの収集 1. Collecting review comments
システムは、ショッピングプラットフォームのAPIを通じてレビューコメントを取得する。サーバは定期的にAPIエンドポイントにリクエストを送り、取得したレビューコメントをデータベースに保存する。具体的には、データベースとしてMySQLやPostgreSQLを使用することができる。 The system retrieves review comments through the shopping platform's API. The server periodically sends requests to the API endpoint and stores the retrieved review comments in a database. Specifically, MySQL or PostgreSQL can be used as the database.
例えば、サーバがAPIエンドポイント "https://example.com/api/reviews" にアクセスして、取得したレビューコメントを "reviews" テーブルに格納する。 For example, the server accesses the API endpoint "https://example.com/api/reviews" and stores the retrieved review comments in the "reviews" table.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化する。PythonのNLPライブラリであるNLPKを使用して、この前処理を行うことができる。 The server cleans the retrieved review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences. This preprocessing can be performed using NLPK, a Python NLP library.
例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にテキストクリーニングを行い、その後トークン化する。 For example, a comment such as "This product is <p>great</p>!" is text cleaned to "This product is great!" and then tokenized.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを生成し、レビューコメントと比較する。例えば、スマートフォンのレビューに「画質」「バッテリー」「操作性」といったキーワードを含むワードリストを使用する。 The server generates a word list based on the features and attributes of each product and compares it with the review comments. For example, for smartphone reviews, a word list containing keywords such as "image quality," "battery," and "operability" is used.
具体的には、レビューコメント内のキーワードの出現頻度をスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。例えば、サーバが「このスマホの画質は抜群です」というコメントを解析し、ワードリストに「画質」が含まれていることで高いスコアを付与する。 Specifically, the frequency of keywords appearing in review comments is scored, and if the score is above a certain level, it is determined to be a "review with high product relevance." For example, the server analyzes a comment such as "The image quality of this smartphone is outstanding," and assigns a high score because "image quality" is included in the word list.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたすべてのレビューコメントを解析し、内容のパターンを確認する。具体的には、同じような内容や形式のレビューコメントが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. Specifically, it checks to see if review comments with similar content or format have been posted consecutively within a short period of time.
不自然なパターンが検出された場合、そのレビューコメントにフラグを付与する。例えば、サーバが「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿されている場合、それらに不自然さのフラグを付ける。 If an unnatural pattern is detected, the review comment is flagged. For example, if the server sees multiple reviews with the same content, such as "Great product!", posted within a short period of time, it will flag them as unnatural.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用し、一致するかどうかを判定する。 Each time a new review comment is submitted, the server compares it with all existing review comments, using sophisticated text comparison algorithms (e.g., Python's difflib library) to determine whether there is a match.
一致が見つかった場合、サーバはそのレビューコメントに「コピペレビュー」としてフラグを立てる。例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 If a match is found, the server will flag the review comment as a "copy-and-paste review." For example, if a comment already exists that says "This product is amazing!", the server will add a flag.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情解析エンジンに投入し、ポジティブ、ネガティブ、中立といった感情に分類する。具体的には、TextBlobやVADERなどの感情解析ライブラリを使用することができる。 The server inputs the review comments into a sentiment analysis engine and classifies them into positive, negative, or neutral sentiment. Specifically, sentiment analysis libraries such as TextBlob and VADER can be used.
これにより、感情スコアを計算し、そのスコアを商品の総合評価に反映する。例えば、TextBlobを使用して「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントを解析し、ネガティブスコアを付与する。 This allows us to calculate an emotional score, which is then reflected in the overall rating of the product. For example, we can use TextBlob to analyze a comment such as "This phone's battery runs out quickly, so it's useless" and assign it a negative score.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合は、エラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user explaining the reason for the post.
また、感情エンジンによる感情スコアをユーザおよび管理者に通知し、レビューの信頼性向上を図る。例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促す。また、管理者には「新しい不自然なレビューが検出されました。確認してください」と通知する。 The emotion engine also notifies users and administrators of the emotion score, helping to improve the reliability of reviews. For example, the server may notify users that "this review has been flagged as unnatural" and encourage them to resubmit. It may also notify administrators that "a new unnatural review has been detected. Please check it."
生成AIモデルへのプロンプト文の例 Example prompt for a generative AI model
「このレビューコメントが特定の商品に関連しているか、そしてその感情を分類してください。例: 'このスマホの画質は抜群です。'」 "Did this review comment relate to a specific product? Please categorize its sentiment. Example: 'The image quality of this phone is outstanding.'"
「このリストのレビューコメントが不自然であるかどうか判定してください。例: '素晴らしい商品です!', '素晴らしい商品です!'」 "Please determine whether the review comments on this listing are unnatural. Example: 'Great product!', 'Great product!'"
「このレビューコメントが既存のコメントと一致するか、コピペレビューであるかどうかチェックしてください。例: 'この商品はとても素晴らしいです!'」 "Check if this review comment matches an existing comment or is a copypasta review. Example: 'This product is amazing!'"
以上が、本発明のシステムを実施するための形態である。 The above is a form for implementing the system of the present invention.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
入力:ショッピングプラットフォームのAPIエンドポイントURL Input: Shopping platform API endpoint URL
具体的な動作:サーバは、定期的にAPIエンドポイントにリクエストを送信して、レビューコメントを取得する。例えば、APIエンドポイント "https://example.com/api/reviews" にアクセスする。 Specific behavior: The server periodically sends requests to an API endpoint to retrieve review comments. For example, it accesses the API endpoint "https://example.com/api/reviews".
データ加工:取得したレビューコメントにメタデータ(ユーザID、商品ID、投稿日時など)を付与する。 Data processing: Metadata (user ID, product ID, posting date and time, etc.) is added to the acquired review comments.
出力:レビューコメントおよびメタデータが含まれたデータセット Output: Dataset containing review comments and metadata
具体的な動作:サーバは取得したデータセットをデータベース(例:MySQLやPostgreSQL)に保存する。 Specific operation: The server stores the acquired dataset in a database (e.g., MySQL or PostgreSQL).
ステップ2: Step 2:
データ前処理: Data preprocessing:
入力:データベースに保存されたレビューコメント Input: Review comments stored in the database
具体的な動作:サーバはレビューコメントをクリーニングする。具体的には、不要な空白、特殊文字、HTMLタグの除去を行うため、PythonのNLPライブラリ(例:NLPK)を使用する。 What it does: The server cleans the review comments. Specifically, it uses a Python NLP library (e.g., NLPK) to remove unnecessary whitespace, special characters, and HTML tags.
データ加工:レビューコメントを単語や文単位でトークン化する。 Data processing: Tokenize review comments into words and sentences.
出力:クリーンでトークン化されたレビューコメント Output: Clean, tokenized review comments
具体的な動作:例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にクリーニングし、単語ごとに分ける。 Specific operation: For example, a comment such as "This product is <p>great</p>!" is cleaned to "This product is great!" and separated into individual words.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
入力:クリーンでトークン化されたレビューコメント、商品の特徴ワードリスト Input: Clean, tokenized review comments, product feature word list
具体的な動作:サーバはレビューコメントと特徴ワードリストを比較する。ワードリストには、「画質」「バッテリー」「操作性」などの製品属性に基づくキーワードが含まれる。 Specific operation: The server compares the review comments with the feature word list. The word list includes keywords based on product attributes such as "image quality," "battery," and "operability."
データ演算:レビューコメント内のキーワードの出現頻度をスコアリングする。 Data calculation: Score the frequency of keywords appearing in review comments.
出力:商品関連性スコア Output: Product relevance score
具体的な動作:例えば、「このスマホの画質は抜群です」というコメントに対し、ワードリストに「画質」が含まれていることで高スコアを付与する。 Specific behavior: For example, a comment such as "The image quality of this smartphone is outstanding" will be given a high score if the word list includes "image quality."
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
入力:一定期間内に投稿された全てのレビューコメント Input: All review comments posted within a certain period
具体的な動作:サーバはレビューコメントの内容のパターンを解析する。同じ内容や書き方のレビューが連続して投稿されていないかチェックする。 Specific operation: The server analyzes the content patterns of review comments. It checks whether reviews with the same content or writing style have been posted consecutively.
データ演算:不自然なパターンを検出するための解析 Data calculations: Analysis to detect unnatural patterns
出力:不自然さのフラグが立ったレビューコメント Output: Review comments flagged as unnatural
具体的な動作:例えば、「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿された場合、それらに不自然さのフラグを付ける。 Specific behavior: For example, if the same review saying "This is a great product!" is posted multiple times within a short period of time, it will be flagged as unnatural.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
入力:新しいレビューコメント、既存のレビューコメント Input: New review comment, Existing review comment
具体的な動作:サーバは高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用して、新しいコメントを既存のレビューコメントと比較する。 What it does: The server uses advanced text comparison algorithms (e.g., Python's difflib library) to compare the new comment with existing review comments.
データ演算:コメントの内容の一致を確認するプロセス Data calculation: The process of checking whether the content of comments matches.
出力:コピペレビューとしてフラグが立ったレビューコメント Output: Review comments flagged as copy-paste reviews
具体的な動作:例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 Specific behavior: For example, if a comment saying "This product is amazing!" already exists, add a flag.
ステップ6: Step 6:
感情エンジンによる感情認識: Emotion recognition using the emotion engine:
入力:レビューコメント Enter: Review comment
具体的な動作:サーバはレビューコメントを感情解析エンジン(例:TextBlobやVADER)に投入し、感情を分類する。 Specific operation: The server inputs the review comments into a sentiment analysis engine (e.g., TextBlob or VADER) and classifies the sentiment.
データ演算:感情スコアの計算 Data calculation: Calculating emotion scores
出力:感情スコア付きレビューコメント Output: Review comments with sentiment scores
具体的な動作:例えば、「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントをネガティブとしてスコア付けする。 Specific behavior: For example, a comment such as "This smartphone's battery runs out quickly, making it useless" is scored as negative.
ステップ7: Step 7:
フィードバックとフィルタリング: Feedback and filtering:
入力:レビューコメント(関連性、不自然さ、コピペのフラグ付き)、感情スコア Input: Review comments (with flags for relevance, unnaturalness, and copy-paste), sentiment score
具体的な動作:サーバはレビューコメントの投稿が試みられた際、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合はエラーメッセージをユーザに表示する。 Specific behavior: When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user.
データ演算:フィードバックおよび投稿判定 Data calculation: feedback and submission evaluation
出力:ユーザおよび管理者への通知 Output: Notification to users and administrators
具体的な動作:例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促し、同時に管理者には「新しい不自然なレビューが検出されました」と通知する。 Specific behavior: For example, the server notifies the user that "this review has been flagged as unnatural" and encourages them to resubmit, while simultaneously notifying the administrator that "a new unnatural review has been detected."
以上が、このシステムのプログラムの具体的な処理ステップである。 The above are the specific processing steps of this system's program.
(応用例2) (Application Example 2)
次に、応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来のレビューコメント評価システムには、レビューの信頼性を十分に保証するための機能が不足している場合が多い。例えば、商品に関連しないレビューや、不自然なレビュー、コピペレビューなどが混在してしまい、ユーザが正確な情報を得ることが困難である。また、レビューコメントの感情分析を行うことで、より精度の高い商品の評価を提供することが求められている。しかし、現行のシステムには感情分析機能が欠如しているため、レビューの質と信頼性を向上させることができない。 Traditional review comment rating systems often lack the functionality to fully guarantee the reliability of reviews. For example, they often contain a mixture of reviews that are unrelated to the product, unnatural reviews, and copy-and-paste reviews, making it difficult for users to obtain accurate information. There is also a demand for more accurate product ratings through sentiment analysis of review comments. However, current systems lack sentiment analysis functionality, making it impossible to improve the quality and reliability of reviews.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情分析を行う手段と、レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報を得られ、商品の評価をより正確に行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for performing sentiment analysis on the review comments, and means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results. This allows users to obtain highly reliable review information and more accurately evaluate products.
「レビューコメント」とは、商品やサービスに対してユーザが記入する感想や評価を指す。 "Review comments" refer to impressions and evaluations written by users about products and services.
「収集する手段」とは、特定の情報をインターネットやデータベースから取得するプロセスや機能を指す。 "Means of collection" refers to the process or function of obtaining specific information from the Internet or a database.
「データ前処理」とは、収集したデータを解析や解析前の処理を施し、不要な部分を削除したり形式を整えたりする工程を指す。 "Data preprocessing" refers to the process of analyzing collected data or performing pre-analysis processing to remove unnecessary parts and format the data.
「特徴ワードリスト」とは、特定の商品やカテゴリに関連する重要なキーワードをまとめたリストを指す。 A "characteristic word list" refers to a list of important keywords related to a specific product or category.
「商品関連性を判定する手段」とは、レビューコメントが特定の商品にどれだけ関連しているかを評価するための方法やアルゴリズムを指す。 "Means for determining product relevance" refers to the methods or algorithms used to evaluate how relevant a review comment is to a particular product.
「パターンを解析し不自然なレビューを判定する手段」とは、レビューコメントの内容や投稿パターンを分析し、不自然な内容や典型的な操作を検出する方法を指す。 "Methods of analyzing patterns to identify unnatural reviews" refers to methods of analyzing the content and posting patterns of review comments to detect unnatural content and typical actions.
「コピペレビュー」とは、他のレビューコメントをコピーしてそのまま貼り付けた、同一内容のレビューコメントを指す。 A "copy-and-paste review" refers to a review comment that contains the same content as another review comment, copied and pasted exactly as is.
「感情分析」とは、テキストデータからユーザの感情や意図を解析して、ポジティブ、ネガティブ、または中立などの分類を行う技術を指す。 "Sentiment analysis" refers to the technology of analyzing user emotions and intentions from text data and classifying them as positive, negative, or neutral.
「フィードバック」とは、解析結果や評価結果をユーザやシステムに返すプロセスを指す。 "Feedback" refers to the process of returning analysis and evaluation results to the user or system.
発明を実施するための形態 Form for implementing the invention
本発明は、ショッピングプラットフォームにおいてレビューコメントの信頼性を向上させ、ユーザに最適な情報を提供するシステムである。このシステムは、レビューコメントを収集し、データ前処理を行い、商品関連性、不自然さ、コピペの有無、感情分析を実施した上で、フィードバックを行うものである。 This invention is a system that improves the reliability of review comments on shopping platforms and provides users with optimal information. This system collects review comments, performs data preprocessing, and analyzes product relevance, unnaturalness, whether or not they have been copied and pasted, and sentiment before providing feedback.
システム概要 System Overview
サーバは以下の手段を含む: The server includes the following means:
1. レビューコメントを収集する手段: 1. How to collect review comments:
サーバは、APIを介してショッピングプラットフォームから定期的に全てのレビューコメントを取得する。この収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. These collected review comments are stored in a database.
2. レビューコメントのデータ前処理を行う手段: 2. Methods for preprocessing review comment data:
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行い、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, tokenizes the review comments into words and sentences, and prepares them in an analyzable form.
3. レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段: 3. How to determine product relevance by comparing review comments with a list of characteristic words:
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば“画質”、“バッテリー”、“操作性”などのワードリストが用意される。ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server compares review comments with a word list based on the characteristics and attributes of each product. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" would be prepared. The server scores the number of times words from the word list appear in the review comments, and if the score is above a certain level, it is determined to be a "review highly relevant to the product."
4. レビューコメントのパターンを解析し不自然なレビューを判定する手段: 4. How to analyze review comment patterns and identify unnatural reviews:
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックし、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time, and if an unnatural pattern is detected, it flags the review comment.
5. レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段: 5. How to compare review comments and identify comments with identical content as copy-and-paste reviews:
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックし、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Every time a new review comment is submitted, the server compares it with all existing review comments. Using sophisticated text comparison algorithms, it checks whether an identical review comment already exists, and if a match is found, it flags the review comment as a "copy-and-paste review."
6. レビューコメントの感情分析を行う手段: 6. How to perform sentiment analysis on review comments:
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, and neutral emotions. Based on the scoring by the emotion engine, the emotion score of the review comments is calculated and reflected in the overall rating of the product.
7. レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段: 7. Means of providing feedback on review relevance, unnaturalness, copy-paste determination results, and sentiment analysis results:
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、エラーメッセージをユーザに表示し、投稿の理由を説明する。フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知し、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, an error message will be displayed to the user, explaining the reason for the post. Feedback will be provided to the user and administrator, along with the sentiment score calculated by the sentiment engine, and administrators will be notified, urging them to further review and take action.
使用するハードウェア及びソフトウェア Hardware and software used
ハードウェア: サーバ、クラウドストレージデバイス Hardware: Servers, cloud storage devices
ソフトウェア: Python、requests、BeautifulSoup、re、nltk、textblob、scikit-learn、感情エンジン(TextBlobなど) Software: Python, requests, BeautifulSoup, re, nltk, textblob, scikit-learn, emotion engine (TextBlob, etc.)
具体例 Specific examples
具体例として、レビューコメント「このスマホの画質は抜群です。」を処理する手順を示す。このコメントは、キーワードである“画質”が含まれているため商品関連性が高いと判定され、不自然なレビューやコピペレビューとの一致もないため承認される。 As a concrete example, we will show the steps for processing the review comment "The image quality of this smartphone is outstanding." This comment is determined to be highly relevant to the product because it contains the keyword "image quality," and is approved because it does not match unnatural reviews or copy-paste reviews.
プロンプト文の例 Example prompt
生成AIモデルへ入力するプロンプト文の例: Example of a prompt to input to a generative AI model:
新しいレビューコメント「このスマホの画質は抜群です。」を解析してください。以下の基準で評価します: Analyze the new review comment, "The image quality of this phone is outstanding." We'll rate it based on the following criteria:
1. 商品関連性 1. Product Relevance
2. 不自然なパターン 2. Unnatural patterns
3. コピペ 3. Copy and paste
4. 感情分析 4. Sentiment analysis
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを定期的に呼び出し、各商品のレビューコメントを取得する。入力として、APIのエンドポイントURLと認証情報を使用する。出力として、取得したレビューコメントを含むJSONデータが生成される。このデータはサーバのデータベースに保存される。 The server periodically calls the shopping platform's API to retrieve review comments for each product. As input, it uses the API endpoint URL and authentication information. As output, it generates JSON data containing the retrieved review comments. This data is stored in the server's database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集されたレビューコメントをクリーニングする。入力として、データベースに保存されたレビューコメントのテキストデータを使用する。具体的な動作として、不要な空白や特殊文字、HTMLタグを除去し、レビューコメントを単語や文単位でトークン化する。出力として、クリーンなテキストデータが生成され、次のステップに渡される。 The server cleans the collected review comments. As input, it uses the text data of the review comments stored in the database. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, and tokenizes the review comments into words and sentences. As output, clean text data is generated and passed to the next step.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用して、レビューコメントの関連性を評価する。入力として、クリーンなレビューコメントと特徴ワードリストを使用する。具体的な動作として、特徴ワードリストに含まれる単語がレビューコメントにどれだけ出現するかをスコアリングする。出力として、各レビューコメントの関連性スコアが生成される。 The server evaluates the relevance of review comments using a word list based on the features and attributes of each product. As input, it uses the clean review comments and the feature word list. Specifically, it scores how often words included in the feature word list appear in the review comments. As output, it generates a relevance score for each review comment.
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、パターンを確認する。入力として、過去一定期間のレビューコメントのテキストデータと現在のレビューコメントを使用する。具体的な動作として、テキストのパターンマッチングアルゴリズムを適用し、類似度を評価する。出力として、不自然なレビューかどうかを示すフラグが生成される。 The server analyzes all review comments posted within a certain period of time and checks for patterns. As input, it uses text data from review comments over a certain period of time in the past and the current review comment. Specifically, it applies a text pattern matching algorithm to evaluate the similarity. As output, it generates a flag indicating whether the review is unnatural.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。入力として、新しいレビューコメントと既存のレビューコメントのデータを使用する。具体的な動作として、高度なテキスト比較アルゴリズム(例:コサイン類似度)を使用して、全く同じ内容のレビューコメントが存在するかチェックする。出力として、コピペレビュー判定結果のフラグが生成される。 Each time a new review comment is posted, the server compares it with all existing review comments. It uses the data of the new review comment and the existing review comments as input. Specifically, it uses an advanced text comparison algorithm (e.g., cosine similarity) to check whether a review comment with the exact same content exists. As output, it generates a flag indicating whether the review is a copy-and-paste review.
ステップ6: Step 6:
感情分析 sentiment analysis
サーバは、レビューコメントを感情エンジンに解析させる。入力として、クリーンなレビューコメントを使用する。具体的な動作として、感情エンジン(例:TextBlob)にテキストを送信し、ポジティブ、ネガティブ、中立の感情スコアを取得する。出力として、レビューコメントごとの感情スコアが生成される。 The server parses the review comments into the sentiment engine. It uses the clean review comments as input. Specifically, it sends the text to the sentiment engine (e.g., TextBlob) and obtains a sentiment score: positive, negative, or neutral. The output is a sentiment score for each review comment.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、これまでのステップで得られた判定結果を元にフィードバックを行う。入力として、すべての判定結果(関連性、不自然さ、コピペ判定結果、感情スコア)を使用する。具体的な動作として、フラグが立たない場合のみ投稿を許可し、フラグが立った場合はエラーメッセージをユーザに表示する。管理者にはさらに詳細なフィードバックが通知される。出力として、ユーザにはエラーメッセージまたは承認メッセージが表示され、レビューコメントがデータベースに保存される。 When an attempt is made to post a review comment, the server provides feedback based on the judgment results obtained in the previous steps. All judgment results (relevance, unnaturalness, copy-paste judgment results, and sentiment score) are used as input. Specific behavior is to allow posting only if no flags are raised, and to display an error message to the user if a flag is raised. More detailed feedback is then provided to the administrator. As output, an error message or approval message is displayed to the user, and the review comment is saved in the database.
特定処理部290は、特定処理の結果をスマート眼鏡214に送信する。スマート眼鏡214では、制御部46Aが、スピーカ240に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the smart glasses 214. In the smart glasses 214, the control unit 46A causes the speaker 240 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成系AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). Examples of data generation model 58 include generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>) and Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating speech, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマート眼鏡214によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the smart glasses 214.
[第3実施形態] [Third embodiment]
図5には、第3実施形態に係るデータ処理システム310の構成の一例が示されている。 Figure 5 shows an example of the configuration of a data processing system 310 according to the third embodiment.
図5に示すように、データ処理システム310は、データ処理装置12及びヘッドセット型端末314を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 5, the data processing system 310 includes a data processing device 12 and a headset terminal 314. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
ヘッドセット型端末314は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及びディスプレイ343を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及びディスプレイ343も、バス52に接続されている。 The headset terminal 314 includes a computer 36, a microphone 238, a speaker 240, a camera 42, a communication I/F 44, and a display 343. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, the speaker 240, the camera 42, and the display 343 are also connected to the bus 52.
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.
図6には、データ処理装置12及びヘッドセット型端末314の要部機能の一例が示されている。図6に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 6 shows an example of the main functions of the data processing device 12 and headset terminal 314. As shown in Figure 6, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
ヘッドセット型端末314では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the headset terminal 314, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、適切なフィードバックを行うことにより、ユーザがより正確なレビュー情報を得られるようにするためのものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and provides appropriate feedback, allowing users to obtain more accurate review information. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。これにより、新しいレビューコメントがシステムに取り込まれる。 The server periodically retrieves all review comments from the shopping platform via API, allowing new review comments to be added to the system.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the collected review comment data. Preprocessing includes removing unnecessary spaces and special characters, splitting review comments, and standardizing language.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのワードリストが設定される。 The server compares the review comment with a feature word list based on product attributes. For example, if the review is about a smartphone, a word list such as "image quality," "battery," and "operability" will be set.
サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is determined to be a "review with high product relevance."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似通ったレビューが連続して投稿されていないかを確認する。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server will flag reviews if any unusual patterns are detected.
具体例: Example:
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、レビューコメントが新しく投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。 Every time a new review comment is posted, the server compares it with all existing review comments to see if any have the exact same content.
サーバは、完全一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 If the server finds an exact match, it will flag the review as a "copy-and-paste review."
具体例: Example:
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。 When a review is submitted, the server will only allow it to be submitted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted.
サーバは、不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者に対してもレビュー内容と判定結果を通知する。 The server filters out inappropriate reviews and displays an error message to the user. It also notifies the administrator of the review content and the judgment result.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This system allows users to select products based on reliable review information, improving the quality of reviews across the entire online shopping platform.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームからAPIを利用し、全てのレビューコメントを一定期間ごとに取得する。この収集には、全商品のレビューコメントが含まれる。 The server uses an API from the shopping platform to periodically retrieve all review comments. This collection includes review comments for all products.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをテキストデータとして保存する。次に、レビューコメントから不要な空白、特殊文字、HTMLタグを除去するためのクリーニング処理を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server stores the collected review comments as text data. Next, it performs a cleaning process to remove unnecessary spaces, special characters, and HTML tags from the review comments. It then tokenizes the review comments into words and sentences, converting them into an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを事前に設定しておく。レビューコメントが投稿されると、サーバはそのコメント内の単語とワードリストを比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが使用される。サーバは、ワードリストに含まれる単語がコメント内にどの程度出現するかをスコア化し、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server pre-sets a word list based on the characteristics and attributes of each product. When a review comment is posted, the server compares the words in the comment with the word list. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" is used. The server scores how often words from the word list appear in the comment, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。似通った内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. If the server detects an unnatural pattern, it flags the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかを判定する。サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Each time a new review comment is submitted, the server compares it with all existing review comments. It uses sophisticated text comparison algorithms to determine whether a review comment with the exact same content already exists. If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ、投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。また、サーバは不正なレビューについて管理者に通知し、管理者がレビューを再確認する手助けを行う。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the posting. The server will also notify administrators of the fraudulent review and help them review the review.
この具体的なステップに基づき、信頼性の高いレビュー情報をユーザに提供し、ショッピングプラットフォーム全体の品質向上を図ることができるものである。 Based on these concrete steps, we will be able to provide users with reliable review information and improve the quality of the entire shopping platform.
(実施例1) (Example 1)
次に、実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
オンラインショッピングプラットフォームにおいて、ユーザが商品選定の参考にするレビューコメントは、その信頼性が重要である。しかし、偽レビューやコピペレビュー、不自然なパターンのレビューが横行しており、ユーザが正確な情報を得ることが困難である。このため、レビューコメントの信頼性を評価し、ユーザに正確なレビュー情報を提供する仕組みが求められている。 On online shopping platforms, the reliability of review comments, which users use as a reference when selecting products, is important. However, fake reviews, copy-and-paste reviews, and reviews with unnatural patterns are rampant, making it difficult for users to obtain accurate information. For this reason, there is a need for a system that can evaluate the reliability of review comments and provide users with accurate review information.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴語リストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報に基づいて商品を選定することが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a feature word list to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, and means for providing feedback on the review relevance, unnaturalness, and copy-and-paste determination results. This enables users to select products based on highly reliable review information.
「レビューコメント」とは、オンラインショッピングプラットフォームにおいてユーザが商品について投稿する意見や評価である。 "Review comments" are opinions and ratings posted by users about products on online shopping platforms.
「データ前処理」とは、収集したレビューコメントのテキストデータから不要な空白や特殊文字を除去し、トークン化や言語統一を行う処理である。 "Data preprocessing" refers to the process of removing unnecessary spaces and special characters from the text data of collected review comments, and performing tokenization and language standardization.
「特徴語リスト」とは、商品に関するレビューコメントの信頼性を評価するために設定された、商品属性に基づくキーワードのリストである。 A "characteristic word list" is a list of keywords based on product attributes that are set up to evaluate the reliability of review comments about a product.
「商品関連性」とは、レビューコメントが特定の商品について言及している度合いや、特徴語リストとの一致度を示す指標である。 "Product relevance" is an indicator that shows the degree to which review comments mention a specific product and the degree of match with the feature word list.
「パターン解析」とは、レビューコメントの投稿パターンを分析し、一定期間内に連続して同一または類似の内容が投稿されているかを判定するプロセスである。 "Pattern analysis" is the process of analyzing the posting patterns of review comments and determining whether the same or similar content has been posted consecutively within a certain period of time.
「不自然なレビュー」とは、通常のユーザ行動から逸脱していると判断されるレビューのことで、短期間に似た内容のコメントが連続して投稿される場合などを指す。 An "unnatural review" is a review that is deemed to deviate from normal user behavior, such as when similar comments are posted in succession within a short period of time.
「コピペレビュー」とは、既存のレビューコメントをそのままコピーして投稿されたコメントのことであり、内容が全く同一であるレビューを指す。 A "copy-and-paste review" is a comment that is posted by simply copying an existing review comment, and refers to a review with exactly the same content.
「フィードバック」とは、レビューコメントの関連性、不自然さ、コピペ判定結果をユーザおよび管理者に通知し、適切なレビューのみを許可する処理である。 "Feedback" is a process that notifies users and administrators of the relevance, unnaturalness, and copy-and-paste judgment results of review comments, allowing only appropriate reviews.
本発明は、オンラインショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザがより正確なレビュー情報を得られるようにするシステムである。以下に、具体的な実施形態を詳述する。 The present invention is a system that evaluates the reliability of review comments on online shopping platforms, allowing users to obtain more accurate review information. Specific embodiments are described in detail below.
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを利用して定期的に全てのレビューコメントを取得する。これにより、最新のレビューコメントも含めてデータベースに定期的に保存される。使用する具体的なソフトウェアとしては、Pythonのrequestsライブラリを用いる。 The server periodically retrieves all review comments using the shopping platform's API. This periodically saves the comments, including the most recent ones, to the database. The specific software used is the Python requests library.
データ前処理 Data preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、テキストデータのトークン化、言語統一などが含まれる。この処理には、Pythonのnltkライブラリおよびreモジュールが使用される。 The server preprocesses the collected review comment data. This includes removing unnecessary whitespace and special characters, tokenizing the text data, and unifying the language. This process uses the Python nltk library and re module.
商品関連性の判定 Product relevance determination
サーバは、レビューコメントと商品属性に基づく特徴語リストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などの特徴語リストが設定される。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。具体的なソフトウェアとしては、Pythonのscikit-learnライブラリを使用する。 The server compares the review comments with a feature word list based on product attributes. For example, for a review about a smartphone, a feature word list such as "image quality," "battery," and "operability" is set. The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is deemed to be "highly relevant to the product." The specific software used is the Python scikit-learn library.
具体例 Specific examples
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
ワードリストに「画質」が含まれるため、高スコアと判定される。 Since "image quality" is included in the word list, it is judged to have a high score.
不自然なレビューの判定 Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似た内容のレビューが連続して投稿されていないかを確認する。サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。この工程には、PythonのPandasライブラリおよび時系列解析が用いられる。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time. If the server detects an unnatural pattern, it flags those reviews. This process uses Python's Pandas library and time series analysis.
具体例 Specific examples
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
サーバは、これらを不自然なレビューと判定し、フラグを付ける。 The server will identify these as unnatural reviews and flag them.
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。ソフトウェアとして、Pythonのdifflibライブラリを使用する。 Every time a new review comment is posted, the server compares it with all existing review comments to see if there are any identical comments. If the server finds a matching comment, it flags the review as a "copy-and-paste review." The software uses the Python difflib library.
具体例 Specific examples
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
サーバは、レビュー2をコピペレビューと判定し、フラグを付ける。 The server determines that Review 2 is a copy-and-paste review and flags it.
フィードバック Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者にはレビュー内容と判定結果を通知する。この処理には、PythonのFlaskまたはDjangoフレームワークおよび通知用のメールサーバ(SMTP)が使用される。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. Inappropriate reviews are filtered out and an error message is displayed to the user. The server also notifies the administrator of the review content and the result of the judgment. This process uses the Python Flask or Django framework and an email server (SMTP) for notifications.
プロンプト文の例 Example prompt
ユーザーが投稿したレビューコメント「このスマホのバッテリー持ちは優れています。」を評価し、以下の条件に基づいてフィードバックを行ってください。 Please rate the user-submitted review comment, "This phone has excellent battery life." and provide feedback based on the following criteria:
条件: Conditions:
1. 商品関連性の高いレビューかどうかを判定するため、「バッテリー」「持ち」「優れています」などの特徴語リストに基づいてスコアリングを行う。 1. To determine whether a review is highly relevant to the product, it is scored based on a list of characteristic words such as "battery," "lifespan," and "excellent."
2. 一定期間内に似たレビューが連続して投稿されていないか確認する。 2. Check to see if similar reviews have been posted consecutively within a certain period of time.
3. 既存のレビューコメントと比較し、コピペレビューかどうかをチェックする。 3. Compare with existing review comments to check if the review is a copy-and-paste one.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上することが期待される。 This system will enable users to select products based on reliable review information, and is expected to improve the quality of reviews across online shopping platforms.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
レビューコメントの収集を行う。サーバは、ショッピングプラットフォームのAPIを通じて定期的に全てのレビューコメントを取得する。入力はAPIリクエストであり、出力は取得されたJSON形式のレビューコメントデータである。サーバは、APIリクエストを送信し、受信したデータをデータベースに保存する。 Collects review comments. The server periodically retrieves all review comments through the shopping platform's API. The input is the API request, and the output is the retrieved review comment data in JSON format. The server sends the API request and stores the received data in a database.
ステップ2: Step 2:
データ前処理を行う。サーバは、収集したレビューコメントのデータに対して前処理を実行する。入力はJSON形式のレビューコメントデータであり、出力は前処理されたテキストデータである。サーバは、不要な空白や特殊文字を除去し、テキストデータをトークン化し、言語統一を行う。 Performs data preprocessing. The server performs preprocessing on the collected review comment data. The input is JSON-formatted review comment data, and the output is preprocessed text data. The server removes unnecessary whitespace and special characters, tokenizes the text data, and standardizes the language.
ステップ3: Step 3:
商品関連性の判定を行う。サーバは、前処理されたレビューコメントと商品属性に基づく特徴語リストを比較する。入力は前処理されたテキストデータと特徴語リストであり、出力はスコアリングされたレビューコメントデータである。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 Determines product relevance. The server compares preprocessed review comments with a feature word list based on product attributes. The input is preprocessed text data and a feature word list, and the output is scored review comment data. The server scores how often words included in the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定を行う。サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。入力は特定期間内のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、短期間に似た内容のレビューが連続して投稿されていないかを確認し、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 Identifies unnatural reviews. The server analyzes patterns in review comments posted within a certain period of time. The input is review comment data from a specific period of time, and the output is the judgment result and flagged data. The server checks whether reviews with similar content have been posted in succession within a short period of time, and if an unnatural pattern is detected, it flags those reviews.
ステップ5: Step 5:
コピペレビューの判定を行う。サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。入力は新しいレビューコメントと既存のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 Determines copy-and-paste reviews. Every time a new review comment is posted, the server compares it with all existing review comments. The input is the new review comment and existing review comment data, and the output is the determination result and flagged data. If the server finds a matching comment, it flags the review as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックを行う。サーバは、レビュー投稿時にそのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。入力はレビューコメントとそれに対する各種判定結果であり、出力はユーザおよび管理者への通知結果である。サーバは、不適切なレビューについてフィルタリングを行い、エラーメッセージをユーザに表示し、管理者に対してもレビュー内容と判定結果を通知する。 Provides feedback. The server will only allow a review to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. The input is the review comment and various judgment results, and the output is notifications to the user and administrator. The server filters out inappropriate reviews, displays an error message to the user, and notifies the administrator of the review content and judgment results.
(応用例1) (Application Example 1)
次に、応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来のショッピングプラットフォームでは、信頼性の低いレビューコメントが多く投稿され、それがユーザーの購買判断を誤らせる原因となっていた。また、短期間に似通ったレビューやコピペレビューが投稿されることにより、レビューの信頼性が低下する問題があった。従って、信頼性の高いレビュー情報をユーザーに提供し、より正確な購買判断を支援するシステムの開発が求められていた。 On conventional shopping platforms, many unreliable review comments were posted, causing users to make incorrect purchasing decisions. There was also the problem of similar reviews and copy-paste reviews being posted within a short period of time, reducing the reliability of the reviews. Therefore, there was a need to develop a system that could provide users with reliable review information and help them make more accurate purchasing decisions.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、レビューコメントの信頼性をリアルタイムで評価しフィードバックする手段と、信頼性の高い順にレビューを表示する手段と、を含む。これにより、ユーザーは信頼性の高いレビューをリアルタイムで受け取り、それに基づいてより正確な購買判断を行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for providing feedback on the relevance, unnaturalness, and copy-and-paste determination results of the reviews, means for evaluating and providing feedback on the reliability of the review comments in real time, and means for displaying reviews in order of reliability. This allows users to receive reliable reviews in real time and make more accurate purchasing decisions based on them.
「レビューコメント」とは、ユーザーが商品やサービスに対して評価や感想を文章形式で記述したものである。 A "review comment" is a written comment written by a user expressing their evaluation or opinion of a product or service.
「収集する手段」とは、オンラインプラットフォームからデータを取得し、システムに取り込む方法を指す。 "Means of collection" refers to the method by which data is obtained from online platforms and entered into the system.
「データ前処理」とは、取得されたデータを解析しやすくするために、不要な情報を削除し、整形するプロセスである。 "Data preprocessing" is the process of removing unnecessary information and formatting acquired data to make it easier to analyze.
「特徴ワードリスト」とは、特定の商品やサービスに関連する重要なキーワードを集めたリストである。 A "characteristic word list" is a list of important keywords related to a specific product or service.
「商品関連性」とは、レビューコメントが特定の商品やサービスにどれだけ関連しているかを示す度合いである。 "Product relevance" is the degree to which a review comment relates to a particular product or service.
「パターンを解析する手段」とは、レビューコメントの中の一定のテンプレートや類似性を検出する方法である。 "Pattern analysis methods" are methods for detecting certain templates or similarities in review comments.
「不自然なレビュー」とは、短期間に大量に投稿されたり、同じ内容が繰り返されるなど、通常のユーザー行動とは異なるコメントである。 "Unnatural reviews" are comments that deviate from normal user behavior, such as those posted in large numbers in a short period of time or those that contain repeated, repeated comments.
「コピペレビュー」とは、他のコメントと完全に同一の内容がコピー&ペーストされたレビューコメントである。 A "copy-and-paste review" is a review comment in which the exact same content as another comment is copied and pasted.
「フィードバックする手段」とは、ユーザーや管理者に対して評価結果を通知し、適切なアクションを促すための方法である。 "Means of providing feedback" refers to methods for notifying users and administrators of evaluation results and encouraging them to take appropriate action.
「信頼性をリアルタイムで評価する手段」とは、レビューが投稿される瞬間に、その評価の正確性や信用度を自動的に判定する方法である。 "Means for assessing trustworthiness in real time" refers to a method that automatically determines the accuracy and credibility of a review the moment it is posted.
「信頼性の高い順に表示する手段」とは、評価が高いレビューコメントを上位に表示することで、ユーザーが参考にしやすくする方法である。 "Displaying in order of reliability" is a method of displaying highly rated review comments at the top, making them easier for users to refer to.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザーがより正確なレビュー情報を得られるようにするものである。このシステムは、以下のプロセスを通じて実施される。 The system of the present invention evaluates the reliability of review comments on shopping platforms, allowing users to obtain more accurate review information. This system is implemented through the following process:
使用するハードウェア Hardware to use
スマートフォン: ユーザーがレビューコメントを投稿するための端末として用いる。 Smartphone: Used by users as a device to post review comments.
サーバ: レビューコメントの収集、データ前処理、解析、評価、フィードバックを行う中枢的なコンピュータ。 Server: A central computer that collects review comments, preprocesses data, analyzes, evaluates, and provides feedback.
APIサーバ: ショッピングプラットフォームからレビューコメントを取得するためのインターフェースとして用いる。 API server: Used as an interface to retrieve review comments from the shopping platform.
使用するソフトウェア Software used
Python: サーバサイドのデータ処理及び解析に使用。 Python: Used for server-side data processing and analysis.
Flask: PythonのWebフレームワークとしてAPIサーバを構築するために用いる。 Flask: A Python web framework used to build API servers.
MySQL: データベース管理システムとして収集したレビューコメントを保存するために使用。 MySQL: Used as a database management system to store collected review comments.
自然言語処理ライブラリ: レビューコメントの前処理および解析に使用。 Natural language processing library: Used for preprocessing and parsing review comments.
データ加工およびデータ演算の流れ Data processing and calculation flow
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから定期的にAPIを介してレビューコメントを取得する。このAPIサーバはFlaskを用いて構築されており、取得したデータはMySQLデータベースに保存される。 The server periodically retrieves review comments from the shopping platform via API. This API server is built using Flask, and the retrieved data is stored in a MySQL database.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントのデータを前処理する。前処理には、Pythonの自然言語処理ライブラリを用いて、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the retrieved review comment data. This preprocessing includes removing unnecessary whitespace and special characters, splitting review comments, and standardizing language using a Python natural language processing library.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのキーワードが用いられる。サーバはスコアリングを行い、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server compares the review comment with a list of characteristic words based on product attributes. For example, a review about a smartphone would use keywords such as "image quality," "battery," and "operability." The server then scores the review comment, and if it scores above a certain level, it determines that the review comment is "highly relevant to the product."
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントを解析し、短期間に似通ったレビューが連続して投稿されていないかを確認する。不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server analyzes review comments posted within a certain period of time to see if similar reviews have been posted in succession within a short period of time. If an unnatural pattern is detected, those reviews are flagged.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックし、完全一致するコメントがあった場合、それを「コピペレビュー」としてフラグ付けする。 The server compares the newly posted review comment with all existing review comments. It checks to see if there are any identical comments, and if there is an exact match, it flags it as a "copy-and-paste review."
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可し、ユーザーにリアルタイムでフィードバックする。また、信頼性の高い順にレビューを表示する機能も持つ。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted, and will provide real-time feedback to the user. It also has a function to display reviews in order of reliability.
具体例とプロンプト文の例 Specific examples and prompt sentence examples
具体例として、以下のようなレビューコメントを考慮する。 As a concrete example, consider the following review comment:
商品: スマートフォン Product: Smartphone
投稿レビュー: 「このスマホのバッテリーは長持ちします。」 Review: "This phone's battery lasts a long time."
プロンプト文の例は以下である。 An example of a prompt is as follows:
「このレビューが製品に関連しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review is relevant to the product: 'This phone's battery lasts a long time.'"
「このレビューが不自然なパターンに該当しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review fits any unnatural pattern: 'This phone's battery lasts a long time.'"
「このレビューが既存のレビューと完全一致しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review exactly matches an existing review: 'This phone's battery lasts a long time.'"
これにより、ユーザーは信頼性の高いレビューを基に商品を選ぶことができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This will allow users to choose products based on reliable reviews, improving the quality of ratings across online shopping platforms.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
サーバは、ショッピングプラットフォーム提供のAPIを使用してレビューコメントを定期的に収集する。サーバは、APIを介して取得したレビューコメントをJSON形式で受け取り、MySQLデータベースに保存する。入力はAPIから取得したJSONデータであり、出力はデータベースに保存されたレビューコメントである。 The server periodically collects review comments using an API provided by the shopping platform. The server receives the review comments obtained via the API in JSON format and stores them in a MySQL database. The input is the JSON data obtained from the API, and the output is the review comments stored in the database.
ステップ2: Step 2:
データ前処理: Data preprocessing:
サーバは、収集したレビューコメントのデータを前処理する。サーバは、Pythonの正規表現ライブラリを使用し、不要な空白や特殊文字を除去し、レビューコメントを文単位に分割する。さらに、異なる形式のデータを統一形式に変換する。入力は生のレビューコメントであり、出力は前処理されたクリーンデータである。 The server preprocesses the collected review comment data. It uses Python's regular expression library to remove unnecessary whitespace and special characters and split the review comments into sentences. It also converts data in different formats into a unified format. The input is the raw review comments, and the output is the preprocessed, clean data.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
サーバは、前処理されたレビューコメントと事前に設定した特徴ワードリストを比較する。サーバは、特徴ワードリストに含まれる単語の出現頻度を計算し、一定のスコア以上であれば商品関連性が高いと判定する。入力は前処理されたレビューコメントと特徴ワードリストであり、出力は関連性の高いレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with a pre-set feature word list. The server calculates the frequency of occurrence of words included in the feature word list, and determines that a product is highly relevant if the frequency is above a certain score. The input is the preprocessed review comments and the feature word list, and the output is data flagged as highly relevant reviews.
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
サーバは、前処理されたレビューコメントを一定期間内に投稿された他のレビューコメントと比較し、パターンを解析する。サーバは、類似のレビューコメントが短期間に大量に投稿されている場合、それを不自然なレビューとして判定し、フラグを立てる。入力は前処理されたレビューコメントと過去のレビューコメントであり、出力は不自然なレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with other review comments posted within a certain period of time and analyzes patterns. If a large number of similar review comments are posted in a short period of time, the server determines that they are unnatural reviews and flags them. The input is the preprocessed review comments and past review comments, and the output is data flagged as unnatural reviews.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと内容一致度で比較する。サーバは、全く同じ内容のレビューコメントを見つけた場合、これをコピペレビューとしてフラグ付けする。入力は新しいレビューコメントと既存のレビューコメントであり、出力はコピペレビューとして判定されたデータである。 The server compares the newly posted review comment with all existing review comments based on content similarity. If the server finds a review comment with exactly the same content, it flags it as a copy-and-paste review. The input is the new review comment and the existing review comment, and the output is the data determined to be a copy-and-paste review.
ステップ6: Step 6:
フィードバック: Feedback:
サーバは、レビューの関連性、不自然さ、コピペの各判定結果をもとに、レビュー投稿者にリアルタイムでフィードバックを行う。ユーザーの端末には、レビューが信頼性の高い順に表示される。また、信頼性の低いレビューは投稿が拒否され、その理由がユーザーに通知される。入力はレビュー判定の各結果であり、出力はフィードバックメッセージである。 The server provides real-time feedback to reviewers based on the review's relevance, unnaturalness, and copy-and-paste assessment results. Reviews are displayed on the user's device in order of reliability. Reviews with low reliability are rejected, and the user is notified of the reason. The input is the review assessment results, and the output is a feedback message.
これにより、ユーザーは信頼性の高いレビューコメントを基に、より正確な購買判断を行うことが可能となる。 This allows users to make more accurate purchasing decisions based on reliable review comments.
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、さらにユーザの感情を認識してレビュー情報を最適化するものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and further optimizes review information by recognizing user sentiment. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントをクリーニングする。不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments, removing unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, making them easier to analyze.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが用意される。 The server compares review comments with a word list based on the features and attributes of each product. For example, for a review about a smartphone, a word list would be prepared, including "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores how often words from the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は抜群です。」 Review comment: "The image quality of this smartphone is outstanding."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
具体例: Example:
レビュー1:「素晴らしい商品です!」 Review 1: "This is a great product!"
レビュー2:「素晴らしい商品です!」 Review 2: "This is a great product!"
レビュー3:「素晴らしい商品です!」 Review 3: "This is a great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
具体例: Example:
レビュー1:「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2:「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, or neutral sentiment.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
具体例: Example:
レビューコメント:「このスマホのバッテリーはすぐに切れるので使い物になりません。」 Review comment: "This phone's battery dies so quickly it's useless."
感情分析結果:ネガティブ Sentiment analysis result: Negative
スコア:低評価として反映。 Score: Reflected as a low rating.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the post.
サーバは、フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知する。一方、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 The server notifies the user and administrator of the feedback along with the emotion score generated by the emotion engine. Administrators are also notified to further review and respond to the review.
これにより、本発明のシステムは、レビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供するものである。感情エンジンの導入によって、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 As a result, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with peace of mind. The introduction of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary spaces, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, preparing them in an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントを比較する。レビューコメント内の単語とワードリストを比較し、スコア化する。例えば、スマートフォンに関連するワードリストには「画質」「バッテリー」「操作性」などが含まれる。 The server compares review comments using a word list based on the features and attributes of each product. It compares the words in the review comments with the word list and generates a score. For example, a word list related to smartphones might include "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。特に文の長さ、使用される単語、文の構造などを比較する。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. In particular, it compares sentence length, the words used, sentence structure, etc.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
感情エンジンによる感情認識 Emotion recognition using an emotion engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。具体的には、自然言語処理アルゴリズムを用いて、文中に含まれる感情表現を抽出し、スコアリングする。 The server uses an emotion engine to analyze review comments and classify them into positive, negative, or neutral sentiment. Specifically, it uses a natural language processing algorithm to extract and score emotional expressions contained in the sentences.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿が拒否された理由を説明する。 The server will only allow a review comment to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If any flags are raised, the server will display an error message to the user explaining why the post was rejected.
サーバは、不適切なレビューについてはフィルタリングを行い、さらに感情エンジンによる感情スコアも含めてユーザおよび管理者に通知する。管理者にはレビュー内容とフラグ立ちの理由、感情スコアなどの詳細情報が送信され、必要な場合にはレビューを再確認するための手助けが提供される。 The server filters out inappropriate reviews and notifies users and administrators, including the sentiment score generated by the sentiment engine. Administrators are sent detailed information such as the review content, the reason it was flagged, and the sentiment score, and are offered help in re-checking the review if necessary.
この具体的なステップに基づき、本発明のシステムはレビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供する。感情エンジンの統合により、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 Based on these specific steps, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with confidence. The integration of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
(実施例2) (Example 2)
次に、実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来のショッピングプラットフォームにおいては、レビューコメントの真偽を判断するための適切なメカニズムが欠如しており、ユーザが不正確な情報に基づいて購買決定を行うリスクがあった。このため、レビューコメントの信頼性を向上させ、ユーザが安心して利用できる環境を提供することが求められている。また、レビューコメントの感情を正確に把握することで、商品の評価情報をより正確に反映させる必要がある。 Traditional shopping platforms lacked an appropriate mechanism for determining the authenticity of review comments, leaving users at risk of making purchasing decisions based on inaccurate information. This has created a need to improve the reliability of review comments and provide an environment where users can use them with peace of mind. It is also necessary to accurately understand the sentiment behind review comments in order to more accurately reflect product evaluation information.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情を分析する手段と、レビューの関連性、不自然さ、コピペ判定結果および感情分析結果をフィードバックする手段と、レビューコメントが不自然な場合やコピペの場合、投稿を拒否する手段と、を含む。これにより、レビューコメントの信頼性を向上させ、ユーザが安心してレビューを参照できる環境を提供し、商品の評価情報をより正確に反映させることが可能となる。 The identification process by the identification processing unit 290 of the data processing device 12 in Example 2 is realized by the following means. In this invention, the server includes means for collecting review comments, means for performing data preprocessing of the review comments, means for determining product relevance by comparing the review comments with a characteristic word list, means for analyzing the patterns of the review comments to determine unnatural reviews, means for comparing the review comments to determine comments with identical content as copy-and-paste reviews, means for analyzing the sentiment of the review comments, means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results, and means for rejecting the posting of review comments that are unnatural or copy-and-paste. This improves the reliability of review comments, provides an environment where users can refer to reviews with confidence, and makes it possible to more accurately reflect product evaluation information.
「レビューコメント」とは、ショッピングプラットフォーム上でユーザが商品やサービスに対して記述する意見や評価のテキストである。 "Review comments" are textual opinions and evaluations written by users on shopping platforms about products and services.
「データ前処理」とは、収集したレビューコメントから不要な要素を取り除き、解析に適した形式に変換する処理である。 "Data preprocessing" is the process of removing unnecessary elements from collected review comments and converting them into a format suitable for analysis.
「特徴ワードリスト」とは、特定の商品やサービスに関連するキーワードのリストで、レビューコメントと比較するために使用されるものである。 A "characteristic word list" is a list of keywords related to a specific product or service that is used to compare with review comments.
「商品関連性判定」とは、レビューコメントが特定の商品やサービスに関連するかを判断するプロセスである。 "Product relevance determination" is the process of determining whether a review comment is relevant to a specific product or service.
「パターン解析」とは、レビューコメントの内容や形式を解析し、特定のパターンや異常を検出するプロセスである。 "Pattern analysis" is the process of analyzing the content and format of review comments to detect specific patterns or anomalies.
「不自然なレビュー」とは、内容や書き方が短期間内に連続して投稿されるなど、通常と異なるパターンを示すレビューコメントである。 "Unnatural reviews" are review comments that show an unusual pattern, such as content or writing style being posted repeatedly within a short period of time.
「コピペレビュー」とは、既存のレビューコメントと全く同じ内容のレビューコメントを指すものである。 A "copy-and-paste review" refers to a review comment that has exactly the same content as an existing review comment.
「感情分析」とは、レビューコメントの内容を解析し、ポジティブ、ネガティブ、中立といった感情の分類を行うプロセスである。 "Sentiment analysis" is the process of analyzing the content of review comments and classifying their sentiments as positive, negative, or neutral.
「フィードバック」とは、解析結果や判定結果をユーザまたは管理者に対して通知し、必要な対応を促す情報の提供である。 "Feedback" refers to the provision of information to notify users or administrators of analysis and judgment results, and to encourage them to take necessary action.
「投稿拒否」とは、不自然なレビューやコピペレビューが投稿されるのを防ぐために、ユーザに対して投稿を許可しない動作を指す。 "Posting refusal" refers to the action of not allowing users to post in order to prevent unnatural reviews or copy-and-paste reviews from being posted.
「サーバ」とは、レビューコメントの収集、前処理、解析、判定、フィードバック、投稿拒否などの一連の処理を管理・実行するコンピュータシステムである。 A "server" is a computer system that manages and executes a series of processes, including the collection, preprocessing, analysis, judgment, feedback, and rejection of review comments.
本発明のシステムは、ショッピングプラットフォーム上でレビューコメントの信頼性を評価し、ユーザの感情を認識してレビュー情報を最適化するものである。そのための具体的な動作や処理を以下に示す。 The system of the present invention evaluates the reliability of review comments on a shopping platform, recognizes user emotions, and optimizes review information. The specific operations and processes for this purpose are described below.
1. レビューコメントの収集 1. Collecting review comments
システムは、ショッピングプラットフォームのAPIを通じてレビューコメントを取得する。サーバは定期的にAPIエンドポイントにリクエストを送り、取得したレビューコメントをデータベースに保存する。具体的には、データベースとしてMySQLやPostgreSQLを使用することができる。 The system retrieves review comments through the shopping platform's API. The server periodically sends requests to the API endpoint and stores the retrieved review comments in a database. Specifically, MySQL or PostgreSQL can be used as the database.
例えば、サーバがAPIエンドポイント "https://example.com/api/reviews" にアクセスして、取得したレビューコメントを "reviews" テーブルに格納する。 For example, the server accesses the API endpoint "https://example.com/api/reviews" and stores the retrieved review comments in the "reviews" table.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化する。PythonのNLPライブラリであるNLPKを使用して、この前処理を行うことができる。 The server cleans the retrieved review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences. This preprocessing can be performed using NLPK, a Python NLP library.
例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にテキストクリーニングを行い、その後トークン化する。 For example, a comment such as "This product is <p>great</p>!" is text cleaned to "This product is great!" and then tokenized.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを生成し、レビューコメントと比較する。例えば、スマートフォンのレビューに「画質」「バッテリー」「操作性」といったキーワードを含むワードリストを使用する。 The server generates a word list based on the features and attributes of each product and compares it with the review comments. For example, for smartphone reviews, a word list containing keywords such as "image quality," "battery," and "operability" is used.
具体的には、レビューコメント内のキーワードの出現頻度をスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。例えば、サーバが「このスマホの画質は抜群です」というコメントを解析し、ワードリストに「画質」が含まれていることで高いスコアを付与する。 Specifically, the frequency of keywords appearing in review comments is scored, and if the score is above a certain level, it is determined to be a "review with high product relevance." For example, the server analyzes a comment such as "The image quality of this smartphone is outstanding," and assigns a high score because "image quality" is included in the word list.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたすべてのレビューコメントを解析し、内容のパターンを確認する。具体的には、同じような内容や形式のレビューコメントが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. Specifically, it checks to see if review comments with similar content or format have been posted consecutively within a short period of time.
不自然なパターンが検出された場合、そのレビューコメントにフラグを付与する。例えば、サーバが「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿されている場合、それらに不自然さのフラグを付ける。 If an unnatural pattern is detected, the review comment is flagged. For example, if the server sees multiple reviews with the same content, such as "Great product!", posted within a short period of time, it will flag them as unnatural.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用し、一致するかどうかを判定する。 Each time a new review comment is submitted, the server compares it with all existing review comments, using sophisticated text comparison algorithms (e.g., Python's difflib library) to determine whether there is a match.
一致が見つかった場合、サーバはそのレビューコメントに「コピペレビュー」としてフラグを立てる。例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 If a match is found, the server will flag the review comment as a "copy-and-paste review." For example, if a comment already exists that says "This product is amazing!", the server will add a flag.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情解析エンジンに投入し、ポジティブ、ネガティブ、中立といった感情に分類する。具体的には、TextBlobやVADERなどの感情解析ライブラリを使用することができる。 The server inputs the review comments into a sentiment analysis engine and classifies them into positive, negative, or neutral sentiment. Specifically, sentiment analysis libraries such as TextBlob and VADER can be used.
これにより、感情スコアを計算し、そのスコアを商品の総合評価に反映する。例えば、TextBlobを使用して「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントを解析し、ネガティブスコアを付与する。 This allows us to calculate an emotional score, which is then reflected in the overall rating of the product. For example, we can use TextBlob to analyze a comment such as "This phone's battery runs out quickly, so it's useless" and assign it a negative score.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合は、エラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user explaining the reason for the post.
また、感情エンジンによる感情スコアをユーザおよび管理者に通知し、レビューの信頼性向上を図る。例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促す。また、管理者には「新しい不自然なレビューが検出されました。確認してください」と通知する。 The emotion engine also notifies users and administrators of the emotion score, helping to improve the reliability of reviews. For example, the server may notify users that "this review has been flagged as unnatural" and encourage them to resubmit. It may also notify administrators that "a new unnatural review has been detected. Please check it."
生成AIモデルへのプロンプト文の例 Example prompt for a generative AI model
「このレビューコメントが特定の商品に関連しているか、そしてその感情を分類してください。例: 'このスマホの画質は抜群です。'」 "Did this review comment relate to a specific product? Please categorize its sentiment. Example: 'The image quality of this phone is outstanding.'"
「このリストのレビューコメントが不自然であるかどうか判定してください。例: '素晴らしい商品です!', '素晴らしい商品です!'」 "Please determine whether the review comments on this listing are unnatural. Example: 'Great product!', 'Great product!'"
「このレビューコメントが既存のコメントと一致するか、コピペレビューであるかどうかチェックしてください。例: 'この商品はとても素晴らしいです!'」 "Check if this review comment matches an existing comment or is a copypasta review. Example: 'This product is amazing!'"
以上が、本発明のシステムを実施するための形態である。 The above is a form for implementing the system of the present invention.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
入力:ショッピングプラットフォームのAPIエンドポイントURL Input: Shopping platform API endpoint URL
具体的な動作:サーバは、定期的にAPIエンドポイントにリクエストを送信して、レビューコメントを取得する。例えば、APIエンドポイント "https://example.com/api/reviews" にアクセスする。 Specific behavior: The server periodically sends requests to an API endpoint to retrieve review comments. For example, it accesses the API endpoint "https://example.com/api/reviews".
データ加工:取得したレビューコメントにメタデータ(ユーザID、商品ID、投稿日時など)を付与する。 Data processing: Metadata (user ID, product ID, posting date and time, etc.) is added to the acquired review comments.
出力:レビューコメントおよびメタデータが含まれたデータセット Output: Dataset containing review comments and metadata
具体的な動作:サーバは取得したデータセットをデータベース(例:MySQLやPostgreSQL)に保存する。 Specific operation: The server stores the acquired dataset in a database (e.g., MySQL or PostgreSQL).
ステップ2: Step 2:
データ前処理: Data preprocessing:
入力:データベースに保存されたレビューコメント Input: Review comments stored in the database
具体的な動作:サーバはレビューコメントをクリーニングする。具体的には、不要な空白、特殊文字、HTMLタグの除去を行うため、PythonのNLPライブラリ(例:NLPK)を使用する。 What it does: The server cleans the review comments. Specifically, it uses a Python NLP library (e.g., NLPK) to remove unnecessary whitespace, special characters, and HTML tags.
データ加工:レビューコメントを単語や文単位でトークン化する。 Data processing: Tokenize review comments into words and sentences.
出力:クリーンでトークン化されたレビューコメント Output: Clean, tokenized review comments
具体的な動作:例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にクリーニングし、単語ごとに分ける。 Specific operation: For example, a comment such as "This product is <p>great</p>!" is cleaned to "This product is great!" and separated into individual words.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
入力:クリーンでトークン化されたレビューコメント、商品の特徴ワードリスト Input: Clean, tokenized review comments, product feature word list
具体的な動作:サーバはレビューコメントと特徴ワードリストを比較する。ワードリストには、「画質」「バッテリー」「操作性」などの製品属性に基づくキーワードが含まれる。 Specific operation: The server compares the review comments with the feature word list. The word list includes keywords based on product attributes such as "image quality," "battery," and "operability."
データ演算:レビューコメント内のキーワードの出現頻度をスコアリングする。 Data calculation: Score the frequency of keywords appearing in review comments.
出力:商品関連性スコア Output: Product relevance score
具体的な動作:例えば、「このスマホの画質は抜群です」というコメントに対し、ワードリストに「画質」が含まれていることで高スコアを付与する。 Specific operation: For example, a comment such as "The image quality of this smartphone is outstanding" will be given a high score if "image quality" is included in the word list.
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
入力:一定期間内に投稿された全てのレビューコメント Input: All review comments posted within a certain period
具体的な動作:サーバはレビューコメントの内容のパターンを解析する。同じ内容や書き方のレビューが連続して投稿されていないかチェックする。 Specific operation: The server analyzes the content patterns of review comments. It checks whether reviews with the same content or writing style have been posted consecutively.
データ演算:不自然なパターンを検出するための解析 Data calculations: Analysis to detect unnatural patterns
出力:不自然さのフラグが立ったレビューコメント Output: Review comments flagged as unnatural
具体的な動作:例えば、「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿された場合、それらに不自然さのフラグを付ける。 Specific behavior: For example, if the same review saying "This is a great product!" is posted multiple times in a short period of time, it will be flagged as unnatural.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
入力:新しいレビューコメント、既存のレビューコメント Input: New review comment, Existing review comment
具体的な動作:サーバは高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用して、新しいコメントを既存のレビューコメントと比較する。 What it does: The server uses advanced text comparison algorithms (e.g., Python's difflib library) to compare the new comment with existing review comments.
データ演算:コメントの内容の一致を確認するプロセス Data calculation: The process of checking whether the content of comments matches.
出力:コピペレビューとしてフラグが立ったレビューコメント Output: Review comments flagged as copy-paste reviews
具体的な動作:例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 Specific behavior: For example, if a comment saying "This product is amazing!" already exists, add a flag.
ステップ6: Step 6:
感情エンジンによる感情認識: Emotion recognition using the emotion engine:
入力:レビューコメント Enter: Review comment
具体的な動作:サーバはレビューコメントを感情解析エンジン(例:TextBlobやVADER)に投入し、感情を分類する。 Specific operation: The server inputs the review comments into a sentiment analysis engine (e.g., TextBlob or VADER) and classifies the sentiment.
データ演算:感情スコアの計算 Data calculation: Calculating emotion scores
出力:感情スコア付きレビューコメント Output: Review comments with sentiment scores
具体的な動作:例えば、「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントをネガティブとしてスコア付けする。 Specific behavior: For example, a comment such as "This smartphone's battery runs out quickly, making it useless" is scored as negative.
ステップ7: Step 7:
フィードバックとフィルタリング: Feedback and filtering:
入力:レビューコメント(関連性、不自然さ、コピペのフラグ付き)、感情スコア Input: Review comments (with flags for relevance, unnaturalness, and copy-paste), sentiment score
具体的な動作:サーバはレビューコメントの投稿が試みられた際、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合はエラーメッセージをユーザに表示する。 Specific behavior: When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user.
データ演算:フィードバックおよび投稿判定 Data calculation: feedback and submission evaluation
出力:ユーザおよび管理者への通知 Output: Notification to users and administrators
具体的な動作:例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促し、同時に管理者には「新しい不自然なレビューが検出されました」と通知する。 Specific behavior: For example, the server notifies the user that "this review has been flagged as unnatural" and encourages them to resubmit, while simultaneously notifying the administrator that "a new unnatural review has been detected."
以上が、このシステムのプログラムの具体的な処理ステップである。 The above are the specific processing steps of this system's program.
(応用例2) (Application Example 2)
次に、応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来のレビューコメント評価システムには、レビューの信頼性を十分に保証するための機能が不足している場合が多い。例えば、商品に関連しないレビューや、不自然なレビュー、コピペレビューなどが混在してしまい、ユーザが正確な情報を得ることが困難である。また、レビューコメントの感情分析を行うことで、より精度の高い商品の評価を提供することが求められている。しかし、現行のシステムには感情分析機能が欠如しているため、レビューの質と信頼性を向上させることができない。 Traditional review comment rating systems often lack the functionality to fully guarantee the reliability of reviews. For example, they often contain a mixture of reviews that are unrelated to the product, unnatural reviews, and copy-and-paste reviews, making it difficult for users to obtain accurate information. There is also a demand for more accurate product ratings through sentiment analysis of review comments. However, current systems lack sentiment analysis functionality, making it impossible to improve the quality and reliability of reviews.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情分析を行う手段と、レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報を得られ、商品の評価をより正確に行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for performing sentiment analysis on the review comments, and means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results. This allows users to obtain highly reliable review information and more accurately evaluate products.
「レビューコメント」とは、商品やサービスに対してユーザが記入する感想や評価を指す。 "Review comments" refer to impressions and evaluations written by users about products and services.
「収集する手段」とは、特定の情報をインターネットやデータベースから取得するプロセスや機能を指す。 "Means of collection" refers to the process or function of obtaining specific information from the Internet or a database.
「データ前処理」とは、収集したデータを解析や解析前の処理を施し、不要な部分を削除したり形式を整えたりする工程を指す。 "Data preprocessing" refers to the process of analyzing collected data or performing pre-analysis processing to remove unnecessary parts and format the data.
「特徴ワードリスト」とは、特定の商品やカテゴリに関連する重要なキーワードをまとめたリストを指す。 A "characteristic word list" refers to a list of important keywords related to a specific product or category.
「商品関連性を判定する手段」とは、レビューコメントが特定の商品にどれだけ関連しているかを評価するための方法やアルゴリズムを指す。 "Means for determining product relevance" refers to the methods or algorithms used to evaluate how relevant a review comment is to a particular product.
「パターンを解析し不自然なレビューを判定する手段」とは、レビューコメントの内容や投稿パターンを分析し、不自然な内容や典型的な操作を検出する方法を指す。 "Methods for analyzing patterns to identify unnatural reviews" refers to methods for analyzing the content and posting patterns of review comments to detect unnatural content and typical actions.
「コピペレビュー」とは、他のレビューコメントをコピーしてそのまま貼り付けた、同一内容のレビューコメントを指す。 A "copy-and-paste review" refers to a review comment that contains the same content as another review comment, copied and pasted exactly as is.
「感情分析」とは、テキストデータからユーザの感情や意図を解析して、ポジティブ、ネガティブ、または中立などの分類を行う技術を指す。 "Sentiment analysis" refers to the technology of analyzing user emotions and intentions from text data and classifying them as positive, negative, or neutral.
「フィードバック」とは、解析結果や評価結果をユーザやシステムに返すプロセスを指す。 "Feedback" refers to the process of returning analysis and evaluation results to the user or system.
発明を実施するための形態 Form for implementing the invention
本発明は、ショッピングプラットフォームにおいてレビューコメントの信頼性を向上させ、ユーザに最適な情報を提供するシステムである。このシステムは、レビューコメントを収集し、データ前処理を行い、商品関連性、不自然さ、コピペの有無、感情分析を実施した上で、フィードバックを行うものである。 This invention is a system that improves the reliability of review comments on shopping platforms and provides users with optimal information. This system collects review comments, performs data preprocessing, and analyzes product relevance, unnaturalness, whether or not they have been copied and pasted, and sentiment before providing feedback.
システム概要 System Overview
サーバは以下の手段を含む: The server includes the following means:
1. レビューコメントを収集する手段: 1. How to collect review comments:
サーバは、APIを介してショッピングプラットフォームから定期的に全てのレビューコメントを取得する。この収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. These collected review comments are stored in a database.
2. レビューコメントのデータ前処理を行う手段: 2. Methods for preprocessing review comment data:
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行い、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, tokenizes the review comments into words and sentences, and prepares them in an analyzable form.
3. レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段: 3. How to determine product relevance by comparing review comments with a list of characteristic words:
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば“画質”、“バッテリー”、“操作性”などのワードリストが用意される。ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server compares review comments with a word list based on the characteristics and attributes of each product. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" would be prepared. The server scores the number of times words from the word list appear in the review comments, and if the score is above a certain level, it is determined to be a "review highly relevant to the product."
4. レビューコメントのパターンを解析し不自然なレビューを判定する手段: 4. How to analyze review comment patterns and identify unnatural reviews:
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックし、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time, and if an unnatural pattern is detected, it flags the review comment.
5. レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段: 5. How to compare review comments and identify comments with identical content as copy-and-paste reviews:
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックし、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Every time a new review comment is submitted, the server compares it with all existing review comments. Using sophisticated text comparison algorithms, it checks whether an identical review comment already exists, and if a match is found, it flags the review comment as a "copy-and-paste review."
6. レビューコメントの感情分析を行う手段: 6. How to perform sentiment analysis on review comments:
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, and neutral emotions. Based on the scoring by the emotion engine, the emotion score of the review comments is calculated and reflected in the overall rating of the product.
7. レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段: 7. Means of providing feedback on review relevance, unnaturalness, copy-paste determination results, and sentiment analysis results:
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、エラーメッセージをユーザに表示し、投稿の理由を説明する。フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知し、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, an error message will be displayed to the user, explaining the reason for the post. Feedback will be provided to the user and administrator, along with the sentiment score calculated by the sentiment engine, and administrators will be notified, urging them to further review and take action.
使用するハードウェア及びソフトウェア Hardware and software used
ハードウェア: サーバ、クラウドストレージデバイス Hardware: Servers, cloud storage devices
ソフトウェア: Python、requests、BeautifulSoup、re、nltk、textblob、scikit-learn、感情エンジン(TextBlobなど) Software: Python, requests, BeautifulSoup, re, nltk, textblob, scikit-learn, emotion engine (TextBlob, etc.)
具体例 Specific examples
具体例として、レビューコメント「このスマホの画質は抜群です。」を処理する手順を示す。このコメントは、キーワードである“画質”が含まれているため商品関連性が高いと判定され、不自然なレビューやコピペレビューとの一致もないため承認される。 As a concrete example, we will show the steps for processing the review comment "The image quality of this smartphone is outstanding." This comment is determined to be highly relevant to the product because it contains the keyword "image quality," and is approved because it does not match unnatural reviews or copy-paste reviews.
プロンプト文の例 Example prompt
生成AIモデルへ入力するプロンプト文の例: Example of a prompt to input to a generative AI model:
新しいレビューコメント「このスマホの画質は抜群です。」を解析してください。以下の基準で評価します: Analyze the new review comment, "The image quality of this phone is outstanding." We'll rate it based on the following criteria:
1. 商品関連性 1. Product Relevance
2. 不自然なパターン 2. Unnatural patterns
3. コピペ 3. Copy and paste
4. 感情分析 4. Sentiment analysis
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを定期的に呼び出し、各商品のレビューコメントを取得する。入力として、APIのエンドポイントURLと認証情報を使用する。出力として、取得したレビューコメントを含むJSONデータが生成される。このデータはサーバのデータベースに保存される。 The server periodically calls the shopping platform's API to retrieve review comments for each product. As input, it uses the API endpoint URL and authentication information. As output, it generates JSON data containing the retrieved review comments. This data is stored in the server's database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集されたレビューコメントをクリーニングする。入力として、データベースに保存されたレビューコメントのテキストデータを使用する。具体的な動作として、不要な空白や特殊文字、HTMLタグを除去し、レビューコメントを単語や文単位でトークン化する。出力として、クリーンなテキストデータが生成され、次のステップに渡される。 The server cleans the collected review comments. As input, it uses the text data of the review comments stored in the database. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, and tokenizes the review comments into words and sentences. As output, clean text data is generated and passed to the next step.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用して、レビューコメントの関連性を評価する。入力として、クリーンなレビューコメントと特徴ワードリストを使用する。具体的な動作として、特徴ワードリストに含まれる単語がレビューコメントにどれだけ出現するかをスコアリングする。出力として、各レビューコメントの関連性スコアが生成される。 The server evaluates the relevance of review comments using a word list based on the features and attributes of each product. As input, it uses the clean review comments and the feature word list. Specifically, it scores how often words included in the feature word list appear in the review comments. As output, it generates a relevance score for each review comment.
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、パターンを確認する。入力として、過去一定期間のレビューコメントのテキストデータと現在のレビューコメントを使用する。具体的な動作として、テキストのパターンマッチングアルゴリズムを適用し、類似度を評価する。出力として、不自然なレビューかどうかを示すフラグが生成される。 The server analyzes all review comments posted within a certain period of time and checks for patterns. As input, it uses text data from review comments over a certain period of time in the past and the current review comment. Specifically, it applies a text pattern matching algorithm to evaluate the similarity. As output, it generates a flag indicating whether the review is unnatural.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。入力として、新しいレビューコメントと既存のレビューコメントのデータを使用する。具体的な動作として、高度なテキスト比較アルゴリズム(例:コサイン類似度)を使用して、全く同じ内容のレビューコメントが存在するかチェックする。出力として、コピペレビュー判定結果のフラグが生成される。 Each time a new review comment is posted, the server compares it with all existing review comments. It uses the data of the new review comment and the existing review comments as input. Specifically, it uses an advanced text comparison algorithm (e.g., cosine similarity) to check whether a review comment with the exact same content exists. As output, it generates a flag indicating whether the review is a copy-and-paste review.
ステップ6: Step 6:
感情分析 sentiment analysis
サーバは、レビューコメントを感情エンジンに解析させる。入力として、クリーンなレビューコメントを使用する。具体的な動作として、感情エンジン(例:TextBlob)にテキストを送信し、ポジティブ、ネガティブ、中立の感情スコアを取得する。出力として、レビューコメントごとの感情スコアが生成される。 The server parses the review comments into the sentiment engine. It uses the clean review comments as input. Specifically, it sends the text to the sentiment engine (e.g., TextBlob) and obtains a sentiment score: positive, negative, or neutral. The output is a sentiment score for each review comment.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、これまでのステップで得られた判定結果を元にフィードバックを行う。入力として、すべての判定結果(関連性、不自然さ、コピペ判定結果、感情スコア)を使用する。具体的な動作として、フラグが立たない場合のみ投稿を許可し、フラグが立った場合はエラーメッセージをユーザに表示する。管理者にはさらに詳細なフィードバックが通知される。出力として、ユーザにはエラーメッセージまたは承認メッセージが表示され、レビューコメントがデータベースに保存される。 When an attempt is made to post a review comment, the server provides feedback based on the judgment results obtained in the previous steps. All judgment results (relevance, unnaturalness, copy-paste judgment results, and sentiment score) are used as input. Specific behavior is to allow posting only if no flags are raised, and to display an error message to the user if a flag is raised. More detailed feedback is then provided to the administrator. As output, an error message or approval message is displayed to the user, and the review comment is saved in the database.
特定処理部290は、特定処理の結果をヘッドセット型端末314に送信する。ヘッドセット型端末314では、制御部46Aが、スピーカ240及びディスプレイ343に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the headset terminal 314. In the headset terminal 314, the control unit 46A causes the speaker 240 and display 343 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成系AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). Examples of data generation model 58 include generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>) and Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating speech, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ヘッドセット型端末314によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the headset-type terminal 314.
[第4実施形態] [Fourth embodiment]
図7には、第4実施形態に係るデータ処理システム410の構成の一例が示されている。 Figure 7 shows an example of the configuration of a data processing system 410 according to the fourth embodiment.
図7に示すように、データ処理システム410は、データ処理装置12及びロボット414を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 7, the data processing system 410 includes a data processing device 12 and a robot 414. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
ロボット414は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及び制御対象443を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及び制御対象443も、バス52に接続されている。 The robot 414 includes a computer 36, a microphone 238, a speaker 240, a camera 42, a communication I/F 44, and a control target 443. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, speaker 240, camera 42, and control target 443 are also connected to the bus 52.
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.
制御対象443は、表示装置、目部のLED、並びに、腕、手及び足等を駆動するモータ等を含む。ロボット414の姿勢や仕草は、腕、手及び足等のモータを制御することにより制御される。ロボット414の感情の一部は、これらのモータを制御することにより表現できる。また、ロボット414の目部のLEDの発光状態を制御することによっても、ロボット414の表情を表現できる。 The control object 443 includes a display device, LEDs in the eyes, and motors that drive the arms, hands, and feet. The posture and gestures of the robot 414 are controlled by controlling the motors of the arms, hands, and feet. Some of the emotions of the robot 414 can be expressed by controlling these motors. In addition, the facial expressions of the robot 414 can also be expressed by controlling the light emission state of the LEDs in the eyes of the robot 414.
図8には、データ処理装置12及びロボット414の要部機能の一例が示されている。図8に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 8 shows an example of the main functions of the data processing device 12 and the robot 414. As shown in Figure 8, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
ロボット414では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the robot 414, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain the specific processing performed by the specific processing unit 290 of the data processing device 12. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、適切なフィードバックを行うことにより、ユーザがより正確なレビュー情報を得られるようにするためのものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and provides appropriate feedback, allowing users to obtain more accurate review information. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。これにより、新しいレビューコメントがシステムに取り込まれる。 The server periodically retrieves all review comments from the shopping platform via API, allowing new review comments to be added to the system.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the collected review comment data. Preprocessing includes removing unnecessary spaces and special characters, splitting review comments, and standardizing language.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのワードリストが設定される。 The server compares the review comment with a feature word list based on product attributes. For example, if the review is about a smartphone, a word list such as "image quality," "battery," and "operability" will be set.
サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is determined to be a "review with high product relevance."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似通ったレビューが連続して投稿されていないかを確認する。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server will flag reviews if any unusual patterns are detected.
具体例: Example:
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、レビューコメントが新しく投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。 Every time a new review comment is posted, the server compares it with all existing review comments to see if any have the exact same content.
サーバは、完全一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 If the server finds an exact match, it will flag the review as a "copy-and-paste review."
具体例: Example:
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。 When a review is submitted, the server will only allow it to be submitted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted.
サーバは、不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者に対してもレビュー内容と判定結果を通知する。 The server filters out inappropriate reviews and displays an error message to the user. It also notifies the administrator of the review content and the judgment result.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This system allows users to select products based on reliable review information, improving the quality of reviews across the entire online shopping platform.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームからAPIを利用し、全てのレビューコメントを一定期間ごとに取得する。この収集には、全商品のレビューコメントが含まれる。 The server uses an API from the shopping platform to periodically retrieve all review comments. This collection includes review comments for all products.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをテキストデータとして保存する。次に、レビューコメントから不要な空白、特殊文字、HTMLタグを除去するためのクリーニング処理を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server stores the collected review comments as text data. Next, it performs a cleaning process to remove unnecessary spaces, special characters, and HTML tags from the review comments. It then tokenizes the review comments into words and sentences, converting them into an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを事前に設定しておく。レビューコメントが投稿されると、サーバはそのコメント内の単語とワードリストを比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが使用される。サーバは、ワードリストに含まれる単語がコメント内にどの程度出現するかをスコア化し、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server pre-sets a word list based on the characteristics and attributes of each product. When a review comment is posted, the server compares the words in the comment with the word list. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" is used. The server scores how often words from the word list appear in the comment, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。似通った内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. If the server detects an unnatural pattern, it flags the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかを判定する。サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Each time a new review comment is submitted, the server compares it with all existing review comments. It uses sophisticated text comparison algorithms to determine whether a review comment with the exact same content already exists. If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ、投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。また、サーバは不正なレビューについて管理者に通知し、管理者がレビューを再確認する手助けを行う。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the posting. The server will also notify administrators of the fraudulent review and help them review the review.
この具体的なステップに基づき、信頼性の高いレビュー情報をユーザに提供し、ショッピングプラットフォーム全体の品質向上を図ることができるものである。 Based on these concrete steps, we will be able to provide users with reliable review information and improve the quality of the entire shopping platform.
(実施例1) (Example 1)
次に、実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
オンラインショッピングプラットフォームにおいて、ユーザが商品選定の参考にするレビューコメントは、その信頼性が重要である。しかし、偽レビューやコピペレビュー、不自然なパターンのレビューが横行しており、ユーザが正確な情報を得ることが困難である。このため、レビューコメントの信頼性を評価し、ユーザに正確なレビュー情報を提供する仕組みが求められている。 On online shopping platforms, the reliability of review comments, which users use as a reference when selecting products, is important. However, fake reviews, copy-and-paste reviews, and reviews with unnatural patterns are rampant, making it difficult for users to obtain accurate information. For this reason, there is a need for a system that can evaluate the reliability of review comments and provide users with accurate review information.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴語リストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報に基づいて商品を選定することが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a feature word list to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, and means for providing feedback on the review relevance, unnaturalness, and copy-and-paste determination results. This enables users to select products based on highly reliable review information.
「レビューコメント」とは、オンラインショッピングプラットフォームにおいてユーザが商品について投稿する意見や評価である。 "Review comments" are opinions and ratings posted by users about products on online shopping platforms.
「データ前処理」とは、収集したレビューコメントのテキストデータから不要な空白や特殊文字を除去し、トークン化や言語統一を行う処理である。 "Data preprocessing" refers to the process of removing unnecessary spaces and special characters from the text data of collected review comments, and performing tokenization and language standardization.
「特徴語リスト」とは、商品に関するレビューコメントの信頼性を評価するために設定された、商品属性に基づくキーワードのリストである。 A "characteristic word list" is a list of keywords based on product attributes that are set up to evaluate the reliability of review comments about a product.
「商品関連性」とは、レビューコメントが特定の商品について言及している度合いや、特徴語リストとの一致度を示す指標である。 "Product relevance" is an indicator that shows the degree to which review comments mention a specific product and the degree of match with the feature word list.
「パターン解析」とは、レビューコメントの投稿パターンを分析し、一定期間内に連続して同一または類似の内容が投稿されているかを判定するプロセスである。 "Pattern analysis" is the process of analyzing the posting patterns of review comments and determining whether the same or similar content has been posted consecutively within a certain period of time.
「不自然なレビュー」とは、通常のユーザ行動から逸脱していると判断されるレビューのことで、短期間に似た内容のコメントが連続して投稿される場合などを指す。 An "unnatural review" is a review that is deemed to deviate from normal user behavior, such as when similar comments are posted in succession within a short period of time.
「コピペレビュー」とは、既存のレビューコメントをそのままコピーして投稿されたコメントのことであり、内容が全く同一であるレビューを指す。 A "copy-and-paste review" is a comment that is posted by simply copying an existing review comment, and refers to a review with exactly the same content.
「フィードバック」とは、レビューコメントの関連性、不自然さ、コピペ判定結果をユーザおよび管理者に通知し、適切なレビューのみを許可する処理である。 "Feedback" is a process that notifies users and administrators of the relevance, unnaturalness, and copy-and-paste judgment results of review comments, allowing only appropriate reviews.
本発明は、オンラインショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザがより正確なレビュー情報を得られるようにするシステムである。以下に、具体的な実施形態を詳述する。 The present invention is a system that evaluates the reliability of review comments on online shopping platforms, allowing users to obtain more accurate review information. Specific embodiments are described in detail below.
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを利用して定期的に全てのレビューコメントを取得する。これにより、最新のレビューコメントも含めてデータベースに定期的に保存される。使用する具体的なソフトウェアとしては、Pythonのrequestsライブラリを用いる。 The server periodically retrieves all review comments using the shopping platform's API. This periodically saves the comments, including the most recent ones, to the database. The specific software used is the Python requests library.
データ前処理 Data preprocessing
サーバは、収集したレビューコメントのデータを前処理する。前処理には、不要な空白や特殊文字の除去、テキストデータのトークン化、言語統一などが含まれる。この処理には、Pythonのnltkライブラリおよびreモジュールが使用される。 The server preprocesses the collected review comment data. This includes removing unnecessary whitespace and special characters, tokenizing the text data, and unifying the language. This process uses the Python nltk library and re module.
商品関連性の判定 Product relevance determination
サーバは、レビューコメントと商品属性に基づく特徴語リストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などの特徴語リストが設定される。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。具体的なソフトウェアとしては、Pythonのscikit-learnライブラリを使用する。 The server compares the review comments with a feature word list based on product attributes. For example, for a review about a smartphone, a feature word list such as "image quality," "battery," and "operability" is set. The server scores the frequency with which words included in the word list appear in the review comments, and if the score is above a certain level, the review comment is deemed to be "highly relevant to the product." The specific software used is the Python scikit-learn library.
具体例 Specific examples
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は素晴らしいです。」 Review comment: "The image quality of this smartphone is amazing."
ワードリストに「画質」が含まれるため、高スコアと判定される。 Since "image quality" is included in the word list, it is judged to have a high score.
不自然なレビューの判定 Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。短期間に似た内容のレビューが連続して投稿されていないかを確認する。サーバは、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。この工程には、PythonのPandasライブラリおよび時系列解析が用いられる。 The server analyzes patterns in review comments posted within a certain period of time, checking to see if similar reviews have been posted consecutively within a short period of time. If the server detects an unnatural pattern, it flags those reviews. This process uses Python's Pandas library and time series analysis.
具体例 Specific examples
レビュー1: 「素晴らしい商品です!」 Review 1: "Great product!"
レビュー2: 「素晴らしい商品です!」 Review 2: "Great product!"
レビュー3: 「素晴らしい商品です!」 Review 3: "Great product!"
サーバは、これらを不自然なレビューと判定し、フラグを付ける。 The server will identify these as unnatural reviews and flag them.
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックする。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。ソフトウェアとして、Pythonのdifflibライブラリを使用する。 Every time a new review comment is posted, the server compares it with all existing review comments to see if there are any identical comments. If the server finds a matching comment, it flags the review as a "copy-and-paste review." The software uses the Python difflib library.
具体例 Specific examples
レビュー1: 「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2: 「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
サーバは、レビュー2をコピペレビューと判定し、フラグを付ける。 The server determines that Review 2 is a copy-and-paste review and flags it.
フィードバック Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。不適切なレビューについてはフィルタリングを行い、エラーメッセージをユーザに表示する。また、管理者にはレビュー内容と判定結果を通知する。この処理には、PythonのFlaskまたはDjangoフレームワークおよび通知用のメールサーバ(SMTP)が使用される。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. Inappropriate reviews are filtered out and an error message is displayed to the user. The server also notifies the administrator of the review content and the result of the judgment. This process uses the Python Flask or Django framework and an email server (SMTP) for notifications.
プロンプト文の例 Example prompt
ユーザーが投稿したレビューコメント「このスマホのバッテリー持ちは優れています。」を評価し、以下の条件に基づいてフィードバックを行ってください。 Please rate the user-submitted review comment, "This phone has excellent battery life." and provide feedback based on the following criteria:
条件: Conditions:
1. 商品関連性の高いレビューかどうかを判定するため、「バッテリー」「持ち」「優れています」などの特徴語リストに基づいてスコアリングを行う。 1. To determine whether a review is highly relevant to the product, it is scored based on a list of characteristic words such as "battery," "lifespan," and "excellent."
2. 一定期間内に似たレビューが連続して投稿されていないか確認する。 2. Check to see if similar reviews have been posted consecutively within a certain period of time.
3. 既存のレビューコメントと比較し、コピペレビューかどうかをチェックする。 3. Compare with existing review comments to check if the review is a copy-and-paste one.
このシステムにより、ユーザは信頼性の高いレビュー情報を基に商品を選定することができ、オンラインショッピングプラットフォーム全体の評価品質が向上することが期待される。 This system will enable users to select products based on reliable review information, and is expected to improve the quality of reviews across online shopping platforms.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
レビューコメントの収集を行う。サーバは、ショッピングプラットフォームのAPIを通じて定期的に全てのレビューコメントを取得する。入力はAPIリクエストであり、出力は取得されたJSON形式のレビューコメントデータである。サーバは、APIリクエストを送信し、受信したデータをデータベースに保存する。 Collects review comments. The server periodically retrieves all review comments through the shopping platform's API. The input is the API request, and the output is the retrieved review comment data in JSON format. The server sends the API request and stores the received data in a database.
ステップ2: Step 2:
データ前処理を行う。サーバは、収集したレビューコメントのデータに対して前処理を実行する。入力はJSON形式のレビューコメントデータであり、出力は前処理されたテキストデータである。サーバは、不要な空白や特殊文字を除去し、テキストデータをトークン化し、言語統一を行う。 Performs data preprocessing. The server performs preprocessing on the collected review comment data. The input is JSON-formatted review comment data, and the output is preprocessed text data. The server removes unnecessary whitespace and special characters, tokenizes the text data, and standardizes the language.
ステップ3: Step 3:
商品関連性の判定を行う。サーバは、前処理されたレビューコメントと商品属性に基づく特徴語リストを比較する。入力は前処理されたテキストデータと特徴語リストであり、出力はスコアリングされたレビューコメントデータである。サーバは、ワードリストに含まれる単語がレビューコメントにどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 Determines product relevance. The server compares preprocessed review comments with a feature word list based on product attributes. The input is preprocessed text data and a feature word list, and the output is scored review comment data. The server scores how often words included in the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定を行う。サーバは、一定期間内に投稿されたレビューコメントのパターンを解析する。入力は特定期間内のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、短期間に似た内容のレビューが連続して投稿されていないかを確認し、不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 Identifies unnatural reviews. The server analyzes patterns in review comments posted within a certain period of time. The input is review comment data from a specific period of time, and the output is the judgment result and flagged data. The server checks whether reviews with similar content have been posted in succession within a short period of time, and if an unnatural pattern is detected, it flags those reviews.
ステップ5: Step 5:
コピペレビューの判定を行う。サーバは、新しいレビューコメントが投稿されるたびに、既存の全レビューコメントと比較する。入力は新しいレビューコメントと既存のレビューコメントデータであり、出力は判定結果とフラグ付けされたデータである。サーバは、一致するコメントがあった場合、そのレビューを「コピペレビュー」としてフラグを立てる。 Determines copy-and-paste reviews. Every time a new review comment is posted, the server compares it with all existing review comments. The input is the new review comment and existing review comment data, and the output is the determination result and flagged data. If the server finds a matching comment, it flags the review as a "copy-and-paste review."
ステップ6: Step 6:
フィードバックを行う。サーバは、レビュー投稿時にそのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。入力はレビューコメントとそれに対する各種判定結果であり、出力はユーザおよび管理者への通知結果である。サーバは、不適切なレビューについてフィルタリングを行い、エラーメッセージをユーザに表示し、管理者に対してもレビュー内容と判定結果を通知する。 Provides feedback. The server will only allow a review to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. The input is the review comment and various judgment results, and the output is notifications to the user and administrator. The server filters out inappropriate reviews, displays an error message to the user, and notifies the administrator of the review content and judgment results.
(応用例1) (Application Example 1)
次に、応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来のショッピングプラットフォームでは、信頼性の低いレビューコメントが多く投稿され、それがユーザーの購買判断を誤らせる原因となっていた。また、短期間に似通ったレビューやコピペレビューが投稿されることにより、レビューの信頼性が低下する問題があった。従って、信頼性の高いレビュー情報をユーザーに提供し、より正確な購買判断を支援するシステムの開発が求められていた。 On conventional shopping platforms, many unreliable review comments were posted, causing users to make incorrect purchasing decisions. There was also the problem of similar reviews and copy-paste reviews being posted within a short period of time, reducing the reliability of the reviews. Therefore, there was a need to develop a system that could provide users with reliable review information and help them make more accurate purchasing decisions.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、レビューコメントの信頼性をリアルタイムで評価しフィードバックする手段と、信頼性の高い順にレビューを表示する手段と、を含む。これにより、ユーザーは信頼性の高いレビューをリアルタイムで受け取り、それに基づいてより正確な購買判断を行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for providing feedback on the relevance, unnaturalness, and copy-and-paste determination results of the reviews, means for evaluating and providing feedback on the reliability of the review comments in real time, and means for displaying reviews in order of reliability. This allows users to receive reliable reviews in real time and make more accurate purchasing decisions based on them.
「レビューコメント」とは、ユーザーが商品やサービスに対して評価や感想を文章形式で記述したものである。 A "review comment" is a written comment written by a user expressing their evaluation or opinion of a product or service.
「収集する手段」とは、オンラインプラットフォームからデータを取得し、システムに取り込む方法を指す。 "Means of collection" refers to the method by which data is obtained from online platforms and entered into the system.
「データ前処理」とは、取得されたデータを解析しやすくするために、不要な情報を削除し、整形するプロセスである。 "Data preprocessing" is the process of removing unnecessary information and formatting acquired data to make it easier to analyze.
「特徴ワードリスト」とは、特定の商品やサービスに関連する重要なキーワードを集めたリストである。 A "characteristic word list" is a list of important keywords related to a specific product or service.
「商品関連性」とは、レビューコメントが特定の商品やサービスにどれだけ関連しているかを示す度合いである。 "Product relevance" is the degree to which a review comment relates to a particular product or service.
「パターンを解析する手段」とは、レビューコメントの中の一定のテンプレートや類似性を検出する方法である。 "Pattern analysis methods" are methods for detecting certain templates or similarities in review comments.
「不自然なレビュー」とは、短期間に大量に投稿されたり、同じ内容が繰り返されるなど、通常のユーザー行動とは異なるコメントである。 "Unnatural reviews" are comments that deviate from normal user behavior, such as those posted in large numbers in a short period of time or those that contain repeated, repeated comments.
「コピペレビュー」とは、他のコメントと完全に同一の内容がコピー&ペーストされたレビューコメントである。 A "copy-and-paste review" is a review comment in which the exact same content as another comment is copied and pasted.
「フィードバックする手段」とは、ユーザーや管理者に対して評価結果を通知し、適切なアクションを促すための方法である。 "Means of providing feedback" refers to methods for notifying users and administrators of evaluation results and encouraging them to take appropriate action.
「信頼性をリアルタイムで評価する手段」とは、レビューが投稿される瞬間に、その評価の正確性や信用度を自動的に判定する方法である。 "Means for assessing trustworthiness in real time" refers to a method that automatically determines the accuracy and credibility of a review the moment it is posted.
「信頼性の高い順に表示する手段」とは、評価が高いレビューコメントを上位に表示することで、ユーザーが参考にしやすくする方法である。 "Displaying in order of reliability" is a method of displaying highly rated review comments at the top, making them easier for users to refer to.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、ユーザーがより正確なレビュー情報を得られるようにするものである。このシステムは、以下のプロセスを通じて実施される。 The system of the present invention evaluates the reliability of review comments on shopping platforms, allowing users to obtain more accurate review information. This system is implemented through the following process:
使用するハードウェア Hardware to use
スマートフォン: ユーザーがレビューコメントを投稿するための端末として用いる。 Smartphone: Used by users as a device to post review comments.
サーバ: レビューコメントの収集、データ前処理、解析、評価、フィードバックを行う中枢的なコンピュータ。 Server: A central computer that collects review comments, preprocesses data, analyzes, evaluates, and provides feedback.
APIサーバ: ショッピングプラットフォームからレビューコメントを取得するためのインターフェースとして用いる。 API server: Used as an interface to retrieve review comments from the shopping platform.
使用するソフトウェア Software used
Python: サーバサイドのデータ処理及び解析に使用。 Python: Used for server-side data processing and analysis.
Flask: PythonのWebフレームワークとしてAPIサーバを構築するために用いる。 Flask: A Python web framework used to build API servers.
MySQL: データベース管理システムとして収集したレビューコメントを保存するために使用。 MySQL: Used as a database management system to store collected review comments.
自然言語処理ライブラリ: レビューコメントの前処理および解析に使用。 Natural language processing library: Used for preprocessing and parsing review comments.
データ加工およびデータ演算の流れ Data processing and calculation flow
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから定期的にAPIを介してレビューコメントを取得する。このAPIサーバはFlaskを用いて構築されており、取得したデータはMySQLデータベースに保存される。 The server periodically retrieves review comments from the shopping platform via API. This API server is built using Flask, and the retrieved data is stored in a MySQL database.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントのデータを前処理する。前処理には、Pythonの自然言語処理ライブラリを用いて、不要な空白や特殊文字の除去、レビューコメントの分割、言語の統一などが含まれる。 The server preprocesses the retrieved review comment data. This preprocessing includes removing unnecessary whitespace and special characters, splitting review comments, and standardizing language using a Python natural language processing library.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、レビューコメントと商品属性に基づく特徴ワードリストを比較する。例えば、スマートフォンに関するレビューであれば、「画質」「バッテリー」「操作性」などのキーワードが用いられる。サーバはスコアリングを行い、一定のスコア以上であればそのレビューコメントを「商品関連性の高いレビュー」と判定する。 The server compares the review comment with a list of characteristic words based on product attributes. For example, a review about a smartphone would use keywords such as "image quality," "battery," and "operability." The server then scores the review comment, and if it scores above a certain level, it determines that the review comment is "highly relevant to the product."
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたレビューコメントを解析し、短期間に似通ったレビューが連続して投稿されていないかを確認する。不自然なパターンが検出された場合、それらのレビューにフラグを立てる。 The server analyzes review comments posted within a certain period of time to see if similar reviews have been posted in succession within a short period of time. If an unnatural pattern is detected, those reviews are flagged.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと比較する。全く同じ内容が存在するかをチェックし、完全一致するコメントがあった場合、それを「コピペレビュー」としてフラグ付けする。 The server compares the newly posted review comment with all existing review comments. It checks to see if there are any identical comments, and if there is an exact match, it flags it as a "copy-and-paste review."
6. フィードバック 6. Feedback
サーバは、レビュー投稿時に、そのレビューが商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可し、ユーザーにリアルタイムでフィードバックする。また、信頼性の高い順にレビューを表示する機能も持つ。 When a review is posted, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted, and will provide real-time feedback to the user. It also has a function to display reviews in order of reliability.
具体例とプロンプト文の例 Specific examples and prompt sentence examples
具体例として、以下のようなレビューコメントを考慮する。 As a concrete example, consider the following review comment:
商品: スマートフォン Product: Smartphone
投稿レビュー: 「このスマホのバッテリーは長持ちします。」 Review: "This phone's battery lasts a long time."
プロンプト文の例は以下である。 An example of a prompt is as follows:
「このレビューが製品に関連しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review is relevant to the product: 'This phone's battery lasts a long time.'"
「このレビューが不自然なパターンに該当しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review fits any unnatural pattern: 'This phone's battery lasts a long time.'"
「このレビューが既存のレビューと完全一致しているかを教えてください:'このスマホのバッテリーは長持ちします。'」 "Please tell us if this review exactly matches an existing review: 'This phone's battery lasts a long time.'"
これにより、ユーザーは信頼性の高いレビューを基に商品を選ぶことができ、オンラインショッピングプラットフォーム全体の評価品質が向上する。 This will allow users to choose products based on reliable reviews, improving the quality of ratings across online shopping platforms.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
サーバは、ショッピングプラットフォーム提供のAPIを使用してレビューコメントを定期的に収集する。サーバは、APIを介して取得したレビューコメントをJSON形式で受け取り、MySQLデータベースに保存する。入力はAPIから取得したJSONデータであり、出力はデータベースに保存されたレビューコメントである。 The server periodically collects review comments using an API provided by the shopping platform. The server receives the review comments obtained via the API in JSON format and stores them in a MySQL database. The input is the JSON data obtained from the API, and the output is the review comments stored in the database.
ステップ2: Step 2:
データ前処理: Data preprocessing:
サーバは、収集したレビューコメントのデータを前処理する。サーバは、Pythonの正規表現ライブラリを使用し、不要な空白や特殊文字を除去し、レビューコメントを文単位に分割する。さらに、異なる形式のデータを統一形式に変換する。入力は生のレビューコメントであり、出力は前処理されたクリーンデータである。 The server preprocesses the collected review comment data. It uses Python's regular expression library to remove unnecessary whitespace and special characters and split the review comments into sentences. It also converts data in different formats into a unified format. The input is the raw review comments, and the output is the preprocessed, clean data.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
サーバは、前処理されたレビューコメントと事前に設定した特徴ワードリストを比較する。サーバは、特徴ワードリストに含まれる単語の出現頻度を計算し、一定のスコア以上であれば商品関連性が高いと判定する。入力は前処理されたレビューコメントと特徴ワードリストであり、出力は関連性の高いレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with a pre-set feature word list. The server calculates the frequency of occurrence of words included in the feature word list, and determines that a product is highly relevant if the frequency is above a certain score. The input is the preprocessed review comments and the feature word list, and the output is data flagged as highly relevant reviews.
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
サーバは、前処理されたレビューコメントを一定期間内に投稿された他のレビューコメントと比較し、パターンを解析する。サーバは、類似のレビューコメントが短期間に大量に投稿されている場合、それを不自然なレビューとして判定し、フラグを立てる。入力は前処理されたレビューコメントと過去のレビューコメントであり、出力は不自然なレビューとしてフラグ付けされたデータである。 The server compares the preprocessed review comments with other review comments posted within a certain period of time and analyzes patterns. If a large number of similar review comments are posted in a short period of time, the server determines that they are unnatural reviews and flags them. The input is the preprocessed review comments and past review comments, and the output is data flagged as unnatural reviews.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
サーバは、新しく投稿されたレビューコメントを既存の全レビューコメントと内容一致度で比較する。サーバは、全く同じ内容のレビューコメントを見つけた場合、これをコピペレビューとしてフラグ付けする。入力は新しいレビューコメントと既存のレビューコメントであり、出力はコピペレビューとして判定されたデータである。 The server compares the newly posted review comment with all existing review comments based on content similarity. If the server finds a review comment with exactly the same content, it flags it as a copy-and-paste review. The input is the new review comment and the existing review comment, and the output is the data determined to be a copy-and-paste review.
ステップ6: Step 6:
フィードバック: Feedback:
サーバは、レビューの関連性、不自然さ、コピペの各判定結果をもとに、レビュー投稿者にリアルタイムでフィードバックを行う。ユーザーの端末には、レビューが信頼性の高い順に表示される。また、信頼性の低いレビューは投稿が拒否され、その理由がユーザーに通知される。入力はレビュー判定の各結果であり、出力はフィードバックメッセージである。 The server provides real-time feedback to reviewers based on the review's relevance, unnaturalness, and copy-and-paste assessment results. Reviews are displayed on the user's device in order of reliability. Reviews with low reliability are rejected, and the user is notified of the reason. The input is the review assessment results, and the output is a feedback message.
これにより、ユーザーは信頼性の高いレビューコメントを基に、より正確な購買判断を行うことが可能となる。 This allows users to make more accurate purchasing decisions based on reliable review comments.
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
本発明のシステムは、ショッピングプラットフォームにおけるレビューコメントの信頼性を評価し、さらにユーザの感情を認識してレビュー情報を最適化するものである。以下に、このシステムのプログラムの処理を自然言語で説明する。 The system of the present invention evaluates the reliability of review comments on shopping platforms and further optimizes review information by recognizing user sentiment. The program processing of this system is explained below in natural language.
プロセスの概要 Process Overview
1. レビューコメントの収集 1. Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
2. データ前処理 2. Data Preprocessing
サーバは、収集したレビューコメントをクリーニングする。不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments, removing unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, making them easier to analyze.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば「画質」「バッテリー」「操作性」などのワードリストが用意される。 The server compares review comments with a word list based on the features and attributes of each product. For example, for a review about a smartphone, a word list would be prepared, including "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores how often words from the word list appear in the review comments, and if the score is above a certain level, it determines the review to be "highly relevant to the product."
具体例: Example:
商品:スマートフォン Product: Smartphone
レビューコメント:「このスマホの画質は抜群です。」 Review comment: "The image quality of this smartphone is outstanding."
スコア:ワードリストに「画質」が含まれるため、高スコアと判定。 Score: "Image quality" is included in the word list, so the score is high.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
具体例: Example:
レビュー1:「素晴らしい商品です!」 Review 1: "This is a great product!"
レビュー2:「素晴らしい商品です!」 Review 2: "This is a great product!"
レビュー3:「素晴らしい商品です!」 Review 3: "This is a great product!"
判定:不自然なレビューとフラグ付け。 Verdict: Unnatural review and flagging.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
具体例: Example:
レビュー1:「この商品はとても素晴らしいです!」 Review 1: "This product is amazing!"
レビュー2:「この商品はとても素晴らしいです!」 Review 2: "This product is amazing!"
判定:コピペレビューとフラグ付け。 Verdict: Copy and paste review and flagging.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, or neutral sentiment.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
具体例: Example:
レビューコメント:「このスマホのバッテリーはすぐに切れるので使い物になりません。」 Review comment: "This phone's battery dies so quickly it's useless."
感情分析結果:ネガティブ Sentiment analysis result: Negative
スコア:低評価として反映。 Score: Reflected as a low rating.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If a flag is raised, the server will display an error message to the user explaining the reason for the post.
サーバは、フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知する。一方、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 The server notifies the user and administrator of the feedback along with the emotion score generated by the emotion engine. Administrators are also notified to further review and respond to the review.
これにより、本発明のシステムは、レビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供するものである。感情エンジンの導入によって、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 As a result, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with peace of mind. The introduction of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
以下に、処理の流れについて説明する。 The processing flow is explained below.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームから全てのレビューコメントを定期的にAPIを介して取得する。収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. The collected review comments are stored in a database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary spaces, special characters, and HTML tags. It also tokenizes the review comments into words and sentences, preparing them in an analyzable form.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントを比較する。レビューコメント内の単語とワードリストを比較し、スコア化する。例えば、スマートフォンに関連するワードリストには「画質」「バッテリー」「操作性」などが含まれる。 The server compares review comments using a word list based on the features and attributes of each product. It compares the words in the review comments with the word list and generates a score. For example, a word list related to smartphones might include "image quality," "battery," and "operability."
サーバは、ワードリストに含まれる単語がどの程度出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server scores the frequency with which words included in the word list appear, and if the score is above a certain level, it determines that the review is "highly relevant to the product."
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかを判断する。特に文の長さ、使用される単語、文の構造などを比較する。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It determines whether reviews with similar content or writing style have been posted in succession within a short period of time. In particular, it compares sentence length, the words used, sentence structure, etc.
サーバは、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 If the server detects any unusual patterns, it will flag the review comment.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックする。 Every time a new review comment is submitted, the server compares it with all existing review comments, using an advanced text comparison algorithm to check whether a review comment with the exact same content already exists.
サーバは、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 If the server finds a match, it flags the review comment as a "copy-and-paste review."
ステップ6: Step 6:
感情エンジンによる感情認識 Emotion recognition using an emotion engine
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。具体的には、自然言語処理アルゴリズムを用いて、文中に含まれる感情表現を抽出し、スコアリングする。 The server uses an emotion engine to analyze review comments and classify them into positive, negative, or neutral sentiment. Specifically, it uses a natural language processing algorithm to extract and score emotional expressions contained in the sentences.
サーバは、感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server calculates the emotional score of the review comments based on the scoring by the emotion engine and reflects this in the overall rating of the product.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、サーバはエラーメッセージをユーザに表示し、投稿が拒否された理由を説明する。 The server will only allow a review comment to be posted if it is not flagged as being unrelated to the product, unnatural, or copied and pasted. If any flags are raised, the server will display an error message to the user explaining why the post was rejected.
サーバは、不適切なレビューについてはフィルタリングを行い、さらに感情エンジンによる感情スコアも含めてユーザおよび管理者に通知する。管理者にはレビュー内容とフラグ立ちの理由、感情スコアなどの詳細情報が送信され、必要な場合にはレビューを再確認するための手助けが提供される。 The server filters out inappropriate reviews and notifies users and administrators, including the sentiment score generated by the sentiment engine. Administrators are sent detailed information such as the review content, the reason it was flagged, and the sentiment score, and are offered help in re-checking the review if necessary.
この具体的なステップに基づき、本発明のシステムはレビューコメントの信頼性を確保し、ユーザが安心して利用できるプラットフォームを提供する。感情エンジンの統合により、レビューの質と信頼性が一層向上し、商品の評価情報がより正確に反映される。 Based on these specific steps, the system of the present invention ensures the reliability of review comments and provides a platform that users can use with confidence. The integration of an emotion engine further improves the quality and reliability of reviews, and more accurately reflects product evaluation information.
(実施例2) (Example 2)
次に、実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 2 will be described. In the following description, the data processing device 12 will be referred to as a "server" and the robot 414 will be referred to as a "terminal."
従来のショッピングプラットフォームにおいては、レビューコメントの真偽を判断するための適切なメカニズムが欠如しており、ユーザが不正確な情報に基づいて購買決定を行うリスクがあった。このため、レビューコメントの信頼性を向上させ、ユーザが安心して利用できる環境を提供することが求められている。また、レビューコメントの感情を正確に把握することで、商品の評価情報をより正確に反映させる必要がある。 Traditional shopping platforms lacked an appropriate mechanism for determining the authenticity of review comments, leaving users at risk of making purchasing decisions based on inaccurate information. This has created a need to improve the reliability of review comments and provide an environment where users can use them with peace of mind. It is also necessary to accurately understand the sentiment behind review comments in order to more accurately reflect product evaluation information.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情を分析する手段と、レビューの関連性、不自然さ、コピペ判定結果および感情分析結果をフィードバックする手段と、レビューコメントが不自然な場合やコピペの場合、投稿を拒否する手段と、を含む。これにより、レビューコメントの信頼性を向上させ、ユーザが安心してレビューを参照できる環境を提供し、商品の評価情報をより正確に反映させることが可能となる。 The identification process by the identification processing unit 290 of the data processing device 12 in Example 2 is realized by the following means. In this invention, the server includes means for collecting review comments, means for performing data preprocessing of the review comments, means for determining product relevance by comparing the review comments with a characteristic word list, means for analyzing the patterns of the review comments to determine unnatural reviews, means for comparing the review comments to determine comments with identical content as copy-and-paste reviews, means for analyzing the sentiment of the review comments, means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results, and means for rejecting the posting of review comments that are unnatural or copy-and-paste. This improves the reliability of review comments, provides an environment where users can refer to reviews with confidence, and makes it possible to more accurately reflect product evaluation information.
「レビューコメント」とは、ショッピングプラットフォーム上でユーザが商品やサービスに対して記述する意見や評価のテキストである。 "Review comments" are textual opinions and evaluations written by users on shopping platforms about products and services.
「データ前処理」とは、収集したレビューコメントから不要な要素を取り除き、解析に適した形式に変換する処理である。 "Data preprocessing" is the process of removing unnecessary elements from collected review comments and converting them into a format suitable for analysis.
「特徴ワードリスト」とは、特定の商品やサービスに関連するキーワードのリストで、レビューコメントと比較するために使用されるものである。 A "characteristic word list" is a list of keywords related to a specific product or service that is used to compare with review comments.
「商品関連性判定」とは、レビューコメントが特定の商品やサービスに関連するかを判断するプロセスである。 "Product relevance determination" is the process of determining whether a review comment is relevant to a specific product or service.
「パターン解析」とは、レビューコメントの内容や形式を解析し、特定のパターンや異常を検出するプロセスである。 "Pattern analysis" is the process of analyzing the content and format of review comments to detect specific patterns or anomalies.
「不自然なレビュー」とは、内容や書き方が短期間内に連続して投稿されるなど、通常と異なるパターンを示すレビューコメントである。 "Unnatural reviews" are review comments that show an unusual pattern, such as content or writing style being posted repeatedly within a short period of time.
「コピペレビュー」とは、既存のレビューコメントと全く同じ内容のレビューコメントを指すものである。 A "copy-and-paste review" refers to a review comment that has exactly the same content as an existing review comment.
「感情分析」とは、レビューコメントの内容を解析し、ポジティブ、ネガティブ、中立といった感情の分類を行うプロセスである。 "Sentiment analysis" is the process of analyzing the content of review comments and classifying their sentiments as positive, negative, or neutral.
「フィードバック」とは、解析結果や判定結果をユーザまたは管理者に対して通知し、必要な対応を促す情報の提供である。 "Feedback" refers to the provision of information to notify users or administrators of analysis and judgment results, and to encourage them to take necessary action.
「投稿拒否」とは、不自然なレビューやコピペレビューが投稿されるのを防ぐために、ユーザに対して投稿を許可しない動作を指す。 "Posting refusal" refers to the action of not allowing users to post in order to prevent unnatural reviews or copy-and-paste reviews from being posted.
「サーバ」とは、レビューコメントの収集、前処理、解析、判定、フィードバック、投稿拒否などの一連の処理を管理・実行するコンピュータシステムである。 A "server" is a computer system that manages and executes a series of processes, including the collection, preprocessing, analysis, judgment, feedback, and rejection of review comments.
本発明のシステムは、ショッピングプラットフォーム上でレビューコメントの信頼性を評価し、ユーザの感情を認識してレビュー情報を最適化するものである。そのための具体的な動作や処理を以下に示す。 The system of the present invention evaluates the reliability of review comments on a shopping platform, recognizes user emotions, and optimizes review information. The specific operations and processes for this purpose are described below.
1. レビューコメントの収集 1. Collecting review comments
システムは、ショッピングプラットフォームのAPIを通じてレビューコメントを取得する。サーバは定期的にAPIエンドポイントにリクエストを送り、取得したレビューコメントをデータベースに保存する。具体的には、データベースとしてMySQLやPostgreSQLを使用することができる。 The system retrieves review comments through the shopping platform's API. The server periodically sends requests to the API endpoint and stores the retrieved review comments in a database. Specifically, MySQL or PostgreSQL can be used as the database.
例えば、サーバがAPIエンドポイント "https://example.com/api/reviews" にアクセスして、取得したレビューコメントを "reviews" テーブルに格納する。 For example, the server accesses the API endpoint "https://example.com/api/reviews" and stores the retrieved review comments in the "reviews" table.
2. データ前処理 2. Data Preprocessing
サーバは、取得したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行う。さらに、レビューコメントを単語や文単位でトークン化する。PythonのNLPライブラリであるNLPKを使用して、この前処理を行うことができる。 The server cleans the retrieved review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags. It also tokenizes the review comments into words and sentences. This preprocessing can be performed using NLPK, a Python NLP library.
例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にテキストクリーニングを行い、その後トークン化する。 For example, a comment such as "This product is <p>great</p>!" is text cleaned to "This product is great!" and then tokenized.
3. 商品関連性の判定 3. Product Relevance Assessment
サーバは、各商品の特徴や属性に基づいたワードリストを生成し、レビューコメントと比較する。例えば、スマートフォンのレビューに「画質」「バッテリー」「操作性」といったキーワードを含むワードリストを使用する。 The server generates a word list based on the features and attributes of each product and compares it with the review comments. For example, for smartphone reviews, a word list containing keywords such as "image quality," "battery," and "operability" is used.
具体的には、レビューコメント内のキーワードの出現頻度をスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。例えば、サーバが「このスマホの画質は抜群です」というコメントを解析し、ワードリストに「画質」が含まれていることで高いスコアを付与する。 Specifically, the frequency of keywords appearing in review comments is scored, and if the score is above a certain level, it is determined to be a "review with high product relevance." For example, the server analyzes a comment such as "The image quality of this smartphone is outstanding," and assigns a high score because "image quality" is included in the word list.
4. 不自然なレビューの判定 4. Identifying unnatural reviews
サーバは、一定期間内に投稿されたすべてのレビューコメントを解析し、内容のパターンを確認する。具体的には、同じような内容や形式のレビューコメントが短期間に連続して投稿されていないかをチェックする。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. Specifically, it checks to see if review comments with similar content or format have been posted consecutively within a short period of time.
不自然なパターンが検出された場合、そのレビューコメントにフラグを付与する。例えば、サーバが「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿されている場合、それらに不自然さのフラグを付ける。 If an unnatural pattern is detected, the review comment is flagged. For example, if the server sees multiple reviews with the same content, such as "Great product!", posted within a short period of time, it will flag them as unnatural.
5. コピペレビューの判定 5. Judging Copy-Paste Reviews
新しいレビューコメントが投稿される度に、サーバはこのコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用し、一致するかどうかを判定する。 Each time a new review comment is submitted, the server compares it with all existing review comments, using sophisticated text comparison algorithms (e.g., Python's difflib library) to determine whether there is a match.
一致が見つかった場合、サーバはそのレビューコメントに「コピペレビュー」としてフラグを立てる。例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 If a match is found, the server will flag the review comment as a "copy-and-paste review." For example, if a comment already exists that says "This product is amazing!", the server will add a flag.
6. 感情エンジンによる感情認識 6. Emotion Recognition Using an Emotion Engine
サーバは、レビューコメントを感情解析エンジンに投入し、ポジティブ、ネガティブ、中立といった感情に分類する。具体的には、TextBlobやVADERなどの感情解析ライブラリを使用することができる。 The server inputs the review comments into a sentiment analysis engine and classifies them into positive, negative, or neutral sentiment. Specifically, sentiment analysis libraries such as TextBlob and VADER can be used.
これにより、感情スコアを計算し、そのスコアを商品の総合評価に反映する。例えば、TextBlobを使用して「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントを解析し、ネガティブスコアを付与する。 This allows us to calculate an emotional score, which is then reflected in the overall rating of the product. For example, we can use TextBlob to analyze a comment such as "This phone's battery runs out quickly, so it's useless" and assign it a negative score.
7. フィードバックとフィルタリング 7. Feedback and Filtering
サーバは、レビューコメントの投稿が試みられた際に、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合は、エラーメッセージをユーザに表示し、投稿の理由を説明する。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user explaining the reason for the post.
また、感情エンジンによる感情スコアをユーザおよび管理者に通知し、レビューの信頼性向上を図る。例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促す。また、管理者には「新しい不自然なレビューが検出されました。確認してください」と通知する。 The emotion engine also notifies users and administrators of the emotion score, helping to improve the reliability of reviews. For example, the server may notify users that "this review has been flagged as unnatural" and encourage them to resubmit. It may also notify administrators that "a new unnatural review has been detected. Please check it."
生成AIモデルへのプロンプト文の例 Example prompt for a generative AI model
「このレビューコメントが特定の商品に関連しているか、そしてその感情を分類してください。例: 'このスマホの画質は抜群です。'」 "Did this review comment relate to a specific product? Please categorize its sentiment. Example: 'The image quality of this phone is outstanding.'"
「このリストのレビューコメントが不自然であるかどうか判定してください。例: '素晴らしい商品です!', '素晴らしい商品です!'」 "Please determine whether the review comments on this listing are unnatural. Example: 'Great product!', 'Great product!'"
「このレビューコメントが既存のコメントと一致するか、コピペレビューであるかどうかチェックしてください。例: 'この商品はとても素晴らしいです!'」 "Check if this review comment matches an existing comment or is a copypasta review. Example: 'This product is amazing!'"
以上が、本発明のシステムを実施するための形態である。 The above is a form for implementing the system of the present invention.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
レビューコメントの収集: Collecting review comments:
入力:ショッピングプラットフォームのAPIエンドポイントURL Input: Shopping platform API endpoint URL
具体的な動作:サーバは、定期的にAPIエンドポイントにリクエストを送信して、レビューコメントを取得する。例えば、APIエンドポイント "https://example.com/api/reviews" にアクセスする。 Specific behavior: The server periodically sends requests to an API endpoint to retrieve review comments. For example, it accesses the API endpoint "https://example.com/api/reviews".
データ加工:取得したレビューコメントにメタデータ(ユーザID、商品ID、投稿日時など)を付与する。 Data processing: Metadata (user ID, product ID, posting date and time, etc.) is added to the acquired review comments.
出力:レビューコメントおよびメタデータが含まれたデータセット Output: Dataset containing review comments and metadata
具体的な動作:サーバは取得したデータセットをデータベース(例:MySQLやPostgreSQL)に保存する。 Specific operation: The server stores the acquired dataset in a database (e.g., MySQL or PostgreSQL).
ステップ2: Step 2:
データ前処理: Data preprocessing:
入力:データベースに保存されたレビューコメント Input: Review comments stored in the database
具体的な動作:サーバはレビューコメントをクリーニングする。具体的には、不要な空白、特殊文字、HTMLタグの除去を行うため、PythonのNLPライブラリ(例:NLPK)を使用する。 What it does: The server cleans the review comments. Specifically, it uses a Python NLP library (e.g., NLPK) to remove unnecessary whitespace, special characters, and HTML tags.
データ加工:レビューコメントを単語や文単位でトークン化する。 Data processing: Tokenize review comments into words and sentences.
出力:クリーンでトークン化されたレビューコメント Output: Clean, tokenized review comments
具体的な動作:例えば、「この商品は<p>素晴らしい</p>!」というコメントを「この商品は素晴らしい!」にクリーニングし、単語ごとに分ける。 Specific operation: For example, a comment such as "This product is <p>great</p>!" is cleaned to "This product is great!" and separated into individual words.
ステップ3: Step 3:
商品関連性の判定: Product relevance determination:
入力:クリーンでトークン化されたレビューコメント、商品の特徴ワードリスト Input: Clean, tokenized review comments, product feature word list
具体的な動作:サーバはレビューコメントと特徴ワードリストを比較する。ワードリストには、「画質」「バッテリー」「操作性」などの製品属性に基づくキーワードが含まれる。 Specific operation: The server compares the review comments with the feature word list. The word list includes keywords based on product attributes such as "image quality," "battery," and "operability."
データ演算:レビューコメント内のキーワードの出現頻度をスコアリングする。 Data calculation: Score the frequency of keywords appearing in review comments.
出力:商品関連性スコア Output: Product relevance score
具体的な動作:例えば、「このスマホの画質は抜群です」というコメントに対し、ワードリストに「画質」が含まれていることで高スコアを付与する。 Specific behavior: For example, a comment such as "The image quality of this smartphone is outstanding" will be given a high score if "image quality" is included in the word list.
ステップ4: Step 4:
不自然なレビューの判定: Determining unnatural reviews:
入力:一定期間内に投稿された全てのレビューコメント Input: All review comments posted within a certain period
具体的な動作:サーバはレビューコメントの内容のパターンを解析する。同じ内容や書き方のレビューが連続して投稿されていないかチェックする。 Specific operation: The server analyzes the content patterns of review comments. It checks whether reviews with the same content or writing style have been posted consecutively.
データ演算:不自然なパターンを検出するための解析 Data calculations: Analysis to detect unnatural patterns
出力:不自然さのフラグが立ったレビューコメント Output: Review comments flagged as unnatural
具体的な動作:例えば、「素晴らしい商品です!」という同一内容のレビューが短期間に複数回投稿された場合、それらに不自然さのフラグを付ける。 Specific behavior: For example, if the same review saying "This is a great product!" is posted multiple times within a short period of time, it will be flagged as unnatural.
ステップ5: Step 5:
コピペレビューの判定: Copy and paste review verdict:
入力:新しいレビューコメント、既存のレビューコメント Input: New review comment, Existing review comment
具体的な動作:サーバは高度なテキスト比較アルゴリズム(例:Pythonのdifflibライブラリ)を使用して、新しいコメントを既存のレビューコメントと比較する。 What it does: The server uses advanced text comparison algorithms (e.g., Python's difflib library) to compare the new comment with existing review comments.
データ演算:コメントの内容の一致を確認するプロセス Data calculation: The process of checking whether the content of comments matches.
出力:コピペレビューとしてフラグが立ったレビューコメント Output: Review comments flagged as copy-paste reviews
具体的な動作:例えば、「この商品はとても素晴らしいです!」というコメントが既に存在する場合、フラグを追加する。 Specific behavior: For example, if a comment saying "This product is amazing!" already exists, add a flag.
ステップ6: Step 6:
感情エンジンによる感情認識: Emotion recognition using the emotion engine:
入力:レビューコメント Enter: Review comment
具体的な動作:サーバはレビューコメントを感情解析エンジン(例:TextBlobやVADER)に投入し、感情を分類する。 Specific operation: The server inputs the review comments into a sentiment analysis engine (e.g., TextBlob or VADER) and classifies the sentiment.
データ演算:感情スコアの計算 Data calculation: Calculating emotion scores
出力:感情スコア付きレビューコメント Output: Review comments with sentiment scores
具体的な動作:例えば、「このスマホのバッテリーはすぐに切れるので使い物になりません」というコメントをネガティブとしてスコア付けする。 Specific behavior: For example, a comment such as "This smartphone's battery runs out quickly, making it useless" is scored as negative.
ステップ7: Step 7:
フィードバックとフィルタリング: Feedback and filtering:
入力:レビューコメント(関連性、不自然さ、コピペのフラグ付き)、感情スコア Input: Review comments (with flags for relevance, unnaturalness, and copy-paste), sentiment score
具体的な動作:サーバはレビューコメントの投稿が試みられた際、それが商品関連性、不自然さ、コピペのいずれにも該当しない場合のみ投稿を許可する。該当する場合はエラーメッセージをユーザに表示する。 Specific behavior: When an attempt is made to post a review comment, the server will only allow it to be posted if it is not related to the product, unnatural, or copied and pasted. If so, an error message will be displayed to the user.
データ演算:フィードバックおよび投稿判定 Data calculation: feedback and submission evaluation
出力:ユーザおよび管理者への通知 Output: Notification to users and administrators
具体的な動作:例えば、サーバが「このレビューは不自然さのフラグが立っています」とユーザに通知し、再投稿を促し、同時に管理者には「新しい不自然なレビューが検出されました」と通知する。 Specific behavior: For example, the server notifies the user that "this review has been flagged as unnatural" and encourages them to resubmit, while simultaneously notifying the administrator that "a new unnatural review has been detected."
以上が、このシステムのプログラムの具体的な処理ステップである。 The above are the specific processing steps of this system's program.
(応用例2) (Application Example 2)
次に、応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来のレビューコメント評価システムには、レビューの信頼性を十分に保証するための機能が不足している場合が多い。例えば、商品に関連しないレビューや、不自然なレビュー、コピペレビューなどが混在してしまい、ユーザが正確な情報を得ることが困難である。また、レビューコメントの感情分析を行うことで、より精度の高い商品の評価を提供することが求められている。しかし、現行のシステムには感情分析機能が欠如しているため、レビューの質と信頼性を向上させることができない。 Traditional review comment rating systems often lack the functionality to fully guarantee the reliability of reviews. For example, they often contain a mixture of reviews that are unrelated to the product, unnatural reviews, and copy-and-paste reviews, making it difficult for users to obtain accurate information. There is also a demand for more accurate product ratings through sentiment analysis of review comments. However, current systems lack sentiment analysis functionality, making it impossible to improve the quality and reliability of reviews.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、レビューコメントを収集する手段と、レビューコメントのデータ前処理を行う手段と、レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、レビューコメントのパターンを解析し不自然なレビューを判定する手段と、レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、レビューコメントの感情分析を行う手段と、レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段と、を含む。これにより、ユーザが信頼性の高いレビュー情報を得られ、商品の評価をより正確に行うことが可能となる。 In this invention, the server includes means for collecting review comments, means for pre-processing data on the review comments, means for comparing the review comments with a list of characteristic words to determine product relevance, means for analyzing patterns of the review comments to determine unnatural reviews, means for comparing review comments to determine comments with identical content as copy-and-paste reviews, means for performing sentiment analysis on the review comments, and means for providing feedback on the review relevance, unnaturalness, copy-and-paste determination results, and sentiment analysis results. This allows users to obtain highly reliable review information and more accurately evaluate products.
「レビューコメント」とは、商品やサービスに対してユーザが記入する感想や評価を指す。 "Review comments" refer to impressions and evaluations written by users about products and services.
「収集する手段」とは、特定の情報をインターネットやデータベースから取得するプロセスや機能を指す。 "Means of collection" refers to the process or function of obtaining specific information from the Internet or a database.
「データ前処理」とは、収集したデータを解析や解析前の処理を施し、不要な部分を削除したり形式を整えたりする工程を指す。 "Data preprocessing" refers to the process of analyzing collected data or performing pre-analysis processing to remove unnecessary parts and format the data.
「特徴ワードリスト」とは、特定の商品やカテゴリに関連する重要なキーワードをまとめたリストを指す。 A "characteristic word list" refers to a list of important keywords related to a specific product or category.
「商品関連性を判定する手段」とは、レビューコメントが特定の商品にどれだけ関連しているかを評価するための方法やアルゴリズムを指す。 "Means for determining product relevance" refers to the methods or algorithms used to evaluate how relevant a review comment is to a particular product.
「パターンを解析し不自然なレビューを判定する手段」とは、レビューコメントの内容や投稿パターンを分析し、不自然な内容や典型的な操作を検出する方法を指す。 "Methods of analyzing patterns to identify unnatural reviews" refers to methods of analyzing the content and posting patterns of review comments to detect unnatural content and typical actions.
「コピペレビュー」とは、他のレビューコメントをコピーしてそのまま貼り付けた、同一内容のレビューコメントを指す。 A "copy-and-paste review" refers to a review comment that contains the same content as another review comment, copied and pasted exactly as is.
「感情分析」とは、テキストデータからユーザの感情や意図を解析して、ポジティブ、ネガティブ、または中立などの分類を行う技術を指す。 "Sentiment analysis" refers to the technology of analyzing user emotions and intentions from text data and classifying them as positive, negative, or neutral.
「フィードバック」とは、解析結果や評価結果をユーザやシステムに返すプロセスを指す。 "Feedback" refers to the process of returning analysis and evaluation results to the user or system.
発明を実施するための形態 Form for implementing the invention
本発明は、ショッピングプラットフォームにおいてレビューコメントの信頼性を向上させ、ユーザに最適な情報を提供するシステムである。このシステムは、レビューコメントを収集し、データ前処理を行い、商品関連性、不自然さ、コピペの有無、感情分析を実施した上で、フィードバックを行うものである。 This invention is a system that improves the reliability of review comments on shopping platforms and provides users with optimal information. This system collects review comments, performs data preprocessing, and analyzes product relevance, unnaturalness, whether or not they have been copied and pasted, and sentiment before providing feedback.
システム概要 System Overview
サーバは以下の手段を含む: The server includes the following means:
1. レビューコメントを収集する手段: 1. How to collect review comments:
サーバは、APIを介してショッピングプラットフォームから定期的に全てのレビューコメントを取得する。この収集されたレビューコメントはデータベースに保存される。 The server periodically retrieves all review comments from the shopping platform via API. These collected review comments are stored in a database.
2. レビューコメントのデータ前処理を行う手段: 2. Methods for preprocessing review comment data:
サーバは、収集したレビューコメントをクリーニングする。具体的には、不要な空白や特殊文字、HTMLタグの除去を行い、レビューコメントを単語や文単位でトークン化し、解析可能な形に整える。 The server cleans the collected review comments. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, tokenizes the review comments into words and sentences, and prepares them in an analyzable form.
3. レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段: 3. How to determine product relevance by comparing review comments with a list of characteristic words:
サーバは、各商品の特徴や属性に基づいたワードリストを使用してレビューコメントと比較する。例えば、スマートフォンに関するレビューであれば“画質”、“バッテリー”、“操作性”などのワードリストが用意される。ワードリストに含まれる単語がレビューコメント内にどれだけ出現するかをスコアリングし、一定のスコア以上であれば「商品関連性の高いレビュー」と判定する。 The server compares review comments with a word list based on the characteristics and attributes of each product. For example, for a review about a smartphone, a word list such as "image quality," "battery," and "operability" would be prepared. The server scores the number of times words from the word list appear in the review comments, and if the score is above a certain level, it is determined to be a "review highly relevant to the product."
4. レビューコメントのパターンを解析し不自然なレビューを判定する手段: 4. How to analyze review comment patterns and identify unnatural reviews:
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、内容のパターンを確認する。同じような内容や書き方のレビューが短期間に連続して投稿されていないかをチェックし、不自然なパターンが検出された場合、そのレビューコメントにフラグを立てる。 The server analyzes all review comments posted within a certain period of time and checks for patterns in content. It checks to see if reviews with similar content or writing style have been posted consecutively within a short period of time, and if an unnatural pattern is detected, it flags the review comment.
5. レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段: 5. How to compare review comments and identify comments with identical content as copy-and-paste reviews:
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。高度なテキスト比較アルゴリズムを使用して、全く同じ内容のレビューコメントが既に存在するかどうかをチェックし、一致が見つかった場合、そのレビューコメントに「コピペレビュー」としてフラグを立てる。 Every time a new review comment is submitted, the server compares it with all existing review comments. Using sophisticated text comparison algorithms, it checks whether an identical review comment already exists, and if a match is found, it flags the review comment as a "copy-and-paste review."
6. レビューコメントの感情分析を行う手段: 6. How to perform sentiment analysis on review comments:
サーバは、レビューコメントを感情エンジンに解析させ、ポジティブ、ネガティブ、中立の感情を分類する。感情エンジンによるスコアリングを元にレビューコメントの感情スコアを計算し、商品の総合評価に反映する。 The server analyzes the review comments using an emotion engine and classifies them into positive, negative, and neutral emotions. Based on the scoring by the emotion engine, the emotion score of the review comments is calculated and reflected in the overall rating of the product.
7. レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段: 7. Means of providing feedback on review relevance, unnaturalness, copy-paste determination results, and sentiment analysis results:
サーバは、レビューコメントの投稿が試みられた際に、商品関連性、不自然さ、コピペのいずれのフラグも立たない場合のみ投稿を許可する。フラグが立った場合、エラーメッセージをユーザに表示し、投稿の理由を説明する。フィードバックと共に感情エンジンによる感情スコアもユーザおよび管理者に通知し、管理者にはさらなるレビューの確認と対応を促す通知が送信される。 When an attempt is made to post a review comment, the server will only allow it to be posted if it is not flagged as being inappropriate, unnatural, or copied and pasted. If a flag is raised, an error message will be displayed to the user, explaining the reason for the post. Feedback will be provided to the user and administrator, along with the sentiment score calculated by the sentiment engine, and administrators will be notified, urging them to further review and take action.
使用するハードウェア及びソフトウェア Hardware and software used
ハードウェア: サーバ、クラウドストレージデバイス Hardware: Servers, cloud storage devices
ソフトウェア: Python、requests、BeautifulSoup、re、nltk、textblob、scikit-learn、感情エンジン(TextBlobなど) Software: Python, requests, BeautifulSoup, re, nltk, textblob, scikit-learn, emotion engine (TextBlob, etc.)
具体例 Specific examples
具体例として、レビューコメント「このスマホの画質は抜群です。」を処理する手順を示す。このコメントは、キーワードである“画質”が含まれているため商品関連性が高いと判定され、不自然なレビューやコピペレビューとの一致もないため承認される。 As a concrete example, we will show the steps for processing the review comment "The image quality of this smartphone is outstanding." This comment is determined to be highly relevant to the product because it contains the keyword "image quality," and is approved because it does not match unnatural reviews or copy-paste reviews.
プロンプト文の例 Example prompt
生成AIモデルへ入力するプロンプト文の例: Example of a prompt to input to a generative AI model:
新しいレビューコメント「このスマホの画質は抜群です。」を解析してください。以下の基準で評価します: Analyze the new review comment, "The image quality of this phone is outstanding." We'll rate it based on the following criteria:
1. 商品関連性 1. Product Relevance
2. 不自然なパターン 2. Unnatural patterns
3. コピペ 3. Copy and paste
4. 感情分析 4. Sentiment analysis
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
レビューコメントの収集 Collecting review comments
サーバは、ショッピングプラットフォームのAPIを定期的に呼び出し、各商品のレビューコメントを取得する。入力として、APIのエンドポイントURLと認証情報を使用する。出力として、取得したレビューコメントを含むJSONデータが生成される。このデータはサーバのデータベースに保存される。 The server periodically calls the shopping platform's API to retrieve review comments for each product. As input, it uses the API endpoint URL and authentication information. As output, it generates JSON data containing the retrieved review comments. This data is stored in the server's database.
ステップ2: Step 2:
データ前処理 Data preprocessing
サーバは、収集されたレビューコメントをクリーニングする。入力として、データベースに保存されたレビューコメントのテキストデータを使用する。具体的な動作として、不要な空白や特殊文字、HTMLタグを除去し、レビューコメントを単語や文単位でトークン化する。出力として、クリーンなテキストデータが生成され、次のステップに渡される。 The server cleans the collected review comments. As input, it uses the text data of the review comments stored in the database. Specifically, it removes unnecessary whitespace, special characters, and HTML tags, and tokenizes the review comments into words and sentences. As output, clean text data is generated and passed to the next step.
ステップ3: Step 3:
商品関連性の判定 Product relevance determination
サーバは、各商品の特徴や属性に基づいたワードリストを使用して、レビューコメントの関連性を評価する。入力として、クリーンなレビューコメントと特徴ワードリストを使用する。具体的な動作として、特徴ワードリストに含まれる単語がレビューコメントにどれだけ出現するかをスコアリングする。出力として、各レビューコメントの関連性スコアが生成される。 The server evaluates the relevance of review comments using a word list based on the features and attributes of each product. As input, it uses the clean review comments and the feature word list. Specifically, it scores how often words included in the feature word list appear in the review comments. As output, it generates a relevance score for each review comment.
ステップ4: Step 4:
不自然なレビューの判定 Determining unnatural reviews
サーバは、一定期間内に投稿された全てのレビューコメントを解析し、パターンを確認する。入力として、過去一定期間のレビューコメントのテキストデータと現在のレビューコメントを使用する。具体的な動作として、テキストのパターンマッチングアルゴリズムを適用し、類似度を評価する。出力として、不自然なレビューかどうかを示すフラグが生成される。 The server analyzes all review comments posted within a certain period of time and checks for patterns. As input, it uses text data from review comments over a certain period of time in the past and the current review comment. Specifically, it applies a text pattern matching algorithm to evaluate the similarity. As output, it generates a flag indicating whether the review is unnatural.
ステップ5: Step 5:
コピペレビューの判定 Copy-and-paste review verdict
サーバは、新しいレビューコメントが投稿される度に、このコメントを既存の全レビューコメントと比較する。入力として、新しいレビューコメントと既存のレビューコメントのデータを使用する。具体的な動作として、高度なテキスト比較アルゴリズム(例:コサイン類似度)を使用して、全く同じ内容のレビューコメントが存在するかチェックする。出力として、コピペレビュー判定結果のフラグが生成される。 Each time a new review comment is posted, the server compares it with all existing review comments. It uses the data of the new review comment and the existing review comments as input. Specifically, it uses an advanced text comparison algorithm (e.g., cosine similarity) to check whether a review comment with the exact same content exists. As output, it generates a flag indicating whether the review is a copy-and-paste review.
ステップ6: Step 6:
感情分析 sentiment analysis
サーバは、レビューコメントを感情エンジンに解析させる。入力として、クリーンなレビューコメントを使用する。具体的な動作として、感情エンジン(例:TextBlob)にテキストを送信し、ポジティブ、ネガティブ、中立の感情スコアを取得する。出力として、レビューコメントごとの感情スコアが生成される。 The server parses the review comments into the sentiment engine. It uses the clean review comments as input. Specifically, it sends the text to the sentiment engine (e.g., TextBlob) and obtains a sentiment score: positive, negative, or neutral. The output is a sentiment score for each review comment.
ステップ7: Step 7:
フィードバックとフィルタリング Feedback and filtering
サーバは、レビューコメントの投稿が試みられた際に、これまでのステップで得られた判定結果を元にフィードバックを行う。入力として、すべての判定結果(関連性、不自然さ、コピペ判定結果、感情スコア)を使用する。具体的な動作として、フラグが立たない場合のみ投稿を許可し、フラグが立った場合はエラーメッセージをユーザに表示する。管理者にはさらに詳細なフィードバックが通知される。出力として、ユーザにはエラーメッセージまたは承認メッセージが表示され、レビューコメントがデータベースに保存される。 When an attempt is made to post a review comment, the server provides feedback based on the judgment results obtained in the previous steps. All judgment results (relevance, unnaturalness, copy-paste judgment results, and sentiment score) are used as input. Specific behavior is to allow posting only if no flags are raised, and to display an error message to the user if a flag is raised. More detailed feedback is then provided to the administrator. As output, an error message or approval message is displayed to the user, and the review comment is saved in the database.
特定処理部290は、特定処理の結果をロボット414に送信する。ロボット414では、制御部46Aが、スピーカ240及び制御対象443に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the robot 414. In the robot 414, the control unit 46A causes the speaker 240 and the control target 443 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成系AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). Examples of data generation model 58 include generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>) and Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating speech, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ロボット414によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the robot 414.
なお、感情エンジンとしての感情特定モデル59は、特定のマッピングに従い、ユーザの感情を決定してよい。具体的には、感情特定モデル59は、特定のマッピングである感情マップ(図9参照)に従い、ユーザの感情を決定してよい。また、感情特定モデル59は、同様に、ロボットの感情を決定し、特定処理部290は、ロボットの感情を用いた特定処理を行うようにしてもよい。 The emotion identification model 59, which serves as an emotion engine, may determine the user's emotion according to a specific mapping. Specifically, the emotion identification model 59 may determine the user's emotion according to an emotion map (see Figure 9), which is a specific mapping. Similarly, the emotion identification model 59 may determine the robot's emotion, and the identification processing unit 290 may perform identification processing using the robot's emotion.
図9は、複数の感情がマッピングされる感情マップ400を示す図である。感情マップ400において、感情は、中心から放射状に同心円に配置されている。同心円の中心に近いほど、原始的状態の感情が配置されている。同心円のより外側には、心境から生まれる状態や行動を表す感情が配置されている。感情とは、情動や心的状態も含む概念である。同心円の左側には、概して脳内で起きる反応から生成される感情が配置されている。同心円の右側には概して、状況判断で誘導される感情が配置されている。同心円の上方向及び下方向には、概して脳内で起きる反応から生成され、かつ、状況判断で誘導される感情が配置されている。また、同心円の上側には、「快」の感情が配置され、下側には、「不快」の感情が配置されている。このように、感情マップ400では、感情が生まれる構造に基づいて複数の感情がマッピングされており、同時に生じやすい感情が、近くにマッピングされている。 Figure 9 shows an emotion map 400 on which multiple emotions are mapped. In emotion map 400, emotions are arranged in concentric circles radiating from the center. Emotions closer to the center of the concentric circles are more primitive. Emotions representing states and actions arising from a state of mind are arranged on the outer edges of the concentric circles. The concept of emotion includes both emotions and mental states. Emotions that are generally generated from reactions that occur in the brain are arranged on the left side of the concentric circles. Emotions that are generally induced by situational judgment are arranged on the right side of the concentric circles. Emotions that are generally generated from reactions that occur in the brain and are induced by situational judgment are arranged above and below the concentric circles. Furthermore, the emotion of "pleasure" is arranged on the top side of the concentric circles, and the emotion of "discomfort" is arranged on the bottom side. In this way, emotion map 400 maps multiple emotions based on the structure by which emotions are generated, with emotions that tend to occur simultaneously being mapped close together.
これらの感情は、感情マップ400の3時の方向に分布しており、普段は安心と不安のあたりを行き来する。感情マップ400の右半分では、内部的な感覚よりも状況認識の方が優位に立つため、落ち着いた印象になる。 These emotions are distributed in the 3 o'clock direction on emotion map 400, and usually fluctuate between relief and anxiety. In the right half of emotion map 400, situational awareness takes precedence over internal sensations, resulting in a calm impression.
感情マップ400の内側は心の中、感情マップ400の外側は行動を表すため、感情マップ400の外側に行くほど、感情が目に見える(行動に表れる)ようになる。 The inside of emotion map 400 represents what is going on in the mind, and the outside of emotion map 400 represents behavior, so the further out you go on emotion map 400, the more visible (expressed in behavior) the emotion becomes.
ここで、人の感情は、姿勢や血糖値のような様々なバランスを基礎としており、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示す。ロボットや自動車やバイク等においても、姿勢やバッテリー残量のような様々なバランスを基礎として、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示すように感情を作ることができる。感情マップは、例えば、光吉博士の感情地図(音声感情認識及び情動の脳生理信号分析システムに関する研究、徳島大学、博士論文:https://ci.nii.ac.jp/naid/500000375379)に基づいて生成されてよい。感情地図の左半分には、感覚が優位にたつ「反応」と呼ばれる領域に属する感情が並ぶ。また、感情地図の右半分には、状況認識が優位にたつ「状況」と呼ばれる領域に属する感情が並ぶ。 Here, human emotions are based on various balances such as posture and blood sugar levels, and when these balances deviate from the ideal, it indicates discomfort, and when they approach the ideal, it indicates pleasure. Emotions can also be created for robots, cars, motorcycles, etc., based on various balances such as posture and remaining battery life, so that when these balances deviate from the ideal, it indicates discomfort, and when they approach the ideal, it indicates pleasure. Emotion maps may be generated, for example, based on Dr. Mitsuyoshi's emotion map (Research on speech emotion recognition and emotional brain physiological signal analysis systems, Tokushima University, doctoral dissertation: https://ci.nii.ac.jp/naid/500000375379). The left half of the emotion map is lined with emotions belonging to an area called "reaction," where sensation is dominant. The right half of the emotion map is lined with emotions belonging to an area called "situation," where situational awareness is dominant.
感情マップでは学習を促す感情が2つ定義される。1つは、状況側にあるネガティブな「懺悔」や「反省」の真ん中周辺の感情である。つまり、「もう2度とこんな想いはしたくない」「もう叱られたくない」というネガティブな感情がロボットに生じたときである。もう1つは、反応側にあるポジティブな「欲」のあたりの感情である。つまり、「もっと欲しい」「もっと知りたい」というポジティブな気持ちのときである。 The emotion map defines two emotions that encourage learning. One is the negative emotion around the middle of "repentance" or "reflection" on the situation side. In other words, this is when the robot experiences negative emotions such as "I never want to feel this way again" or "I don't want to be scolded again." The other is the positive emotion around "desire" on the response side. In other words, this is when the robot experiences positive feelings such as "I want more" or "I want to know more."
感情特定モデル59は、ユーザ入力を、予め学習されたニューラルネットワークに入力し、感情マップ400に示す各感情を示す感情値を取得し、ユーザの感情を決定する。このニューラルネットワークは、ユーザ入力と、感情マップ400に示す各感情を示す感情値との組み合わせである複数の学習データに基づいて予め学習されたものである。また、このニューラルネットワークは、図10に示す感情マップ900のように、近くに配置されている感情同士は、近い値を持つように学習される。図10では、「安心」、「安穏」、「心強い」という複数の感情が、近い感情値となる例を示している。 The emotion identification model 59 inputs user input into a pre-trained neural network, obtains emotion values indicating each emotion shown in the emotion map 400, and determines the user's emotion. This neural network is pre-trained based on multiple pieces of training data that are combinations of user input and emotion values indicating each emotion shown in the emotion map 400. Furthermore, this neural network is trained so that emotions that are close to each other have similar values, as in the emotion map 900 shown in Figure 10. Figure 10 shows an example in which multiple emotions, such as "relieved," "calm," and "reassuring," have similar emotion values.
以上、本開示に係るシステムをデータ処理装置12の機能を主として説明したが、本開示に係るシステムはサーバに実装されているとは限らない。本開示に係るシステムは、一般的な情報処理システムとして実装されていてもよい。本開示は、例えば、パーソナルコンピュータで動作するソフトウェアプログラム、スマートフォン等で動作するアプリケーションとして実装されてもよい。本開示に係る方法はSaaS(Software as a Service)形式でユーザに対して提供されてもよい。 The system according to the present disclosure has been described above primarily in terms of the functions of the data processing device 12, but the system according to the present disclosure is not necessarily implemented on a server. The system according to the present disclosure may also be implemented as a general information processing system. The present disclosure may also be implemented, for example, as a software program that runs on a personal computer or an application that runs on a smartphone, etc. The method according to the present disclosure may also be provided to users in the form of SaaS (Software as a Service).
上記実施形態では、1台のコンピュータ22によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、コンピュータ22を含めた複数のコンピュータによる特定処理に対する分散処理が行われるようにしてもよい。例えば、データ生成モデル58が、データ処理装置12の外部装置に設けられ、当該外部装置において、入力データに応じたデータの生成を行うようにしてもよい。 In the above embodiment, an example was given in which a specific process was performed by a single computer 22, but the technology of the present disclosure is not limited to this, and distributed processing of the specific process may be performed by multiple computers, including the computer 22. For example, the data generation model 58 may be provided in a device external to the data processing device 12, and data may be generated in that external device in response to input data.
上記実施形態では、ストレージ32に特定処理プログラム56が格納されている形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、特定処理プログラム56がUSB(Universal Serial Bus)メモリなどの可搬型のコンピュータ読み取り可能な非一時的格納媒体に格納されていてもよい。非一時的格納媒体に格納されている特定処理プログラム56は、データ処理装置12のコンピュータ22にインストールされる。プロセッサ28は、特定処理プログラム56に従って特定処理を実行する。 In the above embodiment, an example was described in which the specific processing program 56 is stored in the storage 32, but the technology of the present disclosure is not limited to this. For example, the specific processing program 56 may be stored in a portable, computer-readable, non-transitory storage medium such as a USB (Universal Serial Bus) memory. The specific processing program 56 stored in the non-transitory storage medium is installed in the computer 22 of the data processing device 12. The processor 28 executes the specific processing in accordance with the specific processing program 56.
また、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56を格納させておき、データ処理装置12の要求に応じて特定処理プログラム56がダウンロードされ、コンピュータ22にインストールされるようにしてもよい。 Alternatively, the specific processing program 56 may be stored in a storage device such as a server connected to the data processing device 12 via the network 54, and the specific processing program 56 may be downloaded and installed on the computer 22 in response to a request from the data processing device 12.
なお、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56の全てを格納させておいたり、ストレージ32に特定処理プログラム56の全てを記憶させたりしておく必要はなく、特定処理プログラム56の一部を格納させておいてもよい。 It is not necessary to store the entire specific processing program 56 in a storage device such as a server connected to the data processing device 12 via the network 54, or to store the entire specific processing program 56 in the storage 32; only a portion of the specific processing program 56 may be stored.
特定処理を実行するハードウェア資源としては、次に示す各種のプロセッサを用いることができる。プロセッサとしては、例えば、ソフトウェア、すなわち、プログラムを実行することで、特定処理を実行するハードウェア資源として機能する汎用的なプロセッサであるCPUが挙げられる。また、プロセッサとしては、例えば、FPGA(Field-Programmable Gate Array)、PLD(Programmable Logic Device)、又はASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路が挙げられる。何れのプロセッサにもメモリが内蔵又は接続されており、何れのプロセッサもメモリを使用することで特定処理を実行する。 The following types of processors can be used as hardware resources for executing specific processes. Examples of processors include a CPU, a general-purpose processor that functions as a hardware resource for executing specific processes by executing software, i.e., a program. Other examples of processors include dedicated electrical circuits, such as FPGAs (Field-Programmable Gate Arrays), PLDs (Programmable Logic Devices), or ASICs (Application Specific Integrated Circuits), which are processors with a circuit configuration designed specifically for executing specific processes. All processors have built-in or connected memory, and all use the memory to execute specific processes.
特定処理を実行するハードウェア資源は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせ、又はCPUとFPGAとの組み合わせ)で構成されてもよい。また、特定処理を実行するハードウェア資源は1つのプロセッサであってもよい。 The hardware resource that executes the specific processing may be composed of one of these various processors, or may be composed of a combination of two or more processors of the same or different types (for example, a combination of multiple FPGAs, or a combination of a CPU and an FPGA). The hardware resource that executes the specific processing may also be a single processor.
1つのプロセッサで構成する例としては、第1に、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが、特定処理を実行するハードウェア資源として機能する形態がある。第2に、SoC(System-on-a-chip)などに代表されるように、特定処理を実行する複数のハードウェア資源を含むシステム全体の機能を1つのICチップで実現するプロセッサを使用する形態がある。このように、特定処理は、ハードウェア資源として、上記各種のプロセッサの1つ以上を用いて実現される。 As an example of a configuration using a single processor, first, there is a configuration in which one processor is configured using a combination of one or more CPUs and software, and this processor functions as a hardware resource that executes specific processing. Second, there is a configuration in which a processor is used to realize the functions of an entire system, including multiple hardware resources that execute specific processing, on a single IC chip, as typified by SoC (System-on-a-chip). In this way, specific processing is realized using one or more of the various processors listed above as hardware resources.
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路を用いることができる。また、上記の特定処理はあくまでも一例である。従って、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。 More specifically, the hardware structure of these various processors can be an electrical circuit that combines circuit elements such as semiconductor devices. Furthermore, the specific processing described above is merely an example. Therefore, it goes without saying that unnecessary steps can be deleted, new steps can be added, or the processing order can be rearranged, all within the scope of the spirit of the invention.
以上に示した記載内容及び図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、及び効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、及び効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容及び図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことは言うまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容及び図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。 The above-described written content and illustrations are a detailed explanation of the parts related to the technology of the present disclosure and are merely an example of the technology of the present disclosure. For example, the above explanation of the configuration, functions, actions, and effects is an explanation of an example of the configuration, functions, actions, and effects of the parts related to the technology of the present disclosure. Therefore, it goes without saying that unnecessary parts may be deleted, new elements may be added, or substitutions may be made to the above-described written content and illustrations, as long as they do not deviate from the spirit of the technology of the present disclosure. Furthermore, to avoid confusion and facilitate understanding of the parts related to the technology of the present disclosure, the above-described written content and illustrations omit explanations of common technical knowledge that do not require particular explanation to enable the implementation of the technology of the present disclosure.
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。 All publications, patent applications, and technical standards mentioned in this specification are incorporated by reference herein to the same extent as if each individual publication, patent application, and technical standard was specifically and individually indicated to be incorporated by reference.
以上の実施形態に関し、更に以下を開示する。 The following is further disclosed regarding the above embodiments.
(請求項1) (Claim 1)
レビューコメントを収集する手段と、 Methods for collecting review comments,
レビューコメントのデータ前処理を行う手段と、 A means of preprocessing review comment data,
レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、 A means of determining product relevance by comparing review comments with a list of characteristic words,
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、 A method for analyzing review comment patterns and identifying unnatural reviews,
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、 A method for comparing review comments and determining whether comments with identical content are copy-paste reviews,
レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、 Methods for providing feedback on the relevance, unnaturalness, and copy-paste judgment results of reviews,
を含むシステム。 A system including
(請求項2) (Claim 2)
レビューコメントの特徴ワードリストが商品属性に基づいて設定されることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the characteristic word list for review comments is set based on product attributes.
(請求項3) (Claim 3)
レビューコメントのパターン解析が一定期間内のレビューコメントの内容一致度を基に行われることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the pattern analysis of review comments is performed based on the degree of content consistency of review comments within a certain period of time.
「実施例1」 "Example 1"
(請求項1) (Claim 1)
レビューコメントを収集する手段と、 Methods for collecting review comments,
レビューコメントのデータ前処理を行う手段と、 A means of preprocessing review comment data,
レビューコメントの特徴語リストと比較して商品関連性を判定する手段と、 A means of determining product relevance by comparing with a list of feature words from review comments,
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、 A method for analyzing review comment patterns and identifying unnatural reviews,
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、 A method for comparing review comments and determining whether comments with identical content are copy-paste reviews,
レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、 Methods for providing feedback on the relevance, unnaturalness, and copy-paste judgment results of reviews,
を含むシステム。 A system including
(請求項2) (Claim 2)
レビューコメントの特徴語リストが商品属性に基づいて設定されることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the list of characteristic words for review comments is set based on product attributes.
(請求項3) (Claim 3)
レビューコメントのパターン解析が一定期間内のレビューコメントの内容一致度を基に行われることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the pattern analysis of review comments is performed based on the degree of content consistency of review comments within a certain period of time.
「応用例1」 "Application Example 1"
(請求項1) (Claim 1)
レビューコメントを収集する手段と、 Methods for collecting review comments,
レビューコメントのデータ前処理を行う手段と、 A means of preprocessing review comment data,
レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、 A means of determining product relevance by comparing review comments with a list of characteristic words,
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、 A method for analyzing review comment patterns and identifying unnatural reviews,
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、 A method for comparing review comments and determining whether comments with identical content are copy-paste reviews,
レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、 Methods for providing feedback on the relevance, unnaturalness, and copy-paste judgment results of reviews,
レビューコメントの信頼性をリアルタイムで評価しフィードバックする手段と、 A means to evaluate and provide feedback on the reliability of review comments in real time,
信頼性の高い順にレビューを表示する手段と、 A way to display reviews in order of reliability,
を含むシステム。 A system including
(請求項2) (Claim 2)
レビューコメントの特徴ワードリストが商品属性に基づいて設定されることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the characteristic word list for review comments is set based on product attributes.
(請求項3) (Claim 3)
レビューコメントのパターン解析が一定期間内のレビューコメントの内容一致度を基に行われることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the pattern analysis of review comments is performed based on the degree of content consistency of review comments within a certain period of time.
「感情エンジンを組み合わせた場合の実施例2」 "Example 2: Combining Emotion Engines"
(請求項1) (Claim 1)
レビューコメントを収集する手段と、 Methods for collecting review comments,
レビューコメントのデータ前処理を行う手段と、 A means of preprocessing review comment data,
レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、 A means of determining product relevance by comparing review comments with a list of characteristic words,
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、 A method for analyzing review comment patterns and identifying unnatural reviews,
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、 A method for comparing review comments and determining whether comments with identical content are copy-paste reviews,
レビューコメントの感情を分析する手段と、 Methods for analyzing the sentiment of review comments,
レビューの関連性、不自然さ、コピペ判定結果および感情分析結果をフィードバックする手段と、 Means of providing feedback on review relevance, unnaturalness, copy-paste determination results, and sentiment analysis results,
レビューコメントが不自然な場合やコピペの場合、投稿を拒否する手段と、 If a review comment is unnatural or copied and pasted, there are ways to reject the post,
を含むシステム。 A system including
(請求項2) (Claim 2)
レビューコメントの特徴ワードリストが商品属性に基づいて設定されることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the characteristic word list for review comments is set based on product attributes.
(請求項3) (Claim 3)
レビューコメントのパターン解析が一定期間内のレビューコメントの内容一致度を基に行われることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the pattern analysis of review comments is performed based on the degree of content consistency of review comments within a certain period of time.
「感情エンジンを組み合わせた場合の応用例2」 "Application Example 2: Combining Emotion Engines"
(請求項1) (Claim 1)
レビューコメントを収集する手段と、 Methods for collecting review comments,
レビューコメントのデータ前処理を行う手段と、 A means of preprocessing review comment data,
レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、 A means of determining product relevance by comparing review comments with a list of characteristic words,
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、 A method for analyzing review comment patterns and identifying unnatural reviews,
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、 A method for comparing review comments and determining whether comments with identical content are copy-paste reviews,
レビューコメントの感情分析を行う手段と、 Methods for sentiment analysis of review comments,
レビューの関連性、不自然さ、コピペ判定結果、および感情分析結果をフィードバックする手段と、 Means for providing feedback on review relevance, unnaturalness, copy-paste determination results, and sentiment analysis results,
を含むシステム。 A system including
(請求項2) (Claim 2)
レビューコメントの特徴ワードリストが商品属性に基づいて設定されることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the characteristic word list for review comments is set based on product attributes.
(請求項3) (Claim 3)
レビューコメントのパターン解析が一定期間内のレビューコメントの内容一致度を基に行われることを特徴とする請求項1記載のシステム。 The system described in claim 1, characterized in that the pattern analysis of review comments is performed based on the degree of content consistency of review comments within a certain period of time.
10、210、310、410 データ処理システム
12 データ処理装置
14 スマートデバイス
214 スマート眼鏡
314 ヘッドセット型端末
414 ロボット
10, 210, 310, 410 Data processing system 12 Data processing device 14 Smart device 214 Smart glasses 314 Headset type terminal 414 Robot
Claims (3)
レビューコメントのデータ前処理を行う手段と、
レビューコメントの特徴ワードリストと比較して商品関連性を判定する手段と、
レビューコメントのパターンを解析し不自然なレビューを判定する手段と、
レビューコメントを比較して同一内容のコメントをコピペレビューとして判定する手段と、
レビューの関連性、不自然さ、コピペ判定結果をフィードバックする手段と、
を含むシステム。 a means for collecting review comments;
a means for performing data preprocessing of review comments;
A means for determining product relevance by comparing the review comments with a feature word list;
A means for analyzing patterns of review comments and determining unnatural reviews;
A method for comparing review comments and determining whether comments with the same content are copy-paste reviews,
A means of providing feedback on the relevance, unnaturalness, and copy-paste judgment results of reviews,
A system including:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024115278A JP2026014281A (en) | 2024-07-18 | 2024-07-18 | system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024115278A JP2026014281A (en) | 2024-07-18 | 2024-07-18 | system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2026014281A true JP2026014281A (en) | 2026-01-29 |
Family
ID=98568166
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024115278A Pending JP2026014281A (en) | 2024-07-18 | 2024-07-18 | system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2026014281A (en) |
-
2024
- 2024-07-18 JP JP2024115278A patent/JP2026014281A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2026014281A (en) | system | |
| JP2026021107A (en) | system | |
| JP2026014257A (en) | system | |
| JP2026014969A (en) | system | |
| JP2026014864A (en) | system | |
| JP2026019849A (en) | system | |
| JP2026023432A (en) | system | |
| JP2026014972A (en) | system | |
| JP2026021151A (en) | system | |
| JP2026028039A (en) | system | |
| JP2026014262A (en) | system | |
| JP2026024183A (en) | system | |
| JP2026021094A (en) | system | |
| JP2026019763A (en) | system | |
| JP2025049135A (en) | system | |
| JP2026022541A (en) | system | |
| JP2026018514A (en) | system | |
| JP2026019130A (en) | system | |
| JP2026026868A (en) | system | |
| JP2026023938A (en) | system | |
| JP2026015056A (en) | system | |
| JP2026023426A (en) | system | |
| JP2026019025A (en) | system | |
| JP2026019176A (en) | system | |
| JP2026018503A (en) | system |