[go: up one dir, main page]

JP2014063494A - 分類装置、分類方法及び電子設備 - Google Patents

分類装置、分類方法及び電子設備 Download PDF

Info

Publication number
JP2014063494A
JP2014063494A JP2013193252A JP2013193252A JP2014063494A JP 2014063494 A JP2014063494 A JP 2014063494A JP 2013193252 A JP2013193252 A JP 2013193252A JP 2013193252 A JP2013193252 A JP 2013193252A JP 2014063494 A JP2014063494 A JP 2014063494A
Authority
JP
Japan
Prior art keywords
sample
type value
training sample
training
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013193252A
Other languages
English (en)
Other versions
JP6179305B2 (ja
Inventor
Bi Yi
斐 李
Rujie Liu
リィウ・ルゥジエ
Masahiko Sugimura
昌彦 杉村
Takayuki Baba
孝之 馬場
Yusuke Uehara
祐介 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2014063494A publication Critical patent/JP2014063494A/ja
Application granted granted Critical
Publication of JP6179305B2 publication Critical patent/JP6179305B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 従来のイメージによる学習方法により得た測定標本の種類バリューが不正確である問題を解決することができる分類装置、分類方法及び電子設備を提供する。
【解決手段】
本発明の分類装置は、目標標本を分類する分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定する確定ユニットと、種類バリューが不正確である訓練標本の種類バリューを削除する削除ユニットと、前記目標標本を測定標本とし、且つ各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性により前記測定標本の種類バリューを獲得する計算ユニットと、を含む。前記分類方法は、前記分類装置の機能を実現する各ステップを実施する。前記電子設備は、前記分類装置を含む。前述した本発明の技術は、情報処理領域に応用される。
【選択図】 図1

Description

本発明は、情報処理技術に関し、特に分類装置、分類方法及び電子設備に関する。
情報の間の関係を有効に示すことができる一種の説明方法として、図による説明方法は、現在様々な分野に幅広く使用されている。例えば、ウェブページ分類、イメージ検索、ビデオ概念検索などに幅広く使用されている。前記ウェブページ分類、図面検索、イメージ検索、ビデオ概念検索などは、広義的には一種の分類方法だと見なすことができる。本発明において説明する図は、データの間の関係を示す重み付きグラフであり、一般的に使用している図面ではない。
従来のイメージによる学習方法は、通常理想的な条件下において、訓練標本の間の類似性を利用し、且つ理想的な解析表現方式又はイテレーション方式により、問題を解決すると共に、各訓練標本が所属する種類を有効に反映することができる種類バリューを算出する。勉強結果を測定標本まで普及させるため、柔軟な限定により制限条件に基づいて、理想化するコスト函数を形成しなければならない。
しかし、従来のイメージによる学習方法において、勉強結果を測定標本まで普及させる過程において、訓練標本の種類バリューがほとんど変わらないので、種類バリューが正しくない訓練標本が測定標本の種類バリューの計算に影響を与えることができる。即ち、これにより、計算して得た測定標本の種類バリューが不正確になることができる。また、勉強結果を測定標本まで普及させるための従来のイメージによる学習方法は、各測定標本を順位に処理するが、測定標本の間の関係を全然考慮しないので、これにより計算して得た測定標本の種類バリューが不正確になることができる。
以下、本発明の概要を簡単に説明して、技術者が本発明の概要を理解するようにする。後述する本発明の概要により、本発明のすべての内容を示すことができない。本発明の概要は、本発明の重点又は重要な部分を提出する意図であるか、又は本発明の技術的範囲を限定する意図はない。本発明の概要の目的は、総括した内容を提出し、後述する詳細な説明の前書きを作成することにある。
本発明の目的は、従来のイメージによる学習方法により得た測定標本の種類バリューが不正確である問題を解決することができる分類装置、分類方法及び電子設備を提供することにある。
本発明の実施例において、一種の分類装置を提供する。前記分類装置は、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む。
本発明の他の実施例において、一種の分類方法を提供する。前記分類方法は、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するステップと、前記目標標本の各集合に相関する各訓練標本を確定し、且つ前記訓練標本中の各訓練標本は、いずれも種類バリューを有しているステップと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するステップと、前記目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するステップと、を含む。
本発明の他の実施例において、一種の電子設備をさらに提供する。前記電子設備は、前述した分類装置を含む。
前述した本発明の分類装置、分類方法及び電子設備により、以下のような発明の効果を奏することができる。即ち、種類バリューが正しくない訓練標本を選択するとともに、このような訓練標本の種類バリューを削除することにより、訓練標本がデータの実際の分布状況をより正確に示し、且つ測定標本の種類バリューを計算する過程に使用する訓練標本の種類バリューの正確性を確保することができる。また、計算する過程において測定標本の間の類似性関係を追加することにより、獲得した測定標本の種類バリューの正確度を向上させることができる。
以下、図面を参照しながら本発明の最良の実施例を詳細に説明する。これにより、本発明の実施例の発明の効果をより詳細に理解することができる。
本発明の後述する図面に記載されている内容により、本発明の内容をより詳細に理解することができる。本発明の図面において、同様或いは類似する図面符号により、同様或いは類似する部品を示す。述する図面と図面の簡単な説明は、本明細書に含まれ、且つ本明細書の一部分になって、本発明の最良な実施例をより詳細に説明し、本発明の原理及び発明の効果をより詳細に釈明する。
本発明の一実施例に係る分類装置を示すフレーム図である。 従来の分類技術により測定標本を処理する基本的な原理を示す簡略図である。 従来の分類技術により測定標本を処理する基本的な原理を示す簡略図である。 従来の分類技術により測定標本を処理する基本的な原理を示す簡略図である。 本発明の実施例に係る分類装置により測定標本を処理する基本的な原理を示す簡略図である。 図1に記載されている計算ユニットの構造を示す簡略図である。 本発明の他の実施例に係る分類装置を示すフレーム図である。 本発明の他の実施例に係る分類方法を示すフレーム図である。 本発明の他の実施例に係る分類装置及び分類方法の機能を実現するための情報処理設備のハードウェアの構造配置図である。 ここで説明したいことは、本発明の図面中の部品は、部品を簡単/明確に示すために描いたものであるが、部品のサイズの比率により描いたものではない。例えば、本発明の実施例をより詳細に説明するため、図面のある部品のサイズを他の部品のサイズより大きく示す可能性がある。
以下、添付した図面を参照しながら本発明の事例的な実施例を説明する。本発明の技術を詳細/理解しやすく説明するため、本明細書において本発明の実際実施例のすべての特徴を説明しないが、いずれか1つの実施例を実施する時、この実施例の実施に必ず需要するすべての特徴を示さなければならない。これにより、当業者が本発明の具体的な目的を実現することができる。例えば、システム又は方法に適用する制限条件と、異なる実施例により前記制限条件が変わることを示さなければならない。周知の通り、本発明の分類装置又は分類方法を創造することは、非常に複雑で、時間が掛かるが、本技術領域の技術者が後述する本発明の実施例により本発明の分類装置又は分類方法を容易に想到することができる。
また、重要でない細部により本発明の明細書が長くなることを防ぐため、本発明の図面において、本発明の技術的方案に緊密に関連する装置の構造と/処理のステップだけを示した。即ち、本発明の技術的方案との関連性が大きくない細部の記載は省略する。
本発明の実施例において、一種の分類装置を提供する。前記分類装置は、目標標本を分類して、目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む。
以下、図1を参照しながら本発明の一種の実施例に係る分類装置を詳細に説明する。
図1に示す通り、本発明の実施例に係る分類装置100は、分類ユニット110と、確定ユニット120と、削除ユニット130と、計算ユニット140とを含む。
分類装置100において、分類ユニット110は、各目標標本を分類して、目標標本の少なくとも一種の集合を形成する。本実施例の目標標本は、イメージ、動画、本文、又はウェブページであることができる。
本発明の具体的な実施例に係る分類装置において、分類ユニット110は、目標標本を分類して、一種の集合中の各目標標本と、この集合中の他の少なくとも1つの目標標本との間の類似性が第四所定閾値より大きくなるようにする。
例えば、分級的な分類方法により、前述した分類方法を実現ことができる。具体的なステップは、以下の通りである。(a1)最初の時、複数の集合を形成して、各集合が1つの目標標本のみを含むようにする。(a2)2つの集合の間の類似性を計算する。2つの集合の間の類似性は、2つの集合の間の類似性の最大値を超えないことを意味する。即ち、
Figure 2014063494
数1において、A及びBは、いずれか2つの集合を示し、a及びbは、前記2つの集合中のいずれかの目標標本を示し、Sim(A、B)は、集合Aと集合Bとの間の類似性を示す。(a3)前記2つの集合中の目標標本の類似性を計算して、類似性が第四所定閾値より大きいかどうかを判断する。第四所定閾値より大きい場合、最大の類似性を有している2つの集合(即ち、複数の集合中において、類似性が最大である2つの集合)を1つの集合に合併した後、ステップ(a2)を行う。複数の集合中において、いずれか2つの集合の間の類似性が第四所定閾値より小さくなるまで前記ステップを繰り返す。
本実施例において、前記第四所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。
図1に示す通り、確定ユニット120は、目標標本の各集合に相関する訓練標本をそれぞれ確定する。前記訓練標本は、目標標本の種類と同じである対象である。例えば、訓練標本と目標標本は、以下の対象中の一種である。即ち、イメージ、動画、本文、及びウェブページなど中の一種である。
本発明の具体的な実施例に係る分類装置において、前記「目標標本の各集合に相関する訓練標本」は、色々な確定方法により確定することができる。
一種の実現方法において、目標標本の各集合により、確定ユニット120は、前記集合の少なくとも1つの目標標本の間において、類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とする。
前記実現方法中の一例において、目標標本の集合Mは、分類ユニット110が目標標本を分類して得たいずれか1つの集合であると仮定する場合、前記集合Mにおいて、確定ユニット120は、まず各訓練標本と集合Mの各目標標本との間の類似性を獲得する。次に、集合M中の少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本たちを前記集合Mに相関する訓練標本とする。
前記実現方法中の他の一例において、各訓練標本について、確定ユニット120は、前記訓練標本と集合M中の各訓練標本との間の類似性を計算しなくてもよい。訓練標本Sを例とし、確定ユニット120が計算して得た集合M中のいずれかの目標標本Sと訓練標本Sとの間の類似性が第二所定閾値より大きいと時、確定ユニット120は、集合M中の他の剰余目標標本と訓練標本Sとの間の類似性を計算せず、訓練標本Sを直接に集合Mに相関する1つの訓練標本だと確定してもよい。
訓練標本と目標標本との間の類似性は、具体的な状況により適用する計算方法を選択して計算することができる。例えば、イメージの類似性、本文の類似性などを計算する従来の計算方法を採用することができる。即ち、訓練標本と目標標本がイメージ、本文及び他の種類の対象である場合、各種類の対象により、訓練標本と目標標本との間の類似性をそれぞれ計算することができる。
本実施例において、前記第二所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。本実施例において、第二所定閾値は、第四所定閾値と同値に設定することができる。
他の実施方法において、目標標本の各集合について、確定ユニット120は、前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とするか、或いは「前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本」との類似性が第三所定閾値より大きい訓練標本たちを前記集合に相関する訓練標本とする。
前記目標標本のいずれかの1つの集合Mを例とし、且つ前述した方法と類似する方法により、確定ユニット120は、集合M中の少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本たちを前記集合Mに相関する訓練標本とする。説明を簡単にするため、下文において、「集合M中の少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本」を第一訓練標本と略称する。前記第一訓練標本だけではなく、確定ユニット120は、第一訓練標本中のいずれか1つの訓練標本との類似性が第三所定閾値より大きい訓練標本たちを前記集合Mに相関する訓練標本とすることができる。同様に、説明を簡単にするため、下文において、「第一訓練標本中のいずれか1つの訓練標本との類似性が第三所定閾値より大きい訓練標本」を第二訓練標本と略称する。従って、前述した実施例の「集合Mに相関する訓練標本」は、第一訓練標本及び第二訓練標本を含む。本実施例において、前記第三所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。
前述した第一訓練標本中のいずれかの訓練標本も種類バリューを有している。前記種類バリューは、所属する標本の種類と所定する種類との間の整合程度を示す一種の度量である。即ち、前記種類バリューは、所属する標本の種類が所定する種類に符合する程度を示すバリューである。一般的には、種類バリューが大きければ大きいほど、種類バリューに所属する標本が所定する種類に符合する可能性が大きいことを説明し、種類バリューが小さければ小さいほど、種類バリューに所属する標本が所定する種類に符合する可能性が低いことを説明する。例えば、種類バリューは、通常−1〜1との間に置かれる。
本実施例において、前記訓練標本の種類バリューの獲得方法の相違により、訓練標本の以下の二種に分類することができる。
一種の訓練標本は、一般の標注標本である。このような標注標本は、通常所定の種類バリューを有している。前記種類バリューは、例えば人工的に予め標注することができる。しかし、人力に限度があるので、通常所定の種類バリューを有しているこのような標注標本の数量も一定の限度がある。
他の一種の訓練標本は、機器標注標本である。このような機器標注標本の種類バリューは、例えば、訓練過程(一般的な分類装置は、使用する前に訓練標本により訓練を行う過程である)において前記標注標本の種類バリューによって得ることができる。
従って、本発明の実施例に係る分類装置の訓練標本は、前述した二種の標本を含むことができる。即ち、前述した標注標本と機器標注標本を含むことができる。前述した二種の訓練標本の種類バリューは、前述した方法と類似する方法によりそれぞれ得ることができるので、ここでは再び説明しない。この場合、前記確定ユニット120が確定した「目標標本の各集合に相関する訓練標本」は、すべてが機器標注標本であることができる。
前述した通り、確定ユニット120の処理により、目標標本の各集合に相関する訓練標本をそれぞれ確定することができる。
一般的な推定により推定することができるとおり、類似する標本の種類バリューの差が大きいはずはない。従って、いずれか2つの訓練標本(特に、前記2つの訓練標本が機器標注標本である場合)がそれぞれ、いずれか2つの目標標本に類似し、且つ前記2つの目標標本も互いに類似する(例えば、前述したいずれか1つの集合に所属する)場合、前記2つの訓練標本の種類バリューの差が大きいはずはない。でない場合、例えば、いずれか1つの集合中の2つの目標標本にそれぞれ類似する2つの訓練標本の種類バリューの間の差が第一所定閾値より大きい場合、前記2つの訓練標本の種類バリューが正しくないことを説明する。従って、このような種類バリューを除去する推定算法によりより正確な結果を得ることができる。
目標標本の各集合について、削除ユニット130は、まず「前記集合に相関する訓練標本」の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を計算する。次は、計算して得た差が第一所定閾値より大きい場合、このような「前記集合に相関する訓練標本」の種類バリューを削除する。
例えば、前述した通り、目標標本のいずれかの1つの集合Mにおいて、確定ユニット120により、集合Mに相関する訓練標本を確定する。次は、削除ユニット130が集合Mに相関するすべての訓練標本の種類バリュー中において最大種類バリューと最小種類バリューを選び出すとともに、最大種類バリューと最小種類バリューとの間の差を計算する(前記差が0より大きいか或いは等しい)。前記差が第一所定閾値より大きい場合、これらの集合Mに相関するすべての訓練標本の種類バリューを削除する。
特に、1つの優先例において、確定ユニット120が確定した「前記集合に相関する訓練標本」のすべてが機器標注標本である場合、削除ユニット130は、これらの機器標注標本の種類バリューを削除する。
本実施例において、前記第一所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。
計算ユニット140は、残った訓練標本(即ち、種類バリューが削除された訓練標本を除く他の訓練標本)の種類バリューを利用して、解を求めて最適化する方法により、前記目標標本の種類バリューを獲得し、且つ計算して得た前記種類バリューにより目標標本の種類を確定する。
本発明の実施例に係る分類装置において、計算ユニット140は、目標標本を測定標本とすることができる。次に、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得する。
従来のイメージに基づく学習方法は、通常各測定標本を順位に処理し、且つ各測定標本と訓練標本との間の関係のみを考慮し、測定標本と訓練標本との間の関係は完全に使わない。図2A〜2Cは、従来のイメージに基づく学習方法が測定標本を処理する時に採用する基本的な原理を示す簡略図である。図2A〜2Cと後述する図2Dにおいて、「○」は訓練標本(即ち、S1〜S5)を示し、「△」は測定標本(即ち、S1〜S3)を示し、図面中の連結線は連結する対象の間の類似性を示す。
図2A〜2Cに示す通り、従来の方法は、測定標本を処理する時、測定標本と訓練標本との間の類似性のみを考慮する。即ち、各測定標本をそれぞれ処理することにより、測定標本を分類する。図2A〜2Cにおいて、測定標本と各訓練標本との間の連結線を示さず、類似性が高い前の複数の訓練標本と測定標本との間の連結線のみを示した。
図2Dは、計算ユニット140が測定標本を処理する原理を示す簡略図である。図2Dと前述した図2A〜2Cを比較して見ると、図2Dにおいて、計算ユニット140が測定標本を処理する時、測定標本と訓練標本との間の類似性を考慮するとともに、測定標本と測定標本との間の類似性(即ち、図2Dにおいて、S1とS2との間、S2とS3との間の連結線である)も考慮することを分かることができる。
図2A〜2Dに示す各訓練標本の間の連結線(訓練標本の間の類似性)は、測定標本の種類バリューを計算する時に用いるものではなく、いずれかの実施例の訓練過程において、前述した機器標注標本の種類バリューを獲得する時に用いるものである。
以下、図3を参照しながら、計算ユニット140の様々な配置例を説明する。
図3に示す通り、本実施例の計算ユニット140は、コスト函数生成モジュール310と、コスト函数算出モジュール320とを含むことができる。
コスト函数生成モジュール310は、所定の制限条件を反映することができるコスト函数を生成する。コスト函数算出モジュール320は、前記コスト函数の最小化の問題を検出することにより測定標本の種類バリューを獲得する。
前記所定の制限条件は、以下のような2つの条件を含むことができる。即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することである。
前述した所定の制限条件により、本発明の実施例に係る分類装置のコスト函数生成モジュール310が生成するコスト函数は、以下のような函数、又は変形例を含むことができる。
Figure 2014063494
前記函数において、Mは、測定標本の数量であり、Nは、残った訓練標本の数量であり、
Figure 2014063494
は、M個の測定標本中で第i個目の測定標本の種類バリューであり、
Figure 2014063494
は、前記N個の訓練標本中で第j個目の訓練標本の種類バリューであり、
Figure 2014063494
は、第i個目の測定標本と第j個目の訓練標本との間の類似性であり、
Figure 2014063494
は、第k個目の測定標本と第l個目の測定標本との間の類似性である。
前記実施例において、
Figure 2014063494
は、測定標本と訓練標本との間の類似性を示し、
Figure 2014063494
は、測定標本と測定標本との間の類似性を示す。
例えば、
Figure 2014063494

Figure 2014063494
のような2つの函数を含むコスト函数は、以下のような
Figure 2014063494

の形式により示すことができる。
前記函数において、
Figure 2014063494
は、線形組合係数であり、
Figure 2014063494
は、すべての測定標本の種類バリューで構成されるベクトルである。
Figure 2014063494
は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。
次に、解を求めて最適化方法
Figure 2014063494
により、すべての測定標本の種類バリューを算出することができる。前記最適化方法
Figure 2014063494
は、一種の簡単な二回最適化方法である。本技術領域の技術者は、周知する常識と公開されている資料により、最適化の方法を選び出すことができるので、ここでは再び説明しない。
本発明の実施例において、計算ユニット140は、種類バリューが削除された訓練標本と目標標本を一緒に測定標本とすることもでき、且つ前述した方法により測定標本の種類バリューを獲得するとともに、目標標本の種類バリューにより分類結果を確定する。この場合、算出する過程で形成される変量は、目標標本の種類バリューを含むだけではなく、種類バリューが削除された訓練標本たちの新しい種類バリューも含んでいる。すべての測定標本の新しい種類バリューを獲得した後、このような目標標本の種類バリューにより最終の分類結果を確定することができる(分類の目的は、目標標本の種類を獲得することにある)。例えば、種類バリューが−1〜1の間に置かれると仮定する場合、計算により獲得した各目標標本の第一、第二及び第三種類バリューがそれぞれ1、0.8、−1である時、1つ目の目標標本と所定の種類が完全に符合することを示し、2つ目の第二回目の目標標本と所定の種類が比較的に符合することを示し、3つ目の目標標本と所定の種類が完全に符合しないことを示す。前記所定の種類は、例えば、前記訓練標本中で種類バリューが1である訓練標本の種類であることができる。
実際の応用において、測定標本は通常大量に獲得するが、従来の方法において、大量に獲得した測定標本の間の類似性を考慮せず、各測定標本と訓練標本との間の類似性のみを考慮する。本発明の実施例において、測定標本と測定標本との間の類似性をさらに検出することにより、より高い分類精度と分類結果を獲得することができる。
以下、図4を参照しながら、本発明の他の実施例に係る分類装置を詳細に説明する。
図4に示す通り、分類装置400は、分類ユニット410と、確定ユニット420と、削除ユニット430と、計算ユニット440とを含むだけではなく、標本更新ユニット450をさらに含む。図4に示す分類装置400の分類ユニット410、確定ユニット420、削除ユニット430、計算ユニット440は、前記図1と/又は図3に記載されている装置100中の各ユニットと同様な構造及び機能を有し、且つ類似する技術効果を奏することができるので、ここでは再び説明しない。
本実施例の訓練標本は、前述した標注標本と機器標注標本を含む。図4に示す通り、分類装置400において、標本更新ユニット450は、新しい種類バリューを獲得した測定標本を、次の分類過程中の機器標注標本とする。前記測定標本は、次の分類過程で使用する一部分の機器標注標本になり、元存在する機器標注標本は、依然として機器標注標本として使用する。
前述した通り、本発明の実施例に係る分類装置は、種類バリューが正しくない訓練標本を選択するとともに、このような訓練標本の種類バリューを削除することにより、訓練標本がデータの実際の分布状況をより正確に示し、測定標本の種類バリューを計算する過程に使用する訓練標本の種類バリューの正確性を確保することができる。また、本発明の実施例に係る分類装置は、計算する過程において測定標本の間の類似性関係を追加することにより、獲得した測定標本の種類バリューの正確度を向上させることができる。
本発明の実施例において、一種の分類方法をさらに提供する。以下、図5を参照しながら本実施例に係る分類方法を説明する。
図5に示す通り、本発明の実施例に係る分類方法の処理流れ500は、ステップS510から始まり、まずはステップS520を行う。
ステップS520において、目標標本を分類して、目標標本の少なくとも一種の集合を形成する。次に、ステップS530を行う。ステップS520で行う処理は、前記図1で説明した分類ユニット110が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。
ステップS530において、目標標本の各集合に相関する各訓練標本を確定する。訓練標本中の各訓練標本は、いずれも種類バリューを有している。次に、ステップS540を行う。ステップS530で行う処理は、前記図1で説明した確定ユニット120が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。
ステップS540において、目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得する。且つ、前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除する。次に、ステップS550を行う。ステップS540で行う処理は、前記図1で説明した削除ユニット130が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。
ステップS550において、目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得する。次にステップS560を行う。ステップS550で行う処理は、前記図1と/又は図3で説明した計算ユニット140が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。
本実施例の処理流れ500は、ステップS560により終わる。
本発明の優先的な実施例に係るステップS550において、種類バリューが削除された訓練標本と目標標本とを一緒に測定標本とし、且つ得た目標標本の種類バリューにより分類結果を得ることもできる。
前述した通り、本発明の実施例に係る分類方法は、種類バリューが正しくない訓練標本を選択するとともに、このような訓練標本の種類バリューを削除することにより、訓練標本がデータの実際の分布状況をより正確に示し、測定標本の種類バリューを計算する過程に使用する訓練標本の種類バリューの正確性を確保することができる。また、本発明の実施例に係る分類方法は、計算する過程において測定標本の間の類似性関係を追加することにより、獲得した測定標本の種類バリューの正確度を向上させることができる。
本発明の実施例において、一種の電子設備をさらに提供する。前記電子設備は、前述した分類装置を含む。
本発明の実施例に係る電子装置は、後述する設備中のいずれかの一種の設備である。即ち、携帯電話、コンピュータ、ダブレットパソコン、携帯情報端末、メディアプレーヤーなど中の一種の設備である。前記電子設備は、前述した分類装置の各種の機能と技術効果を有しているが、ここでは再び説明しない。
前述した本発明の実施例に係る分類装置が含んでいる各構成ユニット、子ユニット、モジュールなどの機能は、ソフトウェア、ファームウエア、ハードウェア、又はこれらの任意の組合せにより実現することができる。ソフトウェア又はファームウエアにより前記機能を実現する場合、記憶媒介又ネットワークから前記ソフトウェア又はファームウエアを構成するプログラムを、専用ハードウェア構造を有している機器(例えば、図6に示す通用機器600)に入力してインストールすることができる。前記各種のプログラムがインストールされている前記機器は、前記各構成ユニット、子ユニットの各機能を実現することができる。
図6は、本発明の実施例に係る分類装置及び分類方法の機能を実現するための、一種の情報処理設備のハードウェア配置構造図を示す簡略図である。
図6において、中央処理ユニット(CPU)601は、リードオンリーメモリ(ROM)602に記憶されているプログラム、又はメモリ装置608からランダムアクセスメモリ(RAM)603に読み込むプログラムにより各種の処理を行う。RAM603には、CPU601が各種の処理を行う時に需要するデータも記憶されている。CPU601、ROM602及びRAM603は、バス604により互いに連結されている。入力/出力インタフェース605もバス604に連結されている。
以下の部品は、入力/出力インタフェース605に連結されている。例えば、入力装置606(キーボード、マウス等を含む)、出力装置607(表示装置(例えば、陰極線管表示装置(CRT)、液晶表示装置(LCD)など)、スピーカなどを含む)、メモリ装置608(ハードディスクなどを含む)、通信装置609(ネットワークインタフェースカード(例えば、LANカード、変調復調装置など)などを含む)である。通信装置609は、ネットワーク、例えばインターネットにより通信を行う。需要により、ドライブ装置610を入力/出力インタフェース605に連結することもできる。着脱可能なメモリ媒介611、例えば磁気ディスク、ライトディスク、光磁気ディスク、半導体メモリ装置などを前記ドライブ装置610に装着することができる。従って、需要により、前記メモリ媒介611に記憶されているプログラムを前記メモリ装置608に読み込むことができる。
ソフトウェアにより前述した処理を行う場合、ネットワーク、例えばインターネット、又はメモリ媒介、例えば着脱可能なメモリ媒介611から所定のソフトウェアを読取ることができる。
本技術領域の技術者が周知する通り、前記メモリ媒介は、プログラムが記憶されているか、或いは設備と離れてユーザーにプログラムを伝送する図6に示す着脱可能なメモリ媒介611に限定されるものではない。着脱可能なメモリ媒介611は、例えば、磁気ディスク(フロッピー(登録商標)ディスクを含む)、ライトディスク(コンパクトディスクリードオンリーメモリー(CD−ROM)及びディジタルヴァーサタイルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標))、半導体メモリである。前記メモリ媒介は、ROM602、メモリ装置608が含むハードディスクなどであることができる。メモリ媒介には、プログラムが記憶されており、ユーザーは、メモリ媒介とその中に記憶されているプログラムを使用することができる。
本発明の実施例において、装置読取可能なインストラクションコードが記憶されているプログラムを提供する。装置が前記インストラクションコードを読取って実行する場合、本発明の実施例に係る前記分類方法が実施される。前記プログラムを記憶する装置、例えば、磁気ディスク、ライトディスク、光磁気ディスク、半導体メモリ装置などのようなメモリ媒介も本発明の明細書に公開されている。
前述した本発明の具体的な実施例において、一種の実施方式に記載と/又は公開されている特徴は、同様又は類似する方式により、他の1つ又は複数の実施例に使用するか、或いは他の実施例の特徴と組み合わせて使用するか、或いは他の実施例の特徴の代わりに使用することができる。
本発明の実施例に係る方法は、明細書に記載されている時間順位、又は図面に示されている時間順位に沿って実施せず、他の時間順位に沿って実施するか、或いは共に実施するか、或いは別々に実施することができる。即ち、本発明の技術的範囲は、本明細書に記載されている実施順位に限定されるものではない。
本発明の前記方法の各ステップは、装置読取可能なメモリ媒介に記憶されているコンピュータ実施可能なプログラムにより実施することができる。
本発明の目的は、後述する方式により実現することもできる。即ち、メモリ媒介が記憶している前記実施可能なプログラムコードをシステム又は設備に直接又は間接に提供して、前記システム又は設備中のコンピュータ又は中央処理ユニット(CPU)が前記プログラムコードを読取って実行する方法である。
この場合、前記システム又は設備が前記プログラムコードを実行する機能を有しなければならない。本発明の実施方式は、前述したプログラムに限定されるものではない。且つ前記プログラムの形式もいずれかの形式であることができる。例えば、目標プログラム、インタプリタ実行可能なプログラム、又はオペレーティングシステムに提供するスクリプトなどである。
前述した装置読取可能なメモリ媒介は、以下の装置を含むが、以下の装置に限定されるものではない。例えば、メモリ装置及びメモリユニット、半導体設備、ディスクユニット(例えば、磁気ディスク、ライトディスク、光磁気ディスク)、情報を記憶することができる他の媒介などである。
また、ユーザーのコンピュータをインターネットの所定のウェブサイトに繋げて、本発明のコンピュータ用プログラムコードをタウンロードした後、コンピュータにおいて前記プログラムを実行することにより、本発明の技術を実現することもできる。
本明細書に記載されている用語、例えば、左、右、第一、第二などのような関係用語は、1つの装置又はステップと他の1つの装置又はステップを分けるためのものであり、前記装置又はステップの間に存在するいずれかの関係又は順位を限定するか、或いは提示するためのものではない。また、「含む」、「具備する」などのような他のものをさらに含むことを制限しない様々な用語は、いずれの要素を含む過程、方法、装置、又は設備が前記要素を含むだけではなく、記載されていない他の要素をさらに含むか、或いは前述した過程、方法、装置、又は設備が固有する要素をさらに含むことができることを意味する。即ち、他の制限用語がない場合、「……1つを含む」などのような用語は、過程、方法、装置、又は設備が記載されている要素を含むだけではなく、他の要素も含むことができることを意味する。
前述した本発明の実施例により、本発明は、以下のような方案を提供する。しかし、本発明が後述する方案にのみ限定されるものではない。
(付記1)
分類装置において、前記分類装置は、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む。
(付記2)
前記計算ユニットは、所定の制限条件、即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することと、を反映することができるコスト函数を生成するように配置されているコスト函数生成モジュールと、前記コスト函数の最小化の問題を検出することにより測定標本の種類バリューを獲得するコスト函数算出モジュールと、を含む付記1に記載の分類装置。
(付記3)
前記コスト函数は、以下のような函数、又は変形例、
Figure 2014063494

Figure 2014063494
を含み、
前記函数において、Mは、測定標本の数量であり、Nは、残った訓練標本の数量であり、
Figure 2014063494
は、M個の測定標本中で第i個目の測定標本の種類バリューであり、
Figure 2014063494
は、前記N個の訓練標本中で第j個目の訓練標本の種類バリューであり、
Figure 2014063494

は、第i個目の測定標本と第j個目の訓練標本との間の類似性であり、
Figure 2014063494
は、第k個目の測定標本と第l個目の測定標本との間の類似性である付記2に記載の分類装置。
(付記4)
前記訓練標本は、所定の種類バリューを有している標注標本と、訓練過程において前記標注標本の種類バリューにより種類バリューを得る機器標注標本とを含む付記1乃至付記3のいずれか1項に記載の分類装置。
(付記5)
前記確定ユニットが確定した目標標本の各集合に相関する訓練標本が前記機器標注標本である付記4に記載の分類装置。
(付記6)
前記計算ユニットは、種類バリューが削除された訓練標本と目標標本を一緒に前記測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定する付記1乃至付記3のいずれか1項に記載の分類装置。
(付記7)
前記計算ユニットは、種類バリューが削除された訓練標本と目標標本を一緒に前記測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定する付記4又は付記5に記載の分類装置。
(付記8)
新しい種類バリューを獲得した測定標本を次の分類過程中の機器標注標本とする標本更新ユニットをさらに含む付記3、5及び7のいずれか1項に記載の分類装置。
(付記9)
前記確定ユニットは、前記目標標本の各集合により、前記集合の少なくとも1つの目標標本の間において、類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とするように配置される付記1乃至付記8のいずれか1項に記載の分類装置。
(付記10)
前記確定ユニットは、前記目標標本の各集合により、前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本との類似性が第三所定閾値より大きい訓練標本たちを前記集合に相関する訓練標本とするように配置される付記9に記載の分類装置。
(付記11)
前記分類ユニットは、前記目標標本の各種類により、前記集合中の各目標標本と、前記集合中の他の少なくとも1つの目標標本との間の類似性が第四所定閾値より大きくなるように配置されている付記1乃至付記10のいずれか1項に記載の分類装置。
(付記12)
前記目標標本と前記訓練標本は、イメージ、動画、本文、又はウェブページ中の一種である付記1乃至付記11のいずれか1項に記載の分類装置。
(付記13)
分類方法において、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するステップと、前記目標標本の各集合に相関する各訓練標本を確定し、且つ前記訓練標本中の各訓練標本は、いずれも種類バリューを有しているステップと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するステップと、前記目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するステップと、を含む。
(付記14)
解を求めて最適化する方法により前記測定標本の種類バリューを獲得するステップは、所定の制限条件、即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することと、を反映することができるコスト函数を生成するステップと、前記コスト函数の最小化の問題を検出することにより前記測定標本の種類バリューを獲得するステップとを含む付記13に記載の分類方法。
(付記15)
前記訓練標本は、所定の種類バリューを有している標注標本と、訓練過程において前記標注標本の種類バリューにより種類バリューを得る機器標注標本とを含む付記13又は付記14に記載の分類方法。
(付記16)
種類バリューが削除された訓練標本と目標標本を一緒に測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定するステップをさらに含む付記13乃至付記15のいずれか1項に記載の分類方法。
(付記17)
電子設備において、付記1乃至付記12のいずれか1項に記載の分類装置を含む電子設備。
(付記18)
前記電子設備は、以下のような設備、即ち、携帯電話、コンピュータ、ダブレットパソコン、携帯情報端末、メディアプレーヤーなど中のいずれかの一種である付記17に記載の電子設備。
(付記19)
装置読取可能なインストラクションコードが記憶されているプログラムにおいて、前記プルグラムを実行することにより、付記13〜付記16のいずれか1項に記載の分類方法を実施する。
(付記20)
コンピュータ読取可能なメモリ媒介において、前記メモリ媒介に付記19に記載されているプログラムが記憶されている。
100 分類装置
110 分類ユニット
120 確定ユニット
130 削除ユニット
140 計算ユニット
310 コスト函数生成モジュール
320 コスト函数算出モジュール
400 分類装置
410 分類ユニット
420 確定ユニット
430 削除ユニット
440 計算ユニット
450 標本更新ユニット
600 通用機器
601 中央処理ユニット(CPU)
602 リードオンリーメモリ(ROM)
603 ランダムアクセスメモリ(RAM)
604 バス
605 入力/出力インタフェース
606 入力装置
607 出力装置
608 メモリ装置
609 通信装置
610 ドライブ装置
611 着脱可能なメモリ媒介

Claims (10)

  1. 分類装置において、
    目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、
    前記目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、
    前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、
    前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む分類装置。
  2. 前記計算ユニットは、
    所定の制限条件、即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することと、を反映することができるコスト函数を生成するように配置されているコスト函数生成モジュールと、
    前記コスト函数の最小化の問題を検出することにより前記測定標本の種類バリューを獲得するコスト函数算出モジュールと、を含む請求項1に記載の分類装置。
  3. 前記訓練標本は、所定の種類バリューを有している標注標本と、訓練過程において前記標注標本の種類バリューにより種類バリューを得る機器標注標本とを含む請求項1又は2に記載の分類装置。
  4. 前記確定ユニットが確定した目標標本の各集合に相関する訓練標本が前記機器標注標本である請求項3に記載の分類装置。
  5. 前記計算ユニットは、種類バリューが削除された訓練標本と目標標本を一緒に測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定する請求項3又は4に記載の分類装置。
  6. 新しい種類バリューを獲得した測定標本を次の分類過程中の機器標注標本とする標本更新ユニットをさらに含む請求項3乃至請求項5のいずれか1項に記載の分類装置。
  7. 前記確定ユニットは、前記目標標本の各集合により、前記集合の少なくとも1つの目標標本の間において、類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とするように配置される請求項1乃至請求項6のいずれか1項に記載の分類装置。
  8. 前記確定ユニットは、前記目標標本の各集合により、前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本との類似性が第三所定閾値より大きい訓練標本たちを前記集合に相関する訓練標本とするように配置される請求項3に記載の分類装置。
  9. 分類方法において、
    目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するステップと、
    前記目標標本の各集合に相関する各訓練標本を確定し、且つ前記訓練標本中の各訓練標本は、いずれも種類バリューを有しているステップと、
    前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するステップと、
    前記目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するステップと、を含む分類方法。
  10. 電子設備において、
    請求項1乃至請求項8のいずれか1項に記載の分類装置を含む電子設備。
JP2013193252A 2012-09-20 2013-09-18 分類装置、分類方法及び電子設備 Expired - Fee Related JP6179305B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210352239.6A CN103679190B (zh) 2012-09-20 2012-09-20 分类装置、分类方法以及电子设备
CN201210352239.6 2012-09-20

Publications (2)

Publication Number Publication Date
JP2014063494A true JP2014063494A (ja) 2014-04-10
JP6179305B2 JP6179305B2 (ja) 2017-08-16

Family

ID=50316678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013193252A Expired - Fee Related JP6179305B2 (ja) 2012-09-20 2013-09-18 分類装置、分類方法及び電子設備

Country Status (2)

Country Link
JP (1) JP6179305B2 (ja)
CN (1) CN103679190B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472274A (zh) * 2017-09-07 2019-03-15 富士通株式会社 深度学习分类模型的训练装置和方法
CN109840588A (zh) * 2019-01-04 2019-06-04 平安科技(深圳)有限公司 神经网络模型训练方法、装置、计算机设备及存储介质
CN112819020A (zh) * 2019-11-15 2021-05-18 富士通株式会社 训练分类模型的方法和装置及分类方法
CN113590812A (zh) * 2020-04-30 2021-11-02 阿里巴巴集团控股有限公司 垃圾文本训练样本的筛选方法及装置、电子设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105118332B (zh) * 2015-09-30 2018-01-23 中国民用航空总局第二研究所 一种基于聚类分析法的空中交通管制模拟仿真异常检测方法和装置
CN105916032A (zh) * 2015-12-08 2016-08-31 乐视网信息技术(北京)股份有限公司 视频推荐的方法及视频推荐的终端设备
CN108700872B (zh) * 2016-02-29 2021-08-06 三菱电机株式会社 机器分类装置
KR20180127649A (ko) * 2016-03-31 2018-11-29 비트데펜더 아이피알 매니지먼트 엘티디 자동 장치 탐지를 위한 시스템 및 방법
CN106228188B (zh) 2016-07-22 2020-09-08 北京市商汤科技开发有限公司 聚类方法、装置及电子设备
CN109478228A (zh) * 2016-09-30 2019-03-15 富士通株式会社 分类结果的融合方法、装置及电子设备
CN108133224B (zh) * 2016-12-01 2021-11-16 富士通株式会社 用于评估分类任务复杂度的方法
CN110866533B (zh) * 2018-08-27 2023-09-15 富士通株式会社 训练分类模型的装置和方法、以及分类装置和方法
CN112464966B (zh) * 2019-09-06 2024-07-02 富士通株式会社 鲁棒性估计方法、数据处理方法和信息处理设备
CN112906434A (zh) * 2019-12-03 2021-06-04 富士通株式会社 信息处理装置和信息处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110064A (ja) * 2007-10-26 2009-05-21 Toshiba Corp 分類モデル学習装置および分類モデル学習方法
JP2009282686A (ja) * 2008-05-21 2009-12-03 Toshiba Corp 分類モデル学習装置および分類モデル学習方法
WO2010016109A1 (ja) * 2008-08-05 2010-02-11 富士通株式会社 サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444796A (en) * 1993-10-18 1995-08-22 Bayer Corporation Method for unsupervised neural network classification with back propagation
US7076473B2 (en) * 2002-04-19 2006-07-11 Mitsubishi Electric Research Labs, Inc. Classification with boosted dyadic kernel discriminants
CN102637433B (zh) * 2011-02-09 2015-11-25 富士通株式会社 识别语音信号中所承载的情感状态的方法和系统
CN102147866B (zh) * 2011-04-20 2012-11-28 上海交通大学 基于训练自适应增强和支持矢量机的目标识别方法
CN102364498B (zh) * 2011-10-17 2013-11-20 江苏大学 一种基于多标签的图像识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110064A (ja) * 2007-10-26 2009-05-21 Toshiba Corp 分類モデル学習装置および分類モデル学習方法
JP2009282686A (ja) * 2008-05-21 2009-12-03 Toshiba Corp 分類モデル学習装置および分類モデル学習方法
WO2010016109A1 (ja) * 2008-08-05 2010-02-11 富士通株式会社 サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472274A (zh) * 2017-09-07 2019-03-15 富士通株式会社 深度学习分类模型的训练装置和方法
CN109472274B (zh) * 2017-09-07 2022-06-28 富士通株式会社 深度学习分类模型的训练装置和方法
CN109840588A (zh) * 2019-01-04 2019-06-04 平安科技(深圳)有限公司 神经网络模型训练方法、装置、计算机设备及存储介质
CN109840588B (zh) * 2019-01-04 2023-09-08 平安科技(深圳)有限公司 神经网络模型训练方法、装置、计算机设备及存储介质
CN112819020A (zh) * 2019-11-15 2021-05-18 富士通株式会社 训练分类模型的方法和装置及分类方法
CN113590812A (zh) * 2020-04-30 2021-11-02 阿里巴巴集团控股有限公司 垃圾文本训练样本的筛选方法及装置、电子设备
CN113590812B (zh) * 2020-04-30 2024-03-05 阿里巴巴集团控股有限公司 垃圾文本训练样本的筛选方法及装置、电子设备

Also Published As

Publication number Publication date
CN103679190B (zh) 2019-03-01
JP6179305B2 (ja) 2017-08-16
CN103679190A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
JP6179305B2 (ja) 分類装置、分類方法及び電子設備
CN112966712B (zh) 语言模型训练方法、装置、电子设备和计算机可读介质
CN111860573B (zh) 模型训练方法、图像类别检测方法、装置和电子设备
CN116596916B (zh) 缺陷检测模型的训练和缺陷检测方法及其装置
CN109376267B (zh) 用于生成模型的方法和装置
CN109447156B (zh) 用于生成模型的方法和装置
CN109145299A (zh) 一种文本相似度确定方法、装置、设备及存储介质
CN108052577A (zh) 一种通用文本内容挖掘方法、装置、服务器及存储介质
CN115861462B (zh) 图像生成模型的训练方法、装置、电子设备及存储介质
CN105373800A (zh) 分类方法及装置
CN112631902A (zh) 页面元素的测试方法、装置、电子设备及存储介质
CN112131884B (zh) 用于实体分类的方法和装置、用于实体呈现的方法和装置
CN110969200A (zh) 基于一致性负样本的图像目标检测模型训练方法及装置
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN101206727B (zh) 数据处理装置和数据处理方法
CN114549849A (zh) 图像识别方法、装置、计算机设备和存储介质
JP7174551B2 (ja) 推定装置、推定方法及び推定プログラム
CN112561569B (zh) 基于双模型的到店预测方法、系统、电子设备及存储介质
CN112052704A (zh) 用于检测时序动作的方法和装置
CN111126566B (zh) 基于gan模型的异常家具布局数据检测方法
CN115861684B (zh) 图像分类模型的训练方法、图像分类方法及装置
CN110516024A (zh) 地图搜索结果展现方法、装置、设备和存储介质
US10360509B2 (en) Apparatus and method for generating an optimal set of choices
CN116468479A (zh) 确定页面质量评估维度方法、页面质量的评估方法和装置
CN111124862B (zh) 智能设备性能测试方法、装置及智能设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170703

R150 Certificate of patent or registration of utility model

Ref document number: 6179305

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees