JP2018151959A - Determining apparatus, determining program and learning method - Google Patents
Determining apparatus, determining program and learning method Download PDFInfo
- Publication number
- JP2018151959A JP2018151959A JP2017048778A JP2017048778A JP2018151959A JP 2018151959 A JP2018151959 A JP 2018151959A JP 2017048778 A JP2017048778 A JP 2017048778A JP 2017048778 A JP2017048778 A JP 2017048778A JP 2018151959 A JP2018151959 A JP 2018151959A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- data
- state
- target
- requiring attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Manipulator (AREA)
Abstract
【課題】人工知能によって制御される対象の動作または状態が望ましくない結果をもたらす可能性のある動作または状態であるか否かを判定する。【解決手段】本発明の一態様によれば、判定装置は、取得部と、判定部とを含む。取得部は、学習用の人工知能に学習用の対象の動作または状態を制御させることを含む第1の機械学習を通じて得られた第1の学習結果が設定された第1の人工知能によって制御されている対象の動作または状態の観測結果を表す入力データを取得する。判定部は、入力データが、第1の機械学習が実行された期間における学習用の対象の動作または状態に基づいて定められる要注意動作または要注意状態を表すか否かを判定する。【選択図】 図1An object of the present invention is to determine whether an action or state of an object controlled by artificial intelligence is an action or state that may have undesirable consequences. According to one aspect of the present invention, a determination device includes an acquisition unit and a determination unit. The acquisition unit is controlled by the first artificial intelligence in which the first learning result obtained through the first machine learning including causing the learning artificial intelligence to control the operation or state of the learning target is set. Get input data representing the observation results of the motion or state of the target. The determination unit determines whether or not the input data represents an action requiring attention or a state requiring attention determined based on an action or state of a learning target in a period in which the first machine learning is executed. [Selection] Figure 1
Description
本発明は、人工知能の出力の妥当性を判定する技術に関する。 The present invention relates to a technique for determining the validity of an output of artificial intelligence.
人工知能に例えばデータを分類するなどの知的能力を獲得させるために、機械学習が行われる。例えば、特許文献1には、ニューラルネットワークを利用して、検査画像から被検査物の良否を判定する技法が開示されている。 Machine learning is performed to cause the artificial intelligence to acquire intellectual ability such as classifying data. For example, Patent Document 1 discloses a technique for determining pass / fail of an inspection object from an inspection image using a neural network.
対象の動作または状態を制御する能力(制御能力)を獲得することを目的に機械学習が行われることもある。かかる機械学習によって、人工知能は、例えば、ロボットハンド(またはピックアンドプレース装置)によりワークをつかんでA地点からB地点へ移動させて設置する、という動作を行わせる制御能力を獲得するかもしれない。これにより、人間がロボットハンドの制御プログラムを逐一コーディングしなくても、人工知能がロボットハンドにかかる動作を行わせることができる。 Machine learning may be performed for the purpose of acquiring the ability to control the motion or state of the object (control ability). By such machine learning, the artificial intelligence may acquire a control ability to perform an operation of, for example, grasping a work with a robot hand (or a pick-and-place device) and moving it from point A to point B. . Thereby, even if a human does not code the control program of a robot hand one by one, artificial intelligence can perform the operation concerning a robot hand.
しかしながら、機械学習によって獲得された制御能力が常に望ましい結果をもたらすとは限らない。すなわち、対象は、例えば暴走などの不具合により、意図しない動作(例えば衝突などの危険な動作)を行ったり、意図しない状態(例えば推奨温度範囲を超えた高温などの危険な状態)に陥ったりする可能性がある。 However, the control capability acquired by machine learning does not always produce desirable results. That is, the target may perform an unintended operation (for example, a dangerous operation such as a collision) due to a malfunction such as runaway, or may fall into an unintended state (for example, a dangerous state such as a high temperature exceeding the recommended temperature range). there is a possibility.
一般論として、望ましくない結果をもたらすような対象の動作または状態の全てを設計者が事前に網羅的に定義して判定プログラムをコーディングすることは事実上不可能である。特に、人工知能に対象の動作または状態を制御させる場合には、その人工知能で制御される内容が人間のプログラマにとって予想できないため、人間のプログラマには判定プログラムをコーディングすることができない。 In general, it is virtually impossible for a designer to code a decision program with an exhaustive definition of all the actions or states of interest that produce undesirable results. In particular, when the artificial intelligence is made to control the operation or state of the object, the contents controlled by the artificial intelligence cannot be predicted by the human programmer, and therefore the determination program cannot be coded by the human programmer.
特許文献2には、ニューラルネットワークの入力ノード値が学習データの入力ノード値に一致若しくは類似であるか否かにより、当該ニューラルネットワークの出力ノード値の確からしさを評価する技法が開示されている。本文献ではニューラルネットワークへの入力が学習に用いられたデータなのか、未学習のデータなのかに応じて、出力の確からしさを評価している。しかし、学習時に用いられたデータが入力されれば、ニューラルネットワークの出力により制御される対象が望ましい結果をもたらすとは限らない。 Patent Document 2 discloses a technique for evaluating the likelihood of an output node value of a neural network based on whether or not the input node value of the neural network matches or is similar to the input node value of learning data. In this document, the probability of output is evaluated depending on whether the input to the neural network is data used for learning or unlearned data. However, if the data used at the time of learning is input, the target controlled by the output of the neural network does not always give a desirable result.
本発明は、人工知能によって制御される対象の動作または状態が望ましくない結果をもたらす可能性のある動作または状態であるか否かを判定することを目的とする。 It is an object of the present invention to determine whether an action or state of an object controlled by artificial intelligence is an action or state that can have undesirable consequences.
本発明の第1の態様によれば、判定装置は、取得部と、判定部とを含む。取得部は、学習用の人工知能に学習用の対象の動作または状態を制御させることを含む第1の機械学習を通じて得られた第1の学習結果が設定された第1の人工知能によって制御されている対象の動作または状態の観測結果を表す入力データを取得する。判定部は、入力データが、第1の機械学習が実行された期間における学習用の対象の動作または状態に基づいて定められる要注意動作または要注意状態を表すか否かを判定する。故に、この態様によれば、対象の動作または状態の観測結果から望ましくない結果の発生を判定することができる。 According to the first aspect of the present invention, the determination device includes an acquisition unit and a determination unit. The acquisition unit is controlled by the first artificial intelligence in which the first learning result obtained through the first machine learning including causing the learning artificial intelligence to control the operation or state of the learning target is set. Get input data representing the observation results of the motion or state of the target. The determination unit determines whether or not the input data represents an action requiring attention or a state requiring attention determined based on an action or state of a learning target in a period in which the first machine learning is executed. Therefore, according to this aspect, generation | occurrence | production of an undesirable result can be determined from the observation result of operation | movement or a state of object.
本発明の第2の態様によれば、判定部は、第1の機械学習が実行された期間における学習用の対象の動作または状態の観測結果を表す観測データを学習データとして用いる第2の機械学習を通じて得られた第2の学習結果を利用して、入力データが要注意動作または要注意状態を表すか否かを判定する。故に、この態様によれば、望ましくない結果の発生を予測するために機械学習の学習結果を利用することができる。 According to the second aspect of the present invention, the determination unit uses the observation data representing the observation result of the learning operation or state as the learning data in the period in which the first machine learning is executed. Using the second learning result obtained through learning, it is determined whether or not the input data represents an action requiring attention or a condition requiring attention. Therefore, according to this aspect, the learning result of machine learning can be used to predict the occurrence of an undesirable result.
本発明の第3の態様によれば、判定部は、第2の学習結果が設定された第2の人工知能に、入力データを与え、入力データが要注意動作または要注意状態を表すか否かを判定させる。故に、この態様によれば、人工知能に、対象の動作または状態の観測結果から望ましくない結果の発生を予測させることができる。 According to the third aspect of the present invention, the determination unit gives input data to the second artificial intelligence in which the second learning result is set, and whether or not the input data represents the action requiring attention or the condition requiring attention. To determine. Therefore, according to this aspect, it is possible to cause the artificial intelligence to predict the occurrence of an undesirable result from the observation result of the motion or state of the target.
本発明の第4の態様によれば、判定装置は、入力データが要注意動作または要注意状態を表す場合に警報を発する警報部をさらに含む。故に、この態様によれば、望ましくない結果の発生が予測される場合に警報を発することができる。 According to the fourth aspect of the present invention, the determination device further includes an alarm unit that issues an alarm when the input data represents a cautionary action or a cautionary state. Therefore, according to this aspect, an alarm can be issued when an undesirable result is predicted.
本発明の第5の態様によれば、判定装置は、入力データが要注意動作または要注意状態を表す場合に対象の動作または状態への制御に介入する介入部をさらに含む。故に、この態様によれば、望ましくない結果の発生が予測される場合に対象の動作または状態への制御に介入することができる。 According to the fifth aspect of the present invention, the determination apparatus further includes an intervention unit that intervenes in the control to the target action or state when the input data represents the action requiring attention or the condition requiring attention. Thus, according to this aspect, it is possible to intervene in the control of a subject's action or state when occurrence of an undesirable result is predicted.
本発明の第6の態様によれば、学習方法は、学習用の人工知能に学習用の対象の動作または状態を制御させることを含む第1の機械学習を通じて得られた第1の学習結果が設定された第1の人工知能によって制御されている対象の動作または状態の観測結果を表す入力データを取得することを含む。さらに、学習方法は、入力データが第1の学習データに基づいて定められる要注意動作または要注意状態を表すか否かを第2の学習用の人工知能に判定させることを含む第2の機械学習を行うことを含む。この態様によれば、対象の動作または状態の観測結果から望ましくない結果の発生を予測するための機械学習を行うことができる。 According to the sixth aspect of the present invention, in the learning method, the first learning result obtained through the first machine learning including causing the learning artificial intelligence to control the operation or state of the learning target is obtained. Obtaining input data representing observation results of the motion or state of the object controlled by the set first artificial intelligence. Further, the learning method includes causing the second learning artificial intelligence to determine whether or not the input data represents an action requiring attention or a condition requiring attention determined based on the first learning data. Including learning. According to this aspect, it is possible to perform machine learning for predicting the occurrence of an undesirable result from the observation result of the target action or state.
本発明の第7の態様によれば、第1の観測データは、第1の機械学習が実行された期間のうち第1の学習用の人工知能の学習到達度が閾値以下である期間における学習用の対象の動作または状態の観測結果を表す。故に、この態様によれば、望ましくない結果をもたらす可能性の高い動作または状態に基づいて、要注意動作および要注意状態に該当する動作または状態を学習することができる。 According to the seventh aspect of the present invention, the first observation data is learned during a period in which the learning achievement degree of the first learning artificial intelligence is equal to or less than a threshold in the period in which the first machine learning is executed. Represents the observation result of the motion or state of the target. Therefore, according to this aspect, it is possible to learn the action requiring attention and the action or condition corresponding to the condition requiring attention based on the action or the state having a high possibility of causing an undesirable result.
本発明の第8の態様によれば、第1の観測データは、第1の機械学習の完了後の第1の学習用の人工知能または第1の機械学習を通じて得られた第1の学習結果が設定された第1の人工知能によって制御されている対象の動作または状態の観測結果を表す第2の観測データに一致しない第3の観測データを含む。また、第1の学習データは、第3の観測データに基づいて作成される。故に、この態様によれば、高い確率で適切であると推測される動作または状態を除外して、要注意動作および要注意状態に該当する動作または状態を学習することができる。 According to the eighth aspect of the present invention, the first observation data is the first learning result obtained through the first learning artificial intelligence or the first machine learning after the completion of the first machine learning. Includes third observation data that does not coincide with the second observation data representing the observation result of the action or state of the target controlled by the first artificial intelligence set. The first learning data is created based on the third observation data. Therefore, according to this aspect, it is possible to learn the action or state corresponding to the action requiring attention and the condition requiring attention, excluding the action or state estimated to be appropriate with high probability.
本発明の第9の態様によれば、第2の機械学習は、第1の学習データと第2の観測データに基づいて作成された第2の学習データとを用いて行われる。第1の学習データは、第3の観測データが要注意動作または要注意状態に該当することを示す第1の教師データを含む。第2の学習データは、第2の観測データが要注意動作または要注意状態に該当しないことを示す第2の教師データを含む。故に、この態様によれば、要注意動作または要注意状態に該当する動作または状態をより正確に学習することができる。 According to the ninth aspect of the present invention, the second machine learning is performed using the first learning data and the second learning data created based on the second observation data. The first learning data includes first teacher data indicating that the third observation data corresponds to the action requiring attention or the condition requiring attention. The second learning data includes second teacher data indicating that the second observation data does not correspond to the action requiring attention or the condition requiring attention. Therefore, according to this aspect, it is possible to learn more accurately the action or state corresponding to the action requiring attention or the condition requiring attention.
本発明によれば、人工知能によって制御される対象の動作または状態が望ましくない結果をもたらす可能性のある動作または状態であるか否かを判定することができる。 In accordance with the present invention, it is possible to determine whether an action or state of an object controlled by artificial intelligence is an action or state that may have undesirable results.
以下、図面を参照しながら実施形態の説明を述べる。なお、以降、説明済みの要素と同一または類似の要素には同一または類似の符号を付し、重複する説明については基本的に省略する。 Hereinafter, embodiments will be described with reference to the drawings. Hereinafter, elements that are the same as or similar to elements already described are denoted by the same or similar reference numerals, and redundant descriptions are basically omitted.
(第1の実施形態)
図1に例示されるように、第1の実施形態に係る判定装置100は、取得部101と、判定部102と、警報部104と、介入部105と、記憶部106とを含む。判定装置100は、後述される対象の動作または状態の観測結果を表す入力データを取得する。ここで、対象とは、直接的な制御対象に限られず、当該直接的な制御対象の動作または状態によって影響を受ける間接的な制御対象を含み得る。例えば、対象は、ロボットハンドと、当該ロボットハンドによってつかまれるワークとを含み得る。また、動作または状態とは、動作および状態の一方または両方を含み得る。動作および状態は、明確に区別されなくてよい。
(First embodiment)
As illustrated in FIG. 1, the determination apparatus 100 according to the first embodiment includes an acquisition unit 101, a determination unit 102, an alarm unit 104, an intervention unit 105, and a storage unit 106. The determination apparatus 100 acquires input data representing observation results of a target operation or state described later. Here, the target is not limited to a direct control target, and may include an indirect control target that is affected by the operation or state of the direct control target. For example, the object may include a robot hand and a work that is grasped by the robot hand. Also, an operation or state can include one or both of the operation and the state. Operations and states may not be clearly distinguished.
判定装置100は、この入力データが、後述される要注意動作または要注意状態を表すか否かを判定する。さらに、判定装置100は、入力データが要注意動作または要注意状態を表す場合に警報を発したり、対象の動作または状態への制御に介入したりしてもよい。 The determination apparatus 100 determines whether or not the input data represents a caution operation or a caution state described later. Furthermore, the determination apparatus 100 may issue an alarm when the input data indicates a cautionary action or a cautionary state, or may intervene in control of the target action or state.
取得部101は、例えば、外部装置と接続するためのインタフェース(例えば、入力ポート、通信ポート)であり、接続する外部装置に応じて適宜構成され得る。取得部101は、入力データを取得する。取得部101は、入力データをそのまま判定部102へ送ってもよいし、必要な加工(データ形式の変換など)を行ってから判定部102へ送ってもよい。 The acquisition unit 101 is, for example, an interface (for example, an input port or a communication port) for connecting to an external device, and can be appropriately configured according to the external device to be connected. The acquisition unit 101 acquires input data. The acquisition unit 101 may send the input data to the determination unit 102 as it is, or may send the input data to the determination unit 102 after performing necessary processing (such as data format conversion).
入力データは、後述される人工知能によって制御されている対象の動作または状態の観測結果を表す。対象は、産業用、手術用、エンターテイメント用若しくはその他のロボット、化学プラント、自動車若しくはその他の機械用のエンジン、ネブライザなどの治療器、ビルの空調システム、などの制御可能な種々の装置であり得る。そして、入力データは、例えば対象がロボットハンドの場合、ロボットハンドの動きの軌跡やモータの動き、モータへの印加電流値などでの観測に基づいて得られる。また、例えば対象が化学プラントの場合、反応槽の中での燃焼若しくは他の化学反応の状態(例えば、対象またはその周囲の温度、湿度)などの観測に基づいて得られる。また、例えば対象が自動車若しくはその他の機械用のエンジンの場合、自動車やエンジン自体の動作情報や、エンジンの回転数、供給する燃料の量、燃焼の温度などでの観測に基づいて得られる。また、例えば対象がネブライザの場合、振動子の振動数などでの観測に基づいて得られる。また、例えば対象がビルの空調システムの場合、消費電力などの観測に基づいて得られてよい。 The input data represents the observation result of the operation or state of the object controlled by the artificial intelligence described later. The subject can be a variety of controllable devices such as industrial, surgical, entertainment or other robots, chemical plants, engines for cars or other machinery, therapeutic devices such as nebulizers, building air conditioning systems, etc. . Then, for example, when the target is a robot hand, the input data is obtained based on observations of the locus of movement of the robot hand, the movement of the motor, the value of current applied to the motor, and the like. For example, when the target is a chemical plant, it is obtained based on observation of the state of combustion or other chemical reaction in the reaction tank (for example, the temperature of the target or its surroundings, humidity). In addition, for example, when the target is an engine for an automobile or other machine, it is obtained based on observations of operation information of the automobile or the engine itself, the number of revolutions of the engine, the amount of fuel to be supplied, the temperature of combustion, and the like. Further, for example, when the target is a nebulizer, it is obtained based on the observation with the vibration frequency of the vibrator. Further, for example, when the target is a building air conditioning system, it may be obtained based on observation of power consumption or the like.
対象の動作または状態の観測には、例えばイメージセンサ(カメラ)、マイクロホン、回転数センサ、加速度センサ、角速度センサ、電流センサ、温度センサ、湿度センサ、振動センサ、騒音センサ、動作時間センサ、消費電力センサなどの種々のセンサを用いることができる。取得部101は、かかるセンサなどの観測装置から直接的に入力データを取得してもよいし、かかる観測装置によって図示されないストレージに格納された入力データを取得してもよい。 For observation of the movement or state of the object, for example, an image sensor (camera), microphone, rotation speed sensor, acceleration sensor, angular velocity sensor, current sensor, temperature sensor, humidity sensor, vibration sensor, noise sensor, operation time sensor, power consumption Various sensors such as sensors can be used. The acquisition unit 101 may acquire input data directly from an observation device such as the sensor, or may acquire input data stored in a storage (not shown) by the observation device.
観測対象となる動作または状態は、望ましくない結果をもたらすおそれがあるか否かの判定に用いることができるものを選択してよい。例えば、予め定められた耐用温度、耐用電流若しくは耐用電圧を超えた範囲で対象が稼働することになるおそれがあるか否かを判定する場合には、対象またはその周囲の温度、対象に印加される電流若しくは電圧などを観測すればよい。 The action or state to be observed may be selected that can be used to determine whether there is a risk of undesirable results. For example, when it is determined whether there is a possibility that the target will operate in a range exceeding a predetermined durable temperature, durable current, or durable voltage, the temperature is applied to the subject or its surrounding temperature and the subject. Current or voltage may be observed.
判定部102は、例えば、ハードウェアプロセッサであるCPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを含み得る。具体的には、CPUは、記憶部106に格納されたプログラムをRAMに展開する。そして、CPUがかかるプログラムを解釈および実行することで、判定部102は以下に説明する動作(情報処理)を行う。 The determination unit 102 may include, for example, a CPU (Central Processing Unit) that is a hardware processor, a RAM (Random Access Memory), a ROM (Read Only Memory), and the like. Specifically, the CPU expands the program stored in the storage unit 106 in the RAM. Then, when the CPU interprets and executes the program, the determination unit 102 performs an operation (information processing) described below.
判定部102は、取得部101から入力データを受け取り、当該入力データが要注意動作または要注意状態を表すか否かを判定する。判定部102は、判定結果を警報部104および介入部105に通知する。 The determination unit 102 receives input data from the acquisition unit 101, and determines whether or not the input data represents an action requiring attention or a state requiring attention. The determination unit 102 notifies the alarm unit 104 and the intervention unit 105 of the determination result.
要注意動作または要注意状態は、対象の動作または状態を制御する能力(制御能力)を獲得するための機械学習が実行された期間における学習用の対象の動作または状態に基づいて定められる。ここで、この機械学習は、学習用の人工知能にこの学習用の対象の動作または状態を制御させることを含む。 The action requiring attention or the condition requiring attention is determined based on the action or state of the object for learning in the period in which the machine learning for acquiring the ability to control the action or state of the object (control ability) is executed. Here, the machine learning includes causing the learning artificial intelligence to control the operation or state of the learning target.
なお、学習用の人工知能は、対象を実際に制御する(すなわち、運用時に使用される)人工知能と同一であってもよいし、異なっていてもよい。対象を実際に制御する人工知能は、この機械学習を通じて得られた学習結果が設定されていればよい。 Note that the artificial intelligence for learning may be the same as or different from the artificial intelligence that actually controls the object (that is, used during operation). The artificial intelligence that actually controls the object only needs to have a learning result obtained through this machine learning.
学習用の対象は、人工知能によってその動作または状態が実際に制御される(すなわち、運用時に使用される)対象と同一であってもよいし、異なっていてもよい。具体的には、学習用の対象は、実際に制御される対象と同種の実機であってもよいし、シミュレーションモデルであってもよい。すなわち、機械学習は、シミュレーション上で実行されてもよい。 The target for learning may be the same as or different from the target whose operation or state is actually controlled by artificial intelligence (that is, used during operation). Specifically, the learning target may be a real machine of the same type as the target that is actually controlled, or may be a simulation model. That is, machine learning may be executed on a simulation.
一般的に、機械学習時に学習用の対象が危険な動作を行ったり危険な状態に陥ったりする可能性が高く、かつ、それによって生じ得る損害が大きいと予想される場合には、機械学習をシミュレーション上で実行することが好ましい。他方、危険な動作に対する安全上の措置(例えば、ロボットハンドの可動範囲内に当該ロボットハンドの操作に関係のない人または物が入らないように使用環境を整える)がとられている場合、学習用の対象の故障、破損などの可能性が低い場合などには、実機を用いて機械学習が行われ得る。また、対象若しくはその使用環境に個体差があり、対象毎に精密な制御を行う必要がある場合には、学習用の対象として使用された実機がそのまま運用時にも転用され得る。 In general, if it is highly likely that the learning target will perform a dangerous motion or fall into a dangerous state during machine learning, and the damage that can be caused by it is expected to be large, machine learning should be performed. It is preferable to execute it on a simulation. On the other hand, learning is performed when safety measures are taken against dangerous movements (for example, the environment of use is adjusted so that persons or objects unrelated to the operation of the robot hand do not enter the movable range of the robot hand). When there is a low possibility of failure or breakage of a target for use, machine learning can be performed using an actual machine. In addition, when there is an individual difference in the target or its use environment, and it is necessary to perform precise control for each target, an actual machine used as a learning target can be diverted as it is during operation.
制御能力を獲得するための機械学習は典型的には強化学習に相当し、その実行中(特に初期段階)に学習用の対象はでたらめに決定された制御値を与えられ、危険な動作(例えば、ロボットハンドが可動範囲ぎりぎりまで使って動く)を含めて様々な動作を行ったり、危険な状態を含めて様々な状態に陥ったりする。 Machine learning to acquire control ability typically corresponds to reinforcement learning, and during execution (particularly in the initial stage), the learning target is given a randomly determined control value, and dangerous actions (for example, The robot hand moves to the limit of the range of motion), or it falls into various states including dangerous states.
学習用の人工知能は、次第に、望ましくない結果をもたらすような動作または状態を避け、望ましい結果をもたらすような動作または状態を指向するように学習していく。故に、機械学習が実行される期間(特に初期段階)における学習用の対象の動作または状態を観測すれば、望ましくない結果をもたらすような対象の要注意動作または要注意状態を把握することができる。 Artificial intelligence for learning gradually learns to avoid actions or states that produce undesirable results and to direct actions or states that produce desirable results. Therefore, by observing the movement or state of the object for learning during the period during which machine learning is executed (especially in the initial stage), it is possible to grasp the cautionary action or the state of caution that causes an undesirable result. .
なお、観測対象となる動作または状態は、人間(判定装置の設計者または運用者)が予め選択しておいてもよい。この場合には、不必要なデータを観測する手間を省くことができる。或いは、機械学習が実行される期間には可能な限り多種多様な動作または状態を観測し、事後的に人間またはソフトウェア(人工知能を含み得る)が要注意動作および要注意状態を定めるために用いる動作または状態を選択してもよい。この場合には、要注意動作および要注意状態の取りこぼしを減らすことができる。 The operation or state to be observed may be selected in advance by a human (designer or operator of the determination apparatus). In this case, the trouble of observing unnecessary data can be saved. Or, as long as machine learning is performed, observe as many different movements or states as possible, and later used by humans or software (which may include artificial intelligence) to determine the actions and conditions that require attention. An action or state may be selected. In this case, it is possible to reduce the cautionary action and missed attention state.
判定部102は、人工知能を利用して判定を行ってもよい。具体的には、判定部102は、入力データが要注意動作または要注意状態を表すか否かを判定する能力(判定能力)を獲得済みのAI(Artificial Intelligence)103に、入力データを与えて判定をさせてもよい。AI103および後述される他のAIは、例えばGPU(Graphics Processing Unit)などのプロセッサが、RAMに展開されたプログラムを実行することで実現される。 The determination unit 102 may perform determination using artificial intelligence. Specifically, the determination unit 102 gives input data to an AI (Artificial Intelligence) 103 that has acquired the ability (determination ability) to determine whether or not the input data represents an action requiring attention or a state requiring attention. You may make a judgment. The AI 103 and other AI described later are realized by a processor such as a GPU (Graphics Processing Unit) executing a program expanded in the RAM.
或いは、判定部102は、機械学習が実行された期間(特に初期段階)における学習用の対象の動作または状態の観測結果を表す観測データに、入力データ(これは、人工知能によって実際に制御されている対象の動作または状態の観測結果を表すデータである)が一致するか否かにより判定を行ってもよい。 Alternatively, the determination unit 102 converts the input data (which is actually controlled by artificial intelligence) into observation data representing the observation result of the operation or state of the learning target in the period (particularly the initial stage) in which machine learning is executed. Determination may be made based on whether or not there is a match.
AI 103は、例えば深層ニューラルネットワークであってよい。AI 103は、判定能力を獲得するための機械学習(例えばディープラーニング)を通じて得られた学習パラメータ(例えば、ニューラルネットワーク内のユニットのバイアス、ユニット間のエッジの重みなど)を持つ学習モデルを設定される。この機械学習の詳細は、図3を用いて後述される。 The AI 103 may be a deep neural network, for example. The AI 103 is set with a learning model having learning parameters (for example, unit bias in the neural network, edge weights between units, etc.) obtained through machine learning (for example, deep learning) to acquire determination ability. The Details of the machine learning will be described later with reference to FIG.
このように、判定部102は、人工知能によって実際に制御されている対象の動作または状態の観測結果が要注意動作または要注意状態を表すか否か判定する。故に、この判定部102は、図6に示すように、対象210を制御する人工知能201が実際に活用される場面において、人工知能201からの出力を監視し、当該出力が要注意動作または要注意状態を引き起こすか否か判定することができる。さらに、判定結果に応じて、警報部104および介入部105が後述する処理を行う。 As described above, the determination unit 102 determines whether or not the observation result of the action or state of the target that is actually controlled by the artificial intelligence represents the action requiring attention or the condition requiring attention. Therefore, as shown in FIG. 6, the determination unit 102 monitors the output from the artificial intelligence 201 in a scene where the artificial intelligence 201 that controls the object 210 is actually used, and the output is a cautionary action or necessary. It can be determined whether or not an attention state is caused. Further, the alarm unit 104 and the intervention unit 105 perform processing to be described later according to the determination result.
警報部104は、例えば、ブザー、スピーカーなどの警報装置であってもよいし、外部の警報装置に接続するためのインタフェースであってもよい。判定部102から判定結果を通知される。警報部104は、入力データが要注意動作または要注意状態を表すという判定結果を通知された場合には、警報を発する。警報は、例えば、人間(対象の使用者、管理者など)に対して対象の動作または状態に問題があることを画像、光、音などを用いて視覚的または聴覚的に報知することであってもよいし、対象またはそれを直接的若しくは間接的に制御する制御装置(人工知能、人工知能からの制御値に基づいて対象の制御信号を生成する装置など)に対して当該対象の動作または状態に問題があることを報知することであってもよい。具体的には、警報部104は、メーターパネル上のアイコンを点灯させたり、対象を制御しているAIの再学習を促したりしてもよい。警告を受けた人間、または、対象若しくはその制御装置は、対象の制御を停止若しくはリセットしたり、対象の動作または状態への制御を人間または別の制御装置(例えば、人手でコーディングされた制御プログラムを実行する制御装置)に委ねたり、AIの再学習を行ったりすることで、望ましくない結果を回避することができる。 The alarm unit 104 may be an alarm device such as a buzzer or a speaker, or may be an interface for connecting to an external alarm device. A determination result is notified from the determination unit 102. The alarm unit 104 issues an alarm when notified of the determination result that the input data represents an action requiring attention or a condition requiring attention. The alarm is, for example, to visually or auditorily notify a human (target user, administrator, etc.) that there is a problem with the operation or state of the target using an image, light, sound, or the like. Or the operation of the target with respect to the target or a control device that directly or indirectly controls the target (artificial intelligence, a device that generates a control signal of the target based on a control value from the artificial intelligence) You may notify that there is a problem in a state. Specifically, the alarm unit 104 may turn on an icon on the meter panel or prompt the relearning of the AI that is controlling the target. The person who received the warning, or the object or its control device, stops or resets the control of the object, or controls the operation or state of the object by a human or another control device (eg, a manually coded control program). Undesired results can be avoided by entrusting the control device to the control device) or re-learning the AI.
介入部105は、例えば、ハードウェアプロセッサであるCPU、RAM、ROMなどを含み得る。具体的には、CPUは、記憶部106または他の記憶部(例えば介入部105に内蔵された図示しない記憶部)に格納されたプログラムをRAMに展開する。そして、CPUがかかるプログラムを解釈および実行することで、介入部105は以下に説明する動作(情報処理)を行う。かかるプログラムは、例えば、判定部102のCPUから入力データが要注意動作または要注意状態を表すという判定結果を示す信号を受け取り、対象210の制御に介入するための信号(例えば、対象210を緊急停止させる信号)を出力するための命令が記述され得る。 The intervention unit 105 can include, for example, a CPU, RAM, ROM, etc., which are hardware processors. Specifically, the CPU expands a program stored in the storage unit 106 or another storage unit (for example, a storage unit (not shown) built in the intervention unit 105) in the RAM. When the CPU interprets and executes the program, the intervention unit 105 performs an operation (information processing) described below. Such a program receives, for example, a signal indicating a determination result that the input data represents a cautionary action or a cautionary state from the CPU of the determination unit 102, and a signal for intervening in the control of the target 210 (for example, the target 210 An instruction for outputting a signal to stop) may be described.
介入部105は、判定部102から判定結果を通知される。介入部105は、入力データが要注意動作または要注意状態を表すという判定結果を通知された場合には、対象の動作または状態への制御に介入する。介入は、例えば、対象の動作または状態への制御を停止若しくはリセットすることであってもよいし、対象の動作または状態への制御を人間または別の制御装置(例えば、人手でコーディングされた制御プログラムを実行する制御装置)に委ねることであってもよい。 The intervention unit 105 is notified of the determination result from the determination unit 102. When the intervention unit 105 is notified of the determination result that the input data represents the action requiring attention or the condition requiring attention, the intervention unit 105 intervenes in the control to the target action or state. Intervention may be, for example, stopping or resetting control to a subject's action or state, and transferring control to the subject's action or state to a human or another control device (eg, manually coded control). It may be left to a control device that executes the program.
なお、警報部104による警報および介入部105による介入は、段階的に行われてもよい。具体的には、要注意動作または要注意状態がもたらす結果(例えば前述の報酬の低さ)に応じて、当該要注意動作または要注意状態のリスクが評価されてよい。そして、リスクの低い要注意動作または要注意状態が発見された場合には拘束力の弱い警報および介入が行われ、リスクの高い要注意動作または要注意状態が発見された場合には拘束力の強い警報および介入が行われてよい。 The alarm by the alarm unit 104 and the intervention by the intervention unit 105 may be performed in stages. Specifically, the risk of the action requiring attention or the condition requiring attention may be evaluated in accordance with the result of the action requiring attention or the condition requiring attention (for example, the aforementioned low reward). If a low-risk action or condition requiring attention is detected, a low-restraint alarm and intervention are performed, and if a high-risk action or condition requiring attention is detected, the restraint action is detected. Strong alerts and interventions may be performed.
警報部104は、判定装置100から削除されてもよい。具体的に、警報部104は、対象または他の装置に組み込まれてもよいし、全く存在しなくてもよい。同様に、介入部105は、判定装置100から削除されてもよい。具体的に、介入部105は、対象または他の装置に組み込まれてもよいし、全く存在しなくてもよい。 The alarm unit 104 may be deleted from the determination apparatus 100. Specifically, the alarm unit 104 may be incorporated in the target or other device, or may not exist at all. Similarly, the intervention unit 105 may be deleted from the determination apparatus 100. Specifically, the intervention unit 105 may be incorporated in the target or other device, or may not exist at all.
記憶部106は、例えば、ハードディスクドライブ(HDD:Hard Disk Drive)、ソリッドステートドライブ(SSD:Solid State Drive)などを含み得る。記憶部106には、例えば、判定部102のCPUによって実行されるプログラムを格納する。かかるプログラムは、必要に応じて、判定部102のCPUによって読み出され、判定部102のRAMに展開され、当該CPUによって実行される。さらに、記憶部106は、介入部105のCPUによって実行されるプログラムを格納してもよい。 The storage unit 106 may include, for example, a hard disk drive (HDD: Hard Disk Drive), a solid state drive (SSD), and the like. For example, the storage unit 106 stores a program executed by the CPU of the determination unit 102. Such a program is read by the CPU of the determination unit 102 as necessary, is expanded in the RAM of the determination unit 102, and is executed by the CPU. Further, the storage unit 106 may store a program executed by the CPU of the intervention unit 105.
図1の判定装置100は、例えば図2に示される制御システムに組み込まれ得る。図2の制御システムは、制御装置200と、対象210と、観測装置220と、判定装置100とを含む。 The determination apparatus 100 of FIG. 1 can be incorporated into the control system shown in FIG. 2, for example. The control system of FIG. 2 includes a control device 200, a target 210, an observation device 220, and a determination device 100.
制御装置200は、対象210の動作または状態を制御するための制御値を入力データに基づいて生成する。入力データは、例えば、画像、温度などの対象の動作または状態を制御するために参照され得る情報を表す。制御装置200は、この制御値を出力データとして対象210に送る。制御装置200は、例えば、対象210がエンジンである場合には、エンジン制御用のECU(Electronic Control Unit)などであってよい。また、制御装置200は、例えば、対象210がロボットハンドである場合には、ロボットハンド制御用のコントローラなどであってよい。制御装置200は、対象210に対する制御能力を獲得するための機械学習を通じて得られた学習結果が設定されたAI 201に入力データを与え、出力データを得る。 The control device 200 generates a control value for controlling the operation or state of the target 210 based on the input data. The input data represents information that can be referenced to control the operation or state of the object, such as, for example, an image, temperature. The control device 200 sends this control value to the target 210 as output data. For example, when the target 210 is an engine, the control device 200 may be an engine control ECU (Electronic Control Unit). The control device 200 may be, for example, a controller for controlling a robot hand when the target 210 is a robot hand. The control device 200 gives input data to the AI 201 in which a learning result obtained through machine learning for acquiring control ability for the object 210 is set, and obtains output data.
対象210は、制御装置200から制御値を受け取り、これに応答する。例えば、対象210は、燃料を噴射したり、クランク軸の回転数を変更したり、空調の設定温度を変更したり、モータを駆動してロボットハンドを動かしたりする。対象210の動作または状態は、観測装置220によって観測される。 The target 210 receives a control value from the control device 200 and responds to it. For example, the target 210 injects fuel, changes the rotation speed of the crankshaft, changes the set temperature of the air conditioning, or drives the motor to move the robot hand. The operation or state of the object 210 is observed by the observation device 220.
観測装置220は、例えば、イメージセンサ(カメラ)、マイクロホン、回転数センサ、加速度センサ、角速度センサ、電流センサ、温度センサ、湿度センサ、振動センサ、騒音センサ、動作時間センサ、消費電力センサなどの種々のセンサを含むことができる。観測装置220は、対象210の動作または状態を観測し、観測データを生成する。観測装置220は、観測データを入力データとして判定装置100に送る。 The observation device 220 includes various types such as an image sensor (camera), a microphone, a rotation speed sensor, an acceleration sensor, an angular velocity sensor, a current sensor, a temperature sensor, a humidity sensor, a vibration sensor, a noise sensor, an operation time sensor, and a power consumption sensor. Can be included. The observation device 220 observes the operation or state of the object 210 and generates observation data. The observation device 220 sends observation data to the determination device 100 as input data.
判定装置100は、観測装置220から入力データを受け取り、当該入力データが要注意動作または要注意状態を表すか否かを判定する。判定装置100は、判定結果に基づいて、制御装置200または図示されない人間若しくは他の制御装置に警告を発したり、対象210の動作または状態への制御に介入したりしてもよい。判定装置100は、対象210とは独立した装置であってもよいし、対象210に組み込まれていてもよい。また、判定装置100は、制御装置200とは独立した装置であってもよいし、制御装置200に組み込まれていてもよい。 The determination apparatus 100 receives input data from the observation apparatus 220, and determines whether or not the input data represents an action requiring attention or a condition requiring attention. The determination device 100 may issue a warning to the control device 200 or a human or other control device (not shown) based on the determination result, or may intervene in the control of the operation or the state of the target 210. The determination device 100 may be a device independent of the target 210 or may be incorporated in the target 210. Further, the determination device 100 may be a device independent of the control device 200, or may be incorporated in the control device 200.
図3には、制御能力を獲得するための機械学習(強化学習)および判定能力を獲得するための機械学習(教師あり学習)をそれぞれ実施する機械学習システムが例示される。これら機械学習では、学習データベース装置310に格納されている学習データが用いられる。なお、これら機械学習では、学習データベース装置310に格納されている図示されないテストデータが学習到達度の評価のために用いられてもよい。また、制御能力を獲得するための機械学習に用いられる学習データ(制御能力学習データ)と、判定能力を獲得するための機械学習に用いられる学習データ(判定能力学習データ)とは、異なる学習データベース装置に格納されていてもよい。 FIG. 3 illustrates a machine learning system that performs machine learning (reinforcement learning) for acquiring control capability and machine learning (supervised learning) for acquiring determination capability. In these machine learning, learning data stored in the learning database device 310 is used. In these machine learnings, test data (not shown) stored in the learning database device 310 may be used for evaluation of learning achievement. Further, learning data used for machine learning for obtaining control ability (control ability learning data) and learning data used for machine learning for obtaining judgment ability (determination ability learning data) are different learning databases. It may be stored in the device.
第1の学習データ作成装置300は、学習用のAI 321に与えられる入力データに相当する制御能力学習データを作成し、学習データベース装置310に格納する。入力データは、例えば、画像、温度などの対象の動作または状態を制御するために参照され得る情報を表す。 The first learning data creation device 300 creates control ability learning data corresponding to the input data given to the learning AI 321 and stores it in the learning database device 310. The input data represents information that can be referenced to control the operation or state of the object, such as, for example, an image, temperature.
制御能力学習装置320は、学習用のAI 321に学習用の対象330の動作または状態を制御させることを含む機械学習を行う。具体的には、制御能力学習装置320は、学習データベース装置310から制御能力学習データを読み出し、これを入力データとしてAI 321に与え、出力データ(学習用の対象330に直接的または間接的に与えられる制御値)を得る。出力データは、例えば、油圧シリンダ、モータ、ソノレイドなどのアクチュエータに与えられる制御値であってもよい。対象330がエンジンの場合、例えばエンジンへの燃料噴射コマンド、クランク軸の回転数を上げる若しくは下げるコマンドなどであってもよい。対象330がロボットハンドの場合、例えば各アクチュエータへの供給電流を上げるまたは下げるコマンドなどでもよい。AI 321は、この出力データによって制御された対象330が望ましい結果をもたらせば高い報酬を獲得し、望ましくない結果をもたらせば低い報酬を獲得するなどして学習していく。対象330がもたらす結果は、例えば観測装置340による観測に基づいて評価することができる。望ましい結果は、機械学習によって獲得することが望まれる能力などに依存して定められ、例えば、動作完了までの時間低減、燃費の向上、環境負荷の低減、消費電力の削減などであり得る。制御能力学習装置320は、この報酬を最大化するようにAI 321の機械学習(学習パラメータの更新)を行う。 The control capability learning device 320 performs machine learning including causing the learning AI 321 to control the operation or state of the learning target 330. Specifically, the control ability learning device 320 reads the control ability learning data from the learning database device 310, gives this to the AI 321 as input data, and gives the output data (directly or indirectly to the learning target 330). Control value). The output data may be, for example, a control value given to an actuator such as a hydraulic cylinder, a motor, or sono laid. When the target 330 is an engine, for example, a command for fuel injection to the engine, a command for increasing or decreasing the rotational speed of the crankshaft, and the like may be used. When the target 330 is a robot hand, for example, a command for increasing or decreasing the supply current to each actuator may be used. The AI 321 learns by acquiring a high reward if the target 330 controlled by the output data has a desired result, and acquiring a low reward if the target 330 has an undesirable result. The result brought about by the object 330 can be evaluated based on observation by the observation device 340, for example. Desirable results are determined depending on the ability or the like desired to be acquired by machine learning, and may be, for example, reduction of time to completion of operation, improvement of fuel consumption, reduction of environmental load, reduction of power consumption, and the like. The control ability learning device 320 performs machine learning (update of learning parameters) of the AI 321 so as to maximize this reward.
制御能力学習装置320は、学習用のAI 321の学習到達度をテストデータを用いて評価し、学習目標に到達したならば、学習結果(学習モデル)を対象への制御を行うAI(例えば図2のAI 201)に設定する。 The control capability learning device 320 evaluates the learning achievement level of the learning AI 321 using the test data, and when the learning target is reached, the AI that controls the learning result (learning model) to the target (for example, FIG. 2 AI 201).
なお、対象への制御を行うAIは、学習用のAI 321とは別個のAIであってもよいし、学習済みのAI 321が転用されてもよい。また、制御能力学習装置320および対象への制御を行うAIは、同一の装置(例えば、ECUやロボットのコントローラ)に組み込まれていてもよい。 The AI that controls the target may be an AI that is different from the learning AI 321, or the learned AI 321 may be diverted. Further, the control capability learning device 320 and the AI that performs control on the target may be incorporated in the same device (for example, an ECU or a controller of a robot).
観測装置340は、制御能力学習装置320によって機械学習が実行される期間における学習用の対象330の動作または状態を観測し、第1の観測データを生成する。観測装置340は、第1の観測データを第2の学習データ作成装置350に送る。第1の観測データは、制御能力学習装置320によって機械学習が実行される期間のうち学習用のAI 321の学習到達度が閾値以下である期間における対象330の動作または状態の観測結果を表してもよい。一般に、AIの学習到達度が高くなるほど(機械学習の完了が近づくほど)、望ましくない結果が生じる可能性は低下する。故に、機械学習の初期段階では、対象330の運用時にはあり得ない動作を行ったり状態に陥ったりする。このあり得ない動作や状態は、対象330の運用時の要注意動作または要注意状態と言える。そのため、機械段階の初期段階に行われる、このあり得ない動作や状態を第1の観測データとして得て、後述する判定能力学習装置360で学習することで、要注意動作および要注意状態を学習できるかもしれない。 The observation device 340 observes the operation or state of the learning target 330 during a period in which machine learning is executed by the control capability learning device 320, and generates first observation data. The observation device 340 sends the first observation data to the second learning data creation device 350. The first observation data represents an observation result of the operation or state of the target 330 in a period in which the learning achievement of the learning AI 321 is equal to or less than a threshold in the period in which machine learning is performed by the control ability learning device 320. Also good. In general, the higher the learning achievement of AI (the closer the completion of machine learning is), the lower the possibility that an undesirable result will occur. Therefore, in the initial stage of machine learning, an operation that is impossible when the target 330 is operated is performed or falls into a state. This impossible operation or state can be said to be a cautionary action or a cautionary state during operation of the target 330. For this reason, it is possible to learn the cautionary action and the cautionary state by obtaining this impossible action or state, which is performed in the initial stage of the machine stage, as first observation data and learning with the determination ability learning device 360 described later. I may be able to do it.
また、第1の観測データは、制御能力学習装置320によって機械学習が実行された期間のうち学習用のAI 321の学習到達度が第1の閾値以上であって第2の閾値以下である期間における対象330の動作または状態の観測結果としてもよい。 The first observation data is a period in which the learning achievement degree of the learning AI 321 is equal to or higher than the first threshold and equal to or lower than the second threshold in the period when the machine learning is executed by the control ability learning device 320. It may be an observation result of the operation or state of the target 330 in FIG.
第2の学習データ作成装置350は、判定能力を獲得するための機械学習に用いられる学習データである判定能力学習データを作成する。具体的には、第2の学習データ作成装置350は、観測装置340から第1の観測データを受ける。 The second learning data creation device 350 creates determination ability learning data that is learning data used for machine learning for acquiring determination ability. Specifically, the second learning data creation device 350 receives the first observation data from the observation device 340.
第2の学習データ作成装置350は、第1の観測データに基づいて判定能力学習データを作成する。判定能力学習データは、少なくとも後述される第1の学習データを含む。また、判定能力学習データは、後述される第2の学習データを含んでいてもよいし含まなくてもよい。 The second learning data creation device 350 creates determination ability learning data based on the first observation data. The determination ability learning data includes at least first learning data to be described later. The determination ability learning data may or may not include second learning data described later.
判定能力学習装置360は、CPUなどのプロセッサと、当該プロセッサによって実行されるプログラムを格納する記憶部と、当該プログラムを展開するためのRAMとを含み得る。CPUは、記憶部に格納されたプログラムをRAMに展開し、これを解釈および実行することで以下に説明する動作を行う。 The determination capability learning device 360 may include a processor such as a CPU, a storage unit that stores a program executed by the processor, and a RAM for developing the program. The CPU expands the program stored in the storage unit in the RAM, interprets and executes it, and performs the operations described below.
判定能力学習装置360は、判定能力学習データを用いて、入力データが判定能力学習データに基づいて定められる要注意動作または要注意状態を表すか否かを学習用のAI 361に判定させることを含む機械学習を行う。具体的には、判定能力学習装置360は、AI 361に学習データに含まれる入力データを与え、出力データ(判定結果)を得る。判定能力学習装置360は、この出力データが学習データに含まれる教師データに近づくようにこのAI 361の機械学習(学習パラメータの更新)を行う。 The determination ability learning device 360 uses the determination ability learning data to cause the learning AI 361 to determine whether or not the input data represents an action requiring attention or a state requiring attention determined based on the determination ability learning data. Including machine learning. Specifically, the determination capability learning device 360 gives input data included in the learning data to the AI 361, and obtains output data (determination result). The determination capability learning device 360 performs machine learning (update of learning parameters) of the AI 361 so that the output data approaches the teacher data included in the learning data.
判定能力学習装置360は、学習用のAI 361の学習到達度をテストデータを用いて評価し、学習目標に到達したならば、学習結果(学習モデル)を判定装置100のAI 103に設定する。 The determination capability learning device 360 evaluates the learning achievement level of the learning AI 361 using test data, and sets the learning result (learning model) in the AI 103 of the determination device 100 when the learning target is reached.
なお、AI 103は、学習用のAI 361とは別個のAIであってもよいし、学習済みのAI 361が転用されてもよい。また、判定能力学習装置360は、判定装置100に組み込まれていてもよい。 The AI 103 may be an AI that is separate from the learning AI 361, or the learned AI 361 may be diverted. Further, the determination capability learning device 360 may be incorporated in the determination device 100.
第1の学習データは、例えば、第1の観測データ(入力データ)と、当該第1の観測データの表す動作または状態が要注意動作または要注意状態に該当することを示す値(教師データ)との組であってもよい。 The first learning data includes, for example, first observation data (input data) and a value (teacher data) indicating that the operation or state represented by the first observation data corresponds to a caution operation or a caution state. It may be a pair.
或いは、第1の学習データは、第1の観測データの一部または全部である第3の観測データ(入力データ)と、当該第3の観測データの表す動作または状態が要注意動作または要注意状態に該当することを示す値(教師データ)との組であってもよい。ここで、第3の観測データとは、第1の観測データのうち第2の観測データに一致しないものを指す。そして、第2の観測データは、制御能力学習装置320による機械学習の完了後のAI 321または当該機械学習を通じて得られた学習結果が設定されたAIによって制御されている対象の動作または状態の観測結果を表す。一般に、かかる第2の観測データの表す動作または状態は、高い確率で適切な動作または状態であると推測できるので、第1の学習データから除外されてよい。他方、かかる第2の観測データに基づいて第2の学習データが作成されてもよい。第2の学習データは、例えば、第2の観測データ(入力データ)と、当該第2の観測データの表す動作または状態が要注意動作または要注意状態に該当しないことを示す値(教師データ)との組であってもよい。 Alternatively, the first learning data includes the third observation data (input data) that is a part or all of the first observation data, and the operation or state represented by the third observation data. It may be a pair with a value (teacher data) indicating that it corresponds to a state. Here, the third observation data refers to the first observation data that does not match the second observation data. The second observation data is an observation of the action or state of the target controlled by the AI 321 after completion of the machine learning by the control ability learning device 320 or the AI to which the learning result obtained through the machine learning is set. Represents the result. In general, since the motion or state represented by the second observation data can be estimated with high probability as an appropriate motion or state, it may be excluded from the first learning data. On the other hand, second learning data may be created based on the second observation data. The second learning data includes, for example, second observation data (input data) and a value (teacher data) indicating that the operation or state represented by the second observation data does not correspond to a caution operation or a caution state. It may be a pair.
利用者からの要求に応じて制御能力および判定能力を獲得するための機械学習サービスを提供するサービス提供システムが図4に例示される。図4のサービス提供システムは、第1の学習データ作成装置300と、学習データベース装置310と、制御能力学習装置320と、第2の学習データ作成装置350と、判定能力学習装置360と、利用者端末400と、学習依頼装置410とを含む。各装置は、ネットワークNW経由で互いに接続されている。 FIG. 4 illustrates a service providing system that provides a machine learning service for acquiring control ability and determination ability in response to a request from a user. The service providing system of FIG. 4 includes a first learning data creation device 300, a learning database device 310, a control ability learning device 320, a second learning data creation device 350, a judgment ability learning device 360, and a user. A terminal 400 and a learning request apparatus 410 are included. Each device is connected to each other via a network NW.
なお、図4のサービス提供システムの装置構成は例示に過ぎない。すなわち、図4に示される装置の一部または全部が1つの装置に統合されてもよいし、図4に示される装置の機能が複数の装置に分散されてもよい。また、図4のサービス提供システムの一部の装置が削除または変更され得るし、図4に示されていない装置が追加され得る。 The apparatus configuration of the service providing system in FIG. 4 is merely an example. That is, some or all of the devices shown in FIG. 4 may be integrated into one device, or the functions of the device shown in FIG. 4 may be distributed to a plurality of devices. 4 may be deleted or changed, or a device not shown in FIG. 4 may be added.
図4の各装置は、基本的に、入出力部と、CPUなどのプロセッサと、当該プロセッサによって実行されるプログラムを格納する記憶部と、当該プログラムを展開するためのRAMとを含み得る。CPUは、記憶部に格納されたプログラムをRAMに展開し、これを解釈および実行することで以下に説明する動作を行う。 4 may basically include an input / output unit, a processor such as a CPU, a storage unit that stores a program executed by the processor, and a RAM that expands the program. The CPU expands the program stored in the storage unit in the RAM, interprets and executes it, and performs the operations described below.
ここで、入出力部は、例えば、(ネットワークを介して)外部装置と接続するためのインタフェース(例えば、入出力ポート、通信ポート)であり、接続する外部装置に応じて適宜構成され得る。入出力部は、CPUに与える入力データを外部装置から受け取ったり、CPUからの出力データを外部装置に送ったりする。 Here, the input / output unit is, for example, an interface (for example, an input / output port or a communication port) for connecting to an external device (via a network), and can be appropriately configured according to the external device to be connected. The input / output unit receives input data to be supplied to the CPU from an external device, and sends output data from the CPU to the external device.
第1の学習データ作成装置300は、前述のように、制御能力学習データを作成し、学習データベース装置310に格納する。制御能力学習データを作成するためのベースとなるデータが学習依頼装置410からの入力データに含まれていてもよい。 As described above, the first learning data creation device 300 creates control ability learning data and stores it in the learning database device 310. Data serving as a base for creating control ability learning data may be included in the input data from the learning request apparatus 410.
制御能力学習装置320は、学習依頼装置410から学習開始指令を受け取る。さらに、制御能力学習装置320は、例えば、機械学習によって獲得することが望まれる制御能力を定める仕様データを受け取るかもしれない。制御能力学習装置320は、仕様データに基づいて、学習用のAI 321の学習目標を設定したり、強化学習における報酬を設定したりしてよい。 The control ability learning device 320 receives a learning start command from the learning request device 410. Furthermore, the control capability learning device 320 may receive specification data that defines the control capability desired to be acquired by machine learning, for example. The control capability learning device 320 may set a learning target of the learning AI 321 or set a reward for reinforcement learning based on the specification data.
学習データベース装置310は、制御能力を獲得するための機械学習に用いられる制御能力学習データと、判定能力を獲得するための機械学習に用いられる判定能力学習データとを格納する。制御能力学習データは、第1の学習データ作成装置300によって作成され、制御能力学習装置320によって必要に応じて読み出される。判定能力学習データは、第2の学習データ作成装置350によって作成され、判定能力学習装置360によって必要に応じて読み出される。判定能力学習データは、前述の第1の学習データを含み、オプションとして第2の学習データを含み得る。 The learning database device 310 stores control ability learning data used for machine learning for acquiring control ability, and judgment ability learning data used for machine learning for obtaining judgment ability. The control capability learning data is created by the first learning data creation device 300 and read by the control capability learning device 320 as necessary. The determination capability learning data is created by the second learning data creation device 350 and read by the determination capability learning device 360 as necessary. The determination capability learning data includes the first learning data described above, and may optionally include second learning data.
第2の学習データ作成装置350は、観測データに基づいて判定能力学習データを作成し、学習データベース装置310に格納する。判定能力学習データを作成するためのベースとなる観測データは、図4に示されていない観測装置から直接的に取得されてもよいし、学習依頼装置410からの入力データに含まれていてもよい。 The second learning data creation device 350 creates determination ability learning data based on the observation data and stores it in the learning database device 310. The observation data serving as a base for creating the judgment ability learning data may be obtained directly from an observation device not shown in FIG. 4 or may be included in the input data from the learning request device 410. Good.
判定能力学習装置360は、学習依頼装置410から学習開始指令を受け取る。さらに、判定能力学習装置360は、学習依頼装置410から仕様データを受け取るかもしれない。判定能力学習装置360は、仕様データに基づいて、学習用のAI 361の学習目標を設定してもよい。 The determination ability learning device 360 receives a learning start command from the learning request device 410. Further, the determination capability learning device 360 may receive specification data from the learning request device 410. The determination capability learning device 360 may set a learning target of the learning AI 361 based on the specification data.
利用者端末400は、利用者の目的にふさわしい機械学習の提供をサービス提供システムに依頼する。利用者端末400は、例えば、仕様データおよび学習開始指令を受け取り、これらを学習依頼装置410に送る。仕様データは、対象の構造、用途、目的または耐負荷性能などを示す値を含み得る。 The user terminal 400 requests the service providing system to provide machine learning suitable for the user's purpose. For example, the user terminal 400 receives specification data and a learning start command, and sends them to the learning request device 410. The specification data may include a value indicating the target structure, application, purpose, load bearing performance, or the like.
学習依頼装置410は、利用者端末400から仕様データおよび学習開始指令を学習依頼として受け付ける。学習依頼装置410は、仕様データおよび学習開始指令を制御能力学習装置320および判定能力学習装置360へと送る。 The learning request device 410 receives specification data and a learning start command from the user terminal 400 as a learning request. The learning request apparatus 410 sends the specification data and the learning start command to the control ability learning apparatus 320 and the determination ability learning apparatus 360.
図5は、図4のサービス提供システムの動作を例示する。利用者が、利用者端末400に仕様データおよび学習開始指令を入力することで、図5の動作は開始する。 FIG. 5 illustrates the operation of the service providing system of FIG. When the user inputs specification data and a learning start command to the user terminal 400, the operation in FIG.
まず、学習依頼装置410は、利用者端末400から仕様データおよび学習開始指令を学習依頼として受け取る(ステップS501)。この学習依頼をトリガとして、第1の学習データ作成装置300は、制御能力学習データを作成し、学習データベース装置310に格納する(ステップS502)。 First, the learning request apparatus 410 receives specification data and a learning start command from the user terminal 400 as a learning request (step S501). Using this learning request as a trigger, the first learning data creation device 300 creates control ability learning data and stores it in the learning database device 310 (step S502).
制御能力学習装置320は、ステップS502において作成された制御能力学習データを用いて、AI 321の機械学習を行う(ステップS503)。ステップS503の学習結果は、利用者端末400へと送られ、利用者の使用するAIに設定され得る。 The control capability learning device 320 performs machine learning of the AI 321 using the control capability learning data created in step S502 (step S503). The learning result in step S503 can be sent to the user terminal 400 and set to the AI used by the user.
ステップS503における対象の動作または状態の観測データに基づいて、第2の学習データ作成装置350は、判定能力学習データを作成し、学習データベース装置310に格納する(ステップS504)。 Based on the observation data of the target action or state in step S503, the second learning data creation device 350 creates determination ability learning data and stores it in the learning database device 310 (step S504).
判定能力学習装置360は、ステップS504において作成された判定能力学習データを用いて、AI 361の機械学習を行う(ステップS505)。ステップS505の学習結果は、利用者端末400へと送られ、利用者の使用するAIに設定され得る。 The determination capability learning device 360 performs machine learning of the AI 361 using the determination capability learning data created in step S504 (step S505). The learning result in step S505 can be sent to the user terminal 400 and set to the AI used by the user.
以上説明したように、第1の実施形態に係る判定装置は、人工知能によって制御されている対象の動作または状態の観測結果を表す入力データが、要注意動作または要注意状態を表すか否かを判定する。これら要注意動作または要注意状態は、当該人工知能のための機械学習時における学習用の対象の動作または状態に基づいて定められているので、望ましくない結果をもたらす可能性が高いと推測できる。故に、この判定装置によれば、対象の動作または状態の観測結果から望ましくない結果の発生を予測することができる。 As described above, the determination apparatus according to the first embodiment determines whether or not the input data representing the observation result of the action or state of the target controlled by the artificial intelligence represents the action requiring attention or the condition requiring attention. Determine. Since these action requiring attention or condition requiring attention are determined based on the action or state of the object for learning at the time of machine learning for the artificial intelligence, it can be estimated that there is a high possibility of causing an undesirable result. Therefore, according to this determination apparatus, generation | occurrence | production of an undesired result can be estimated from the observation result of operation | movement or a state of object.
上述の実施形態は、本発明の概念の理解を助けるための具体例を示しているに過ぎず、本発明の範囲を限定することを意図されていない。実施形態は、本発明の要旨を逸脱しない範囲で、様々な構成要素の付加、削除または転換をすることができる。 The above-described embodiments are merely specific examples for helping understanding of the concept of the present invention, and are not intended to limit the scope of the present invention. The embodiment can add, delete, or convert various components without departing from the gist of the present invention.
上記各実施形態において説明された種々の機能部は、回路を用いることで実現されてもよい。回路は、特定の機能を実現する専用回路であってもよいし、プロセッサのような汎用回路であってもよい。 The various functional units described in the above embodiments may be realized by using a circuit. The circuit may be a dedicated circuit that realizes a specific function, or may be a general-purpose circuit such as a processor.
上記各実施形態の処理の少なくとも一部は、汎用のコンピュータを基本ハードウェアとして用いることでも実現可能である。上記処理を実現するプログラムは、コンピュータで読み取り可能な記録媒体に格納して提供されてもよい。プログラムは、インストール可能な形式のファイルまたは実行可能な形式のファイルとして記録媒体に記憶される。記録媒体としては、磁気ディスク、光ディスク(CD−ROM、CD−R、DVD等)、光磁気ディスク(MO等)、半導体メモリなどである。記録媒体は、プログラムを記憶でき、かつ、コンピュータが読み取り可能であれば、何れであってもよい。また、上記処理を実現するプログラムを、インターネットなどのネットワークに接続されたコンピュータ(サーバ)上に格納し、ネットワーク経由でコンピュータ(クライアント)にダウンロードさせてもよい。 At least a part of the processing of each of the above embodiments can also be realized by using a general-purpose computer as basic hardware. A program for realizing the above processing may be provided by being stored in a computer-readable recording medium. The program is stored in the recording medium as an installable file or an executable file. Examples of the recording medium include a magnetic disk, an optical disk (CD-ROM, CD-R, DVD, etc.), a magneto-optical disk (MO, etc.), and a semiconductor memory. The recording medium may be any recording medium as long as it can store the program and can be read by the computer. The program for realizing the above processing may be stored on a computer (server) connected to a network such as the Internet and downloaded to the computer (client) via the network.
上記各実施形態の一部または全部は、特許請求の範囲のほか以下の付記に示すように記載することも可能であるが、これに限られない。
(付記1)
メモリと、
前記メモリに接続されたプロセッサと
を具備し、
前記プロセッサは、
(a)学習用の人工知能に学習用の対象の動作または状態を制御させることを含む第1の機械学習を通じて得られた第1の学習結果が設定された第1の人工知能によって制御されている対象の動作または状態の観測結果を表す入力データを取得し、
(b)前記入力データが、前記第1の機械学習が実行された期間における前記学習用の対象の動作または状態に基づいて定められる要注意動作または要注意状態を表すか否かを判定する
ように構成される、判定装置。
A part or all of each of the embodiments described above can be described as shown in the following supplementary notes in addition to the claims, but is not limited thereto.
(Appendix 1)
Memory,
A processor connected to the memory,
The processor is
(A) The first learning result obtained through the first machine learning including causing the learning artificial intelligence to control the operation or state of the learning target is controlled by the set first artificial intelligence. Obtain input data that represents the observation results of the motion or state of the target
(B) Determining whether or not the input data represents an action requiring attention or a condition requiring attention determined based on the action or state of the learning target in a period in which the first machine learning is executed. A determination device configured as follows.
(付記2)
プロセッサによって行われる学習方法であって、
前記学習方法は、
第1の学習用の人工知能に学習用の対象の動作または状態を制御させることを含む第1の機械学習が実行された期間における前記学習用の対象の動作または状態の観測結果を表す第1の観測データに基づいて作成された第1の学習データを取得することと、
入力データが前記第1の学習データに基づいて定められる要注意動作または要注意状態を表すか否かを第2の学習用の人工知能に判定させることを含む第2の機械学習を行うことと
を具備する、学習方法。
(Appendix 2)
A learning method performed by a processor,
The learning method is:
A first representing an observation result of the learning target operation or state in a period in which the first machine learning including execution of the first learning artificial intelligence to control the learning target operation or state is performed. Obtaining first learning data created based on the observation data of
Performing a second machine learning including causing the second learning artificial intelligence to determine whether or not the input data represents an action requiring attention or a condition requiring attention determined based on the first learning data. A learning method comprising:
100・・・判定装置
101・・・取得部
102・・・判定部
103,201,321,361・・・AI
104・・・警報部
105・・・介入部
106・・・記憶部
200・・・制御装置
210,330・・・対象
220,340・・・観測装置
300・・・第1の学習データ作成装置
310・・・学習データベース装置
320・・・制御能力学習装置
350・・・第2の学習データ作成装置
360・・・判定能力学習装置
400・・・利用者端末
410・・・学習依頼装置
DESCRIPTION OF SYMBOLS 100 ... Determination apparatus 101 ... Acquisition part 102 ... Determination part 103,201,321,361 ... AI
104 ... alarm unit 105 ... intervention unit 106 ... storage unit 200 ... control device 210,330 ... target 220,340 ... observation device 300 ... first learning data creation device 310 ... Learning database device 320 ... Control capability learning device 350 ... Second learning data creation device 360 ... Judgment capability learning device 400 ... User terminal 410 ... Learning request device
Claims (10)
前記入力データが、前記第1の機械学習が実行された期間における前記学習用の対象の動作または状態に基づいて定められる要注意動作または要注意状態を表すか否かを判定する判定部と
を具備する、判定装置。 The first learning result obtained through the first machine learning including causing the learning artificial intelligence to control the movement or state of the learning target is set for the target controlled by the first artificial intelligence. An acquisition unit for acquiring input data representing observation results of the operation or state;
A determination unit that determines whether or not the input data represents an action requiring attention or a state requiring attention determined based on the action or state of the learning target in a period in which the first machine learning is performed; A determination device.
学習用の人工知能に学習用の対象の動作または状態を制御させることを含む第1の機械学習を通じて得られた第1の学習結果が設定された第1の人工知能によって制御されている対象の動作または状態の観測結果を表す入力データを取得する手段、
前記入力データが、前記第1の機械学習が実行された期間における前記学習用の対象の動作または状態に基づいて定められる要注意動作または要注意状態を表すか否かを判定する手段
として機能させるための判定プログラム。 Computer
The first learning result obtained through the first machine learning including causing the learning artificial intelligence to control the movement or state of the learning target is set for the target controlled by the first artificial intelligence. Means for obtaining input data representing observation results of movements or states;
A function for determining whether or not the input data represents an action requiring attention or a condition requiring attention determined based on the action or state of the learning target in a period in which the first machine learning is executed; Judgment program for.
入力データが前記第1の学習データに基づいて定められる要注意動作または要注意状態を表すか否かを第2の学習用の人工知能に判定させることを含む第2の機械学習を行うことと
を具備する、学習方法。 A first representing an observation result of the learning target operation or state in a period in which the first machine learning including execution of the first learning artificial intelligence to control the learning target operation or state is performed. Obtaining first learning data created based on the observation data of
Performing a second machine learning including causing the second learning artificial intelligence to determine whether or not the input data represents an action requiring attention or a condition requiring attention determined based on the first learning data. A learning method comprising:
前記第1の学習データは、前記第3の観測データに基づいて作成される、
請求項7に記載の学習方法。 In the first observation data, the first learning result obtained through the first learning artificial intelligence or the first machine learning after the completion of the first machine learning is set. Including third observation data that does not match the second observation data representing the observation result of the action or state of the object controlled by the artificial intelligence;
The first learning data is created based on the third observation data.
The learning method according to claim 7.
前記第1の学習データは、前記第3の観測データが前記要注意動作または前記要注意状態に該当することを示す第1の教師データを含み、
前記第2の学習データは、前記第2の観測データが前記要注意動作または前記要注意状態に該当しないことを示す第2の教師データを含む、
請求項9に記載の学習方法。 The second machine learning is performed using the first learning data and the second learning data created based on the second observation data,
The first learning data includes first teacher data indicating that the third observation data corresponds to the action requiring attention or the condition requiring attention;
The second learning data includes second teacher data indicating that the second observation data does not correspond to the action requiring attention or the condition requiring attention.
The learning method according to claim 9.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017048778A JP6693451B2 (en) | 2017-03-14 | 2017-03-14 | Judgment device, judgment program, and learning method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017048778A JP6693451B2 (en) | 2017-03-14 | 2017-03-14 | Judgment device, judgment program, and learning method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018151959A true JP2018151959A (en) | 2018-09-27 |
| JP6693451B2 JP6693451B2 (en) | 2020-05-13 |
Family
ID=63680509
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017048778A Active JP6693451B2 (en) | 2017-03-14 | 2017-03-14 | Judgment device, judgment program, and learning method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6693451B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020155011A (en) * | 2019-03-22 | 2020-09-24 | 株式会社中電工 | Drawing learning device |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014176933A (en) * | 2013-03-15 | 2014-09-25 | Yaskawa Electric Corp | Robot system and method for controlling the same |
| JP2017033040A (en) * | 2015-07-28 | 2017-02-09 | ファナック株式会社 | Control device and machine learning device with plc program optimization function |
| JP2017033526A (en) * | 2015-07-31 | 2017-02-09 | ファナック株式会社 | Machine learning device and machine learning method for learning fault condition and fault prediction device and fault prediction system equipped with machine learning device |
-
2017
- 2017-03-14 JP JP2017048778A patent/JP6693451B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014176933A (en) * | 2013-03-15 | 2014-09-25 | Yaskawa Electric Corp | Robot system and method for controlling the same |
| JP2017033040A (en) * | 2015-07-28 | 2017-02-09 | ファナック株式会社 | Control device and machine learning device with plc program optimization function |
| JP2017033526A (en) * | 2015-07-31 | 2017-02-09 | ファナック株式会社 | Machine learning device and machine learning method for learning fault condition and fault prediction device and fault prediction system equipped with machine learning device |
Non-Patent Citations (1)
| Title |
|---|
| 櫻井 俊輔 外2名: "「学習途上エージェントの挙動に基づく逆強化学習」", 電子情報通信学会技術研究報告, vol. 第115巻,第112号, JPN6020009528, 16 June 2015 (2015-06-16), pages 95 - 99, ISSN: 0004231791 * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020155011A (en) * | 2019-03-22 | 2020-09-24 | 株式会社中電工 | Drawing learning device |
| JP7301278B2 (en) | 2019-03-22 | 2023-07-03 | 株式会社中電工 | Drawing learning device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6693451B2 (en) | 2020-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7091820B2 (en) | Control system, learning data creation device, learning device and judgment device | |
| JP2022125288A (en) | Abnormality Prediction Device, Abnormality Prediction System, Abnormality Prediction Method and Abnormality Prediction Program | |
| CN111796514B (en) | Control and monitor physical systems based on trained Bayesian neural networks | |
| US11275345B2 (en) | Machine learning Method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device | |
| CN112119404B (en) | Sample-Efficient Reinforcement Learning | |
| US10131053B1 (en) | Real time robot collision avoidance | |
| KR20230028501A (en) | Offline Learning for Robot Control Using Reward Prediction Model | |
| WO2020152364A1 (en) | Multi-agent reinforcement learning with matchmaking policies | |
| WO2020065001A1 (en) | Learning motor primitives and training a machine learning system using a linear-feedback-stabilized policy | |
| US20190219972A1 (en) | System and method for context-driven predictive simulation selection and use | |
| JP7381585B2 (en) | information processing system | |
| EP3837666A1 (en) | Systems and methods for modeling and controlling physical dynamical systems using artificial intelligence | |
| CN112292239B (en) | Method and device for computer-aided determination of control parameters for a suitable operating technical system | |
| JP6693451B2 (en) | Judgment device, judgment program, and learning method | |
| US11285604B2 (en) | Robot collision detection using cascading variational autoencoder | |
| JP2018519594A (en) | Local analysis on assets | |
| JP2020003893A (en) | Robust adjustment device and model creation method | |
| JP7564033B2 (en) | Distributed system and diagnostic method | |
| US11477243B2 (en) | Off-policy control policy evaluation | |
| US20150149398A1 (en) | Method and apparatus for decision migration in a multi-component robot | |
| Vassev et al. | Awareness in software-intensive systems | |
| CN113165174B (en) | Automated systems including reachability analysis | |
| Dassanayake et al. | A deep reinforcement learning based homeostatic system for unmanned position control | |
| JP2023062688A (en) | Agent control method | |
| WO2025026650A1 (en) | System and method for managing testing of autonomous vehicles |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190312 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200227 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200317 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200330 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6693451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |