JP2629291B2 - マニピュレータ学習制御方法 - Google Patents
マニピュレータ学習制御方法Info
- Publication number
- JP2629291B2 JP2629291B2 JP63205773A JP20577388A JP2629291B2 JP 2629291 B2 JP2629291 B2 JP 2629291B2 JP 63205773 A JP63205773 A JP 63205773A JP 20577388 A JP20577388 A JP 20577388A JP 2629291 B2 JP2629291 B2 JP 2629291B2
- Authority
- JP
- Japan
- Prior art keywords
- manipulator
- neural network
- hand position
- learning
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Manipulator (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、マニピュレータの制御方法に関するもので
ある。
ある。
従来、多関節型マニピュレータを制御するためには、
通常、作業座標系上で記述されたマニピュレータ手先位
置・姿勢をマニピュレータ関節回転角に変換する必要が
ある。両者は三角関数を含む非線形関係にあり、上記の
解を解析的に得ることは一般に難しい。このため、各手
先位置・姿勢に対する関節回転角をすべてメモリ上に貯
えておき、その都度参照する方法や、各リンクごとの逆
変換行列を高速に計算して数値的に逆変換を実行する方
法などがとられている。
通常、作業座標系上で記述されたマニピュレータ手先位
置・姿勢をマニピュレータ関節回転角に変換する必要が
ある。両者は三角関数を含む非線形関係にあり、上記の
解を解析的に得ることは一般に難しい。このため、各手
先位置・姿勢に対する関節回転角をすべてメモリ上に貯
えておき、その都度参照する方法や、各リンクごとの逆
変換行列を高速に計算して数値的に逆変換を実行する方
法などがとられている。
なお、関連するマニピュレータ制御技術としては、P.
P.ポール著「ロボットマニピュレータ」MITプレスpp.6
5,1983(R.P.Paul:Robot Manipulators,MIT Press,pp.6
5,1983)や「ロボット光学とその応用」電子通信学会p
p.39(1984)が挙げられる。
P.ポール著「ロボットマニピュレータ」MITプレスpp.6
5,1983(R.P.Paul:Robot Manipulators,MIT Press,pp.6
5,1983)や「ロボット光学とその応用」電子通信学会p
p.39(1984)が挙げられる。
上記従来技術では、大容量のメモリや高性能の計算機
が不可欠であり、煩雑な解析も行わなければならないと
いう問題があった。
が不可欠であり、煩雑な解析も行わなければならないと
いう問題があった。
本発明の目的は、このような従来の問題を解決し、煩
雑な解析,大容量のメモリや高性能の計算機等を必要と
せず、マニピュレータ手先位置・姿勢と関節回転角の関
係を求められるマニピュレータ学習制御方法を提供する
ことにある。
雑な解析,大容量のメモリや高性能の計算機等を必要と
せず、マニピュレータ手先位置・姿勢と関節回転角の関
係を求められるマニピュレータ学習制御方法を提供する
ことにある。
上記目的を達成するため、本発明のマニピュレータ学
習制御方法は、ニューラルネットワークとマニピュレー
タとマニピュレータの手先位置姿勢測定装置を有するマ
ニピュレータ学習制御方法において、マニピュレータの
手先位置姿勢の目標値(xd)を3層構造からなるニュー
ラルネットワークに入力し、前記ニューラルネットワー
クの出力値を制御指令値として前記マニピュレータに入
力し、前記手先位置姿勢測定装置により測定されたマニ
ピュレータの手先位置姿勢データとニューラルネットの
前記入力データとを比較し、比較結果を前記ニューラル
ネットワークのバックプロパゲーション用信号として入
力して学習させることを特徴としている。
習制御方法は、ニューラルネットワークとマニピュレー
タとマニピュレータの手先位置姿勢測定装置を有するマ
ニピュレータ学習制御方法において、マニピュレータの
手先位置姿勢の目標値(xd)を3層構造からなるニュー
ラルネットワークに入力し、前記ニューラルネットワー
クの出力値を制御指令値として前記マニピュレータに入
力し、前記手先位置姿勢測定装置により測定されたマニ
ピュレータの手先位置姿勢データとニューラルネットの
前記入力データとを比較し、比較結果を前記ニューラル
ネットワークのバックプロパゲーション用信号として入
力して学習させることを特徴としている。
また、該3層構造のニューラルネットワークの前段
に、さらに前記マニピュレータの手先位置姿勢の目標値
(xd)のべき乗項を計算する層を設け、該層で生成され
る目標値(xd)のべき乗項{1,xd,xd 2・・・xd k}を前
記3層構造のニューラルネットワークに入力するように
したことを特徴としている。
に、さらに前記マニピュレータの手先位置姿勢の目標値
(xd)のべき乗項を計算する層を設け、該層で生成され
る目標値(xd)のべき乗項{1,xd,xd 2・・・xd k}を前
記3層構造のニューラルネットワークに入力するように
したことを特徴としている。
本発明においては、第1図に示すようなマニピュレー
タ学習制御系において、作業座標系上で記述されたマニ
ピュレータ手先位置・姿勢xd1,xd2,・・・,xdnを入力し
ニューラルネットワークの演算によりm個の出力θ1,θ
2,・・・,θmを得る。これをマニピュレータの関節回
転角指令値として動作を実行する。その結果、マニピュ
レータはある位置・姿勢x1,x2,・・・,xnをとる。この
値と指令値との誤差を計算し、その値を用いてニューラ
ルネットワークを改善する。最初、マニピュレータの動
作位置は指令値と大きく違うが、上記の過程を何回か繰
り返すうちにニューラルネットワークが改善されて誤差
が微小になる。この状態は、作業座標系上で記述された
マニピュレータ手先位置・姿勢をマニピュレータ関節回
転角に変換する解析に相当する両者の関係が、ニューラ
ルネットワークの入出力として表現できたことを表し、
その結果マニピュレータの制御が可能となる。すなわ
ち、ニューラルネットワークの学習機能により、大容量
のメモリや高性能の計算機等を必要とせず、マニピュレ
ータ手先位置・姿勢と回転角を容易にもとめることが可
能となる。
タ学習制御系において、作業座標系上で記述されたマニ
ピュレータ手先位置・姿勢xd1,xd2,・・・,xdnを入力し
ニューラルネットワークの演算によりm個の出力θ1,θ
2,・・・,θmを得る。これをマニピュレータの関節回
転角指令値として動作を実行する。その結果、マニピュ
レータはある位置・姿勢x1,x2,・・・,xnをとる。この
値と指令値との誤差を計算し、その値を用いてニューラ
ルネットワークを改善する。最初、マニピュレータの動
作位置は指令値と大きく違うが、上記の過程を何回か繰
り返すうちにニューラルネットワークが改善されて誤差
が微小になる。この状態は、作業座標系上で記述された
マニピュレータ手先位置・姿勢をマニピュレータ関節回
転角に変換する解析に相当する両者の関係が、ニューラ
ルネットワークの入出力として表現できたことを表し、
その結果マニピュレータの制御が可能となる。すなわ
ち、ニューラルネットワークの学習機能により、大容量
のメモリや高性能の計算機等を必要とせず、マニピュレ
ータ手先位置・姿勢と回転角を容易にもとめることが可
能となる。
以下、本発明の一実施例を、図面により詳細に説明す
る。
る。
第1図は、本発明の一実施例を示すマニピュレータ学
習制御系のブロック図である。
習制御系のブロック図である。
第1図において、1はニューラルネットワーク、2は
m自由度マニピュレータである。作業座標系上で記述さ
れたマニピュレータ手先位置・姿勢の指令値xd=(xd1,
xd2,・・・,xdn)をニューラルネットワーク1に入力す
る。ネットワーク1は3層構造であり、各ユニットの入
力、出力をui,viとすると、 vh i=f(uh i) ……(2) vo i=f(uo i) ……(4) が成立する。ここで、添字ihoは各々第1層,第2層,
第3層を表し、f(・)は値域[−1,1]のsigmoid関数 f(x)=2/(1+e-x)−1……(5) とする。ネットワークの出力vo=(vo 1,vo 2,・・・,
vo m)をマニピュレータ2の関節角指令値θ=(θ1,
θ2,・・・,θm)としてマニピュレータ2を動作す
る。マニピュレータ2の位置決め出力値x=(x1,x2,・
・・,xn)と指令値xdとの誤差を用いて学習を行う。学
習は次式に基づいて荷重wp ij,ws ijを変更することによ
って実行される。
m自由度マニピュレータである。作業座標系上で記述さ
れたマニピュレータ手先位置・姿勢の指令値xd=(xd1,
xd2,・・・,xdn)をニューラルネットワーク1に入力す
る。ネットワーク1は3層構造であり、各ユニットの入
力、出力をui,viとすると、 vh i=f(uh i) ……(2) vo i=f(uo i) ……(4) が成立する。ここで、添字ihoは各々第1層,第2層,
第3層を表し、f(・)は値域[−1,1]のsigmoid関数 f(x)=2/(1+e-x)−1……(5) とする。ネットワークの出力vo=(vo 1,vo 2,・・・,
vo m)をマニピュレータ2の関節角指令値θ=(θ1,
θ2,・・・,θm)としてマニピュレータ2を動作す
る。マニピュレータ2の位置決め出力値x=(x1,x2,・
・・,xn)と指令値xdとの誤差を用いて学習を行う。学
習は次式に基づいて荷重wp ij,ws ijを変更することによ
って実行される。
wp ij(n)=wp ij(n−1)+△wp ij(n)……(6) ws ij(n)=ws ij(n−1)+△ws ij(n)……(7) △ws ij(n)=qsiδivh j+qs2△ws ij(n−1)……
(9) ここで、nは学習の回数を表し、qp1,qp2,qs1,qs2は
定数である。
(9) ここで、nは学習の回数を表し、qp1,qp2,qs1,qs2は
定数である。
第3図(a),(b),(c)は、第1図に示したマ
ニピュレータ制御系を用いて第2図に示すような3自由
度多関節マニピュレータを対象として学習制御を行った
場合のシミュレーション結果である。目標手先位置(x
d1,xd2,xd3)は動作範囲内でランダムな値を与え、ネッ
トワークの出力(θ1,θ2,θ3)を得る。これを指令値
としてマニピュレータを動作させる代わりに、次式によ
り計算機内でマニピュレータの手先位置(x1,x2,x3)を
シミュレートする。
ニピュレータ制御系を用いて第2図に示すような3自由
度多関節マニピュレータを対象として学習制御を行った
場合のシミュレーション結果である。目標手先位置(x
d1,xd2,xd3)は動作範囲内でランダムな値を与え、ネッ
トワークの出力(θ1,θ2,θ3)を得る。これを指令値
としてマニピュレータを動作させる代わりに、次式によ
り計算機内でマニピュレータの手先位置(x1,x2,x3)を
シミュレートする。
x1=(L1cosθ1+L2cosθ2)cosθ3……(11) x2=(L1cosθ1+L2cosθ2)cosθ3……(12) x3=L1sinθ1+L2sinθ2+L3……(13) 図では、横軸に学習回数、縦軸にマニピュレータ手先
位置を取り、学習回数50回ごとの目標値xdi、実現値
xi、両者の誤差xdi−xi[i=1,2,3]を示す。学習に従
って誤差が減少し、150回で目標値と実現値がよく一致
している。
位置を取り、学習回数50回ごとの目標値xdi、実現値
xi、両者の誤差xdi−xi[i=1,2,3]を示す。学習に従
って誤差が減少し、150回で目標値と実現値がよく一致
している。
第4図(a),(b),(c)はsigmoid関数 f(x)=2/(1+e-kx)−1……(14) のパラメータkを各々0.1,1,3とした場合の制御結果を
示す。k=1の場合(図(b)、150回以降で偏差がほ
とんど0となるが、k=0.1および3の場合(図
(a),(c))は大きな偏差が残る。また、第5図は
パラメータkに対する、学習制御150回から200回までの
制御精度の平均値を示す。たとえば、精度10%とするた
めにはパラメータの範囲は0.7<k<2.5と規定される。
示す。k=1の場合(図(b)、150回以降で偏差がほ
とんど0となるが、k=0.1および3の場合(図
(a),(c))は大きな偏差が残る。また、第5図は
パラメータkに対する、学習制御150回から200回までの
制御精度の平均値を示す。たとえば、精度10%とするた
めにはパラメータの範囲は0.7<k<2.5と規定される。
第6図はニューラルネットワーク入力値xdとしてラン
ダムな値を用いた場合(第6図(a))と、正弦波信号
を用いた場合(第6図(b)の制御結果の比較を示す。
前者は誤差が減少しているが、後者は定常的な誤差が残
っている。したがって、入力値が周期的な信号よりラン
ダムな信号の方が学習制御結果が良好である。
ダムな値を用いた場合(第6図(a))と、正弦波信号
を用いた場合(第6図(b)の制御結果の比較を示す。
前者は誤差が減少しているが、後者は定常的な誤差が残
っている。したがって、入力値が周期的な信号よりラン
ダムな信号の方が学習制御結果が良好である。
第7図はニューラルネットワーク内のユニットを4層
構造とし、第1の層は入力値xdのべき乗項を計算して、
これにより生成される値{1,xd,xd 2,・・・xd k}を用い
て第2層以下の3層で学習を実行するマニピュレータ学
習制御系を示すブロック図である。ここでは、第1図に
示す学習制御系のニューラルネットワークの3層構造ユ
ニットに対して4層とした点が相違している。
構造とし、第1の層は入力値xdのべき乗項を計算して、
これにより生成される値{1,xd,xd 2,・・・xd k}を用い
て第2層以下の3層で学習を実行するマニピュレータ学
習制御系を示すブロック図である。ここでは、第1図に
示す学習制御系のニューラルネットワークの3層構造ユ
ニットに対して4層とした点が相違している。
第8図は第7図に示す4層ユニットのニューラルネッ
トワーク3を持つマニピュレータ学習制御系を用いた場
合(第8図(a))と、第1図に示す3層ユニットの制
御系を用いた場合(第8図(b))の制御結果の比較を
示す。前者は後者に比べ速く誤差が減少している。した
がって、4層ユニットのネットワークを用いた方が学習
が速く達成でき、優れた制御が実行できる。
トワーク3を持つマニピュレータ学習制御系を用いた場
合(第8図(a))と、第1図に示す3層ユニットの制
御系を用いた場合(第8図(b))の制御結果の比較を
示す。前者は後者に比べ速く誤差が減少している。した
がって、4層ユニットのネットワークを用いた方が学習
が速く達成でき、優れた制御が実行できる。
このように、本実施例においては、手先位置・姿勢を
指令値としてマニピュレータを動作させる場合、煩雑な
解析・大容量のメモリや高性能の計算機等を必要とせ
ず、容易に制御が可能となる。
指令値としてマニピュレータを動作させる場合、煩雑な
解析・大容量のメモリや高性能の計算機等を必要とせ
ず、容易に制御が可能となる。
以上説明したように、本発明によれば、煩雑な解析,
大容量のメモリや高性能の計算機等を必要とせず、マニ
ピュレータ手先位置・姿勢と関節回転角の関係を求めら
れるようになる。
大容量のメモリや高性能の計算機等を必要とせず、マニ
ピュレータ手先位置・姿勢と関節回転角の関係を求めら
れるようになる。
第1図は本発明の一実施例を示すマニピュレータ学習制
御系のブロック図、第2図は3自由度多関節マニピュレ
ータの構造図、第3図は第2図に示したマニピュレータ
を対象として学習制御を行なった場合のシミュレーショ
ン結果を示す図、第4図はsigmoid関数のパラメータk
を変えた場合の制御結果を示す図、第5図はsigmoid関
数のパラメータkを変えた場合の学習回数150〜200回の
制御精度の平均値を示す図、第6図はニューラルネット
ワーク入力値xdとしてランダムな値を用いた場合と、正
弦波信号を用いた場合の制御結果の比較を示す図、第7
図はニューラルネットワーク内のユニットを4層構造と
したマニピュレータ学習制御系を示すブロック図、第8
図は第7図に示す4層ユニットのニューラルネットワー
クを持つマニピュレータ学習制御系を用いた場合と、第
1図に示す3層ユニットの制御系を用いた場合の制御結
果の比較を示す図である。 1:3層ユニットのニューラルネットワーク、2:m自由度マ
ニピュレータ、3:4層ユニットのニューラルネットワー
ク。
御系のブロック図、第2図は3自由度多関節マニピュレ
ータの構造図、第3図は第2図に示したマニピュレータ
を対象として学習制御を行なった場合のシミュレーショ
ン結果を示す図、第4図はsigmoid関数のパラメータk
を変えた場合の制御結果を示す図、第5図はsigmoid関
数のパラメータkを変えた場合の学習回数150〜200回の
制御精度の平均値を示す図、第6図はニューラルネット
ワーク入力値xdとしてランダムな値を用いた場合と、正
弦波信号を用いた場合の制御結果の比較を示す図、第7
図はニューラルネットワーク内のユニットを4層構造と
したマニピュレータ学習制御系を示すブロック図、第8
図は第7図に示す4層ユニットのニューラルネットワー
クを持つマニピュレータ学習制御系を用いた場合と、第
1図に示す3層ユニットの制御系を用いた場合の制御結
果の比較を示す図である。 1:3層ユニットのニューラルネットワーク、2:m自由度マ
ニピュレータ、3:4層ユニットのニューラルネットワー
ク。
Claims (2)
- 【請求項1】ニューラルネットワークとマニピュレータ
とマニピュレータの手先位置姿勢測定装置を有するマニ
ピュレータ学習制御方法において、 マニピュレータの手先位置姿勢の目標値(xd)を3層構
造からなるニューラルネットワークに入力し、 前記ニューラルネットワークの出力値を制御指令値とし
て前記マニピュレータに入力し、 前記手先位置姿勢測定装置により測定されたマニピュレ
ータの手先位置姿勢データとニューラルネットの前記入
力データとを比較し、 比較結果を前記ニューラルネットワークのバックプロパ
ゲーション用信号として入力して学習させることを特徴
とするマニピュレータ学習制御方法。 - 【請求項2】前記3層構造のニューラルネットワークの
前段に、さらに前記マニピュレータの手先位置姿勢の目
標値(xd)のべき乗項を計算する層を設け、該層で生成
される目標値(xd)のべき乗項{1,xd,xd 2・・・xd k}
を前記3層構造のニューラルネットワークに入力するよ
うにしたことを特徴とする請求項第1項記載のマニピュ
レータ学習制御方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63205773A JP2629291B2 (ja) | 1988-08-19 | 1988-08-19 | マニピュレータ学習制御方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63205773A JP2629291B2 (ja) | 1988-08-19 | 1988-08-19 | マニピュレータ学習制御方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0253582A JPH0253582A (ja) | 1990-02-22 |
| JP2629291B2 true JP2629291B2 (ja) | 1997-07-09 |
Family
ID=16512431
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63205773A Expired - Fee Related JP2629291B2 (ja) | 1988-08-19 | 1988-08-19 | マニピュレータ学習制御方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2629291B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20230134890A (ko) * | 2022-03-15 | 2023-09-22 | 한국원자력연구원 | 다관절 로봇의 구동을 위한 기구학 모델링 방법, 장치 및 컴퓨터 프로그램 |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2728222B2 (ja) * | 1990-05-25 | 1998-03-18 | キヤノン株式会社 | 情報記録再生装置 |
| JPH05234112A (ja) * | 1992-02-21 | 1993-09-10 | Victor Co Of Japan Ltd | 光ディスク装置用トラッキング制御装置 |
| JPH05233042A (ja) * | 1992-02-25 | 1993-09-10 | Fanuc Ltd | 冗長自由度ロボットの姿勢制御方式 |
| JP2713834B2 (ja) * | 1992-06-10 | 1998-02-16 | ミサワホーム株式会社 | 建物の面材取付け構造 |
| EP0589394A1 (en) * | 1992-09-21 | 1994-03-30 | Toyoda Koki Kabushiki Kaisha | Method and apparatus for controlling a robot using a neural network |
| JP4776409B2 (ja) * | 2006-03-22 | 2011-09-21 | 株式会社カワデン | 電動バルブ |
| DE102009018991A1 (de) | 2009-05-01 | 2010-11-04 | Airbus Operations Gmbh | Vorrichtung zur räumlichen Ausrichtung von mindestens zwei Untergruppenbauteilen sowie Verfahren |
| JP7375587B2 (ja) * | 2020-02-05 | 2023-11-08 | 株式会社デンソー | 軌道生成装置、多リンクシステム、及び軌道生成方法 |
-
1988
- 1988-08-19 JP JP63205773A patent/JP2629291B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20230134890A (ko) * | 2022-03-15 | 2023-09-22 | 한국원자력연구원 | 다관절 로봇의 구동을 위한 기구학 모델링 방법, 장치 및 컴퓨터 프로그램 |
| KR102719462B1 (ko) * | 2022-03-15 | 2024-10-21 | 한국원자력연구원 | 다관절 로봇의 구동을 위한 기구학 모델링 방법, 장치 및 컴퓨터 프로그램 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0253582A (ja) | 1990-02-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0402849B1 (en) | Manipulator | |
| Köker | Reliability-based approach to the inverse kinematics solution of robots using Elman's networks | |
| JPH06314103A (ja) | 制御装置と能動的センシング装置 | |
| EP2188685A1 (en) | Inverse kinematics | |
| EP2105263A2 (en) | Real time control method and device for robots in virtual projection | |
| Wu et al. | A low-cost digital twin-driven positioning error compensation method for industrial robotic arm | |
| JP2629291B2 (ja) | マニピュレータ学習制御方法 | |
| JP2874238B2 (ja) | 多関節形ロボットの制御方法 | |
| CN115213905A (zh) | 冗余度机械臂位姿控制方法、系统及机器人 | |
| Eftekhari et al. | Neuro-fuzzy adaptive control of a revolute stewart platform carrying payloads of unknown inertia | |
| JPH0683427A (ja) | 柔軟マニピュレータの作業点位置制御システム | |
| Chen et al. | Robust neural dynamics for depth maintenance tracking control of robot manipulators with uncertainty and perturbation | |
| Knani | Dynamic modelling of flexible robotic mechanisms and adaptive robust control of trajectory computer simulation––Part I | |
| Rahmani et al. | Application of a novel elimination algorithm with developed continuation method for nonlinear forward kinematics solution of modular hybrid manipulators | |
| JPH05177563A (ja) | マスタスレーブマニピュレータの制御方法 | |
| Guo et al. | Data-driven mode shape selection and model-based vibration suppression of 3-rrr parallel manipulator with flexible actuation links | |
| JP4230196B2 (ja) | 位置決め演算方法および位置決め演算装置 | |
| JPH0699372A (ja) | ロボット制御装置 | |
| Lee et al. | On the control of mechanical manipulators | |
| JPH06114769A (ja) | オフラインティーチング装置 | |
| Cote et al. | Telemanipulator design and optimization software | |
| Andersson | Computing the feasible configurations of a 7-DOF arm subject to joint limits | |
| Ganin et al. | Redundant Manipulator Control System Simulation with Adaptive Neural Network and Newton-Raphson Refinement Algorithm | |
| Melinte et al. | Compensating dynamics of impedance haptic devices using neural networks | |
| Sharma et al. | A framework for active vision-based robot control using neural networks |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |