[go: up one dir, main page]

JP2005285090A - 多目的最適化装置、多目的最適化方法および多目的最適化プログラム - Google Patents

多目的最適化装置、多目的最適化方法および多目的最適化プログラム Download PDF

Info

Publication number
JP2005285090A
JP2005285090A JP2004368744A JP2004368744A JP2005285090A JP 2005285090 A JP2005285090 A JP 2005285090A JP 2004368744 A JP2004368744 A JP 2004368744A JP 2004368744 A JP2004368744 A JP 2004368744A JP 2005285090 A JP2005285090 A JP 2005285090A
Authority
JP
Japan
Prior art keywords
individual
fitness
individuals
optimization
objective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004368744A
Other languages
English (en)
Inventor
Hirotaka Kaji
洋隆 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2004368744A priority Critical patent/JP2005285090A/ja
Publication of JP2005285090A publication Critical patent/JP2005285090A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/80Technologies aiming to reduce greenhouse gasses emissions common to all road transportation technologies
    • Y02T10/82Elements for improving aerodynamics

Landscapes

  • Feedback Control In General (AREA)

Abstract

【課題】 最適化対象が不確実性を伴う場合でも、多様性を有する適切なパレート最適個体を短時間で得ることが可能な多目的最適化装置、多目的最適化方法および多目的最適化プログラムを提供する。
【解決手段】 多目的進化型アルゴリズム部2は、個体のパラメータの組を適応度推定部3の探索履歴記憶装置31に与えるとともに最適化対象6に与える。最適化対象6は、個体のパラメータの組に基づいて適応度のサンプル値の組を出力する。探索履歴記憶装置31は、個体のパラメータの組およびサンプル値の組を探索履歴として記憶する。適応度推定モジュール30は、探索履歴記憶装置31に記憶される探索履歴に基づいて真の適応度の推定値の組を算出し、推定値の組を多目的進化型アルゴリズム部2に与える。多目的進化型アルゴリズム部2は、複数組の推定値に基づいて遺伝的アルゴリズムにしたがってパレート最適個体集合を求める。
【選択図】 図1

Description

本発明は、最適化対象のパラメータを最適化する多目的最適化装置、多目的最適化方法および多目的最適化プログラムに関する。
従来、多目的最適化問題と呼ばれる問題クラスが存在する。例えば、ある製品のコストを最小化し、性能を最大化するという問題を考えた場合、これは2つの目的関数の多目的最適化問題となる。この場合、コストおよび性能が2つの目的関数となる。一般的には、コストを下げると性能が悪化し、性能を上げるとコストがかさむというトレードオフの関係が生じるために、多目的最適化問題の解は一つではない。
図36は多目的最適化問題をエンジンの最適化に適用した例を示す図である。多目的最適化問題をエンジンの燃費およびトルクの最適化に適用する場合、燃費およびトルクが2つの目的関数f1,f2である。この場合、燃料噴射量、点火時期等のパラメータを調整することにより目的関数f1,f2の値を最適化する。
解Aは、燃費が解Bに比べて優れているが、トルクが解Bに比べて劣っている。このように、エンジンの燃費とエンジンのトルクとはトレードオフの関係を有するため、複数の最適解が存在する。使用者は、複数の最適解から目的に合った解を選択することができる。例えば、スポーツ走行に適した自動二輪車に用いるエンジンには解Aを選択し、ロングツーリングに適した自動二輪車に用いるエンジンには解Bを選択する。
一般に多目的最適化問題は、N個のパラメータについてM個の目的関数の値を、各パラメータの制約条件の範囲で最小化する問題と定義される。目的関数の値を最大化する場合は、目的関数に負の符号を付けて目的関数の値を最小化する問題に変換することとする。
このような多目的最適化問題は、一般的に単一の最適解を持たず、パレート最適解と呼ばれる概念で定義される最適解集合を持つ。ここで、パレート最適解とは、ある目的関数の値を改善するためには、少なくとも1つの他の目的関数の値を改悪せざるを得ない解のことをいい、以下のように定義される(例えば、非特許文献1参照)。
〔定義1〕あるp個の目的関数fk(k=1,・・・,p)の2つの解x1,x2∈Fに関して、fk(x1)≦fk(x2)(∀k=1,・・・,p)∧fk(x1)<fk(x2)(∃k=1,・・・,p)のとき、x1はx2に優越するという。ここで、Fは解の集合である。
〔定義2〕ある解x0が他のすべての解x∈Fに優越するとき、x0は最適解である。
〔定義3〕ある解x0に優越する解x∈Fが存在しないとき、x0はパレート最適解(または非劣解)である。
パレート最適解集合を求めることは、目的関数のトレードオフに関して最適な解の集合を求めることになる。
図37はパレート最適解について説明するための図である。図37は2つの目的関数f1,f2の例を示す。解aについての目的関数f1の値f1(a)は解bについての目的関数f1の値f1(b)よりも小さく、解aについての目的関数f2 の値f2(a)は解bについての目的関数f2の値f2(b)よりも小さい。したがって、解aは解bに優越する。
同様に、解aは解c,dに優越する。解aに優越する解は存在しない。同様に、解e,fに優越する解も存在しない。したがって、解a,e,fはパレート最適解である。
なお、解gは、弱パレート最適解である。弱パレート最適解とは、ある目的関数についてのみパレート最適解に優越されないパレート解である。弱パレート最適解は、合理的な解ではなく、本来求める必要のない解である。
多目的最適化問題の解法は多数提案されている。最近注目されている方法に多目的進化型アルゴリズム(MOEAs:Multiple Objective Evolutionary Algorithm)がある。この方法の最大の特徴は、進化型アルゴリズムの多点探索を利用してパレート最適解集合を一度に求めることである。得られたパレ一ト最適解集合は、その中から目的に合致した解を探す意志決定、またはパレ一ト最適解集合(パレート境界)の形状からの知見の獲得等に用いられる。
進化型アルゴリズムとして遺伝的アルゴリズム(GA:Genetic Algorithm)を多目的最適化問題に適用する研究が数多く行われている。遺伝的アルゴリズムは、生物の適応進化を模倣した計算手法である。遺伝的アルゴリズムでは、解の候補を個体と呼ぶ。また、目的関数は適応関数と呼び、適応度関数の値を適応度と呼ぶ。
この遺伝的アルゴリズムは、自然進化に見られる過程(染色体の選択、交叉および突然変異)をヒントにして、J.Hollandにより提案されたアルゴリズムである。設計変数を遺伝子とみなして、初期設計の個体集合をランダムに生成し、各個体の適応度を評価する。適応度の良い個体ほど親として選択される可能性が高くなるように親を選択する。そして、交叉(遺伝子の入れ換え)および突然変異(遺伝子のランダムな変化)により子孫を作る。さらに、評価、選択、交叉および突然変異により世代を繰り返し、最適解を探索する。
具体的には、FonsecaらのMOGA(Multiple Objective Genetic Algorithm:例えば、非特許文献1参照)、DebらのNSGA−II(Non-Dominated Sorting Genetic Algorithm-II:例えば、非特許文献2参照)、ZitzlerらのSPEA2(Strength Pareto Evolutionary Algorithm 2: 例えば、非特許文献3参照)等が提案されている。特に、NSGA−IIおよびSPEA2は優秀な多目的進化型アルゴリズムとして知られている。
多目的進化型アルゴリズムは、実応用として、超音速旅客機の翼形状を求める問題、車体またはエンジン等のパラメ一タ最適化等に用いられている。
また、不確実性を伴う適応度関数の最適化のために、探索履歴を用いて真の適応度を推定するMFEGA(Memory-based Fitness Estimation Genetic Algorithm)が佐野、喜多らにより提案されている(例えば、非特許文献4参照)。ここで、MFEGAでは、過去に得られた個体の適応度のサンプル値を探索履歴として保存し、探索履歴を参照して真の適応度を推定する。MFEGAは、不確実性を持つ問題に関して、同一個体の適応度を複数回サンプリングする方法および通常の遺伝的アルゴリズムに比べて優秀な探索性能を持つことが報告されている。
C.M.fonseca,p.J.Flemimg:genetic algorithms for multiobjective optimization:formulation,discussion and generalization,of the 5th international conference on genetic algorithms,pp.416-423(1993) K.Deb,S.Agrawal,A.Pratab,and T.Meyarivan:A Fast Elitist Non-Dominated Sorting Genetic Algorithm for Multi-Objective Optimization:NSGA-II,KanGAL report 20001,Indian Institute of Technology,Kanpur,India(20OO) E.Zitzler,M.Laumanns,L.Thiele:SPEA2:Improving the Performance of the Strength Pareto Evolutionary A1gorithm,Technical Report 103,Computer Engineering and Communication Networks Lab(TIK),Swiss Federal Institute of Technology(ETH)Zurich(2001) 佐野,喜多:探索履歴を利用した遺伝的アルゴリズムによる不確実関数の最適化,電学論C 122巻6号,PP−1001−1008(2002) K.Ikeda, H.Kita, and S.Kobayashi : Failuer of Pareto-Based MOEAs, Does Non-Dominated Really Mean Near to Optimal? Congress on Evolutionary Computation, pp.957-962(2001) M.D.Berg, et.al. : Computational Geometry : Algorithms and Applications, Springer-Verlag (1997) 今井浩、今井桂子,計算幾何学,情報数学講座12,共立出版(1994) E.Zitzler, K.Deb, L,Thiele : Comparison of Mu1tiobjective Evo1utionary Algorithms : Empirical Results, Evolutionary Computation 8(2), pp.173-195 (2000)
しかしながら、上記非特許文献1〜非特許文献3に提案された遺伝的アルゴリズムは、いずれもベンチマ一ク問題または確率要素を含まない理想モデルのように、何度実行しても同じ解が得られるシミュレーションに適用されている。実システムまたは確率要素を含むシミュレーションのように、個体の適応度がノイズを伴う問題、いわゆる不確実性を持つ問題に上記の遺伝的アルゴリズムが適用された例は報告されていない。その理由としては次の2点が挙げられる。
第1に、最適化対象がノイズを伴うために、個体の評価ごとに最適化対象から得られる個体の適応度が変化し、進化が良好に進まないことが挙げられる。すなわち、ノイズにより適応度が悪化することにより、本来ならば良い適応度が得られるはずの個体が淘汰される。あるいは、ノイズにより適応度が向上することにより、本来ならば悪い適応度が得られるはずの個体が生き残る。このような現象が発生することにより、個体の正常な進化ができない。
第2に、得られるパレート最適解集合の形状が不明瞭であることが挙げられる。すなわち、得られる適応度がノイズを伴うために、例えば2目的最適化問題において適応度を適応度関数空間の平面にプロットした場合に、パレート境界が形成されない。したがって、従来の遺伝的アルゴリズムを意志決定または知見の獲得に用いることは困難である。
多目的最適化が必要とされる実システムおよび確率要素を含むシミュレーションとしては、例えば、交通流シミュレータを用いた信号切り替えルールの最適化およびモータの制御パラメータの最適化が挙げられる。信号切り替えルールの最適化は、2つの幹線道路の交差点およびその付近の信号を上手く切り替えて、どちらの道路も渋滞を起こさないようにすることを目的とする。モータの制御パラメータの最適化は、モータの即応性の向上およびオーバシュート量の減少を両立させることを目的とする。
しかし、交通流シミュレータの場合には、通行する車の速度および台数がランダムに与えられ、モータの場合には、センサの測定誤差等が生じるために、同一の個体(すなわちルールおよび制御パラメータ)を用いて適応度を算出しても、その都度異なる適応度が得られることになる。そのため、上記の2つの問題が生じることになる。
このような不確実性を伴う問題は、多目的最適化だけでなく、単目的最適化にとっても、非常に困難な問題である。進化型計算法においては、ノイズを統計的に処理するいくつかの方法が提案されている。最も一般的な方法は、個体を複数回サンプリングする方法である。この方法では、サンプリング回数をnとするとノイズの分散をn-0.5に低減することができる。しかしながら、この方法は、時間のかかる実システムまたは大規模シミュレーションの最適化においては、評価時間がn倍になるので好ましくはない。
また、非特許文献4において提案されたMFEGAは、単目的最適化問題に対して優秀な探索性能を発揮しているが、多目的最適化問題への応用については十分に検討されていない。
本発明の目的は、最適化対象が不確実性を伴う場合でも、多様性を有する適切なパレート最適個体を短時間で得ることが可能な多目的最適化装置、多目的最適化方法および多目的最適化プログラムを提供することである。
(1)第1の発明に係る多目的最適化装置は、最適化対象に個体のパラメータの組を与え、複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組を最適化対象から受ける多目的最適化装置であって、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組を記憶する記憶部と、記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める推定部と、推定部により求められた推定値に基づいて新たな個体を生成し、生成された個体のパラメータの組を最適化対象および記憶部に与えるとともに、推定部により求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める演算部とを備え、推定部は、記憶部に記憶された各個体に対応するサンプル値の組に重み付けを行い、重み付けられた複数組のサンプル値の線形和を求めることにより、注目個体に対応する適応度の推定値の組を求め、各個体の重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であり、演算部は、複数の適応度関数の各々について評価用個体集合の複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々についての比較結果に重み付けを行い、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて評価用個体集合の複数の個体のランク付けを行い、適応度関数空間上で評価用個体集合の最上位ランクの個体の分布における疎の程度を表す分布指標に基づいて新たな個体を生成するものである。
その多目的最適化装置においては、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組が記憶部に記憶される。記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組が推定部により求められる。推定値に基づいて演算部により新たな個体が生成され、生成された個体のパラメータの組が最適化対象および記憶部に与えられる。また、求められた複数組の推定値に基づいて評価用個体集合が多目的進化型アルゴリズムに従って演算部により評価される。それにより、パレート最適個体集合が求められる。
この場合、記憶部に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和が求められることにより、注目個体に対応する適応度の推定値の組が求められる。
各個体の重みはパラメータ空間上で注目個体とその個体との距離を含む関数であるので、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、複数の適応度関数の各々について評価用個体集合の複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々についての比較結果に重み付けが行われる。そして、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて評価用個体集合の複数の個体のランク付けが行われる。
それにより、弱パレート最適個体を淘汰することができる。また、最適化対象の不確実性により適応度のサンプル値がノイズを含む場合に、弱パレート最適個体がパレート最適個体と個体と判定されることが防止される。したがって、最適化対象が不確実性を有する場合でも、複数の適応度間の関係を考慮した合理的なパレート最適個体を求めることが可能となる。
さらに、適応度関数空間上での最上位ランクの個体の分布において、疎の程度を表す分布指標に基づいて新たな個体が生成される。それにより、適応度関数空間上の広い範囲に偏りのなく個体を容易に生成することが可能となる。したがって、多様性を有するパレート最適個体を短時間で得ることができる。
(2)推定部は、記憶部に記憶された複数の個体をhlとし、注目個体xに対応するサンプル値の組をF(x)とし、パラメータ空間上で注目個体から距離dl離れた個体に対応するサンプル値の組をF(hl)とし、k’を係数とし、l=1,…,Hとし、nを自然数とした場合に、
Figure 2005285090
で表される推定式により注目個体xに対応する真の適応度の推定値の組f’(x)を算出してもよい。
この場合、パラメータ空間上で注目個体と他の個体との距離を考慮して真の適応度からの誤差がより小さい推定値を得ることができる。
(3)nは1であってもよい。この場合、推定値の算出において、パラメータ空間上で注目個体から遠く離れた他の個体の影響が小さくなる。それにより、真の適応度からの誤差が十分に小さい推定値を得ることができる。
(4)nは3であってもよい。この場合、推定値の算出において、パラメータ空間上で注目個体から遠く離れた他の個体の影響が大幅に小さくなる。それにより、真の適応度からの誤差がさらに十分に小さい推定値を得ることができる。
(5)演算部は、p個の目的に対応するp個の適応度関数のうち一の適応度関数についての個体x1およびx2に対応する適応度の推定値をfk(x1)およびfk(x2)とし、p個の適応度関数のうち他の適応度関数についての個体x1およびx2に対応する適応度の推定値をfj(x1)およびfj(x2)とし、kおよびjを1,・・・,pとし、kはjとは異なり、αkjを重みとし、次式で表されるgk(x1,x2)がk=1,・・・,pのすべてに関してgk(x1,x2)≦0を満足しかつk=1,・・・,pの少なくとも1つに関してgk(x1,x2)<0の関係を有する場合に、個体x1が個体x2に優越すると判定してもよい。
Figure 2005285090
(6)複数の目的が2以上のm目的である場合に、分布指標はm個の目的に対応する適応度関数空間上で注目個体に隣接するm個の個体が形成する単体の大きさであり、演算部は、単体の大きさに基づいて疎の程度が最も高い個体を選択し、選択された個体を用いて新たな個体を生成してもよい。
この場合、適応度関数空間上での最上位ランクの個体の分布において、分布指標に基づいて個体が疎らな領域に新たな個体を容易に生成することが可能となる。それにより、多様性の高いパレート最適個体を容易に得ることができる。
(7)複数の目的が2目的である場合に、単体の大きさは適応度関数空間上で注目個体に隣接する2個体を結ぶ直線の長さで表され、複数の目的が3目的である場合に、単体の大きさは適応度関数空間上で注目個体に隣接する3個体を頂点とする三角形の面積で表され、複数の目的が4目的である場合に、単体の大きさは適応度関数空間上で注目個体に隣接する4個体を頂点とする三角錐の体積で表されてもよい。
この場合、最上位ランクの個体の分布において個体が疎らな領域を目的の数に応じて容易に判定することができる。
(8)複数の目的が4以上のm目的である場合に、単体の大きさは適応度関数空間上で注目個体に隣接するm個の個体が形成する単体の底(m−1)次元面積×高さ/mにより表されてもよい。
この場合、最上位ランクの個体の分布において個体が疎らな領域を目的の数に応じて容易に判定することができる。
(9)複数の目的が3以上の目的である場合に、単体はドローネ三角形分割法により形成されてもよい。この場合、分布指標である単体の大きさを容易に算出することができる。
(10)演算部は、生成された新たな個体が評価用個体集合の個体と異なる場合に、新たな個体を評価用個体集合の下位ランクの個体と置換してもよい。
この場合、パレート最適個体の探索初期には、緩やかに悪い個体を減少させることができ、パレート最適個体の探索後期には、パレート最適個体の多様性を維持することができる。
(11)演算部は、生成された新たな個体が評価用個体集合の個体と重複する場合に、新たな個体に最下位ランクを付与してもよい。
この場合、パレート最適個体の探索初期には、緩やかに悪い個体を減少させることができ、パレート最適個体の探索後期には、パレート最適個体の多様性を維持することができる。
(12)演算部は、評価用個体集合の各個体を1回ずつ評価してもよい。この場合、個体の再評価が行われないので、実システムまたは大規模シミュレーションのように1個体の評価に時間を要する場合でも、最適化時間の短縮が可能となる。
(13)推定部は、記憶部に記憶されるサンプル値の組の量が所定の記憶容量に達した場合に、最適化対象から出力されるサンプル値の組の記憶を終了してもよい。
この場合、記憶部に記憶された所定量のサンプル値の組を用いて適応度の推定値の組が求められる。それにより、最適化時間の短縮が可能となる。
(14)演算部は、推定部により求められた推定値の組に基づいてパレート最適個体を表示してもよい。
この場合、使用者は、パレート最適個体を視覚的に認識することができるので、種々の意思決定を容易に行うことができる。
(15)演算部は、多目的進化型アルゴリズムとして遺伝的アルゴリズムを用いて評価用個体集合の個体を評価してもよい。
この場合、遺伝的アルゴリズムに基づいて世代交代を行うことにより、最適なパレート最適個体を容易に得ることができる。
(16)最適化対象は、機器の複数の性能を評価するための評価システムを含み、パラメータの組は、評価システムのための制御用パラメータの組を含み、複数の適応度関数は評価システムの評価により得られる複数の性能であり、適応度の組は複数の性能の値であってもよい。
この場合、評価システムに制御用パラメータの組が与えられる。評価システムにより制御用パラメータの組に基づいて機器の性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、評価システムが不確実性を伴う場合でも、多様性を有する適切な制御用パラメータの組の集合をパレート最適個体として短時間で得ることができる。
(17)機器はエンジンであってもよい。この場合、評価システムにエンジン制御用パラメータの組が与えられる。評価システムによりエンジン制御用パラメータの組に基づいてエンジンの性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、評価システムが不確実性を伴う場合でも、多様性を有する適切なエンジン制御用パラメータの組の集合をパレート最適個体として短時間で得ることができる。
(18)機器はモータであってもよい。この場合、評価システムにモータ制御用パラメータの組が与えられる。評価システムによりモータ制御用パラメータの組に基づいてモータの性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、評価システムが不確実性を伴う場合でも、多様性を有する適切なモータ制御用パラメータの組の集合をパレート最適個体として短時間で得ることができる。
(19)評価システムは、パラメータの組に基づいて機器を制御するとともに機器の動作により発生される複数の性能の値をサンプル値として出力する機器評価装置であってもよい。
この場合、機器評価装置に制御用パラメータの組が与えられる。機器評価装置により制御用パラメータの組に基づいて機器の性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、機器評価装置が不確実性を伴う場合でも、多様性を有する適切な制御用パラメータの組の集合をパレート最適個体として短時間で得ることができる。
(20)評価システムは、パラメータの組に基づいて機器の動作をシミュレーションすることにより複数の性能を評価し、評価された複数の性能の値をサンプル値の組として出力する機器シミュレータであってもよい。
この場合、機器シミュレータに制御用パラメータの組が与えられる。機器シミュレータにより制御用パラメータの組に基づいて機器の動作がシミュレーションされることにより複数の性能が評価され、評価された複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、機器シミュレータが不確実性を伴う場合でも、多様性を有する適切な制御用パラメータの組の集合をパレート最適個体として短時間で得ることができる。
(21)第2の発明に係る多目的最適化方法は、最適化対象に個体のパラメータの組を与え、最適化対象から出力される複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化する多目的最適化方法であって、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組を記憶部に記憶するステップと、記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求めるステップと、求められた推定値に基づいて新たな個体を生成し、生成された個体のパラメータの組を最適化対象および記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求めるステップとを備え、推定値の組を求めるステップは、記憶部に記憶された各個体に対応するサンプル値の組に重み付けを行い、重み付けられた複数組のサンプル値の線形和を求めることにより、注目個体に対応する適応度の推定値の組を求めるステップを含み、各個体の重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であり、パレート最適個体を求めるステップは、複数の適応度関数の各々について評価用個体集合の複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々についての比較結果に重み付けを行い、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて評価用個体集合の複数の個体のランク付けを行うステップと、適応度関数空間上で評価用個体集合の最上位ランクの個体の分布における疎の程度を表す分布指標に基づいて新たな個体を生成するステップとを含むものである。
その多目的最適化方法においては、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組が記憶部に記憶される。記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組が求められる。推定値に基づいて新たな個体が生成され、生成された個体のパラメータの組が最適化対象および記憶部に与えられる。また、求められた複数組の推定値に基づいて評価用個体集合が多目的進化型アルゴリズムに従って評価される。それにより、パレート最適個体集合が求められる。
この場合、記憶部に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和が求められることにより、注目個体に対応する適応度の推定値の組が求められる。
各個体の重みはパラメータ空間上で注目個体とその個体との距離を含む関数であるので、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、複数の適応度関数の各々について評価用個体集合の複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々についての比較結果に重み付けが行われる。そして、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて評価用個体集合の複数の個体のランク付けが行われる。
それにより、弱パレート最適個体を淘汰することができる。また、最適化対象の不確実性により適応度のサンプル値がノイズを含む場合に、弱パレート最適個体がパレート最適個体と個体と判定されることが防止される。したがって、最適化対象が不確実性を有する場合でも、複数の適応度間の関係を考慮した合理的なパレート最適個体を求めることが可能となる。
さらに、適応度関数空間上での最上位ランクの個体の分布において、疎の程度を表す分布指標に基づいて新たな個体が生成される。それにより、適応度関数空間上の広い範囲に偏りのなく個体を容易に生成することが可能となる。したがって、多様性を有するパレート最適個体を短時間で得ることができる。
(22)第3の発明に係る多目的最適化プログラムは、最適化対象に個体のパラメータの組を与え、最適化対象から出力される複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化する、コンピュータにより実行可能な多目的最適化プログラムであって、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組を記憶部に記憶する処理と、記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める処理と、求められた推定値に基づいて新たな個体を生成し、生成された個体のパラメータの組を最適化対象および記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める処理とをコンピュータに実行させ、推定値の組を求める処理は、記憶部に記憶された各個体に対応するサンプル値の組に重み付けを行い、重み付けられた複数組のサンプル値の線形和を求めることにより、注目個体に対応する適応度の推定値の組を求める処理を含み、各個体の重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であり、パレート最適個体を求める処理は、複数の適応度関数の各々について評価用個体集合の複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々についての比較結果に重み付けを行い、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて評価用個体集合の複数の個体のランク付けを行う処理と、適応度関数空間上で評価用個体集合の最上位ランクの個体の分布における疎の程度を表す分布指標に基づいて新たな個体を生成する処理とを含むものである。
その多目的最適化プログラムにおいては、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組が記憶部に記憶される。記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組が求められる。推定値に基づいて新たな個体が生成され、生成された個体のパラメータの組が最適化対象および記憶部に与えられる。また、求められた複数組の推定値に基づいて評価用個体集合が多目的進化型アルゴリズムに従って評価される。それにより、パレート最適個体集合が求められる。
この場合、記憶部に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和が求められることにより、注目個体に対応する適応度の推定値の組が求められる。
各個体の重みはパラメータ空間上で注目個体とその個体との距離を含む関数であるので、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、複数の適応度関数の各々について評価用個体集合の複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々についての比較結果に重み付けが行われる。そして、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて評価用個体集合の複数の個体のランク付けが行われる。
それにより、弱パレート最適個体を淘汰することができる。また、最適化対象の不確実性により適応度のサンプル値がノイズを含む場合に、弱パレート最適個体がパレート最適個体と個体と判定されることが防止される。したがって、最適化対象が不確実性を有する場合でも、複数の適応度間の関係を考慮した合理的なパレート最適個体を求めることが可能となる。
さらに、適応度関数空間上での最上位ランクの個体の分布において、疎の程度を表す分布指標に基づいて新たな個体が生成される。それにより、適応度関数空間上の広い範囲に偏りのなく個体を容易に生成することが可能となる。したがって、多様性を有するパレート最適個体を短時間で得ることができる。
本発明によれば、最適化対象が不確実性を伴う場合でも、多様性を有する適切なパレート最適個体を短時間で得ることが可能となる。
(1)第1の実施の形態
まず、本発明の第1の実施の形態に係る多目的最適化装置を図1に基づき説明する。
(a)多目的最適化装置の機能的な構成
図1は本発明の第1の実施の形態に係る多目的最適化装置の機能的な構成を示すブロック図である。
図1の多目的最適化装置1は、多目的進化型アルゴリズムとして多目的遺伝的アルゴリズム(GA)を利用して多目的最適化問題のパレート最適個体集合を算出する。この多目的最適化装置1は、最適化対象6に接続される。
最適化対象6は、機器の性能を評価する評価システムである。評価システムは、実システムを評価する評価装置または確率要素を含むシミュレータである。実システムは、例えばエンジンまたはモータであり、評価装置は、例えばエンジン評価装置またはモータ評価装置である。また、シミュレータは、例えばエンジンシミュレータまたはモータシミュレータである。本実施の形態では、最適化対象6はエンジン評価装置である。
多目的最適化装置1は、多目的進化型アルゴリズム部2、適応度推定部3、出力インタフェース4および入力インタフェース5を含む。適応度推定部3は、適応度推定モジュール30および探索履歴記憶装置31を含む。
多目的進化型アルゴリズム部2および適応度推定部3の適応度推定モジュール30は、後述するCPU101(図2)が多目的最適化プログラムを実行することにより実現される。探索履歴記憶装置31は、後述する外部記憶装置106(図2)により構成される。
使用者10は、多目的進化型アルゴリズム部2に複数の適応度関数(目的関数)を設定する。本実施の形態では、複数の適応度関数としては、燃費、トルク、エンジンの排気ガスに含まれるCO(一酸化炭素)、HC(炭化水素)、NOx (窒素酸化物)等の成分の濃度等のうち複数が設定される。
ここで、トレードオフの関係としては、トルクと燃費、トルクとCO濃度、トルクとHC濃度、燃費とNOx 濃度、CO濃度とNOx 濃度、HC濃度とNOx 濃度等が挙げられる。
また、多目的遺伝的アルゴリズムの個体とは、多目的最適化問題の解の候補であり、複数のパラメータの組および複数の適応度を有する。パラメータは、調整可能な値であり、遺伝的アルゴリズムでは、遺伝子と呼ばれる。パラメータとしては、燃料噴射量、燃料噴射時期、点火時期、スロットル開度等が挙げられる。適応度は、適応度関数の値である。以下、多目的遺伝的アルゴリズムの個体を単に個体と呼ぶ。
多目的進化型アルゴリズム部2は、後述する適応度推定モジュール30により算出された真の適応度の推定値を受け、個体のパラメータの組を適応度推定部3の探索履歴記憶装置31に与えるとともに出力インタフェース4を介して最適化対象6に与える。
最適化対象6は、多目的最適化装置1から与えられた個体のパラメータの組に基づいて適応度のサンプル値の組を出力する。最適化対象6から出力される各サンプル値は、後述するように、真の適応度およびノイズ成分を含む。サンプル値の詳細については、後述する。
最適化対象6から出力されるサンプル値の組は、入力インタフェース5を介して適応度推定部3の探索履歴記憶装置31に入力される。探索履歴記憶装置31は、個体のパラメータの組およびサンプル値の組を探索履歴として記憶する。以下、探索履歴に含まれる個体のパラメータおよびサンプル値の各組を履歴データと呼ぶ。
適応度推定モジュール30は、探索履歴記憶装置31に記憶される探索履歴の履歴データに基づいて真の適応度の推定値の組を算出し、推定値の組を多目的進化型アルゴリズム部2に与える。以下、真の適応度の推定値を単に適応度の推定値または推定値と呼ぶ。
多目的進化型アルゴリズム部2は、複数組の推定値に基づいて遺伝的アルゴリズムにしたがって複数の個体を発生して多点探索を行い、適応度関数をパレート最適性で評価することにより、パレート最適個体集合を同時に求める。また、多目的進化型アルゴリズム部2は、求められたパレート最適個体集合を使用者10に提示する。
このように、多目的進化型アルゴリズム部2および適応度推定部3は、協働することにより個体のパラメータの最適化を行う。
多目的進化型アルゴリズム部2および適応度推定部3の詳細な動作については後述する。
(b)多目的最適化装置のハードウエア構成
図2は図1の多目的最適化装置1のハードウエア構成を示すブロック図である。
多目的最適化装置1は、CPU(中央演算処理装置)101、ROM(リードオンリメモリ)102、RAM(ランダムアクセスメモリ)103、入力装置104、表示装置105、外部記憶装置106、記録媒体駆動装置107および入出力インタフェース108を含む。
入力装置104は、キーボード、マウス等からなり、各種指令および各種データを入力するために用いられる。ROM102にはシステムプログラムが記憶される。記録媒体駆動装置107は、CD(コンパクトディスク)ドライブ、DVD(デジタルバーサタイルディスク)ドライブ、フレキシブルディスクドライブ等からなり、CD、DVD、フレキシブルディスク等の記録媒体109に対してデータの読み書きを行う。
記録媒体109には、多目的最適化プログラムが記録されている。外部記憶装置106は、ハードディスク装置等からなり、記録媒体駆動装置107を介して記録媒体109から読み込まれた多目的最適化プログラムおよび各種データを記憶する。CPU101は、外部記憶装置106に記憶された多目的最適化プログラムをRAM103上で実行する。
表示装置105は、液晶表示パネル、CRT(陰極線管)等からなり、パレート最適個体集合等の各種画像を表示する。入出力インタフェース108は、図1の出力インタフェース4および入力インタフェース5を含む。この入出力インタフェース108には最適化対象6が無線通信または有線通信により接続される。入出力インタフェース108は、最適化対象6から出力されるサンプル値の組を外部記憶装置106に転送するとともに、多目的最適化プログラムにより生成された個体のパラメータの組を最適化対象6に与える。
なお、多目的最適化プログラムを記録する記録媒体109として、ROM等の半導体メモリ、ハードディスク等の種々の記録媒体を用いることができる。また、多目的最適化プログラムを通信回線等の通信媒体を介して外部記憶装置106にダウンロードし、RAM103上で実行してもよい。
ここで、記録媒体109は、コンピュータで読み取り可能な記録媒体であれば、電子的読み取り方式、磁気的読み取り方式、光学的読み取り方式またはその他のあらゆる読み取り方式の記録媒体を含むものである。例えば、上記のCD、DVDおよびフレキシブルディスクの他、CDV(コンパクトディスクビデオ)等の光学的読取方式記録媒体、RAM、ROM等の半導体記録媒体、ハードディスク等の磁気記録型記録媒体、MO(光磁気ディスク)等の磁気記憶型/光学的読取方式記録媒体を用いることができる。
(c)最適化対象の構成
図3は最適化対象6の構成の一例を示すブロック図である。図3の最適化対象6はエンジン評価装置である。
最適化対象6は、エンジン61、ECU(エンジン制御ユニット)62、排気ガス分析計63、コントローラ64、スロットルユニット65およびダイナモ66を含む。
ECU62は、多目的最適化装置1からシリアル通信によりパラメータの組を受ける。本例では、パラメータの組は、点火時期および燃料噴射時期である。ECU62は、パラメータの組に基づいてエンジン61の点火時期および燃料噴射時期を制御する。エンジン61からコントローラ64に回転数、空燃比等のエンジン情報が与えられる。
コントローラ64は、エンジン情報に基づいてスロットルユニット65およびダイナモ66を制御する。スロットルユニット65は、エンジン61の吸入空気量を調整することによりエンジン61の出力トルクを制御する。ダイナモ66は、負荷トルクを制御する。
排気ガス分析計63は、エンジン61からの排気ガス中の成分を分析し、HC濃度およびNOx濃度をサンプル値の組としてシリアル通信により多目的最適化装置1に出力する。
図4はHC濃度、NOx濃度およびCO濃度と空燃比との関係を示す図である。
燃料が完全に燃焼すれば、排気ガスに二酸化炭素と水とが含まれる。しかし、運転状態が変化すると燃焼状態も変化し、排気ガスにCO、HCおよびNOxが含まれる。
図4に示すように、空燃比が小さいと、HC濃度およびNOx 濃度が低くなる。NOx 濃度は空燃比が理論空燃比(14.7)よりやや小さいときに最大となり、それ以外の領域では減少する。理論空燃比付近では、HC濃度とNOx 濃度はトレードオフの関係を有し、CO濃度とNOx 濃度とはトレードオフの関係を有する。
図3の最適化対象6は、多目的最適化装置1から個体のパラメータの組として点火時期および燃料噴射時期を受け、サンプル値の組としてHC濃度およびNOx 濃度を出力する。
(d)多目的最適化装置の全体処理
図5および図6は図1の多目的最適化装置1の全体処理を示すフローチャートである。
図5に示すように、最適化処理が開始されると、多目的進化型アルゴリズム部2は、初期個体集合として親個体集合Pを各パラメータの定められた範囲内でランダムに生成することにより親個体集合Pを初期化し、生成された親個体集合Pの各個体のパラメータの組を最適化対象6に順次与える(ステップS1)。それにより、最適化対象6から適応度のサンプル値の組が順次出力される。
なお、事前知識として知られているパレート最適個体が存在する場合は、そのパレート最適個体を初期個体集合の一部として用いてもよい。それにより、パレート最適個体の探索の収束性の向上が期待できる。
適応度推定部3の探索履歴記憶装置31は、最適化対象6から親個体集合Pの各個体に対応するサンプル値の組を取得し、親個体集合Pのパラメータの組およびサンプル値の組を探索履歴として記憶する(ステップS2)。
次に、適応度推定部3の適応度推定モジュール30は、探索履歴記憶装置31に記憶された複数の個体に対応するサンプル値の組に基づいて親個体集合Pの各個体の適応度の推定値の組を算出する(ステップS3)。適応度の推定値の算出方法については後述する。
次に、多目的進化型アルゴリズム部2は、適応度の推定値の組に基づく優劣比較およびパレートランキングにより親個体集合Pをランクごとの個体集合に分割する(ステップS4)。パレートランキングについては後述する。
次に、多目的進化型アルゴリズム部2は、親個体集合Pの各ランクの個体集合に混雑度ソートを行う(ステップS5)。それにより、各ランクの個体が混雑度(混雑距離)の大きい順に並べられる。混雑度ソートについては後述する。そして、より上位のランクでより大きな混雑度を有する所定数の個体が選択され、他の個体が削除される。
さらに、多目的進化型アルゴリズム部2は、親個体集合Pの最上位ランク(ランク1)の個体集合から特定の3つの親個体を選択するとともに、3つの親個体に交叉操作を施すことにより子個体集合Cを生成し、生成された子個体集合Cの各個体のパラメータの組を最適化対象6に順次与える(ステップS6)。それにより、最適化対象6から適応度のサンプル値の組が順次出力される。
ここで、交叉操作とは、個体の遺伝子を掛け合わせることにより新たな個体を生成することをいう。特定の親個体の選択方法については後述する。
適応度推定部3の探索履歴記憶装置31は、最適化対象6から出力される子個体集合Cの各個体に対応する適応度のサンプル値の組を取得し、各個体に対応するパラメータの組およびサンプル値の組を探索履歴として記憶する(ステップS7)。
次いで、多目的進化型アルゴリズム部2は、子個体集合Cと親個体集合Pとから個体集合Fを生成する(ステップS8)。
適応度推定部3の適応度推定モジュール30は、探索履歴記憶装置31に記憶された複数組のサンプル値に基づいて個体集合Fの各個体に対応する適応度の推定値の組を算出する(ステップS9)。
多目的進化型アルゴリズム部2は、適応度の推定値の組に基づく優劣比較およびパレートランキングにより個体集合Fをランクごとの個体集合に分割し、子個体集合Cにおいて親個体集合Pの個体と重複する個体に最下位ランクを付与する(ステップS10)。
次に、多目的進化型アルゴリズム部2は、個体集合Fの各ランクの個体集合に混雑度ソートを行って新たな親個体集合Pを生成する(ステップS11)。それにより、各ランクの個体が混雑度(混雑距離)の大きい順に並べられる。混雑度ソートについては後述する。そして、より上位のランクでより大きな混雑度を有する所定数の個体が選択され、他の個体が削除される。
その後、多目的進化型アルゴリズム部2は、世代数が所定の終了条件に到達したか否かを判定する(ステップS12)。
ここで、世代とは、個体集合から親個体を選択する選択ステップ、交叉操作により新たな子個体を生成する交叉ステップおよび親個体と子個体とを入れ替える世代交代ステップから構成される。世代数が所定の終了条件に到達していないと判定した場合には、ステップS6に移行する。世代数が所定の終了条件に到達したと判定した場合には、多目的進化型アルゴリズム部2は、ステッブS11で生成された親個体集合Pをパレート最適個体集合として使用者10に提示し、処理を終了する。
(e)多目的最適化装置の各処理の具体例
図7〜図12は多目的最適化装置1の各処理の具体例を示す模式図である。
図7〜図12には、2つのパラメータx1,x2および2つの適応度関数f1,f2の例が示される。図3の最適化対象6の場合には、パラメータx1,x2は点火時期および燃料噴射時期であり、適応度関数f1,f2はHC濃度およびNOx 濃度である。
(e−1)親個体集合の初期化
図7は初期化により生成される親個体集合を示す模式図であり、(a)は適応度関数空間における親個体集合を示し、(b)はパラメータ空間における親個体集合を示す。初期化においては、図7に示すように、適応度関数空間およびパラメータ空間に複数の個体がランダムに生成される。
(e−2)個体の評価方法
多目的最適化問題においては、個体が複数の適応度関数に対応する適応度を有するため、単純な値の大小では個体の優劣を比較できない。本実施の形態では、以下に説明する優劣比較、パレートランキングおよび混雑度ソートを用いて個体を評価する。
(e−2−1)優劣比較
図5のステップS4および図6のステップS10における優劣比較について説明する。この優劣比較には、以下に示すα優越戦略(α-domination strategy)が用いられる。なお、α優越戦略の詳紬については、例えば、非特許文献5に掲載されている。
図8はα優越戦略を説明するための模式図である。ここで、一般に、α優越は、次のように定義される。
あるp個の目的度関数fk(k=1,・・・,p)の2つの解x1,x2∈Fに対して次式(8)で表されるgk(x1,x2)が次の関係を有する場合、解x1は解x2にα優越する。
k(x1,x2)≦0(∀k=1,・・・,p)∧gk(x1,x2)<0(∃k=1,・・・,p)
Figure 2005285090
上式において、fk(x1)およびfj(x1)はそれぞれ解x1に対応する目的度関数fkおよびfjの値であり、fk(x2)およびfj(x2)はそれぞれ解x2に対応する目的度関数fkおよびfjの値である。多目的遺伝的アルゴリズムでは、解x1および解x2が個体に相当し、目的関数fkおよびfjが適応度関数に相当する。
ここで、図8において、個体I3に注目する。一般的な優越比較によれば、個体I3から適応度関数f1に平行に延びる直線L11および個体I3から適応度関数f2に平行に延びる直線L12で個体I3が他の個体に優越する領域が定められる。すなわち、個体I3は、直線L11よりも上でかつ直線L12より右の領域にある他の個体I6,I7,I8に優越する。個体I2,I4は、個体I3により優越されない。
個体I2は、適応度関数f1に関しては個体I3によりもわずかに優れているが、適応度関数f2に関しては個体I3よりもかなり劣っている。個体I4は、適応度関数f2に関しては個体I3によりもわずかに優れているが、適応度関数f1に関しては個体I3よりもかなり劣っている。このような個体I2,I4の適応度が不確実性(例えばノイズ)を有する場合には、個体I2,I4は個体I3により優越される可能性がある。
これに対して、α優越戦略によれば、個体I3から適応度関数f1の軸に近づくように傾斜した直線L1および個体I3から適応度関数f2の軸に近づくように傾斜した直線L2により個体I3が他の個体に優越する領域が定められる。すなわち、個体I3は、直線L1よりも上側でかつ直線L2より右側の領域にある個体I2,I4,I6,I7,I8に優越する。α優劣戦略によれば、個体I2,I4はパレート最適個体から排除される。
本実施の形態では、α優越戦略により複数の適応度の推定値の重み付線形和に基づいて個体の優劣比較が行われる。α優越戦略によれば、ある個体の1つの適応度が1悪くなれば、他の適応度はα悪くなる。すなわち、優劣比較において、1つの適応度の優劣が他の適応度の優劣に影響を与える。それにより、次のように、複数の適応度間の関係を考慮した合理的な解を求めることが可能となる。
弱パレート最適個体は、複数の適応度のうち少なくとも1つが他の個体に優越されない(すなわち少なくとも1つの適応度があるパレート最適解と等しい)解である。このような弱パレート最適個体は、ある適応度関数について最適解を有するが、残りの適応度関数についてはパレート最適個体に劣る。したがって、弱パレート最適個体は、合理的な解とは言えず、本来は求める必要の無い解である。そこで、α優越戦略を導入することにより、弱パレート最適個体を淘汰することができる。
また、適応度が不確実性を伴っている場合、弱パレート最適個体が不確実性によりパレート最適個体となる現象が生じる。弱パレート最適個体が不確実性によりパレート最適個体と判定されると、いつまでも淘汰されることなく個体集合中に存続することとなり、パレート最適個体の探索が停滞する原因となる。そこで、α優越戦略を導入することにより、このようなパレート最適個体と判定される弱パレート最適個体を淘汰することが可能となる。
図9はα優劣戦略による個体の優劣比較を説明するための模式図である。
図9において、個体I3は個体I2,I4,I5,I6,I7に優越しており、個体I6は個体I8に優越しており、個体I7は個体I8に優越している。個体I1,I3,I5を優越する個体はない。よって、個体I1,I3,I5パレート最適個体である。
(e−2−2)パレートランキング
次に、図5のステップS4および図6のステップS10のパレートランキングについて説明する。図10はパレートランキングを説明するための図である。パレートランキングでは、各個体のランク付けに基づいてパレート最適個体集合を求める。
i個の個体に優越されている個体xiのランクr(xi)は次式で与えられる。
r(xi)=1+pi
ここでは、ランク1を最上位ランクとし、それ以上の数値のランクは数値が大きくなるほど下位のランクとなることにする。
図10において、個体I1,I3,I5は他の個体に優越されていない。したがって、個体I1,I3,I5のランクは1である。個体I2,I4は1つの個体I3に優越されている。したがって、個体I2,I4のランクは2である。同様にして、個体I6のランクは6であり、個体I7のランクは5であり、個体I8のランクは8である。
(e−2−3)混雑度ソート
次に、図5のステップS5および図6のステップS11における混雑度ソートについて説明する。図11は混雑度ソートを説明するための模式図である。
混雑度ソートでは、同じランクの各注目個体について、それに隣接する2つの個体を結ぶ線を対角線とする長方形を想定し、長方形の縦および横の辺の長さの合計で混雑度(混雑距離)を表す。混雑度の値が小さいほど注目個体は混雑した領域に存在する。同じランクの両端の個体には最大の混雑度を与える。
図11において、個体I3の混雑度は、隣接する個体I1,I5が作る長方形s1の縦および横の辺の合計で表される。個体I1の混雑度は、隣接する個体I9,I3が作る長方形s2の縦および横の辺の合計で表される。個体I5の混雑度は、隣接する個体I3,I10が作る長方形s3の縦および横の辺の合計で表される。
図12は多目的進化型アルゴリズム部2による混雑度ソートの処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、個体集合を適応度関数ごとにソートし、適応度関数ごとに同一ランク内で各注目個体に隣接する2つの個体を調べる(ステップS31)。
次に、多目的進化型アルゴリズム部2は、各注目個体に隣接する2つの個体間の数学的距離を適応度関数ごとに算出し、各注目個体についての複数の適応度関数における数学的距離の合計を混雑度として算出する(ステップS32)。ここで、数学的距離としてはユークリッド距離を用いる。
その後、多目的進化型アルゴリズム部2は、各ランクの個体集合の個体を混雑度の値の大きい順にソートする(ステップS33)。
(e−3)探索履歴による推定値の算出
次に、図5のステップS3および図6のステップS9における推定値の算出について説明する。
図13は適応度推定部3の適応度推定モジュール30による推定値の算出を説明するための模式図である。
図1の探索履歴記憶装置31には、多目的進化型アルゴリズム部2から与えられる個体のパラメータの組および最適化対象6から出力される適応度のサンプル値の組が探索履歴HSとして順次記憶される。図13においては、個体ごとにパラメータx1,x2の組およびサンプル値F1,F2の組が探索履歴HSとして記憶されている。
適応度推定モジュール30は、探索履歴HSに基づいて各個体に対応する真の適応度を推定値として算出する。各個体に対応するパラメータの組および推定値の組は、推定結果Eとして図1の探索履歴記憶装置31に記憶される。
図13に示すように、探索履歴記憶装置31には、個体ごとにパラメータx1,x2の組および推定値f1’,f2'の組が推定結果Eとして記憶されている。
また、適応度推定モジュール30は、各個体のパラメータの組および推定値の組に基づいて適応度関数空間およびパラメータ空間上のパレート最適個体集合を図2の表示装置105の画面に表示することができる。
図13においては、適応度関数f1,f2からなる適応度関数空間上およびパラメータx1,x2からなるパラメータ空間上にパレート最適個体集合が表示されている。パレート最適個体集合が形成する境界をパレート境界と呼ぶ。
このように、探索履歴記憶装置31に記憶された探索履歴HSを用いて個体の適応度を推定する方法をメモリベース適応度推定法(Memory-based Fitness Estimated Method:MFEM)と呼ぶ(非特許文献5参照)。
注目個体の推定値を算出する場合、一般に注目個体と探索履歴HSの個体とは異なる探索点である。また、不確実な環境を想定するため、最適化対象6に同じパラメータの組を与えても、異なるサンプル値の組が出力される。したがって、探索履歴HSのサンプル値の組から注目個体の推定値の組を算出するためには適応度関数の性質に何らかの仮定を設ける必要がある。MFEMでは、適応度関数が注目個体からの数学的距離に応じてランダムに変動すると考えて不確実な環境をモデル化している。
注目個体をxとし、その注目個体xの真の適応度をf(x)とする。パラメータ空間において注目個体xから距離dだけ離れた個体hの適応度f(h)を考える。適応度f(h)の期待値がf(x)であり、適応度f(h)の分散が距離dに比例して増大する正規分布に従うモデルは次式(1)で表される。
f(h)〜N(f(x),kd) …(1)
上式(1)において、kは距離による重みを決定する正の定数であり、N(f(x),kd)は平均がf(x)でかつ分散がkdである正規分布の確率密度関数を表す。
ここで、真の適応度f(x)には、平均0および分散σE 2 でかつ個体の位置に無関係な正規分布に従うノイズδが加わるものとする。この場合、個体xに対応するサンプル値F(x)は次式のように定義される。
F(x)=f(x)+δ …(2)
図14は正規分布に従うノイズδを伴うサンプル値を示す模式図である。ここで、サンプル値F(x)は適応度関数f1についてのサンプル値F1(x)および適応度関数f2についてのサンプル値F2(x)の組であり、真の適応度f(x)は適応度関数f1についての真の適応度f1(x)および適応度関数f2についての真の適応度f2(x)の組である。また、ノイズδは適応度関数f1についてのノイズδ1および適応度関数f2についてのノイズδ2の組である。ノイズδi(i=1,2)は次式で表される。
δi〜N(0,σEi 2 ) (i=1,2)
上式において、N(0,σEi 2 )は平均0および分散σE 2である正規分布の確率密度関数を表す。
適応度推定部3は、サンプル値F(x)の期待値を最小にするパレート最適個体集合を求める。このとき、個体hに対応するサンプル値F(h)は、次式(3.1)および(3.2)としてモデル化される。
F(h)〜N(f(x),kd+σE 2 ) …(3.1)
d=|h−x|・・・(3.2)
上式(3.1)において、N(f(x),kd+σE 2 )は平均がf(x)でありかつ分散がkd+σE 2 である正規分布の確率密度関数を表す。
図15は不確実な適応度関数のモデルを示す模式図である。このモデルでは、注目個体xから遠く離れるほどサンプル値F(h)が大きく不規則に変化するものと仮定している。
このモデルに基づいて探索履歴HSを用いた最尤法により真の適応度f(x)の推定値を算出する。
探索履歴HSに記憶された個体hl(l=1,…,H)、個体hlのサンプル値F(hl)および注目個体xから個体hlまでの距離dl(l=1,…,H)を考えると、サンプル値F(hl),…,F(hH)が得られる確率は次式により表わすことができる。
Figure 2005285090
ここで、p(F(hl),dl)は、サンプル値F(hl)が得られる確率を表す確率密度関数であり、次式で表すことができる。
Figure 2005285090
ここで、k’=k/σE 2 である。本実施の形態においては、定数k’は事前実験にて求めるものとする。非特許文献4には、探索中に定数k’を推定する方法が提案されている。提案された方法により定数k’を求めてもよい。
上記式(4)および(5)を真の適応度f(x)の尤度と考え、最尤法を用いる。それにより、真の適応度f(x)の推定値f’(x)は、次式(6)に示すように、距離dlを含む関数により重み付けされた加重平均の式で表すことができる。
Figure 2005285090
図16は適応度推定部3の適応度推定モジュール30による推定値の算出処理を示すフローチャートである。
まず、適応度推定モジュール30は、多目的進化型アルゴリズム部2において親個体集合Pが初期化されたことを確認する(ステップS41)。次に、適応度推定モジュール30は、探索履歴記憶装置31の探索履歴HSをすべてクリアする(ステップS42)。
その後、適応度推定モジュール30は、最適化対象6から出力されるサンプル値の組を探索履歴記憶装置31に探索履歴HSとして記憶する(ステップS43)。次いで、適応度推定モジュール30は、探索履歴記憶装置31の探索履歴HSに基づいて上記式(6)より各個体に対応する真の適応度の推定値の組を算出する(ステップS44)。
適応度推定モジュール30は、多目的進化型アルゴリズム部2の処理が終了したか否かを判定する(ステップS45)。
多目的進化型アルゴリズム部2の処理が終了していない場合には、ステップS43に戻ってステップS43〜S45の処理を繰り返す。多目的進化型アルゴリズム部2の処理が終了した場合には、推定値の算出処理を終了する。
(e−4)親個体の選択から世代交代までの方法
次に、図6のステップS6の特定の親個体の選択からステップS11の世代交代までの方法を説明する。図17は特定の親個体の選択から世代交代までの方法を説明するための模式図である。
図17(a)に示すように、パレートランキングにより親個体集合Pがランク付けされる。図17(b)に示すように、親個体集合Pのランク1の個体集合について、適応度関数空間における隣接する各2つの個体間のユークリッド距離を分布指標として算出する。本実施の形態では、適応度関数空間は、2つの適応度関数f1およびf2からなる。
ユークリッド距離が最大となる2つの個体Ia,Ibのうちいずれか1つの個体を第1の親個体Iaとして確率1/2でランダムに選択する。さらに、第2の親個体Icおよび第3の親個体Idを親個体集合Pからランダム選択で選択する。
本実施の形態においては、分布指標のユークリッド距離Lは、図17(f)に示すように、隣接する2つの個体をxおよびyとすると、次式により求められる。
L=[{f1(x)−f1(y)}2 +{f2(x)−f2(y)}2 1/2 …(7)
次いで、図17(c)に示すように、第1、第2および第3の親個体Ia,Ic,Idから子個体集合Cを生成する。さらに、図17(d)に示すように、子個体集合Cおよび親個体集合Pから個体集合Fを生成し、個体集合Fに上記のα優越戦略を用いたパレートランキングを行う。このとき、子個体集合Cにおいて親個体集合Pに含まれる個体に重複する個体がある場合には、その個体に最下位ランクを付与する。
その後、図17(e)に示すように、個体集合Fに混雑度ソートを行い、個体のランクおよび各ランク内の混雑度に基づいて所定数の個体を選択し、残りの個体を削除する。それにより、新たな親個体集合Pを生成する。このようにして、世代交代が行われる。
図18は子個体集合Cの生成処理を説明するための模式図である。図18(a)はパラメータ空間上の親個体集合Pを示し、図18(b)はパラメータ空間上の子個体集合Cを示す。子個体集合Cの個体I21のパラメータx1,x2が親個体集合Pの個体I11のパラメータx1,x2と一致する場合には、個体I21には最下位ランクが付与される。同様に、子個体集合Cの個体I22のパラメータx1,x2が親個体集合Pの個体I12のパラメータx1,x2と一致する場合には、個体I22には最下位ランクが付与される。
なお、特定の親個体の選択方法は、本実施の形態に限定されず、ランク1の個体集合からユークリッド距離Lが最大となる2つの個体を第1および第2の親個体として選択し、第3の親個体を親個体集合Pからランダム選択、ルーレット選択またはトーナメント選択等の方法により選択してもよい。
図19は多目的進化型アルゴリズム部2による特定の親個体の選択処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、親個体集合Pから選択されたランク1の個体集合を適応度関数ごとにソートする(ステップS51)。
次に、多目的進化型アルゴリズム部2は、ランク1の個体集合において隣接する2つの個体間のユークリッド距離を算出する(ステップS52)。
さらに、多目的進化型アルゴリズム部2は、最大のユークリッド距離を与える2つの個体のうち1つの個体を第1の親個体として確率1/2でランダムに選択し、第2の親個体および第3の親個体を親個体集合Pからランダム選択で選択する(ステップS53)。
本実施の形態では、第1、第2および第3の親個体から交叉操作により子個体が生成される。交叉操作としては、例えば、UNDX(単峰性正規分布交叉:Unimodal Normal Distribution Crossover)が用いられる。
図20はUNDXによる子個体の生成処理を示す模式図である。UNDXでは、第1の親個体P1、第2の親個体P2および第3の親個体P3の位置関係に基づいて定められる正規分布乱数に従って子個体C1を生成する。この場合、第1の親個体P1と第2の親個体P2とを結ぶ軸AXの周辺の正規分布に従って子個体C1が生成されるので、子個体C1が第1〜第3の親個体P1〜P3から遠くに離れた位置に生成されることがない。
(f)第1の実施の形態の効果
本実施の形態に係る多目的最適化装置1においては、上式(6)により探索履歴記憶装置31に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和を用いて注目個体に対応する適応度の推定値の組が求められる。
各個体の重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であるので、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、α優越戦略により複数の適応度関数の各々について個体集合の複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々についての比較結果に重み付けが行われる。そして、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて個体集合の複数の個体のランク付けが行われる。それにより、最適化対象が不確実性を有する場合でも、複数の適応度間の関係を考慮した合理的なパレート最適個体を求めることが可能となる。
さらに、適応度関数空間上での最上位ランクの個体の分布において、隣接する個体間の距離を分布指標として用いることにより、疎らな領域に新たな子個体を容易に生成することができる。それにより、最上位ランクの個体を適応度関数空間上の広い領域に偏りなく分布するように生成することが可能となる。したがって、多様性を有するパレート最適個体を容易に得ることができる。
さらに、生成された新たな子個体が親個体集合の個体と重複する場合に、新たな子個体に最下位ランクが付与される。それにより、パレート最適個体の探索初期には、緩やかに悪い個体を減少させることができ、パレート最適個体の探索後期には、パレート最適個体の多様性を維持することができる。
また、適応度推定部3により算出された推定値の組に基づいてパレート最適個体が表示装置105の画面上に表示される。それにより、使用者は、パレート最適個体を視覚的に認識することができるので、種々の意思決定を容易に行うことができる。
(2)第2の実施の形態
次に、本発明の第2の実施の形態に係るに多目的最適化装置について説明する。本実施の形態に係る多目的最適化装置は、図1および図2に示した構成を有する。また、本実施の形態に係る多目的最適化装置の全体処理は、図5および図6に示した処理と同様である。
本実施の形態が第1の実施の形態と異なるのは、図5のステップS3および図6のステップS9における推定値の算出方法および図6のステップS6における特定の親個体の選択方法である。
(a)推定値の算出
本実施の形態では、真の適応度f(x)の推定値f’(x)は、改良された推定式により算出される。
Figure 2005285090
上式(9)に示すように、推定値f’(x)はパラメータ空間上の距離dlの3乗を含む関数により重み付けされた加重平均の式で表される。
上式(9)によれば、注目個体から探索履歴HS内の個体までの距離が短いほど重みが大きくなる。一方、注目個体から探索履歴HS内の個体までの距離が長くなると、極端に重みが小さくなる。したがって、注目個体から離れた個体は推定値f’(x)の算出にほとんど寄与しない。
図21は探索履歴記憶装置31に記憶された探索履歴に基づく個体の探索を示す模式図である。図21(a)は単目的最適化における探索初期の個体集合を示し、図21(b)は多目的最適化における探索初期の個体集合を示し、図21(c)は単目的最適化における探索後期の個体集合を示し、図21(d)は多目的最適化における探索後期の個体集合を示す。
図21(a),(c)の縦軸は適応度関数fを示し、横軸はパラメータxを示す。図21(b),(d)の縦軸は適応度関数f2を示し、横軸は適応度関数f1を示す。
探索初期には、図21(a),(b)に示すように複数の個体が分散している。探索後期には、単目的最適化では、図21(c)に示すように個体があるパラメータの値の近傍に集中し、多目的最適化では、図21(d)に示すように複数の個体がパレート最適個体集合を形成する。
このように、多目的最適化では、個体が適応度関数空間の広い範囲に分散するので、式(9)を用いることにより、注目個体から遠く離れた個体の寄与が小さくなるので、推定値の精度が高くなる。
(b)特定の親個体の選択から世代交代までの方法
図22は親個体の選択から世代交代までの方法を説明するための模式図である。本実施の形態では、3つの適応度関数f1,f2,f3の例が示される。
図22(a)に示すように、パレートランキングにより親個体集合Pがランク付けされている。図22(b)に示すように、親個体集合Pのランク1の個体集合について、適応度関数空間における隣接する各3つの個体が形成する三角形の面積を分布指標として算出する。
三角形の形成には、ドローネ三角形分割(Delaunay Triangulation)の方法を用いる(非特許文献6参照)。
ここで、ドローネ三角形分割について簡単に説明する。ドローネ三角形分割は、計算幾何学(Computational Geometry)の中で重要な概念であるボロノイ図(Voronoi Diagram)の双対図形である。平面(空間)上の点集合の三角形分割の中で、種々の意味で最適な三角形分割として知られており、コンピュータグラフィクスにおけるメッシュ生成または有限要素法等にも用いられる。ドローネ三角形分割は、分割された三角形の最小角を最大にする分割方法であり、アルゴリズムとして逐次添加法、分割統治法または幾何変換を用いる方法等がある。なお、ドローネ三角形分割の詳細については、例えば非特許文献7に記載されている。
最大の三角形の面積を与える3つの個体IA,IB,ICのうちいずれか1つの個体を第1の親個体IAとして確率1/3でランダムに選択する。さらに、第2の親個体IDおよび第3の親個体IEを親個体集合Pからランダム選択で選択する。
次いで、図22(c)に示すように、第1、第2および第3の親個体IA,ID,IEから子個体集合Cを生成する。さらに、図22(d)に示すように、子個体集合Cおよび親個体集合Pから個体集合Fを生成し、個体集合Fに上記のα優越戦略を用いたパレートランキングを行う。このとき、子個体集合Cにおいて親個体集合Pに含まれる個体に重複する個体がある場合には、その個体に最下位ランクを付与する。
その後、図22(e)に示すように、個体集合Fに混雑度ソートを行い、個体のランクおよび各ランク内の順位に基づいて所定数の個体を選択し、残りの個体を削除する。それにより、新たな親個体集合Pを生成する。このようにして、世代交代が行われる。
なお、特定の親個体の選択方法は、本実施の形態に限定されず、最大の三角形の面積を与える3つの個体を第1、第2および第3の親個体として選択してもよく、あるいは最大の三角形の面積を与える3つの個体のうち2つを第1および第2の親個体として選択し、第3の親個体を親個体集合Pからランダム選択、ルーレット選択またはトーナメント選択等の方法により選択してもよい。
また、パラメータが3つ以上の場合には、多親拡張された交叉方法、例えばUNDX−m等を用いてもよい。
図24は多目的進化型アルゴリズム部2による特定の親個体の選択処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、親個体集合Pから選択されたランク1の個体集合をfi−fj平面に正射影する(ステップS61)。ここで、fiおよびfjは適応度関数である。i,j=1,2,3であり、かつi≠jであり、それらの組み合わせは世代ごとに変化させる。
次に、多目的進化型アルゴリズム部2は、正射影した個体集合のドローネ三角形分割を行う(ステップS62)。
さらに、多目的進化型アルゴリズム部2は、ドローネ三角形分割されたランク1の個体集合に適応度関数fkの成分を高さ成分として与え、複数の三角形を3次元空間上に展開する(ステップS63)。ここで、k≠i,jである。
次いで、多目的進化型アルゴリズム部2は、3次元空間上に展開された複数の三角形の面積をそれぞれ算出する(ステップS64)。
面積最大の三角形を形成する3つの個体のうち1つの個体を第1の親個体として確率1/3でランダムに選択し、親個体集合Pから2つの個体を第2の親個体および第3の親個体としてランダム選択で選択する(ステップS65)。
(c)第2の実施の形態の効果
本実施の形態に係る多目的最適化装置1においては、上式(9)により探索履歴記憶装置31に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和を用いて注目個体に対応する適応度の推定値の組が求められる。
各個体の重みは、パラメータ空間上で注目個体とその個体との距離の3乗を含む関数であるので、パラメータ空間上で注目個体から遠く離れた他の個体の影響が十分に小さくなる。それにより、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、適応度関数空間上での最上位ランクの個体の分布において、隣接する3つの個体を頂点とする三角形の面積を分布指標として用いることにより、疎らな領域に新たな子個体を容易に生成することができる。それにより、最上位ランクの個体を適応度関数空間上の広い領域に偏りなく分布するように生成することが可能となる。したがって、多様性を有するパレート最適個体を容易に得ることができる。
(3)他の実施の形態
(a)拡張された推定式
上記の推定式(4)および(9)を一般化すると、次式のようになる。
Figure 2005285090
上式(10)において、nは任意の自然数である。第1の実施の形態の推定式(4)はn=1の場合を示し、第2の実施の形態の推定式(9)はn=3の場合を示す。n=3が好ましいが、nが他の自然数であってもよい。
このように、注目個体の真の適応度の推定値は、ノイズ成分を有する適応度のサンプル値を用いずに、探索履歴HSにおける他の個体の推定値の重み付け線形和により算出される。それにより、サンプル値が不確実性を有する場合でも、パレート最適個体を安定に探索することができる。
また、パラメータ空間上で注目個体と他の個体との距離のn乗の関数を含む重みが用いられるので、推定値の算出が広範囲に広がる他の個体の影響を大きく受けることが防止される。したがって、推定値を高精度に算出することができる。
(b)親個体の選択
第1の実施の形態で示されるように、2目的最適化問題では、特定の親個体の選択のための分布指標として個体間の距離が用いられる。また、第2の実施の形態で示されるように、3目的最適化問題では、特定の親個体の選択のための分布指標として3つの個体が形成する三角形の面積が用いられる。
特定の親個体の選択のための分布指標をm目的最適化問題に拡張した場合、分布指標は、適応度関数空間上で隣接するm個の個体が形成する単体(simplex)の大きさである。mは2以上の自然数である。上記の単体は、ドローネ三角形分割により形成することができる。
図24はm目的最適化問題に拡張された分布指標を示す図である。図24に示すように、2目的の場合には、分布指標は隣接する2つの個体間を結ぶ直線の長さであり、3目的の場合には、分布指標は隣接する3つの個体を頂点とする三角形の面積であり、4目的の場合には、分布指標は隣接する4つの個体を頂点とする三角錐の体積である。分布指標は4次元単体の大きさであり、底体積×高さ÷4により算出される。5目的の場合には、分布指標は5次元単体の大きさであり、底4次元面積×高さ÷5により算出される。(m+1)目的の場合には、分布指標はm次元単体の大きさであり、底(m−1)次元面積×高さ÷mにより算出される。
このように、分布指標に基づいて特定の親個体を選択することにより、適応度関数空間上で分布が疎らな領域で積極的な個体の探索が行われる。それにより、広い領域で個体の探索が行われるので、推定値を高精度に算出することができるとともに、適応度関数空間上の広い領域で均等にパレート最適個体を見出すことができる。
(c)エンジンシミュレータへの適応例
図25は多目的最適化装置をエンジンシミュレータに適用した例を示すブロック図である。
図25の最適化対象6aはエンジンシミュレータである。エンジンシミュレータは、例えばパーソナルコンピュータからなる。この最適化対象6aは、多目的最適化装置1から与えられるパラメータの組に基づいてエンジンの動作のシミュレーションを行い、シミュレーション結果を適応度のサンプル値の組として多目的最適化装置1に出力する。
本実施の形態では、複数の適応度関数としては、燃費、トルク、エンジンの排気ガスに含まれるCO(一酸化炭素)、HC(炭化水素)、NOx (窒素酸化物)等の成分の濃度等のうち複数が設定される。
また、パラメータとしては、燃料噴射量、燃料噴射時期、点火時期、スロットル開度等が挙げられる。
図25の多目的最適化装置1によれば、適応度関数の組およびパラメータの組を設定することにより、パレート最適個体集合を効率良く求めることができる。
(d)モータ評価装置への適応例
図26は多目的最適化装置をモータ評価装置に適用した例を示すブロック図である。
図26の最適化対象6bはモータ評価装置である。モータ評価装置は、モータ、制御回路および各種検出回路により構成される。この最適化対象6bは、多目的最適化装置1から与えられる個体のパラメータの組に基づいてモータを制御するとともにモータの複数の性能項目を測定し、測定結果を適応度のサンプル値の組として多目的最適化装置1に出力する。
複数の適応度関数としては、立ち上がり時間、整定時間、オーバーシュート量、消費電流等のうち複数が設定される。
また、パラメータとしては、PID(比例積分微分:Proportional Integral Derivative)ゲイン、駆動電流等が挙げられる。
ここで、トレードオフの関係としては、立ち上がり時間とオーバーシュート量、立ち上がり時間と消費電流、整定時間とオーバーシュート量等が挙げられる。
図26の多目的最適化装置1によれば、適応度関数の組およびパラメータの組を設定することにより、パレート最適個体集合を効率良く求めることができる。
また、パレート最適個体集合をリアルタイムに算出することにより実環境に即したモータのリアルタイム制御を行うことも可能である。
(e)モータシミュレータへの適応例
図27は多目的最適化装置をモータシミュレータに適用した例を示すブロック図である。
図27の最適化対象6cはモータシミュレータである。モータシミュレータは、例えばパーソナルコンピュータからなる。この最適化対象6cは、多目的最適化装置1から与えられるパラメータの組に基づいてモータの動作のシミュレーションを行い、シミュレーション結果を適応度のサンプル値の組として多目的最適化装置1に出力する。
複数の適応度関数としては、立ち上がり時間、整定時間、オーバーシュート量、消費電流等のうち複数が設定される。また、パラメータとしては、PIDゲイン、駆動電流等が挙げられる。
図27の多目的最適化装置1によれば、適応度関数の組およびパラメータの組を設定することにより、パレート最適個体集合を効率良く求めることができる。
(f)多目的進化型アルゴリズムの他の例
上記実施の形態では、多目的進化型アルゴリズムとして遺伝的アルゴリズム(GA)を用いているが、これに限定されず、遺伝的アルゴリズムの代わりに、進化戦略(ES:Evolution Strategy)等の同様のアイデアに基づく計算法を用いてもよい。
なお、GA、ES等の計算法は、進化アルゴリズム(EAs:Evolutionary Algorithms)または進化計算(Evolutionary Computation)と総称される。
(g)4以上の目的への適用
上記実施の形態では、2目的および3目的の最適化を例に挙げて説明したが、本発明は、4以上の目的の最適化にも同様に適用することができる。この場合、トレードオフの関係を有する4以上の適応度関数が設定される。
(h)世代交代方法
上記の図6のステップS10において、子個体集合Cのうち親個体集合Pの個体と重複しない個体を親個体集合Pの下位の個体と入れ換えることにより新たな親個体集合Pを生成してもよい。
この場合、パレート最適個体の探索初期には、緩やかに悪い個体を減少させることができるとともに、パレート最適個体の探索後期には、パレート最適個体の多様性を維持することができる。
(i)親個体の再評価
上記実施の形態においては、親個体の再評価を行っているが、実システムまたは大規模シミュレーションにおいて個体の評価回数に制限がある場合には、子個体のみ再評価してもよい。それにより、評価回数を低減することが可能になる。
(j)サンプル値の取得の制限
探索履歴記憶装置31に記憶されるサンプル値の量が所定の記憶容量に達した時点で探索履歴記憶装置31へのサンプル値の取得を終了してもよい。それにより、以後は探索履歴記憶装置31に記憶された探索履歴HSに基づいて推定値を算出し、算出された推定値に基づいてパレート最適個体の探索を進めることが可能になる。
(k)ランク付け
上記実施の形態では、パレートランキングにより複数の個体のランク付けが行われているが、これに限定されず、非優越ソート等の他の方法を用いて複数の個体がランク付けされてもよい。
(l)各部の実現方法
上記実施の形態では、多目的進化型アルゴリズム部2、適応度推定モジュール30および探索履歴記憶部31がCPU101およびプログラムにより実現されるが、多目的進化型アルゴリズム部2、適応度推定モジュール30および探索履歴記憶部31の一部または全てが電子回路等のハードウエアにより実現されてもよい。
(4)実施例1および比較例1
以下の実施例1では、第1の実施の形態に係る多目的最適化装置によりベンチマーク問題を実行した。また、比較例1では、選択オペレータを除いて第1の実施の形態に係る多目的最適化装置と同様の多目的最適化装置によりベンチマーク問題を実行した。
図28は比較例1および実施例1の多目的最適化の条件を示す図である。図28(a)は比較例1の多目的最適化の条件を示し、図28(b)は実施例1の多目的最適化の条件を示し、図28(c)は比較例1および実施例1において実行するベンチマーク問題を示す。
図28(a)に示すように、比較例1において、個体集合サイズは100であり、世代数は30であり、評価回数は3000である。ただし、評価回数は親個体の再評価を含む。また、比較例1では、選択オペレータとしてバイナリトーナメント選択を用い、交叉オペレータとしてUNDXを用いる。
図28(b)に示すように、実施例1において、個体集合サイズは100であり、世代数は300であり、評価回数は3000である。また、実施例1では、選択オペレータとして第1の実施の形態の選択方法(図17に示した特定の親個体の選択方法)を用い、交叉オペレータとしてUNDXを用いる。さらに、図17に示した世代交代方法を用いた。
比較例1および実施例1において、定数k'(=(k1 ,k2 )は予備実験にて決定し、k1=k2=1000とする。また、実施例1のα優越戦略におけるα(=(α12 ,α21 )は0.1とする。
ここで、評価回数とは、(世代数×子個体の数+初期個体集合の個体の数)で求められる。
実施例1および比較例1では、ベンチマーク問題として図28(c)に示す2問題ZDT1およびZDT2を用いた(非特許文献8参照)。
ZDT1は、パレート最適解集合が凸型のパレート境界を有する2目的最適化問題である。ZDT2は、パレート最適解集合が凹型のパレート境界を有する2目的最適化問題である。ここで、ZDT1およびZDT2を2変数2目的関数の最小化問題とした。また、それぞれの目的関数には適当なノイズを加える。なお、このZDT1,ZDT2は弱パレート最適解を持つ。
図29は比較例1および実施例1において50世代目に得られたパレート最適個体集合を示す図である。図29(a)は、サンプル値がノイズを含まない状態で比較例1の最適化により得られたパレート最適個体集合を示し、丸印は真の適応度であり、実線はパレート境界である。図29(b)は、サンプル値がノイズを含む状態で比較例1の最適化により得られたパレート最適解集合を示し、丸印はノイズを有さない真の適応度であり、菱形は推定値であり、実線はパレート境界である。図29(c)は、サンプル値がノイズを含む状態で実施例1の最適化により得られたパレート最適個体集合を示し、丸印はノイズを有さない真の適応度であり、菱形は推定値であり、実線はパレート境界である。
サンプル値がノイズを含まない状態で比較例1により最適化を行うと、図29(a)に示すように、真の適応度および推定値が凸型および凹型のパレート境界に沿った形状を有する。
しかしながら、サンプル値がノイズを含む状態で比較例1により最適化を行うと、図29(b)に示すように、真の適応度および推定値が共にバラバラに散在し、パレート境界に到達しない個体が多く存在し、さらに弱パレート最適個体がパレート最適個体となっている様子がわかる。
これに対して、サンプル値がノイズを含む状態で実施例1により最適化を行うと、図29(c)に示すように、真の適応度および推定値が共にほとんど偏りない分布で凸型および凹型のパレート境界に到達しており、さらに弱パレート最適個体が排除されている様子がわかる。
このように、第1の実施の形態に係る多目的最適化装置によれば、α優越戦略を用いることにより、弱パレート最適解を持つ2目的最適化問題においても、弱パレート最適個体を排除するとともに、パレート最適個体集合における推定値を高精度に算出することができる。それにより、真の適応度および推定値をパレート境界に到達させることが可能となる。
(5)実施例2および比較例2
以下の実施例2では、第2の実施の形態に係る多目的最適化装置によりベンチマーク問題を実行した。また、比較例2では、選択オペレータを除いて第2の実施の形態に係る多目的最適化装置と同様の多目的最適化装置によりベンチマーク問題を実行した。
図30は比較例2および実施例2の多目的最適化の条件を示す図である。図30(a)は比較例2の多目的最適化の条件を示し、図30(b)は実施例2の多目的最適化の条件を示し、図30(c)は比較例2および実施例2において実行するベンチマーク問題を示す。
図30(a)に示すように、比較例2において、個体集合サイズは100であり、世代数は30であり、評価回数は3000である。ただし、評価回数は親個体の再評価を含む。また、比較例2では、選択オペレータとしてバイナリトーナメント選択を用い、交叉オペレータとしてUNDXを用いる。
図30(b)に示すように、実施例2において、個体集合サイズは100であり、世代数は300であり、評価回数は3000である。また、実施例2では、選択オペレータとして第2の実施の形態の選択方法(図22に示した特定の親個体の選択方法)を用い、交叉オペレータとしてUNDXを用いる。さらに、図22に示した世代交代方法を用いた。
比較例2および実施例2において、定数k'(=k1 ,k2 ,k3 )は予備実験にて決定し、k1 =k2 =k3 =100000とする。また、実施例2のα優越戦略におけるα(=α12 =α23 =α31 )は0.1とする。
実施例2および比較例2では、ベンチマーク問題として図30(c)に示す2問題DTLZ2を用いた。
DTLZ2は、パレート最適解集合が凹型のパレート境界を有する3目的最適化問題である。ここで、DTLZ2を3変数3目的関数の最小化問題とした。また、それぞれの目的関数には適当なノイズを加える。
図31は比較例2および実施例2において得られたパレート最適個体集合を示す図である。図31(a)は、サンプル値がノイズを含まない状態で比較例2の最適化により得られたパレート最適個体集合を示し、丸印は真の適応度であり、実線はパレート境界である。図31(b)は、サンプル値がノイズを含む状態で比較例2の最適化により得られたパレート最適解集合を示し、丸印はノイズを有さない真の適応度であり、菱形は推定値であり、実線はパレート境界である。図31(c)は、サンプル値がノイズを含む状態で実施例2の最適化により得られたパレート最適個体集合を示し、丸印はノイズを有さない真の適応度であり、菱形は推定値であり、実線はパレート境界である。
サンプル値がノイズを含まない状態で比較例2により最適化を行うと、図31(a)に示すように、真の適応度および推定値が凹型のパレート境界に沿った形状を有する。
しかしながら、サンプル値がノイズを含む状態で比較例2により最適化を行うと、図31(b)に示すように、真の適応度および推定値が共にバラバラに散在し、パレート境界に到達しない個体が多く存在する。
これに対して、サンプル値がノイズを含む状態で実施例2により最適化を行うと、図31(c)に示すように、真の適応度および推定値が共にほとんど偏りない分布で凹型のパレート境界に到達している。
このように、第2の実施の形態に係る多目的最適化装置によれば、上記の特定の親個体の選択方法および世代交代方法を用いることにより、3目的最適化問題においても、パレート最適個体集合における推定値を高精度に算出することができる。それにより、真の適応度および推定値をパレート境界に到達させることが可能となる。
(6)実施例3
以下の実施例3では、図1の多目的最適化装置1により図3の最適化対象6の多目的最適化を実行した。
多目的最適化装置1からパラメータとして点火時期および燃料噴射時期を最適化対象6のECU62に与える。最適化対象6のコントローラ64により車速および空燃比を一定に制御し、多目的最適化装置1から与えられるパラメータに基づいてECU62により点火時期および燃料噴射時期を変化させ、排気ガス分析計63によりHC濃度およびNOx濃度を分析する。分析されたHC濃度およびNOx濃度はサンプル値として多目的最適化装置1に出力される。
図32は実施例3の多目的最適化の条件を示す図である。図32に示すように、実施例3において、個体集合サイズは50であり、子個体集合サイズは10であり、世代数は23であり、評価回数は280である。また、実施例3では、選択オペレータとして第1の実施の形態の選択方法(図17に示した特定の親個体の選択方法)を用い、交叉オペレータとしてUNDXを用いる。定数k’(=k1 =k2 )は100000であり、世代交代方法としては第1の実施の形態の方法(図17に示した世代交代方法)を用いる。
図33は実施例3において得られたサンプル値および推定値を示す図である。図33の縦軸はNOx濃度であり、横軸はHC濃度である。縦軸および横軸の値は正規化された値である。丸印は23世代(280個体)のサンプル値を示し、菱形印は最終世代の推定値を示す。
図34は実施例3において得られた最終世代のパレート最適個体の推定値を適応度関数空間上に示す図である。図34の縦軸はNOx濃度であり、横軸はHC濃度である。縦軸および横軸の値は正規化された値である。
図35は実施例3において得られた最終世代のパレート最適個体のパラメータをパラメータ空間上に示す図である。図35の縦軸は燃料噴射時期であり、横軸は点火時期である。縦軸および横軸の値は正規化された値である。
図34および図35では、推定値とパラメータとの関係が容易にわかるように、複数のパレート最適個体が3つの系列1〜3に分類されている。菱形印は系列1のパレート最適個体を示し、四角印は系列2のパレート最適個体を示し、三角印は系列3のパレート最適個体を示す。
系列1はHC濃度が良くNOx濃度が悪い領域であり、系列2はHC濃度とNOx濃度とが平衡する領域であり、系列3はHC濃度が悪くNOx濃度が良い領域である。図35から、噴射時期を早く点火時期の値を小さくするとHC濃度が改善され、噴射時期を遅く点火時期の値を大きくするとNOx濃度が改善されることがわかる。
(7)請求項の構成要素と実施の形態の各部との対応
上記実施の形態では、探索履歴記憶装置31が記憶部に相当し、適応度推定モジュール30が推定部に相当し、多目的進化型アルゴリズム部2が演算部に相当する。
本発明は、実システムまたは不確実性を有するシミュレーション等の最適化対象のパラメータを最適化するため等に利用することができる。
本発明の第1の実施の形態に係る多目的最適化装置の機能的な構成を示すブロック図である。 図1の多目的最適化装置のハードウエア構成を示すブロック図である。 最適化対象の構成の一例を示すブロック図である。 HC濃度、NOx濃度およびCO濃度と空燃比との関係を示す図である。 図1の多目的最適化装置の全体処理を示すフローチャートである。 図1の多目的最適化装置の全体処理を示すフローチャートである。 初期化により生成される親個体集合を示す模式図である。 α優越戦略を説明するための模式図である。 α優劣戦略による個体の優劣比較を説明するための模式図である。 パレートランキングを説明するための図である。 混雑度ソートを説明するための模式図である。 多目的進化型アルゴリズム部による混雑度ソートの処理を示すフローチャートである。 適応度推定部の適応度推定モジュールによる推定値の算出を説明するための模式図である。 正規分布に従うノイズを伴うサンプル値を示す模式図である。 不確実な適応度関数のモデルを示す模式図である。 適応度推定部の適応度推定モジュールによる推定値の算出処理を示すフローチャートである。 特定の親個体の選択から世代交代までの方法を説明するための模式図である。 子個体集合の生成処理を説明するための模式図である。 多目的進化型アルゴリズム部による特定の親個体の選択処理を示すフローチャートである。 UNDXによる子個体の生成処理を示す模式図である。 探索履歴記憶装置に記憶された探索履歴に基づく個体の探索を示す模式図である。 親個体の選択から世代交代までの方法を説明するための模式図である。 多目的進化型アルゴリズム部による親個体の選択処理を示すフローチャートである。 m目的最適化問題に拡張された分布指標を示す図である。 多目的最適化装置をエンジンシミュレータに適用した例を示すブロック図である。 多目的最適化装置をモータ評価装置に適用した例を示すブロック図である。 多目的最適化装置をモータシミュレータに適用した例を示すブロック図である。 比較例1および実施例1の多目的最適化の条件を示す図である。 比較例1および実施例1において50世代目に得られたパレート最適個体集合を示す図である。 比較例2および実施例2の多目的最適化の条件を示す図である。 比較例2および実施例2において得られたパレート最適個体集合を示す図である。 実施例3の多目的最適化の条件を示す図である。 実施例3において得られたサンプル値および推定値を示す図である。 実施例3において得られた最終世代のパレート最適個体の推定値を適応度関数空間上に示す図である。 実施例3において得られた最終世代のパレート最適個体のパラメータをパラメータ空間上に示す図である。 多目的最適化問題をエンジンの最適化に適用した例を示す図である。 パレート最適解について説明するための図である。
符号の説明
1 多目的最適化装置
2 多目的進化型アルゴリズム部
3 適応度推定部
4 出力インタフェース
5 入力インタフェース
6 最適化対象
10 使用者
30 適応度推定モジュール
31 探索履歴記憶装置
61 エンジン
62 ECU(エンジン制御ユニット)
63 排気ガス分析計
64 コントローラ
65 スロットルユニット
66 ダイナモ
101 CPU(中央演算処理装置)
102 ROM(リードオンリメモリ)
103 RAM(ランダムアクセスメモリ)
104 入力装置
105 表示装置
106 外部記憶装置
107 記録媒体駆動装置
108 入出力インタフェース
109 記録媒体
C 子個体集合
l 距離
1,f2 適応度関数
F 個体集合
HS 探索履歴
I1,I2,I3,I4,I5,I6,I7,I8,I9,I10,I11,I12,I21,I22 個体
L1,L2,L11,L12 直線
P 親個体集合
P1 第1の親個体
P2 第2の親個体
P3 第3の親個体
s1,s2,s3 長方形
1,x2 パラメータ

Claims (22)

  1. 最適化対象に個体のパラメータの組を与え、複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組を前記最適化対象から受ける多目的最適化装置であって、
    個体のパラメータの組および前記最適化対象から出力される適応度のサンプル値の組を記憶する記憶部と、
    前記記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める推定部と、
    前記推定部により求められた推定値に基づいて新たな個体を生成し、生成された個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、前記推定部により求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める演算部とを備え、
    前記推定部は、
    前記記憶部に記憶された各個体に対応するサンプル値の組に重み付けを行い、重み付けられた複数組のサンプル値の線形和を求めることにより、注目個体に対応する適応度の推定値の組を求め、各個体の前記重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であり、
    前記演算部は、
    前記複数の適応度関数の各々について前記評価用個体集合の複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々についての比較結果に重み付けを行い、前記複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて前記評価用個体集合の複数の個体のランク付けを行い、
    適応度関数空間上で前記評価用個体集合の最上位ランクの個体の分布における疎の程度を表す分布指標に基づいて新たな個体を生成することを特徴とする多目的最適化装置。
  2. 前記推定部は、前記記憶部に記憶された複数の個体をhlとし、注目個体xに対応するサンプル値の組をF(x)とし、パラメータ空間上で注目個体から距離dl離れた個体に対応するサンプル値の組をF(hl)とし、k’を係数とし、l=1,…,Hとし、nを自然数とした場合に、
    Figure 2005285090
    で表される推定式により注目個体xに対応する真の適応度の推定値の組f’(x)を算出することを特徴とする請求項1記載の多目的最適化装置。
  3. 前記nは1であることを特徴とする請求項2記載の多目的最適化装置。
  4. 前記nは3であることを特徴とする請求項2記載の多目的最適化装置。
  5. 前記演算部は、p個の目的に対応するp個の適応度関数のうち一の適応度関数についての個体x1およびx2に対応する適応度の推定値をfk(x1)およびfk(x2)とし、p個の適応度関数のうち他の適応度関数についての個体x1およびx2に対応する適応度の推定値をfj(x1)およびfj(x2)とし、kおよびjを1,…,pとし、kはjとは異なり、αkjを重みとし、次式で表されるgk(x1,x2)がk=1,・・・,pのすべてに関してgk(x1,x2)≦0を満足しかつk=1,・・・,pの少なくとも1つに関してgk(x1,x2)<0の関係を有する場合に、個体x1が個体x2に優越すると判定することを特徴とする請求項1〜4のいずれかに記載の多目的最適化装置。
    Figure 2005285090
  6. 前記複数の目的が2以上のm目的である場合に、前記分布指標はm個の目的に対応する適応度関数空間上で注目個体に隣接するm個の個体が形成する単体の大きさであり、
    前記演算部は、前記単体の大きさに基づいて疎の程度が最も高い個体を選択し、選択された個体を用いて新たな個体を生成することを特徴とする請求項1〜5のいずれかに記載の多目的最適化装置。
  7. 前記複数の目的が2目的である場合に、前記単体の大きさは適応度関数空間上で注目個体に隣接する2個体を結ぶ直線の長さで表され、前記複数の目的が3目的である場合に、前記単体の大きさは適応度関数空間上で中膜個体に隣接する3個体を頂点とする三角形の面積で表され、前記複数の目的が4目的である場合に、前記単体の大きさは適応度関数空間上で注目個体に隣接する4個体を頂点とする三角錐の体積で表されることを特徴とする請求項6記載の多目的最適化装置。
  8. 前記複数の目的が4以上のm目的である場合に、前記単体の大きさは適応度関数空間上で注目個体に隣接するm個の個体が形成する単体の底(m−1)次元面積×高さ/mにより表されることを特徴とする請求項6記載の多目的最適化装置。
  9. 前記複数の目的が3以上の目的である場合に、前記単体はドローネ三角形分割法により形成されることを特徴とする請求項6記載の多目的最適化装置。
  10. 前記演算部は、生成された新たな個体が前記評価用個体集合の個体と異なる場合に、前記新たな個体を前記評価用個体集合の下位ランクの個体と置換することを特徴とする請求項1〜9のいずれかに記載の多目的最適化装置。
  11. 前記演算部は、生成された新たな個体が前記評価用個体集合の個体と重複する場合に、前記新たな個体に最下位ランクを付与することを特徴とする請求項1〜9のいずれかに記載の多目的最適化装置。
  12. 前記演算部は、前記評価用個体集合の各個体を1回ずつ評価することを特徴とする請求項1〜11のいずれかに記載の多目的最適化装置。
  13. 前記推定部は、前記記憶部に記憶されるサンプル値の組の量が所定の記憶容量に達した場合に、前記最適化対象から出力されるサンプル値の組の記憶を終了することを特徴とする請求項1〜12のいずれかに記載の多目的最適化装置。
  14. 前記演算部は、前記推定部により求められた推定値の組に基づいて前記パレート最適個体を表示することを特徴とする請求項1〜13のいずれかに記載の多目的最適化装置。
  15. 前記演算部は、前記多目的進化型アルゴリズムとして遺伝的アルゴリズムを用いて前記評価用個体集合の個体を評価することを特徴とする請求項1〜14のいずれかに記載の多目的最適化装置。
  16. 前記最適化対象は、機器の複数の性能を評価するための評価システムを含み、前記パラメータの組は、前記評価システムのための制御用パラメータの組を含み、前記複数の適応度関数は前記評価システムの評価により得られる前記複数の性能であり、前記適応度の組は前記複数の性能の値であることを特徴とする請求項1〜15のいずれかに記載の多目的最適化装置。
  17. 前記機器はエンジンであることを特徴とする請求項16記載の最適化装置。
  18. 前記機器はモータであることを特徴とする請求項16記載の最適化装置。
  19. 前記評価システムは、前記パラメータの組に基づいて前記機器を制御するとともに前記機器の動作により発生される複数の性能の値をサンプル値として出力する機器評価装置であることを特徴とする請求項16記載の機器最適化装置。
  20. 前記評価システムは、前記パラメータの組に基づいて前記機器の動作をシミュレーションすることにより複数の性能を評価し、評価された複数の性能の値をサンプル値の組として出力する機器シミュレータであることを特徴とする請求項16記載の機器最適化装置。
  21. 最適化対象に個体のパラメータの組を与え、前記最適化対象から出力される複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化する多目的最適化方法であって、
    個体のパラメータの組および前記最適化対象から出力される適応度のサンプル値の組を記憶部に記憶するステップと、
    前記記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求めるステップと、
    求められた前記推定値に基づいて新たな個体を生成し、生成された個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求めるステップとを備え、
    推定値の組を求める前記ステップは、
    前記記憶部に記憶された各個体に対応するサンプル値の組に重み付けを行い、重み付けられた複数組のサンプル値の線形和を求めることにより、注目個体に対応する適応度の推定値の組を求めるステップを含み、各個体の前記重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であり、
    前記パレート最適個体を求める前記ステップは、
    前記複数の適応度関数の各々について前記評価用個体集合の複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々についての比較結果に重み付けを行い、前記複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて前記評価用個体集合の複数の個体のランク付けを行うステップと、
    適応度関数空間上で前記評価用個体集合の最上位ランクの個体の分布における疎の程度を表す分布指標に基づいて新たな個体を生成するステップとを含むことを特徴とする多目的最適化方法。
  22. 最適化対象に個体のパラメータの組を与え、前記最適化対象から出力される対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化するコンピュータにより実行可能な多目的最適化プログラムであって、
    個体のパラメータの組および前記最適化対象から出力される適応度のサンプル値の組を記憶部に記憶する処理と、
    前記記憶部に記憶された複数の個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める処理と、
    求められた前記推定値に基づいて新たな個体を生成し、生成された個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める処理とをコンピュータに実行させ、
    推定値の組を求める前記処理は、
    前記記憶部に記憶された各個体に対応するサンプル値の組に重み付けを行い、重み付けられた複数組のサンプル値の線形和を求めることにより、注目個体に対応する適応度の推定値の組を求める処理を含み、各個体の前記重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であり、
    前記パレート最適個体を求める前記処理は、
    前記複数の適応度関数の各々について前記評価用個体集合の複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々についての比較結果に重み付けを行い、前記複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて前記評価用個体集合の複数の個体のランク付けを行う処理と、
    適応度関数空間上で前記評価用個体集合の最上位ランクの個体の分布における疎の程度を表す分布指標に基づいて新たな個体を生成する処理とを含むことを特徴とする多目的最適化プログラム。
JP2004368744A 2003-12-24 2004-12-21 多目的最適化装置、多目的最適化方法および多目的最適化プログラム Pending JP2005285090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004368744A JP2005285090A (ja) 2003-12-24 2004-12-21 多目的最適化装置、多目的最適化方法および多目的最適化プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003428021 2003-12-24
JP2004062402 2004-03-05
JP2004368744A JP2005285090A (ja) 2003-12-24 2004-12-21 多目的最適化装置、多目的最適化方法および多目的最適化プログラム

Publications (1)

Publication Number Publication Date
JP2005285090A true JP2005285090A (ja) 2005-10-13

Family

ID=35183353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004368744A Pending JP2005285090A (ja) 2003-12-24 2004-12-21 多目的最適化装置、多目的最適化方法および多目的最適化プログラム

Country Status (1)

Country Link
JP (1) JP2005285090A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007326517A (ja) * 2006-06-09 2007-12-20 Toyota Motor Corp 制御パラメータ決定装置
JP2008096778A (ja) * 2006-10-13 2008-04-24 National Institute Of Advanced Industrial & Technology 光軸自動調整機能搭載2光子レーザ顕微鏡
JP2008117059A (ja) * 2006-11-01 2008-05-22 Fuji Heavy Ind Ltd 制御パラメータの自動調整装置
JP2008217155A (ja) * 2007-02-28 2008-09-18 Fuji Heavy Ind Ltd 制御パラメータの自動適合システム
JP2009003578A (ja) * 2007-06-19 2009-01-08 Ono Sokki Co Ltd エンジンの設計変数の最適解を計算する方法、コンピュータ、及びプログラム
JP2016510151A (ja) * 2013-02-28 2016-04-04 アー・ファウ・エル・リスト・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 非線形プロセス用非線形コントローラの設計方法
JP2018037032A (ja) * 2016-09-02 2018-03-08 富士通株式会社 特定プログラム、特定方法および特定装置
KR20180127467A (ko) * 2016-03-30 2018-11-28 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터 도출
CN110929464A (zh) * 2019-11-20 2020-03-27 燕山大学 一种基于改进蜻蜓算法的蓄电池参数辨识方法
CN111898726A (zh) * 2020-07-30 2020-11-06 长安大学 一种电动汽车控制系统参数优化方法、计算机设备及存储介质
CN116614830A (zh) * 2023-07-18 2023-08-18 中国电信股份有限公司 网元优化方法、装置、计算机设备、存储介质
CN116681312A (zh) * 2023-07-28 2023-09-01 华中科技大学 一种面向生态的多目标水库优化调度决策方法及系统
WO2023238606A1 (ja) * 2022-06-08 2023-12-14 パナソニックIpマネジメント株式会社 評価装置、評価方法、およびプログラム
WO2024201834A1 (ja) * 2023-03-29 2024-10-03 富士通株式会社 演算プログラム、演算方法、および情報処理装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200400061008, 佐野 泰仁、喜多 一, "探索履歴を利用した遺伝的アルゴリズムによる不確実関数の最適化", 電気学会論文誌, 20020601, Vol.122−C No.6, 第1001−1008頁 *
JPN6011003501, Deb K., Pratap A., Agarwal S., Meyarivan T., "A fast and elitist multiobjective genetic algorithm: NSGA−II", IEEE Transactions on Evolutionary Computation, 200204, Volume 6, 第182−197頁 *
JPN6011003502, Ikeda K., Kita H. Kobayashi, S., "Failure of Pareto−based MOEAs: does non−dominated really mean near to optimal?", Proceedings of the 2001 Congress on Evolutionary Computation 2001, 2001, vol.2, 第957−962頁 *
JPN6011003503, 佐野 泰仁、喜多 一, "探索履歴を利用した遺伝的アルゴリズムによる不確実関数の最適化", 電気学会論文誌, 20020601, Vol.122−C No.6, 第1001−1008頁 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007326517A (ja) * 2006-06-09 2007-12-20 Toyota Motor Corp 制御パラメータ決定装置
JP2008096778A (ja) * 2006-10-13 2008-04-24 National Institute Of Advanced Industrial & Technology 光軸自動調整機能搭載2光子レーザ顕微鏡
JP2008117059A (ja) * 2006-11-01 2008-05-22 Fuji Heavy Ind Ltd 制御パラメータの自動調整装置
JP2008217155A (ja) * 2007-02-28 2008-09-18 Fuji Heavy Ind Ltd 制御パラメータの自動適合システム
JP2009003578A (ja) * 2007-06-19 2009-01-08 Ono Sokki Co Ltd エンジンの設計変数の最適解を計算する方法、コンピュータ、及びプログラム
JP2016510151A (ja) * 2013-02-28 2016-04-04 アー・ファウ・エル・リスト・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 非線形プロセス用非線形コントローラの設計方法
KR102090998B1 (ko) 2016-03-30 2020-04-23 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터의 실시간 조절
KR102177092B1 (ko) 2016-03-30 2020-11-10 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터 도출
KR20180129882A (ko) * 2016-03-30 2018-12-05 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터의 실시간 조절
KR20180127467A (ko) * 2016-03-30 2018-11-28 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터 도출
KR102126909B1 (ko) 2016-03-30 2020-06-25 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터 도출
KR20200077605A (ko) * 2016-03-30 2020-06-30 주식회사 소니 인터랙티브 엔터테인먼트 하위 호환성을 위한 애플리케이션-특정 연산 파라미터 도출
JP2018037032A (ja) * 2016-09-02 2018-03-08 富士通株式会社 特定プログラム、特定方法および特定装置
CN110929464B (zh) * 2019-11-20 2022-06-03 燕山大学 一种基于改进蜻蜓算法的蓄电池参数辨识方法
CN110929464A (zh) * 2019-11-20 2020-03-27 燕山大学 一种基于改进蜻蜓算法的蓄电池参数辨识方法
CN111898726A (zh) * 2020-07-30 2020-11-06 长安大学 一种电动汽车控制系统参数优化方法、计算机设备及存储介质
CN111898726B (zh) * 2020-07-30 2024-01-26 长安大学 一种电动汽车控制系统参数优化方法、设备及存储介质
WO2023238606A1 (ja) * 2022-06-08 2023-12-14 パナソニックIpマネジメント株式会社 評価装置、評価方法、およびプログラム
WO2024201834A1 (ja) * 2023-03-29 2024-10-03 富士通株式会社 演算プログラム、演算方法、および情報処理装置
CN116614830A (zh) * 2023-07-18 2023-08-18 中国电信股份有限公司 网元优化方法、装置、计算机设备、存储介质
CN116614830B (zh) * 2023-07-18 2023-10-31 中国电信股份有限公司 网元优化方法、装置、计算机设备、存储介质
CN116681312A (zh) * 2023-07-28 2023-09-01 华中科技大学 一种面向生态的多目标水库优化调度决策方法及系统
CN116681312B (zh) * 2023-07-28 2023-10-31 华中科技大学 一种面向生态的多目标水库优化调度决策方法及系统

Similar Documents

Publication Publication Date Title
CN100454314C (zh) 多目的最优化装置、多目的最优化方法及多目的最优化程序
JP5019744B2 (ja) 多目的最適化装置、多目的最適化方法および多目的最適化プログラム
JP5156329B2 (ja) パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
Di Pierro et al. An investigation on preference order ranking scheme for multiobjective evolutionary optimization
JP4947903B2 (ja) 最適化方法及び最適化プログラム
JP2005285090A (ja) 多目的最適化装置、多目的最適化方法および多目的最適化プログラム
Ho et al. Inheritable genetic algorithm for biobjective 0/1 combinatorial optimization problems and its applications
US20040167721A1 (en) Optimal fitting parameter determining method and device, and optimal fitting parameter determining program
KR20030085594A (ko) 유전학적 알고리즘 최적화 방법
CN115034557A (zh) 一种敏捷卫星应急任务规划方法
CN114065896A (zh) 基于邻域调整和角度选择策略的多目标分解进化算法
US7437336B2 (en) Polyoptimizing genetic algorithm for finding multiple solutions to problems
CN118245901A (zh) 驾驶行为分类器参数选取方法、装置、设备、介质和程序产品
Büche Multi-objective evolutionary optimization of gas turbine components
Hamda et al. Multi-objective evolutionary topological optimum design
CN119943206B (zh) 一种多模态蛋白质设计方法、装置、系统及其存储介质
Kölle et al. Optimizing variational quantum circuits using metaheuristic strategies in reinforcement learning
CN113722853B (zh) 一种面向智能计算的群智能进化式工程设计约束优化方法
Damay Multiple-objective optimization of traffic lights using a genetic algorithm and a microscopic traffic simulator
Taboada Multi-objective optimization algorithms considering objective preferences and solution clusters
CN118893618B (zh) 一种机器人运动轨迹的时空测评方法及系统
Santana-Quintero et al. Surrogate-based multi-objective particle swarm optimization
Wang et al. A Novel Multi-objective Squirrel Search Algorithm: MOSSA
Wei et al. Comparative association rules mining using genetic network programming (GNP) with attributes accumulation mechanism and its application to traffic systems
Hsieh et al. Optimal grey-fuzzy gain-scheduler design using Taguchi-HGA method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110719