[go: up one dir, main page]

JP2019034714A - 複数車両環境における自律的車両目標のための自律的動作 - Google Patents

複数車両環境における自律的車両目標のための自律的動作 Download PDF

Info

Publication number
JP2019034714A
JP2019034714A JP2018112638A JP2018112638A JP2019034714A JP 2019034714 A JP2019034714 A JP 2019034714A JP 2018112638 A JP2018112638 A JP 2018112638A JP 2018112638 A JP2018112638 A JP 2018112638A JP 2019034714 A JP2019034714 A JP 2019034714A
Authority
JP
Japan
Prior art keywords
vehicle
autonomous vehicle
autonomous
state
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018112638A
Other languages
English (en)
Other versions
JP2019034714A5 (ja
Inventor
智樹 西
Tomoki Nishi
智樹 西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Engineering and Manufacturing North America Inc
Original Assignee
Toyota Motor Engineering and Manufacturing North America Inc
Toyota Engineering and Manufacturing North America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Engineering and Manufacturing North America Inc, Toyota Engineering and Manufacturing North America Inc filed Critical Toyota Motor Engineering and Manufacturing North America Inc
Publication of JP2019034714A publication Critical patent/JP2019034714A/ja
Publication of JP2019034714A5 publication Critical patent/JP2019034714A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18163Lane change; Overtaking manoeuvres
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/161Decentralised systems, e.g. inter-vehicle communication
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/161Decentralised systems, e.g. inter-vehicle communication
    • G08G1/163Decentralised systems, e.g. inter-vehicle communication involving continuous checking
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/167Driving aids for lane monitoring, lane changing, e.g. blind spot detection
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

【課題】複数車両環境用の自律的車両目標に関連する一組の自律的車両状態セット内の状態の進行のための装置および方法を提供する。【解決手段】別の車両の判別された車両状態を生成するために複数車両環境の別の車両の車両状態が判別され、ここで別の車両は自律的車両目標に影響を及ぼすように動作している。判別された車両状態に基づいて自律的車両状態セットのうちの現在の自律的車両状態についての適応ポリシーが形成され、適応ポリシーから、自律的車両状態セットのうちの後続する自律的車両状態まで進行するための自律的車両アクションが生成される。自律的車両状態セットのうちの後続する自律的車両状態までの進行をもたらすために自律的車両アクションが伝送される。【選択図】図6

Description

本明細書中に記載の主題は、概して、車両環境装置内における自律的車両動作に関し、より詳細には、複数車両環境内で自律的車両目標を達成するための自律的車両動作に関する。
概して、自律的車両は、起点と目的地を有する軌道計画を走行するための自律的運転機能を実施するために、制御システムアーキテクチャを使用してきた。起点から目的地まで走行するというより大きな目標を達成するために、軌道計画は、具体的なランドマークにおいて「右左折する」、指定された制限内の速度で走行する、などのより小さい目標へと解析(parse)された。完全にまたは部分的に自律的でない可能性のある他の車両には、軌道計画を共有しかつ/または道路上の自律的車両と他の形で走行経路を調和させる能力が無かった。1つの戦略は、これらの他の車両を自律的車両との関係における定常環境の一部とみなし、単にこの環境がより頻繁に変化したと考える、というものであった。同様に、これらの環境を査定するための高いサンプリングおよび走査速度は、自律的車両の適時の決断を有効に可能にするのに充分な時間閾値内で処理しアクセスすべき大量のデータを生み出した。複数車両環境内での他の車両の非恒常的または非静的動作も同様に考慮に入れながら(加速すべきか否か、減速すべきか否かなどの)適時のアクション決断を形成する目的で複数車両環境内での自律的車両の決断を最適化することのできる方法および装置に対するニーズが存在する。
複数車両環境における自律的車両の動作のための装置および方法が開示されている。自律的車両の動作は、自律的車両状態セットを含む自律的車両目標を提供し、ここで、複数車両環境の別の車両がこの自律的車両目標に影響を及ぼす。自律的動作による複数車両環境の能動的な走査および検知を必要とすることなく、別の車両の判別された車両状態を考慮しながら自律的車両状態セットのうちの後続する状態まで進行するための、自律的車両アクションが選択される。
一実施形態においては、複数車両環境用の自律的車両目標に関連する一組の自律的車両状態セット内の状態の進行のための方法が開示されている。別の車両の判別された車両状態を生成するために複数車両環境の別の車両の車両状態が判別され、別の車両は自律的車両目標に影響を及ぼすように動作している。判別された車両状態に基づいて自律的車両状態セットのうちの現在の自律的車両状態についての適応ポリシーが形成され、適応ポリシーから、自律的車両状態セットのうちの後続する自律的車両状態まで進行するための自律的車両アクションが生成される。自律的車両アクションは、自律的車両状態セットのうちの後続する自律的車両状態までの進行をもたらすために伝送される。
別に実装においては、複数車両環境における自律的車両の動作のための車両制御ユニットが開示されている。車両制御ユニットは、無線通信インタフェース、プロセッサおよびメモリを含む。無線通信インタフェースは、車両ネットワークとの通信に供用するために動作可能である。プロセッサは、無線通信インタフェースおよび複数の車両センサ装置に対し通信可能な形で結合されている。メモリは、プロセッサに対して通信可能な形で結合され、自律的車両目標のための自律的車両状態セットの各々の状態進行について、複数車両検出モジュールおよび強化学習モジュールを記憶している。複数車両検出モジュールは、プロセッサによって実行された場合に、プロセッサに、複数の車両センサ装置の第1の部分に基づいて複数車両環境の別の車両の車両状態を判別して、別の車両の判別された車両状態を生成させる命令を含み、ここで別の車両は、自律的車両目標に影響を及ぼすように動作する。強化学習モジュールは、プロセッサによって実行された場合に、プロセッサに、複数の車両センサ装置の第2の部分に基づいて複数車両環境に関係する自律的車両の動作についての受動的動的データを検索させる命令を含む。強化学習モジュールは、判別された車両状態および受動的動的データに基づいて、自律的車両目標に関連する複数の自律的車両状態のうちの現在の自律的車両状態のための適応ポリシーを形成する。この適応ポリシーから、強化学習モジュールは、自律的車両状態セットのうちの後続する自律的車両状態まで進行するために適応ポリシーから自律的車両のアクションを形成し、自律的車両状態のうちの後続する自律的車両状態までの進行をもたらすために自律的車両アクション指令を伝送する。
複数の図を通して、同様の参照番号は同様の部分を意味している添付図面を参照しながら説明が行なわれ、図面は次の通りである:
図1は、複数車両環境内で自律的車両の動作を提供するための車両制御ユニットを含む車両の概略的例示である。 図2は、図1の車両制御ユニットのブロック図を例示する。 図3は、複数車両環境内での自律的車両の動作のための強化学習構造を伴う機能的モジュールブロック図を例示する。 図4は、図3の強化学習モジュールの一実施例の機能的モジュールブロック図を示す。 図5は、自律的動作機能性を有する車両および別の車両を含む複数車両環境の一実施例を示す。 図6は、複数車両環境内で自律的車両目標まで進行するための、自律的動作ための例示的プロセスを示す。
本明細書では、自律的車両目標のための複数車両環境用の自律的車両動作について説明する。例示的方法では、複数車両環境内の別の車両が自律的車両目標に影響を及ぼすか否かが考慮される(例えば別の車両を含む車線の交通の流れとの合流)。自律的車両ソリューションでは、別の車両を、自律的車両との関係における定常な、または予測可能な車両環境の一構成要素として考慮していた。これとは対照的に本明細書中の例示的方法および実施形態では、車両目標を達成する目的で車両のソリューションを形成するため、別の1つまたは複数の車両の車両アクションが考慮されている。
図1は、複数車両環境116において自律的車両動作を提供するための車両制御ユニット110を含む車両100の概略的例示である。
ここで分かるように、車両100は、自動車、軽トラック、貨物輸送車両または他の任意の乗用車または非乗用車両であり得る。
複数の物体センサ装置102−1、102−2、103−3、102−4、102−5および102−6(全体として、物体センサ装置102)は、別の車両150が車両100についての軌道計画134との関係における自律的車両目標に影響を及ぼすように動作し得る複数車両環境116を査定するために制御ユニット110と通信状態にある。車両100の軌道情報(および自律的車両状態)は、概して、軌道計画134、車両速度、車両メーカー、車両モデル、ファームウェア設備、目的地地点、および、GPSおよび/またはマッピング技術上で位置設定され得るさまざまな既定のマーカーにおける軌道点動作(例えば、減速、停止、右左折、加速、交通の流れとの合流など)を含み得る。
同様に、軌道情報は、中間自律的車両目標も含み得る。すなわち、車両制御ユニット110は、信号、通りにおける右左折など、交通信号マーカーのための加速または減速などの目標を概して静的なものとして識別し得る。一方で、複数車両環境116の場合などには、中間自律的車両目標は、別の車両150に関連して動的であり得る。このような自律的車両目標は、図2〜6を参照しながら詳述されるように、例えば合流車線を介して高速道路へ、現在の交通車線から隣接する交通車線へ、出口車線から側道車線へなど、別の車両150を伴う交通の流れの中への車両100による合流を含み得る。便宜上、自律的相互作用は、別の車両150の速度および進路の変動および交通合流などの中間自律的車両目標に対して結果としてもたらされる効果を無視して、静的および/または恒常なものとして別の車両150の挙動をモデリングする場合がある。
複数の物体センサ装置102は、車両100の外部表面上に位置付けされ得、あるいは、美観上から車両100との関係において隠された形で位置付けされてもよい。物体センサ装置102と車両制御ユニット100を含めた車両制御ユニットとの間の通信は、バスベースであってよいが、同様に、車両100の他のシステムによって使用されるかまたは動作させられてもよい。
例えば、物体センサ装置102は、Body Electronic Area Network(BEAN)、Controller Area Network(CAN)バス構成、Audio Visual Communication Local Area Network(AVC−LAN)構成および/または車両100の装置およびシステム間の通信を提供するための追加の通信システムアーキテクチャの他の組合せなどのネットワークアーキテクチャの組合せによって結合されてよい。
例示的物体センサ装置102の出力は、検知用信号を介して複数車両環境116の別の車両が自律的車両物体に影響を及ぼすか否かを決定するために、車両制御ユニット110によって使用されてよい。そのような場合、物体センサ装置102は、検知用信号152を介して、車両100を基準にして別の車両150の車両状態を判別することができる。
物体センサ装置102は、Light Detection and Ranging(LIDAR)システムによって提供されてよく、ここで、物体入力装置102は、車両100の環境116内の物理的物体からのレーザ光の戻りに関連するデータを捕捉することができる。物体センサ装置102は同様に、レーザ(LIDAR)とミリ波レーダ装置の組合せを含むこともできる。LIDARおよびレーダベースの装置は、物体の速度(すなわち相対的および/または絶対的速度)と共に物体を検知するように動作し得る。
物体センサ装置102は、深さ画像を捕捉するため、または捕捉画像についての深さ情報を他の形で生成するために、単独でまたは組合せた形で動作してよい。例えば、物体センサ装置102は、画像(視覚的および非視覚的スペクトル波長、可視および非可聴波長など)を捕捉するように構成されてよい。
この点において、物体センサ装置102は、検知用信号152を介して複数車両環境116の別の車両150の距離ベクトル測定を決定するように動作可能である。
例えば、物体センサ装置102の各々は、構造化光、飛行時間(例えばドップラ検知用信号のもの)、光検出測距(LIDAR)、光照射野および、別の車両150の深度/距離、方向および/または速度を決定するための他の情報を検知および/または分析するように構成されていてよい。
動作中、多数のセンサ102−1〜102−6を組合わせて、または独立して使用して物体を検出することができる。一実施例において、物体センサ装置102−1、102−2、103−3は、車両100の前方の物体を検出するために動作でき、物体センサ装置102−4、102−5および102−6は、車両100の後方の物体を検出するために動作することができる。
同様に、物体センサ装置102の各々は、それぞれの空間的部分に基づいて集合的物体パラメータ検出を提供するためにそれぞれの機能を実装することができる。例えば、物体センサ装置102−1は、別の車両150などの物体を検出するために動作することができ、物体センサ装置102−2は、車両100との関係において別の車両150の物体速度を検出するために動作することができる。さらに物体センサ装置102−3は、別の車両150などの物体の検知および/または検出を確証するために、物体センサ装置102−1との組合せで動作することができる。ここで分かるように、物体の速度を、物体センサ装置102を介して決定してよく、物体の連続的な位置検出測定およびそれに基づいて運動の速度および/または方向を計算すること(例えば運動ベクトルを形成するため)によって外挿することができる。
同様に、物体センサ装置102のそれぞれのサブセットは、他の物体センサ装置サブセットと組合わせた形で動作してよく、所望される検知機能および/または利用分野用に交番式または非同期的、同時または個別的ベースで動作することもできる。
動作中、車両制御ユニット110は、物体センサ装置102により出力され得る車両センサデータを受信するように動作することができる。物体センサ装置102は、軌道計画134に沿って、速度V100で走行しながら車両100を取り囲むエリア内の物理的物体からのレーザ戻りに関連する車両センサデータを捕捉し送信することができる。一例として、検知用信号152の信号の戻りは、車両経路のマーキング、例えばセンタライン、車線ラインおよび車両経路134の縁部、交通標識など、ならびに別の車両150を標示し得る。
ここで分かるように、車両制御ユニット110は、複数車両環境116のための自律的車両目標を選択するために動作し得る。自律的車両目標は、軌道計画134および/または車両制御ユニット116による短期自律的制御に基づくものであり得る。自律的車両目標に関して、車両制御ユニット110は、1組の自律的車両状態セットを識別し、複数車両環境の別の車両150が自律的車両目標に影響を及ぼすか否かを決定することができる。
車両環境116の別の車両150が自律的車両目標に影響を及ぼす場合、車両制御ユニット110は、別の車両150の判別された車両状態をも考慮しながら、自律的車両目標を達成するために自律的車両状態セットを通して進行するように動作する。車両制御ユニット110は、別の車両150の判別された車両状態に基づいて、車両100のための自律的車両状態セットのうちの現在の自律的車両状態に対する適応ポリシーを形成するように動作することができる。適応ポリシーは、車両目標の自律的車両状態セットのうちの後続する自律的車両状態まで進行するための自律的車両アクションを形成する。車両制御ユニット110は、自律的車両状態セットのうちの後続する自律的車両状態まで進行させるための車両アクションを伝送し得る。このように車両状態セットを通して再帰的に進行することにより、車両制御ユニット110は、図2〜6を参照しながら詳述されるように、複数車両環境116内の自律的車両目標を満たすことができる。
図2は、図1の車両制御ユニット110のブロック図を例示する。図2は、バス208を介して通信可能な形で結合されている無線通信インタフェース202、プロセッサ204およびメモリ206を含む車両制御ユニット110のブロック図である。車両制御ユニット110は、図1〜6を参照して詳述される装置および方法のための例示的プラットフォームを提供することができる。
プロセッサ204は、従来の中央処理ユニットまたは情報を操作または処理できる任意の他のタイプの装置または多数の装置であり得る。ここで分かるように、プロセッサ204は、単一の処理装置または複数の処理装置であってよい。このような処理装置は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、マイクロコンピュータ、中央処理ユニット、フィールドプログラマブルゲートアレイ、プログラマブル論理装置、状態機械、論理回路、アナログ回路、デジタル回路、および/または回路および/または動作命令のハードコーディングに基づき信号(アナログおよび/またはデジタル)を操作する任意の装置であってよい。
メモリ(および/またはメモリエレメント)206は、プロセッサ204に対して通信可能な形で結合され得、本明細書中に記載の1つ以上のモジュールを記憶するように動作することができる。モジュールは、実行された場合に本明細書中に記載のさまざまなプロセスおよび/またはオペレーションのうちの1つ以上をプロセッサ204に実施させる命令を含むことができる。
メモリおよび/またはメモリエレメント206は、単一のメモリ装置、複数のメモリ装置、および/またはプロセッサ204の埋込み型回路であってよい。このようなメモリ装置は、読取り専用メモリ、ランダムアクセスメモリ、揮発性メモリ、不揮発性メモリ、スタティックメモリ、ダイナミックメモリ、フラッシュメモリ、キャッシュメモリ、および/またはデジタル情報を記憶する任意の装置であってよい。さらに、本明細書中に記載の配置は、コンピュータ可読プログラムコードが上に具体化、例えば記憶された1つ以上のコンピュータ可読媒体の形で具体化されたコンピュータプログラムプロダクトの形を取ることができる。1つ以上のコンピュータ可読媒体の任意の組合せを利用してよい。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。
「コンピュータ可読記憶媒体」は、非一時的記憶媒体を意味する。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁、赤外線または半導体システム、装置または装置、あるいはこれらの任意の好適な組合せであり得るが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的リスト)としては、以下のものが含まれると思われる:すなわち、ポータブルコンピュータディスケット、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)、読取り専用メモリ(ROM)、消去可能プログラマブル読取り専用メモリ(EPROMまたはフラッシュメモリ)、ポータブルコンパクトディスク読取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、光学記憶装置、磁気記憶装置またはこれらの任意の好適な組合せ。本明細書に関連して、コンピュータ可読記憶媒体は、命令実行システム、装置または装置によるまたはこれらに関連した使用のためのプログラムを格納または記憶できる任意の有形媒体であってよい。コンピュータ可読媒体上に具体化されたプログラムコードは、非限定的に無線、有線、光ファイバ、ケーブル、RFなどまたはこれらの任意の好適な組合せを含む、任意の適切な媒体を使用して伝送されてよい。
メモリ206は、機械可読命令または命令を記憶でき、こうしてプロセッサ204が機械可読命令にアクセスできるようになっている。機械可読命令は、プログラミング言語およびその各世代(例えば1GL、2GL、3GL、4GLまたは5GL)、例えばプロセッサ204により直接実行され得る機械語、またはアセンブリ言語、オブジェクト指向プログラミング(OOP)、例えばJAVA、Smalltalk、C++など、従来の手続き型プログラミング言語、スクリプト言語、マイクロコードなど、機械可読命令へとコンパイルまたはアセンブルされメモリ206内に記憶され得る言語で書かれた論理またはアルゴリズムを含むことができる。代替的には、機械可読命令は、ハードウェア記述言語(HDL)例えばフィールドプログラマブルゲートアレイ(FPGA)構成かまたは特定用途向け集積回路(ASIC)、またはそれらの等価物を介して実装される論理で書かれていてもよい。したがって、本明細書中に記載の方法および装置は、予めプログラムされたハードウェア素子として、またはハードウェアおよびソフトウェア構成要素の組合せとして、任意の従来のコンピュータプログラミング言語で実装され得る。
プロセッサ204が2つ以上の処理装置を含む場合、処理装置は中央に位置設定(例えば有線および/または無線バス構造を介して直接合わせて結合)されてよく、あるいは分散して位置設定(例えばローカルエリアネットワークおよび/または広域ネットワークを介した間接的結合によるクラウドコンピューティング)されてもよい、ということに留意されたい。さらに、プロセッサ204が、状態機械、アナログ回路、デジタル回路および/または論理回路を介してその機能の1つ以上を実装する場合、対応する動作命令を記憶するメモリおよび/またはメモリエレメントは、状態機械、アナログ回路、デジタル回路および/または論理回路を含めた回路の内部に埋込まれるかまたはこの回路の外部にあってよいという点に留意されたい。
さらにまた、メモリ206は、図1〜6に例示されたステップおよび/または機能の少なくともいくつかに対応するモジュールのハードコーディングされた命令および/または動作命令を記憶し、プロセッサ204はそれを実行する、という点に留意されたい。
車両制御ユニット110は、本明細書中にその少なくともいくつかが記載されている1つ以上のモジュールを含むことができる。モジュールは、プロセッサ204によって実行された場合に本明細書中に記載のさまざまなプロセスの1つ以上を実行するコンピュータ可読プログラムコードとして実装可能である。モジュールの1つ以上は、プロセッサ204の一構成要素であり得、あるいはモジュールの1つ以上を、プロセッサ204が動作可能な形で接続されている他の処理システム上で実行させる、および/またはこれらのシステムの間で分散させることも可能である。モジュールは、1つ以上のプロセッサ204により実行可能な命令(例えばプログラム論理)を含むことができる。
無線通信インタフェース202は概して、車両ネットワーク212を介して受信したデータを支配し管理する。任意の特定のハードウェア配置上で動作する本開示に対する制約は全く無く、したがって、本明細書中の基本的特徴は、開発される可能性のある改良型のハードウェアおよび/またはファームウェア配置のために、置換、除去、追加または他の形で修正されてもよい。
アンテナ112は、全地球測位システム衛星により伝送される電磁信号と相互作用する1つ以上の導体素子を含み得る。受信された信号は、場所(例えば緯度および経度位置)を表わす、さらには道路データとの関係における車両の位置付けを表わすデータ信号へと変換されてよい。
車両制御ユニット110は、例えば車両制御ユニット110のアンテナ112または他のこのような車両アンテナ(図示せず)を介して、全地球測位システム衛星からの信号を受信するために通信可能な形で結合され得る。アンテナ112は、無線通信112を通した車両制御ユニット110との通信を提供するように動作する。ここで分かるように、無線通信112は、別の車両150に関し得る車両の動作データ140を受信する目的で、車両間(V2V)通信、車両・インフラ間(V2I)通信および/またはデータ/セルラ通信を搬送するために動作することができる(図1)。
無線通信122は、1つまたは多くの無線通信システム仕様に基づくものであってよい。例えば、無線通信システムは、非限定的に3GPP(第3世代パートナシッププロジェクト)、4GPP(第4世代パートナシッププロジェクト)、5GPP(第5世代パートナシッププロジェクト)、LTE(ロングタームエボリューション)、LTE Advanced、RFID、IEEE802.11、Bluetooth、AMPS(先進移動電話サービス)、デジタルAMPS、GSM(汎欧州デジタル移動電話方式)、CDMA(符号分割多元接続)、LMDS(ローカル多地点配信システム)、MMDS(多チャンネル多地点配信システム)、IrDA、無線USB、Z−Wave、ZigBee、および/またはそれらの変形形態を含めた1つ以上の標準仕様にしたがって動作し得る。
ここで分かるように、車両ネットワーク212の通信路213は、例えば導線、導電性トレース、光導波路などの、信号を伝送するのに好適な媒体で形成されてよい。さらに、通信路213を、信号を伝送できる媒体の組合せで形成することもできる。
一実施形態において、通信路213は、プロセッサ、メモリ、センサ、入力装置、出力装置および通信装置などの構成要素に対する電気データ信号の伝送を可能にするように協働する導電性トレース、導線、コネクタおよびバスの組合せを含んでいてよい。
したがって、通信路213は、車両バスまたはその組合せ、例えばBody Electric Area Network(BEAN)、Controller Area Network(CAN)バス構成、Audio Visual Communication−Local Area Network(AVC−LAN)構成、Local Interconnect Network(LIN)構成、Vehicle Area Network(VAN)バス、および/または車両100の装置およびシステムの間の通信を提供するための追加の通信・システムアーキテクチャの他の組合せによって提供され得る。
「信号」なる用語は、本明細書中に記載の媒体の少なくともいくつかを通って伝播できる波形(例えば電気的、光学的、磁気的、機械的または電磁的)、例えばDC、AC、正弦波、三角波、方形波、振動などに関係するものと理解されてよい。
車両制御ユニット110のそれぞれのモジュールおよび付随する命令は、図3〜6を参照して詳述されるように、プロセッサ204により実行された場合に、このプロセッサ204に物体センサ装置102(図1)からの車両センサデータ216を受信させ、少なくとも部分的に車両センサデータ216に基づいて自律的車両アクション指令124を生成させる。
図3は、車両制御ユニット110のためのメモリ206内に記憶された機能的モジュールブロック図を例示し、ここで、メモリ206は複数車両検出モジュール308および強化学習モジュール312を記憶することができる。メモリ206は同様に、フィードバックモジュール318および自律的車両データモジュール314を記憶することもできる。
車両検出モジュール308は、別の車両のための動作データ306を受信し得る。動作データ306は、別の車両により伝送された車両動作データ140、および/または別の車両150(図1)の観察に関係する車両センサデータ216−150(例えば、物体センサ装置102データ出力)に基づいていてよい。車両についての自律的車両状態322に関するデータとの関係において、車両センサデータ216−100は、車両100の動作に関係する車両センサデータ216(例えば、車両速度センサ(VSS)データ出力、慣性測定ユニット(IMU)データ出力など)に関係する。
動作データ306に基づいて、複数車両検出モジュール308は、プロセッサによって実行された場合にこのプロセッサに複数車両環境の別の車両の車両状態を判別させて自律的車両目標に影響を及ぼし得る別の車両の判別された車両状態を生成する命令を介する。例えば、自律的車両目標が交通の流れと合流することになる可能性がある場合(例えば道路および/または高速道路上へ)、別の車両が自律的車両目標に影響を及ぼす可能性があるが、これは自律的車両が別の車両の動作状態を要因として考慮しないときには衝突および/または回避アクションが必然的に発生し得るからである。この点において、合流の目標は、自律的車両が充分な間隔を取ってかつ別の車両(または他の車両全般)との衝突無く安全に流れの中に移行することであり得る。
強化学習モジュール312は、判別された車両状態310および自律的車両100に関係する車両センサ装置216−100に基づく自律的車両状態322を受信する。ここで分かるように、強化学習構造は、自律的車両アクション指令124を基礎として用いるべく制御ダイナミクスを生成するのに、環境の能動的サンプリングに依存していた。調査コストは過剰となる可能性があり、その結果、適時のアクション決断に到達するために時間および処理およびサンプリングオーバーヘッドがかかり過ぎることを理由として、衝突またはニアミスを導く可能性のある楽観的な操作を自律的車両に試みさせることを受容できない可能性がある。
したがって、強化学習モジュール312は、受動的動的データを検索するために自律的車両データセットモジュール314にアクセスしてよい。自律的車両データセットモジュール314は、車両100に関係する部分的に公知のシステムダイナミクスモデルをサンプリングし、開発しメモリ206内に記憶するように動作する。モデルは、(a)制御ダイナミクスデータと(b)受動的環境ダイナミクスデータとを含む。制御ダイナミクスデータは、車両100の自律的制御(速度パラメータ、方向パラメータ、加速パラメータ、減速パラメータなど)と符合する。環境ダイナミクスデータ(例えば、道路上の平均速度、別の車両150との過去の相互作用/シミュレーション、環境内の気候条件など)は、能動的に収集されておらず、その代りに自律的車両100と符合する先に収集され記憶された状態遷移および/またはシミュレーションデータに基づくものであり得るという点で、受動的であり得る。
こうして、環境ダイナミクスデータは、車両110と結びつけられた位置−ベクトルデータに基づいて軌道計画134の道路部分に、そして判別された車両状態310を介して別の車両150と結びつけられる位置−ベクトルデータに関係し得る。
フィードバックモジュール318は、車両動作データ140および/または車両センサデータ216−150に基づいて別の車両の動作データを受信し、自律的車両アクション指令124の結果に関係する報酬データ320−150を決定する。車両センサデータ216−100との関係におけるに自律的車両状態322に基づいて、さらなる報酬または強化を決定してよい。
図4は、図3の強化学習モジュール312の一実施例の機能的モジュールブロック図を例示する。ここで分かるように、強化学習(RL)は、機械学習の一形態であり、人工頭脳(AI)の一態様とみなされ得る。強化学習モジュール312の1つの目標は、ポリシー決断に続いて状態値を予測し、最適なポリシーの達成に向けてポリシーを変更することにある。
強化モジュール312は、クリティックモジュール402とアクターモジュール406を含んでいてよい。クリティックモジュール402は、報酬データ320および車両センサデータ216−100を介した自律的車両アクション124の帰結の観察に基づくものであり得る、強化フィードバック信号404の生成による状態評価を提供するために動作する。ここで分かるように、クリティックモジュール402は、アクションが先行する自律的車両アクション124で期待されるものに比べて改善したかまたは悪化したかについての標示を提供する時間的差異誤差の形をとり得る。時間的差異が正である場合、その自律的車両アクション124の選択に向かう傾向は強められると考えられる。報酬データの一般的な例として、正の報酬は、所望の軌道を首尾よくたどっていることを表わし、一方負の報酬は衝突(または所望の軌道を首尾よくたどらないこと)を表わし得る。
アクターモジュール406は、ポリシーπ改善を提供することができ、自律的車両アクション124がいかに「良好に」機能すると期待され得るか(すなわち将来の報酬)の値関数であるエージェントモジュール挙動関数および複数車両環境116のモデル表現を含むポリシーπ構成要素を含む。ポリシーπは、自律的車両状態から自律的車両アクション124に対してマッピングされ得るような車両の挙動とみなすことができる。ここで分かるように、ポリシーπは、決定論的ポリシー(例えばアクション「a」はπ(状態「s」に等しい)であるか、または、ポリシーπ(アクション「a」|状態「s」)がマルコフの進行における次の自律的車両状態のための確率P[At=アクション「a」124|St=アクション「s」]に等しい確率的ポリシーであることができる。
アクターモジュール406は、自律的動作の未来が現在の状態(位置、速度、方向など)および自律的車両アクション124に依存しているマルコフ形とみなされてよい。Sを状態セットとし、A(s)を状態Sにおいて可能なアクションのセットとし、pを状態「S」からの遷移の確率とし、rを、自律的車両アクションAを状態Sで実行したときの期待報酬とし、γを期待報酬rについての割引率として、{S、A、p、r、γ}によりマルコフ決断プロセスが定義される。
指摘された通り、強化学習モジュール312のための受動的アクタークリティック構造において、2つのデータソース、そのうちの1つは、受動的状態遷移(すなわち環境116に関するサンプリングおよび/またはシミュレーションされた車両アクション)上で収集された受動的動的データ、および自律的車両100のための公知の制御ダイナミクスである。線形可解の連続マルコフ決断プロセス(L−MDP)に適用され得るように、クリティックモジュール402は、受動的動的データ316から線形化ベルマン方程式に基づいて推定値を推定することができ、一方アクターモジュール406は、受動的動的データ316上の標準ベルマン方程式および自律的車両100のための制御ダイナミクスモデルに基づいてポリシーπを最適化する(自律的車両アクション124を生成する)ために動作することができる。
図5は、車両100および別の車両150を含む複数車両環境116の一実施例を示す。車両100は、自律的車両目標546を選択し、本実施例については道路560の交通の流れに車両100を合流させることである自律的車両目標に関係する自律的車両状態セット540、542、544、および546を識別する。自律的車両状態540、542、544および546は、車両制御ユニット110によって離散的サンプリング間隔により標示され得、概して、自律的車両目標546に向かう車両100の進行の過小サンプリングおよび/または過大サンプリングを回避するように選択され得る。ここで分かるように、自律的車両状態の数は、離散的サンプリング間隔に基づいて増減し得る。
強化学習モジュール312の受動的アクタークリティック構造に関して(図4)、受動的動的データ316は、自律的車両100による最適なポリシーπ(すなわち、合流車線562から道路560の交通の流れに合流するための所与の距離にわたる速度の増加)を可能にする。この実施例において、最適なポリシーπは、自律的車両目標546、すなわち交通の流れとの合流のための物理的特性の各々(例えば合流車線562の長さ、合流車線562のための平均速度、道路560の交通の流れと合流するために加速すべき速度など)を識別するために複数車両環境116の能動的調査に基づいていない。その代り、これらの特性は、受動的に収集されており、かつ/または車両制御ユニット110の強化学習モジュール312による使用のために環境モデルをレンダリングするためにシミュレートされ、こうして、そうでなければ環境および/または状況査定に割当てられる時間が削減される。
別の車両150は、車両100の時間においてまたはおよそこの時間において自律的車両目標546を妨害し得ることから、車両100の車両制御ユニット110を介して、自律的車両目標546に影響を及ぼすものと決定される。この点において、車両100と別の車両150との間の衝突および/またはニアミスの可能性が結果として発生し得る。
ここで分かるように、例えば現在の交通車線から別の車両を含む隣接する交通車線への合流、出口車線から別の車両を含む側道車線への合流など、自律的車両100の自律的車両目標に別の車両150が影響を及ぼす他の例示的シナリオも発生し得る。同様に実施例を簡略化するため、1台の車両150が自律的車両目標に影響を及ぼすものとして示されている。より激しい交通の流れ条件においては、数台の他の車両が自律的車両目標に影響を及ぼす可能性があり、自律的車両目標546に向かう自律的車両100のアプローチを調整するために、追加の他の車両についての車両状態のさらなる検知および判別を実施することができる。
動作中、車両制御ユニット110は、検知用信号152(およびそれらのそれぞれの戻り)および/または無線通信122を介して車両制御ユニット110により受信された車両動作データ140(例えば車両制御ユニット110との関係における別の車両150の位置、速度、進行方向など)に基づいて、判別された車両状態502、504、506...などを生成することができる。この点において、車両制御ユニット110は、自律的車両目標546に向かって後続する自律的車両状態540まで進行するための自律的車両アクション(例えば加速レベル(m/s2))を形成するために適応ポリシーπを形成する上で反復的に別の車両150の動きを考慮に入れるように動作することができる。
動作中、車両制御ユニット110は、別の車両150の車両状態を判別して、判別された車両状態を生成することができる。別の車両150の判別された車両状態は、別の離散的時間的間隔に基づくものであってよい。車両制御ユニット110は、別の車両150の時間t’における判別された車両状態Sとの関係における時間tにおける現在の自律的車両状態に対する適応ポリシーπを形成する。適応ポリシーπから、時間tにおける現在の自律的車両状態から時間t+1における自律的車両状態セットSのうちの後続する自律的車両状態まで進行するために、自律的車両アクション(t)522が生成される。明確さのため、自律的車両アクションは、合流車線562から道路560への合流のために充分な自律的車両100と別の車両150の相対的速度に基づくものであり得る適応ポリシーπに基づく自律的車両の速度に関係するものであってよい。
自律的車両アクション(t)522は、自律的車両状態セットのうちの後続する自律的車両状態への進行をもたらすために伝送され得る。すなわち、自律的車両アクション(t)522は、車両パワートレインアクチュエータに対する自律的車両アクション(t)522、自律的車両アクション(t1)526、自律的車両アクション(t+2)530などに基づいて制御データを生成することのできる、パワートレイン制御ユニットなどの自律的車両100の他の車両制御ユニットに対して提供されてよい。
ここで分かるように、車両100の他の車両制御ユニットは、車両制御ユニット110(図2)などと類似の構造を有することができる。同様に本明細書中で使用される「パワートレイン」なる用語は、動力を発生させその動力を路面、水または空気に送出する車両構成要素を表わし、エンジン、トランスミッション、駆動シャフト、差動装置およびこの動力を運動に伝達する最終駆動機構(例えば、駆動輪、軍用戦車またはキャタピラトラクタ内の連続軌道、プロペラなど)を含み得る。同様に、パワートレインは、車両100の物理的ハンドルを通したまたはドライブバイワイヤおよび/またはドライブバイライトアクチュエータを介した、ハンドル角度制御を含み得る。
図5に示されているように、自律的車両状態セットのうちの後続する状態への進行には、現時間(t)に関連する自律的車両アクション部分と、後続する自律的車両状態との関係における将来の時間的間隔(t+1)における報酬部分(例えばSt+1における自律的車両状態540についての報酬(t+1))が含まれる。受動的アクタークリティックモジュール(図4)に基づく強化学習構造312においては、クリティックモジュール402は、達成されたか否かを決定するために知覚された報酬524を評価し、さらに、強化フィードバック信号404を介して適宜アクターモジュール406(図4)のポリシーπをさらに適応させるように動作することができる。
したがって、判別された車両状態502(例えば時間t’から時間(t’+1)までの別の車両150の距離xの変化および速度vt’+1m/s)で、自律的車両状態540から後続する自律的車両状態542まで進行するために、自律的車両100は、知覚された報酬(t+2)528(例えば、別の車両150の前方または後方の距離dt+1メートル)を伴って、自律的車両アクション(t+1)526(例えば加速度at+1m/s2)を実施する。
判別された車両状態504(例えば時間(t’+1)から時間(t’+2)までの別の車両150の距離xの変化および速度vt’+2m/s)で、自律的車両状態542から後続する自律的車両状態544まで進行するために、自律的車両100は、知覚された報酬(t+3)528(例えば、別の車両150の前方または後方の距離dt+2メートル)を伴って、自律的車両アクション(t+2)530(例えば加速度at+2m/s2)を実施する。
判別された車両状態506(例えば時間(t’+2)から時間(t’+3)までの別の車両150の距離xの変化および速度vt’+3m/s)に関して、自律的車両状態544から後続する自律的車両状態(および)自律的車両目標)546まで進行するために、自律的車両100は、知覚された報酬(t+4)536(例えば、別の車両150の前方または後方の距離dt+4メートル)を伴って、自律的車両アクション(t+3)534(例えば加速度at+3m/s2)を実施する。
ここで分かるように、1つの自律的車両状態540、542、544および546からの自律的車両アクションは、互いに類似していない場合がある。同様に、別の車両150の速度および/または加速度は、判別された車両状態St’から判別された車両状態および初期時間t’まで、恒常でない可能性がある。
図6は、複数車両環境内の自律的車両目標まで進行するための自律的動作についての例示的プロセス600を示す。図6は、複数車両環境内の自律的車両目標まで進行するための例示的プロセス600である。
動作602において、車両環境についての自律的車両目標が選択され、動作604において、自律的車両目標に関連する自律的車両状態セットを識別する。自律的車両状態は、自律的車両目標までの進行を査定するための離散的時間的間隔および/または周期とみなされてよい。自律的車両目標の一例は、進入車線から主要道路の交通の流れへの合流、現在の交通車線から別の車両を含む隣接する交通車線への合流、出口車線から別の車両を含む側道車線への合流などであり得る。
動作606では、車両環境の別の車両が、自律的車両目標に影響を及ぼすか否かについての決定が行なわれる。例えば静的環境という仮定の下では、自律的車両は、目標を完遂する上で他の物体および/または車両の動きを考慮に入れない。いくつかの事例においては、他の車両および/または物体が充分な距離だけ離れたところにありそれらが自律的車両の動作と干渉する確率が無視できるものであり得る場合など、この仮定が有効であり得る。
別の車両が動作608において自律的車両目標に影響を及ぼす場合には、本明細書中で論述されている方法および装置は、このような別の車両により導入される変数を考慮し、適応ポリシーπを通して、別の車両を考慮に入れ、自律的車両目標へと進行する自律的車両アクションを選択する。
渋滞シナリオ、例えば道路への合流が遭遇し得るシナリオにおいては、自律的車両目標に対する別の車両の効果が無視できるものでない確率が高くなる。その上、アクタークリティック制御構造は環境の能動的な現在のスキャニング/サンプリングに依存してきたことから、動的環境が、時宜を得た形でサンプリングおよび査定を行なうために、車両制御ユニットを凌駕する傾向を有し得る。概して、アクションの決断は、自律的車両が車両環境と対話するための許容時間ウィンドウ外に来る場合がある。
したがって、受動的アクタークリティック構造では、必要に応じて類似の環境内で想起され得る、受動的な記憶されたベースで収集された環境サンプルに基づいて、最適化および/または適応ポリシーπを開発することができる。この点において、自律的車両アクションは、能動的な環境スキャニングおよび査定に依存せず、その代りに、同じく別の車両を考慮に入れるために動作可能である適応ポリシーの下で生成されたアクションに焦点を当てる適応ポリシーπに基づいていてよい。
したがって、動作610では、別の車両に関係する車両状態が判別されて、判別された車両状態を生成する。動作612において、別の車両の判別された車両状態との関係における自律的車両状態セットのうちの現在の自律的車両状態についての適応ポリシーが形成される。概して、自律的車両アクションに関して達成された報酬に対して推定上の報酬を評価することにより、ポリシーπを適応させることができる。
例えばアクションが、後続する自律的車両の状態への到達に基づいて、および別の車両の判別された車両状態に基いて加速度を増大させることである場合、推定上の報酬は、速度を一定量だけ増大させ、後続する自律的車両状態において別の車両までの相対的距離を増大させることである。例えば、期待が及ばない場合(例えば他の車両がそれぞれの速度を自律的車両の速度を超えて増大させた場合)、後続するアクションはこのフィードバックに基づくものとなる。
同様に、ここで分かるように、自律的車両および別の車両の状態間隔のサンプリングおよび/または査定は、自律的車両アクション(例えば加速度の増減)についての充分な情報を得た上での決断を可能にするように、交互および/またはインターレース方式であり得る。
動作614においては、車両目標の自律的車両状態セットのうちの後続する自律的車両状態まで進行するための適応ポリシーに基づいて、自律的車両アクションが形成される。動作616において、自律的車両アクションは、自律的車両状態セットのうちの後続する自律的車両状態までの進行をもたらすために伝送される。例えば、パワートレイン制御ユニットなどの自律的車両100の他の車両制御ユニットに対して自律的車両アクションを伝送することができる。パワートレイン制御ユニットは、適応ポリシーπにより形成された自律的車両アクションに基づいた制御データを生成するように動作することができ、このデータは後に車両パワートレインアクチュエータに提供される。
動作618において、自律的車両状態セットのうちの後続する自律的車両状態が同様に自律的車両目標である場合、プロセス600は終了する。そうでなければ、プロセス600は、動作610において、自律的車両状態セットの状態進行を続行する。
本明細書中では詳細な実施形態が開示されている。しかしながら、開示された実施形態は単なる一例として意図されたものであるということを理解すべきである。したがって、本明細書中で開示されている具体的な構造的および機能的詳細は、限定的なものとして解釈されるべきではなく、単にクレームのための根拠としておよび本明細書中の態様を事実上任意の詳細な構造内でさまざまな形で利用するように当業者に教示するための代表的根拠として解釈されるべきものである。さらに、本明細書中で使用されている用語および言いまわしは、限定的であるよう意図されておらず、むしろ考えられる実装の理解可能な説明を提供するべく意図されたものである。さまざまな実施形態が図1〜7に示されているが、実施形態は、例示された構造または利用分野に限定されない。
当業者であれば認識し得るように、本明細書中で使用され得る「実質的に(substantially)」または「おおよそ(approximately)」なる用語は、その対応する用語および/または品目間の相対性に対して、業界で受容される誤差を提供している。品目間のこのような相対性は、数パーセントの差異から大きな差異にまで及ぶ。
当業者であればさらに認識し得るように、本明細書中で使用され得る「結合された(coupled)」なる用語は、直接的結合および別の構成要素、要素、回路またはモジュールを介した間接的な結合を含み、ここで間接的結合については、介入する構成要素、要素、回路またはモジュールは、信号の情報を修正しないが、その電流レベル、電圧レベル、および/または電力レベルを調整することができる。同様に当業者であれば認識するように、推論上の結合(すなわち、推論によって1つの要素が別の要素に結合されている場合)は、「結合された(coupled)」と同様に2つの要素間での直接的および間接的結合を含む。
「モジュール」なる用語が図面の描写内で使用されるように、モジュールは、出力信号を生成するための入力信号の処理などの1つ以上の機能を行なうハードウェア、ソフトウェアおよび/またはファームウェア内で実装される機能的ブロックを含む。本明細書中で使用されるように、モジュールは、それ自体モジュールであるサブモジュールを格納し得る。
図中の流れ図およびブロック図は、さまざまな実施形態に係るシステム、方法およびコンピュータプログラムプロダクトの考えられる実装のアーキテクチャ、機能性およびオペレーションを例示する。この点において、流れ図またはブロック図内の各ブロックは、規定の論理機能を実施するための1つ以上の実行可能な命令を含むモジュール、セグメントまたはコード部分を表わし得る。いくつかの代替的実装において、ブロック内で指摘された機能が、図中に記された順序から逸脱して発生し得るというということにも留意すべきである。例えば、連続して示された2つのブロックを、実際には、実質的に同時に実行してもよく、あるいは、時には関与する機能性に応じてブロックを逆の順序で実行してもよい。
上述のシステム、構成要素および/またはプロセスは、ハードウェアの形またはハードウェアとソフトウェアの組合せの形で実現でき、1つの処理システム内で集中的に、または異なる要素が複数の相互接続された処理システムを横断して広がっている分散型として、実現可能である。本明細書中に記載されている方法を実施するために適応されたあらゆる種類の処理システムまたは別の装置が適している。ハードウェアとソフトウェアの典型的な組合せは、ロードされ実行された場合に処理システムを制御してそれが本明細書中に記載の方法を実施するようにするコンピュータ使用可能なプログラムコードを伴う処理システムであり得る。
さらに、本明細書中に記載の配置は、コンピュータ可読プログラムコードが上に具体化、例えば記憶される1つ以上のコンピュータ可読媒体の形で具体化されたコンピュータプログラムプロダクトの形を取ることができる。1つ以上のコンピュータ可読媒体の任意の組合せを利用することができる。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であってよい。
本明細書中で使用される「a」および「an」なる用語は、1つまたは2つ以上として定義される。本明細書中で使用される「複数(plurality)」なる用語は、2つまたは3つ以上として定義される。本明細書中で使用される「別の(another)」なる用語は、少なくとも第2のもの以上として定義される。本明細書で使用される「including(〜を含む、含めた)」および/または「having(〜を有する)」なる用語は、「comprising(〜を含む)」(すなわちオープンランゲージ)として定義される。本明細書中で使用されている「…および…のうちの少なくとも1つ(at least one of…and…)」なる語句は、付随する列挙する項目のうちの1つ以上の考えられるいずれかのおよび全ての組合せを意味し、包含する。一例として、「A、BおよびCのうちの少なくとも1つ」なる語句は、Aのみ、Bのみ、Cのみ、またはその任意の組合せ(例えばAB、AC、BCまたはABC)を含む。
本明細書中の態様は、その精神または不可欠の属性から逸脱することなく、他の形態で具体化することができる。したがって、その範囲を標示するものとしては以上の明細書ではなくむしろ以下のクレームの参照が指示されるべきである。

Claims (20)

  1. 複数車両環境用の自律的車両目標に関連する一組の自律的車両状態セットの各状態の進行のために:
    前記複数車両環境の別の車両の車両状態を判別して、前記別の車両の判別された車両状態を生成するステップであって、前記別の車両が前記自律的車両目標に影響を及ぼすように動作している、ステップと、
    前記判別された車両状態に基づいて前記自律的車両状態セットのうちの現在の自律的車両状態に対する適応ポリシーを形成するステップと、
    前記適応ポリシーから、前記自律的車両状態セットのうちの後続する自律的車両状態まで進行するための自律的車両アクションを生成するステップと、
    前記自律的車両状態セットのうちの前記後続する自律的車両状態までの進行をもたらすための自律的車両アクションを伝送するステップと、を含む方法。
  2. 前記自律的車両目標は、
    合流車線から前記別の車両を含んでいる交通の流れへと合流することと、
    現在の交通車線から前記別の車両を含む隣接する交通車線へと合流することと、
    出口車線から前記別の車両を含む側道車線へと合流することと、のうちの少なくとも1つを含む、請求項1に記載の方法。
  3. 前記別の車両の前記ポリシーを判別する前記ステップが、前記別の車両の動作に関係するセンサ入力データと、無線通信を介して前記別の車両から受信したデータと、を含む、請求項1に記載の方法。
  4. 前記適応ポリシーを形成する前記ステップが、車両ポリシーの少なくとも1つのパラメータを最適化して前記適応ポリシーを形成するように、および、前記適応ポリシーに基づいて前記自律的車両アクションの報酬予測を生成するように、動作可能な受動的アクタークリティックモジュールによるものである、請求項1に記載の方法。
  5. 前記アクタークリティックモジュールが、
    車両アクションおよび受動的動的データに応答して報酬パラメータに関係する前記アクターモジュールのためのフィードバックデータを生成するように動作可能であるクリティックモジュールであって、前記フィードバックデータを介してさらに、前記アクターモジュールのポリシーパラメータを修正して前記適応ポリシーを形成するために動作するクリティックモジュールと、
    前記受動的動的データおよび車両制御動的データから生成された前記適応ポリシーに基づいて、前記自律的車両アクションの予測を生成するために動作可能であるアクターモジュールと、を更に含んでいる、請求項4に記載の方法。
  6. 前記フィードバックデータが時間的な変位誤差データを含む、請求項5に記載の方法。
  7. 前記別の車両の前記車両状態が、前記自律的車両状態セットのうちの前記現在の自律的車両状態と同期していない、請求項1に記載の方法。
  8. 車両環境について自律的車両目標を選択するステップと、
    前記自律的車両目標に関連する自律的車両状態セットを識別するステップと、
    前記車両環境の別の車両が前記自律的車両目標に影響を及ぼすか否かを決定するステップと、
    前記車両環境の前記別の車両が前記自律的車両目標に影響を及ぼす場合には、前記自律的車両状態セットの各状態進行について、
    前記別の車両の車両状態を判別して、判別された車両状態を生成するステップと、
    前記別の車両の前記判別された車両状態との関係における前記自律的車両状態セットのうちの現在の自律的車両状態に対する適応ポリシーを形成するステップと、
    前記自律的車両目標の前記自律的車両状態セットのうちの後続する自律的車両状態まで進行するために前記適応ポリシーに基づいて自律的車両アクションを形成するステップと、
    前記自律的車両状態セットのうちの前記後続する自律的車両状態までの進行をもたらすために前記自律的車両アクションを伝送するステップと、を含む方法。
  9. 前記自律的車両目標は、
    合流車線から前記別の車両を含む交通の流れへと合流することと、
    現在の交通車線から前記別の車両を含む隣接する交通車線へと合流することと、
    出口車線から前記別の車両を含む側道車線へと合流することと、のうちの少なくとも1つを含む、請求項8に記載の方法。
  10. 前記別の車両の前記ポリシーを判別する前記ステップが、前記別の車両の動作に関係するセンサ入力データと、無線通信を介して前記別の車両から受信したデータと、を含む、請求項8に記載の方法。
  11. 前記適応ポリシーを形成する前記ステップが、車両ポリシーを最適化して前記適応ポリシーを形成するように、且つ、前記適応ポリシーに基づいて前記自律的車両アクションの予測を生成するように、動作可能な受動的アクタークリティックモジュールによるものである、請求項8に記載の方法。
  12. 前記アクタークリティックモジュールが、
    自律的車両アクションに応答して報酬パラメータに関係する前記アクターモジュールのためのフィードバックデータを生成するように動作可能であるクリティックモジュールであって、前記フィードバックデータを介してさらに、前記アクターモジュールのポリシーパラメータを修正して前記適応ポリシーを形成するために動作するクリティックモジュールと、
    前記適応ポリシーに基づいて、前記自律的車両アクションの前記予測を生成するために動作可能であるアクターモジュールと、を更に含んでいる、請求項11に記載の方法。
  13. 前記フィードバックデータが時間的な変位誤差データを含む、請求項12に記載の方法。
  14. 前記別の車両の前記車両状態が、前記自律的車両状態セットのうちの前記現在の自律的車両状態と同期していない、請求項8に記載の方法。
  15. 複数車両環境における自律的車両の動作のための車両制御ユニットであって、
    車両ネットワークとの通信に供用するための無線通信インタフェースと、
    前記無線通信インタフェースおよび複数の車両センサ装置に対し通信可能な形で結合されたプロセッサと、
    前記プロセッサに対して通信可能な形で結合されたメモリであって、自律的車両目標のための自律的車両状態セットの各々の状態進行について、
    複数車両検出モジュールであって、前記プロセッサによって実行された場合に、前記プロセッサに、前記複数の車両センサ装置の第1の部分に基づいて前記複数車両環境の別の車両の車両状態を判別して、前記別の車両の判別された車両状態を生成させる命令を含み、ここで前記別の車両が前記自律的車両目標に影響を及ぼすように動作する、複数車両検出モジュールと、
    強化学習モジュールであって、前記プロセッサによって実行された場合に、前記プロセッサに、
    前記複数の車両センサ装置の第2の部分に関連する前記複数車両環境に関係する前記自律的車両の動作についての受動的動的データを検索させ、
    前記判別された車両状態および前記受動的動的データに基づいて、前記自律的車両目標に関連する複数の自律的車両状態のうちの現在の自律的車両状態に対する適応ポリシーを形成させ、
    前記自律的車両状態セットのうちの後続する自律的車両状態まで進行するために適応ポリシーから自律的車両アクション指令を形成させ、
    前記自律的車両状態のうちの前記後続する自律的車両状態までの進行をもたらすために前記自律的車両アクション指令を伝送させる、命令を含む強化学習モジュールと、
    を記憶するメモリと、
    を含む車両制御ユニット。
  16. 前記自律的車両目標は、
    合流車線から前記別の車両を含む交通の流れへと合流することと、
    現在の交通車線から前記別の車両を含む隣接する交通車線へと合流することと、
    出口車線から前記別の車両を含む側道車線へと合流することと、
    のうちの少なくとも1つを含む、請求項15に記載の車両制御ユニット。
  17. 前記別の車両の前記判別された車両状態が、前記別の車両の前記動作に関係する前記複数の車両センサ装置の少なくとも一部分のセンサデータと、無線インタフェースを介して前記別の車両から受信したデータと、のうちの少なくとも1つに基づいている、請求項15に記載の車両制御ユニット。
  18. 前記強化学習モジュールが、
    前記プロセッサにより実行されたときに、車両ポリシーを最適化して前記適応ポリシーを形成することによって、および、前記適応ポリシーに基づいて前記自律的車両アクションについての予測を生成することによって、前記プロセッサに前記適応ポリシーを形成させる命令を含む、受動的アクタークリティックモジュールを更に含む、請求項15に記載の車両制御ユニット。
  19. 前記アクタークリティックモジュールが、
    前記プロセッサにより実行されたとき、このプロセッサに、車両アクションに応答して報酬パラメータに関係する前記アクターモジュールのためのフィードバックデータを生成させる命令を含むクリティックモジュールであって、前記フィードバックデータを介してさらに、前記アクターモジュールのポリシーパラメータを修正して前記適応ポリシーを形成するために動作するクリティックモジュールと、
    前記プロセッサにより実行されたとき、このプロセッサに前記適応ポリシーに基づいて、前記自律的車両アクションの前記予測を生成させる命令を含むアクターモジュールと、
    を更に含んでいる、請求項18に記載の車両制御ユニット。
  20. 前記フィードバックデータが時間的な変位誤差データを含む、請求項19に記載の車両制御ユニット。
JP2018112638A 2017-06-21 2018-06-13 複数車両環境における自律的車両目標のための自律的動作 Pending JP2019034714A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/629,004 US10296004B2 (en) 2017-06-21 2017-06-21 Autonomous operation for an autonomous vehicle objective in a multi-vehicle environment
US15/629,004 2017-06-21

Publications (2)

Publication Number Publication Date
JP2019034714A true JP2019034714A (ja) 2019-03-07
JP2019034714A5 JP2019034714A5 (ja) 2019-10-31

Family

ID=64693189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018112638A Pending JP2019034714A (ja) 2017-06-21 2018-06-13 複数車両環境における自律的車両目標のための自律的動作

Country Status (2)

Country Link
US (1) US10296004B2 (ja)
JP (1) JP2019034714A (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112019016268B1 (pt) 2017-02-10 2023-11-14 Nissan North America, Inc. Método para uso no atravessamento de uma rede de transporte de veículo e veículo autônomo
MX2019009395A (es) 2017-02-10 2019-12-05 Nissan North America Inc Monitoreo del bloqueo de la administracion operacional de vehiculos autonomos.
JP6856575B2 (ja) * 2017-05-12 2021-04-07 トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド 能動的探索なしの強化学習に基づく制御ポリシー学習及び車両制御方法
US10571916B2 (en) * 2017-07-14 2020-02-25 Uatc, Llc Control method for autonomous vehicles
US11702070B2 (en) 2017-10-31 2023-07-18 Nissan North America, Inc. Autonomous vehicle operation with explicit occlusion reasoning
WO2019088989A1 (en) 2017-10-31 2019-05-09 Nissan North America, Inc. Reinforcement and model learning for vehicle operation
BR112020010209B1 (pt) * 2017-11-30 2023-12-05 Nissan North America, Inc. Métodos para uso na travessia de uma rede de transporte de veículos e veículo autônomo
US10293819B1 (en) * 2017-12-19 2019-05-21 Trw Automotive U.S. Llc Autonomous roadway merge assist system
US11874120B2 (en) 2017-12-22 2024-01-16 Nissan North America, Inc. Shared autonomous vehicle operational management
US11328210B2 (en) 2017-12-29 2022-05-10 Micron Technology, Inc. Self-learning in distributed architecture for enhancing artificial neural network
JP6963158B2 (ja) 2018-02-26 2021-11-05 ニッサン ノース アメリカ,インク 集中型共有自律走行車動作管理
US10522038B2 (en) * 2018-04-19 2019-12-31 Micron Technology, Inc. Systems and methods for automatically warning nearby vehicles of potential hazards
US10698753B2 (en) * 2018-04-20 2020-06-30 Ratheon Company Mitigating device vulnerabilities in software
US11429725B1 (en) * 2018-04-26 2022-08-30 Citicorp Credit Services, Inc. (Usa) Automated security risk assessment systems and methods
US11120688B2 (en) 2018-06-29 2021-09-14 Nissan North America, Inc. Orientation-adjust actions for autonomous vehicle operational management
US11373466B2 (en) 2019-01-31 2022-06-28 Micron Technology, Inc. Data recorders of autonomous vehicles
US11410475B2 (en) 2019-01-31 2022-08-09 Micron Technology, Inc. Autonomous vehicle data recorders
US11755884B2 (en) 2019-08-20 2023-09-12 Micron Technology, Inc. Distributed machine learning with privacy protection
US11392796B2 (en) 2019-08-20 2022-07-19 Micron Technology, Inc. Feature dictionary for bandwidth enhancement
US11636334B2 (en) 2019-08-20 2023-04-25 Micron Technology, Inc. Machine learning with feature obfuscation
CN114207539B (zh) * 2019-09-03 2024-11-26 华为技术有限公司 多智能体系统中的大规模策略评估
US11899454B2 (en) 2019-11-26 2024-02-13 Nissan North America, Inc. Objective-based reasoning in autonomous vehicle decision-making
US11635758B2 (en) 2019-11-26 2023-04-25 Nissan North America, Inc. Risk aware executor with action set recommendations
DE102019219021A1 (de) * 2019-12-06 2021-06-10 Robert Bosch Gmbh Verfahren und Vorrichtung zum Austauschen von Manöverinformationen zwischen Fahrzeugen
US11613269B2 (en) 2019-12-23 2023-03-28 Nissan North America, Inc. Learning safety and human-centered constraints in autonomous vehicles
JP7357537B2 (ja) * 2019-12-24 2023-10-06 本田技研工業株式会社 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム
US11300957B2 (en) 2019-12-26 2022-04-12 Nissan North America, Inc. Multiple objective explanation and control interface design
US11714971B2 (en) 2020-01-31 2023-08-01 Nissan North America, Inc. Explainability of autonomous vehicle decision making
US11577746B2 (en) 2020-01-31 2023-02-14 Nissan North America, Inc. Explainability of autonomous vehicle decision making
US11782438B2 (en) 2020-03-17 2023-10-10 Nissan North America, Inc. Apparatus and method for post-processing a decision-making model of an autonomous vehicle using multivariate data
US11080602B1 (en) 2020-06-27 2021-08-03 Sas Institute Inc. Universal attention-based reinforcement learning model for control systems
CN114527737B (zh) * 2020-11-06 2024-08-02 陕西世纪华耀科技有限公司 用于自动驾驶的速度规划方法、装置、设备、介质和车辆
US12384410B2 (en) 2021-03-05 2025-08-12 The Research Foundation For The State University Of New York Task-motion planning for safe and efficient urban driving
US11921506B2 (en) * 2021-05-28 2024-03-05 Nissan North America, Inc. Belief state determination for real-time decision-making
US20230063368A1 (en) * 2021-08-27 2023-03-02 Motional Ad Llc Selecting minimal risk maneuvers

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106828495A (zh) * 2017-02-16 2017-06-13 奇瑞汽车股份有限公司 一种控制车辆行驶的方法及装置
WO2018132607A2 (en) * 2017-01-12 2018-07-19 Mobileye Vision Technologies Ltd. Navigation based on vehicle activity

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5228366B2 (ja) 2007-04-25 2013-07-03 株式会社デンソー 走行情報収集システムおよび走行情報の学習方法
US8942913B2 (en) * 2011-09-20 2015-01-27 Infosys Limited System and method for on-road traffic density analytics using video stream mining and statistical techniques
US9511767B1 (en) * 2015-07-01 2016-12-06 Toyota Motor Engineering & Manufacturing North America, Inc. Autonomous vehicle action planning using behavior prediction
US10397019B2 (en) * 2015-11-16 2019-08-27 Polysync Technologies, Inc. Autonomous vehicle platform and safety architecture
US9947145B2 (en) * 2016-06-01 2018-04-17 Baidu Usa Llc System and method for providing inter-vehicle communications amongst autonomous vehicles
US10065654B2 (en) * 2016-07-08 2018-09-04 Toyota Motor Engineering & Manufacturing North America, Inc. Online learning and vehicle control method based on reinforcement learning without active exploration

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018132607A2 (en) * 2017-01-12 2018-07-19 Mobileye Vision Technologies Ltd. Navigation based on vehicle activity
CN106828495A (zh) * 2017-02-16 2017-06-13 奇瑞汽车股份有限公司 一种控制车辆行驶的方法及装置

Also Published As

Publication number Publication date
US20180373245A1 (en) 2018-12-27
US10296004B2 (en) 2019-05-21

Similar Documents

Publication Publication Date Title
JP2019034714A (ja) 複数車両環境における自律的車両目標のための自律的動作
JP6875330B2 (ja) ビークルの自律動作能力の構成
US10053091B2 (en) Spring system-based change lane approach for autonomous vehicles
US10629080B2 (en) Autonomous vehicles featuring vehicle intention system
US10824153B2 (en) Cost design for path selection in autonomous driving technology
US10268200B2 (en) Method and system to predict one or more trajectories of a vehicle based on context surrounding the vehicle
US10459441B2 (en) Method and system for operating autonomous driving vehicles based on motion plans
EP3347785B1 (en) Method to dynamically adjusting steering rates of autonomous vehicles
US10019008B2 (en) Sideslip compensated control method for autonomous vehicles
EP3345086B1 (en) A physical model and machine learning combined method to simulate autonomous vehicle movement
US11199846B2 (en) Learning-based dynamic modeling methods for autonomous driving vehicles
US10507813B2 (en) Method and system for automated vehicle emergency light control of an autonomous driving vehicle
EP3342670B1 (en) Method to dynamically adjusting speed control rates of autonomous vehicles
US10272778B2 (en) Method and system for determining unit gain of speed control for autonomous driving vehicles
WO2019169604A1 (en) Simulation-based method to evaluate perception requirement for autonomous driving vehicles
US11210937B2 (en) Method for un-signalized intersection traffic flow management
EP3327530A1 (en) Method for determining command delays of autonomous vehicles
CN113228040A (zh) 多级对象行进方向估计
WO2020132339A2 (en) Routing autonomous vehicles using temporal data
US20230082365A1 (en) Generating simulated agent trajectories using parallel beam search
US12222726B2 (en) Platform for path planning system development for automated driving system
JP2023502598A (ja) 統計モデルを用いる衝突モニタリング
US12164399B2 (en) GPU stress test with dynamic loads
US11233717B2 (en) System and method for collaborative centralized latency characterization
Yang et al. Real-Time Collision Detection Algorithm with Redundancy Based on Intention and Trajectory Prediction

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190919

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190919

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190919

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20191016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210608