[go: up one dir, main page]

JP2018165693A - 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム - Google Patents

運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム Download PDF

Info

Publication number
JP2018165693A
JP2018165693A JP2017063659A JP2017063659A JP2018165693A JP 2018165693 A JP2018165693 A JP 2018165693A JP 2017063659 A JP2017063659 A JP 2017063659A JP 2017063659 A JP2017063659 A JP 2017063659A JP 2018165693 A JP2018165693 A JP 2018165693A
Authority
JP
Japan
Prior art keywords
driving
presentation information
operation signal
unit
actions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017063659A
Other languages
English (en)
Inventor
江村 恒一
Koichi Emura
恒一 江村
本村 秀人
Hideto Motomura
秀人 本村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2017063659A priority Critical patent/JP2018165693A/ja
Publication of JP2018165693A publication Critical patent/JP2018165693A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】乗員の意図を反映するような運転行動を導出する技術を提供する。【解決手段】生成部90は、複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する。また、生成部90は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成する。操作信号入力部には、第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号、あるいは第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力される。学習部74は、第1操作信号において示された1つの運転行動に正の重み付けを実行する。また、学習部74は、第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、他の運転行動に負の重み付けを実行する。【選択図】図3

Description

本発明は、車両、車両に設けられる運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、プログラム、提示システムに関する。
自動運転車両は、車両の周囲の状況を検知し、従来乗員が意図し実行していた運転行動を自動的に実行することによって走行する。このような自動運転車両には、乗員が意図する運転行動と、自動運転車両の運転行動とが乖離しないように、乗員が運転行動を変更するための運転支援装置が搭載される。運転支援装置は、実行可能な運転行動を提示し、乗員に運転行動を選択させる(例えば、特許文献1参照)。
国際公開第16/170763号
提示した運転行動の中に乗員が希望する運転行動が含まれない場合、乗員は、希望する運転行動を選択できない。そのため、乗員の意図を反映するような運転行動を提示することが望まれる。
本発明はこうした状況に鑑みなされたものであり、その目的は、乗員の意図を反映するような運転行動を導出する技術を提供することにある。
上記課題を解決するために、本発明のある態様の運転支援装置は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。
本発明の別の態様は、自動運転制御装置である。この装置は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部と、1つの運転行動をもとに、車両の自動運転を制御する自動運転制御部とを備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。
本発明のさらに別の態様は、車両である。この車両は、運転支援装置を備える車両であって、運転支援装置は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。
本発明のさらに別の態様は、運転支援方法である。この方法は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、生成した第1提示情報を報知装置に出力するステップと、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、生成した第2提示情報を報知装置に出力するステップと、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、を備える。
本発明のさらに別の態様は、提示システムである。この提示システムは、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を出力する提示情報出力部とを備える運転支援装置と、運転支援装置から出力された提示情報を報知する報知装置とを備える。運転支援装置は、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。
なお、以上の構成要素の任意の組合せ、構成要素の一部、例えば学習部、を通信網を介したコンピュータで逐次あるいは一日など所定時間分をまとめて処理する構成、本発明の表現を装置、システム、方法、プログラム、プログラムを記録した記録媒体、本装置を搭載した車両などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、乗員の意図を反映するような運転行動を導出できる。
実施の形態1乃至3に係る車両の構成を示す図である。 実施の形態1乃至3に係る車両の室内を模式的に示す図である。 実施の形態1乃至3に係る制御部の構成を示す図である。 実施の形態1乃至3に係るヒストグラム生成部において生成されるヒストグラムを示す図である。 図5(a)乃至(c)は、図3の表示制御部の処理概要を示す図である。 実施の形態1に係る制御部による処理手順を示すフローチャートである。 図7(a)乃至(e)は、実施の形態2に係る表示制御部の処理概要を示す図である。 実施の形態2に係る制御部による生成手順を示すフローチャートである。 実施の形態3に係る制御部による生成手順を示すフローチャートである。
(実施の形態1)
本発明を具体的に説明する前に、概要を述べる。本実施の形態は、自動車の自動運転に関する。特に、本実施の形態は、車両の運転行動に関する情報を車両の乗員(例えば運転者)との間でやり取りするためのHMI(Human Machine Interface)を制御する装置(以下「運転支援装置」とも呼ぶ。)に関する。本実施の形態における各種の用語は次のように定義される。「運転行動」は、車両の走行中または停止時の操舵や制動などの作動状態、もしくは自動運転制御に係る制御内容を含んでおり、例えば、定速走行、加速、減速、一時停止、停止、車線変更、進路変更、右左折、駐車などである。また、運転行動は、巡航(車線維持で車速維持)、車線維持、先行車追従、追従時のストップアンドゴー、追越、合流車両への対応、高速道への進入と退出を含めた乗換(インターチェンジ)、合流、工事ゾーンへの対応、緊急車両への対応、割込み車両への対応、右左折専用レーンへの対応、歩行者・自転車とのインタラクション、車両以外の障害物回避、標識への対応、右左折・Uターン制約への対応、車線制約への対応、一方通行への対応、交通標識への対応、交差点・ラウンドアバウトへの対応などであってもよい。
「運転行動推定エンジン」として、DL(Deep Learning:深層学習)、ML(Machine Learning:機械学習)、フィルタ等のいずれか、あるいはそれらの組合せが使用される。Deep Learningは、例えば、CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)、RNN(Recurrent Neural Network:リカレント・ニューラル・ネットワーク)である。また、Machine Learningは、例えば、SVM(Support Vector Machine)である。さらに、フィルタは、例えば、協調フィルタリングである。
「運転行動モデル」は、運転行動推定エンジンに応じて一意に定められる。DLの場合の運転行動モデルは学習されたニューラルネットワーク(Neural Network)であり、SVMの場合の運転行動モデルは学習された予測モデルであり、協調フィルタリングの場合の運転行動モデルは走行環境データと運転行動データとを紐付けたデータである。ルールの場合の運転行動モデルは入力と出力とを紐付けたデータである。
このような定義のもと、運転支援装置は、機械学習等により生成した運転行動モデルを用いて複数の運転行動を推定する。さらに、運転支援装置は、信頼度が最も高い運転行動を選択して、選択した運転行動に応じた自動運転を実行させる。信頼度とは、推定された運転行動の確からしさを示しており、DLの場合に推定結果の累積値に相当し、SVMの場合に信頼値(confidence value)に相当し、協調フィルタリングの場合に相関度に相当する。ルールの場合にルールの信頼度に相当する。そのため、信頼度が最も高い運転行動は、安全性の高い運転行動である。しかしながら、当該運転行動が、乗員の意図を反映した運転行動でない場合があり、乗員の意図を反映するような運転行動を導出することが望まれる。
そのため、本実施の形態では、選択された運転行動をもとに強化学習を実行することによって、運転行動モデルを更新する。その際、強化学習における報酬として、運転支援装置によって運転行動が選択された場合に対する報酬よりも、乗員によって運転行動が選択された場合に対する報酬を大きくする。その結果、乗員によって選択された運転行動の信頼度が以後高くなりやすくなり、乗員の意図が反映されやすくなる。以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、以下に説明する各実施の形態は一例であり、本発明はこれらの実施の形態により限定されるものではない。
図1は、実施の形態1に係る車両100の構成を示し、特に自動運転車両に関する構成を示す。車両100は、自動運転モードで走行可能であり、報知装置2、入力装置4、無線装置8、運転操作部10、検出部20、自動運転制御装置30、運転支援装置40を含む。図1に示す各装置の間は、専用線あるいはCAN(Controller Area Network)等の有線通信で接続されてもよい。また、USB(Universal Serial Bus)、Ethernet(登録商標)、Wi−Fi(登録商標)、Bluetooth(登録商標)等の有線通信または無線通信で接続されてもよい。
報知装置2は、車両100の走行に関する情報を乗員に報知する。報知装置2は、例えば、車内に設置されているカーナビゲーションシステム、ヘッドアップディスプレイ、センタディスプレイである。報知装置2は、ステアリングホイール、ピラー、ダッシュボード、メータパネル周りなどに設置されているLED(Light Emitting Diode)などの発光体などのような情報を表示する表示部でもよい。また、報知装置2は、情報を音声に変換して乗員に報知するスピーカであってもよいし、あるいは、乗員が感知できる位置(例えば、乗員の座席、ステアリングホイールなど)に設けられる振動体であってもよい。さらに、報知装置2は、これらの組合せであってもよい。
入力装置4は、乗員による操作入力を受けつけるユーザインタフェース装置である。例えば入力装置4は、タッチパネル、レバー、ボタン、スイッチ、ジョイスティックやボリューム等のコントローラ、非接触でジェスチャーを認識するカメラ等のセンサ、音声を認識するマイク等のセンサや、それらの組合せであり、乗員が入力した自車の自動運転に関する情報を受けつける。また、自動運転と手動運転を切りかえるための操作信号を受けつけてもよい。入力装置4は、受けつけた情報を操作信号として運転支援装置40に出力する。
図2は、車両100の室内を模式的に示す。報知装置2は、ヘッドアップディスプレイ(HUD、Head−Up Display)2aであってもよく、センタディスプレイ2bであってもよい。入力装置4は、ステアリング11に設けられた第1操作部4aであってもよく、運転席と助手席との間に設けられた第2操作部4bであってもよく、ジェスチャーを認識するカメラ等のセンサである第3操作部4cであってもよい。なお、報知装置2と入力装置4は一体化されてもよく、例えばタッチパネルディスプレイとして実装されてもよい。車両100には、自動運転に関する情報を音声にて乗員へ提示するスピーカ6がさらに設けられてもよい。この場合、運転支援装置40は、自動運転に関する情報を示す画像を報知装置2に表示させ、それとともに、またはそれに代えて、自動運転に関する情報を示す音声をスピーカ6から出力させてもよい。図1に戻る。
無線装置8は、携帯電話通信システム、WMAN(Wireless Metropolitan Area Network)等に対応しており、無線通信を実行する。具体的に説明すると、無線装置8は、ネットワーク302を介してサーバ300と通信する。サーバ300は車両100外部の装置であり、運転行動学習部310を含む。運転行動学習部310については後述する。なお、サーバ300と運転支援装置40は、運転支援システム500に含められる。
運転操作部10は、ステアリング11、ブレーキペダル12、アクセルペダル13、ウィンカスイッチ14を備える。ステアリング11、ブレーキペダル12、アクセルペダル13、ウィンカスイッチ14は、ステアリングECU、ブレーキECU、エンジンECUとモータECUおよびウィンカコントローラにより電子制御が可能である。自動運転モードにおいて、ステアリングECU、ブレーキECU、エンジンECU、モータECUは、自動運転制御装置30から供給される制御信号に応じて、アクチュエータを駆動する。またウィンカコントローラは、自動運転制御装置30から供給される制御信号に応じてウィンカランプを点灯あるいは消灯する。
検出部20は、車両100の周囲状況および走行状態を検出する。検出部20は、例えば、車両100の速度、車両100に対する先行車両の相対速度、車両100と先行車両との距離、車両100に対する側方車線の車両の相対速度、車両100と側方車線の車両との距離、車両100の位置情報を検出する。検出部20は、検出した各種情報(以下、「検出情報」という)を自動運転制御装置30に出力する。また、検出部20は、自動運転制御装置30を介して運転支援装置40に検出情報を出力してもよいし、運転支援装置40に直接出力してもよい。検出部20は、位置情報取得部21、センサ22、速度情報取得部23、地図情報取得部24を含む。
位置情報取得部21は、GNSS(Global Navigation Satellite System(s))受信機から車両100の現在位置を取得する。センサ22は、車外の状況および車両100の状態を検出するための各種センサの総称である。車外の状況を検出するためのセンサとして例えばカメラ、ミリ波レーダ、LIDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)、ソナー、気温センサ、気圧センサ、湿度センサ、照度センサ等が搭載される。車外の状況は、車線情報を含む自車の走行する道路状況、天候を含む環境、自車周辺状況、近傍位置にある他車両(隣接車線を走行する他車両等)を含む。なお、センサ22が検出できる車外の情報であれば何でもよい。また車両100の状態を検出するためのセンサ22として例えば、加速度センサ、ジャイロセンサ、地磁気センサ、傾斜センサ等が搭載される。
速度情報取得部23は、車速センサから車両100の現在速度を取得する。地図情報取得部24は、地図データベースから車両100の現在位置周辺の地図情報を取得する。地図データベースは、車両100内の記録媒体に記録されていてもよいし、使用時にネットワークを介して地図サーバからダウンロードしてもよい。なお、地図情報には、道路、交差点に関する情報が含まれている。
自動運転制御装置30は、自動運転制御機能を実装した自動運転コントローラであり、自動運転における車両100の行動を決定する。自動運転制御装置30は、制御部31、記憶部32、I/O(Input/Output、入出力)部33を備える。制御部31の構成はハードウェア資源とソフトウェア資源の協働、またはハードウェア資源のみにより実現できる。ハードウェア資源としてプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、その他のLSIを利用でき、ソフトウェア資源としてオペレーティングシステム、アプリケーション、ファームウェア等のプログラムを利用できる。記憶部32は、フラッシュメモリ等の不揮発性記録媒体を備える。I/O部33は、各種の通信フォーマットに応じた通信制御を実行する。例えば、I/O部33は、自動運転に関する情報を運転支援装置40に出力するとともに、制御コマンドを運転支援装置40から入力する。また、I/O部33は、検出情報を検出部20から入力する。
制御部31は、運転支援装置40から入力した制御コマンド、検出部20あるいは各種ECUから収集した各種情報を自動運転アルゴリズムに適用して、車両100のアクセルスロットル開度、ステアリング舵角等の自動制御対象を制御するための制御値を算出する。制御部31は算出した制御値を、各制御対象のECUまたはコントローラに伝達する。本実施の形態ではステアリングECU、ブレーキECU、エンジンECU、ウィンカコントローラに伝達する。なお電気自動車あるいはハイブリッドカーの場合、エンジンECUに代えてまたは加えてモータECUに制御値を伝達する。
運転支援装置40は、車両100と乗員との間のインタフェース機能を実行するHMIコントローラであり、制御部41、記憶部42、I/O部43を備える。制御部41は、HMI制御等の各種データ処理を実行する。制御部41は、ハードウェア資源とソフトウェア資源の協働、またはハードウェア資源のみにより実現できる。ハードウェア資源としてプロセッサ、ROM、RAM、その他のLSIを利用でき、ソフトウェア資源としてオペレーティングシステム、アプリケーション、ファームウェア等のプログラムを利用できる。
記憶部42は、制御部41により参照され、または更新されるデータを記憶する記憶領域である。例えばフラッシュメモリ等の不揮発の記録媒体により実現される。I/O部43は、各種の通信フォーマットに応じた各種の通信制御を実行する。I/O部43は、操作信号入力部50、画像・音声出力部51、検出情報入力部52、コマンドIF(Interface、インタフェース)53、通信IF56を備える。
操作信号入力部50は、入力装置4に対してなされた乗員もしくは車外にいるユーザの操作による操作信号を入力装置4から受信し、制御部41へ出力する。画像・音声出力部51は、制御部41が生成した画像データあるいは音声メッセージを報知装置2へ出力して表示させる。検出情報入力部52は、検出部20による検出処理の結果であり、車両100の現在の周囲状況および走行状態を示す検出情報を検出部20から受信し、制御部41へ出力する。
コマンドIF53は、自動運転制御装置30とのインタフェース処理を実行し、行動情報入力部54とコマンド出力部55を含む。行動情報入力部54は、自動運転制御装置30から送信された車両100の自動運転に関する情報を受信し、制御部41へ出力する。コマンド出力部55は、自動運転制御装置30に対して自動運転の態様を指示する制御コマンドを、制御部41から受けつけて自動運転制御装置30へ送信する。
通信IF56は、無線装置8とのインタフェース処理を実行する。通信IF56は、制御部41から出力されたデータを無線装置8へ送信し、無線装置8から車外の装置へ送信させる。また、通信IF56は、無線装置8により転送された、車外の装置からのデータを受信し、制御部41へ出力する。
なお、ここでは、自動運転制御装置30と運転支援装置40は別個の装置として構成される。変形例として、図1の破線で示すように、自動運転制御装置30と運転支援装置40を1つのコントローラに統合してもよい。言い換えれば、1つの自動運転制御装置が、図1の自動運転制御装置30と運転支援装置40の両方の機能を備える構成であってもよい。さらに、報知装置2、運転支援装置40が組み合わされた提示システムとして構成されてもよい。
図3は、制御部41の構成を示す。制御部41は、運転行動推定部70、表示制御部72、学習部74を含む。運転行動推定部70は、運転行動モデル80、推定部82、ヒストグラム生成部84を含み、表示制御部72は、生成部90、処理部92を含み、処理部92は選択部94を含む。
運転行動推定部70は、車両100が実行しうる複数の運転行動の候補のうち、現在の状況において実現可能な運転行動を判定するために、予め学習により構築されたニューラルネットワーク(NN)を使用する。ここで、実現可能な運転行動は複数であってもよく、運転行動を判定することは運転行動を推定することともいえる。
運転行動推定部70での処理には、図1のサーバ300における運転行動学習部310も関連するので、ここでは、運転行動学習部310の処理をまず説明する。運転行動学習部310は、複数の運転者の運転履歴と走行履歴の少なくとも1つをパラメータとしてニューラルネットワークに入力する。また、運転行動学習部310は、ニューラルネットワークからの出力が、入力したパラメータに対応した教師付けデータに一致するように、ニューラルネットワークの重みを最適化する。運転行動学習部310は、このような処理を繰り返し実行することによって、運転行動モデル80を生成する。つまり、運転行動モデル80は、重みが最適化されたニューラルネットワークである。サーバ300は、運転行動学習部310において生成した運転行動モデル80をネットワーク302、無線装置8を介して運転支援装置40に出力する。なお、運転行動学習部310は、新たなパラメータをもとに運転行動モデル80を更新してもよい。その際、更新された運転行動モデル80は、リアルタイムに運転支援装置40へ出力されてもよいし、遅延をもって運転支援装置40へ出力されてもよい。
運転行動学習部310によって生成され、かつ運転行動推定部70に入力された運転行動モデル80は、複数の運転者の運転履歴と走行履歴の少なくとも1つから構築したニューラルネットワークである。また、運転行動モデル80は、複数の運転者の走行履歴と走行履歴から構築したニューラルネットワークを、特定の運転者の走行履歴と走行履歴を用いた転移学習により、構築し直したニューラルネットワークであってもよい。ニューラルネットワークの構築には公知の技術が使用されればよいので、ここでは説明を省略する。なお、図3の運転行動推定部70には1つの運転行動モデル80が含まれているが、運転者、乗員、走行シーン、天候、国ごとに複数の運転行動モデル80が運転行動推定部70に含まれていて、状況を自動的に判定するか、手動で変更することにより切りかえてもよい。
推定部82は、運転行動モデル80を用いて、運転行動を推定する。ここで、運転履歴は、車両100によって過去になされた複数の運転行動のそれぞれに対応した複数の特徴量(以下、「特徴量セット」という)を示す。運転行動に対応した複数の特徴量は、例えば、車両100によって当該運転行動がなされた時点から所定時間前の時点における車両100の走行状態を示す量である。特徴量は、例えば、同乗者数、車両100の速さやその時系列、ハンドルの操舵量やその時系列、ブレーキの度合いやその時系列、アクセルの度合いやその時系列などである。運転履歴は、運転特性モデルといわれてもよい。そのため、特徴量は、例えば、速度に関する特徴量、ステアリングに関する特徴量、操作タイミングに関する特徴量、車外センシングに関する特徴量、または車内センシングに関する特徴量等である。これらの特徴量は、図1の検出部20によって検出されて、I/O部43経由で推定部82に入力される。また、これらの特徴量は、複数の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。さらに、これらの特徴量は、特定の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。
走行履歴は、車両100によって過去になされた複数の運転行動のそれぞれに対応した複数の環境パラメータ(以下、「環境パラメータセット」という)を示す。運転行動に対応した複数の環境パラメータは、例えば、車両100によって当該運転行動がなされた時点から所定時間前の時点やその時点以前の所定範囲の時系列における車両100の環境(周囲の状況)を示すパラメータである。環境パラメータは、例えば、自車両の速度、自車両に対する先行車両の相対速度、先行車をセンサがとらえる大きさ、および先行車両と自車両との車間距離などである。また、これらの環境パラメータは、図1の検出部20によって検出されて、I/O部43経由で推定部82に入力される。また、これらの環境パラメータは、複数の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。さらに、これらの環境パラメータは、特定の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。
推定部82は、運転履歴あるいは走行履歴に含まれる特徴量セットあるいは/および環境パラメータを取得する。推定部82は、運転行動モデル80のニューラルネットワークに特徴量セットあるいは/および環境パラメータを入力し、ニューラルネットワークからの出力を推定結果としてヒストグラム生成部84に出力する。
ヒストグラム生成部84は、推定部82から、複数種類の運転行動と、各運転行動に対応する推定結果とを取得し、その運転行動に対する推定結果の累積値を示すヒストグラムを生成する。そのため、ヒストグラムには、複数種類の運転行動と、各運転行動に対応した累積値とが含まれる。ここで、累積値とは、運転行動に対する推定結果が導出された回数を累積した値である。
図4は、ヒストグラム生成部84において生成されるヒストグラムを示す。ヒストグラムには、一例として5種類の運転行動である運転行動A〜Eが含まれる。また、運転行動A〜Eのそれぞれに対する累積値が含まれる。ここでは、累積値が大きい順に、運転行動C、運転行動E、運転行動B、運転行動D、運転行動Aであるとする。図3に戻る。ヒストグラム生成部84は、生成したヒストグラムを生成部90に出力する。
生成部90は、ヒストグラム生成部84からヒストグラム、つまり複数種類の運転行動と、各運転行動に対応した累積値とを入力する。生成部90は、複数種類の運転行動のそれぞれの累積値が大きい順に所定数の運転行動を選択する。例えば、生成部90は、「5」の運転行動のうちから「3」の運転行動を選択する。なお、選択される運転行動の数は「3」に限定されない。選択された運転行動は、ヒストグラム生成部84からの複数種類の運転行動のうち、一部の運転行動ともいえる。なお、先行車が減速した場合に、加速して車間距離を詰めるといった危険を及ぼす運転行動を除外するなど、交通安全に沿ったルールベースに基づいて推定された安全な運転行動に限ってもよい。生成部90は、選択した運転行動が示された提示情報を生成する。図4の場合、提示情報には、運転行動C、運転行動E、運転行動Bが含まれており、提示情報では、累積値が大きい順にこれらの運転行動が並べられているものとする。生成部90は、生成した提示情報を処理部92に出力する。
処理部92は、生成部90からの提示情報を受けつける。処理部92は、図1の画像・音声出力部51を介して、図2のヘッドアップディスプレイ2aあるいはセンタディスプレイ2bに提示情報を出力する。ヘッドアップディスプレイ2aあるいはセンタディスプレイ2bは、提示情報の画像を表示する。なお、処理部92は、図1の画像・音声出力部51を介して、図2のスピーカ6に提示情報を出力してもよい。その際、スピーカ6は、提示情報の音声メッセージを出力する。
図5(a)−(c)は、表示制御部72の処理概要を示す。図5(a)は、センタディスプレイ2bにおいて表示される提示情報の画像を示す。この提示情報の画像は図4をもとに生成されており、累積値が大きい順番に、運転行動C、運転行動E、運転行動Bが上から下に並んで配置される。また、累積値が大きいほど、文字のサイズが大きくされる。つまり、センタディスプレイ2bに表示される画像では、提示情報において前方に配置された運転行動ほど、画面の上方に配置されるとともに、文字のサイズが大きくされる。これらは、累積値である信頼度が高い運転行動ほど、乗員に選択されやすくするためである。
なお、ヘッドアップディスプレイ2aに提示情報の画像が表示される場合、当該画像は、図5(a)と同様である。図5(b)は、センタディスプレイ2bにおいて表示される提示情報の画像であって、かつ運転行動C、運転行動E、運転行動Bを実際の運転行動に対応付けた場合の提示情報の画像を示す。ここでは、運転行動Cは「直進」に対応し、運転行動Eは「右折」に対応し、運転行動Bは「左側に車線変更」に対応するとする。以下では、説明を明瞭にするために、図5(a)を説明の対象とする。図5(c)の説明は後述し、図3に戻る。
乗員、例えば運転手は、センタディスプレイ2bに表示された提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択する場合、入力装置4に対して選択結果を入力する。例えば、乗員は、第1操作部4aあるいは第2操作部4bを操作して1つの運転行動を選択する。また、センタディスプレイ2bがタッチパネルである場合、乗員は、センタディスプレイ2bに表示された提示情報の画像の中から、1つの運転行動の表示部分をタッチすることによって、1つの運転行動を選択する。さらに、ヘッドアップディスプレイ2aに提示情報の画像が表示されている場合、乗員は、画像の中から、1つの運転行動の表示部分を選択するようなジェスチャーを実行すると、第3操作部4cはジェスチャーに応じた1つの運転行動を選択する。操作信号入力部50には、入力装置4からの操作信号であって、かつ乗員によって選択された1つの運転行動を示す操作信号が入力される。このように操作信号入力部50に操作信号が入力される場合は、「手動選択状態」と呼ばれる。
乗員は、センタディスプレイ2bに表示された提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択しない場合、入力装置4に対して選択結果を入力しない。そのため、操作信号入力部50には、提示行動を出力してから所定期間において、入力装置4からの操作信号が入力されない。操作信号入力部50に操作信号が入力されない場合、処理部92は、選択部94に対して1つの運転行動の選択の実行を指示する。選択部94は、処理部92からの指示を受けつけた場合、提示情報に含まれた複数種類の運転行動のうちの1つの運転行動を選択する。ここでは、例えば、最も累積値の大きい運動行動が選択される。これは、提示情報に配置された複数種類の運転行動のうち、先頭の運転行動が選択されることに相当する。このように操作信号入力部50に操作信号が入力されない場合は、「自動選択状態」と呼ばれる。
処理部92は、自動選択状態の場合、選択した運転行動に対応した制御コマンドをコマンド出力部55経由で自動運転制御装置30に出力する。一方、処理部92は、手動選択状態の場合、操作信号で示された運転行動に対応した制御コマンドをコマンド出力部55経由で自動運転制御装置30に出力する。図1の自動運転制御装置30は、制御コマンドに対応した運転行動をもとに、車両100の自動運転を制御する。
学習部74は、自動選択状態の場合、選択部94において選択した1つの運転行動に正の報酬「α」を付与する。一方、学習部74は、手動選択状態の場合、操作信号において示された1つの運転行動に正の報酬「β」を付与する。ここで、自動選択状態の場合において付与する正の報酬「α」の値よりも、手動選択状態の場合において付与される正の報酬「β」の値を大きくする。例えば、前者が「+0.5」とされ、後者が「+0.7」とされる。学習部74は、1つの運転行動に報酬を付与しながら強化学習を実行することによって運転行動モデル80を更新する。強化学習については公知の技術が使用されればよいので、ここでは説明を省略するが、報酬が反映されるように、運転行動モデル80におけるニューラルネットワークの重みが調節されることに相当する。
ここで、学習部74は、手動選択状態の場合、提示情報に含まれた複数種類の運転行動のうち、操作信号において示された1つの運転行動以外の運転行動、つまり乗員によって選択されなかった運転行動に負の報酬を付与してもよい。その際、提示情報に含まれなかった運転行動に負の報酬が付与されなくてもよく、付与されてもよい。ここで、負の報酬は「−β」と示されるが、他の値であってもよい。学習部74は、負の報酬も付与しながら強化学習を実行する。一方、自動選択状態の場合、学習部74は、選択部94において選択した1つの運転行動以外の運転行動に負の報酬を付与しない。
ここでは、学習部74において付与される報酬について、図5(c)を使用しながらさらに詳細に説明する。ここでは、前提として、図5(a)に示すような提示情報の画像が表示されているとする。図5(c)のパターン「1」は、自動選択状態に相当する。乗員が運転行動を選択しなければ、選択部94は運転行動Cを選択する。その結果、学習部74は、運転行動Cに正の報酬「+α」を付与する。一方、図5(c)のパターン「2」から「4」は、手動選択状態に相当する。パターン「2」において、乗員が運転行動Cを選択した場合、学習部74は、運転行動Cに正の報酬「+β」を付与する。パターン「3」において、乗員が運転行動Eを選択した場合、学習部74は、運転行動Eに正の報酬「+β」を付与し、運転行動Cに負の報酬「−β」を付与する。パターン「4」において、乗員が運転行動Bを選択した場合、学習部74は、運転行動Bに正の報酬「+β」を付与し、運転行動C、Eに負の報酬「−β」を付与する。
以上の構成による運転支援装置40の動作を説明する。図6は、制御部41による処理手順を示すフローチャートである。推定部82は、複数の運転行動を推定する(S10)。生成部90は、累積値が大きい順に所定の運転行動を選択する(S12)。報知装置2は、提示情報を表示する(S14)。操作信号入力部50に操作信号が入力された場合(S16のY)、学習部74は、操作信号に示された運転行動に正の報酬「+β」を付与し(S18)、提示情報中の他の運転行動で操作信号に示された運転行動より累積地が大きい運転行動に負の報酬「−β」を付与する(S20)。操作信号入力部50に操作信号が入力されない場合(S16のN)、選択部94は、累積値が最大の運転行動を選択する(S22)。学習部74は、選択した運転行動に正の報酬「+α」を付与する(S24)。
本実施の形態によれば、操作信号が入力されない場合の報酬の値よりも、操作信号が入力された場合の報酬の値を大きくするので、乗員が積極的に選択したときの運転行動の信頼性を高くできる。また、乗員が積極的に選択したときの運転行動の信頼性が高くなるので、乗員の意図を反映するような運転行動を導出できる。また、乗員に選択された運転行動以外の運転行動に負の報酬を付与するので、乗員が選択しなかった運転行動の信頼度を低くできる。また、乗員に選択された1つの運転行動より信頼度が高いとシステムが推定していた運転行動に負の報酬を付与するので、システムが信頼度が高いと推定したが乗員が選択した運転行動の信頼性と、乗員が選択しなかった運転行動の信頼性との差を大きくできる。また、乗員が選択した運転行動の信頼性と、システムが信頼度が高いと推定したが乗員が選択しなかった運転行動の信頼性との差が大きくなるので、乗員の意志をさらに反映できる。
また、提示情報に含まれた一部の運転行動のうち、選択されなかった運転行動に負の報酬を付与するので、提示情報に含まれなかった運転行動に報酬を付与しなくできる。また、提示情報に含まれなかった運転行動に報酬が付与されないので、乗員の意図と関係なく信頼性が変化することを抑制できる。また、操作信号が入力されない場合の正の報酬の値よりも、操作信号入力された場合の正の報酬の値を大きくするので、乗員の意図を反映するような運転行動を実行できる。
(実施の形態2)
次に、実施の形態2を説明する。実施の形態2は、実施の形態1と同様に、提示情報の画像を表示するとともに、選択された運転行動に報酬を与えながら強化学習を実行する運転支援装置に関する。実施の形態1においては、自動選択状態であるか、手動選択状態であるかに応じて報酬の値を変えて、強化学習が実行される。一方、実施の形態2は、手動運転状態である場合を説明の対象とする。前述のごとく、提示情報には、推定された複数種類の運転行動のうち、所定数の運転行動が含まれる。乗員は、提示情報に含まれた運転行動を選択可能であるが、提示情報に含まれていない運転行動を選択できない。このような運転行動の信頼度は向上しないので、当該運転行動は推定されにくくなる。つまり、乗員は、そのような運転行動を意図的に除外していなくても除外されてしまうので、乗員の意図が反映されない。実施の形態2は、乗員の意図を反映させやすくなる提示情報の生成について説明する。実施の形態2に係る車両100は図1、図2と同様のタイプであり、実施の形態2に係る制御部41は図3と同様のタイプである。
図3の運転行動推定部70は、実施の形態1と同様に、複数種類の運転行動と、各運転行動に対応した累積値とが含まれたヒストグラムを出力する。生成部90は、ヒストグラムに含まれた複数種類の運転行動のそれぞれの累積値が大きい順に所定数の運転行動を選択する。生成部90は、選択した運転行動が示された提示情報を生成する。この提示情報は実施の形態1と同様であるが、ここでは「第1提示情報」という。第1提示情報では、例えば、「5」の運転行動のうちから、累積値が大きい方から「3」の運転行動を含む。
一方、生成部90は、所定の頻度、例えば10回に1回の割合で、第1提示情報の代わりに、第2提示情報を生成する。第2提示情報では、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、累積値の小さい運転行動が含められる。具体的に説明すると、所定数が「3」である場合、第1提示情報に含めるべき3つの運転行動は、累積値の大きさが1番目の運転行動、累積値の大きさが2番目の運動行動、累積値の大きさが3番目の運転行動である。生成部90は、これらのうちの1つの運転行動、例えば、累積値の大きさが3番目の運転行動の代わりに、累積値の大きさが4番目の運転行動、あるいは累積値の大きさが5番目の運転行動を含めるように第2提示情報を生成する。例えば、累積値の大きさが4番目の運転行動と、累積値の大きさが5番目の運転行動は、第2提示情報の生成ごとに所定の割合で交互に含められればよい。生成部90は、生成した第1提示情報、あるいは第2提示情報を処理部92に出力する。
処理部92は、図1の画像・音声出力部51に第1提示情報あるいは第2提示情報を出力し、画像・音声出力部51は、図2のヘッドアップディスプレイ2aあるいはセンタディスプレイ2bに第1提示情報あるいは第2提示情報を出力する。ヘッドアップディスプレイ2aあるいはセンタディスプレイ2bは、第1提示情報あるいは第2提示情報の画像を表示する。
図7(a)−(e)は、実施の形態2に係る表示制御部72の処理概要を示す。図7(a)は、センタディスプレイ2bにおいて表示される第1提示情報の画像を示す。これは、図5(a)と同一である。図7(b)は、センタディスプレイ2bにおいて表示される第2提示情報の画像を示す。第1提示情報との比較を容易にするために、この第2提示情報の画像は図4をもとに生成されている。累積値が大きい順番に、運転行動C、運転行動Eが上から下に並んで配置される。また、累積値が最も小さい運転行動Aが、最も下に配置されるとともに、最も小さい文字のサイズにされる。図7(c)−(e)の説明は後述し、図3に戻る。
乗員は、センタディスプレイ2bに表示された第1提示情報あるいは第2提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択しない場合、入力装置4に対して選択結果を入力しない。これが前述の自動選択状態であり、操作信号入力部50には入力装置4からの操作信号が入力されない。その場合、選択部94は、第1提示情報あるいは第2提示情報に含まれた複数種類の運転行動のうちの1つの運転行動を選択する。具体的に説明すると、選択部94は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番、例えば、画像において最も上に配置された1つの運転行動を選択する。このような選択部94の処理は実施の形態1と同様である。このような選択部94の動作を考慮すると、生成部90は、第2提示情報を生成する際、選択部94において選択される順番以外の順番に、累積値の小さい運転行動を配置させるといえる。図7(b)においては、累積値の最も小さい運転行動が最も下に配置される。
一方、乗員は、センタディスプレイ2bに表示された第1提示情報あるいは第2提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択する場合、入力装置4に対して選択結果を入力する。これが前述の手動選択状態であり、操作信号入力部50には入力装置4からの操作信号が入力される。なお、第1提示情報が表示された場合の操作信号を「第1操作信号」といい、第2提示情報が表示された場合の操作信号を「第2操作信号」ということもある。これに続いて、処理部92は、制御コマンドをコマンド出力部55を経由で自動運転制御装置30に出力するが、実施の形態1と同様であるので、ここでは説明を省略する。
学習部74は、自動選択状態において、第1提示情報が出力された場合であるか、あるいは第2提示情報が出力された場合であるかにかかわらず、実施の形態1と同様の処理を実行する。また、学習部74は、手動選択状態において、第1操作信号が入力された場合、乗員に選択された1つの運転行動に報酬を付与する。この報酬の付与も実施の形態1と同様であり、第1操作信号において示された1つの運転行動に正の報酬が付与される。しかしながら、学習部74は、手動選択状態において、第1提示情報に含まれた複数種類の運転行動のうち、選択されなかった運転行動に負の報酬を付与しない。
学習部74は、手動選択状態において、第2操作信号が入力された場合、乗員に選択された1つの運転行動に報酬を付与する。この報酬の付与も実施の形態1と同様であり、第2操作信号において示された1つの運転行動に正の報酬が付与される。一方、学習部74は、手動選択状態において、第2提示情報に含まれた複数種類の運転行動のうち、選択されなかった運転行動に負の報酬を付与する。ここで、負の報酬は「−β」と示されるが、他の値であってもよい。
ここでは、学習部74において付与される報酬について、図7(c)−(d)を使用しながらさらに詳細に説明する。ここでは、手動選択状態のみを説明の対象にする。図7(c)の前提として、図7(a)に示すような第1提示情報の画像が表示されているとする。パターン「1」において、乗員が運転行動Cを選択した場合、学習部74は運転行動Cに正の報酬「+β」を付与する。パターン「2」において、乗員が運転行動Eを選択した場合、学習部74は運転行動Eに正の報酬「+β」を付与する。パターン「3」において、乗員が運転行動Bを選択した場合、学習部74は運転行動Bに正の報酬「+β」を付与する。
また、図7(d)の前提として、図7(b)に示すような第2提示情報の画像が表示されているとする。パターン「4」において、乗員が運転行動Cを選択した場合、学習部74は、運転行動Cに正の報酬「+β」を付与する。パターン「5」において、乗員が運転行動Eを選択した場合、学習部74は、運転行動Eに正の報酬「+β」を付与し、運転行動C、Aに負の報酬「−β」を付与する。パターン「6」において、乗員が運転行動Aを選択した場合、学習部74は、運転行動Aに正の報酬「+β」を付与し、運転行動C、Eに負の報酬「−β」を付与する。図3に戻る。
これまでの生成部90は、第2提示情報を生成する際、選択部94において選択される順番以外の順番に、累積値の小さい運転行動を配置させている。なお、選択部94において選択される順番の一例は、画像において最も上である。しかしながら、生成部90は、第2提示情報を生成する際、選択部94において選択される順番に、累積値の小さい運転行動を配置させてもよい。図7(e)は、このような場合にセンタディスプレイ2bにおいて表示される第2提示情報の画像を示す。これまでとの比較を容易にするために、この第2提示情報の画像は図4をもとに生成されている。累積値が最も小さい運転行動Aが最も上に配置されるとともに、最も大きい文字のサイズにされる。また、これの下に、累積値が大きい順番に、運転行動C、運転行動Eが上から下に並んで配置される。
以上の構成による運転支援装置40の動作を説明する。図8は、実施の形態2に係る制御部41による生成手順を示すフローチャートである。生成部90はi=1と設定する(S100)。i=10でなければ(S102のN)、生成部90は第1提示情報を生成する(S104)。生成部90はiをインクリメントする(S106)。i=10であれば(S102のY)、生成部90は第2提示情報を生成する(S108)。生成部90はi=1と設定する(S110)。終了でなければ(S112のN)、ステップ102に戻る。終了でなければ(S112のY)、終了する。
図9は、実施の形態3に係る制御部41による生成手順を示すフローチャートである。操作信号入力部50に第1操作信号あるいは第2操作信号が入力される(S150)。第1操作信号が入力された場合(S152のY)、学習部74は、選択された運転行動に正の報酬「+β」を付与する(S154)。第1提示情報が入力されていない場合(S152のN)、学習部74は、選択された運転行動に正の報酬「+β」を付与し(S156)、他の運転行動のうち選択された運転行動より高い信頼度でシステムが推定した運転行動に負の報酬「−β」を付与する(S158)。
本実施の形態によれば、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、信頼度の低い運転行動の選択機会を増加できる。また、信頼度の低い運転行動の選択機会が増加するので、当該運転行動が乗員の意図で選択されなかったか否かを区別できる。また、当該運転行動が乗員の意図で選択されなかったか否かが区別されるので、乗員の意図を認識できる。また、乗員の意図が認識されるので、乗員の意図を反映するような運転行動を導出できる。また、選択部において選択される運転行動として、信頼度の低い運転行動を配置させるので、当該運転行動を乗員が選択するか否かによって、乗員の積極的な意志を認識できる。また、選択部において選択される運転行動以外として、信頼度の低い運転行動を配置させるので、信頼度の高い運転行動を選択部に選択させることができる。また、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を実行できる。
以上、本発明に係る実施の形態について図面を参照して詳述してきたが、上述した装置や各処理部の機能は、コンピュータプログラムにより実現されうる。上述した機能をプログラムにより実現するコンピュータは、キーボードやマウス、タッチパッドなどの入力装置、ディスプレイやスピーカなどの出力装置、CPU(Central Processing Unit)、ROM、RAM、ハードディスク装置やSSD(Solid State Drive)などの記憶装置、DVD−ROM(Digital Versatile Disk Read Only Memory)やUSBメモリなどの記録媒体から情報を読み取る読取装置、ネットワークを介して通信を行うネットワークカードなどを備え、各部はバスにより接続される。
また、読取装置は、上記プログラムを記録した記録媒体からそのプログラムを読み取り、記憶装置に記憶させる。あるいは、ネットワークカードが、ネットワークに接続されたサーバ装置と通信を行い、サーバ装置からダウンロードした上記各装置の機能を実現するためのプログラムを記憶装置に記憶させる。また、CPUが、記憶装置に記憶されたプログラムをRAMにコピーし、そのプログラムに含まれる命令をRAMから順次読み出して実行することにより、上記各装置の機能が実現される。
本発明の一態様の概要は、次の通りである。
(項目1−1)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、
前記生成部において生成した提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする運転支援装置。
この態様によると、操作信号が入力されない場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくするので、乗員の意図を反映するような運転行動を導出できる。
(項目1−2)
前記学習部は、前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動以外の運転行動に負の重み付けを実行しながら学習を実行することを特徴とする項目1−1に記載の運転支援装置。
この場合、乗員に選択された1つの運転行動以外の運転行動に負の重み付けを実行するので、乗員が選択しなかった運転行動の信頼度を低くできる。
(項目1−3)
前記生成部は、複数種類の運転行動のうち、一部の運転行動が示された提示情報を生成し、
前記学習部は、前記操作信号入力部に操作信号が入力された場合、前記生成部において生成した提示情報に含まれた一部の運転行動のうち、当該操作信号において示された1つの運転行動以外の運転行動に負の重み付けを実行することを特徴とする項目1−2に記載の運転支援装置。
この場合、提示情報に含まれた一部の運転行動のうち、選択されなかった運転行動に負の重み付けを実行するので、乗員が選択しなかった運転行動の信頼度を低くできる。
(項目1−4)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、
前記生成部において生成した提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動をもとに車両の自動運転を制御し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動をもとに車両の自動運転を制御する自動運転制御部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする自動運転制御装置。
この態様によると、操作信号が入力されない場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくするので、乗員の意図を反映するような運転行動を実行できる。
(項目1−5)
運転支援装置を備える車両であって、
前記運転支援装置は、
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、
前記生成部において生成した提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする車両。
この態様によると、操作信号が入力されない場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくするので、乗員の意図を反映するような運転行動を導出できる。
(項目1−6)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成するステップと、
生成した提示情報を報知装置に出力するステップと、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力されるステップと、
操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択するステップと、
操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
操作信号が未入力である場合、前記選択するステップにおいて選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとを備え、
操作信号が未入力である場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくすることを特徴とする運転支援方法。
(項目1−7)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成するステップと、
生成した提示情報を報知装置に出力するステップと、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力されるステップと、
操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択するステップと、
操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
操作信号が未入力である場合、前記選択するステップにおいて選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとを備え、
操作信号が未入力である場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくすることをコンピュータに実行させるためのプログラム。
(項目1−8)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、前記生成部において生成した提示情報を出力する提示情報出力部とを備える運転支援装置と、
前記運転支援装置から出力された提示情報を報知する報知装置とを備え、
前記運転支援装置は、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする提示システム。
(項目2−1)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする運転支援装置。
この態様によると、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を導出できる。
(項目2−2)
前記操作信号入力部に第1操作信号が未入力である場合、第1提示情報に含まれた1つの運転行動を選択し、前記操作信号入力部に第2操作信号が未入力である場合、第2提示情報に含まれた1つの運転行動を選択する選択部をさらに備え、
前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
前記生成部は、第2提示情報を生成する際、前記予め定められた順番に、信頼度の低い運転行動を配置させることを特徴とする項目2−1に記載の運転支援装置。
この場合、選択部において選択される運転行動として、信頼度の低い運転行動を配置させるので、乗員の積極的な意志を認識できる。
(項目2−3)
前記操作信号入力部に第1操作信号が未入力である場合、第1提示情報に含まれた1つの運転行動を選択し、前記操作信号入力部に第2操作信号が未入力である場合、第2提示情報に含まれた1つの運転行動を選択する選択部をさらに備え、
前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
前記生成部は、第2提示情報を生成する際、前記予め定められた順番以外の順番に、信頼度の低い運転行動を配置させることを特徴とする項目2−1に記載の運転支援装置。
この場合、選択部において選択される運転行動以外として、信頼度の低い運転行動を配置させるので、信頼度の高い運転行動を選択部に選択させることができる。
(項目2−4)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部と、
1つの運転行動をもとに、車両の自動運転を制御する自動運転制御部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする自動運転制御装置。
この態様によると、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を実行できる。
(項目2−5)
運転支援装置を備える車両であって、
前記運転支援装置は、
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする車両。
この態様によると、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を導出できる。
(項目2−6)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、
生成した第1提示情報を報知装置に出力するステップと、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
生成した第2提示情報を前記報知装置に出力するステップと、
前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
を備えることを特徴とする運転支援方法。
(項目2−7)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、
生成した第1提示情報を報知装置に出力するステップと、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
生成した第2提示情報を前記報知装置に出力するステップと、
前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとをコンピュータに実行させるためのプログラム。
(項目2−8)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、前記生成部において生成した第1提示情報を出力する提示情報出力部とを備える運転支援装置と、
前記運転支援装置から出力された提示情報を報知する報知装置とを備え、
前記運転支援装置は、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする提示システム。
以上、本発明を実施の形態をもとに説明した。これらの実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
実施の形態1、2において、運転行動推定部70は運転支援装置40の制御部41に含まれる。しかしながらこれに限らず例えば、運転行動推定部70は、自動運転制御装置30の制御部31に含まれてもよい。本変形例によれば、構成の自由度を向上できる。
実施の形態1、2において、運転行動モデル80は、運転行動学習部310において生成され、運転行動推定部70に送信されている。しかしながらこれに限らず例えば、運転行動モデル80は運転行動推定部70にプリインストールされていてもよい。本変形例によれば、構成を簡易にできる。
実施の形態1、2において、運転行動学習部310は、運転支援装置40に含まれてもよい。
実施の形態1、2において、運転行動推定部70は、推定として、ニューラルネットワークを使用する深層学習により生成した運転行動モデルを用いている。しかしながらこれに限らず例えば、運転行動推定部70は、深層学習以外の機械学習を用いた運転行動モデルを用いてもよい。深層学習以外の機械学習の一例は、SVMである。さらに、運転行動推定部70は、統計処理により生成したフィルタを用いてもよい。フィルタの一例は、協調フィルタリングである。協調フィルタリングでは、各運転行動に対応した運転履歴あるいは走行履歴と、テストデータとの相関値を算出することによって、相関値の高い運転行動が選択される。相関値によって確からしさが示されているので、相関値は尤度ともいえ、信頼度に相当する。学習部74は、信頼度として相関値に対する報酬を付与する。本変形例によれば、構成の自由度を向上できる。
実施の形態1において、学習部74は、手動選択状態である場合、選択されなかった運転行動に対して負の報酬を付与している。しかしながらこれに限らず例えば、学習部74は、手動選択状態である場合、選択されなかった運転行動に対して負の報酬を付与しなくてもよい。本変形例によれば、選択された運転行動の信頼度と、選択されなかった運転行動の信頼度との差の増大を抑制できる。
実施の形態1、2の組合せも有効である。本変形例によれば、実施の形態1、2の組合せによる効果を得ることができる。
2 報知装置、 2a ヘッドアップディスプレイ、 2b センタディスプレイ、 4 入力装置、 4a 第1操作部、 4b 第2操作部、 4c 第3操作部、 6 スピーカ、 8 無線装置、 10 運転操作部、 11 ステアリング、 12 ブレーキペダル、 13 アクセルペダル、 14 ウィンカスイッチ、 20 検出部、 21 位置情報取得部、 22 センサ、 23 速度情報取得部、 24 地図情報取得部、 30 自動運転制御装置、 31 制御部、 32 記憶部、 33 I/O部、 40 運転支援装置、 41 制御部、 42 記憶部、 43 I/O部、 50 操作信号入力部、 51 画像・音声出力部、 52 検出情報入力部、 53 コマンドIF、 54 行動情報入力部、 55 コマンド出力部、 56 通信IF、 70 運転行動推定部、 72 表示制御部、 74 学習部、 80 運転行動モデル、 82 推定部、 84 ヒストグラム生成部、 90 生成部、 92 処理部、 94 選択部、 100 車両、 300 サーバ、 302 ネットワーク、 310 運転行動学習部、 500 運転支援システム。

Claims (8)

  1. 運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
    前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
    前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
    前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
    前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
    前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
    前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
    前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする運転支援装置。
  2. 前記操作信号入力部に第1操作信号が未入力である場合、第1提示情報に含まれた1つの運転行動を選択し、前記操作信号入力部に第2操作信号が未入力である場合、第2提示情報に含まれた1つの運転行動を選択する選択部をさらに備え、
    前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
    前記生成部は、第2提示情報を生成する際、前記予め定められた順番に、信頼度の低い運転行動を配置させることを特徴とする請求項1に記載の運転支援装置。
  3. 前記操作信号入力部に第1操作信号が未入力である場合、第1提示情報に含まれた1つの運転行動を選択し、前記操作信号入力部に第2操作信号が未入力である場合、第2提示情報に含まれた1つの運転行動を選択する選択部をさらに備え、
    前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
    前記生成部は、第2提示情報を生成する際、前記予め定められた順番以外の順番に、信頼度の低い運転行動を配置させることを特徴とする請求項1に記載の運転支援装置。
  4. 運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
    前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
    前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
    前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部と、
    1つの運転行動をもとに、車両の自動運転を制御する自動運転制御部とを備え、
    前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
    前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
    前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
    前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする自動運転制御装置。
  5. 運転支援装置を備える車両であって、
    前記運転支援装置は、
    運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
    前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
    前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
    前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
    前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
    前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
    前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
    前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする車両。
  6. 運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、
    生成した第1提示情報を報知装置に出力するステップと、
    前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
    入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
    第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
    生成した第2提示情報を前記報知装置に出力するステップと、
    前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
    入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
    を備えることを特徴とする運転支援方法。
  7. 運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、
    生成した第1提示情報を報知装置に出力するステップと、
    前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
    入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
    第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
    生成した第2提示情報を前記報知装置に出力するステップと、
    前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
    入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとをコンピュータに実行させるためのプログラム。
  8. 運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、前記生成部において生成した第1提示情報を出力する提示情報出力部とを備える運転支援装置と、
    前記運転支援装置から出力された提示情報を報知する報知装置とを備え、
    前記運転支援装置は、
    前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
    前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備え、
    前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
    前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
    前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
    前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする提示システム。
JP2017063659A 2017-03-28 2017-03-28 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム Pending JP2018165693A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017063659A JP2018165693A (ja) 2017-03-28 2017-03-28 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017063659A JP2018165693A (ja) 2017-03-28 2017-03-28 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム

Publications (1)

Publication Number Publication Date
JP2018165693A true JP2018165693A (ja) 2018-10-25

Family

ID=63922862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017063659A Pending JP2018165693A (ja) 2017-03-28 2017-03-28 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム

Country Status (1)

Country Link
JP (1) JP2018165693A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020235061A1 (ja) * 2019-05-22 2020-11-26

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020235061A1 (ja) * 2019-05-22 2020-11-26
WO2020235061A1 (ja) * 2019-05-22 2020-11-26 日本電気株式会社 動作規則決定装置、動作規則決定方法および記録媒体
JP7173317B2 (ja) 2019-05-22 2022-11-16 日本電気株式会社 動作規則決定装置、動作規則決定方法およびプログラム
US12093001B2 (en) 2019-05-22 2024-09-17 Nec Corporation Operation rule determination device, method, and recording medium using frequency of a cumulative reward calculated for series of operations

Similar Documents

Publication Publication Date Title
CN108885836B (zh) 驾驶辅助装置、系统、方法、控制装置、车辆及介质
US11072343B2 (en) Driving assistance method, and driving assistance device, driving control device, vehicle, driving assistance program, and recording medium using said method
US12145603B2 (en) Assistance method and assistance system and assistance device using assistance method that execute processing relating to a behavior model
US11926259B1 (en) Alert modality selection for alerting a driver
US10583841B2 (en) Driving support method, data processor using the same, and driving support system using the same
JP2019510677A (ja) 運転者のルールベース型支援のための制御データ作成方法
KR20180063069A (ko) 운전 제어 장치 및 운전 제어 방법, 그리고 프로그램
WO2016170764A1 (ja) 運転支援方法およびそれを利用した運転支援装置、運転制御装置、車両、運転支援プログラム
JP2018165692A (ja) 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム
WO2018008488A1 (ja) 運転支援方法およびそれを利用した運転支援装置、運転支援システム、自動運転制御装置、車両、プログラム
JP2018165693A (ja) 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、提示システム
JP2018165086A (ja) 運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、車両、プログラム、運転支援システム
JP2025177630A (ja) 車両制御装置、車両制御方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180417