[go: up one dir, main page]

JP2018071853A - 学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム - Google Patents

学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム Download PDF

Info

Publication number
JP2018071853A
JP2018071853A JP2016210319A JP2016210319A JP2018071853A JP 2018071853 A JP2018071853 A JP 2018071853A JP 2016210319 A JP2016210319 A JP 2016210319A JP 2016210319 A JP2016210319 A JP 2016210319A JP 2018071853 A JP2018071853 A JP 2018071853A
Authority
JP
Japan
Prior art keywords
information
time
learning
control
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016210319A
Other languages
English (en)
Inventor
司 竹原
Tsukasa Takehara
司 竹原
成康 堀川
Nariyasu Horikawa
成康 堀川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Info-Green Co Ltd
Japan Computer Technos Corp
Original Assignee
Info-Green Co Ltd
Japan Computer Technos Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Info-Green Co Ltd, Japan Computer Technos Corp filed Critical Info-Green Co Ltd
Priority to JP2016210319A priority Critical patent/JP2018071853A/ja
Publication of JP2018071853A publication Critical patent/JP2018071853A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Air Conditioning Control Device (AREA)

Abstract

【課題】従来の空調制御装置においては、空調システムが管理する領域内の熱的快適性を最大公約数の範囲に収めることは可能であっても、刻一刻と変化する個々のユーザの嗜好に合わせた熱的快適性に適応することが難しかった。そのため、各ユーザは熱的快適性が許容範囲を超えたとき、自ら空調機の操作を行って快適性を回復する必要があったという課題があった。【解決手段】過去のデータを用いた学習機能を用いることで、各ユーザの熱的快適性を許容範囲に収めるように、空調システムを自動的に制御することができる。【選択図】図1

Description

本発明は、複数の空調機等を有する空調システムを制御する制御装置に関するものである。
従来の学習機能を有する空調を制御する制御装置では、単独のエアコンを制御するもの制御装置が存在する(例えば、特許文献1参照)。
特開2016−169938号公報(第1頁、第1図等)
しかしながら、従来の空調制御装置では、ユーザの操作の情報を含む空調システムに関する過去の種々の情報を用いて、複数の空調機を統合的かつ好適に制御することはできないという課題があった。
本第一の発明の学習装置は、2以上の空調機を有する空調システムを制御するための学習情報が格納される学習情報格納部と、外気温度を含む外部環境情報と、日時に関する日時情報とを有する2以上の外部情報が格納される外部情報格納部と、空調機が空気調整する領域を識別する領域識別子と、領域の温度を含む内部環境情報と、日時に関する日時情報とを有する2以上の内部情報が格納される内部情報格納部と、空調システムを構成する空調機を識別する装置識別子と、空調機の状態に関する1以上の状態情報と、日時に関する日時情報とを有する2以上の装置状態情報が格納される装置状態情報格納部と、空調システムを構成する空調機を識別する装置識別子と、空調機の設定に関する1以上の設定情報と、日時に関する日時情報とを有する2以上の装置設定情報が格納される装置設定情報格納部と、空調システムを構成する空調機に対応する装置識別子と、ユーザによる空調機の操作を特定する操作識別子と、日時に関する日時情報とを有する1以上の操作情報が格納される操作情報格納部と、2以上の外部情報と2以上の内部情報と2以上の装置状態情報と2以上の装置設定情報と1以上の操作情報とを有する2以上の統合情報を用いて、時刻に関する時刻情報と時刻情報に対応する外部情報、または時刻に関する時刻情報と時刻情報に対応する外部情報と時刻情報に対応する内部情報と時刻情報に対応する装置状態情報と各空調機に対する装置設定情報を含む制御情報を入力とし、各空調機に対する装置設定情報を含む制御情報に関する情報を出力とする学習情報を構成する学習部と、学習情報を学習情報格納部に蓄積する蓄積部とを具備する学習装置である。
かかる構成により、過去に蓄積された環境に関する情報と装置に関する情報から、ユーザが直接空調機を操作する必要がない空調システムの制御を実現するための学習情報を取得することができる。
また、本第二の発明の学習装置は、第一の発明に対して、学習情報格納部には、1または2以上の熱源と2以上の空調機とを有する空調システムを制御するための学習情報が格納され、装置状態情報格納部には、熱源を識別する装置識別子と、熱源の状態に関する1以上の状態情報と、日時に関する日時情報とを有する1以上の装置状態情報をも格納され、装置設定情報格納部には、空調システムを構成する熱源を識別する装置識別子と、熱源の設定に関する1以上の設定情報と、日時に関する日時情報とを有する1以上の装置設定情報をも格納され、学習部は、2以上の外部情報と2以上の内部情報と3以上の装置状態情報と3以上の装置設定情報と1以上の操作情報とを有する2以上の統合情報を用いて、時刻に関する時刻情報と時刻情報に対応する外部情報、または時刻に関する時刻情報と時刻情報に対応する外部情報と時刻情報に対応する内部情報と時刻情報に対応する装置状態情報と各装置に対する装置設定情報を含む制御情報を入力とし、各装置に対する装置設定情報を含む制御情報に関する情報を出力とする学習情報を構成する学習装置である。
かかる構成により、熱源と空調機を同時に制御する空調システムの制御装置のための学習情報を取得することができる。
また、本第三の発明の学習装置は、第一または第二の発明に対して、学習部は、2以上の外部情報、2以上の内部情報、2以上の装置状態情報、2以上の装置設定情報および1以上の操作情報について、1以上の各操作情報が有する日時情報に対応する外部情報、内部情報、装置状態情報および装置設定情報である負例と、負例以外の日時情報に対応する外部情報、内部情報、装置状態情報および装置設定情報である正例のうち、少なくとも一部を用いて、学習情報を構成する学習装置である。
かかる構成により、ユーザが装置を直接操作する必要がない空調システムの制御を行う学習情報を取得することができる。
また、本第四の発明の学習装置は、第一から第三いずれか1つの発明に対して、学習部は、深層学習により学習情報を構成する学習装置である。
かかる構成により、より高精度な空調システムの制御を行う学習情報を取得することができる。
また、本第五の発明の制御装置は、第一から第四いずれか1つの発明に対して、学習装置により学習された学習情報、または2以上の統合情報である学習情報が格納される学習情報格納部と、少なくとも一の時刻に対応する外部情報および一の時刻に対応する内部情報を受け付ける受付部と、受付部が受け付けた外部情報、内部情報、装置状態情報および装置設定情報を、学習情報に適用し、2以上の各空調機に対する装置設定情報を含む制御情報を生成する制御情報生成部と、制御情報を出力する出力部とを具備する制御装置である。
かかる構成により、過去に蓄積された環境に関する情報と装置に関する情報から、ユーザが空調機を直接操作する必要がない空調システムの制御を行うことができる。
また、本第六の発明の制御装置は、第五の発明に対して、制御情報生成部は、受付部が受け付けた外部情報を、学習情報に適用し、理想的な内部情報を取得する理想状態取得手段と、受付部が受け付けた内部情報から、理想状態取得手段が取得した内部情報へ近づけるための制御情報を取得する制御情報取得手段とを具備する制御装置である。
かかる構成により、過去に蓄積された環境に関する情報と装置に関する情報から、ユーザが空調機を直接操作する必要がない空調システムの制御を行うことができる。
また、本第七の発明の制御装置は、第五の発明に対して、受付部は、少なくとも一の時刻に対応する外部情報、一の時刻に対応する内部情報および一の時刻に対応する装置状態情報を受け付け、制御情報生成部は、受付部が受け付けた外部情報、内部情報および装置状態情報から1以上の制御情報候補を生成する制御情報候補生成手段と、学習情報を用いて、受付部が受け付けた外部情報、内部情報および装置状態情報と、制御情報候補生成手段が生成した制御情報とを組み合わせた情報が正例と負例のいずれに属するかを判定する制御情報判定手段と、制御情報候補生成手段が生成した制御情報候補のうち、制御情報判定手段が正例であると判定した制御情報候補から、一の制御情報候補を選択する制御情報選択手段とを具備し、出力部は、制御情報選択手段が選択した一の制御情報候補を制御情報として出力する制御装置である。
かかる構成により、過去に蓄積された環境に関する情報と装置に関する情報から、ユーザが空調機を直接操作する必要がない空調システムの制御を行うことができる。
また、本第八の発明の制御装置は、第五の発明に対して、受付部は、少なくとも一の時刻に対応する外部情報、一の時刻に対応する内部情報および一の時刻に対応する装置状態情報を受け付け、制御情報生成部は、受付部が受け付けた外部情報、内部情報および装置状態情報から1以上の制御情報候補を生成する制御情報候補生成手段と、学習情報を用いて、受付部が受け付けた外部情報、内部情報および装置状態情報と、制御情報候補生成手段が生成した制御情報とを組み合わせた情報の報酬を算出する制御情報評価手段と、制御情報候補生成手段が生成した制御情報候補のうち、制御情報評価手段が算出した報酬が最大となる制御情報候補を選択する制御情報選択手段とを具備し、出力部は、制御情報選択手段が選択した一の制御情報候補を制御情報として出力する制御装置である。
かかる構成により、強化学習を用いることで、過去に蓄積された情報には存在しないような状況においても柔軟に対応する制御を行うことができることができる。
また、本第九の発明の制御装置は、第五から第八いずれか1つの発明に対して、一の時刻に対応する外部情報、一の時刻に対応する内部情報および一の時刻に対応する装置状態情報と、制御情報生成部が生成した制御情報から、一の時刻から予め決められた時間が経過した後の時刻である次時点における外部情報、内部情報および装置状態情報を推定する次時点情報推定部と、次時点情報推定部が推定した次時点における外部情報、内部情報および装置状態情報を制御情報生成部に与え、次時点の制御情報を生成させ、かつ次時点からさらに予め決められた時間が経過した後の時刻である次々時点における外部情報、内部情報および装置状態情報を生成させる生成制御部をさらに具備し、受付部は、制御情報を生成する対象の期間である制御情報生成対象期間を受け付け、出力部は、制御情報生成部が生成した制御情報生成対象期間の制御情報を出力する制御装置である。
かかる構成により、生成された制御情報を用いた場合の次の状態を推定することで、長期間にわたる空調制御のシミュレーションを行うことができる。
本発明による制御装置によれば、ユーザが空調機の操作を行う必要がないような空調システムの制御を行うことができる。
本発明の実施の形態1における学習装置のブロック図 同実施の形態における学習装置の動作を示すフローチャート 同実施の形態における時刻収集処理の動作を示すフローチャート 同実施の形態における情報統合処理の動作を示すフローチャート 同実施の形態における外部情報の一例を示す図 同実施の形態における内部情報の一例を示す図 同実施の形態における装置状態情報の一例を示す図 同実施の形態における装置設定情報の一例を示す図 同実施の形態における操作情報の一例を示す図 同実施の形態における学習情報の一例を示す図 同実施の形態における統合情報の一例を示す図 本発明の実施の形態2における空調システムのブロック図 同実施の形態における制御装置の動作を示すフローチャート 同実施の形態における理想状態取得処理の動作を示すフローチャート 同実施の形態における制御情報取得処理の動作を示すフローチャート 同実施の形態における受付情報の一例を示す図 本発明の実施の形態3における制御装置のブロック図 同実施の形態における制御装置の動作を示すフローチャート 同実施の形態における制御情報候補生成処理の動作を示すフローチャート 同実施の形態における制御情報選択処理の動作を示すフローチャート 本発明の実施の形態4における制御装置のブロック図 同実施の形態における制御装置の動作を示すフローチャート 同実施の形態における報酬最大制御情報選択処理の動作を示すフローチャート 本発明の実施の形態5における制御装置のブロック図 同実施の形態における制御装置の動作を示すフローチャート 上記実施の形態におけるコンピュータシステムの外観の一例を示す図 上記実施の形態におけるコンピュータシステムの内部構成の一例を示す図
以下、学習装置、制御装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、1または2以上の熱源と2以上の空調機を有する空調システムを制御する制御装置のために、過去に蓄積された環境に関する情報(外気温度や室内温度、湿度、日射等)と装置に関する情報(設定温度や送風強度、熱源の出力等)を入力とし、各熱源と各空調機に対する制御に関する情報を出力とする学習を行う学習装置1について説明する。
図1は、本実施の形態における学習装置1のブロック図である。
学習装置1は、格納部11、学習部12、蓄積部13を備える。さらに、格納部11は、学習情報格納部111、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115、操作情報格納部116を備える。
学習情報格納部111は、学習情報が格納される。ここで、学習情報とは、2以上の空調機を有する空調システムを制御するための情報である。学習情報格納部111については、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116の説明の後、再度詳細を述べる。
外部情報格納部112は、2以上の外部情報が格納される。ここで、外部情報とは、外部環境情報と日時情報とを有する情報である。さらに、外部環境情報とは、空調システムが空調管理する領域外の環境に関する情報である。外部環境情報は外気温度を含む。また、日時情報は日時に関する情報である。日時情報は、通常、ある時点を表す情報であるが、ある時点から別のある時点までの期間を表す情報であっても良い。なお、外部環境情報は、ビル外の特定の位置の温度(例えば、ビル周辺の道路上の温度)や湿度、日射、天気を含んでも良く、また、「3時間後の外気温度」のような将来の外気温度等を含んでも良い。また、日時情報は、当該日時が休日か否かという情報をさらに含んでも良い。
内部情報格納部113は、2以上の内部情報が格納される。ここで、内部情報とは、領域識別子と内部環境情報と日時情報とを有する情報である。さらに、領域識別子とは、空調システムが空調管理する定められた一定の空間である領域を識別する識別子である。例えば、領域は、空調機が設置された部屋や廊下であり、領域識別子は、当該部屋や廊下を識別する識別子である。また、内部環境情報とは、空調システムが空調管理する領域内の環境に関する情報である。内部環境情報は、領域内の温度を含む。なお、内部環境情報は、領域内の湿度や領域内に存在する人間の数を含んでも良い。
装置状態情報格納部114は、2以上の装置状態情報が格納される。ここで、装置状態情報とは、装置識別子と状態情報と日時情報とを有する情報である。さらに、装置識別子とは、空調システムを構成する熱源または空調機を識別する識別子である。また、状態情報とは、熱源または空調機の状態を表す情報である。状態情報は、通常、熱源または空調機に関して、当該装置以外のものや人が外部から直接変更することができない、当該装置の状態に関する取得可能な情報である。例えば、状態情報は、装置の累計運転時間、消費電力、消費燃料を含む。
装置設定情報格納部115は、2以上の装置設定情報が格納される。ここで、装置設定情報とは、装置識別子と設定情報と日時情報とを有する情報である。さらに、設定情報とは、空調システムを構成する熱源または空調機に関して、当該装置以外のものや人が外部から直接変更することができる当該装置の設定に関する情報である。例えば、設定情報は、熱源または空調機を稼働させるか否か(熱源のON/OFF)といった情報や、空調機の設定温度、動作モード(冷房、暖房、除湿等)、風量等を含む。
操作情報格納部116は、1以上の操作情報が格納される。ここで、操作情報とは、装置識別子と、操作識別子と、日時情報とを有する情報である。さらに、操作識別子とは、ユーザによる空調機の操作を識別する識別子である。なお、ユーザとは、空調システムのユーザではなく、空調システムが空調管理する領域内に存在する人間を意味する。操作識別子は、「電源のON/OFF」、「設定温度を2度下げる」、「設定温度を28℃にする」等、内容の形式は問わない。また、操作情報は、ユーザを識別するユーザ識別子を含んでも良い。
学習情報格納部111に格納される学習情報は、格納部11の他の情報から学習した、空調システムを制御するための情報ならば、その形式は問わない。ここで、格納部11の他の格納部とは、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115、および操作情報格納部116を意味する。例えば、学習情報は、一の時刻における外部情報を入力とし、ユーザが空調機を直接操作することがないような内部情報を出力する回帰モデルに関する情報でも良い。以下、ユーザが空調機を直接操作することがないような内部情報を、理想的な内部情報と呼ぶ。理想的な内部情報とは、空調システムが目標とするべき内部情報とも言える。
また、例えば、学習情報は、外部情報と内部情報と装置状態情報と制御情報とを入力とし、当該制御情報が適切か否かを出力する識別器に関する情報でも良い。ここで、入力される外部情報と内部情報と装置状態情報は、一の時刻によって対応付けられている。すなわち、入力される外部情報と内部情報と装置状態情報は、同一時刻の情報である。また、制御情報とは、通常、一の時刻における、空調システムを構成する各熱源および各空調機の装置設定情報である。さらに、制御情報が適切か否かとは、当該制御情報を実行した後に、ユーザが空調機を直接操作するか否かを意味する。ユーザが空調機を直接操作するような場合、当該制御情報は適切でなく、ユーザが空調機を直接操作しないような場合、当該制御情報は適切である。
また、例えば、学習情報は、外部情報と内部情報と装置状態情報と制御情報とを入力とし、当該制御情報の適切さに関する値を返すモデルに関する情報でも良い。ここで、入力される外部情報と内部情報と装置状態情報は、一の時刻によって対応付けられている。また、制御情報の適切さに関する値とは、例えば、当該制御情報を実行した後に、ユーザによる空調機の操作の有無を定量的に表した値である。すなわち、当該値は、当該制御情報を実行した後に、ユーザが空調機を操作するほど低く、またユーザが空調機を操作しないほど高くなる値である。また、制御情報の適切さに関する値は、ユーザによる空調機の操作の有無に加え、当該制御情報を実行するコストも考慮した値とすることは好適である。ここで、コストは、空調システムの消費電力であっても良く、空調システムを構成する各装置の部品の損耗率であっても良い。
学習部12は、2以上の統合情報を用いて、外部情報や内部情報、装置状態情報、制御情報を入力とし、制御情報に関する情報を出力とする学習情報を構成する。ここで、統合情報とは、時刻情報によって結び付けられた、外部情報、内部情報、装置状態情報、装置設定情報、および操作情報である。さらに、時刻情報とは、日時情報と異なり、特定の時点を表す情報である。通常、時刻情報は、月、日、時、分の情報を含む。さらに、時刻情報は、日付情報と同じく、休日か否かという情報をさらに含んでも良い。また、時刻情報と結び付けられるとは、当該時刻情報が表す時点を含む日時情報を有することを意味する。すなわち、統合情報とは、通常、一の時刻における、外部環境情報、領域識別子と内部環境情報、装置識別子と状態情報、装置識別子と設定情報、および装置識別子と操作識別子を結合した情報である。なお、時刻情報によって結び付けられた外部情報、内部情報、装置状態情報、装置設定情報および操作情報は、通常、それぞれ外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115、操作情報格納部116に格納されている情報であるが、前記各格納部に格納されている情報を基に算出した情報を用いても良い。また、統合情報は時刻によってソートされているものとする。
また、入力とする外部情報や内部情報、装置状態情報、制御情報は、通常、統合情報と同様に一の時刻で結び付けられている。ここで、学習部12は、外部情報、内部情報、装置状態情報および制御情報のすべてを入力として用いる必要はなく、少なくとも外部情報を含む前記情報のいずれか1以上の情報を用いれば良い。
また、出力とする制御情報に関する情報は、学習情報格納部111でも述べたような様々な出力がある。例えば、理想的な内部情報を出力としても良く、入力した制御情報が適切であるか否かを判定する情報を出力としても良い、また、入力した制御情報の適切さに関する値を出力としても良い。
以下、学習部12が、理想的な内部情報を出力する場合と、入力した制御情報が適切であるか否かを判定する情報を出力する場合と、入力した制御情報の適切さに関する値を出力する場合の、3つの場合について詳細を説明する。
<理想的な内部情報を出力とする場合>
学習装置1が理想的な内部情報を出力する場合、学習部12は、通常、時刻に関する時刻情報と当該時刻情報に対応する外部情報を入力とし、当該外部情報に対する理想的な内部情報を出力とする学習情報を構成する。この場合、学習装置1によって生成された学習情報を用いる制御装置は、通常、入力された外部情報から当該学習情報を用いて理想的な内部情報を取得し、その後、当該取得した内部情報へ推移する制御情報を生成する。当該制御装置については、実施の形態2にてその詳細を述べる。
学習装置1が理想的な内部情報を出力する場合、学習部12が構築する学習情報は、時刻に関する時刻情報と当該時刻情報に対応する外部情報から、当該外部情報に対する理想的な内部情報を取得することができるならば、そのモデルや学習方法はどのようなものでも良い。
例えば、上記の場合、学習部12が構築する学習情報は、操作情報を含まない統合情報をすべて格納し、入力情報と最も近い前記統合情報の内部情報を出力するモデルによって実現できる。ここで、操作情報を含まない統合情報とは、ユーザによる空調機の操作が行われていない時刻の統合情報を意味する。本発明では、ユーザによる空調機の操作が行われていない時刻の情報を「正例」と、ユーザによる空調機の操作が行われた時刻の情報を「負例」と呼ぶ。また、入力情報とは、入力された時刻情報と当該時刻情報に対応する外部情報を表す。また、入力された情報と統合情報が近いとは、入力された情報を表すベクトルと、統合情報の時刻情報と外部情報を表すベクトルの距離が近いことを意味する。また、「距離が近い」とは「類似度が高い」と読み替えても良い。ここで、各情報をベクトル化する際に正規化を行うことは好適である。また、ベクトル間の距離や類似度は、2つのベクトル間がどの程度一致しているかを表す数ならば、その内容は問わない。例えば、距離はユークリッド距離でもマハラノビス距離でも良く、類似度はコサイン類似度やピアソンの相関係数でも良い。なお、上記のような学習情報は、各統合情報をそれぞれ1クラスとみなしたk最近傍法とも考えることができる。また、なお、ベクトルの距離と類似度およびk最近傍法については、公知技術のため説明を省略する。さらに、上記の場合、学習部12が行う学習とは、統合情報を記憶することと、距離や類似度を算出するために必要な情報を収集することになる。
また、例えば、学習情報は、SVR(Support Vector Regression)によっても実現され得る。具体的には、学習部12は、内部情報のそれぞれ(領域識別子と内部環境情報のペア1つ)に対して、1つのSVRを構築することで実現され得る。例えば、領域識別子「会議室」と内部環境情報「温度」のペアに対応するSVRが1つ、さらに、領域識別子「社長室」と内部環境情報「温度」のペアに対応するSVRが1つのように、内部情報のそれぞれについてSVRを構築する。この場合、各SVRは、操作情報を含まない統合情報を用いて、時刻情報と外部情報から、当該SVRが対象とする内部情報への回帰を学習する。なお、SVRについては、公知技術であるので、詳細な説明を省略する。
また、例えば、学習情報は、ニューラルネットワークによっても実現され得る。具体的には、学習部12は、操作情報を含まない統合情報を用いて、前記統合情報の時刻情報と外部情報から、前記統合情報の内部情報への回帰を学習させたニューラルネットワークを学習情報とする。ここで、ニューラルネットワークは、時刻情報と外部情報から、内部情報への回帰を学習させることが可能ならば、どのような形状のネットワークでも良い。例えば、深層学習と呼ばれる4層以上のニューラルネットワーク(入力層と出力層を除く中間層が2層以上存在するニューラルネットワーク)を用いても良い。なお、ニューラルネットワークおよび深層学習については、公知技術であるので、詳細な説明を省略する。
なお、学習装置1が理想的な内部情報を出力する場合において、学習情報は、時刻に関する時刻情報と当該時刻情報に対応する外部情報以外にも、当該時刻に対応する内部情報、当該時刻に対応する装置状態情報、当該時刻に対応する装置設定情報をさらに入力としても良い。また、前記学習情報は、その他、多変量の回帰問題を解く様々な方法で実現可能である。
<制御情報が適切な否かを出力とする場合>
学習装置1が理想的な内部情報を出力する場合、学習部12は、通常、時刻情報、外部情報、内部情報、装置状態情報および制御情報を入力とし、当該制御情報が適切か否かを出力とする学習情報を構成する。ここで、当該外部情報、当該内部情報および当該装置状態情報は、当該時刻情報で対応付けられているものとする。この場合、学習装置1によって生成された学習情報を用いる制御装置は、通常、はじめに、前記入力された情報から、実行可能な制御情報を1以上生成する。その後、当該制御装置は、生成した制御情報の中から、当該学習情報を用いて適切な制御情報を選択する。当該制御装置については、実施の形態3にてその詳細を述べる。
例えば、上記の場合、学習部12が構築する学習情報は、すべての統合情報を記憶し、入力情報と最も近い前記統合情報が操作情報を含むか否かを出力するモデルによって実現できる。ここで、入力情報とは、時刻情報と、当該時刻情報に対応する外部情報、内部情報および装置状態情報と、制御情報を表す。また、入力された制御情報は、統合情報の装置設定情報とそのまま対応するものとする。本モデルの詳細は、上記の理想的な内部情報を出力とする場合と同様である。
また、例えば、学習情報は、SVM(Support Vector Machine)によっても実現され得る。具体的には、統合情報に含まれる、外部情報と内部情報と装置状態情報と装置設定情報とをベクトル化し、操作情報を含む統合情報に対応する前記ベクトルを正例、操作情報を含む統合情報に対応する前記ベクトルを負例として学習したSVMによって実現され得る。学習情報をSVMによって実現する場合、統合情報に含まれる、外部情報と内部情報と装置状態情報と装置設定情報を表すベクトルは、正規化を行うことは適切である。また、本学習情報を用いる際には、制御情報は、各装置設定情報へそのまま入力する。なお、SVMについては、公知技術であるので、詳細な説明を省略する。
また、例えば、学習情報は、ニューラルネットワークによっても実現され得る。具体的には、学習部12は、すべての統合情報を用いて、前記統合情報の時刻情報と外部情報と内部情報と装置状態情報と装置設定情報から、前記統合情報が正例である確率と前記統合情報が負例である確率を出力するようなニューラルネットワークを学習情報とする。すなわち、統合情報が操作情報を含まない場合は、「正例である確率は1、負例である確率は0」、統合情報が操作情報を含む場合は、「正例である確率は0、負例である確率は1」として学習を行う。ここで、ニューラルネットワークは、前記統合情報が正例である確率と前記統合情報が負例である確率を取得できるならば、どのような形状のネットワークでも良い。また、先のSVMと同様に、本学習情報を用いる際には、制御情報は、各装置設定情報へそのまま入力する。本例については、具体例を後述する。
学習装置1が理想的な制御情報が適切な否かを出力する場合において、学習情報は、その他、多次元ベクトルを入力とした2クラスの分類問題を解く様々な方法で実現可能である。
<制御情報の適切さに関する値を出力とする場合>
学習装置1が制御情報の適切さに関する値を出力する場合、学習部12は、通常、時刻情報、外部情報、内部情報、装置状態情報および制御情報を入力とし、当該制御情報の適切さに関する値を出力とする学習情報を構成する。ここで、当該外部情報、当該内部情報および当該装置状態情報は、当該時刻情報で対応付けられているものとする。この場合、学習装置1によって生成された学習情報を用いる制御装置は、通常、入力された外部情報、内部情報、装置状態情報から、実行可能な制御情報を1以上生成する。その後、当該制御装置は、生成した制御情報の中から、当該学習情報を用いて適切さに関する値が最も高い制御情報を選択する。当該制御装置については、実施の形態4にてその詳細を述べる。
例えば、上記の場合、学習部12が構築する学習情報は、強化学習を用いて、統合情報から学習される行動価値関数によって実現することは好適である。すなわち、前記学習情報は、時刻情報、外部情報、内部情報および装置状態情報で表される状況(以下、現在の状態と呼ぶ)において、ある制御情報に対応する制御を実行した際の、将来得られる報酬の合計の期待値を返す関数として表される。ここで、報酬とは、現在の状態において、どの程度ユーザによる空調機の操作が行われないかを表す値で、ユーザによる空調機の操作が行われないほど高い値となる。また、報酬の定義は予め与えられているものとする。なお、報酬は、ユーザによる操作の有無に加え、コストを考慮することが望ましい。すなわち、「ユーザによる操作が行われた場合に報酬は低く(もしくは無し)、かつ、コストが低いほど高くなる」ような関数が望ましい。ここで、コストとは、現在の状態に対する必要な電力量や費用を表す値である。なお、この場合、学習装置1は、図示しない報酬関数格納部を有する。報酬関数格納部は、現在の状態に対する報酬を算出する関数である報酬関数が格納されているものとする。
上記の例の場合、学習部12は、強化学習を用いて、行動価値関数(Q(s,a)=状況sで行動aを取り、以後、同じ方策に従った場合の得る報酬の和の期待値)を学習し、当該行動価値関数を学習情報とする。例えば、行動価値関数は以下のような方法で得ることができる。はじめに、学習部12は、時刻情報を一定間隔(1時間、1分等)にした統合情報を生成する。次に、当該統合情報について、現在の状態s、行動a、報酬r、次の状態s’を取得する。ここで、現在の状態sは、時刻情報、外部情報、内部情報および装置状態情報である。また、行動aは、装置設定情報である。また、次の状態s’は、次の時点の統合情報における外部情報、内部情報および装置状態情報である。また、報酬rは、図示しない報酬関数格納部に格納されている関数から求められる値であり、例えば、「(理論的な最大消費電力−状況sの消費電力)×{0,1|ユーザによる操作が行われた場合は0,それ以外は1}」といった値である。そして、統合情報から取得した前記「現在の状態s、行動a、報酬r、次の状態s’」の組から、Neural Fitted Q Iterationや、Deep Q−Networkを用いて行動価値関数を学習する。
なお、強化学習、ニューラルネットワーク、Neural Fitted Q IterationおよびDeep Q−Networkについては、公知技術であるので、詳細な説明を省略する。
蓄積部13は、学習部12が学習した学習情報を学習情報格納部111に蓄積する。
格納部11、学習情報格納部111、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115(以下、格納部11等)は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
格納部11等に情報が記憶される過程は問わない。例えば、通信回線等を介して送信された情報が格納部11等で記憶されるようになってもよく、記録媒体を介して情報が格納部11等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11等で記憶されるようになってもよい。
学習部12および蓄積部13は、通常、MPUやメモリ等から実現され得る。学習部12および蓄積部13の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。また、後の実施の形態で記す、制御情報生成部23、制御情報生成部33、制御情報生成部43、次時点情報推定部55、および生成制御部56についても同様に、MPUやメモリ等から実現され得る。
次に、学習装置1の動作について図2のフローチャートを用いて説明する。以下、所定の情報におけるi番目の情報は、「情報[i]」と記載するものとする。
また、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116には予め学習に用いる情報が格納されているものとする。
(ステップS201)学習部12は、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116の情報から時刻を収集する。かかる処理を時刻収集処理という。時刻収集処理の詳細について、図3のフローチャートを用いて説明する。
(ステップS202)学習部12は、ステップS201で収集した時刻に基づいて、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116を統合し、統合情報を生成する。かかる処理を情報統合処理という。情報統合処理の詳細について、図4のフローチャートを用いて説明する。
(ステップS203)学習部12は、ステップS202で生成した統合情報をそれぞれベクトル化する。ここで、統合情報から生成されるベクトルは、外部情報の種類、領域識別子と内部情報の種類の組、装置識別子と装置状態情報の種類の組、装置識別子と装置設定情報の種類の組のそれぞれを1以上の次元とするベクトルである。例えば、「会議室」と「社長室」という2つの領域識別子のそれぞれについて、「気温」と「湿度」という内部情報の種類が存在した場合、生成されるベクトルにおいて、これらの内部情報に対応する部分は、「会議室:気温」、「会議室:湿度」、「社長室:気温」、「社長室:湿度」の4次元となる。また、気温や湿度ではなく「天気」のように定性的な値をとる情報の場合、天気のそれぞれ(晴、雨、曇など)について1つの次元を割り当て、各次元に対応する値をとった場合に1、そうでない場合は0のように定量化を行う。
(ステップS204)学習部12は、ステップS203でベクトル化した各統合情報を用いて制御情報に関する情報を出力するモデルを学習する。本ステップの詳細については、後に示す具体例、ならびに実施の形態で述べる。
(ステップS205)蓄積部13は、ステップS204で学習した学習情報を学習情報格納部111へ保存する。
なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS201の時刻収集処理の詳細の具体例について、図3のフローチャートを用いて説明する。なお、図3および図4のフローチャートにおいて、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116をDBと表記し、前記順番で並べてあるものとする。
(ステップS301)学習部12は、収集時刻Tを空に、カウンタiを1に初期化する。ここで、収集時刻Tは順序付きの集合とする。
(ステップS302)学習部12は、i番目のDBが存在する場合はステップS303へ、そうでない場合はステップS310へ進む。
(ステップS303)学習部12は、カウンタjを1に初期化する。
(ステップS304)学習部12は、DB[i]にj番目のデータが存在する場合、ステップS305へ、そうでない場合、ステップS309へ進む。
(ステップS305)学習部12は、DB[i]の[j]番目に格納されている日付情報が期間を表す場合、ステップS306へ、そうでない場合、ステップS307へ進む。
(ステップS306)学習部12は、DB[i]のj番目の日付情報の開始時刻と終了時刻をそれぞれ収集時刻Tへ追加し、ステップS308へ進む。
(ステップS307)学習部12は、DB[i]のj番目の日付情報の時刻を収集時刻Tへ追加する。
(ステップS308)学習部12は、カウンタjを1だけ増加させ、ステップS304へ戻る。
(ステップS309)学習部12は、カウンタiを1だけ増加させ、ステップS302へ戻る。
(ステップS310)学習部12は、収集時刻Tを昇順に(後の時刻ほど後ろになるように)ソートし、上位処理へリターンする。
次に、ステップS202の情報統合処理の詳細の具体例について、図4のフローチャートを用いて説明する。
(ステップS401)学習部12は、カウンタkを1に初期化する。
(ステップS402)学習部12は、ステップS201の時刻収集処理で収集した収集時刻Tにk番目の時刻が存在する場合、ステップS403へ進み、そうでない場合、上位処理へリターンする。
(ステップS403)学習部12は、カウンタiを1に初期化する。
(ステップS404)学習部12は、i番目のDBが存在する場合、ステップS405へ、そうでない場合、ステップS411へ進む。
(ステップS405)学習部12は、DB[i]の各情報の中に、T[k]が日付情報に含まれる情報が存在する場合、ステップS406へ、そうでない場合、ステップS407へ進む。
(ステップS406)学習部12は、T[k]を含むDB[i]の情報をT[k]に対応する情報とし、ステップS410へ進む。
(ステップS407)学習部12は、DB[i]が操作情報格納部116の場合、ステップS409へ、そうでない場合、ステップS408へ進む。
(ステップS408)学習部12は、DB[i]の情報のうち、T[k]と最も近い時刻を含む情報を、T[k]に対応する情報とし、ステップS410へ進む。なお、ここで、通常、DB[i]が装置設定情報格納部115の場合、最も近い時刻は、前の時刻のみを対象にする。
(ステップS409)学習部12は、T[k]に対応する情報を「なし」とする。
(ステップS410)学習部12は、カウンタiを1だけ増加させ、ステップS404へ進む。
(ステップS411)学習部12は、ステップS406、ステップS408とステップS409で対応付けた情報を時刻T[k]の統合情報とする。
(ステップS412)学習部12は、カウンタkを1だけ増加させ、ステップS402へ戻る。
なお、図4のフローチャートにおいて、ステップS408は、T[k]の前後の情報から補間を行っても良い。
以下、本実施の形態における学習装置1の具体的な動作について説明する。
本具体例において、学習装置1は、一の時刻における外部情報、当該時刻における内部情報および当該時刻における装置状態情報と、当該時刻に対応する制御情報を入力とし、当該制御情報が適切か否かを判定する識別器に関する学習情報を取得することを目的とする。以下、制御情報が適切であることを「正例」、適切でないことを「負例」と呼ぶ。
また、本具体例において、外部情報格納部112は図5の外部情報を、内部情報格納部113は図6の内部情報を、装置状態情報格納部114は図7の装置状態情報を、装置設定情報格納部115は図8の装置設定情報を、操作情報格納部116は図9の操作情報を格納しているものとする。
また、本具体例において、前記識別器は図10のような4層のニューラルネットワーク(深層学習)で実現するものとする。具体的には、第1層が入力、第2層と第3層が全結合層、そして第4層が正例の確率(P正例)と負例の確率(P負例)を表す2ユニットで構成される出力層となるニューラルネットワークである。各層のユニット数は、第1層が統合情報のベクトルの次元数+1、第2層と第3層は学習時に決定、そして第4層は2である。また、第2層と第3層の活性化関数はReLU(Rectifier Liner Unit)を、第4層の活性化関数はsoftmax関数である。なお、ReLUとsoftmax関数については、公知技術であるため、説明を省略する。
また、本具体例において、気温は−10℃から45℃の範囲にあると仮定する。また、熱源Aの最大電力は3500Wh、空調機aの最大電力は250Wh、空調機bの最大電力は150Whであるとする。また、熱源Aの出力は0%から100%の範囲をとるものとし、空調機aと空調機bの温度は、OFFもしくは16℃から31℃の範囲をとるものとする。
はじめに、学習部12は、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116(以下、まとめて元データと呼ぶ)から、時刻情報を収集する(ステップS201)。その結果、9/23の8:00、9:00、10:00、11:00、12:00、13:00を取得する。
次に、学習部12は、元データから収集した時刻に対応する各情報を収集し、統合情報を生成する(ステップS202)。この結果、図11のような統合情報が生成される。なお、図11において、空白のセルは、データが「ない」ことを意味する。
次に、学習部12は、図11の各行をベクトル化する。ここで、ベクトルの各値は0から1の値に正規化を行う。時刻については、0時からの経過時間と、0時までの残り時間のうち短い時間をtとして、「t/12時間」によって正規化する。また、外部情報の外気温、内部情報の開発部:気温および会議室:気温については、−10℃より低い温度の場合は0、45℃より高い温度の場合は1、それ以外の温度の場合は「(気温+10)/55」と正規化する。また、装置状態情報において、熱源A:電力は「電力/3500」と、空調機a:電力は「電力/250」と、空調機b:電力は「電力/150」と正規化する。また、装置設定情報の熱源A:出力は「出力/100」と正規化する。さらに、装置設定情報の空調機a:温度と空調機b:温度については、何かしらの温度が設定されている場合に1,OFFの場合に0となる次元と、「温度−16/47」の値をとる次元の2次元に展開する。以上のようなベクトル化を行い、統合情報を12次元のベクトルに変換する(ステップS203)。
次に、学習部12は、前ステップで作成したベクトルから、上述したニューラルネットワークの学習を行う(ステップS204)。本学習における教師データは、入力は前ステップで作成したベクトルであり、出力は当該ベクトルに操作情報が存在する場合は「P正例=0、P負例=1」、操作情報が存在しない場合は「P正例=1、P負例=0」である。本学習では、中間層のユニット数を変動させつつ、交差エントロピーによる出力層の誤差が少なくなるように各層のユニット間の重みw(1) i,jとw(2) i,jを計算する。
最後に、蓄積部13は、中間層のユニット数を含むニューラルネットワークの構造と、各層のユニット間の重みw(1) i,jとw(2) i,jを学習情報格納部111に格納する(ステップS205)。
以上、本実施の形態によれば、過去に蓄積された外部情報、内部情報、装置設定情報、装置状態情報および操作情報から、ユーザが直接空調機を操作する必要がない空調システムの制御を実現するための学習情報を取得することができる。
なお、本実施の形態によれば、学習部12は、統合情報をベクトル化する際、最も近い時刻のデータの値によって補間を行う(図4のステップS408)のではなく、前後の時刻のデータから値を補間しても良い。例えば、補完対象時刻の直前の時刻から直後の時刻へ線形に推移していると仮定し、補完対象時刻の値を線形関数によって推定し、当該推定値で補間しても良い。
欠損値を補間しても良い。すなわち、
また、本実施の形態によれば、統合情報のすべてを学習に用いなくとも良い。例えば、非営業日の統合情報は学習に用いなくとも良い。
(実施の形態2)
本実施の形態において、1または2以上の熱源と2以上の空調機を有する空調システムを制御する制御装置であって、過去のデータから学習した、理想的な室内温度等の内部情報を用いて、適切な制御情報を生成する制御装置2について説明する。
図12は、本実施の形態における空調システムのブロック図である。空調システムは制御装置2、1または2以上の熱源6、1または2以上の空調機7、1または2以上の外部情報源8、1または2以上の内部情報源9を有する。
制御装置2は、1または2以上の熱源6、2以上の空調機7、1または2以上の外部情報源8、1または2以上の内部情報源9と、直接もしくはネットワークを介して接続されている。当該ネットワークは、有線、または無線の通信回線であり、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線等である。
熱源6は、空調機7に熱量を供給する装置である。また、空調機7は、熱源から供給された熱量を空調システムが管理する各領域へ送る装置である。また、外部情報源8は、空調システムが空調管理する領域外の環境に関する情報である外部環境情報を与えるものである。また、内部情報源9は、空調システムが空調管理する領域内の環境に関する情報である内部環境情報を与えるものである。
空調機7、外部情報源8および内部情報源9は、制御装置2と接続可能であれば何でも良い。熱源6は、例えば、ヒートポンプ、ボイラー、蒸気圧縮冷凍機、吸着式冷凍機、または、吸収始期冷凍機であっても良い。空調機7は、例えば、中央式空気調和機、エアハンドリングユニット、ファンコイルユニット、個別式空気調和機、パッケージエアコンディショナ、ルームエアコンディショナであっても良い。外部情報源8は、例えば、サーバー、デスクトップパソコン、ノートパソコン、スマートフォン、タブレット、PDA、または空調システムが空調管理する領域外に設置された通信機能を有する温度計等であっても良い。内部情報源9は、例えば、サーバー、デスクトップパソコン、ノートパソコン、スマートフォン、タブレット、PDA、ウェアラブルデバイス、または空調システムが空調管理する領域内に設置された通信機能を有する温度計等であっても良い。なお、制御装置2と熱源6が1つの装置で実現されていても良い。また、制御装置2と空調機7が1つの装置で実現されていても良い。また、制御装置2と外部情報源8が1つの装置で実現されても良い。また、制御装置2と内部情報源9が1つの装置で実現されても良い。また、熱源6と空調機7が1つの装置で実現されても良い。また、空調機7と内部情報源9が1つの装置で実現されても良い。
図12の制御装置2は、格納部11、学習情報格納部111、受付部22、制御情報生成部23、出力部24を備える。さらに、制御装置2の制御情報生成部23は、理想状態取得手段231、制御情報取得手段232を備える。
制御装置2を構成する格納部11は、学習情報が格納されている学習情報格納部111を有する。本実施の形態において、学習情報格納部111は、通常、学習装置1等から学習した、時刻に関する時刻情報と当該時刻情報に対応する外部情報を入力とし、当該外部情報に対する理想的な内部情報を出力とするモデルに関する学習情報が格納されている。
受付部22は、時刻情報と外部情報と内部情報とを受け付ける。ここで、当該外部情報と当該内部情報は、当該時刻情報と対応付けられている。すなわち、当該外部情報と当該内部情報は、通常、当該時刻における外部環境情報と内部環境情報を意味する。
受け付けとは、通常、有線もしくは無線の通信回線を介して送信された情報の受信であるが、その他、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリ、USBメモリなどの記録媒体から読み出された情報の受け付けなども含む概念である。入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。
制御情報生成部23は、受付部22が受け付けた情報を、学習情報格納部111に格納されている学習情報に適用し、2以上の各空調機に対する装置設定情報を含む制御情報を生成する。
本実施の形態において、制御情報生成部23は、理想状態取得手段231と制御情報取得手段232を含む。
理想状態取得手段231は、受付部22が受け付けた外部情報を、学習情報格納部111に格納されている学習情報に適用し、理想的な内部情報を取得する。
制御情報取得手段232は、受付部22が受け付けた内部情報から、理想状態取得手段231が取得した内部情報へ近づけるための制御情報を取得する。制御情報取得手段232は、受付部22が受け付けた内部情報(以下、受付内部情報)と理想状態取得手段231が取得した内部情報(以下、取得内部情報)から適切な制御情報を取得できるならば、その具体的な方法は問わない。
例えば、学習情報格納部111に格納される学習情報がk最近傍法の場合、学習情報には、図11のような統合情報が含まれる。このような場合、制御情報取得手段232は、2つの連続する統合情報(統合情報は時系列順に並べられている)を走査し、当該2つの統合情報の内部情報と、受付内部情報と取得内部情報の、間の距離が最も近い統合情報の装置設定情報を制御情報として取得しても良い。ここで、制御情報とする装置設定情報は、2つの統合情報のうち前の時刻の統合情報の装置設定情報である。また、ここで、前の時刻の統合情報が操作情報を含む場合は、装置設定情報に操作情報を上書きした情報を制御情報とすることは適切である。また、2つの内部情報のペアの間の距離については、学習部12と同様に、どのような距離または類似度を用いても良い。
また、例えば、制御情報取得手段232は、前記隣接する統合情報、もしくは装置設定情報が変化していない2時刻の統合情報を用いて、各統合情報の2つの内部情報から、前の時刻の装置設定情報へ回帰するような問題を解く方法でも実現可能である。
出力部24は、制御情報生成部23が生成した制御情報を出力する。制御装置2は、出力部24の出力を各熱源または各空調機へ入力し直接制御を行っても良い。また、制御装置2は、各装置を直接制御するのではなく、出力部24の出力をディスプレイ等へ表示し、空調システムの管理者へシミュレーション結果を提示しても良い。
出力とは、熱源または空調機への処理結果の引渡し、他の処理装置や他のプログラムなどへの処理結果の引渡し、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積などを含む概念である。
受付部22、後述する受付部32、および後述する受付部52は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
出力部24は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。出力部24および後述する出力部54は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。
次に、制御装置2の動作について図13のフローチャートを用いて説明する。以下、所定の情報におけるi番目の情報は、「情報[i]」と記載するものとする。
(ステップS1301)受付部22は、時刻に関する時刻情報と、当該時刻情報に対応する外部情報および内部情報(以下、受付情報)が入力された場合、ステップS1302へ進む、そうでない場合、受付情報が入力されるまで待機する。
(ステップS1302)理想状態取得手段231は、受付情報から、ユーザにより各空調機の操作が行われないと推定される内部情報を取得する。かかる処理を理想状態取得処理という。理想状態取得処理の詳細について、図14のフローチャートを用いて説明する。
(ステップS1303)制御情報取得手段232は、受付情報の内部情報と理想状態取得手段231が取得した内部情報から、制御情報を取得する。かかる処理を制御情報取得処理という。制御情報取得処理の詳細について、図15のフローチャートを用いて説明する。
(ステップS1304)出力部24は、制御情報生成部23が生成した制御情報を出力する。
なお、図13のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS1302の理想状態取得処理の詳細の具体例について、図14のフローチャートを用いて説明する。なお、本理想状態取得処理の具体例では、学習情報格納部111に格納されている学習情報が、k最近傍法に基づくモデルである場合であり、当該学習情報としてすべての統合情報が保存されている場合を説明する。
(ステップS1401)理想状態取得手段231は、カウンタiを1に、最小距離dを∞に、理想状態Sをnullに初期化する。
(ステップS1402)理想状態取得手段231は、i番目の統合情報が存在する場合、ステップS1403へ進み、そうでない場合、上位処理へリターンする。
(ステップS1403)理想状態取得部231は、統合情報[i]の操作情報が「なし」の場合、ステップS1404へ、そうでない場合、ステップS1407へ進む。
(ステップS1404)理想状態取得手段231は、受付情報と、統合情報の時刻情報と外部情報を、それぞれベクトル化し、ベクトル間の距離を求め、変数tmpへ代入する。
(ステップS1405)理想状態取得手段231は、最小距離dよりtmpの方が小さい場合、ステップS1406へ、そうでない場合、ステップS1407へ進む。
(ステップS1406)理想状態取得手段231は、最小距離dへtmpを代入し、目標状態Sに統合情報[i]の内部情報を代入する。
(ステップS1407)理想状態取得手段231は、カウンタiを1だけ増加させ、ステップS1402へ戻る。
次に、ステップS1303の制御情報取得処理の詳細の具体例について、図15のフローチャートを用いて説明する。なお、本制御情報取得処理の具体例では、学習情報格納部111に格納されている学習情報が、k最近傍法に基づくモデルである場合であり、当該学習情報としてすべての統合情報が保存されている場合を説明する。
(ステップS1501)制御情報取得手段232は、カウンタiを2に、最小距離dを∞に、制御情報Cをnullに初期化する。
(ステップS1502)制御情報取得手段232は、i番目の統合情報が存在する場合、ステップS1503へ、そうでない場合、上位処理へリターンする。
(ステップS1503)制御情報取得手段232は、統合情報[i]の内部情報と統合情報[i+1]の内部情報のペアと、受付情報の内部情報と理想状態取得手段231が取得した内部情報のペアの、2つのペアをそれぞれベクトル化し、ベクトル間の距離を求め、変数tmpへ代入する。
(ステップS1504)制御情報取得手段232は、最小距離dよりtmpの方が小さい場合、ステップS1505へ、そうでない場合、ステップS1506へ進む。
(ステップS1505)制御情報取得手段232は、最小距離dへtmpを代入し、制御情報Cに統合情報[i]の装置設定情報を代入する。この際、統合情報[i]が操作情報を含む場合、装置設定情報に操作情報を上書きする。
(ステップS1506)制御情報取得手段232は、カウンタiを1だけ増加させ、ステップS1502へ戻る。
以下、本実施の形態における制御装置2の具体的な動作について説明する。
本具体例において、学習情報格納部111に格納されている学習情報は、k最近傍法に基づくモデルであり、図11の統合情報が保存されているものとする。
はじめに、受付部22は、図16の時刻情報、外部情報および内部情報(以下、受付情報)を受け付ける(ステップS1301)。
次に、理想状態取得手段231は、図16の受付情報の時刻情報および外部情報と最も近い状況を、図11の統合情報のうち、操作情報が存在しないものから探し出す(ステップS1302)。この結果、図11の時刻9/23 11:00が最も近いと判定されたとする。この結果、理想状態取得手段231が取得する内部情報は「開発部:28℃」、「会議室:25℃」となる。
次に、制御情報取得手段232は、受付部22が受け付けた内部情報「開発部:28℃」、「会議室:29℃」と、理想状態取得手段231が取得した内部情報「開発部:28℃」、「会議室:25℃」と最も近い2つの統合情報を図11の統合情報から探し出す(ステップS1303)。この結果、図11の9/23 10:00〜11:00が探し出される。そして、図11の9/23 10:00の装置設定情報に操作情報を上書きした情報である、「空調機a:温度26℃」、「空調機b:温度24℃」が制御情報として取得される。
最後に、出力部24は、取得された制御情報である「空調機a:温度26℃」、「空調機b:温度24℃」を出力する。
以上、本実施の形態によれば、過去の様々な情報を利用した学習機能を用いることで、ユーザによる空調機の操作なしに自動的に空調システムを構成する装置を制御することができる。
また、以上、本実施の形態によれば、ユーザの操作が行われた場合を負例と考えることで、各ユーザの熱的快適性を許容範囲に収めるように、空調システムを自動的に制御することができる。
なお、本実施の形態によれば、学習情報格納部111に格納される学習情報は、実施の形態1の「時刻に関する時刻情報と当該時刻情報に対応する外部情報を入力とし、当該外部情報に対する理想的な内部情報を出力とする学習情報」ならば、どのような学習情報を用いても良い。
また、本実施の形態によれば、理想状態取得手段231において、外部情報に「3時間後の気温」等の将来・過去の情報が含まれる場合、時刻情報を用いずに理想的な内部情報を取得しても良い。
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMやUSBメモリなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における制御装置を実現するソフトウェアは、以下のようなプログラムである。
つまり、このプログラムは、2以上の空調機とを有する空調システムを制御する制御プログラムであって、コンピュータがアクセス可能な記憶媒体は、2以上の空調機を有する空調システムを制御するための学習情報、もしくは2以上の外部情報と2以上の内部情報と2以上の装置状態情報と2以上の装置設定情報と1以上の操作情報とを有する2以上の統合情報である学習情報が格納される学習情報格納部を具備し、コンピュータを、少なくとも一の時刻に対応する外部情報および当該一の時刻に対応する内部情報を受け付ける受付部と、前記受付部が受け付けた外部情報、内部情報、装置状態情報および装置設定情報を、前記学習情報に適用し、2以上の各空調機に対する装置設定情報を含む制御情報を生成する制御情報生成部と、前記制御情報を出力する出力部として機能させるためのプログラム。である。
(実施の形態3)
本実施の形態において、1または2以上の熱源と2以上の空調機とを有する空調システムを制御する制御装置3であって、過去のデータから制御情報が適切であるか否かを学習し、その学習結果を用いて、自動的に生成した制御情報の中から最も適切な制御情報を選択する制御装置3について説明する。
本実施の形態における、空調システムは実施の形態2の空調システム(図12)と同様の構成である。ただし、本実施の形態における制御装置3は、図12の制御装置2の制御情報生成部23を図17の制御情報生成部33と置き換えた装置である。すなわち、制御装置3は、格納部11、学習情報格納部111、受付部32、制御情報生成部33、出力部24を備える。さらに、制御情報生成部33は、制御情報候補生成手段331、制御情報判定手段332、制御情報選択手段333を備える。
受付部32は、時刻情報と外部情報と内部情報と装置状態情報を受け付ける。ここで、当該外部情報と当該内部情報と当該装置状態情報は、当該時刻情報によって対応付けられている。
制御情報候補生成手段331は、受付情報から、1以上の制御情報候補を生成する。ここで、受付情報とは、受付部32が受け付けた時刻情報、外部情報、内部情報、および装置状態情報である。制御情報候補生成手段331は、通常、受付情報で表される環境および装置の状態において、実行可能な制御情報を制御情報候補として生成する。例えば、制御情報候補生成手段331は、基礎とする制御情報をもとに、予め定めた一定の範囲で各装置設定を変更することで制御情報候補を生成しても良い。ここで、基礎とする制御情報は、ランダムに設定した装置設定情報を用いても良い。また、予め時刻ごとの平均的な装置設定情報を算出しておき、受付情報の時刻における平均的な装置設定情報を用いても良い。なお、この場合、制御装置3は、図示しない平均装置設定情報格納部を有し、平均的な装置設定情報を平均装置設定情報格納部に格納しているものとする。また、受付部32が装置設定情報をも受け付けるようにし、受け付けた装置設定情報を前記基礎とする制御情報としても良い。また、基礎とする制御情報として直前に生成した制御情報を用いても良い。この場合、制御装置3は、図示しない直前制御情報格納部を具備し、最後に生成した制御情報を格納しているものとする。また、制御情報候補生成手段331は、受付情報の状況において実行可能なすべての制御情報を生成しても良い。
制御情報判定手段332は、学習情報格納部111に格納されている学習情報を用いて、制御情報候補生成手段331が生成した制御情報候補が、正例と負例のいずれに属するかを判定する。ここで、制御情報判定手段332は、当該制御情報候補に加え、受付部32が受け付けた外部情報、内部情報および装置状態情報も判定に用いる。制御情報判定手段332は、ユーザによる空調機の操作が行われなかった時刻の統合情報を「正例」、ユーザによる空調機の操作が行われた時刻の統合情報を「負例」として学習した識別器を用いて判定を行う。
制御情報選択手段333は、制御情報候補生成手段331が生成した制御情報候補のうち、制御情報判定手段332が正例であると判定した制御情報候補から、一の制御情報候補を選択する。
例えば、制御情報選択手段333は、制御情報候補生成手段331が生成した制御情報候補のうち、コストが最小となる制御情報候補を選択することは好適である。ここで、コストとは、例えば、制御情報候補の制御を実行した場合の熱源の総出力や、必要な電力量、電気代および燃料代の総額等である。
次に、制御装置3動作について図18のフローチャートを用いて説明する。
(ステップS1801)受付部32は、時刻に関する時刻情報と、当該時刻情報に対応する外部情報、内部情報および装置状態情報が入力された場合、ステップS1802へ進む、そうでない場合、受付情報が入力されるまで待機する。
(ステップS1802)制御情報候補生成手段331は、受付情報から制御情報候補を生成する。かかる処理を制御情報候補生成処理という。制御情報候補生成処理の詳細について、図19のフローチャートを用いて説明する。
(ステップS1803)制御情報判定手段332と制御情報選択手段333は、ステップS1802で生成した制御情報候補から、1の制御情報を選択する。かかる処理を制御情報選択処理という。制御情報選択処理の詳細について、図20のフローチャートを用いて説明する。
(ステップS1804)出力部24は、制御情報生成部33が生成した制御情報を出力する。
なお、図18のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS1802の制御情報候補生成処理の詳細の具体例について、図19のフローチャートを用いて説明する。
(ステップS1901)制御情報候補生成手段331は、制御情報候補の基礎とする制御情報を取得する。
(ステップS1902)制御情報候補生成手段331は、基礎とする制御情報に対する変更をすべて行った場合、上位処理へリターンし、そうでない場合、ステップS1903へ進む。
(ステップS1903)制御情報候補生成手段331は、基礎とする制御情報から1のパラメータを選択し、当該パラメータの値を変更する。当該パラメータが連続値の場合、制御情報候補生成手段331は、予め定めた範囲の中で基礎とする制御情報のパラメータを変更する。
(ステップS1904)制御情報候補生成手段331は、ステップS1903でパラメータを変更した制御情報が実行可能な場合、ステップS1905へ進み、そうでない場合、ステップS1902へ戻る。
(ステップS1905)制御情報候補生成手段331は、制御情報候補にステップS1903でパラメータを変更した制御情報を制御情報候補に追加する。
次に、ステップS1803の制御情報選択処理の詳細の具体例について、図20のフローチャートを用いて説明する。
(ステップS2001)制御情報選択手段333は、カウンタiを1に、コストeを∞に、制御情報CをステップS1901で取得した基礎とする制御情報に初期化する。
(ステップS2002)制御情報選択手段333は、i番目の制御情報候補が存在する場合、ステップS2003へ、そうでない場合、上位処理へリターンする。
(ステップS2003)制御情報選択手段333は、受付情報と制御情報候補[i]を制御情報判定手段332で判定し、結果が正例であった場合、ステップS2004へ、そうでない場合は、ステップS2007へ進む。
(ステップS2004)制御情報選択手段333は、変数tmpに制御情報候補[i]を実行した場合のコストを代入する。
(ステップS2005)制御情報選択手段333は、コストeよりtmpの方が小さい場合、ステップS2006へ、そうでない場合、ステップS2007へ進む。
(ステップS2006)制御情報選択手段333は、コストeへtmpを代入し、制御情報Cへ制御情報候補[i]を代入する。
(ステップS2007)制御情報選択手段333は、カウンタiを1だけ増加させる。
以下、本実施の形態における制御装置3の具体的な動作について説明する。
本具体例において、学習情報格納部111に格納されている学習情報は、図10のような正例である確率と負例である確率を出力するニューラルネットワークに基づくモデルに関する情報であるとする。
はじめに、受付部32は、図16の時刻情報、外部情報、内部情報および装置状態情報(以下、受付情報)を受け付ける(ステップS1801)。
次に、制御情報候補生成手段331は、基礎とする制御情報として、過去の平均的な制御情報として、「空調機a:温度26℃」、「空調機b:OFF」を取得する(ステップS1901)。
次に、制御情報候補生成手段331は、ステップS1901で取得した基礎とする制御情報の各値を変化させ、制御情報候補を生成する。その結果、制御情報候補生成手段331は、「空調機a:温度26℃、空調機b:OFF」、「空調機a:温度OFF、空調機b:OFF」、「空調機a:温度OFF、空調機b:温度26℃」、「空調機a:温度26℃、空調機b:温度26℃」の4つの制御情報候補が生成したとする。
次に、制御情報選択手段333は、前記の4つの制御情報候補から、先に学習した制御情報判定手段332が正例であると判定し、かつ、コストが最小の制御情報候補を制御情報候補として選択する。ここで、制御情報選択手段333は、受付情報と制御情報候補を制御情報のニューラルネットワークに適用し、正例である確率と負例である確率を取得する、そして、正例である確率の方が負例である確率より高い場合に、正例であると判定する。この結果、「空調機a:温度26℃、空調機b:温度26℃」が選択される。
最後に、出力部24は、選択された制御情報である「空調機a:温度26℃、空調機b:温度26℃」を出力する。
以上、本実施の形態によれば、過去の様々な情報を利用した学習機能を用いることで、ユーザによる空調機の操作なしに自動的に空調システムを構成する装置を制御することができる。
また、以上、本実施の形態によれば、ユーザの操作が行われた場合を負例と考えることで、各ユーザの熱的快適性を許容範囲に収めるように、空調システムを自動的に制御することができる。
なお、本実施の形態によれば、学習情報格納部111に格納される学習情報は、実施の形態1の「時刻情報、外部情報、内部情報、装置状態情報および制御情報を入力とし、当該制御情報が適切か否かを出力とする学習情報」ならば、どのような学習情報を用いても良い。
(実施の形態4)
本実施の形態において、1または2以上の熱源と2以上の空調機とを有する空調システムを制御する制御装置4であって、制御情報を実行した際の報酬を求める制御情報評価部を備えることで、未知の状況に対しても柔軟に対応できる制御装置4について説明する。
本実施の形態における、空調システムは図1の空調システムと同様の構成である。ただし、本実施の形態における制御装置4は、図1の制御情報生成部23を図21の制御情報生成部43と置き換えた構成である。すなわち、制御装置4は、格納部11、学習情報格納部111、受付部32、制御情報生成部43、出力部24を備える。さらに、制御情報生成部43は、制御情報候補生成手段331、制御情報評価手段431、制御情報選択手段432を備える。
制御情報評価手段431は、学習情報格納部111に格納されている学習情報を用いて、制御情報候補生成手段331が生成した制御情報候補の報酬を算出する。ここで、報酬を算出する際、受付部32が受け付けた外部情報、内部情報および装置状態情報も制御情報候補と共に用いる。また、報酬とは、ユーザによる空調機の操作がどの程度行われないかを表す値であり、報酬が高いほど、ユーザによる空調機の操作が行われないことを表す。また、当該学習情報が実施の形態1で示した強化学習によって得られた学習情報である場合、報酬は、当該制御情報を実行した後に得られる将来の報酬まで含む報酬(将来得られる報酬の和の期待値)である。
制御情報選択手段432は、制御情報候補生成手段331が生成した制御情報候補のうち、制御情報評価手段431が算出した報酬が最大となる制御情報候補を選択する。
次に、制御装置4の動作について図22のフローチャートを用いて説明する。
(ステップS2201)受付部32は、時刻に関する時刻情報と、当該時刻情報に対応する外部情報、内部情報および装置設定情報(以下、受付情報)が入力された場合、ステップS2202へ進む、そうでない場合、受付情報が入力されるまで待機する。
(ステップS2202)制御情報候補生成手段331は、受付情報から制御情報候補を生成する。かかる処理は実施の形態3の制御情報候補生成処理と同様である。
(ステップS2203)制御情報選択手段432は、ステップS2202で生成した制御情報候補から、制御情報評価手段431が算出する報酬が最大となる1の制御情報を選択する。かかる処理を報酬最大制御情報選択処理という。報酬最大制御情報選択処理の詳細について、図23のフローチャートを用いて説明する。
(ステップS2204)出力部24は、制御情報生成部43が生成した制御情報を出力する。
なお、図22のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS2203の報酬最大制御情報選択処理の詳細の具体例について、図23のフローチャートを用いて説明する。
(ステップS2301)制御情報選択手段432は、カウンタiを1に、報酬bを−∞に、制御情報Cをnullに設定する。
(ステップS2302)制御情報選択手段432は、i番目の制御情報候補が存在する場合、ステップS2303へ進み、そうでない場合、上位処理へリターンする。
(ステップS2303)制御情報選択手段432は、制御情報評価手段431を用いて、受付部32が受け付けた外部情報、内部情報および装置状態情報において、制御情報候補[i]を実行した際の報酬を算出し、変数tmpへ代入する。
(ステップS2304)制御情報選択手段432は、報酬bがtmpより小さい場合、ステップS2305へ、そうでない場合、ステップS2306へ進む。
(ステップS2305)制御情報選択手段432は、報酬bにtmpを代入し、制御情報Cに制御情報候補[i]を代入する。
(ステップS2306)制御情報選択手段432は、カウンタiを1だけ増加させる。
以上、本実施の形態によれば、過去の様々な情報を利用した学習機能を用いることで、ユーザによる空調機の操作を少なくしつつコストを低減するような空調システムの制御を実現できる。
また、本実施の形態によれば、長期的なコストを少なくしつつ、ユーザによる操作回数を少なくするような空調システムの制御を実現できる。
また、本実施の形態によれば、過去には存在しないような状況にも柔軟に対応できる、制御を行うことができる。
なお、本実施の形態によれば、学習情報格納部111に格納される学習情報は、実施の形態1の「時刻情報、外部情報、内部情報、装置状態情報および制御情報を入力とし、当該制御情報の適切さに関する値を出力とする学習情報」ならば、どのような学習情報を用いても良い。
(実施の形態5)
本実施の形態において、1または2以上の熱源と2以上の空調機とを有する空調システムを制御する制御装置5であって、指定された一定期間の制御情報を出力する制御装置5について説明する。
図24は、本実施の形態における制御装置5のブロック図である。なお、図24の制御装置5は、図12と同様に、1または2以上の熱源6、1または2以上の空調機7、1または2以上の外部情報源8、1または2以上の内部情報源9と接続され空調システムを構成する。
制御装置5は、格納部11、学習情報格納部111、受付部52、制御情報生成部23、出力部54、次時点情報推定部55、生成制御部56を備える。
受付部52は、制御情報を生成する対象の期間である制御情報生成対象期間を受け付ける。ここで、制御情報を生成する対象の期間は、通常、任意の同一ではない2つの時刻からなる。さらに、時刻は通常、月、日、時と分からなる時間である。以後、制御情報生成対象期間の前の時刻を「開始時刻」と、後の時刻を「終了時刻」と呼ぶ。また、受付部52は、制御情報生成対象期間とともに、開始時刻における外部情報、内部情報および装置状態情報を受け付けても良い。
次時点情報推定部55は、時刻に関する時刻情報と、当該時刻情報に対応する日時情報を含む外部情報、内部情報および装置状態情報と、制御情報から、前記時刻情報から一定時間経過した後の時刻である次時点における外部情報、内部情報および装置状態情報を推定する。
次時点情報推定部55は、例えば、外部情報格納部112、内部情報格納部113、装置状態情報格納部114、装置設定情報格納部115および操作情報格納部116を備え、前記格納部に格納されている各情報を予め学習することで実現され得る。具体的には、以下のような方法で次時点情報推定部55は実現され得る。はじめに、実施の形態1で示した統合情報を生成する。この際、統合情報の時刻情報が一定間隔ではない場合、補完処理を行い、時刻情報を一定間隔に変更する。補完処理の詳細については実施の形態1を参照されたし。また、統合情報の時刻の間隔は、制御装置5が出力する制御情報の間隔と等しいものとする。次時点情報推定部55は、統合情報の外部情報、内部情報および装置状態情報と、装置設定情報を操作情報で上書きした情報を入力、当該統合情報の次の時点の統合情報の外部情報、内部情報、装置状態情報を出力として回帰モデルを学習させることで実現できる。ここで、学習器にはニューラルネットワーク、SVR(Support Vector Regression)等、回帰問題を解くことができる学習器ならば何を用いても良い。すなわち、次点情報推定部55は、実施の形態1の内部状態を出力とする場合と同様のモデルと学習方法によって実現することができる。なお、ニューラルネットワークおよびSVRについては、公知技術であるので、詳細な説明を省略する。
生成制御部56は、制御情報生成部23を用いて、次時点情報推定部55が推定した次時点における外部情報、内部情報および装置状態情報から、次時点の制御情報を生成する。さらに、生成制御部56は、次時点情報推定部55を用いて、前記外部情報、前記内部情報、前記装置状態情報および前記制御情報から、次時点からさらに一定時間経過した後の時刻である次々時点の外部情報、内部情報および装置状態情報を推定する。すなわち、生成制御部56は、制御情報生成部23を用いた現在の状態に対する制御情報の生成と、次時点情報推定部55を用いた次時点の情報の推定を繰り返すことで、受付部52が受け付けた制御計画生成対象期間の制御情報を生成する。
出力部54は、生成制御部56が生成した制御情報生成対象期間の制御情報を出力する。出力部54は、生成制御部56が生成した制御情報生成対象期間の制御情報以外に、次時点情報推定部55が推定した外部情報、内部情報および装置状態情報を、制御情報と同時に出力しても良い。
次に、制御装置5の動作について図25のフローチャートを用いて説明する。
(ステップS2501)受付部52は、制御情報生成対象期間が入力された場合、ステップS2502へ進む、そうでない場合、制御情報生成対象期間が入力されるまで待機する。
(ステップS2502)生成制御部56は、時刻tを開始時刻に、現在状態Eを初期状態に、制御情報列Cを?に初期化する。ここで、初期状態は、実施の形態3の制御情報候補生成手段331において、基礎とする制御情報を取得する手法と同様に、ステップS2501で受け付けた開始時刻ともっとも近い外部情報、内部情報および装置状態情報を取得する。また、制御情報列Cは配列(順序付きの多重集合)である。
(ステップS2503)生成制御部56は、時刻tが終了時刻以下の場合、ステップS2504へ、そうでない場合、ステップS2507へ進む。
(ステップS2504)生成制御部56は、制御情報生成部23を用いて、現在状態Eから制御情報を生成し、当該制御情報を制御情報列Cの末尾へ追加する。
(ステップS2505)生成制御部56は、時刻tを予め定めた推定間隔だけ進める。
(ステップS2506)生成制御部56は、次時点情報推定部55を用いて、現在状態EとステップS2504で生成した制御情報から、次の状態を推定し、当該次の状態を現在状態Eへ代入する。
(ステップS2507)出力部54は、制御情報列Cを出力する。
なお、図25のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
以下、本実施の形態における制御装置5の具体的な動作について説明する。
本具体例では、9/23の9:00から12:00を制御情報の生成対象期間とし、制御情報の推定間隔を1時間とする。また、本具体例では、次時点情報推定部55は学習器によって実現し、図11と同様の統合情報を構築し、空調システムに関する情報を学習済みであるとする。
制御装置5の受付部52は、はじめに、制御情報生成対象期間として、9/23の9:00から12:00を受け付ける(ステップS2501)。
次に、生成制御部56は、時刻tを「9/23 9:00」に、現在状態Eを図11と日付が一致する統合情報である「外気温25℃、開発部:気温28℃、会議室:気温28℃、熱源A:電力1500Wh、空調機a:電力150Wh、空調機b:電力0Wh」とし、制御情報列Cを?に初期化する(ステップS2502)。
次に、生成制御部56は、制御情報生成部23を用いて、前記現在状態Eから制御情報「空調機a:温度26℃、空調機b:OFF」を生成し、制御情報列Cへ追加する(ステップS2504)。
次に、生成制御部56は、時刻tを1時間だけ進め、「9/23 10:00」とする(ステップS2505)。
次に、生成制御部56は、次時点情報推定部55を用いて、現在状態E「外気温25℃、開発部:気温28℃、会議室:気温28℃、熱源A:電力1000Wh、空調機a:電力150Wh、空調機b:電力0Wh」と制御情報「空調機a:温度26℃、空調機b:OFF」から、次時点情報「外気温26℃、開発部:気温28℃、会議室:気温29℃、熱源A:電力2000Wh、空調機a:電力150Wh、空調機b:電力0Wh」を推定する。そして、この次時点情報を現在状態Eへ代入する(ステップS2506)。
次に、生成制御部56は、制御情報生成部23を用いて、現在状態E「外気温26℃、開発部:気温28℃、会議室:気温29℃、熱源A:電力2000Wh、空調機a:電力150Wh、空調機b:電力0Wh」から、制御情報「空調機a:温度26℃、空調機b:24℃」を生成し、制御情報列Cへ追加する(ステップS2504)。
次に、生成制御部56は、「時刻tを進める(ステップS2505)」、「次時点情報の推定(ステップS2506)」を行う。
以後、時刻tが終了時刻を超えるまで、「制御情報の生成(ステップS2504)」、「時刻tを進める(ステップS2505)」、「次時点情報の推定(ステップS2506)」を繰り返し実行する。
そして、時刻tが終了時刻を超えた場合、出力部54は、制御情報列Cを出力する(ステップS2507)。
以上、本実施の形態によれば、長期間にわたる空調システムの制御計画を立案することができる。
また、本実施の形態によれば、長期間にわたる空調システムの制御に関するシミュレーションが可能となる。
なお、本実施の形態によれば、制御情報生成部23は、実施の形態3の制御情報生成部33や実施の形態4の制御情報生成部43を用いても良い。
また、本実施の形態によれば、次時点情報推定部55は、制御装置5と接続される外部情報源8の情報をそのまま用いても良い。例えば、ある時刻の外部情報の外気温について、外部の天気情報を提供するWebサービスから直接取得しても良い。
また、本実施の形態によれば、次時点情報推定部55は、物理シミュレーションによって情報を推定しても良い。
また、本実施の形態によれば、次時点情報推定部55は、推定する情報ごとに異なった方法を用いて推定を行っても良い。例えば、外部情報の外気温は天候予測Webページ(外部情報源8)から取得する一方、内部情報の各部屋の温度はニューラルネットワークによって推定しても良い。
また、図26は、本明細書で述べたプログラムを実行して、上述した実施の形態の制御装置2等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。
図26において、コンピュータシステム3000は、CD−ROMドライブ3005を含むコンピュータ3001と、キーボード3002と、マウス3003と、モニタ3004とを備える。
図27は、コンピュータシステム3000の内部構成を示す図である。図26において、コンピュータ3001は、CD−ROMドライブ3005に加えて、MPU(Micro Processing Unit)3011と、ブートアッププログラム等のプログラムを記憶するためのROM3012と、MPU3011に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM3013と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク3014と、MPU3011、ROM3012等を相互に接続するバス3015とを備える。なお、コンピュータ3001は、LANやWAN等への接続を提供する図示しないネットワークカードを含んでいてもよい。
コンピュータシステム3000に、上記実施の形態による制御装置2等の機能を実行させるプログラムは、CD−ROM3021に記憶されて、CD−ROMドライブ3005に挿入され、ハードディスク3014に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ3001に送信され、ハードディスク3014に記憶されてもよい。プログラムは実行の際にRAM3013にロードされる。なお、プログラムは、CD−ROM3021、またはネットワークから直接、ロードされてもよい。また、CD−ROM3021に代えて他の記録媒体(例えば、USBメモリ等)を介して、プログラムがコンピュータシステム3000に読み込まれてもよい。
プログラムは、コンピュータ3001に、上記実施の形態による制御装置2等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能やモジュールを呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム3000がどのように動作するのかについては周知であり、詳細な説明は省略する。
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
以上のように、本発明にかかる制御装置は、過去のデータを用いた学習機能を用いることで、各ユーザの熱的快適性を許容範囲に収めるように、空調システムを自動的に制御することができるという効果を有し、制御装置等として有用である。
1 学習装置
2、3、4、5 制御装置
6 熱源
7 空調機
8 外部情報源
9 内部情報源
11 格納部
111 学習情報格納部
112 外部情報格納部
113 内部情報格納部
114 装置状態情報格納部
115 装置設定情報格納部
116 操作情報格納部
12 学習部
13 蓄積部
22、32、52 受付部
23、33、43 制御情報生成部
231 理想状態取得手段
232 制御情報取得手段
331 制御情報候補生成手段
332 制御情報判定手段
333 制御情報選択手段
431 制御情報評価手段
432 制御情報選択手段
24、54 出力部

Claims (13)

  1. 2以上の空調機を有する空調システムを制御するための学習情報が格納される学習情報格納部と、
    外気温度を含む外部環境情報と、日時に関する日時情報とを有する2以上の外部情報が格納される外部情報格納部と、
    空調機が空気調整する領域を識別する領域識別子と、当該領域の温度を含む内部環境情報と、日時に関する日時情報とを有する2以上の内部情報が格納される内部情報格納部と、
    空調システムを構成する空調機を識別する装置識別子と、当該空調機の状態に関する1以上の状態情報と、日時に関する日時情報とを有する2以上の装置状態情報が格納される装置状態情報格納部と、
    空調システムを構成する空調機を識別する装置識別子と、当該空調機の設定に関する1以上の設定情報と、日時に関する日時情報とを有する2以上の装置設定情報が格納される装置設定情報格納部と、
    空調システムを構成する空調機に対応する装置識別子と、ユーザによる空調機の操作を特定する操作識別子と、日時に関する日時情報とを有する1以上の操作情報が格納される操作情報格納部と、
    前記2以上の外部情報と前記2以上の内部情報と前記2以上の装置状態情報と前記2以上の装置設定情報と前記1以上の操作情報とを有する2以上の統合情報を用いて、時刻に関する時刻情報と当該時刻情報に対応する外部情報、または時刻に関する時刻情報と当該時刻情報に対応する外部情報と当該時刻情報に対応する内部情報と当該時刻情報に対応する装置状態情報と各空調機に対する装置設定情報を含む制御情報を入力とし、各空調機に対する装置設定情報を含む制御情報に関する情報を出力とする学習情報を構成する学習部と、
    前記学習情報を前記学習情報格納部に蓄積する蓄積部とを具備する学習装置。
  2. 前記学習情報格納部には、
    1または2以上の熱源と2以上の空調機とを有する空調システムを制御するための学習情報が格納され、
    前記装置状態情報格納部には、
    熱源を識別する装置識別子と、当該熱源の状態に関する1以上の状態情報と、日時に関する日時情報とを有する1以上の装置状態情報をも格納され、
    前記装置設定情報格納部には、
    熱源を識別する装置識別子と、当該熱源の設定に関する1以上の設定情報と、日時に関する日時情報とを有する1以上の装置設定情報をも格納され、
    前記学習部は、
    前記2以上の外部情報と前記2以上の内部情報と前記3以上の装置状態情報と前記3以上の装置設定情報と前記1以上の操作情報とを有する2以上の統合情報を用いて、時刻に関する時刻情報と当該時刻情報に対応する外部情報、または時刻に関する時刻情報と当該時刻情報に対応する外部情報と当該時刻情報に対応する内部情報と当該時刻情報に対応する装置状態情報と各装置に対する装置設定情報を含む制御情報を入力とし、各装置に対する装置設定情報を含む制御情報に関する情報を出力とする学習情報を構成する請求項1記載の学習装置。
  3. 前記学習部は、
    前記2以上の外部情報、前記2以上の内部情報、前記2以上の装置状態情報、前記2以上の装置設定情報、および前記1以上の操作情報について、
    前記1以上の各操作情報が有する日時情報に対応する外部情報、内部情報、装置状態情報、および装置設定情報である負例と、前記負例以外の日時情報に対応する外部情報、内部情報、装置状態情報、および装置設定情報である正例のうち、少なくとも一部を用いて、学習情報を構成する請求項1または請求項2記載の学習装置。
  4. 前記学習部は、
    深層学習により前記学習情報を構成する請求項1から請求項3いずれか一項に記載の学習装置。
  5. 請求項1から請求項4いずれか一項に記載の学習装置により学習された学習情報、または請求項1から請求項4いずれか一項に記載の2以上の統合情報である学習情報が格納される学習情報格納部と、
    少なくとも一の時刻に対応する外部情報、および当該一の時刻に対応する内部情報を受け付ける受付部と、
    前記受付部が受け付けた情報を、前記学習情報に適用し、2以上の各空調機に対する装置設定情報を含む制御情報を生成する制御情報生成部と、
    前記制御情報を出力する出力部とを具備する制御装置。
  6. 前記制御情報生成部は、
    前記受付部が受け付けた外部情報を、前記学習情報に適用し、内部情報を取得する理想状態取得手段と、
    前記受付部が受け付けた内部情報から、前記理想状態取得手段が取得した内部情報へ近づけるための制御情報を取得する制御情報取得手段とを具備する請求項5記載の制御装置。
  7. 前記受付部は、
    少なくとも一の時刻に対応する外部情報、当該一の時刻に対応する内部情報、および当該一の時刻に対応する装置状態情報を受け付け、
    前記制御情報生成部は、
    前記受付部が受け付けた外部情報、内部情報、および装置状態情報から1以上の制御情報候補を生成する制御情報候補生成手段と、
    前記学習情報を用いて、前記受付部が受け付けた外部情報、内部情報、および装置状態情報と、前記制御情報候補生成手段が生成した制御情報とを組み合わせた情報が正例と負例のいずれに属するかを判定する制御情報判定手段と、
    前記制御情報候補生成手段が生成した制御情報候補のうち、前記制御情報判定手段が正例であると判定した制御情報候補から、一の制御情報候補を選択する制御情報選択手段とを具備し、
    前記出力部は、
    前記制御情報選択手段が選択した一の制御情報候補を制御情報として出力する請求項5記載の制御装置。
  8. 前記受付部は、
    少なくとも一の時刻に対応する外部情報、当該一の時刻に対応する内部情報、および当該一の時刻に対応する装置状態情報を受け付け、
    前記制御情報生成部は、
    前記受付部が受け付けた外部情報、内部情報、および装置状態情報から1以上の制御情報候補を生成する制御情報候補生成手段と、
    前記学習情報を用いて、前記受付部が受け付けた外部情報、内部情報、および装置状態情報と、前記制御情報候補生成手段が生成した制御情報とを組み合わせた情報の報酬を算出する制御情報評価手段と、
    前記制御情報候補生成手段が生成した制御情報候補のうち、前記制御情報評価手段が算出した報酬が最大となる制御情報候補を選択する制御情報選択手段とを具備し、
    前記出力部は、
    前記制御情報選択手段が選択した一の制御情報候補を制御情報として出力する請求項5記載の制御装置。
  9. 一の時刻に対応する外部情報、前記一の時刻に対応する内部情報、および前記一の時刻に対応する装置状態情報と、前記制御情報生成部が生成した制御情報から、前記一の時刻から予め決められた時間が経過した後の時刻である次時点における外部情報、内部情報、および装置状態情報を推定する次時点情報推定部と、
    前記次時点情報推定部が推定した次時点における外部情報、内部情報、および装置状態情報を前記制御情報生成部に与え、次時点の制御情報を生成させ、かつ当該次時点からさらに予め決められた時間が経過した後の時刻である次々時点における外部情報、内部情報、および装置状態情報を生成させる生成制御部をさらに具備し、
    前記受付部は、
    制御情報を生成する対象の期間である制御情報生成対象期間を受け付け、
    前記出力部は、
    前記制御情報生成部が生成した制御情報生成対象期間の制御情報を出力する請求項5から請求項8いずれか一項に記載の制御装置。
  10. 記憶媒体に、
    2以上の空調機を有する空調システムを制御するための学習情報と、
    外気温度を含む外部環境情報と、日時に関する日時情報とを有する2以上の外部情報と、
    空調機が空気調整する領域を識別する領域識別子と、当該領域の温度を含む内部環境情報と、日時に関する日時情報とを有する2以上の内部情報と、
    空調システムを構成する空調機を識別する装置識別子と、当該空調機の状態に関する1以上の状態情報と、日時に関する日時情報とを有する2以上の装置状態情報と、
    空調システムを構成する空調機を識別する装置識別子と、当該空調機の設定に関する1以上の設定情報と、日時に関する日時情報とを有する2以上の装置設定情報と、
    空調システムを構成する空調機に対応する装置識別子と、ユーザによる空調機の操作を特定する操作識別子と、日時に関する日時情報とを有する1以上の操作情報とを格納しており、
    学習部と蓄積部を用いて処理される、2以上の空調機を有する空調システムを制御する方法であって、
    前記学習部が、
    前記2以上の外部情報と前記2以上の内部情報と前記2以上の装置状態情報と前記2以上の装置設定情報と前記1以上の操作情報とを有する2以上の統合情報を用いて、時刻に関する時刻情報と当該時刻情報に対応する外部情報、または時刻に関する時刻情報と当該時刻情報に対応する外部情報と当該時刻情報に対応する内部情報と当該時刻情報に対応する装置状態情報と各空調機に対する装置設定情報を含む制御情報を入力とし、各空調機に対する装置設定情報を含む制御情報に関する情報を出力とする学習情報を構成する学習ステップと、
    前記蓄積部が、
    前記学習情報を蓄積する蓄積ステップとを備える学習方法。
  11. 記憶媒体に、
    請求項10に記載の学習方法により学習された学習情報、または請求項10に記載の2以上の統合情報である学習情報を格納しており、
    受付部、制御情報生成部、および出力部とを用いて処理される、2以上の空調機を有する空調システムを制御する方法であって、
    前記受付部が、
    少なくとも一の時刻に対応する外部情報、および当該一の時刻に対応する内部情報を受け付ける受付ステップと、
    前記制御情報生成部が、
    前記受付部が受け付けた外部情報、内部情報、装置状態情報、および装置設定情報を、前記学習情報に適用し、2以上の各空調機に対する装置設定情報を含む制御情報を生成する制御情報生成ステップと、
    前記出力部が、
    前記制御情報を出力する出力ステップとを備える制御方法。
  12. 2以上の空調機を有する空調システムを制御するための学習プログラムであって、
    コンピュータがアクセス可能な記憶媒体は、
    2以上の空調機を有する空調システムを制御するための学習情報が格納される学習情報格納部と、
    外気温度を含む外部環境情報と、日時に関する日時情報とを有する2以上の外部情報が格納される外部情報格納部と、
    空調機が空気調整する領域を識別する領域識別子と、当該領域の温度を含む内部環境情報と、日時に関する日時情報とを有する2以上の内部情報が格納される内部情報格納部と、
    空調システムを構成する空調機を識別する装置識別子と、当該空調機の状態に関する1以上の状態情報と、日時に関する日時情報とを有する2以上の装置状態情報が格納される装置状態情報格納部と、
    空調システムを構成する空調機を識別する装置識別子と、当該空調機の設定に関する1以上の設定情報と、日時に関する日時情報とを有する2以上の装置設定情報が格納される装置設定情報格納部と、
    空調システムを構成する空調機に対応する装置識別子と、ユーザによる空調機の操作を特定する操作識別子と、日時に関する日時情報とを有する1以上の操作情報が格納される操作情報格納部とを具備し、
    コンピュータを、前記2以上の外部情報と前記2以上の内部情報と前記2以上の装置状態情報と前記2以上の装置設定情報と前記1以上の操作情報とを有する2以上の統合情報を用いて、時刻に関する時刻情報と当該時刻情報に対応する外部情報、または時刻に関する時刻情報と当該時刻情報に対応する外部情報と当該時刻情報に対応する内部情報と当該時刻情報に対応する装置状態情報と各空調機に対する装置設定情報を含む制御情報を入力とし、各空調機に対する装置設定情報を含む制御情報に関する情報を出力とする学習情報を構成する学習部と、
    前記学習情報を前記学習情報格納部に蓄積する蓄積部として機能させるためのプログラム。
  13. 2以上の空調機を有する空調システムを制御する制御プログラムであって、
    コンピュータがアクセス可能な記憶媒体は、
    請求項12のプログラムにより学習された学習情報、または請求項12に記載の2以上の統合情報である学習情報が格納される学習情報格納部を具備し、
    コンピュータを、
    少なくとも一の時刻に対応する外部情報、および当該一の時刻に対応する内部情報を受け付ける受付部と、
    前記受付部が受け付けた外部情報、内部情報、装置状態情報、および装置設定情報を、前記学習情報に適用し、2以上の各空調機に対する装置設定情報を含む制御情報を生成する制御情報生成部と、
    前記制御情報を出力する出力部として機能させるためのプログラム。
JP2016210319A 2016-10-27 2016-10-27 学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム Pending JP2018071853A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016210319A JP2018071853A (ja) 2016-10-27 2016-10-27 学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016210319A JP2018071853A (ja) 2016-10-27 2016-10-27 学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム

Publications (1)

Publication Number Publication Date
JP2018071853A true JP2018071853A (ja) 2018-05-10

Family

ID=62113724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016210319A Pending JP2018071853A (ja) 2016-10-27 2016-10-27 学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム

Country Status (1)

Country Link
JP (1) JP2018071853A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019060514A (ja) * 2017-09-25 2019-04-18 日本電信電話株式会社 空調制御装置、空調制御方法、およびプログラム
JP2020077019A (ja) * 2018-11-05 2020-05-21 日本コンピューターテクノス株式会社 設備制御装置、学習装置、設備制御方法、学習器の生産方法、およびプログラム
JP2020115270A (ja) * 2019-01-17 2020-07-30 株式会社富士通ゼネラル サーバ装置および学習方法
JP2020148385A (ja) * 2019-03-13 2020-09-17 ダイキン工業株式会社 空調制御システム、及び、空調制御方法
WO2020189544A1 (ja) * 2019-03-18 2020-09-24 ダイキン工業株式会社 空調機の予冷運転又は予暖運転の運転条件を決定する機械学習装置
JP2020184118A (ja) * 2019-04-26 2020-11-12 ダイキン工業株式会社 ポンプ台数制御装置、ポンプ台数制御方法、ポンプ台数制御プログラム
CN113614455A (zh) * 2019-03-18 2021-11-05 大金工业株式会社 空调机的预冷运转或预热运转的运转条件确定系统
JPWO2021250770A1 (ja) * 2020-06-09 2021-12-16
JP2022026452A (ja) * 2020-07-31 2022-02-10 ダイキン工業株式会社 空調システム
CN114761732A (zh) * 2019-12-13 2022-07-15 三菱电机株式会社 模型共享系统、模型管理装置以及空调装置的控制装置
JP7244148B1 (ja) 2022-08-25 2023-03-22 cynaps株式会社 換気制御システム、換気制御装置、及び換気制御プログラム
JPWO2023132266A1 (ja) * 2022-01-05 2023-07-13
WO2025074577A1 (ja) * 2023-10-05 2025-04-10 三菱電機株式会社 空気調和システム及び学習装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0544972A (ja) * 1991-08-09 1993-02-23 Matsushita Electric Ind Co Ltd 空気調和機制御装置
JPH05133585A (ja) * 1991-11-12 1993-05-28 Matsushita Electric Ind Co Ltd 空気調和機の制御装置
JP2014194290A (ja) * 2013-03-28 2014-10-09 Fujitsu Advanced Engineering Ltd 空調設定温度算出装置、空調設定温度算出プログラム、及び空調設定温度算出方法
JP2015215659A (ja) * 2014-05-08 2015-12-03 アズビル株式会社 関数生成装置、熱源機器制御装置、空調システム、関数生成方法、および関数生成用プログラム
JP2016065680A (ja) * 2014-09-25 2016-04-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 空調機の制御パラメータ変更方法、制御用設定値表示変更方法、制御パラメータ変更装置、及び制御用設定値表示変更装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0544972A (ja) * 1991-08-09 1993-02-23 Matsushita Electric Ind Co Ltd 空気調和機制御装置
JPH05133585A (ja) * 1991-11-12 1993-05-28 Matsushita Electric Ind Co Ltd 空気調和機の制御装置
JP2014194290A (ja) * 2013-03-28 2014-10-09 Fujitsu Advanced Engineering Ltd 空調設定温度算出装置、空調設定温度算出プログラム、及び空調設定温度算出方法
JP2015215659A (ja) * 2014-05-08 2015-12-03 アズビル株式会社 関数生成装置、熱源機器制御装置、空調システム、関数生成方法、および関数生成用プログラム
JP2016065680A (ja) * 2014-09-25 2016-04-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 空調機の制御パラメータ変更方法、制御用設定値表示変更方法、制御パラメータ変更装置、及び制御用設定値表示変更装置

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019060514A (ja) * 2017-09-25 2019-04-18 日本電信電話株式会社 空調制御装置、空調制御方法、およびプログラム
JP2020077019A (ja) * 2018-11-05 2020-05-21 日本コンピューターテクノス株式会社 設備制御装置、学習装置、設備制御方法、学習器の生産方法、およびプログラム
JP7203374B2 (ja) 2018-11-05 2023-01-13 日本コンピューターテクノス株式会社 設備制御装置、学習装置、設備制御方法、学習器の生産方法、およびプログラム
JP7211096B2 (ja) 2019-01-17 2023-01-24 株式会社富士通ゼネラル サーバ装置および学習方法
JP2020115270A (ja) * 2019-01-17 2020-07-30 株式会社富士通ゼネラル サーバ装置および学習方法
WO2020184454A1 (ja) * 2019-03-13 2020-09-17 ダイキン工業株式会社 空調制御システム、及び、空調制御方法
EP3940306A4 (en) * 2019-03-13 2022-04-27 Daikin Industries, Ltd. Air-conditioning control system and air-conditioning control method
JP2020148385A (ja) * 2019-03-13 2020-09-17 ダイキン工業株式会社 空調制御システム、及び、空調制御方法
JP2020153530A (ja) * 2019-03-18 2020-09-24 ダイキン工業株式会社 空調機の予冷運転又は予暖運転の運転条件を決定する機械学習装置
CN113508268A (zh) * 2019-03-18 2021-10-15 大金工业株式会社 决定空调机的预冷运转或预热运转的运转条件的机械学习装置
CN113614455A (zh) * 2019-03-18 2021-11-05 大金工业株式会社 空调机的预冷运转或预热运转的运转条件确定系统
US11885520B2 (en) 2019-03-18 2024-01-30 Daikin Industries, Ltd. Machine learning apparatus for determining operation condition of precooling operation or preheating operation of air conditioner
WO2020189544A1 (ja) * 2019-03-18 2020-09-24 ダイキン工業株式会社 空調機の予冷運転又は予暖運転の運転条件を決定する機械学習装置
US11525595B2 (en) 2019-03-18 2022-12-13 Daikin Industries, Ltd. System for determining operation condition of precooling operation/preheating operation of air conditioner
JP2020184118A (ja) * 2019-04-26 2020-11-12 ダイキン工業株式会社 ポンプ台数制御装置、ポンプ台数制御方法、ポンプ台数制御プログラム
JP7260770B2 (ja) 2019-04-26 2023-04-19 ダイキン工業株式会社 ポンプ台数制御装置、ポンプ台数制御方法、ポンプ台数制御プログラム
CN114761732A (zh) * 2019-12-13 2022-07-15 三菱电机株式会社 模型共享系统、模型管理装置以及空调装置的控制装置
CN114761732B (zh) * 2019-12-13 2024-03-19 三菱电机株式会社 模型共享系统、模型管理装置以及空调装置的控制装置
WO2021250770A1 (ja) * 2020-06-09 2021-12-16 三菱電機株式会社 空気調和装置の制御のための学習装置および推論装置
JPWO2021250770A1 (ja) * 2020-06-09 2021-12-16
JP7208538B2 (ja) 2020-07-31 2023-01-19 ダイキン工業株式会社 空調システム
JP2022026452A (ja) * 2020-07-31 2022-02-10 ダイキン工業株式会社 空調システム
JPWO2023132266A1 (ja) * 2022-01-05 2023-07-13
WO2023132266A1 (ja) * 2022-01-05 2023-07-13 三菱電機株式会社 学習装置、空調制御システム、推論装置、空調制御装置、学習済みモデルの生成方法、学習済みモデル及びプログラム
JP7570538B2 (ja) 2022-01-05 2024-10-21 三菱電機株式会社 学習装置、空調制御システム、推論装置、空調制御装置、学習済みモデルの生成方法、学習済みモデル及びプログラム
JP7244148B1 (ja) 2022-08-25 2023-03-22 cynaps株式会社 換気制御システム、換気制御装置、及び換気制御プログラム
WO2024043156A1 (ja) * 2022-08-25 2024-02-29 cynaps株式会社 換気制御システム、換気制御装置、換気制御プログラム、温度調節制御システム、温度調節制御装置、及び温度調節制御プログラム
JP2024031139A (ja) * 2022-08-25 2024-03-07 cynaps株式会社 換気制御システム、換気制御装置、及び換気制御プログラム
WO2025074577A1 (ja) * 2023-10-05 2025-04-10 三菱電機株式会社 空気調和システム及び学習装置

Similar Documents

Publication Publication Date Title
JP2018071853A (ja) 学習装置、制御装置、学習方法、制御方法、学習プログラムおよび制御プログラム
US20250045360A1 (en) System for distributed data processing using clustering
Chae et al. Artificial neural network model for forecasting sub-hourly electricity usage in commercial buildings
US11468375B2 (en) System for energy consumption prediction
Moreno et al. Big data: the key to energy efficiency in smart buildings
Li et al. An effective PSO-based hybrid algorithm for multiobjective permutation flow shop scheduling
CA2436352C (en) Process and system for developing a predictive model
Ajdari et al. An adaptive exploration-exploitation algorithm for constructing metamodels in random simulation using a novel sequential experimental design
US20100076913A1 (en) Finding communities and their evolutions in dynamic social network
Zhang et al. Bayesian hybrid collaborative filtering-based residential electricity plan recommender system
WO2014084832A2 (en) Comfort estimation and incentive design for energy efficiency
Raghavendra et al. Artificial humming bird with data science enabled stability prediction model for smart grids
CN102414956A (zh) 用于电力设施使用、监视和管理的系统和方法
US9727653B2 (en) System and method for identifying and ranking user preferences
Xu et al. PSARE: A RL-based online participant selection scheme incorporating area coverage ratio and degree in mobile crowdsensing
WO2022153624A1 (ja) 施策決定支援装置および施策決定支援方法
Scheftelowitsch et al. Multi-objective approaches to Markov decision processes with uncertain transition parameters
Doma et al. Developing a residential occupancy schedule generator based on smart thermostat data
Zeiler et al. Human-in-the-loop energy flexibility integration on a neighbourhood level: Small and Big Data management
Pan et al. Data-driven demand-side energy management approaches based on the smart energy network
CN112952808A (zh) 一种基于分类概率建模和igdt的有源配电网优化运行方法
CN117057852A (zh) 一种基于人工智能技术的互联网营销系统及方法
CN106548301B (zh) 电力用户聚类方法及装置
Maury et al. Savings at home by modifying the energy consumption pattern using gamification, predictive models and Energy Management Systems
Chanpiwat et al. Using cluster analysis and dynamic programming for demand response applied to electricity load in residential homes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210105