CN108687137A

CN108687137A - 整套设备控制装置、轧机控制装置、控制方法及存储介质

Info

Publication number: CN108687137A
Application number: CN201810267684.XA
Authority: CN
Inventors: 服部哲; 高田敬规; 田内佑树
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2017-04-10
Filing date: 2018-03-29
Publication date: 2018-10-23
Anticipated expiration: 2038-03-29
Also published as: CN108687137B; JP2018180799A; JP6813416B2; DE102018204684A1

Abstract

本发明涉及不会使控制对象整套设备的状态恶化而学习针对实际数据的最佳的操作方法的整套设备控制装置、轧机控制装置、整套设备控制方法、轧机控制方法及存储有程序的存储介质。本发明针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制，其中具备：控制方法学习装置，学习控制对象整套设备的实际数据和控制操作的组合；以及控制执行装置，根据学习出的实际数据和控制操作的组合，实施控制对象整套设备的控制，其中控制执行装置具备控制规则执行部、控制输出判定部以及控制输出抑制部，控制方法学习装置具备控制结果良好与否判定部、学习数据制作部以及控制规则学习部。

Description

整套设备控制装置、轧机控制装置、控制方法及存储介质

技术领域

本发明涉及使用神经网络等人工智能技术进行的实时的反馈控制中的、整套设备控制装置及其控制方法、轧机控制装置及其控制方法以及储存有程序的存储介质。

背景技术

以往，在各种整套设备中为了通过其控制而得到期望的控制结果，实施了基于各种控制理论的整套设备控制。

作为整套设备的一个例子，例如在轧机控制中，作为控制的一个例子，作为以对板的起伏状态进行控制的形状控制为对象的控制理论，应用了模糊控制、神经模糊控制。模糊控制被应用于利用冷却剂的形状控制，另外神经模糊控制被应用于森吉米尔轧机的形状控制。其中，如专利文献1所示，求出由形状检测器检测出的实际形状模式和目标形状模式之差与预先设定的基准形状模式的类似比例，利用根据该类似比例将它也由针对预先设定的基准形状模式的控制操作端操作量表现的控制规则，求出针对操作端的控制输出量，从而进行应用了神经模糊控制的形状控制。以下，作为现有技术，使用利用神经模糊控制的森吉米尔轧机的形状控制。

图5示出在专利文献1的图1中记述的森吉米尔轧机的形状控制。在森吉米尔轧机的形状控制中使用神经模糊控制。在该例子中，利用模式识别机构51，根据由形状检测器52检测出的实际形状进行形状的模式识别，运算实际形状最接近预先设定的基准形状模式中的哪个。在控制运算机构53中，使用如图6所示的由针对预先设定的形状模式的控制操作端操作量构成的控制规则来实施控制。如果更具体地叙述图6，则在模式识别机构51中运算由形状检测器52检测出的形状实际结果和目标形状(εref)的差分(Δε)最接近1至8的形状模式(ε)中的哪个，在控制运算机构53中选择1至8的控制方法中的某一个并执行。

但是，在专利文献1的方法中，为了验证控制规则，有时在轧制中让操作人员进行手动操作来进行控制规则的验证等，有时呈现与预想相反的形状变化。即，发生如上述那样确定的控制规则不符合现实的情况。其原因在于机械特性的研究不足、轧机的作业状态、机械条件的变化，但如果一个一个验证预先设定的控制规则是否为最佳的规则，那么应考虑的条件多而是困难的。因此，如果一旦设定了控制规则，只要没有故障，通常会保持原样。

在由于作业条件的变化等而控制规则不符合现实时，由于控制规则是被固定的，所以难以输出某种程度以上的控制精度。另外，一旦形状控制进行了动作，操作人员就不进行手动操作(对于控制而言是干扰)，所以也难以通过操作人员的手动介入而寻找新的控制规则。进而，在对新的标准的轧制材料进行轧制的情况下，也难以与该材料对应地设定控制规则。

如以上所述，在现有的形状控制中，使用预先设定的控制规则来进行控制，所以存在难以修正控制规则的问题。

为了解决该问题，通过如专利文献2所示的一边进行形状控制一边使控制规则随机地变化而学习形状变得良好的规则来进行，从而实现：

1)在轧制中一边实施形状控制一边发现新的控制规则。

2)因为新的控制规则并非预先能够预想的，有时完全预测不到的控制规则是最佳的，所以随机地使控制操作端动作而一边观察对它的控制结果一边寻找。

现有技术文献

专利文献1：日本专利2804161号

专利文献2：日本专利4003733号

发明内容

在上述现有技术中，预先将代表性的形状设定为基准形状模式，根据表示与针对基准波形模式的控制操作端操作量的关系的控制规则来进行控制。关于控制规则的学习也与针对基准波形模式的控制操作端操作量有关，直接使用预先确定的代表性的基准形状模式。因此，存在成为仅对特定的形状模式反应的形状控制的问题。

基准形状模式是人预先根据与作为对象的轧机有关的知识、积蓄了形状实际结果和手动介入操作的经验而确定的，难以网罗在作为对象的轧机以及被轧制材料中发生的所有形状。因此，在发生了与基准形状模式不同的形状的情况下，有时不实施基于形状控制的控制，形状偏差未被抑制而残留，或者误识别为类似的基准形状模式，进行错误的控制操作，反而使形状恶化。

如以上所述，在现有的形状控制中，使用预先设定的基准形状模式和对它的控制规则而学习控制规则来实施控制，所以存在控制精度的提高受限的问题。

根据以上，在本发明中，提供“一种整套设备控制装置，针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制，其特征在于，具备：

控制方法学习装置，学习控制对象整套设备的实际数据和控制操作的组合；以及

控制执行装置，根据学习出的实际数据和控制操作的组合实施控制对象整套设备的控制，

控制执行装置具备：

控制规则执行部，依照控制对象整套设备的实际数据和控制操作的被确定的组合来提供控制输出；

控制输出判定部，判定控制规则执行部能否输出控制输出，并且向控制方法学习装置通知该实际数据和控制操作是错误的；以及

控制输出抑制部，在控制输出判定部判断为在将控制输出输出到控制对象整套设备的情况下控制对象整套设备的实际数据发生恶化的情况下，阻止将控制输出输出到控制对象整套设备，

控制方法学习装置具备：

控制结果良好与否判定部，在控制执行装置将控制输出实际输出到控制对象整套设备的情况下，在直至控制效果表现在实际数据为止的时间延迟之后，判定关于实际数据与控制前相比变得良好还是变得恶化的控制结果的良好与否；

学习数据制作部，使用控制结果良好与否判定部中的控制结果的良好与否和控制输出而得到教师数据；以及

控制规则学习部，将实际数据和教师数据作为学习数据进行学习，

通过控制方法学习装置进行学习，根据控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作控制规则执行部中的控制对象整套设备的实际数据和控制操作的被确定的组合。”。

另外，本发明是“一种轧机控制装置，应用有整套设备控制装置，其特征在于，控制对象整套设备是轧机，实际数据是轧机的输出侧形状。”。

另外，本发明是“一种整套设备控制方法，该整套设备控制方法应用于整套设备控制装置，针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制，其特征在于，所述整套设备控制装置具备：

控制执行装置依照控制对象整套设备的实际数据和控制操作的被确定的组合来提供控制输出，判定能否输出控制输出，向控制方法学习装置通知该实际数据和控制操作是错误的，在判断为在将控制输出输出到控制对象整套设备的情况下控制对象整套设备的实际数据发生恶化的情况下，阻止将控制输出输出到控制对象整套设备，

控制方法学习装置在控制执行装置将控制输出实际输出到控制对象整套设备的情况下，在直至控制效果表现在实际数据为止的时间延迟之后，判定关于实际数据与该控制前相比变得良好还是变得恶化的控制结果的良好与否，使用控制结果的良好与否和控制输出而得到教师数据，将实际数据和教师数据作为学习数据进行学习，从而根据控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作控制执行装置中的控制对象整套设备的实际数据和控制操作的被确定的组合。”。

另外，本发明是“一种轧机控制方法，应用有整套设备控制方法，其特征在于，控制对象整套设备是轧机，实际数据是轧机的输出侧形状。”。

另外，本发明是“一种储存有程序的存储介质，该程序是通过计算机系统实现整套设备控制装置时的程序，所述整套设备控制装置针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制，所述存储介质的特征在于，

计算机系统具备：

所述程序是用于实现所述控制执行装置的处理的、控制规则执行程序、控制输出判定程序以及控制输出抑制程序，其中控制规则执行程序依照控制对象整套设备的实际数据和控制操作的被确定的组合来提供控制输出；控制输出判定程序判定该控制规则执行程序能否输出控制输出，并且向控制方法学习装置通知该实际数据和控制操作是错误的；控制输出抑制程序在该控制输出判定程序判断为在将控制输出输出到控制对象整套设备的情况下控制对象整套设备的所述实际数据发生恶化的情况下，阻止将控制输出输出到所述控制对象整套设备，

所述程序是用于实现所述控制方法学习装置的处理的、控制结果良好与否判定程序、学习数据制作程序以及控制规则学习程序，其中控制结果良好与否判定程序用于实现控制结果良好与否判定的处理，其中在控制执行装置将控制输出实际输出到控制对象整套设备的情况下在直至控制效果表现在实际数据的时间延迟之后判定关于实际数据与该控制前相比变得良好还是变得恶化的控制结果的良好与否；学习数据制作程序使用该控制结果良好与否判定程序中的控制结果的良好与否和控制输出而得到教师数据；控制规则学习程序将实际数据和教师数据作为学习数据进行学习，

通过控制方法学习装置进行学习，根据控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作控制规则执行程序中的控制对象整套设备的实际数据和控制操作的被确定的组合。”。

通过使用本发明，能够在控制中自动地修正在形状控制中使用的形状模式和操作方法的控制规则并设为最佳的。因此，具有提高控制精度、缩短控制部的启动期间、能够应对经年变化等效果。

附图说明

图1是示出本发明的实施例的整套设备控制装置的概要的图。

图2是示出本发明的实施例的控制规则执行部10的具体结构事例的图。

图3是示出本发明的实施例的控制规则学习部11的具体结构事例的图。

图4是示出将本发明使用于森吉米尔轧机的形状控制的情况下的神经网络结构的图。

图5是示出专利文献1的图1中记述的森吉米尔轧机的形状控制的图。

图6是示出专利文献1的图1中记述的森吉米尔轧机的形状控制中的控制规则的图。

图7是示出输入数据制作部2的概要的图。

图8是示出控制输出运算部3的概要的图。

图9是示出控制输出判定部5的概要的图。

图10是示出形状偏差和控制方法的图。

图11是示出控制良好与否判定部6的概要的图。

图12是将控制输出运算部3中的各部分数据、记号的关系整理而示出的图。

图13是示出学习数据制作部7中的处理步骤和处理内容的图。

图14是示出在学习数据数据库DB2中保存的数据例的图。

图15是示出神经网络管理表格TB的例子的图。

图16是示出学习数据数据库DB2的例子的图。

(符号说明)

1：控制对象整套设备；2：控制输入数据制作部；3：控制输出运算部；4：控制输出抑制部；5：控制输出判定部；6：控制结果良好与否判定部；7：学习数据制作部；10：控制规则执行部；11：控制规则学习部；20：控制执行装置；21：控制方法学习装置；DB1：控制规则数据库；DB2：输出判定数据库；DB3：学习数据数据库；Si：实际数据；SO：控制操作量输出；S1：输入数据；S2：控制操作端操作指令；S3：控制操作量；S4：控制操作量输出可否数据；S5：良好与否判定数据；S6：控制结果良好与否数据；S7a、S7b、S7c：教师数据；S8a、S8b、S8c：输入数据(控制规则学习部用)。

具体实施方式

以下，使用附图详细说明本发明的实施例，在此之前，以轧机的形状控制为例子来说明本发明中的想法以及实现本发明的经过。

首先，为了解决本发明中的上述课题，需要：

1)并非预先分别设定基准形状模式和对它的控制操作来学习控制操作方法，学习形状模式和控制操作的组合并使用其来实施控制操作。

为了将其实现，需要使在形状控制中使用的形状模式和控制操作的组合进行变化，变更控制操作以使控制结果变得良好。为此，需要构成能够学习形状模式和控制操作的组合的神经网络，根据控制结果的良好与否，变更针对在轧机中发生的形状模式的神经网络的控制操作的输出。

在一边对作业中的轧机实施形状控制一边实施上述时，有时输出错误的控制输出，所以有时形状恶化而发生板破断等作业异常。在发生板破断时，在轧机中使用的辊的更换中需要时间、轧制中的被轧制材料浪费等损失大。因此，需要尽可能避免对轧机输出错误的控制输出。

根据以上，在本发明中，为了将其实现，例如使用轧机的简单模型等来验证神经网络输出的控制操作的良好与否，避免对轧机的控制操作端输出可以明显认为形状发生恶化的输出来防止形状恶化。此时，关于神经网络，将针对其形状模式的控制操作设为是错误的，而实施学习。

由于有可能控制操作的良好与否的验证方法自身发生错误，所以关于以某概率判断为发生错误的神经网络的控制操作输出，也输出到轧机的控制操作端，从而还能够学习预料以外的形状模式和控制操作的组合。

【实施例1】

图1示出本发明的实施例的整套设备控制装置的概要。图1的整套设备控制装置包括：控制对象整套设备1；控制执行装置20，输入来自控制对象整套设备1的实际数据Si，将依照如图6例示的控制规则(神经网络)确定的控制操作量输出SO提供给控制对象整套设备1而进行控制；控制方法学习装置21，输入来自控制对象整套设备1的实际数据Si等来进行学习，使学习出的控制规则反映到控制执行装置20中的控制规则；多个数据库DB(DB1至DB3)；以及数据库DB的管理表格TB。

控制执行装置20是将控制输入数据制作部2、控制规则执行部10、控制输出运算部3、控制输出抑制部4、控制输出判定部5、控制操作干扰发生部16作为主要的要素而构成的。

其中，在控制执行装置20中，首先根据作为控制对象整套设备1的轧机的实际数据Si，使用控制输入数据制作部2制作控制规则执行部10的输入数据S1。控制规则执行部10使用表现控制对象的实际数据Si和控制操作端操作指令S2的关系的神经网络(控制规则)，根据控制对象的实际数据Si制作控制操作端操作指令S2。在控制输出运算部3中，根据控制操作端操作指令S2，运算向控制操作端的控制操作量S3。由此，根据控制对象整套设备1的实际数据Si，使用神经网络来制作控制操作量S3。

另外，在控制执行装置20内的控制输出判定部5中，使用来自控制对象整套设备1的实际数据Si以及来自控制输出运算部3的控制操作量S3，确定向控制操作端的控制操作量输出可否数据S4。在控制输出抑制部4中，根据控制操作量输出可否数据S4确定可否向控制操作端输出控制操作量S3，将被确定为可输出的控制操作量S3作为提供给控制对象整套设备1的控制操作量输出SO而输出。由此，被判断为异常的控制操作量S3不被输出到控制对象整套设备1。此外，控制操作干扰发生部16为了验证整套设备控制装置，生成干扰，提供给控制对象整套设备1。

如以上所述构成的控制执行装置20为了其处理执行，进而如后所述，参照控制规则数据库DB1以及输出判定数据库DB3。控制规则数据库DB1可访问地连接于控制执行装置20内的控制规则执行部10和后述的控制方法学习装置21内的控制规则学习部11这双方。作为控制规则学习部11中的学习结果的控制规则(神经网络)被储存于控制规则数据库DB1，控制规则执行部10参照在控制规则数据库DB1中储存的控制规则。输出判定数据库DB3可访问地连接于控制执行装置20内的控制输出判定部5。

图2示出本发明的实施例的控制规则执行部10的具体结构事例。控制规则执行部10输入由控制输入数据制作部2制作出的输入数据S1，向控制输出运算部3提供控制操作端操作指令S2。控制规则执行部10具备神经网络101，在神经网络101中基本上通过如图6例示的专利文献1的方法来确定控制操作端操作指令S2。在本发明中，控制规则执行部10还具备神经网络选择部102，通过参照在控制规则数据库DB1中储存的控制规则，选择最佳的控制规则作为神经网络101中的控制规则而开始执行。这样，在图2的控制规则执行部10中，从按操作人员组、控制目的划分的多个神经网络中选择必要的神经网络并使用。在控制规则数据库DB1中，作为来自控制对象整套设备1的数据，可以还包括如能够选择神经网络以及良好与否判定基准那样的实际数据(作业组的数据等)Si。此外，由于存在如果执行神经网络则成为控制规则的关系，所以在本说明书中不区分神经网络和控制规则，以相同的含义来使用。

返回到图1，在控制方法学习装置21中，实施在控制执行装置20中使用的神经网络101的学习。在控制执行装置20对控制对象整套设备1输出控制操作量输出SO的情况下，在控制效果实际地表现为实际数据Si的变化中需要时间。因此，使用使时间延迟与该时间对应的量而得到的数据来实施学习。在图1中，Z^-1表示针对各数据的适当的时间延迟功能。

控制方法学习装置21是将控制结果良好与否判定部6、学习数据制作部7、控制规则学习部11、良好与否判定数据库DB4作为主要的要素而构成的。

其中，控制结果良好与否判定部6使用来自控制对象整套设备1的实际数据Si及实际数据前次值Si0以及在良好与否判定数据库DB4中存储的良好与否判定数据S5，判定实际数据Si朝良好的方向变化、还是朝恶化的方向变化，输出控制结果良好与否数据S6。

在控制方法学习装置21内的学习数据制作部7中，使用将由控制执行装置20制作出的控制操作端操作指令S2、控制操作量S3、控制操作量输出可否数据S4等输入数据分别延迟相同时间而得到的数据和来自控制结果良好与否判定部6的控制结果良好与否数据S6，制作在神经网络的学习中使用的新的教师数据S7a，提供给控制规则学习部11。此外，教师数据S7a是与控制规则执行部10输出的控制操作端操作指令S2对应的数据，学习数据制作部7能够将使用控制结果良好与否判定部6提供的控制结果良好与否数据S6来推测控制规则执行部10输出的控制操作端操作指令S2而得到的数据求出为新的教师数据S7a。

图3示出本发明的实施例的控制规则学习部11的具体结构事例。控制规则学习部11是将输入数据制作部114、教师数据制作部115、神经网络处理部110、神经网络选择部113作为主要的结构要素而构成的。另外，在控制规则学习部11中，作为来自外部的输入，得到使来自输入数据制作部2的输入数据S1延迟时间而成的数据S8a，得到来自学习数据制作部7的新的教师数据S7a，另外参照在控制规则数据库DB1以及学习数据数据库DB2中积蓄的数据。

在控制规则学习部11中，将输入数据S1在补偿适当的时间延迟之后经由输入数据制作部114取入到神经网络处理部110。

另外，在控制规则学习部11中，使来自学习数据制作部7的新的教师数据S7a在教师数据制作部115中为还包括存储于学习数据数据库DB2的过去的教师数据S7b的合计的教师数据S7c而提供给神经网络处理部110。将这些教师数据S7a、S7b适当地存储于学习数据数据库DB2而利用。

同样地，使来自控制输入数据制作部2的输入数据S8a在输入数据制作部114中为还包括存储于学习数据数据库DB2的过去的输入数据S8b的合计的输入数据S8c而提供给神经网络处理部110。将这些输入数据S8a、S8b适当地存储于学习数据数据库DB2而利用。

神经网络处理部110由神经网络111和神经网络学习控制部112构成，神经网络111取入来自输入数据制作装置114的输入数据S8c、来自教师数据制作部115的教师数据S7c、神经网络选择部113选择出的控制规则(神经网络)，将最终确定的神经网络储存于控制规则数据库DB1。

神经网络学习控制部112针对输入数据制作装置114、教师数据制作部115、神经网络选择部113，以适当的定时控制它们而得到神经网络111的输入，另外控制为将处理结果储存于控制规则数据库DB1。

在此，图2的控制执行装置20中的神经网络101和图3的控制方法学习装置21中的神经网络111都是相同概念的神经网络，在对利用上的基本概念上的不同进行说明时，如以下所述。首先，控制执行装置20中的神经网络101是预先确定的内容的神经网络，在提供了输入数据S1时求出作为对应的输出的控制操作端操作指令S2，可以说是利用于一个方向的处理的神经网络。相对于此，控制方法学习装置21中的神经网络111用于在将关于输入数据S1和控制操作端操作指令S2的输入数据S8c、教师数据S7c设定为学习数据时通过学习来求出满足其输入输出关系的神经网络。

如上所述构成的控制方法学习装置21中的基本处理的考虑方法如以下所述。首先，在控制操作量输出可否数据S4的内容为“可”的情况下，向控制对象整套设备1输出控制操作量输出SO，在控制结果良好与否数据S6的内容为“良好”(实际数据Si朝良好的方向变化)的情况下，判断为控制规则执行部10输出的控制操作端操作指令S2正确，以使神经网络的输出成为控制操作端操作指令S2的方式制作学习数据。

另一方面，在控制操作量输出可否数据S4的内容为“否”的情况下，或者在向控制对象整套设备1输出控制操作量输出SO而控制结果良好与否数据S6的内容为“否”(实际数据Si朝恶化的方向变化)的情况下，判断为控制规则执行部10输出的控制操作端操作指令S2发生错误，以不输出神经网络的输出的方式制作学习数据。此时，作为控制输出，以相对相同控制操作端输出+方向、-方向这2种输出的方式构成神经网络输出，以不输出所输出的一侧的控制操作端操作指令S2的方式制作学习数据。

另外，在图3例示的控制规则学习部11中，作为基于神经网络学习控制部112的数据处理的结果，如以下那样处理。在此，首先使用作为使向控制执行装置20的输入数据S1延迟时间而得到的S8c和由教师数据制作部115制作出的教师数据S7c的组合的学习数据，实施用于控制规则执行部10的神经网络101的学习。实际上，在控制规则学习部11内具备与控制规则执行部10的神经网络101相同的神经网络111，在各种条件下进行运用测试来学习此时的响应，作为学习的结果得到确认了产生更良好的结果的控制规则。由于需要使用多个学习数据来进行学习，所以从积蓄了过去制作出的学习数据的学习数据数据库DB2中取出多个过去的学习数据来实施学习处理，并且将本次的学习数据储存于学习数据数据库DB2。另外，学习出的神经网络为了由控制规则执行部10利用而被储存于控制规则数据库DB1。

在神经网络的学习中，既可以每当制作新的学习数据时将过去的学习数据一起使用来学习，也可以在将学习数据积蓄某种程度(例如100个)之后将过去的学习数据一起使用来学习。

另外，在控制结果良好与否判定部6中，根据来自良好与否判定数据库DB4的良好与否判定基准，实施良好与否判定。在控制结果的良好与否判定中，由于根据控制目的而判断结果不同，所以制作与多个控制目的对应的多个神经网络，即使输入数据相同也根据控制目的分别制作教师数据来学习，从而针对1次量的输入数据制作多个教师数据而用于与各个教师数据对应的神经网络的学习，由此能够同时学习与多个控制目的对应的神经网络。在此，多个控制目的是指，例如在形状控制的情况下想在板宽方向上优先地控制哪部分(板端部、中央部、非对称部等)、想优先地控制多个控制对象项目(例如板厚和张力、轧制荷重等)中的任意项目等。

在构成为如上所述的情况下，一旦用于控制规则执行部10的神经网络101进行学习时，就不实施新的控制操作。因此，利用控制操作干扰发生部16适时使新的操作方法随机地发生，施加于控制操作量S3来执行控制操作，从而学习新的控制方法。

以下，以专利文献1所示的森吉米尔轧机中的形状控制为对象，详细说明本整套设备控制方法。此外，关于形状控制，采用下述的规格A、B来说明。

规格A是关于优先级的规格，设为具有板宽方向的优先级的信息。例如，在形状控制中，经常在机械特性上难以在整个板宽方向上控制为目标值。因此，在板宽方向上设置下述2个关于优先级的规格A1、A2。其中，关于优先级的规格A1是“使板端部优先”，关于优先级的规格A2是“使中央部优先”，实施依照A1、A2这样的2个优先次序的控制。在实施控制的情况下，考虑关于优先级的规格A1或者A2中的任意规格。

规格B是关于应对预先判明的条件的规格。如果举出一个例子，则形状模式和控制方法的关系由于在各种条件下变化，所以被认为需要例如通过将规格B1设为板宽、将规格B2设为钢种类的划分来分开。由于上述分别发生变化，所以对形状操作端的形状的影响程度发生变化。

在该事例中，控制对象整套设备1是森吉米尔轧机，实际数据为形状实际结果。此外，森吉米尔轧机是用于对不锈钢等硬的材料进行冷轧的具有多辊的轧机。在森吉米尔轧机中，为了对硬的材料提供强轧制而使用小径的工作辊。因此，难以得到平坦的钢板。作为其对策，采用多辊的构造、各种形状控制部。在森吉米尔轧机中，一般而言，上下的第1中间辊具有单锥，除了能够移位以外，还上下具备6个分割辊和2个被称为AS-U的辊。在以下说明的事例中，作为形状的实际数据Si，使用形状检测器的检测数据，进而作为输入数据S1，使用作为与目标形状之差的形状偏差。另外，作为控制操作量S3，设为#1～#n的AS-U、上下的第1中间辊的辊移动量。

图4示出在森吉米尔轧机的形状控制中使用的情况下的神经网络结构。在此，作为神经网络，在用于控制规则执行部10时是神经网络101，在用于控制规则学习部11时表示神经网络111所示的神经网络，但构造都相同。

在图4所示的森吉米尔轧机的形状控制的事例中，来自控制对象整套设备1的实际数据Si是包括形状检测器的数据(在此设为作为实际形状和目标形状之差的形状偏差被输出的数据)的森吉米尔轧机的实际数据，在控制输入数据制作部2中，作为输入数据S1，得到标准化形状偏差201、形状偏差等级202。由此，神经网络101、111的输入层由标准化形状偏差201、形状偏差等级202构成。此外，在图4中，将形状偏差等级202作为向神经网络输入层的输入，但也可以根据等级来切换神经网络。

另外，输出层与作为森吉米尔轧机的形状控制操作端的AS-U、第1中间辊对应地由AS-U操作程度301和第1中间操作程度302构成。在各自的操作程度中，关于AS-U，对于各AS-U具有AS-U开方向(辊隙(轧机的上下作业辊间的间隔)敞开的方向)、AS-U闭方向(辊隙关闭的方向)。另外，关于第1中间辊，对于上下第1中间辊具有第1中间辊开方向(第1中间辊以轧机中心朝向外侧动作的方向)、第1中间辊闭方向(第1中间辊朝向轧机中心侧动作的方向)。例如，在形状检测器为20个分区且将形状偏差等级202设为3个等级(大、中、小)的情况下，输入层为23个输入。另外，在AS-U的座板是7块且上下第1中间辊能够在板宽方向上移位时，输出层为14个AS-U操作程度301、4个1中间操作程度的合计18个。适时地设定中间层的层数以及各层的神经元数。此外，虽然参照图8来后述，关于作为输出层的森吉米尔轧机的形状控制操作端，以相对各个控制操作端输出+方向、-方向这2种输出的方式构成神经网络输出。

图10示出形状偏差和控制方法。在此，在图10的上部，示出在形状偏差大的情况下的控制方法，在图10的下部，示出在形状偏差小的情况下的控制方法。此外，高度方向是形状偏差的大小，横轴方向是板宽方向，板宽的两侧表示板端部，中央表示板中央部。如该图10的上部所示，在形状偏差大的情况下，相比于板宽方向的局部的形状偏差，优先修正整体的形状。另一方面，如图10的下部所示，在形状偏差小的情况下，优先减小局部的形状偏差。

这样，需要根据形状偏差的大小变更控制方法，所以如图4所示设置形状偏差等级202并提供给神经网络101、111，判定形状偏差的大小。关于形状偏差，无论形状偏差的大小如何，例如都使用标准化为0～1的结果即可。这是一个例子，既可以考虑不对形状偏差进行标准化而直接输入到神经网络的输入层，也可以考虑根据形状偏差的大小变更神经网络自身(例如准备2个神经网络，区分在形状偏差大的情况下使用的神经网络和在形状偏差小的情况下使用的神经网络)。

使以上说明的如图4的结构的神经网络101、111学习针对形状模式的操作方法，使用学习出的神经网络来实施形状控制。即使是相同结构的神经网络，也能够根据学习出的条件而具有不同的特性并针对相同形状模式输出不同的控制输出。

因此，通过根据形状实际数据的其他条件而分开使用多个神经网络，能够针对各种条件构成最佳的控制。这是针对规格B的对应。先前说明的图2的结构表示进行上述规格的情况下的具体例。在图2的结构事例中，针对用于控制规则执行部10的神经网络101，根据轧制实际情况、轧机操作人员名、被轧制材料的钢种类、板宽等准备单独的神经网络，登记到控制规则数据库DB1。在神经网络选择部102中，选择与该时间点的条件匹配的神经网络并设定为控制规则执行部10的神经网络101。此外，作为神经网络选择部102中的该时间点的条件，可以从控制对象整套设备1中的实际数据Si中取入板宽的数据，与其对应地选择神经网络。另外，如果在此使用的多个神经网络具有如图4所示的输入层、输出层，则中间层的层数、各层的单元数也可以不同。

图7示出制作用于输入到神经网络101、111的输入层的数据S1(标准化形状偏差201、形状偏差等级202)的控制输入数据制作部2的概要。在此，作为实际数据Si，将检测控制对象整套设备1即森吉米尔轧机中的轧制时的板形状的、形状检测器的形状检测器数据作为输入，首先利用形状偏差PP值运算装置210求出作为各形状检测器分区的检测结果的最大值和最小值之差的形状偏差PP值(Peak To Peak值，峰至峰值)S_PP。在形状偏差等级运算装置211中，根据形状偏差PP值S_PP将形状偏差分类为大、中、小这3个等级。形状为被轧制材料的延展率的板宽方向分布，将以10-5单位表示延展率的I-UNIT用作单位。例如，如下式那样分类。

在此，以如下方式分类：通过(1)式的成立，形状偏差等级成为(大＝1、中＝0、小＝0)，通过(2)式的成立，形状偏差等级成为(大＝0、中＝1、小＝0)，通过(3)式的成立，形状偏差等级成为(大＝0、中＝0、小＝1)。此外，在此关于各分区的形状偏差，使用设为S_PM＝S_PP的S_PM来实施标准化。

【式1】

S_PP≥50I-UNIT…(1)

【式2】

50I-UNIT＞S_PP≥10I-UNIT…(2)

【式3】

10I-UNIT＞S_PP…(3)

如以上所述，制作作为向神经网络101的输入数据的标准化形状偏差201以及形状偏差等级202。标准化形状偏差201以及形状偏差等级202是控制规则执行部10的输入数据S1。

图8示出控制输出运算部3的概要。控制输出运算部3根据来自控制规则执行部10内的神经网络101的输出即控制操作端操作指令S2(在森吉米尔轧机的形状控制的事例中AS-U操作程度301、第1中间操作程度302与其相当)，制作作为向各形状控制操作端的操作指令的控制操作量S3。此外，在此关于存在多个的AS-U操作程度301、第1中间操作程度302，示出了各1个数据例，各数据由开方向程度和闭方向程度的一对数据构成。

在控制输出运算部3内，输入的AS-U操作程度301具有各AS-U开方向、闭方向的输出，所以通过对它们的差乘以变换增益G_ASU来输出向各AS-U的操作指令。由于向各AS-U的控制输出是AS-U位置变更量(单位是长度)，所以变换增益G_ASU是从程度向位置变更量的变换增益。

另外，同样输入的第1中间操作程度302具有第1中间外侧、内侧的输出，所以通过对它们的差乘以变换增益G_1ST来输出向各第1中间辊移位的操作指令。由于向各第1中间辊的控制输出是第1中间辊移位位置变更量(单位是长度)，所以变换增益G_1ST是从程度向位置变更量的变换增益。

通过以上，能够运算控制操作量S3。控制操作量S3由#1～#nAS-U位置变更量(n基于AS-U辊的座板数)和上第1中间移位位置变更量、下第1中间移位位置变更量构成。此外，在图8中，图示了将来自控制操作干扰发生部16的干扰数据施加于控制操作端操作指令S2的系统。

图9示出控制输出判定部5的概要。控制输出判定部5由轧制现象模型501和形状修正良好与否判定部502构成，得到来自控制对象整套设备1的实际数据Si、来自控制输出运算部3的控制操作量S3以及输出判定数据库DB3的信息，提供向控制操作端的控制操作量输出可否数据S4。通过上述结构，在控制输出判定部5中，通过将控制输出运算部3运算出的控制操作量S3输出到作为控制对象整套设备1的轧机的情况下的形状的变化输入到已知的控制对象整套设备1的模型(在图9的实施例的情况下为轧制现象模型501)来进行预测，在预想为形状恶化的情况下，抑制控制操作量输出SO，防止形状大幅恶化。

如果更详细地叙述，则将控制操作量S3输入到轧制现象模型501来预测基于控制操作量S3的形状变化，运算形状偏差修正量预测数据503。另一方面，通过对来自控制对象整套设备1的形状检测器数据Si(当前时间点的形状偏差实际数据504)相加形状偏差修正量预测数据503而得到形状偏差预测数据505，通过评价形状偏差预测数据505，能够预测在将控制操作量S3输出到控制对象整套设备1时形状如何变化。根据现状的形状偏差实际数据504和形状偏差预测数据505，在形状修正良好与否判定部502中判定形状朝良好的方向变化、还是形状朝恶化的方向变化，得到控制操作量输出可否数据S4。

在形状修正良好与否判定部502中，具体而言如以下所述进行形状修正的良好与否判定。首先，如关于形状控制的优先级的规格A1、A2所示，考虑板宽方向上的控制优先级，所以在输出判定数据库DB3中对规格A1、规格A2的各规格设定板宽方向的权重系数w(i)。使用其，例如使用下述的(4)式的评价函数J来判定形状变化的良好与否。此外，在(4)式中，w(i)是权重系数，εfb(i)是形状偏差实际504，εest(i)是形状偏差预测505，i是形状检测器分区，rand是随机数项。

【式4】

在使用(4)式的评价函数J的情况下，形状变良好时评价函数J为正，形状变恶化时评价函数J为负。另外，rand是随机数项，使评价函数J的评价结果随机地变化。由此，即使在形状恶化的情况下，作为评价函数J仍有变为正的情况发生，所以关于轧制现象模型501不正确的情况也能够学习形状模式和控制方法的关系。在此，以如试运转当初那样控制对象整套设备1的模型不可靠的情况下增大最大值、想以某程度学习控制方法来实施稳定的控制的情况下设为0的方式适时地变更rand。

在形状修正良好与否判定部502中，运算评价函数J，以在J≥0时设为控制操作量输出可否数据S4＝1(可)、在J<0时设为控制操作量输出可否数据S4＝0(否)的方式，输出控制操作量输出可否数据S4。

在控制输出抑制部4中，根据作为控制输出判定部5的判定结果的控制操作量输出可否数据S4，确定有无向控制对象整套设备1输出控制操作量输出SO。控制操作量输出可否数据S4是#1～#nAS-U位置变更量输出、上第1中间移位位置变更量输出、下第1中间移位位置变更量输出，通过如下来确定。

IF(控制操作量输出可否数据S4＝0)THEN

#1～#nAS-U位置变更量输出＝0

上第1中间移位位置变更量输出＝0

下第1中间移位位置变更量输出＝0

ELSE

#1～#nAS-U位置变更量输出＝#1～#nAS-U位置变更量

上第1中间移位位置变更量输出＝上第1中间移位位置变更量

下第1中间移位位置变更量输出＝下第1中间移位位置变更量

ENDIF

在控制执行装置20中，根据来自控制对象整套设备1(轧机)的实际数据Si执行上述运算，将控制操作量输出SO输出到控制对象整套设备1(轧机)，从而实施形状控制。

接下来，说明控制方法学习装置21的动作概要。在控制方法学习装置21中，使用在控制执行装置20中使用的数据的时间延迟数据。时间延迟Z^-1意味着e^-TS，表示延迟预先设定的时间T。控制对象整套设备1具有时间响应，所以根据控制操作量输出SO而在实际数据发生变化以前存在时间延迟。因此，使用在执行控制操作之后经过延迟时间T的时间点的实际数据来实施学习。在形状控制中，在针对AS-U、第1中间辊的操作指令输出后至形状计检测到形状变化为止，需要几秒，所以可以设定为T＝2至3秒左右(延迟时间还根据形状检测器的种类、轧制速度而变化，所以只要将控制操作端的变更成为形状变化为止的最佳的时间设定为T即可)。

图11示出控制良好与否判定部6的动作概要。在形状变化良好与否判定部602中使用下式的良好与否判定评价函数J_C。

【式5】

此外，在(5)式中，εfb(i)是在实际数据Si中包含的形状偏差实际数据，εlast(i)是形状偏差实际数据前次值，wC(i)是良好与否判定用的板宽方向权重系数。在此，基于良好与否判定数据库DB4，根据关于控制的优先级的规格A1、A2设定良好与否判定用的权重系数wC(i)。利用良好与否判定评价函数Jc判定控制结果是否良好。另外，关于作为控制输出判定部5的判定结果的控制操作量输出可否数据S4为0(控制输出不可)的情况，虽然实际向控制对象整套设备1的控制操作量输出＝0，但仍判断为形状恶化。

在此，在控制操作量输出可否数据S4＝0的情况下，设为控制结果良好与否数据S6＝-1。另外，根据阈值条件(LCU≥0≥LCL)，预先设定阈值上限LCU和阈值加减LCL。此时，与良好与否判定评价函数Jc的比较的结果如果是Jc>LCU，则设为控制结果良好与否数据S6＝-1(形状恶化)，如果是LCU≥Jc≥0，则设为控制结果良好与否数据S6＝0(形状朝恶化的方向变化)，如果是0>Jc≥LCL，则设为控制结果良好与否数据S6＝1(形状朝良好的方向变化)，如果是Jc<LCL，则设为控制结果良好与否数据S6＝0(形状良好)。

在此，控制结果良好与否数据S6＝-1表示由于形状恶化而抑制所输出的控制输出的情况，控制结果良好与否数据S6＝0表示由于无形状变化或者形状良好而保持所输出的控制输出的情况，控制结果良好与否数据S6＝1表示虽然形状朝良好的方向变化但有进一步变良好的可能性而使所输出的控制量增大的情况。

这样，根据关于控制的优先级的规格A1、A2，板宽方向的权重系数wC(i)发生变化，所以良好与否判定评价函数Jc不同。因此，被认为控制结果良好与否数据S6的判定结果也不同。因此，在控制方法学习装置21中，对关于控制的优先级的规格A1、A2这2种实施控制结果良好与否数据S6的判定。

接下来，说明学习数据制作部7的概要。如图1所示，在学习数据制作部7中，根据来自控制结果良好与否判定部6的判定结果(控制结果良好与否数据S6)，利用控制操作端操作指令S2、控制操作量S3、控制输出抑制部的判定结果(控制操作量输出可否数据S4)，制作针对在控制规则学习部11中使用的神经网络111的教师数据S7a。

该情况的教师数据S7a为图4所示的来自神经网络111的输出层的输出即AS-U操作程度301、1中间操作程度302。学习数据制作部7使用作为神经网络101的输出的控制操作端操作指令S2(AS-U操作程度301、1中间操作程度301)和作为控制操作量输出SO的#1～#nAS-U位置变更量输出、上第1中间移位位置变更量输出、下第1中间移位位置变更量输出，制作针对在控制规则学习部11中使用的神经网络111的教师数据S7a。

在说明学习数据制作部7的动作概要时，将图8的控制输出运算部3中的各部分数据、记号的关系整理为图12。在此，关于作为神经网络101的输出的控制操作端操作指令S2，代表性地示出AS-U操作程度301，将操作程度正侧的数据设为OPref，将操作程度负侧的数据设为OMref，将来自控制操作干扰发生部16的随机发生的操作程度设为操作程度随机数Oref，将变换增益设为G，将控制操作量输出SO设为Cref而进行说明。这样，在此为了简化，将来自控制规则执行部10的神经网络101的输出层的输出设为操作程度正侧以及操作程度负侧，将来自控制操作干扰发生部16的随机发生的操作程度设为操作程度随机数。另外，将针对控制操作端的控制操作量输出SO设为操作指令值。

图13示出学习数据制作部7中的处理步骤和处理内容。在此，如果依照图12的记号的约定来进行说明，则在最初的处理步骤71中利用(6)式求出操作指令值Cref。

【式6】

Cref＝G·(OPref-OMref+ORref)…(6)

在接下来的处理步骤72中，根据控制结果良好与否数据S6修正操作指令值Cref而设为C′ref。具体而言，在控制结果良好与否数据S6＝-1时利用(7)式、在控制结果良好与否数据S6＝0时利用(8)式、在控制结果良好与否数据S6＝1时利用(9)式，设为操作指令值Cref的修正值C′ref。

【式7】

【式8】

C′ref＝Cref…(8)

【式9】

在处理步骤73中，根据修正后的操作指令值C′ref，利用(10)、(11)式求出操作程度修正量ΔOref。

【式10】

C′ref＝G·((OPref+ΔOref)-(OMref-ΔOref))…(10)

【式11】

在处理步骤74中，利用(12)式求出针对神经网络111的教师数据OP′ref、OM′ref。

【式12】

这样在学习数据制作部7中，如图12所示，针对实际对控制对象整套设备1输出的操作指令值Cref，根据作为控制结果良好与否判定部6中的判定结果的控制结果良好与否数据S6，运算操作指令值修正值C′ref。具体而言，在控制结果良好与否数据S6＝1的情况下，控制方向是OK，但在判断为控制输出不足的情况下，使操作指令值向相同方向增加ΔCref。反之，在控制结果良好与否数据S6＝-1的情况下，在判断为控制方向发生错误的情况下，使操作指令值向相反方向减少ΔCref。变换增益G由于是预先设定的，因此是已知的，所以如果知道操作程度正侧以及操作程度负侧的值，则能够求出修正量ΔOref。在此，预先利用仿真等求出适当的值来设定ΔCref。通过以上的步骤，能够利用上述(12)式求出在控制规则学习部11中使用的教师数据OP′ref、OM′ref。

此外，在图13中以简单的事例进行了说明，但实际上实施针对#1～#nAS-U的AS-U操作程度301以及针对上第1中间辊移位、下第1中间辊移位的第1中间操作程度302的全部，设为在控制规则学习部11中使用的神经网络111的教师数据(AS-U操作程度教师数据、1中间操作程度教师数据)。

图14示出在学习数据数据库DB2中保存的数据例。为了学习神经网络111，需要许多输入数据S8a和教师数据S7a的组合。因此，将由学习数据制作部7制作出的教师数据S7a(AS-U操作程度教师数据、第1中间操作程度)与在控制执行装置20中输入到控制规则执行部10的输入数据S1(标准化形状偏差201以及形状偏差等级)的时间延迟数据S8a组合而作为一组学习数据，保存到学习数据数据库DB2。

此外，在图1的整套设备控制装置中使用各种数据库DB1、DB2、DB3、DB4，图15示出用于对各数据库DB1、DB2、DB3、DB4进行关联地管理运用的神经网络管理表格TB的结构。管理表格TB具备规格的管理表格。具体而言，在管理表格TB中，根据(B1)板宽、(B2)钢种类以及关于控制的优先级的规格A1、A2来划分规格。作为(B1)板宽，例如使用3英尺宽、公尺宽、4英尺宽、5英尺宽这4个划分，作为钢种类，使用钢种类(1)～钢种类(10)这10个划分程度。另外，对于关于控制的优先级的规格A，设为A1以及A2这2种。在该情况下，设为80个划分，根据轧制条件分开使用80个神经网络。

神经网络学习控制部112依照图15的神经网络管理表格TB将如图14所示的作为输入数据以及教师数据的组合的学习数据与相应的神经网络No.(编号)关联起来，储存于如图16所示的学习数据数据库DB2。

控制执行装置20对控制对象整套设备1执行形状控制时，制作2组学习数据。其原因为，针对相同的输入数据、控制输出，使用关于控制的优先级的规格A1以及规格A2这2个评价基准来进行控制结果良好与否判定，所以制作2种教师数据。如果教师数据被积蓄某种程度(例如200组)、或者新积蓄到学习数据数据库DB2，则神经网络学习控制部112指示神经网络111的学习。

在控制规则数据库DB1中，依照如图15所示的管理表格TB，储存有多个神经网络，在神经网络学习控制部112中指定需要学习的神经网络No.，神经网络选择部113从控制规则数据库DB1中取出该神经网络，设定为神经网络111。神经网络学习控制部112对输入数据制作部114以及教师数据制作部115指示从学习数据数据库DB2中取出与该神经网络对应的输入数据以及教师数据，使用它们来实施神经网络111的学习。此外，关于神经网络的学习方法，提出了各种方法，也可以使用任意的方法。

在神经网络111的学习完成时，神经网络学习控制部112将作为学习结果的神经网络111写回到控制规则数据库DB1的该神经网络No.的位置，从而学习完成。

学习既可以针对在图15中定义的所有神经网络以固定时间间隔(例如每日)一起实施，也可以仅使新的学习数据被积蓄某种程度(例如100组)的神经网络No.的神经网络在该时间点学习。

以上，无需大幅打乱作为控制对象整套设备1的轧机的形状而能够实现：

1)并非预先分别设定基准形状模式和针对其的控制操作来学习控制操作方法，而是学习形状模式和控制操作的组合并使用它来实施控制操作。

2)因为新的控制规则并非预先能够预想的，有时完全预测不到的控制规则是最佳的，所以随机地使控制操作端动作并一边观察对它的控制结果一边寻找。

此外，在控制规则数据库DB1中储存在控制执行装置20中使用的神经网络，但如果所储存的神经网络是仅随机地实施初始化处理而得到的，则使神经网络的学习进行，直至能够进行相应的控制为止花费时间。因此，在对控制对象整套设备1构筑了控制部时，根据在该时间点判明的控制对象整套设备1的控制模型预先利用仿真实施控制规则的学习，将仿真器中的学习完成的神经网络储存于数据库，能够从控制对象整套设备的启动当初起实施某种程度的性能的控制。

本发明的整套设备控制装置实际被实现为计算机系统，但在该情况下在计算机系统内形成多个程序群，其中这些程序群也可以储存于存储介质。

这些程序群例如是用于实现控制执行装置的处理的、控制规则执行程序、控制输出判定程序以及控制输出抑制程序，其中控制规则执行程序依照控制对象整套设备的实际数据和控制操作的被确定的组合来提供控制输出；控制输出判定程序判定控制规则执行程序能否输出控制输出，并且向控制方法学习装置通知该实际数据和控制操作是错误的；控制输出抑制程序在控制输出判定程序判断为在将控制输出输出到控制对象整套设备的情况下控制对象整套设备的所述实际数据发生恶化的情况下，阻止将控制输出输出到所述控制对象整套设备，这些程序群例如是用于实现控制方法学习装置的处理的、控制结果良好与否判定程序、学习数据制作程序以及控制规则学习程序，其中控制结果良好与否判定程序用于实现控制结果良好与否判定的处理，其中在控制执行装置将控制输出实际输出到控制对象整套设备的情况下在直至控制效果表现在实际数据的时间延迟之后判定关于实际数据与该控制前相比变得良好还是变得恶化的控制结果的良好与否；学习数据制作程序使用该控制结果良好与否判定程序中的控制结果的良好与否和控制输出而得到教师数据；控制规则学习程序将实际数据和教师数据作为学习数据进行学习。

另外，通过控制方法学习装置进行学习，根据控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作控制规则执行程序中的控制对象整套设备的实际数据和控制操作的被确定的组合。

此外，在将本发明装置应用于实际整套设备时需要确定神经网络的初始值，关于这点，可以在实施控制对象整套设备中的控制之前使用控制对象整套设备的控制模型通过仿真制作实际数据和控制操作的组合，缩短控制对象整套设备中的实际数据和控制操作的组合的学习期间。

产业上的可利用性

本发明例如涉及作为轧制装置之一的轧机的控制方法以及部分，在实际应用时并无特别的问题。

Claims

1.一种整套设备控制装置，针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制，其特征在于，具备：

控制执行装置，根据学习出的所述实际数据和控制操作的组合实施控制对象整套设备的控制，

所述控制执行装置具备：

控制规则执行部，依照控制对象整套设备的实际数据和控制操作的被确定的组合，提供控制输出；

控制输出判定部，判定该控制规则执行部能否输出控制输出，并且向所述控制方法学习装置通知该实际数据和控制操作是错误的；以及

控制输出抑制部，在该控制输出判定部判断为在将控制输出输出到所述控制对象整套设备的情况下所述控制对象整套设备的所述实际数据发生恶化的情况下，阻止将控制输出输出到所述控制对象整套设备，

所述控制方法学习装置具备：

控制结果良好与否判定部，在所述控制执行装置将控制输出实际输出到控制对象整套设备的情况下，在直至控制效果表现在实际数据为止的时间延迟之后，判定关于实际数据与控制前相比变得良好还是变得恶化的控制结果的良好与否；

学习数据制作部，使用该控制结果良好与否判定部中的控制结果的良好与否和所述控制输出而得到教师数据；以及

控制规则学习部，将所述实际数据和所述教师数据作为学习数据进行学习，

通过所述控制方法学习装置进行学习，根据所述控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作所述控制规则执行部中的控制对象整套设备的实际数据和控制操作的被确定的组合。

2.根据权利要求1所述的整套设备控制装置，其特征在于，

为了根据控制对象整套设备的实际数据的大小来更换实际数据和控制操作的组合，使用与实际数据的大小有关的信息和易于对实际数据进行标准化来实施模式识别的信息，学习实际数据和控制操作的组合来进行控制。

3.根据权利要求1或者2所述的整套设备控制装置，其特征在于，

所述控制规则执行部将控制对象整套设备的实际数据和控制操作的被确定的组合保持为第1神经网络，所述控制规则学习部将实际数据和控制操作的组合保持为第2神经网络，将所述控制方法学习装置中的学习的结果所得到的第2神经网络用作所述控制规则执行部中的所述第1神经网络。

4.根据权利要求1至3中的任意一项所述的整套设备控制装置，其特征在于，

所述控制执行装置具备对所述控制输出提供干扰的控制操作干扰发生部，所述控制方法学习装置在包括被施加干扰时也进行学习。

5.根据权利要求1至4中的任意一项所述的整套设备控制装置，其特征在于，

所述控制方法学习装置通过基于预先确定的多个规格的学习而得到实际数据和控制操作的多个组合，所述控制执行装置从实际数据和控制操作的多个组合中根据控制对象整套设备的运转状态选择1个实际数据和控制操作的多个组合来提供所述控制输出。

6.根据权利要求3所述的整套设备控制装置，其特征在于，

根据实际数据的大小，变更要使用的对实际数据和操作方法的组合进行学习的神经网络。

7.根据权利要求1至6中的任意一项所述的整套设备控制装置，其特征在于，

根据所述控制对象整套设备的状态或者控制对象整套设备的操作员的经验等变更控制结果良好与否判定基准，分别求出针对控制对象整套设备的实际数据和操作方法的关系并分别储存于数据库，从而根据所述控制对象整套设备的状态或者控制对象整套设备的操作员的经验等，利用不同的控制方法进行控制。

8.根据权利要求1至7中的任意一项所述的整套设备控制装置，其特征在于，

在实施控制对象整套设备中的控制之前，使用控制对象整套设备的控制模型，通过仿真来制作所述实际数据和控制操作的组合，缩短控制对象整套设备中的所述实际数据和控制操作的组合的学习期间。

9.一种轧机控制装置，应用有权利要求1至8中的任意一项所述的整套设备控制装置，所述轧机控制装置的特征在于，

所述控制对象整套设备是轧机，所述实际数据是所述轧机的输出侧形状。

10.一种整套设备控制方法，该整套设备控制方法应用于整套设备控制装置，针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制，其特征在于，所述整套设备控制装置具备：

所述控制执行装置依照控制对象整套设备的实际数据和控制操作的被确定的组合，提供控制输出，判定能否输出该控制输出，向所述控制方法学习装置通知该实际数据和控制操作是错误的，在判断为在将控制输出输出到所述控制对象整套设备的情况下所述控制对象整套设备的所述实际数据发生恶化的情况下，阻止将控制输出输出到所述控制对象整套设备，

所述控制方法学习装置在所述控制执行装置将控制输出实际输出到控制对象整套设备的情况下，在直至控制效果表现在实际数据为止的时间延迟之后，判定关于实际数据与控制前相比变得良好还是变得恶化的控制结果的良好与否，使用该控制结果的良好与否和所述控制输出而得到教师数据，将所述实际数据和所述教师数据作为学习数据进行学习，通过学习，根据所述控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作所述控制执行装置中的控制对象整套设备的实际数据和控制操作的被确定的组合。

11.一种轧机控制方法，应用有权利要求10所述的整套设备控制方法，其特征在于，

所述控制对象整套设备是轧机，所述实际数据是所述轧机的出侧形状。

12.一种储存有程序的存储介质，该程序是利用计算机系统实现针对控制对象整套设备识别控制对象整套设备的实际数据的组合的模式来实施控制的整套设备控制装置时的程序，所述存储介质的特征在于，

计算机系统具备：

所述程序是用于实现所述控制执行装置的处理的控制规则执行程序、控制输出判定程序、控制输出抑制程序，其中所述控制规则执行程序依照控制对象整套设备的实际数据和控制操作的被确定的组合提供控制输出；所述控制输出判定程序判定该控制规则执行程序能否输出控制输出，并且向所述控制方法学习装置通知该实际数据和控制操作是错误的；所述控制输出抑制程序在该控制输出判定程序判断为在将控制输出输出到控制对象整套设备的情况下控制对象整套设备的所述实际数据发生恶化的情况下，阻止将控制输出输出到所述控制对象整套设备，

所述程序是用于实现所述控制方法学习装置的处理的、控制结果良好与否判定程序、学习数据制作程序、控制规则学习程序，其中所述控制结果良好与否判定程序用于使控制结果良好与否判定的处理实现，其中在控制执行装置将控制输出实际输出到控制对象整套设备的情况下在直至控制效果表现在实际数据为止的时间延迟之后判定关于实际数据与控制前相比变得良好还是变得恶化的所述控制结果的良好与否；所述学习数据制作程序使用该控制结果良好与否判定程序中的控制结果的良好与否和控制输出而得到教师数据；所述控制规则学习程序将所述实际数据和所述教师数据作为学习数据进行学习，

通过控制方法学习装置进行学习，根据所述控制对象整套设备的状态针对多个控制目标而得到独自的实际数据和控制操作的组合，将得到的实际数据和控制操作的组合用作所述控制规则执行程序中的控制对象整套设备的实际数据和控制操作的被确定的组合。