[go: up one dir, main page]

CN116048911A - 一种冗余系统的监控方法、装置、设备及存储介质 - Google Patents

一种冗余系统的监控方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116048911A
CN116048911A CN202211582868.8A CN202211582868A CN116048911A CN 116048911 A CN116048911 A CN 116048911A CN 202211582868 A CN202211582868 A CN 202211582868A CN 116048911 A CN116048911 A CN 116048911A
Authority
CN
China
Prior art keywords
node
monitoring
information
state
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211582868.8A
Other languages
English (en)
Inventor
赵先明
武俊龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Changkun Technology Co ltd
Original Assignee
Beijing Changkun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Changkun Technology Co ltd filed Critical Beijing Changkun Technology Co ltd
Priority to CN202211582868.8A priority Critical patent/CN116048911A/zh
Publication of CN116048911A publication Critical patent/CN116048911A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明涉及计算机技术领域,具体涉及一种冗余系统的监控方法、装置、设备及存储介质,该方法包括:当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。可以理解的是,本发明示出的技术方案,通过将节点状态切换时的状态信息直接同步到监控节点处,能够实现更全面的数据推送,且由于使用的是推送模式,每次节点状态变化信息都可以很及时的到达监控节点,无需占用过多资源,提升监控效果。

Description

一种冗余系统的监控方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种冗余系统的监控方法、装置、设备及存储介质。
背景技术
目前的冗余系统,以服务器为例,常常设置有一个主服务器和多个备份服务器,但是,这些服务器对外表现为一个虚拟IP,在运行过程中,主服务器会发送特定的消息至备份服务器,当主服务器宕机时,备份服务器就收不到主服务器发送的特定消息,备份服务器就会接管虚拟IP,继续提供服务,从而保证了此冗余系统的高可用性。
现有技术中针对上述的高可用的方案,为了更好的查看高可用系统的当前状态以及历史状态,常常对应设置有监控方案。现有的监控方案,为对各节点集群的状态进行定时轮询获取,然而,此类监控方式,如果轮询间隔设置的太长,那么获取的数据就不及时,如果轮询间隔设置的太短,则会占用较多的资源,导致监控效果不理想。
发明内容
有鉴于此,本发明的目的在于提供一种冗余系统的监控方法、装置、设备及存储介质,以解决现有技术中的冗余系统的监控方式监控效果不理想的问题。
根据本发明实施例的第一方面,提供一种冗余系统的监控方法,包括:
当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;
利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;
在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。
优选的,在判断冗余系统的节点是否进行状态切换之前,还包括:
分别在冗余系统的主节点和从节点处安装服务器状态检查模块;
在监控节点处设置监控服务模块;
分别在所述主节点和所述从节点处安装监控信息采集模块和监控信息发送模块;
分别在所述主节点和所述从节点处配置所述服务器状态检查模块的通知脚本。
优选的,所述分别在冗余系统的主节点和从节点处安装服务器状态检查模块,包括:
分别在所述主节点和所述从节点处使用linux的命令安装Keepalived,所述Keepalived为所述服务器状态检查模块;
分别在所述主节点和所述从节点处配置所述Keepalived的全局定义,配置节点集群的健康检查脚本,配置虚拟路由冗余协议实例。
优选的,所述配置节点集群的健康检查脚本,包括:
分别配置健康检查脚本路径、执行间隔、执行超时时间、判定节点健康需要的脚本执行成功的次数和判定节点不健康需要的脚本执行失败的次数。
优选的,所述配置虚拟路由冗余协议实例,包括:
初始状态、配置为非抢占模式、虚拟路由冗余协议实例通信的网卡名称、健康检查脚本实例的名称、其他节点的地址、虚拟路由ID、当前节点路由的优先级、路由组的认证信息、虚拟IP地址信息和通知脚本配置。
优选的,所述利用预先设置的监控信息发送模块将所述状态信息发送至监控节点,包括:
将切换时的状态信息写入日志,以作为对切换历史做本地的追溯;
使用所述监控信息发送模块将所述状态信息发送到所述监控服务模块;
所述状态信息包括切换时的节点名称和要切换到的状态。
优选的,所述监控信息采集模块为zabbix-agent,所述监控信息发送模块为zabbix_sender,所述监控服务模块为zabbix-server。
根据本发明实施例的第二方面,提供一种冗余系统的监控装置,包括:
状态信息生成单元,用于当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;
状态信息发送单元,用于利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;
状态信息显示单元,用于在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。
根据本发明实施例的第三方面,提供一种冗余系统的监控设备,包括:
主控器,及与所述主控器相连的存储器;
所述存储器,其中存储有程序指令;
所述主控器用于执行存储器中存储的程序指令,执行上述任一项所述的方法。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述任一项所述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
可以理解的是,本发明示出的技术方案,能够当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。可以理解的是,本发明示出的技术方案,通过将节点状态切换时的状态信息直接同步到监控节点处,能够实现更全面的数据推送,且由于使用的是推送模式,每次节点状态变化信息都可以很及时的到达监控节点,无需占用过多资源,提升监控效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种冗余系统的监控方法的步骤示意图;
图2是根据一示例性实施例示出的应用冗余系统的监控方法的架构示意图;
图3是根据一示例性实施例示出的方案流程对比示意图;
图4是根据一示例性实施例示出的一种冗余系统的监控装置的示意框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
实施例一
图1是根据一示例性实施例示出的一种冗余系统的监控方法的步骤示意图,参见图1,提供一种冗余系统的监控方法,包括:
步骤S11、当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;
步骤S12、利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;
步骤S13、在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。
在具体实践中,冗余系统通常包含若干个节点,其中有一个主节点和多个从节点,当主节点工作时,主节点会发送特定的消息至其余从节点,当主节点宕机时,其余从节点接收不到该特定消息,就能判断出主节点宕机,从节点便会根据预设的规则或者预设优先级,选出一个从节点作为新的主节点,接替主节点的工作。在主节点宕机或者从节点变为主节点时,均可视为状态切换,在状态切换时,会执行预先部署的通知脚本生成状态信息,之后,可以利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点。监控节点为工作人员提供监控信息,在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息,工作人员可以观测到显示的状态信息,从而进行后续判断或工作。
优选的,主节点因异常情况宕机后,可以经过工作人员修复,在主节点修复之后,可以再次放入节点集群,也可以视为状态切换。
可以理解的是,本发明示出的技术方案,能够当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。可以理解的是,本发明示出的技术方案,通过将节点状态切换时的状态信息直接同步到监控节点处,能够实现更全面的数据推送,且由于使用的是推送模式,每次节点状态变化信息都可以很及时的到达监控节点,无需占用过多资源,提升监控效果。
需要说明的是,在判断冗余系统的节点是否进行状态切换之前,还包括:
分别在冗余系统的主节点和从节点处安装服务器状态检查模块;
在监控节点处设置监控服务模块;
分别在所述主节点和所述从节点处安装监控信息采集模块和监控信息发送模块;
分别在所述主节点和所述从节点处配置所述服务器状态检查模块的通知脚本。
在具体实践中,图2是根据一示例性实施例示出的应用冗余系统的监控方法的架构示意图,参见图2,所述服务器状态检查模块可以为Keepalived,本实施例采用的监控方案可以为Zabbix,优选的,所述监控信息采集模块为zabbix-agent,所述监控信息发送模块为zabbix-sender,所述监控服务模块为zabbix-server。因此,在实际应用场景中,借助于Keepalived的通知脚本以及Zabbix的主推方式,当安装有Keepalived的节点进行状态切换时,执行切换的通知脚本,在脚本中将Zabbix监控的节点状态主动推送到Zabbix的监控中心数据库,从而在Zabbix的监控中心就可以实时查看当前集中中的节点状态。具体为:在主节点和从节点安装Keepalived;在监控节点部署zabbix-server;在主节点和从节点安装zabbix-agent和zabbix-sender;在主节点和从节点配置Keepalived通知脚本;在Zabbix监控页面配置监控信息。
Keepalived是一个基于VRRP(虚拟路由冗余)协议来实现的LVS服务高可用方案,可以利用其来解决单点故障。一个LVS服务会有多台服务器运行Keepalived,一台为主服务器(MASTER),其余为备份服务器(BACKUP),但是对外表现为一个虚拟IP,主服务器会发送特定的消息给备份服务器,当备份服务器收不到这个消息的时候,即主服务器宕机的时候,备份服务器就会接管虚拟IP,继续提供服务,从而保证了高可用性。
VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个主服务器和多个备份服务器,主服务器上面有一个对外提供服务的虚拟IP(该路由器所在局域网内其他机器的默认路由为该虚拟IP),主服务器会发组播或这单播,当备份服务器收不到VRRP包时就认为主服务器宕掉了,这时就需要根据VRRP的优先级来选举一个备份服务器当主服务器。这样的话就可以保证路由器的高可用了。
Keepalived提供了很好的高可用性保障服务,它可以检查服务器的状态,如果有服务器出现问题,Keepalived会将其从系统中移除,并且同时使用备份服务器代替该服务器的工作,当这台服务器可以正常工作后,Keepalived再将其放入服务器群中,这个过程是Keepalived自动完成的,不需要人工干涉,人工只需要修复出现问题的服务器即可。
图3是根据一示例性实施例示出的方案流程对比示意图,参见图3,图3左侧为现有技术的流程,现有技术中使用Zabbix轮询查询每个节点的状态,每间隔n秒轮询一次,在轮询完成后才能更新每个节点的状态。而本实施例示出的方案流程参见图3右侧,只有当节点发生变化时,将该变化的状态信息主动推送至监控节点,实现数据的更新。
需要说明的是,所述分别在冗余系统的主节点和从节点处安装服务器状态检查模块,包括:
分别在所述主节点和所述从节点处使用linux的命令安装Keepalived,所述Keepalived为所述服务器状态检查模块;
分别在所述主节点和所述从节点处配置所述Keepalived的全局定义,配置节点集群的健康检查脚本,配置虚拟路由冗余协议实例。
在具体实践中,配置Keepalived的全局定义,一般情况仅需要配置script_user(脚本执行的用户)即可。
而配置节点集群的健康检查脚本,包括:分别配置健康检查脚本路径、执行间隔、执行超时时间、判定节点健康需要的脚本执行成功的次数和判定节点不健康需要的脚本执行失败的次数。
在具体实践中,配置集群的健康检查脚本(vrrp_script),需要分别配置script(健康检查脚本路径)、interval(执行间隔)、timeout(执行超时时间)、rise(判定节点健康需要的脚本执行成功的次数)、fall(判定节点不健康需要的脚本执行失败的次数)即可。特别的,script配置的路径对应的文件是具有执行权限的,该文件中使用shell命令对节点的服务进行监控(比如说对服务的端口进行探测),脚本返回为0则视为脚本执行成功。
需要说明的是,所述配置虚拟路由冗余协议实例,包括:初始状态、配置为非抢占模式、虚拟路由冗余协议实例通信的网卡名称、健康检查脚本实例的名称、其他节点的地址、虚拟路由ID、当前节点路由的优先级、路由组的认证信息、虚拟IP地址信息和通知脚本配置。
在具体实践中,配置虚拟路由冗余协议实例(配置vrrp_instance)主要包括:state(初始状态)、nopreempt(配置为非抢占模式)、interface(VRRP实例通信的网卡名称)、track_script(检查脚本实例的名称)、unicast_peer(其他节点的地址)、virtual_router_id(虚拟路由id)、priority(当前节点路由的优先级)、authentication(路由组的认证信息,一般认证类型为密码)、virtual_ipaddress(虚拟IP地址信息)以及notify(通知脚本配置)。
需要说明的是,所述利用预先设置的监控信息发送模块将所述状态信息发送至监控节点,包括:
将切换时的状态信息写入日志,以作为对切换历史做本地的追溯;
使用所述监控信息发送模块将所述状态信息发送到所述监控服务模块;
所述状态信息包括切换时的节点名称和要切换到的状态。
在具体实践中,在主节点和从节点配置Keepalived通知脚本,主要为:在A3中notify的对应路径对应的文件中,编写shell脚本,以实现将切换时的信息写入日志,以作为对切换历史做本地的追溯;
同时,编写shell脚本,实现使用zabbix_sender将切换时的节点名称以及要切换到的状态发送到部署好的Zabbix服务中,发送的Key的名称要唯一。
优选的,在Zabbix监控页面配置监控信息,登录Zabbix服务web页面之后,主要包括以下步骤:
步骤S21、创建主机组;
步骤S22、创建主节点和从节点,将节点分别加入步骤S21中的主机组;
步骤S23、创建Template,选择步骤S21中的主机组;
步骤S24、在步骤S23中的Template中创建application;
步骤S25、在步骤S23中的Template中创建Item,Type为“Zabbix trapper”,Key的名称要和上述的Key名称一致,Type of infomation使用text,History storage period表示的是历史数据存储时间。Allowed hosts需要添加主节点和从节点的IP地址,applications选择步骤S22中保存成功的application。
步骤S26、在步骤S23中的Template中创建Triggers,Expression(表达式)要选择利用步骤S25中的Key来做触发告警的表达式的变量。
实施例二
图4是根据一示例性实施例示出的一种冗余系统的监控装置的示意框图,参见图4,提供一种冗余系统的监控装置,包括:
状态信息生成单元101,用于当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;
状态信息发送单元102,用于利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;
状态信息显示单元103,用于在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。
可以理解的是,本实施例示出的技术方案,通过状态信息生成单元101当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;通过状态信息发送单元102利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;通过状态信息显示单元103在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。可以理解的是,本实施例示出的技术方案,通过将节点状态切换时的状态信息直接同步到监控节点处,能够实现更全面的数据推送,且由于使用的是推送模式,每次节点状态变化信息都可以很及时的到达监控节点,无需占用过多资源,提升监控效果。
实施例三
提供一种冗余系统的监控设备,包括:
主控器,及与所述主控器相连的存储器;
所述存储器,其中存储有程序指令;
所述主控器用于执行存储器中存储的程序指令,执行上述任一项所述的方法。
实施例四
根据本发明实施例的第四方面,提供一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述任一项所述的方法。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种冗余系统的监控方法,其特征在于,包括:
当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;
利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;
在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。
2.根据权利要求1所述的方法,其特征在于,在判断冗余系统的节点是否进行状态切换之前,还包括:
分别在冗余系统的主节点和从节点处安装服务器状态检查模块;
在监控节点处设置监控服务模块;
分别在所述主节点和所述从节点处安装监控信息采集模块和监控信息发送模块;
分别在所述主节点和所述从节点处配置所述服务器状态检查模块的通知脚本。
3.根据权利要求2所述的方法,其特征在于,所述分别在冗余系统的主节点和从节点处安装服务器状态检查模块,包括:
分别在所述主节点和所述从节点处使用linux的命令安装Keepalived,所述Keepalived为所述服务器状态检查模块;
分别在所述主节点和所述从节点处配置所述Keepalived的全局定义,配置节点集群的健康检查脚本,配置虚拟路由冗余协议实例。
4.根据权利要求3所述的方法,其特征在于,所述配置节点集群的健康检查脚本,包括:
分别配置健康检查脚本路径、执行间隔、执行超时时间、判定节点健康需要的脚本执行成功的次数和判定节点不健康需要的脚本执行失败的次数。
5.根据权利要求3所述的方法,其特征在于,所述配置虚拟路由冗余协议实例,包括:
初始状态、配置为非抢占模式、虚拟路由冗余协议实例通信的网卡名称、健康检查脚本实例的名称、其他节点的地址、虚拟路由ID、当前节点路由的优先级、路由组的认证信息、虚拟IP地址信息和通知脚本配置。
6.根据权利要求5所述的方法,其特征在于,所述利用预先设置的监控信息发送模块将所述状态信息发送至监控节点,包括:
将切换时的状态信息写入日志,以作为对切换历史做本地的追溯;
使用所述监控信息发送模块将所述状态信息发送到所述监控服务模块;
所述状态信息包括切换时的节点名称和要切换到的状态。
7.根据权利要求1~6任意一项所述的方法,其特征在于,所述监控信息采集模块为zabbix-agent,所述监控信息发送模块为zabbix_sender,所述监控服务模块为zabbix-server。
8.一种冗余系统的监控装置,其特征在于,包括:
状态信息生成单元,用于当冗余系统的节点进行状态切换时,执行预先部署的通知脚本生成状态信息;
状态信息发送单元,用于利用预先设置的监控信息采集模块获取所述状态信息,利用预先设置的监控信息发送模块将所述状态信息发送至监控节点;
状态信息显示单元,用于在监控节点处利用预先设置的监控服务模块实时显示各个节点的状态信息。
9.一种冗余系统的监控设备,其特征在于,包括:
主控器,及与所述主控器相连的存储器;
所述存储器,其中存储有程序指令;
所述主控器用于执行存储器中存储的程序指令,执行如权利要求1~7任一项所述的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~7任一项所述的方法。
CN202211582868.8A 2022-12-09 2022-12-09 一种冗余系统的监控方法、装置、设备及存储介质 Pending CN116048911A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211582868.8A CN116048911A (zh) 2022-12-09 2022-12-09 一种冗余系统的监控方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211582868.8A CN116048911A (zh) 2022-12-09 2022-12-09 一种冗余系统的监控方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116048911A true CN116048911A (zh) 2023-05-02

Family

ID=86112339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211582868.8A Pending CN116048911A (zh) 2022-12-09 2022-12-09 一种冗余系统的监控方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116048911A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119892609A (zh) * 2025-03-28 2025-04-25 北京和利时控制技术有限公司 一种服务器切换方法及系统
CN120186367A (zh) * 2025-05-21 2025-06-20 深圳市天威视讯股份有限公司 一种基于Zabbix的宽带网络电视网管监控系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330598A (zh) * 2016-08-11 2017-01-11 浪潮软件股份有限公司 一种通过zabbix监控hadoop的方法
CN107239380A (zh) * 2017-05-10 2017-10-10 杭州铭师堂教育科技发展有限公司 一种基于zabbix的消息队列监控方法
CN107239502A (zh) * 2017-05-10 2017-10-10 杭州铭师堂教育科技发展有限公司 基于salt的数据库错误日志监控系统
CN110048888A (zh) * 2019-04-16 2019-07-23 深圳市致宸信息科技有限公司 一种基于zabbix监控告警的方法、服务器、设备及存储介质
CN111404653A (zh) * 2020-03-06 2020-07-10 北京和利时系统工程有限公司 一种监控服务系统、方法和装置
CN111722988A (zh) * 2020-06-11 2020-09-29 苏州浪潮智能科技有限公司 一种数据空间节点的故障切换方法和装置
CN112416515A (zh) * 2020-11-20 2021-02-26 苏州浪潮智能科技有限公司 一种Keepalived集群部署的方法、系统、设备及介质
EP4023527A1 (en) * 2020-12-30 2022-07-06 Guodian Nanjing Automation Co., LTD. Subsystem and method for controlling the switch between a main center and a standby center in the integrated supervisory control system
CN115145782A (zh) * 2021-03-30 2022-10-04 中移(苏州)软件技术有限公司 一种服务器切换方法,MooseFS系统及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330598A (zh) * 2016-08-11 2017-01-11 浪潮软件股份有限公司 一种通过zabbix监控hadoop的方法
CN107239380A (zh) * 2017-05-10 2017-10-10 杭州铭师堂教育科技发展有限公司 一种基于zabbix的消息队列监控方法
CN107239502A (zh) * 2017-05-10 2017-10-10 杭州铭师堂教育科技发展有限公司 基于salt的数据库错误日志监控系统
CN110048888A (zh) * 2019-04-16 2019-07-23 深圳市致宸信息科技有限公司 一种基于zabbix监控告警的方法、服务器、设备及存储介质
CN111404653A (zh) * 2020-03-06 2020-07-10 北京和利时系统工程有限公司 一种监控服务系统、方法和装置
CN111722988A (zh) * 2020-06-11 2020-09-29 苏州浪潮智能科技有限公司 一种数据空间节点的故障切换方法和装置
CN112416515A (zh) * 2020-11-20 2021-02-26 苏州浪潮智能科技有限公司 一种Keepalived集群部署的方法、系统、设备及介质
EP4023527A1 (en) * 2020-12-30 2022-07-06 Guodian Nanjing Automation Co., LTD. Subsystem and method for controlling the switch between a main center and a standby center in the integrated supervisory control system
CN115145782A (zh) * 2021-03-30 2022-10-04 中移(苏州)软件技术有限公司 一种服务器切换方法,MooseFS系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119892609A (zh) * 2025-03-28 2025-04-25 北京和利时控制技术有限公司 一种服务器切换方法及系统
CN120186367A (zh) * 2025-05-21 2025-06-20 深圳市天威视讯股份有限公司 一种基于Zabbix的宽带网络电视网管监控系统

Similar Documents

Publication Publication Date Title
JP6835444B2 (ja) ソフトウェア定義型データセンター、並びにそのためのサービスクラスタスケジューリング方法及びトラフィック監視方法
CN108293001B (zh) 一种软件定义数据中心及其中的服务集群的部署方法
CN109495312B (zh) 基于仲裁盘和双链路的高可用集群的实现方法和系统
US9674285B2 (en) Bypassing failed hub devices in hub-and-spoke telecommunication networks
CN108173911B (zh) 一种微服务故障检测处理方法及装置
US10728099B2 (en) Method for processing virtual machine cluster and computer system
CN105515812A (zh) 资源的故障处理方法及装置
WO2020030000A1 (zh) 容灾切换方法、相关设备及计算机存储介质
US8570877B1 (en) Preparing for planned events in computer networks
CN104038376A (zh) 一种管理真实服务器的方法、装置及lvs集群系统
CN104765889A (zh) 基于数据库高可用框架的切换方法及装置
CN116048911A (zh) 一种冗余系统的监控方法、装置、设备及存储介质
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
JP5558422B2 (ja) ネットワークシステム、冗長化方法、障害検知装置及び障害検知プログラム
CN102497288A (zh) 一种双机备份方法和双机系统实现装置
CN105634848B (zh) 一种虚拟路由器监控方法及装置
CN117240694A (zh) 一种基于keepalived的双机热备主备切换方法、装置及系统
US11418382B2 (en) Method of cooperative active-standby failover between logical routers based on health of attached services
WO2024179028A1 (zh) 基于云技术的探测方法及云管理平台
CN104125079B (zh) 一种确定双机热备份配置信息的方法及装置
JP5285044B2 (ja) クラスタシステム復旧方法及びサーバ及びプログラム
CN115499296A (zh) 一种云桌面热备管理方法、装置及系统
JP2012014674A (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
US10305987B2 (en) Method to syncrhonize VSAN node status in VSAN cluster
CN118963937A (zh) 云管理服务的切换方法及装置、存储介质、程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination