[go: up one dir, main page]

CN101237356A - 用于监控的系统和方法 - Google Patents

用于监控的系统和方法 Download PDF

Info

Publication number
CN101237356A
CN101237356A CNA2008100026951A CN200810002695A CN101237356A CN 101237356 A CN101237356 A CN 101237356A CN A2008100026951 A CNA2008100026951 A CN A2008100026951A CN 200810002695 A CN200810002695 A CN 200810002695A CN 101237356 A CN101237356 A CN 101237356A
Authority
CN
China
Prior art keywords
equipment
network
group
many groups
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100026951A
Other languages
English (en)
Other versions
CN101237356B (zh
Inventor
陶舒
哈尼·T.·加姆朱姆
尼克劳斯·安内罗西斯
德班简·萨哈
周晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IBM China Co Ltd
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101237356A publication Critical patent/CN101237356A/zh
Application granted granted Critical
Publication of CN101237356B publication Critical patent/CN101237356B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种用于监控网络的方法包括:识别网络中的多组设备,其中所述多组设备中的每组设备是相关设备的一个集合;对所述多组设备中的每组设备中的一组节点的状态进行采样,其中所述多组设备中的每组设备具有多组节点;并根据所采样的所述多组设备中的每组设备中的节点组的状态确定该网络的状态。

Description

用于监控的系统和方法
技术领域
本发明涉及网络管理,更具体地说,涉及一种用于通过数据采样监控大规模分布式网络的系统和方法。
背景技术
管理每天要处理数百万事务的诸如计算机、有线和电信网络的大规模分布式网络是非常重要的,并且是充满挑战性的任务。在与这类网络管理相关的各种挑战中,尤其重要的是实时监控网络状态。通过使用经由实时监控得到的数据,管理中心能够很快地检测到网络中的问题并加以解决,从而避免使这些问题扩散到整个网络。但是,由于监控这些网络中的大量设备所需的经常性开销,为诸如管理中心或操作中心这样的网络管理实体提供有效的实时监控在成本上并不是很划算。
用于大规模分布式网络管理的已知方法包括反应式监控和总体监控。一种示例性的反应式监控方法在以下文献中加以讨论,即R.Sasisekharan、V.Seshadri和S.M.Weiss的“Data Mining andForecasting in Large-Scale Telecommunication Networks”,IEEEIntelligent Systems and Their Applications 11(1):37-43,1996年2月。示例性的总体监控方法在以下文献中加以讨论,即R.R.Kompella、J.Yates、A.Greenberg和A.C.Snoeren的“IP Fault Localization ViaRisk Modeling”,In Proceedings of Networked Systems Design andImplementation(NSDI),2005年;S.Kandula、D.Katabi和J.P.Vasseur的“Shrink:A Tool for Failure Diagnosis in IP Networks”,费城,宾夕法尼亚州,2005年8月;以及1998年5月12日授予Ordanic等人的美国专利No.5751964,发明名称为“System and Method forAutomatic Determination of Thresholds in Network Management”。
反应式监控通常涉及当报告问题时使用操作中心来监控仅受到影响的网络设备。因此,尽管在该方法期间所采集的信息对于问题分析而言是有帮助的,但对于避免问题来说没有用处。总体监控通常涉及使用操作中心在总体水平上监控一个网络。例如,有线网络的操作中心可依赖于有线调制解调器终端系统(CMTS)中的管理信息数据库(MIB)来监控附加到CMTS上的调制解调器的可用性。但这种方法不能为网络中的所有设备提供详细状态信息。
因此,需要一种用于管理大规模分布式网络的技术,它能够以有效和低成本的方式提供实时监控。
发明内容
在本发明的一个示例性实施例中,一种用于监控网络的方法包括:识别网络中的多组设备,其中所述多组设备中的每组设备是相关设备的一个集合;对所述多组设备中的每组设备中的一组节点的状态进行采样,其中所述多组设备中的每组设备具有多组节点;并根据所采样的所述多组设备中的每组设备中的节点组的状态确定该网络的状态。
网络中的所述多组设备是通过以下方式来识别的:接收该网络的拓扑结构或该网络的历史监控数据作为输入;当接收该网络的拓扑结构时,根据该网络的拓扑结构的节点连接关系确定所述多组设备;或者当接收该网络的历史监控数据时,根据从该网络的节点所采集的历史数据确定所述多组设备。
网络中的所述多组设备还通过以下方式来识别:接收该网络的局部拓扑结构和该网络的历史监控数据作为输入;并根据该网络的局部拓扑结构的节点连接关系和从该网络的节点所采集的历史数据确定所述多组设备。
所述多组设备中每组设备中的节点组的状态通过将探测单元发送到所述多组设备中每组设备中的一组节点而被采样。发送给具有数目较多的设备的设备组的探测单元比发送给具有数目较少的设备的设备组的探测单元要多。当设备组具有数目相同的设备时,发送给具有状态可变性较高的设备的设备组的探测单元比发送给具有状态可变性较低的设备的设备组的探测单元要多。
网络的状态通过以下方式来确定:通过使用所述多组设备中每组设备的一组节点的所采样的状态来估计所述多组设备中每组设备的状态;并生成所述多组设备的状态估计。
所述方法还包括通过使用所述状态估计来生成网络的状态报告,以识别出网络中存在问题的部分。所述方法还包括:通过使用所述多组设备的状态估计生成当前问题标志;并将所述当前问题标志与先前的问题标志进行比较,以识别出网络中当前所发生的问题。所述方法还包括:将所述当前问题标志与所述多组设备的预测的状态估计结合起来,以判断在网络中是否即将发生未来的问题;并确定采取哪些措施来避免在网络中发生未来的问题。
在本发明的一个示例性实施例中,一种计算机程序产品包括具有存储在其上的用于监控网络的计算机程序逻辑的计算机可读介质,所述计算机程序逻辑包括:用于识别网络中的多组设备的程序代码,其中所述多组设备中的每组设备是相关设备的一个集合;用于对所述多组设备中每组设备中的一组节点的状态进行采样的程序代码,其中所述多组设备中的每组设备具有多组节点;以及用于根据所述多组设备中每组设备中的节点组的所采样的状态来确定网络状态的程序代码。
用于识别网络中的多组设备的程序代码包括:用于接收该网络的拓扑结构或该网络的历史监控数据作为输入的程序代码;以及用于当接收该网络的拓扑结构时,根据该网络的拓扑结构的节点连接关系确定所述多组设备的程序代码;或者用于当接收该网络的历史监控数据时,根据从该网络的节点所采集的历史数据确定所述多组设备的程序代码。
用于识别网络中的多组设备的程序代码包括:用于接收该网络的局部拓扑结构和该网络的历史监控数据作为输入的程序代码;以及用于根据该网络的局部拓扑结构的节点连接关系和从该网络的节点所采集的历史数据确定所述多组设备的程序代码。
所述多组设备中每组设备中的节点组的状态通过将探测单元发送到所述多组设备中每组设备中的一组节点而被采样。发送给具有数目较多的设备的设备组的探测单元比发送给具有数目较少的设备的设备组的探测单元要多。当设备组具有数目相同的设备时,发送给具有状态可变性较高的设备的设备组的探测单元比发送给具有状态可变性较低的设备的设备组的探测单元要多。
用于确定网络状态的程序代码包括:用于通过使用所述多组设备中每组设备的一组节点的所采样的状态来估计所述多组设备中每组设备的状态的程序代码;以及用于生成所述多组设备的状态估计的程序代码。
所述计算机程序产品还包括用于通过使用所述状态估计来生成网络的状态报告,以识别出网络中存在问题的部分的程序代码。所述计算机程序产品还包括:用于通过使用所述多组设备的状态估计生成当前问题标志的程序代码;以及用于将所述当前问题标志与先前的问题标志进行比较,以识别出网络中当前所发生的问题的程序代码。
所述计算机程序产品还包括:用于将所述当前问题标志与所述多组设备的预测的状态估计结合起来,以判断在网络中是否即将发生未来的问题的程序代码;还包括用于确定采取哪些措施来避免在网络中发生未来的问题的程序代码。
在本发明的一个示例性实施例中,一种用于监控网络的系统包括:用于存储程序的存储设备;与所述存储设备进行通信的处理器,所述处理器以所述程序来操作,从而:识别网络中的多组设备,其中所述多组设备中的每组设备是相关设备的一个集合;对所述多组设备中每组设备中的一组节点的状态进行采样,其中所述多组设备中的每组设备具有多组节点;并根据所述多组设备中每组设备中的节点组的所采样的状态来确定网络状态。
上述技术特征属于相应的实施例,并且其描述有助于理解本发明。应当理解,它们不应作为对通过权利要求书所限定的本发明的限制,或者作为对权利要求的等同物的限制。因此,这些技术特征的概括不应作为对判断等同物起决定性作用的内容。本发明的其他技术特征将在后面的说明中通过参照附图和权利要求书而变得更为清楚。
附图说明
图1示出了根据本发明的一个示例性实施例的用于监控大规模分布式网络的系统;并且
图2示出了根据本发明的一个示例性实施例从网络拓扑信息所推断出的粒状分组。
具体实施方式。
图1示出了根据本发明的一个示例性实施例的用于监控大规模分布式网络的系统。
如图1所示,网络监控站105包括组分析器110、数据采样器115和推断引擎120。所述网络监控站105具有用于接收网络拓扑信息125和/或历史监控数据130的输入接口。所述网络监控站105具有用于将数据采样器115连接到诸如大规模分布式网络的被监控网络135上的网络接口,使得数据采样器115可以对被监控网络135种的设备进行采样。网络监控站105还具有用于输出由所述推断引擎120所推断出的与被监控网络135相关的信息140的输出接口。
现在将讨论图1所示系统的示例性实施方式。
在图1中,利用网络拓扑信息125,例如被监控网络135的拓扑结构,组分析器110识别出被监控网络135中的粒状分组145a、b、c。每个粒状分组145a、b、c是具有相关状态的设备的一个子集。例如,在诸如有线网络的大规模分布式网络中,附加到同一转发器上的一组有线调制解调器可以被视作一个粒状分组。
通过使用网络拓扑结构中的节点连接关系识别出所述粒状分组145a、b、c。由于大规模分布式网络通常呈现为树状拓扑结构,因此一个粒状分组(例如组1或组2)可包含一个叶子节点(例如有线调制解调器)的集合,这些叶子节点排他地连接到一个上级节点(例如转发器B或C,它们分别连接到一个更高级别的转发器A或有线调制解调器终端系统(CMTS)接口A),如图2所示。
如果不能得到网络拓扑信息125,则组分析器110例如可以使用从一组叶子节点中所采集到的历史监控信息130来推断粒状分组。历史监控信息130例如包括当检测到在被监控网络135中出现问题时所采集的数据。粒状分组推断可等同于识别共同承担类似故障风险和/或被监控网络135中出现的问题的叶子节点。因此,如果给定了足够的历史监控数据130,无需使用网络拓扑信息125就可以推断出粒状分组。另外,如果给定了局部网络拓扑信息125和某些历史监控数据130,组分析器110可以将这两者结合起来,以得到更为精确的粒状分组。
利用所识别出的粒状分组,数据采样器115以较少数目的探测单元、如数据包或信号对每组进行采样。例如,如果组I包括Ni个节点,则数据采样器115仅探测Mi个节点,其中Mi<<Ni。在每轮采样中,所述的Mi个节点可以从组I中随机地选取。Mi的值是组的大小(Ni)和该组中节点状态的可变性这两者的函数。因此,例如应当将更多的探测单元发送给较大的组,从而对组状态得到更为精确的估计。此外,对于具有相同大小的组,那些其成员表现出较高的状态可变性的组应当接收更多的探测单元,从而使所采集的样本更能代表这些组的整体状态。在实际中,Mi的选取可以被调整,以减少在所采样的数据中发生噪声的可能性(例如在采样期间有线调制解调器可能会被意外地关断)以及使得与探测相关的成本最小化。
当数据采样完成后,推断引擎120根据函数f(x_1,x_2,...,x_Mi)来估计每个组的状态,该函数以Mi个采样数据作为输入,并输出对整个组的状态估计。应当理解的是,由于存在采样噪声,这种估计并不总是精确的。推断引擎120把这种潜在的噪声作为输入,并执行下述分析。
在一个示例性的分析中,推断引擎120通过使用上述基于组的估计导出整个网络的状态报告,以生成识别出被监控网络135中存在问题的部分的报告。
在另一个示例性的分析中,推断引擎120通过使用对于所有粒状分组的状态估计来诊断被监控网络135中出现的问题,作为问题标记。与通过探测整个网络而得到的结果进行比较,由采样导出的问题标记具有小得多的尺度。这使得能够更容易地在问题标记与历史调整或知识基础之间进行映射。这种映射即可以手动完成也可以通过机器学习技术自动地完成,其中所述系统可以识别一个用于在当前样本中观察到的问题的可能解决方案的列表。
在另外一个示例性的分析中,推断引擎120使用由采样导出的状态估计预先检测被监控网络135中的问题。由于状态参数不一定是二值的(例如有故障或没有故障),它也可以是一个连续的变量(例如在至有线调制解调器的信道上的信噪比(SNR))。在实际中往往是这样的情况:即当这些参数值落在某个特定的范围中时,可能在将来潜在地触发更为严重的问题。例如,如果从一组节点测得的SNR很低,可能意味着上层节点需要维护或更换。通过使用状态估计,像这样的问题可以在影响被监控网络135之前被检测出来。
根据本发明的一个示例性实施例,由于所采样的节点的状态代表相应节点的状态,整个被监控网络的状态可以从采样数据中推断出来。另外,由于粒状分组的数目比网络中所有节点的数目要小得多,采用这种方法所导致的经常性开销要比不采用该方法时用于监控整个网络所需的开销低得多。因此,这种系统可用在大规模分布式网络的实时监控中。
应当理解的是,除了上述的组件之外,网络监控站105还可包括或体现为连接到操作人员的控制台的计算机。该计算机包括中央处理单元(CPU)以及连接到输入设备和输出设备的存储器。所述CPU可包括到或连接到组分析器110、数据采样器115和推断引擎120。
所述存储器包括随机访问存储器(RAM)或只读存储器(ROM)。所述存储器也可包括数据库、盘驱动器、磁带驱动器等,或者其组合。RAM作为数据存储器来工作,其存储在CPU中执行程序时所使用的数据,并被用作工作区。ROM作为程序存储器来工作,用于存储在CPU中执行的程序。输入由键盘、鼠标等构成,输出由液晶显示器(LCD)、阴极射线管(CRT)显示器、打印机等构成。
所述系统的操作可以由操作人员的控制台来控制,所述控制台包括控制器(例如键盘和显示器)。操作人员的控制台与PC进行通信,使得可以在显示器上观看到例如由组分析器110、数据采样器115和推断引擎120所采集的数据。在没有操作人员的控制台的情况下,例如通过使用所述输入和输出设备,PC可以被配置为操作和显示由组分析器110、数据采样器115和推断引擎120所提供的信息,以执行由控制器和显示器所实现的特定任务。
应当理解的是,本发明可以通过硬件、软件、固件、专用处理器及其组合的多种形式实现。在一个实施例中,本发明可以通过软件来实现,所述软件作为在程序存储设备(例如软磁盘、RAM、CD ROM、DVD、ROM和闪存)上切实体现的应用程序。该应用程序可以被上传到包括任意适用结构的机器上,并由该机器来执行。
还应当理解的是,由于附图中所示的构成该系统的某些组件和某些方法步骤空过软件来实现,因此在这些系统组件(或方法步骤)之间的实际连接关系可能根据本发明的编程方式而有所不同。在给出了这里所提供的本发明的指导的情况下,本领域普通技术人员将能够完成本发明的这些或类似的实施方式或配置。
还应当理解的是,上述描述仅代表作为说明性的实施例。为了方便读者,上述描述集中在可能的实施例的一个代表性的样本上,这个样本用来说明本发明的原理。本说明书并非试图穷举所有可能的变体。一些替代实施例可能没有在本发明的特定部分给出,或者另外一些未被描述的变体可能对于本发明的一部分来说是可获得的,这不应认为是放弃了这些替代实施例。也可以实现其它应用和实施例,而不背离本发明的主旨和保护范围。
因此,本发明不限于那些具体描述的实施例,因为上述实施方式以及涉及对上述内容的非创造性替换的实施方式的多种变换和组合均可以实现,但本发明是根据后面的权利要求书来限定的。可以看到,许多没有详细描述的实施例也在后面的权利要求书的字面范围内,其它实施例也是等效的。

Claims (12)

1.一种用于监控网络的方法,该方法包括:识别网络中的多组设备,其中所述多组设备中的每组设备是相关设备的一个集合;
对所述多组设备中的每组设备中的一组节点的状态进行采样,其中所述多组设备中的每组设备具有多组节点;并且
根据所采样的所述多组设备中的每组设备中的节点组的状态确定该网络的状态。
2.如权利要求1所述的方法,其中网络中的所述多组设备是通过以下方式来识别的:
接收该网络的拓扑结构或该网络的历史监控数据作为输入;并且
当接收该网络的拓扑结构时,根据该网络的拓扑结构的节点连接关系确定所述多组设备;或者
当接收该网络的历史监控数据时,根据从该网络的节点所采集的历史数据确定所述多组设备。
3.如权利要求1所述的方法,其中网络中的所述多组设备还通过以下方式来识别:
接收该网络的局部拓扑结构和该网络的历史监控数据作为输入;并且
根据该网络的局部拓扑结构的节点连接关系和从该网络的节点所采集的历史数据确定所述多组设备。
4.如权利要求1所述的方法,其中所述多组设备中每组设备中的节点组的状态通过将探测单元发送到所述多组设备中每组设备中的一组节点而被采样。
5.如权利要求4所述的方法,其中发送给具有数目较多的设备的设备组的探测单元比发送给具有数目较少的设备的设备组的探测单元要多。
6.如权利要求4所述的方法,其中当设备组具有数目相同的设备时,发送给具有状态可变性较高的设备的设备组的探测单元比发送给具有状态可变性较低的设备的设备组的探测单元要多。
7.如权利要求1所述的方法,其中网络的状态通过以下方式来确定:
通过使用所述多组设备中每组设备的一组节点的所采样的状态来估计所述多组设备中每组设备的状态;并且
生成所述多组设备的状态估计。
8.如权利要求7所述的方法,还包括:
通过使用所述状态估计来生成网络的状态报告,以识别出网络中存在问题的部分。
9.如权利要求8所述的方法,还包括:通过使用所述多组设备的状态估计生成当前问题标志;并且
将所述当前问题标志与先前的问题标志进行比较,以识别出网络中当前所发生的问题。
10.如权利要求9所述的方法,还包括:
将所述当前问题标志与所述多组设备的预测的状态估计结合起来,以判断在网络中是否即将发生未来的问题;并且
确定采取哪些措施来避免在网络中发生未来的问题。
11.一种用于监控网络的系统,该系统包括:
用于存储程序的存储设备;
与所述存储设备进行通信的处理器,所述处理器以所述程序来操作,从而:
识别网络中的多组设备,其中所述多组设备中的每组设备是相关设备的一个集合;
对所述多组设备中每组设备中的一组节点的状态进行采样,其中所述多组设备中的每组设备具有多组节点;并且
根据所述多组设备中每组设备中的节点组的所采样的状态来确定网络状态。
12.一种用于监控网络的系统,该系统包括用于执行上述方法权利要求中的任一项所述方法的装置。
CN2008100026951A 2007-01-29 2008-01-14 用于监控的系统和方法 Expired - Fee Related CN101237356B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/668,225 US20080181134A1 (en) 2007-01-29 2007-01-29 System and method for monitoring large-scale distribution networks by data sampling
US11/668,225 2007-01-29

Publications (2)

Publication Number Publication Date
CN101237356A true CN101237356A (zh) 2008-08-06
CN101237356B CN101237356B (zh) 2012-05-23

Family

ID=39667854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100026951A Expired - Fee Related CN101237356B (zh) 2007-01-29 2008-01-14 用于监控的系统和方法

Country Status (2)

Country Link
US (1) US20080181134A1 (zh)
CN (1) CN101237356B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430592B2 (en) * 2004-04-21 2008-09-30 Dell Products L.P. Method for heterogeneous system configuration
US8625457B2 (en) 2007-12-03 2014-01-07 International Business Machines Corporation Method and apparatus for concurrent topology discovery
GB2464125A (en) * 2008-10-04 2010-04-07 Ibm Topology discovery comprising partitioning network nodes into groups and using multiple discovery agents operating concurrently in each group.
US10623285B1 (en) * 2014-05-09 2020-04-14 Amazon Technologies, Inc. Multi-mode health monitoring service
US10044581B1 (en) 2015-09-29 2018-08-07 Amazon Technologies, Inc. Network traffic tracking using encapsulation protocol
US10033602B1 (en) 2015-09-29 2018-07-24 Amazon Technologies, Inc. Network health management using metrics from encapsulation protocol endpoints
US10862777B2 (en) 2016-09-28 2020-12-08 Amazon Technologies, Inc. Visualization of network health information
US10243820B2 (en) 2016-09-28 2019-03-26 Amazon Technologies, Inc. Filtering network health information based on customer impact
US10917324B2 (en) 2016-09-28 2021-02-09 Amazon Technologies, Inc. Network health data aggregation service
US10911263B2 (en) 2016-09-28 2021-02-02 Amazon Technologies, Inc. Programmatic interfaces for network health information
US11140020B1 (en) 2018-03-01 2021-10-05 Amazon Technologies, Inc. Availability-enhancing gateways for network traffic in virtualized computing environments
CN118245724B (zh) * 2024-05-28 2024-08-23 国网甘肃省电力公司兰州供电公司 面向电力电网设施全寿命周期抽样统计诊断平台及方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5878420A (en) * 1995-08-31 1999-03-02 Compuware Corporation Network monitoring and management system
US6310909B1 (en) * 1998-12-23 2001-10-30 Broadcom Corporation DSL rate adaptation
US6278694B1 (en) * 1999-04-16 2001-08-21 Concord Communications Inc. Collecting and reporting monitoring data from remote network probes
US6772437B1 (en) * 1999-07-28 2004-08-03 Telefonaktiebolaget Lm Ericsson Cable modems and systems and methods for identification of a noise signal source on a cable network
US20020177910A1 (en) * 2000-04-19 2002-11-28 Quarterman John S. Performance measurement system for large computer network
JP2001356972A (ja) * 2000-06-15 2001-12-26 Fast Net Kk ネットワーク監視システム及びネットワーク監視方法
US7225250B1 (en) * 2000-10-30 2007-05-29 Agilent Technologies, Inc. Method and system for predictive enterprise resource management
US20020144287A1 (en) * 2001-03-30 2002-10-03 Kabushiki Kaisha Toshiba Cable modem, head end system, and channel change method for bi-directional communication system
ES2186531B1 (es) * 2001-04-19 2005-03-16 Diseño De Sistemas En Silicio, S.A. Procedimiento de acceso multiple y multiple transmision de datos para un sistema multiusuario de transmision digital de datos punto a multipunto sobre red electrica.
CA2363370C (en) * 2001-11-21 2010-09-14 Consultronics Limited Single ended dmt test method for determining dsl capability of cables
US20040103442A1 (en) * 2002-11-27 2004-05-27 Eng John W. End of line monitoring of point-to-multipoint network
US20060004917A1 (en) * 2004-06-30 2006-01-05 Wang Winston L Attribute grouping for management of a wireless network
ATE501591T1 (de) * 2004-12-24 2011-03-15 Alcatel Lucent Testverfahren und einrichtung zur identifizierung von internen leitungsproblemen
CN100361461C (zh) * 2005-01-11 2008-01-09 东南大学 基于抽样测量的端到端运行性能监测方法
US7577738B1 (en) * 2005-08-01 2009-08-18 Avaya Inc. Method and apparatus using voice and data attributes for probe registration and network monitoring systems
CN1794242B (zh) * 2005-09-09 2010-04-28 浙江大学 一种故障诊断数据采集与发布方法
US7848337B1 (en) * 2006-11-14 2010-12-07 Cisco Technology, Inc. Auto probing endpoints for performance and fault management

Also Published As

Publication number Publication date
CN101237356B (zh) 2012-05-23
US20080181134A1 (en) 2008-07-31

Similar Documents

Publication Publication Date Title
CN101237356B (zh) 用于监控的系统和方法
US8238263B2 (en) Network status detection
US10601688B2 (en) Method and apparatus for detecting fault conditions in a network
EP2695035B1 (en) Grid event detection
CN107707376B (zh) 一种监控和告警的方法和系统
US10153950B2 (en) Data communications performance monitoring
US7634682B2 (en) Method and system for monitoring network health
JP2008283621A (ja) ネットワーク輻輳状況監視装置、ネットワーク輻輳状況監視方法及びプログラム
EP2887578A1 (en) Network fault detection and location
CN118740678A (zh) 网络设备的故障检测方法、装置及电子设备
CN112994972A (zh) 一种分布式探针监测平台
CN110474821A (zh) 节点故障检测方法及装置
CN115987827B (zh) 一种设备监测方法、装置、电子设备及可读介质
CN113300914A (zh) 网络质量监测方法、装置、系统、电子设备和存储介质
CN109462493B (zh) 一种基于ping的局域网络监测方法
CN116204386B (zh) 应用服务关系自动识别及监控方法、系统、介质和设备
KR100500836B1 (ko) 매트로 이더넷망의 장애처리 장치 및 그 방법
CN104584515B (zh) 过程控制系统中的通信配置分析
EP2887579A1 (en) Data communications performance monitoring using principal component analysis
CN118250154A (zh) 故障定位方法、装置、设备及存储介质
CN111261271B (zh) 一种针对视频监控环境的业务可用性诊断方法及装置
KR101027261B1 (ko) 공정 제어 네트워크에서 정책 기반의 장애 탐지 방법 및 시스템
CN107426044B (zh) 一种串线检测方法、装置及操作维护服务器
CN112541573B (zh) 一种神经网络的训练方法和装置
JP4199268B2 (ja) Catv伝送路監視装置、方法及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180614

Address after: 7 floor, building 10, Zhang Jiang Innovation Park, 399 Keyuan Road, Zhang Jiang high tech park, Pudong New Area, Shanghai.

Patentee after: International Business Machines (China) Co., Ltd.

Address before: American New York

Patentee before: International Business Machines Corp.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20190114