Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR PROCESSING OSCILLATING ALARM IN NETWORK MANAGEMENT SYSTEM
Document Type and Number:
WIPO Patent Application WO/2013/155778
Kind Code:
A1
Abstract:
Disclosed is a method and device for processing an oscillating alarm in a network management system (NMS). The method comprises: determining whether a received alarm message is an alarm reporting message or an alarm recovery message; in the case of an alarm reporting message, if it is determined that the alarm reporting message satisfies an alarm condition in a preset continuously oscillating alarm pool, further determining whether the duration of the alarm reporting message is greater than or equal to a preset oscillation time threshold, and if yes, determining that an alarm corresponding to the alarm reporting message does not oscillate; if it is determined that the alarm reporting message does not satisfy the alarm condition in the preset continuously oscillating alarm pool, reporting the alarm reporting message to an NMS; in the case of an alarm recovery message, determining whether the duration of an alarm reporting message corresponding to the alarm recovery message is smaller than a preset oscillation threshold, and if yes, determining that an alarm corresponding to the alarm recovery message does not oscillate. Using fewer system resources, the present invention shields the NMS from oscillating alarms in the element management system.

Inventors:
XU CHUNSHENG (CN)
JIA TINGYAO (CN)
Application Number:
PCT/CN2012/076929
Publication Date:
October 24, 2013
Filing Date:
June 14, 2012
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ZTE CORP (CN)
XU CHUNSHENG (CN)
JIA TINGYAO (CN)
International Classes:
H04W24/04
Foreign References:
CN101076174A2007-11-21
CN101296466A2008-10-29
CN101662382A2010-03-03
CN101014179A2007-08-08
Attorney, Agent or Firm:
CHINA PAT INTELLECTUAL PROPERTY OFFICE (CN)
北京派特恩知识产权代理事务所(普通合伙) (CN)
Download PDF:
Claims:
权利要求书

1、 一种网管系统中振荡告警的处理方法, 其中, 包括:

判定接收到的告警消息是告警上报消息还是告警恢复消息;

对于告警上报消息, 如果判定其符合预定持续振荡告警池中的告警条 件, 则还判断该告警上报消息的持续时间是否大于或等于预定振荡时间阈 值, 如果是, 则判定该告警上报消息对应的告警未发生振荡; 如果判定其 不符合预定持续振荡告警池中的告警条件, 则将该告警上报消息上报给网 络管理系统;

对于告警恢复消息, 判断该告警恢复消息对应的告警上报消息的持续 时间小于预定振荡时间阈值时, 判定该告警恢复消息对应的告警发生振荡。

2、 根据权利要求 1所述的方法, 其中, 所述预定持续振荡告警池由最 近一个周期内振荡次数超过预定阈值次数的告警的告警条件组成。

3、 根据权利要求 1所述的方法, 其中, 判定该告警上报消息对应的告 警未发生振荡, 包括:

将该告警上报消息放入预定振荡处理緩存队列中, 对该告警上报消息 设定一个值为 n的告警计数器并开始进行周期性轮询, 每次轮询时告警计 数器的值减一, 当告警计数器的值减到零时, 判定该告警上报消息对应的 告警未发生振荡; 其中, n为所述预定振荡时间阈值除以预定轮询周期的结 果。

4、 根据权利要求 3所述的方法, 其中, 判定该告警恢复消息对应的告 警发生振荡, 包括:

通过告警流水号判断该告警恢复消息对应的告警上报消息是否在预定 振荡处理緩存队列里, 如果在, 说明该告警恢复消息对应的告警上报消息 的持续时间小于预定振荡时间阈值, 判定该告警恢复消息对应的告警发生 振荡; 如果不在, 则将该告警恢复消息上报到网络管理系统。 5、 根据权利要求 4所述的方法, 其中, 还包括:

当判定该告警恢复消息对应的告警发生振荡时, 将该条告警对应的告 警恢复消息和告警上报消息进行屏蔽, 同时在振荡处理緩存队列中清除该 告警上报消息, 并且将该条告警的相关信息记录到预定历史事件库中; 或 者, 将该告警恢复消息上报到网络管理系统, 同时将该告警恢复消息对应 的告警的相关信息记录到预定历史告警库中。

6、 根据权利要求 5所述的方法, 其中, 还包括:

周期性对预定历史事件数据库和预定历史告警库中的告警进行统计, 并根据本周期统计的相同告警发生振荡的次数、 上周期统计的相同告警发 生振荡的次数, 以及预定阈值次数进行分析, 对预定持续振荡告警池进行 维护和更新。

7、 根据权利要求 6所述的方法, 其中, 根据本周期统计的相同告警发 生振荡的次数、 上周期统计的相同告警发生振荡的次数, 以及预定阈值次 数进行分析, 包括:

如果本周期统计相同告警发生振荡的次数大于等于预定阈值次数, 但 上周期统计未超过预定阈值次数, 则该告警属于新增的持续振荡告警, 将 其对应的告警条件增加到持续振荡告警池;

如果本周期统计相同告警发生振荡的次数大于等于预定阈值次数, 而 且上周期统计也超过预定阈值次数, 则该告警仍然为持续振荡状态;

如果本周期统计相同告警发生振荡的次数低于预定阈值次数, 但上周 期统计超过预定阈值次数, 则该告警已终止持续振荡, 从持续振荡告警池 中清除该告警的告警条件。

8、 根据权利要求 7所述的方法, 其中, 还包括:

对于新增的持续振荡告警, 发送一条新的告警上报消息通知网络管理 系统该告警发生了持续振荡。 9、 根据权利要求 7所述的方法, 其中, 还包括:

对于仍然为持续振荡状态的持续振荡告警, 发送对应的告警更新消息 通知到网络管理系统。

10、 根据权利要求 7所述的方法, 其中, 对于已终止的持续振荡告警, 发送对应的告警恢复消息到网络管理系统。

11、 一种网管系统中振荡告警的处理装置, 其中, 包括:

接收判断单元, 用于判定接收到的告警消息是告警上报消息还是告警 恢复消息, 如果是告警上报消息, 触发上报消息处理单元; 如果是告警恢 复消息, 触发恢复消息处理单元;

上报消息处理单元, 用于对于告警上报消息, 如果符合预定持续振荡 告警池中的告警条件, 则还判断该告警上报消息的持续时间是否大于或等 于预定振荡时间阈值, 如果是, 则判定该告警上报消息对应的告警未发生 振荡; 如果不符合预定持续振荡告警池中的告警条件, 则将该告警上报消 息上报给网络管理系统;

恢复消息处理单元, 用于对于告警恢复消息, 判断该告警恢复消息对 应的告警上报消息的持续时间是否小于预定振荡时间阈值, 如果是, 则判 定该告警恢复消息对应的告警发生振荡。

12、 根据权利要求 11所述的装置, 其中, 所述预定持续振荡告警池由 最近时期内振荡次数多于预定阈值次数的告警的告警条件组成。

13、 根据权利要求 11所述的装置, 其中, 所述上报消息处理单元还包 括:

第一处理模块, 用于对于告警上报消息, 如果判定其符合预定持续振 荡告警池中的告警条件时, 触发第二处理模块; 如果判定其不符合预定持 续振荡告警池中的告警条件, 则将该告警上报消息上报给网络管理系统; 第二处理模块, 用于将告警上报消息放入预定振荡处理緩存队列中, 对该告警上报消息设定一个值为 n的告警计数器并开始进行周期性轮询, 每次轮询时告警计数器的值减一, 当告警计数器的值减到零时, 判定该告 警上报消息对应的告警未发生振荡; 其中, n为所述预定振荡时间阈值除以 预定轮询周期的结果。

14、根据权利要求 13所述的方法,其中, 所述恢复消息处理单元用于, 通过告警流水号判断该告警恢复消息对应的告警上报消息是否在预定振荡 处理緩存队列里, 如果在, 说明该告警恢复消息对应的告警上报消息的持 续时间小于预定振荡时间阈值, 判定该告警恢复消息对应的告警发生振荡; 如果不在, 则将该告警恢复消息上报到网络管理系统。

15、 根据权利要求 14所述的装置, 其中, 所述恢复消息处理单元还用 于,

当判定该告警恢复消息对应的告警发生振荡时, 将该条告警对应的告 警恢复消息和告警上报消息进行屏蔽, 同时在振荡处理緩存队列中清除该 告警上报消息, 并且将该条告警的相关信息记录到预定历史事件库中; 或 者, 将该告警恢复消息上报到网络管理系统的同时, 将该告警恢复消息对 应的告警的相关信息记录到预定历史告警库中。

16、 根据权利要求 15所述的装置, 其中, 还包括:

维护更新单元, 用于周期性对预定历史事件数据库和预定历史告警库 中的告警进行统计, 并根据本周期统计的相同告警发生振荡的次数、 上周 期统计的相同告警发生振荡的次数, 以及预定阈值次数进行分析, 对预定 持续振荡告警池进行维护和更新。

Description:
网管系统中振荡告警的处理方法及装置 技术领域

本发明涉及通信技术领域, 尤其涉及一种网管系统中振荡告警的处理 方法及装置。 背景技术

在现网环境中, 当电信设备产生告警时, 设备首先上报到网元管理系 统( EMS, Element Management System ), 然后 EMS将设备的告警消息上 报到网络管理系统( NMS , Network Management System )。 NMS系统根据 接收的告警消息派生出工单, 通知电信系统运维人员及时进行设备故障检 测及修复。 设备故障修复后, 设备会上报告警恢复消息到 EMS, EMS再将 恢复消息上报的 NMS, 关闭派生的工单, 整个流程结束。 但由于网络不稳 定或者某种原因的异常情况下, 可能导致某个网元, 短时间内频繁上报和 恢复同一告警, 这些告警虽然标识不同, 但告警码和告警发生位置都相同, 也即通常说的告警振荡, 告警振荡在一定统计周期内达到一定频率, 称之 为告警持续振荡。 NMS收到振荡告警后, 工单很可能还来不及处理, 告警 又自动恢复了, 产生大量无效工单, 因此需要对振荡告警从 EMS上进行有 效屏蔽, 不上报 NMS。 同时, 若设备出现持续振荡告警, 很可能设备正处 于非正常运行状态, 如果不及时处理, 也可能会给系统的运行带来隐患。 因此, 作为一个稳定可靠的 EMS网管, 必须要解决振荡告警上报问题。

现有抑制告警振荡的方法通常是采用振荡告警 緩存队列, 计算告警恢 复时间, 如果恢复时间较短, 直接进行告警丟弃。 这种做法存在很多局限 性, 例如, 需要对所有告警都先放入緩存队列, 这样会导致普通非振荡告 警的上报产生延迟, 而且都要先占用系统緩存, 更多占用 EMS系统运行资 源, 而且当所有振荡告警被屏蔽后, NMS系统无法了解并消除由于设备存 在持续振荡告警带来的系统运行隐患。 发明内容

鉴于上述的分析, 本发明旨在提供一种网管系统中振荡告警的处 理方 法及装置, 用以解决现有技术中告警振荡抑制方法所存在 的缺陷。

本发明的目的主要是通过以下技术方案实现的 :

本发明提供了一种网管系统中振荡告警的处理 方法, 包括:

判定接收到的告警消息是告警上报消息还是告 警恢复消息;

对于告警上报消息, 如果判定其符合预定持续振荡告警池中的告警 条 件, 则还判断该告警上报消息的持续时间是否大于 或等于预定振荡时间阈 值, 如果是, 则判定该告警上报消息对应的告警未发生振荡 ; 如果判定其 不符合预定持续振荡告警池中的告警条件, 则将该告警上报消息上报给网 络管理系统;

对于告警恢复消息, 判断该告警恢复消息对应的告警上报消息的持 续 时间小于预定振荡时间阈值时, 判定该告警恢复消息对应的告警发生振荡。

其中, 所述预定持续振荡告警池由最近一个周期内振 荡次数超过预定 阈值次数的告警的告警条件组成。

优选地, 判定该告警上报消息对应的告警未发生振荡, 包括: 将该告警上报消息放入预定振荡处理緩存队列 中, 对该告警上报消息 设定一个值为 n的告警计数器并开始进行周期性轮询, 每次轮询时告警计 数器的值减一, 当告警计数器的值减到零时, 判定该告警上报消息对应的 告警未发生振荡; 其中, n为所述预定振荡时间阈值除以预定轮询周期 结 果。

优选地, 判定该告警恢复消息对应的告警发生振荡, 包括:

通过告警流水号判断该告警恢复消息对应的告 警上报消息是否在预定 振荡处理緩存队列里, 如果在, 说明该告警恢复消息对应的告警上报消息 的持续时间小于预定振荡时间阈值, 判定该告警恢复消息对应的告警发生 振荡; 如果不在, 则将该告警恢复消息上报到网络管理系统。

优选地, 还包括:

当判定该告警恢复消息对应的告警发生振荡时 , 将该条告警对应的告 警恢复消息和告警上报消息进行屏蔽, 同时在振荡处理緩存队列中清除该 告警上报消息, 并且将该条告警的相关信息记录到预定历史事 件库中; 或 者, 将该告警恢复消息上报到网络管理系统, 同时将该告警恢复消息对应 的告警的相关信息记录到预定历史告警库中。

优选地, 还包括:

周期性对预定历史事件数据库和预定历史告警 库中的告警进行统计, 并根据本周期统计的相同告警发生振荡的次数 、 上周期统计的相同告警发 生振荡的次数, 以及预定阈值次数进行分析, 对预定持续振荡告警池进行 维护和更新。

优选地, 根据本周期统计的相同告警发生振荡的次数、 上周期统计的 相同告警发生振荡的次数, 以及预定阈值次数进行分析, 包括:

如果本周期统计相同告警发生振荡的次数大于 等于预定阈值次数, 但 上周期统计未超过预定阈值次数, 则该告警属于新增的持续振荡告警, 将 其对应的告警条件增加到持续振荡告警池;

如果本周期统计相同告警发生振荡的次数大于 等于预定阈值次数, 而 且上周期统计也超过预定阈值次数, 则该告警仍然为持续振荡状态;

如果本周期统计相同告警发生振荡的次数低于 预定阈值次数, 但上周 期统计超过预定阈值次数, 则该告警已终止持续振荡, 从持续振荡告警池 中清除该告警的告警条件。

优选地, 还包括: 对于新增的持续振荡告警, 发送一条新的告警上报消息通知网络管理 系统该告警发生了持续振荡。

优选地, 还包括:

对于仍然为持续振荡状态的持续振荡告警, 发送对应的告警更新消息 通知到网络管理系统。

优选地, 对于已终止的持续振荡告警, 发送对应的告警恢复消息到网 络管理系统。

本发明还提供了一种网管系统中振荡告警的处 理装置, 包括: 接收判断单元, 用于判定接收到的告警消息是告警上报消息还 是告警 恢复消息, 如果是告警上报消息, 触发上报消息处理单元; 如果是告警恢 复消息, 触发恢复消息处理单元;

上报消息处理单元, 用于对于告警上报消息, 如果符合预定持续振荡 告警池中的告警条件, 则进一步判断该告警上报消息的持续时间是否 大于 或等于预定振荡时间阈值, 如果是, 则判定该告警上报消息对应的告警未 发生振荡; 如果不符合预定持续振荡告警池中的告警条件 , 则将该告警上 报消息上报给网络管理系统;

恢复消息处理单元, 用于对于告警恢复消息, 判断该告警恢复消息对 应的告警上报消息的持续时间是否小于预定振 荡时间阈值, 如果是, 则判 定该告警恢复消息对应的告警发生振荡。

其中, 所述预定持续振荡告警池由最近时期内振荡次 数多于预定阈值 次数的告警的告警条件组成。

优选地, 所述上报消息处理单元具体包括:

第一处理模块, 用于对于告警上报消息, 如果判定其符合预定持续振 荡告警池中的告警条件时, 触发第二处理模块; 如果判定其不符合预定持 续振荡告警池中的告警条件, 则将该告警上报消息上报给网络管理系统; 第二处理模块, 用于将告警上报消息放入预定振荡处理緩存队 列中, 对该告警上报消息设定一个值为 n的告警计数器并开始进行周期性轮询, 每次轮询时告警计数器的值减一, 当告警计数器的值减到零时, 判定该告 警上报消息对应的告警未发生振荡; 其中, n为所述预定振荡时间阈值除以 预定轮询周期的结果。

优选地, 所述恢复消息处理单元具体用于, 通过告警流水号判断该告 警恢复消息对应的告警上报消息是否在预定振 荡处理緩存队列里, 如果在, 说明该告警恢复消息对应的告警上报消息的持 续时间小于预定振荡时间阈 值, 判定该告警恢复消息对应的告警发生振荡; 如果不在, 则将该告警恢 复消息上报到网络管理系统。

优选地, 所述恢复消息处理单元还用于,

当判定该告警恢复消息对应的告警发生振荡时 , 将该条告警对应的告 警恢复消息和告警上报消息进行屏蔽, 同时在振荡处理緩存队列中清除该 告警上报消息, 并且将该条告警的相关信息记录到预定历史事 件库中; 或 者, 将该告警恢复消息上报到网络管理系统的同时 , 将该告警恢复消息对 应的告警的相关信息记录到预定历史告警库中 。

优选地, 所述装置还包括:

维护更新单元, 用于周期性对预定历史事件数据库和预定历史 告警库 中的告警进行统计, 并根据本周期统计的相同告警发生振荡的次数 、 上周 期统计的相同告警发生振荡的次数, 以及预定阈值次数进行分析, 对预定 持续振荡告警池进行维护和更新。

本发明有益效果如下:

本发明使用较少的系统资源, 既实现网元管理系统中振荡告警对 NMS 的屏蔽, 同时又对振荡频率较高的告警进行压缩汇总, 产生新的告警上报 到网络管理系统 NMS进行处理。 本发明的其他特征和优点将在随后的说明书中 阐述, 并且, 部分的从 说明书中变得显而易见, 或者通过实施本发明而了解。 本发明的目的和其 他优点可通过在所写的说明书、 权利要求书、 以及附图中所特别指出的结 构来实现和获得。 附图说明

图 1为本发明实施例所述方法的流程示意图;

图 2为本发明实施例所述装置的结构示意图。 具体实施方式

下面结合附图来具体描述本发明的优选实施例 , 其中, 附图构成本申 请一部分, 并与本发明的实施例一起用于阐释本发明的原 理。

如图 1所示, 图 1为本发明实施例所述方法的流程示意图, 具体流程 可以包括如下步驟:

步驟 101: EMS 网元管理系统接收设备上报的告警消息, 该告警消息 包括告警上报消息和告警恢复消息;

步驟 102: 判断接收到的告警消息是告警上报消息还是告 警恢复消息, 如果是告警上报消息执行步驟 103, 如果是告警恢复消息, 执行步驟 109; 步驟 103:根据该告警上报消息判断本条告警的告警 件是否满足预定 持续振荡告警池中的告警条件,如果是,执行 步驟 104, 否则执行步驟 108; 这里的预定持续振荡告警池, 它是由最近一个周期内振荡次数超过预定阈 值次数(根据实际需要设定大小) 的告警的告警条件组成, 每类告警条件 主要包括告警码和告警发生位置, 一般认为告警码和告警发生位置相同的 告警作为同一类告警, 持续振荡告警池作为是否需要进行振荡处理的 告警 判断依据。 持续振荡告警池, 初始时可以为空, 也可根据设备维护经验设 置初始值。 系统运行过程中, 该预定持续振荡告警池是由专门的定时任务 进行维护, 统计预定历史告警库和预定历史事件库中近期 内发生振荡次数 较多的告警的告警条件, 及时维护更新持续振荡告警池中的告警条件, 后 续步驟 112-步驟 117将对此进行详细说明。

以下步驟 104~步驟 108为对于告警上报消息的具体处理过程, 主要内 容包括: 判断该告警上报消息的持续时间是否大于或等 于预定振荡时间阈 值(根据实际情况设定时间长短), 如果是, 则判定该告警上报消息对应的 告警未发生振荡; 如果判定其不符合预定持续振荡告警池中的告 警条件, 则将该告警上报消息上报给 NMS;

步驟 104: 将该告警上报消息先放入预定震荡处理緩存队 列中, 并为本 周期上报的告警设置一个值为 η的告警计数器( η为预定振荡时间阈值除以 预定轮询周期的结果, 即告警的振荡时间阈值为轮询周期的 η倍, 不同种 类告警的振荡时间阈值可以设置不同 ), 然后执行步驟 106;

步驟 105: 每个轮询处理周期中,预定震荡处理緩存队列 中所有告警计 数器值减一, 直到计数器值为 0;

步驟 106: 判断告警计数器的值是否小于等于 0, 如果值减到 0, 说明 此条告警未发生振荡, 执行步驟 107, 否则执行步驟 105, 进入下个轮询周 期;

步驟 107: 此告警未发生告警振荡,从预定震荡处理緩存 队列中移除此 条告警的告警上报消息, 然后执行步驟 108;

步驟 108: EMS将该告警上报消息上报到网络管理系统 NMS;

以下步驟 109~步驟 111为对于告警恢复消息的具体处理过程, 主要内 容包括: 对于告警恢复消息, 判断该告警恢复消息对应的告警上报消息的 持续时间是否小于预定振荡时间阈值, 如果是, 则判定该告警恢复消息对 应的告警发生振荡;

步驟 109: 对于告警恢复消息, 判断该告警恢复消息对应的告警上报消 息是否在预定震荡处理緩存队列中 (可以通过告警流水号进行对应), 如果 在, 执行步驟 111; 如果不在, 执行步驟 110;

步驟 110:告警恢复消息对应的告警上报消息不在预 震荡处理緩存队 列中, 将该告警恢复消息上报到 NMS, 同时将该条告警的相关信息记录对 应告警到预定历史告警库, 包括告警起始时间、 告警持续时间、 告警码、 告警位置信息等, 步驟 112 中的持续振荡告警池定时维护任务会用到预定 历史告警库中的记录;

步驟 111:告警恢复消息对应的告警上报消息在预定 荡处理緩存队列 中, 说明此条告警的持续时间小于振荡时间阈值( 轮询周期的 n倍), 发生 了振荡, 将此条告警的告警上报消息和告警恢复消息进 行屏蔽, 都不上报 到 NMS, 同时清除预定震荡处理緩存队列中的告警上报 信息, 并将该条告 警的相关信息记录到预定历史事件库中, 包括告警起始时间、 告警持续时 间、 告警码、 告警位置信息等, 步驟 112 中的持续振荡告警池定时维护任 务会用到预定历史事件库中记录;

以下步驟 112~步驟 117为对于预定持续振荡告警池的维护和更新过 程, 主要内容包括: 定期对预定历史事件数据库和预定历史告警库 中的告警进 行统计, 并根据本周期统计的相同告警发生振荡的次数 、 上周期统计的相 同告警发生振荡的次数, 以及预定阈值次数进行分析, 对预定持续振荡告 警池进行维护和更新;

步驟 112:持续振荡告警池是由专门的定时任务进行 期性维护和更新 的, 统计出预定历史告警库和预定历史事件库中最 近一个周期内发生振荡 次数较多的告警的告警条件, 执行步驟 113;

步驟 113: 比较最近两个周期中预定持续振荡告警池的情 况, 包括以下 三种情况:

( 1 )新增的持续振荡告警的情况: 本周期统计相同告警发生振荡的次 数大于等于预定阈值次数, 但上周期统计未超过预定阈值次数, 属于新增 的持续振荡告警, 将对应的告警条件(告警、 告警发生位置等)增加到持 续振荡告警池, 同时发送一条新的告警上报消息到 NMS, 通知 NMS此类 告警发生了持续的振荡, 该新的告警上报信息中主要包括: 告警条件、 发 生振荡的次数、 发生振荡的起始时间。

( 2 )续振荡告警仍在继续的情况: 本周期统计相同告警发生振荡的次 数大于等于预定阈值次数, 而且上周期统计也超过预定阈值次数, 此告警 仍然为持续振荡状态, 发送对应的告警更新消息到 NMS, 该告警更新消息 主要包括: 告警条件、 发生振荡的次数、 发生振荡的起始时间;

( 3 )持续振荡告警已经终止的情况: 本周期统计相同告警发生振荡的 次数低于预定阈值次数, 但上周期统计超过预定阈值次数, 说明此告警持 续振荡已终止, 从持续振荡告警池中清除此类告警条件, 发送对应的告警 恢复消息来恢复( 1 ) 中发送到 NMS的新的告警上报消息和步驟 115中更 新到 NMS的告警消息;

步驟 114: 进入下个周期统计任务, 循环回到步驟 112。

下面将结合附图 2对本发明实施例所述装置进行详细说明。

如图 2所示, 图 2为本发明实施例所述装置的结构示意图, 具体可以 包括:

接收判断单元、 上报消息处理单元、 恢复消息处理单元和维护更新单 元, 以下分别对各个功能单元予以详细说明。

(一)接收判断单元, 主要负责判定接收到的告警消息是告警上报消 息还是告警恢复消息, 如果是告警上报消息, 触发上报消息处理单元; 如 果是告警恢复消息, 触发恢复消息处理单元;

(二)上报消息处理单元, 主要负责对于告警上报消息, 如果符合预 定持续振荡告警池中的告警条件, 则进一步判断该告警上报消息的持续时 间是否大于或等于预定振荡时间阈值, 如果是, 则判定该告警上报消息对 应的告警未发生振荡; 如果不符合预定持续振荡告警池中的告警条件 , 则 将该告警上报消息上报给网络管理系统; 这里的预定持续振荡告警池, 它 是由最近一个周期内振荡次数超过预定阈值次 数的告警的告警条件组成, 每类告警条件主要包括告警码和告警发生位置 , 一般认为告警码和告警发 生位置相同的告警作为同一类告警, 持续振荡告警池作为是否需要进行振 荡处理的告警判断依据。 持续振荡告警池, 初始时可以为空, 也可根据设 备维护经验设置初始值。 系统运行过程中, 该预定持续振荡告警池是由专 门的定时任务进行维护, 统计预定历史告警库和预定历史事件库中近期 内 发生振荡次数较多的告警的告警条件, 及时维护更新持续振荡告警池中的 告警条件;

该上报消息处理单元具体包括:

第一处理模块, 对于告警上报消息, 如果判定其符合预定持续振荡告 警池中的告警条件时, 触发第二处理模块; 如果判定其不符合预定持续振 荡告警池中的告警条件, 则将该告警上报消息上报给网络管理系统;

第二处理模块, 将告警上报消息放入预定振荡处理緩存队列中 , 对该 告警上报消息设定一个值为 n的告警计数器并开始进行周期性轮询, 每次 轮询时告警计数器的值减一, 当告警计数器的值减到零时, 判定该告警上 报消息对应的告警未发生振荡; 其中, n为所述预定振荡时间阈值除以预定 轮询周期的结果。

(三) 恢复消息处理单元, 主要负责对于告警恢复消息, 判断该告警 恢复消息对应的告警上报消息的持续时间是否 小于预定振荡时间阈值, 如 果是, 则判定该告警恢复消息对应的告警发生振荡。

具体的说就是, 恢复消息处理单元通过告警流水号判断该告警 恢复消 息对应的告警上报消息是否在预定振荡处理緩 存队列里, 如果在, 说明该 告警恢复消息对应的告警上报消息的持续时间 小于预定振荡时间阈值, 判 定该告警恢复消息对应的告警发生振荡; 如果不在, 则将该告警恢复消息 上报到网络管理系统。

恢复消息处理单元还用于, 当判定该告警恢复消息对应的告警发生振 荡时, 将该条告警对应的告警恢复消息和告警上报消 息进行屏蔽, 同时在 振荡处理緩存队列中清除该告警上报消息, 并且将该条告警的相关信息记 录到预定历史事件库中; 或者, 将该告警恢复消息上报到网络管理系统的 同时, 将该告警恢复消息对应的告警的相关信息记录 到预定历史告警库中。

(四) 维护更新单元, 用于周期性对预定历史事件数据库和预定历史 告警库中的告警进行统计, 并根据本周期统计的相同告警发生振荡的次数 、 上周期统计的相同告警发生振荡的次数, 以及预定阈值次数进行分析, 对 预定持续振荡告警池进行维护和更新。

对于本发明实施例所述装置的具体实现流程, 由于上述方法中已有详 细说明, 故此处不再赘述。

综上所述, 本发明实施例提供了一种网管系统中振荡告警 的处理方法 及装置, 具有以下优点:

采用统计学的方法统计出当前发生持续振荡的 告警, 一般情况下系统 中发生持续振荡的告警码和告警位置在一段时 间内都是稳定的, 采用统计 学的方法消耗较少的系统资源, 却能比较准确地统计出当前的实时情况, 只处理需要处理的告警, 减少了 EMS系统运行资源的消耗; 同时又对振荡 频率较高的告警进行压缩汇总, 产生新的告警上报到网络管理系统 NMS, 运维人员能够及时检查并消除系统运行不稳定 的隐患。

以上所述, 仅为本发明较佳的具体实施方式, 但本发明的保护范围并 不局限于此, 任何熟悉本技术领域的技术人员在本发明揭露 的技术范围内, 可轻易想到的变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本 发明的保护范围应该以权利要求书的保护范围 为准。

工业实用性

本发明通过采用统计学的方法, 消耗较少的系统资源, 却能比较准确 地统计出当前的实时情况, 只处理需要处理的告警, 减少了 EMS系统运行 资源的消耗; 同时又对振荡频率较高的告警进行压缩汇总, 产生新的告警 上报到网络管理系统 NMS, 运维人员能够及时检查并消除系统运行不稳定 的隐患。