中国石油天然气股份有限公司网络系统监控管理项目
一.客户背景
中国石油天然气股份有限公司(简称“中石油”)是按专业公司制组成的一家庞大的石油天然气公司,广泛从事与石油、天然气有关的各项业务。企业计算机网络是一个借助公共电信网环境建立起来的集数据、语音和视频为一体的综合业务企业信息网络,涵盖中国石油总部和勘探与生产、炼化、销售及天然气与管道板块所属的80几个地区公司,遍布全国十几个大中城市。各种不同厂家的不同网络设备分布在整个石油股份企业的各个单位和部门。网上应用除传统的计算机数据通讯外,还包括INTERNET浏览、E-MAIL、EIP、办公自动化、电视会议、IP电话等多种应用。网上用户达十几万。
二.项目需求
中国石油广域网是一个庞大而复杂的系统,具有规模大,应用多的特点,为保证网络的正常运行和安全及信息的实时传输,仅靠单纯的人工管理,被动式的检查维护已无法满足整个系统的良好运转的需要。如何面对并处理网络中众多设备发出的事件报告,如何在当网络中出现故障时能在最短时间内检测发现源故障点,所有的这些要求摆在网络管理人员的面前。
对于如此规模的网络环境,如此重要的应用系统应用,必须对其进行有效的监控管理,减少问题的发生,提高系统的可用性。
中国石油天然气股份有限公司的系统管理压力是显而易见的,急需一个有效的管理机制,来实施对所有的网络系统进行全面的集中控管,通过这种管理机制完成中国石油网络系统的性能优化,将系统管理人员从繁杂的人工管理中解放出来,真正做到“减压增效,确保安全运行”的目标。
中国石油自2004年实施网络管理系统项目,到目前为止已经取得了阶段性成果,在总部和试点单位初步构建了功能实用的网络管理系统,并初步建立了相关的网络管理制度,在网管系统的运行维护过程中培养了一批网管领域的技术骨干力量。
其他需求如:自建库、虚拟参考咨询、论文服务等。
中国石油目前主要使用的网络管理软件包括:
HP Openview Operation&Performance
HP OpenView Network Node Manager
HP OpenView Smart Plug-Ins
HP OpenView Internet Service
HP OpenView Service Desk
各个系统和工具的使用在一定程度上提升了中国石油的网络管理水平,同时也暴露出了一些问题,在本次进行推广的过程中,不但要发扬原来网络系统管理建设的成功,同时,也要针对现有的问题,进行必要的完善和升级。
基于上述中国石油网络系统管理软件的使用情况,易宝公司认为在二期网管系统推广时,不仅要考虑网管产品本身,更要充分调查了解总部和各二级单位的实际情况,更多地考虑培养使用人员的运维技能,以及建立符合中国石油自身特点、与网管系统相结合的运维流程。简而言之:人员、流程和技术三者密不可分。基于以上的管理现状和网络管理发展趋势,通过此次项目实现的总体目标如下:
1、消除故障隐患、提高管理水平:
经过对以往故障的分析,我们发现,由于当前IT系统比较庞大而且复杂,同时涉及到的技术和管理层面又很多,因而造成IT系统维护工作的整体逻辑不完整或者缺乏有效控制,进而造成整体技术环节无法有效协调,最终引起IT系统的故障。这类原因引起的故障在系统故障的总体构成中占有很大的比重,所以在IT服务管理的初期目标中,我们把实现对IT系统所有关键配置和关键操作的协调控制、消除故障隐患作为最重要的一个内容。
2、快速定位故障、及时恢复服务:
由于当前IT技术的复杂性、广泛性,想做到对所有故障的预先控制或消除是极其困难的,但这些不可预见的故障对IT服务还是构成了很大的威胁。为了提高IT服务管理水平、提高中国石油的整体实力,在IT服务管理系统建设的初期目标中,将建立相对完整的IT组件监控体系,并对关键的网络系统、业务应用系统建立完整的内部逻辑监控体系,实现快速定位和排除故障、快速恢复服务的目标。
三.解决方案的应用
根据易宝对于项目需求的理解,中国石油全网网络拓扑结构为总部~区域中心~地区公司网络中心的树型结构。其中总部~区域中心的广域网组成一级骨干网,区域中心~地区公司的广域网为二级骨干网,由一级骨干网和二级骨干网构成整个网络的骨干网。一级骨干网包括总部和区域中心,以总部节点作为一级骨干网的中心节点,区域中心节点均直接接入总部。对于这样一个庞大的网络,单靠管理中心的单点管理是很难满足对全网进行有效监控的需求的。因此,必须进行有效的划分,通过合理的配置,实现管理的要求。
根据以上实际情况,本系统通过HP OpenView的分布式管理实现中国石油的管理需求。
1、消除故障隐患、提高管理水平:
总部中心的管理平台和各区域的管理工作站分工协作,结构分明,其主要特点和实现的功能如下:

拓扑上传:各区域中心管理各区域的网络结构、网络设备的状态设置为定期上传到中心管理平台,这样,中心管理工作站不必要对各区域的网络设备进行轮询监测,而是通过分管理平台的管理,而获得汇总的网络设备状态。这样可大大节省网络带宽的占用。同时各区域的管理工作主要由各地进行,中心进行集中监控,从而实现对全网网络拓扑、网络设备状态的监控。
事件上传:中石油各区域网的网络故障主要由各区域中心本地进行处理,同时对于重要的网络故障,可根据管理要求,设置上报到总部中心管理平台,这样,一般的故障事件由本地人员处理,职责明确;重要事件汇报到总部网管中心,总部网管中心可以监控到,从而可以协助区域本地网管人员进行管理。同时,总部管理中心对各区域起到监控作用。
数据汇总:对于各区域中心的网络性能数据和网络链路数据由各区域进行采集,并可通过本地报表工具进行统计分析;同时可设置相应策略对各区域的网络性能数据定期汇总到总部管理中心,由管理中心生成所需要的全网范围的管理报表。同时各区域的资产信息,事件信息也可汇总到总部管理中心,由管理中心汇总处理。
2、分权管理,明确职责
中国石油的IT管理人员角色可以划分为管理员Administrator,操作员Operator,以及管理模版的编辑人员,每种角色有多个管理员,一个管理员也可以充当不同的角色。综合管理平台支持用户身份的管理,通过图形化界面的设置,最高级管理员(Administrator)可以非常方便地设定其他系统管理员(Operator)的管理权限,明确定义出每一个管理员的管理对象、查看的消息组等。OVO所管理的每一个对象(主机、网络设备等)都会纳入一个或多个管理对象组中。对于系统所产生的每一个事件都可以在事件定义中设定所属的分组,既可以将它归类于已有分组,也可以创建新的分组,这样就可以对每一个用户设定出由管理对象分组和事件分组定义出的一个阵列,准确描述每一个用户的权限,和可以看到的事件。同时管理员还可以定义每一个操作者所使用的管理工具。由此实现了各司其职、人尽其能的管理方式。
管理人员登陆系统需要管理口令的验证,并且操作动作会以日志的形式存在,保障了分权管理的安全性。
3、功能逻辑构架
(1)、综合监控管理平台

在中国石油系统管理项目中,易宝公司采用集成的综合监控管理平台HP Openview Operations软件实现,其主要功能是将各个组件管理系统的事件(包括主机系统、数据库系统、中间件系统)集中起来统一报告给用户,即将所有告警事件都显示在同一个事件浏览器中,管理人员只需监控这一个事件浏览器就可以知道整个IT环境中发生的所有事件,可以采用相应的报警方式(如Email, 声音等)通知管理员。使得管理员不必要实时查看事件浏览器。
(2)、组件管理
组件管理包括系统管理、数据库管理、中间件管理、应用管理等功能,它们分别由Openview不同的功能模块实现,组件管理是指每一个功能模块都只管理整个IT环境中的某个方面,用户需要采用不同工具监控不同的组件。所有这些组件管理工具所产生的告警事件都可以发送到Operations的集中控制台上,达到统一事件告警的目的。对于其他厂家的产品,Operations提供命令行或API接口将监控到的事件发送到Operations的监控台上。
4、产品部署

(1)、总部网管中心
在中石油总部中心建立网络系统管理平台,实现对网络系统的综合管理,包括网络管理、主机系统管理、数据库应用管理、报表管理和服务支持平台等管理工作,实现对全国一级骨干网络的监控和总部系统主机及应用的监控。总部网管系统包括:
HP OpenView Operation & Performance统一综合管理平台,实现对网络系统、主机系统的统一监控管理;同时结合集成商的二次开发和定制来实现对特定业务系统的管理,并将所有的管理工作都集成在OpenView统一管理平台中;
HP OpenView Network Node Manager实现网络系统的拓扑监控、故障处理、性能采集等工作,并集成于OVO中,实现统一的网络事件处理;
HP OpenView SPI for DB 实现对中国石油系统环境中各个数据库系统的管理,包括故障监控和性能管理;
HP OpenView Internet Service实现对互联网服务的监控管理,包括WEB访问、邮件服务器的健康状况等;
MAS-N实现网络的设备管理、性能分析和故障统计;
MAS-O为网络提供完善、详尽的报表功能、设备管理、性能分析、故障统计;
(2)、区域网管中心(9个)
在9个区域中心建立分管理平台,实现对各区域的网络系统的综合管理,包括网络管理、主机系统管理、数据库应用管理、报表管理和服务支持平台等管理工作:
HP OpenView Network Node Manager实现网络系统的拓扑监控、故障处理、性能采集等工作;
MAS-N实现网络的设备管理、性能分析和故障统计。
(3)报表实施和开发
IT运维管理的过程中,常需要根据各种系统中各式各样的数据生成大量的系统报表,一方面记录系统运行的历史情况,向相关管理人员或用户提供系统的详细服务情况报告,另一方面为了解系统现状、系统未来发展和规划提供必要的决策支持。优秀的综合报表系统需要准确的统计分析,简易快捷的以中文报表和图形方式呈现,让负责人能一目了然的了解IT的运营状况及未来的趋势发展,结合业界技术参考和理论依据,以科学、准确的数据为综合管理提供决策支持。易宝电脑系统(北京)有限公司作为HP Openview授权技术中心,根据多年的网络管理经验和客户需求,秉承上述理念自主开发了网管综合统计分析系统。产品是一个基于Web实现的智能报表平台,能够自动从各种主流网络与系统管理平台(如:HP Openview NNM/OVO/等网络管理平台软件)中收集网络设备、主机系统、骨干链路的配置、性能、故障等数据。通过对数据仓库中的数据进行贴近客户的整理分析,根据模板规则自动创建有针对性的,以图形和表格等表现形式的分析报表。灵活的交互视图查询,网管报表快捷打印,加上良好的扩展性能,满足客户决策对网络管理资源、性能、故障告警等基础信息的需求,帮助用户真正的发挥网管的作用,并清晰、全面地把握自己的网络。
易宝公司根据中石油的网络特点,开发实施的报表功能如下:
A)、网络资源管理
易宝公司根据中石油的网络特点,开发实施的报表功能如下:
可以了解网络设备的资产状况,按照不同的厂商、不同的设备类型、不同的网段进行灵活的分类统计和配置管理,查看设备的配置信息。
◆统计网络设备的资产状况;
◆查看网络设备的配置信息,快速查看各设备的平台,位置,联系人以及系统其他信息;
◆按照设备类型、网段等信息进行灵活的分类查询和统计;
◆按照组织部门或地理区域统计网上设备资源;
◆支持IP地址模糊查询;
◆交互查询机制,资源任意检索;


B)、网络性能分析
易宝公司根据中石油的网络特点,开发实施的报表功能如下:
可针对CPU利用率、缓存利用率、内存利用率、端口输出利用率和端口输入利用率等网上资源利用状况,按日、周、月、年进行统计分析,也可根据用户定制采集的数据进行统计分析,从而预测未来网络的趋势状态,为网络的改善提供决策依据。
◆日报统计分析
◆月报统计分析
◆年报统计分析
◆性能类型丰富
◆端口输入输出流量
◆端口输入输出利用率
◆CPU负载
◆内存利用率
……


C)、网络故障统计
对网络设备运营的历史状况进行分门别类的统计和分析,从而判断企业网络运营品质的优劣,根据需要可分别对网络的节点、链路、端口等资源发生故障情况,按不同的时间段进行统计分析。
◆时间组合查询
◆故障组合查询
◆未恢复故障提示
◆网络故障原因记录
◆故障处理知识库
◆故障类型丰富灵活
◆节点宕机持续时间统计
◆接口故障持续时间统计
◆链路中断持续时间统计
◆链路故障持续时间统计
……


可检索目前仍处于宕机状态的设备和端口

D)、报表呈现形式
报表以各种图形方式呈现,以HTML,Excel等形式保存。同时定时发送MAIL,将报表发送给相关人员。
四.客户的收益
◆高效聚合
通过故障监控和故障分析功能,及时掌控网络运行状况,在故障发生前采取有效的方法,消除或降低故障的发生,提高系统可用性和服务质量,由“被动应对”转变为“主动预防”。
◆转变管理模式
通过故障监控和故障分析功能,及时掌控网络运行状况,在故障发生前采取有效的方法,消除或降低故障的发生,提高系统可用性和服务质量,由“被动应对”转变为“主动预防”。
◆直观、全面的管理依据
详尽的图形和报表功能,为系统管理员维护网络、及时发现潜在问题及网络升级改造等,提供科学、有效的依据,能快速回答您最关心的网络问题,使IT主管和领导及时了解网络资源、运营状况、资源管理和使用效率。
五.为什么选易宝?
·专业的队伍:易宝(北京)公司是中国区第一家HP OpenView授权技术服务中心,联系多年荣获HP最高奖项的高增值代理商,在HP产品方面积累了丰富的集成经验,凭借雄厚的技术力量和专业能力为广大客户提供从售前到售后,从设计到实施以及技术培训等全面的支持和服务;
·雄厚的研发实力:ePRO软件开发中心已经获得CMMI3认证,拥有一支专业的开发组,可根据客户要求做客户化开发,确保客户成功;
·服务能力强:覆盖全国的销售和服务网络,为客户提供及时周到的服务,以及近十年的IT服务经验和一支非常专业的IT服务队伍,一个在稳步增长的、非常信任我们的客户群体、一个以“诚信服务”为核心的市场信誉和一整套行知有效的服务管理机制;
·专业的IT服务内容: 易宝(北京)提供的服务集成是对企业IT系统中不同厂家、不同类别的产品,提供全面服务,特别针对厂家保修期已过的产品的保修服务,服务集成的主要目的是保证企业IT系统的继续运行。
·多元化产品及服务供应商:易宝凭借自身的实力,不断实现技术与管理上的创新与飞跃,成功地从一家系统集成公司转向以行业解决方案为核心、以专业服务为基础、以软件开发为支撑、以产业研究为后盾的新型全方位高科技公司。还致力于IT管理(包括网络管理、系统管理、网络安全管理、带宽管理、数据存储管理等)、内容管理应用、企业短信平台的专业化技术服务和开发;一直致力于为政府和企业的信息内容管理建设和电子政务应用提供优秀的解决方案和技术服务。
|