1. 系统的目的 中国建设银行湖北分行作为我国的四大国有银行之一中国建设银行的重要分行之一,现在,它的分支机构已覆盖到湖北全省,业务范围已涉及到储蓄、信贷等多个领域。为集中有效管理好这些分公司和业务,建行湖北分行很早就采用了先进的信息技术,它的信息化应用在全国都是领先的。建行湖北分行有分布在湖北全省多个城市的局域网和广域网、有多台HP、AIX等多厂商产品组成的主机系统,有储蓄、信贷等几大关键业务系统交织的应用。由此可见建行湖北分行信息系统的庞杂及其管理的难度。现在,随着建行湖北分行业务的迅速增长和外部竞争形势的日益加剧,建行湖北分行对信息系统的可用性、稳定性和安全性要求也越来越高。因此,对于建行湖北分行来说,当务之急就是如何全面、集中、主动、有效地管理和优化IT基础构架,实现信息系统的高可管理性和高可用性,从而确保业务的顺畅运行和服务的准备及时传递,以最终赢得用户,取得成功,实现企业的价值最大化。 在一期实施HP OpenView信息系统服务解决方案的基础上,建行湖北分行为了满足企业信息系统服务管理不断增长的需求,希望通过对现有产品的开发和界面的客户化工作,实现下面的目的: * 实现信息系统管理的智能化与高效性,提高整体的运行维护水平 * 有效地控制信息系统管理的成本 * 建立规范的信息系统管理流程和制度 * 提高整个信息系统的服务管理水平 * 实现对主机系统、存贮系统、网络系统、数据库系统及应用系统的有效集中监控,预先发现故障问题并通过声音、图形等多手段做到故障事件及时告警,让各监控人员及技术管理人员及时发现并处理故障,从而有效的保证系统正常运行。
2. 系统设计的原则 为了保证建行湖北分行后台监控管理项目的顺利进行和保证能得到期望的效果,在进行系统设计时遵循了下面的设计原则。 * 可用性 所设计的后台监控系统对用户而言,应当具有良好的使用性,用户可以方便的进行日常的维护操作。 * 可靠性 所设计的后台监控系统应当具有高可靠性,应当充分考虑异常情况的发生,避免由于异常情况导致的监控系统的不正常工作。 * 安全性 由于后台监控系统所监控的系统都是建行湖北分行的关键系统,后台监控系统应当保证具有高安全性,保证所监控系统和监控内容的安全。 * 一致性原则 所设计后台监控系统应当确保在不同的系统上监控同一目标时所设计的模板和脚本的一致,以便于系统的维护和使用,符合一致性原则。 * 精心实施原则 由于后台监控系统的客户化特点,很多监控目标待讨论细化。因此在实施时应先对用户培训及与相关人员细化实施方案,通过多方的结合和配合,使系统建设达到更高的水平。
3. 后台监控管理系统的总体架构 目前,建行湖北分行的HP OpenView有以下几个方面的解决方案构成: * 网络管理:HP OpenView Network Node Manager * 系统管理:HP OpenView Operation for Unix(HP-UX) * 性能管理:HP OpenView Performance * 服务管理:HP OpenView ServiceNavigator
建行湖北分行还使用了一些系统是HP OpenView的标准系统没有现成接口进行管理的。如Informix数据库、中间件Tuxedo、备份管理系统OmniBack等,对这些系统的管理,对用户来说,很不方便。另外,用户工作中特别需要的有关系统运行管理的报表,需要用户临时制作,不太规范,用起来也不方便。为了满足建行湖北分行对整个后台集中监控管理系统的要求,在该项目中我们开发实现了下列的管理功能: * 对Informix数据库的管理: 通过定制开发实现 * 对Tuxedo的管理: 通过定制开发实现 * 对备份系统的管理(OmniBack):通过定制开发实现 * 报表系统: 通过定制开发实现 建行湖北分行后台监控管理系统的总体架构如下图所示:
4. 后台监控管理系统的功能介绍 开发后的建行湖北分行后台监控管理系统主要有以下的功能模块组成: * 拓扑管理 * 故障管理 * 性能管理 * 综合报表 * 服务管理
4.1 拓扑管理 基于HP Openview NNM网络管理平台,我们对其进行了客户化定制视图,消息过滤和定制,让界面更加本地化,建行湖北分行下属之网络拓朴图一目了然地呈现在管理员面前,配以HP Openview NNM的节点色码标示,使得网络管理界面更加直观了。 拓扑图如下所示:
4.2 故障管理 通过HP OVO统一消息平台可以实现故障的统一管理;后台监控管理系统下的所有设备和软件在运行过程中 发生的故障,都集中到后台监控管理系统中的故障管理模块,进行集中管理。故障管理的主要功能,首先要记录故障信息,进行故障分类,并按定制的故障级别,向适当的管理责任人付出告警。高实时性的告警通告功能可通过短消息传到管理责任人的手机上,也可以通过电子邮件、声音方式向管理责任人告警,使得网络告警可随时随地告达。 通过OVO Java GUI实现了故障的远程查询,并提供通过对存档故障信息的分析,为系统维护计划、运行计划的制定等提供决策支持。 OVO message browser图如下所示:
性能管理 提供统一的性能分析平台,可以满足用户对网络性能、主机服务器、企业应用等各个方面进行综合、复杂分析的需要。例如网络流量分析,带宽利用率分析,网络时延分析,设备性能分析,设备可用性分析,数据库性能分析等等。
4.3 综合报表 建行湖北分行后台监控管理系统采用的HP Openview系列管理软件提供了一些管理报表,其内容和使用的方便性远远满足不了用户的工作需求。我们根据用户运行环境和对运行管理报表的具体需求对报表系统进行了完善和大量的客户化工作,构成了湖北省建设银行系统网络统计分析系统。系统的主要功能及特征如下:
自动收集处理数据 报表数据的收集和处理无需人工干预,可以自动运行。用户只需要在安装时做一些参数设置即可。
基于Brower/Server结构 用户无需进行特别培训,无需在客户端特别安装任何软件,利用系统自带的浏览器即可实现对报表的查询、打印。
完善、详尽的报表功能 主要的报表,按其分为对象,可以分为以下几大类:
系统运行报表 日报: 可以根据主机、日期等检索和打印被管主机的CPU、内存等系统资源的运行报告及曲线图 月报: 可以根据主机、月份和故障类型等检索和打印被管主机每月运行状况的柱状图和曲线图等多种报表形式
数据库系统运行报表 日报: 可以根据主机、日期等检索和打印被管主机的数据库空间、表记录等多种数据库资源的运行报告及曲线图 月报: 可以根据主机、月份等检索和打印被管主机的数据库空间、表记录等多种数据库资源的运行报告及曲线图
其它应用系统运行报表 数据备份: 提供数据库零级备份执行状况的月报 其它: 可根据用户的具体需求提供更多更详尽的应用运行报表
简单易用 图形化的使用界面让系统管理员不需要了解OVO更深层的知识,就能够轻松自如地完成统计分析和报表打印;中文化的输出结果让使用者和管理者能够对系统网络现状和未来趋势一目了然。
4.4 服务管理 可帮助信息技术(IT)管理人员从最终用户的角度对关键业务应用进行管理,并对较低级别的组件故障或性能问题所造成的业务影响迅速有所了解。
5. 结束语 建行湖北分行后台监控管理系统通过二次开发,新增或提高了以下优点: * 实现了信息系统的集中管理,如Informix数据库、Tuxedo中间件、OmniBack备份管理软件等的管理,都集中到了一个平台上,提高了整个信息系统的服务管理水平,整体的运行维护水平进一步得到了提升,从而提高了这个系统的生产率 * 实现了故障的分级告警, 一是危险级告警, 二是重要级告警,三是警告级告警,使得各级责任人有了各尽其责的基础;使相关责任人同时获知告警通知,便于及时采取相应措施,控制故障的发展,避免或减少故障对业务系统的危害 * 告警方式多样化:通过配置日志、事件管理显示、声音、电子邮件、打手机等进行告警 * 新开发、完善的系统网络统计分析系统用具体、形象的网管统计分析数据,为IT管理、网络优化、系统扩展等的决策提供数字化支持 * 可以利用各种统计分析报表随时掌握网络,系统硬、软设备的实际使用状况 * 可以了解并定位系统运行瓶颈出现在哪里,及时调整各应用在系统中的状态,解决系统拥塞,以保证所有业务系统都能顺畅运行。 * 引入了一种统一的、全面的服务管理流程,IT部门对业务部门的IT服务逐步做到了“数字化”,提高了IT服务支持的工作效率
总之,建行湖北分行的IT服务管理水平随之提高到了一个新的高度,提高了整个IT系统的运行效率和可靠性,降低了运营成本,减少了系统偶然性宕机的可能性;为湖北分行的IT系统的扩容建设、IT管理服务的不断改善提供数据依据;进而为分行的业务发展提供更好更有效的保障和支持。
|