创建快速高效的运维管理指挥调度体系

来源:e星体育    发布时间:2024-09-09 18:56:56 点击:1次

  徐海东:各位领导、各位专家下午好,介绍一下我们公司在运维管理方面的调度体系,题目是创建快速高效的运维管理指挥调度体系。

  从五个方面介绍这个体系,一个是背景,第二是成果的内涵和做法,第三是创新点,第四是推广应用情况,第五是效益这几方面介绍。

  第一,形成的背景,从2000年开始真正发挥主要是中国移动做集中化运维模式,地市公司做现场的作业计划,要求适应于集中化,一直到现在我们也沿着这条路建设适应于集中化运维模式的高速快速高效的运维指挥调度体系。

  具体的内容,第一是指挥调度体系是在有效协调指挥集中化的运维体制下,运维活动的所有的环节构建一套联动系统,我们整个组织架构是分成三级,第一总部有网络部,还有智能管理和生产中心。第二层面是省公司,省网络部和省的网管中心,第三层面是现场维护作业,地市的操作维护中心。

  整个建立的是说符合集中化运维和生产架构的科学职能设置,把每个方面职责定好,利用工作流程制度,依托信息化的手段,采用场景化的现场工作组织模式,面向日常生活作业重大的故障保障和突发事件的指挥调度活动。第一设计科学的管理智能,根据任务执行配制集中的维护职能。总部层面,让总部逐步成为全网最高运维指挥中心,承担全网的维护管理职能,对全网运作情况进行监控,对突发事件和重大故障进行指挥调度。具体详细工作内容有故障监控、维护情况、集中管理的内容。在省公司层面,成为真正意义上的省级指挥调度的核心。对网络运行的所有的环节深入介入。99年刚才独立出来成立的时候模式变了,原来总部是管理机构,省公司也是一个管理机构,各个地市公司是生产维护部门,这种集中化的方式把它转过来了,总部管一干和全网重大事件,省公司管全网,地市公司接受省公司派单进行现场服务。现在做7×24小时值班是总部和省公司,地市公司不做,只是接单之后处理。整个职能变成这样了。

  这套职能顺应标准化的流程和明确的制度保障体系的高效运营,我们在里面主要涉及三方面的工作,一个是业务的实现,就是说市场部门那边的业务要求,一些业务的实现。第二运行维护,第三是运维管理。比如运行维护,包括集团客户的保障,网络优化,作业计划、告警监控和故障处理。借鉴国际上的理论方式,根据中国移动自己的运维经验提出的核心运维流程体系,主要涉及三方面的内容。为了支持这些流程,我们建立了以专业网管、电子运维指挥调度系统还有指挥调度社会为主体的IT手段,用这些IT手段来支撑整个前面的职能和流程。

  专业网管目前分成数据、话务、传输网管,总部和省公司都是这样设置的。现在往综合网管方面过渡,这是两层架构,省公司网管是地市公司也可以用,但地市公司没有网管系统。电子指挥调度系统也是两基的,一个是总部,一个是省公司,总部的导读系统省公司也可以用,通过他给各省公司发单,包括通信设施的厂家的报修,对他们的技术上的支持都走这个,包括总部内部对一干的维护走总部的电子指挥调度系统。省内包括自己的还有代维公司都在使用这套流程,控制整个职责。

  还建了一套总部和省公司的视讯调度系统,实施三十一个省公司和地市公司,面对面现场指挥,同时能和多个省也可以和全国做沟通,总部和各省之间建立一套视讯系统。主要工作涉及到三个场景,一个是日常工作,一个是重大活动保障,一个是突发事件保障。日常维护包括网络的调整、故障处理等能够都走这套系统。其他的还有重大活动保障场景和突发事件保障场景。

  主要成果创新点,第一该体系借鉴了eTOM,ITLL理论,参考业界最佳实践,梳理出了一套完善高效的流程制度。其实我们的IT系统都是来承载这些制度和流程运行的过程。第二我们大家都认为创新的是整个IT化的支撑手段,这个支撑手段两级架构,由原来的三级变成两级,从网络管理,包括流程的运转,包括视讯指挥方面构成了立体化网络管理指挥系统。这套系统获得了06、08年信息产业重大发明奖,第三首次将红橙黄蓝预警体系运用到国家级自然灾害、国防安全,包括大型公共事件,针对这么多东西做了红橙黄蓝工程体系,不同场景有不同的启动点,包括不一样的层次的决策人员和具体的操作人员。第四将网络和信息安全工作模型化和模块化,有效提高网络安全工作的效率。根据网络信息安全工作特点,结合中国移动的情况,我们提出一套系统和完整的安全运维和保障各类重大活动的网络安全管理模型,构建了相应的包括左右互通、上下联动、内外结合的运行机制和相关工作流程,高效的实现了各种资源的合理配制,提高了安全保障工作的效率和水平。

  第五个创新性建立虚拟一体的运维生产环境,突破多层次、长链条的运维生产带来的问题,快速准确的指挥调度全网资源。最大的是在总部能发现全网的重大故障,包括每个基站的退服。比如一个地区有四十个基站同时退服,我们会认为是重大的故障。包括光缆的中断、用户对业务指标的下降,在总部就能看见,这样对省公司而言也是一种压力,这种压力慢慢的让这种体系建设能起来,在后面也能够正常的看到,整个故障处理包括投诉处理时间都大大的缩短,打破了信息只能从下向上的传递,原来的状态经常有失帧的现象,现在信息更透明了。

  这里列了几个重要的政治经济活动保障,每年通信保障任务,包括完成奥运会的通信保障任务。这套系统在几分钟之内就能了解到全网的情况,包括奥运省保障情况的一手资料。第二对突发事件的应对即时,通信恢复迅速。整个体系能够迅速响应,对于红橙黄蓝应急预案有效疏通引起的话务高峰,还有抗击雪雨灾害。举个例子,比如应急通讯车和油机调度,实现了自动化的方式,根据断站的情况,包括站蓄电池的时长和运输时间,制作出模型,决定哪个油机到哪个地方发电,其实最大的保障就是扛着发电机去基站发电,靠人去算,基本是不太可能的。

  包括社会和信息安全事件的通信保障,包括重大的病毒对全网的影响,包括信息安全的一些事件,还有非典期间大话务量的影响。还有日常维护工作规范可控制,工作效率提高,举几个数字,全网网络投诉平均处理历时由2006年的19.36小时下降大08年底的12.96小时,缩短了33%,IIP乌克呼平均处理市场从1.96小时下降到1.57小时,缩短20%,重大故障平均历时从5年的4小时34份,降到08年的3小时23分。

  最后讲一下产生的效益,我们打造了一张令人瞩目的网络,得到了客户的认可,中国移动网络在覆盖网络质量方面均处于国际领先水平,人口覆盖达到97%,掉线%。无线%以上,包括多次政治经济活动中发挥着及其重要的作用。也得到了各种奖励。经过效益的算法很简单,节约的人数,乘以成本。简单来说02年到08年,全国维护人员人均维护基站数增长了3.8倍,人均服务用户数增长3.4倍,人均承担线倍。业务发展也很快,层出不穷的数据业务,我们算一下应该是53种数据业务,从02、08年维护的队伍,没有做过多的增长,从始至终保持在2.2万人左右。08年比02年也就增加了几百人,平均下来。

  这是我们根据每人成本的十万块钱一年算出的经济效益。这是我介绍的中国移动的指挥调度体系,谢谢大家。

上一篇:华为云828营销季来袭数据灾备方案为云端业务筑牢安全防线
下一篇:【精选】基于技术中台的有线电视大运维体系架构研究及构建实践