行业云化落地,政务云首当其冲。一来,政务服务大众,牵涉到广大人民群众的福祉;二来政务受限于大众,云化进程受成本、效率的制约。

我们知道,云计算给企业商业和运维模式带来了根本性的变革,政务云的运维成为众矢之的。政府行业因自身的局限性,大都不会自建运维团队,企业的运维通常与运营商合作。但是,运营商对传统数据中心的运维有丰富的经验,却缺少对云数据中心的运维经验。

换句话说,本身正处在向云转型过程中的运营商,又负担了当地政务云的运维工作,这中间要解决的问题就变得颇为复杂。上海政务云,就遇到了这样的难题,所以它们想到了云运维经验最为丰富的华为,这会产生怎样的故事?

上海政务云的运维难题有很强的共性

实际上,在进入互联网时代之后,我国有过一个阶段的电子政务建设黄金期。比如在2011到2015年,电子政务建设达到高峰。但各地数据中心建设繁杂,且缺乏统一规划造成资源利用率低,后期运维难度大。

所以,政务云的出现,恰好可以作为新一代数据服务和共享平台,将成为电子政务发展中遇到的问题一一解决。所以各地政府都在加速走向政务云。

这就引出了传统数据中心与云数据中心的区别。

从表面上看,云是数据中心的新IT形态,云数据中心与传统数据中心的建设目标是一致的,都是为政府或企业提供IT服务。

但是在运维对象和服务内容上又所有不同:以IaaS层为例,传统数据中心运维对象主要包括机房基础设施、网络及网络设备、服务器及存储等硬件相关的实体资源;而云数据中心的运维对象,除了包括传统数据中心关注的实体资源之外,还要关注架设在基础架构之上的虚拟资源,比如网络资源、计算资源、存储资源,以及虚拟化平台本身。

换言之,云数据中心是将基础设施(IaaS)以服务的形式提供给最终用户,它利用虚拟化、SDN等技术将网络、计算、存储等资源池化,通过自动化技术按需为用户分配IT资源。

无疑云服务的需求会驱动运营商从卖资源的运营模式向卖服务、卖能力的模式转型,这涉及到运维组织架构、资源配备和运维流程的变革,运营商找到了华为来为其提供量身定制云数据中心运维规划设计方案,共同服务于上海政务云项目。

罗马不是一天建成,华为如何做到抽丝剥茧?

我们知道,任何政务云项目都是既有共性,也有特定的需求,上海政务云项目绝对无法一蹴而就。这要求华为,拿出专家的精神和专业的态度,抽丝剥茧,抓到运维的关键。

而此刻摆在华为面前的也有很多的难题有待解决。

经过前期详细的调查后,华为面临的首要难题是现有运维工具是否满足云运维需求。受限于预算等原因,客户还是希望依托现有工具来实现运维。所以,要求项目组需要对当前客户正在使用的运维平台的功能进行全面的了解,找出可以适配的部分进行改造和定制。其中,现有的运维工具和承载的业务是否可以与云平台对接都是运维所要思考的问题。

在客观的评估现有环境之后,第二个难题是:基于政务云并参考ITIL的标准和框架,制定一套上海政务云的运维组织架构、管理流程、制度规范和SOP。

但运维组织架构的设计,并不能一蹴而就。华为采取了循序渐进的方式,在前期先输出一个标准运维组织模型,根据目前的客户业务特点进行调整,甚至在运营初期,还会对组织架构进行精简。同时在故障处理阶段,如果初期现场还不具备技术能力,就把岗位职责放在后方,随着业务量的增加,根据工作量再来细分岗位角色,最终期望达到理想高效的组织模型。

在经过了渐进式的部署之后,事情也并没有结束,华为还会对于已经输出的流程、规范和SOP,在实际运营中还会不断的进行优化。而由于当前的流程没有工具承载,华为还建议客户采用纸面件先把流程固化,在线下形成规范操作后,随着工具和平台的部署,再转移到线上处理,比如在运营初期,故障量不多,运维现场主要通过电话、微信等方式来进行事件的沟通和传递,以保证效率,再通过纸质工单进行记录和统计。

总体来看,华为在用一种自上而下的方式,进行了专家式的贴身服务,从初期的内部流程梳理,团队组建,到拿出方法论,并根据需求不断优化,克服重重困难,可以说是抽丝剥茧,老成持重。

以上海政务云为模板,华为已有完整的云运维方法论

其实,政务云的建设与其它云服务项目相比还是有明显的自身特色。比如,政务云运维以核心业务保障为主,不同于互联网业务的快速迭代,政务云的新业务增速比较缓慢,安全性要求高,更注重管理和绩效,往往有分级管理要求,同时也关注数据的潜在价值。

以上海政务云项目为例,华为总结并输出政务云运维的四个典型阶段。

第一阶段,是初级阶段。在此阶段,更侧重于资产管理,还谈不到CMDB(配置管理数据库)的建设,运维流程也只能实现单一的故障处理流程,同时岗位职责上没有专职的服务台和管理角色。所以,首先要做好一体化监控,将虚拟化资源池当中的计算资源、存储资源和网络资源全部监控起来,做到资源的可视化。以此为基础就可以及时发现问题并解决问题。

第二阶段,是基础建设阶段。要在一体化监控的基础上建设CMDB,CMDB建设成败会直接影响到运维的效率和成本,CMDB规划要长远,但部署要分层次分阶段来进行。华为认为,初期的建设可以在IT资产项的基础上增加逻辑关系,颗粒度不必过细,因为往往过细的颗粒度又会导致运维复杂度增高,运维成本过高,效率反而降低,所以CMDB的建设最能体现一个组织的运维能力。

例如,上海政务云项目本身涉及到的CI量并不是很大,而且是全新部署的模型,业务应用是逐渐增加,业务管理关系还未成规模,这给CMDB的建模和部署都留出足够的时间和空间。由于运维组织模型还不够成熟,一般在这个阶段,运维流程往往只是侧重于资源申请、发放,以及故障的受理,对于更高级的功能,要随着运维组织成熟度的加深而不断完善。

第三阶段,是流程的标准化运作阶段。当CMDB的建设日趋成熟,颗粒度可以满足日常运维需求,ITIL的运维流程体系才可能真正发挥作用,资源申请、事件、问题、变更、发布也才能真正实现其价值。这个阶段运维组织模型已经比较成熟,业务量也会达到相当的规模,流程的标准化运作会让运维效率,得到大大提升。

第四阶段,就是政务云运维进入自动化和智能化的终极阶段。这个阶段需要更多的工具支撑,一般以定制开发为主,而且需要与业务进行适配。每一个政务云运维最终都要走到这个阶段,才能够称之为真正的落地。

去年底,权威机构IDC将中国政务云第一的位置授予了华为,显然是非常有根据的。从这套方法论当中,我们看到了华为对政务云建设,是从客户的实际情况出发,做到因地制宜,既不做跃进,也不徘徊不前,可以说既满足了政务云安全、稳定的诉求,也考虑到了运维对业务升级的要求。让政务云落地成雨,华为做到了。