本文共 1594 字,大约阅读时间需要 5 分钟。
作者简介:蒋君伟,广通软件研发中心产品部总监,IT网管与运维领域的十年老兵,负责国内多个全国性的网络管理与运维管理系统产品研发,拥有丰富的网络管理、系统运维与产品研发经验。现从事广通新一代数据中心运维产品研发工作,主要负责产品线规划、核心技术研发、研发团队建设与运维咨询等工作。此外,个人还热衷于开源社区的技术推广与研究,喜欢Emacs、Lisp与Python,实现过开源.Net SNMP协议栈,目前主要研究去中心化的大规模软件集群技术。
现如今DevOps已经深入人心,在这个大量数据中心建设加速的时代,运维部门都在高度强调自动化,而自动化的关键即DevOps。但是,大家在推进DevOps的过程中却发现其前途坎坷。
一种方案是建设自己的开发队伍从头开始,做CMDB、做监控、做自动化、做流程、做服务目录、做大屏展现,这种造轮子方法需要强大持续的研发投入,成本极高;第二种方案则是寻找开源产品改造,以适合自己,如CMDBBuild、Zabbix、JBPM等,但是开源社区的产品,技术风格迥异,成熟度低,技术团队的素质要求高、踩的坑很多,管控风险很大。
那么应该如何去较低的总拥有成本推进DevOps运维呢?
有一种建议以优秀、灵活、开放的商业运维平台为基础,辅助于个性化的开发作为补充,来快速实现DevOps的运维体系。
运维平台的选型,需要选择技术成熟稳定、成功案例丰富、可适应不同规模的运维软件,软件必须注重平台开放性,需要包含运维经验的汇聚,可以帮助运维团队快速沉淀出属于自己的运维系统,具体选型应该中应该关注一下几个重点:
一、万物建模的CMDB + PMDB,零代码构建自有资源模型
如同没有完全相同的两个鸡蛋一样,不同的企业不会使用相同的IT资源模型。不同的运维部门,需要管理的广度与深度都不一样。CMDB作为配置资源库,PMDB作为性能指标库,需完整实现面向对象的建模能力,提供界面操作即可完成真实世界的数据建模工作,对每一个IT资源,都可细微的定义其应有的属性、指标、状态。并在模型调整扩展时,也可保留数据的平滑迁移,避免大量数据迁移开发。
二、无限扩展的监控探针群+ 扩展脚本,迅速满足海量监控需求
监控方面, 运维部门最关心的是监控容量是否可以满足不断扩大的IT规模,以及如何应对层出不穷的监控指标需求。监控平台使用可广泛部署的探针集群,联结与覆盖全网,实现大范围无死角的监控。除了上千种内置监控指标外,还可简单的编写脚本对接新的监控指标,开发人员不再需要考虑通信协议与数据存储,指标数据会自动通过探针集群上传到PMDB,并最终通过可视化展现大大降低监控门槛。
三、量体裁衣般的运维流程,基于最佳实践调整无压力
运维流程应该首先符合ITILV3标准的全套运维流程,并使用可灵活调整的运维表单建模与流程引擎,实现流程的个性化定制。当有新的运维业务需要上线时,也可基于现有流程复制调整快速上线,或全新设计新的流程模块,期间不需要任何编码工作。基于工单流转的事件触发脚本与开放API,可进一步释放流程的联动能力,有效组合企业现有的运维协同,实现操作自动化。
四、灵动酷炫的大屏和门户,释放运维数据的可视化能力
如何将运维系统的各类数据各有价值的利用?使用运维平台可视化设计器和对外服务门户,抽取运维系统内外的各类数据,并通过丰富的图表与动态渲染加以展示。实现IT数据中心的业务看板、掌握全局运维态势、提升运维部门对于业务的影响力。
五、开放API平台设计,可以按需开发定义自己的平台
除了上述特性外,选型中最关键的是,运维平台必须是开放式设计,必须可以支持多维度扩展,比如说: 完全基于目前流行的RESTful开放API体系,提供了SDK开发手册易于开发扩展,可以基于平台进行自定义完善,这样的平台才是DevOps团队相对理想的运维基础平台。
本文转自d1net(转载)