规划概述
根据公司的整体战略需求,公司IDC资源在逐步向公有云进行过渡,基于公司混合云的管理思路,并根据目前IDC的问题,对现有IDC规范化统一改造,主要针对主机,网络互联等进行一次较大规模的革新。
混合云网络整体架构
架构描述
- 公司混合云架构融合专线、VPN、互联网三条网络线路方案,实现网络传输的可靠性
- 所有IDC均设置一个10.x.0.0/16位地址段
- 所有IDC间内网实现互通,并可以自主选择使用专线网络或VPN网络
- 办公网均通过10.x.0.0/16位地址段进行主机的管理
爱技术,好产品,探管理,享生活
根据公司的整体战略需求,公司IDC资源在逐步向公有云进行过渡,基于公司混合云的管理思路,并根据目前IDC的问题,对现有IDC规范化统一改造,主要针对主机,网络互联等进行一次较大规模的革新。
架构描述
SmartPing为一个各机器(点)间间互PING检测工具,支持互PING,单向PING,绘制拓扑及报警功能。
本系统设计为无中心化原则,所有的数据均存储自身点中,默认每个Ping目标点的数据循环保留1个月时间,由自身点的数据绘制 出PING包 的状态,由各其他点的数据绘制 进PING包 的状态,从任意一点查询数据均会通过Ajax请求关联点的API接口获取其他点数据组装全部数据,绘制 出Ping曲线图,进Ping曲线图,网络互Ping拓扑图。并可以设置阈值进行报警,方便对网络质量的监控。

自动化运维开发平台
Elves-Project 才刚刚起步,欢迎更多的人加入我们,共同见证其成长!
QQ群:69748845
如果您在使用Elves,那么可以修改_ huan-ying.md__ , 然后提交pull-request到gy-games/elves-book,等待merge过后,即可在这里显示。_
从去年开始团队内部一直在使用微信群的方式通知以及处理故障,整体使用情况还不错,但是在数据统计以及使用规范上还有有所欠缺,最近决定开发一款微信产品来替代目前团队内部故障处理
在一个故障的处理中最难的部分是信息的交流,中间的噪声太多,信息一级一级的传递后容易变质,这款产品上线也主要为打通此环节间问题。
先来看一下一个常规的故障处理流程
SmartPing为一个各机器(点)间间互PING检测工具,支持互PING,单向PING,绘制拓扑及报警功能
本系统设计为无中心化原则,所有的数据均存储自身点中,默认数据循环保留1个月时间,由自身点的数据绘制 出PING包 的状态,由各其他点的数据绘制 进PING包 的状态,并API接口获取其他点数据绘制整体PING拓扑图,拓扑图中存在报警功能,报警规则为Thdchecksec秒钟内发现大于等于Thdoccnum次延迟超过Thdavgdelay毫秒或丢包率大于Thdloss%即报警,若设置报警声音则会同时有Alertsound声音提醒。
Elves为一套自动化运维开发平台(IT Automatic Develop Platform),面向开发,注重以编程实现运维自动化,致力于为运维研发人员提供便捷的运维自动化业务编程实现环境, Elves自身不提供业务性功能,运维开发人员可根据自身的业务进行应用(APP)的开发来实现相应业务的自动化管理。
灵活的业务(App)编程设计:Elves主要面向运维开发人员,以编程方式实现某业务的自动化操作,Elves与用户间交互以RESTful方式进行,与Apps间交互以进程调用方式进行,理论上支持所有的编程语言,目前Elves提供Python与C#版开发SDK
任务模式:Elves提供及时任务(同步),队列任务(异步,支持依赖),计划任务(异步) 三种任务调度模式,且允许开发者直接将App-worker的执行结果直接反馈至App-processor,以构建C/S架构服务
高可用与高性能:在Elves的设计中各组件为可拔插形式,且极大程度的降低各组件间依赖关系,几乎所有组件均可以独立使用与集群部署
数据交互传输:Elves-Center间各组件的数据传输使用RABBITMQ以队列形式进行交互,Elves-Center与Elves-Agent间数据传输使用Thrift进行交互,开发人员操作Elves(App)使用RESTful方式交互
开发语言与结构:Elves自身以C/S架构设计,Elves-Center(SERVER)由JAVA实现,Elves-Agent(CLIENT)由Golang实现
SmartPBR为一个帮助运维人员快速自动化安装策略路由服务,主要企业使用LINUX网关策略路由组网环境。
Red Hat Enterprise Linux Server release 6.4 (Santiago)
smartpbr-x.x.x 安装目录 /usr/local/smartpbr 配置文件 /etc/smartpbr
SmartVPN为光宇游戏运维团队发布的一个帮助运维人员快速自动化安装OPENVPN服务的脚本,主要用于企业使用OpenVPN组网环境。
##功能 ##
lzo-2.03 安装:/usr/local 配置:null
openssl-1.0.2k 安装:/usr/local/openssl 配置:null
openvpn-2.1_rc22 安装:/usr/local/openvpn 配置:/etc/openvpn 日志:/var/log/openvpn-server/client.log
smartvpn-x.x.x 安装:/usr/local/smartvpn 配置:null
团队从15年开始尝试敏捷,走了不少弯路,从敏捷的概念引入到敏捷与项目之间的结合,在不同的时间有着不同的理解,这里团队采用的敏捷偏重SCRUM框架,但也结合PMI的项目管理理论成型,在保持管理的基础上增加团队的自主性与互动性。
下面看一下今年版本的指导规范
角色:完成这套管理标准需要三个角色1、PO产品负责人,2、TO技术负责人、3、DEVTEAM开发团队,有PO负责业务的分析以及规范流程的实施,TO负责业务开发过程中的技术设计与评审,DEVTEAM负责业务开发过程的实施。
过程:抽象成PMI的4大过程,但因为迭代的时间周期性,四个过程是个穿插的过程。周三至周三为PO与TO的业务规划时间,周四为PO,TO,DEVTEAM的任务拆解时间,周一至周五为DEVTEAM的开发时间。以一周迭代周期为例,本周三PO与TO将规划出下周(迭代N)的PB清单,本周四PO,TO,DEVTEAM拆解下周(迭代N)的PB清单,下周一开启下次迭代N,并持续到周五,在迭代N的执行过程中,周三出迭代N+1的清单,周四拆解迭代N+1的任务。
邮件体系:邮件体系贯穿在整个迭代周期中,迭代开启前将发送迭代申请邮件,包含下次迭代的PB清单以及已拆解完的迭代任务,迭代之行过程中将每天发送日敏捷记录邮件,公开开发团队的工作进展。
截至目前,此规范不仅用于了开发团队,也开始普及至运维团队,下面是开发规范的全文,欢迎交流指导