月 薪:
职责业绩: 参与苹果iCloud项目,从0~1完成公司所有托管机房项目选址、规划设计、建设和运维全生命周期管理;交付测试、验收,推动完成测试问题整改,确保交付机房质量可靠。
1、项目需求整理、系统规划:
负责 所有托管机房的IT项目实施,托管机房的部署项目管理工作,包括机房选址、改造验收、资产管理、进度规划、资源调度、设备部署、布线、资产接收及录入等;所有项目均按计划完成。
2、建设阶段:
托管机房及数据中心建设:
项目转运维阶段后,基于ITIL建立托管机房运维体系 ,组织编写包括事件、变更、物理安全管理、文档管理、知识库管理等 10 余个流程及若干标准操作流程。
参加设备选型,规划建设的进度,与第三方供应商选择和谈判,根据甲方客户要求,包括技术要求、中国业务覆盖率、售后服务情况、到货周期选择设备,跟进设备安装及资源调度。
3、项目实施:
进度规划:在站点人员不足情况下,为保证及时完成甲方对机房按期部署的要求,将所有工作拆解到每个人,合理分配工作优先级,梳理各项目衔接流程,确保各项目之间有效衔接、按期落地。
项目推进:
通过Python编写自动化程序,解决多个设备跨机房连接问题,调整后仅需在一个房间即可完成第一个接口直接连到第二十个接口,节约各个机房调换时间,降低操作人员能力要求,为公司节约每天5000元成本,该成果已被贵州省《劳动时报》报道。
针对数据中心项目部署流程长,涉及相关方过多,布线方案复杂的痛点,利用Python开发用于数据中心IT部署的自动化工具,各项上线程序后均可自动化完成,并可同步形成项目甘特图,节约整体流程30%的时间,项目实施效率提高70%以上。
资源协调:与第三方供应商保持友好沟通,制作量化评分表,统筹管理9家供应商,发现问题及时上报部门领导,确保项目保质按期落地。
4、日常运维:
网点运维:
负责全国范围内 iCloud 网络接入点的 IT运维管理,包括 IT 故障处理,资产管理,机房基础设施管理、物理安全管理、容量管理等,通过管理机房供应商,评估其电力、弱电、暖通、消防等方面基础设施运维项目完成质量,确保所有 iCloud 网络接入点 100%可用率。
制定并要求机房执行网络接入点物理安全管理规定,迄今所有站点非法入侵事件数量为0,所有网络接入点部署项目及时完成率、准确率均为100%。
应急演练:基于现有业务特点,设计并组织系统冗余性丢失方面相关应急演练,保证机房故障问题恢复效率,完善备选方案,设备故障确保15分钟内响应,2小时内完成恢复。
供应商管理:通过建立供应商评价体系,实现对供应商的有效管理,严格把关网络线路中断、设备损坏等问题解决情况,保证供应商的服务水平和质量,确保供应商需求满足率、服务请求及时率均为 95%以上。
评审落地:对照信息系统第三级等级保护标准,及时对每个机房进行审计规范材料检查,与公司合规部门一起及时补充所需审计资料,确保iCloud系统 IT 部分等保评审全部按期完成。
5、创新性运维:
运维服务:针对 SLA要求及运维过程中的经验教训,建立运维服务质量成熟度评估模型,用于持续运维质量以及评选供应商,根据发现的问题,通过Excel重新设计运维月度报告模板,同步建立机房巡检制度,按季度对城市进行巡检机房,根据成熟度模型检查机房。
数据分析:
负责公司全部 IT 相关的数据分析,针对iCloud网络接入点过多,且各站点辅料均为独立库存,调货周期长的痛点,利用Python及统计学相关知识开发用于库存管理自动化工具,建立备件使用预测模型,实现辅料使用量预测、各接入点故障率分析等功能,预测准确率达75%,提升公司精细化管理,节约运营成本。
针对运维过程中数据孤岛、系统孤立等痛点,开发自动化工具,打通数据体系,实现数据互联;完成资产管理系统新旧更替操作,将手工录入通过自动化工具实现一键式导入,完成时间由手动录入1个月缩短至1小时;
打通工单、资产两个独立管理系统间数据,实现数据分析时可直接进行关联对比,完成时间从人工比对需2天工作缩短至1分钟完成。
6、团队管理:
日常沟通:管理3人团队,成员均在上海,每周通过周会推进工作及各类事项落地。
绩效管理:根据每个人不同情况制定绩效考核,充分发挥每个人的能力优势,达成公司要求,站点可用率、服务率达100%,满足公司合规性要求,完成公司创新性要求建设。
为加强团队管理,提高团队绩效,梳理现有流程,将重复性高、易出错任务等要点利用Python编写脚本实现动态管理,使团队工作由绩效达标不到10%,提升95%以上。
知识管理:建立部门文档分类分级管理制度及命名规范;带领团队梳理现有文档,建立知识图谱;建立知识分享机制。