广东蓝海信息技术有限公司
电话:020-37216363传真:020-37216303
E-mail:juye@gzjuye.com
地址:广州市天河区科韵北路创锦产业园100号之三205-206室
机房搬迁方案
发布时间:2022-07-13 阅读量:1006
搬迁思路
在机房系统搬迁过程中,因业务系统及数据极其重要,数据的完好和业务系统的正常运行需要得到保证。业务系统需7*24小时运行,本次搬迁过程中,需要保证尽量减少业务系统的停止时间。
在本项目中,用户提出在______________________________应急环境,待搬迁前,将位于___________________IDC机房内运行的业务系统切换至_____________应急环境中运行。此种方式的优势如下:
优势:
1. 确保业务的连续性和可用性;
2. 搬迁过程中不影响业务的正常使用;
建议采用“先准备应急环境,后整体搬迁”的方式实现机房搬迁的顺利进行。同时辅助各个职能的工程师现场实施并配合各项工作来完成整个数据中心的搬迁工作。搬迁整体工作,包含整个搬迁的设备系统的(冷备)备用系统搭建、系统割接、设备下架,物流及到新机房后的上架,整体调测等过程。
基于我们前期对用户业务及设备的调研分析上,我们根据业务的重要性及设备间的相互关联,将需要搬迁的设备按照用户当前的实际应用系统来划分。在详细的前期资料收集和调研后负责制定每一个系统的详细规划、设计、准备、及实施工作。通过分阶段划分搬迁目标的方式完成整个系统的搬迁工作。
我们通过制定严格文档管理制度,来协助完成搬迁信息的整理和分发。在搬迁前期清点阶段,对各个机柜等做好严格标记,依照设计部门的设计,进行机柜的整体搬迁。搬迁后测试方案来保证搬迁的顺利完成。
在搬迁完成后,确保搬迁设备在前期规划指定位置,保证所有系统无损。一旦发生故障,通过现场设备进行快速修复;若涉及切换到应急系统的需考虑二次迁移,修复原系统设备后,在合适的时间进行停机割接和数据的回切,实现系统顺利重新运行在原系统环境中,最终完成该系统的搬迁工作。
项目阶段性规划
鉴于数据中心迁移项目搬迁的复杂性以及所涉及的人员、部门、设备多样性,整个搬迁项目的规划及实施时间非常紧凑。
根据不同时期的工作重点,我们将搬迁项目划分为三个阶段:Ⅰ.评估与建模阶段、Ⅱ.详细设计阶段、Ⅲ.实施阶段。
第一阶段为搬迁的评估与建模,主要对用户的设备/业务现状进行调研分析,及用户新数据中心的需求进行收集整理。通过编制现有IT系统拓扑逻辑详图,理清现有系统中所有硬件、软件、系统、应用等信息及其相互间的关联,确保所有相关信息完整地显示出来。同时,根据用户新数据中心的使用规划,编制新机房系统拓扑逻辑详图。进行初步设计、规划、以及评估,为搬迁做好准备。
第二阶段将进行详细方案地设计,并制定预演方案及风险准备计划。根据现有IT系统拓扑逻辑详图,通过与用户IT、网络、业务部门及设备运输物流商等各方面的充分的沟通,划分设备搬迁的具体批次及方法,分别制定详细的搬迁方案及相应的应急修复方案。
本阶段的目标是:双方确认的详细的搬迁/预演/灾难恢复方案及执行计划。
第三阶段即进行搬迁的实施及管理。根据第二阶段设计的详细方案,各小组开始做搬迁前的各项准备工作,进行搬迁后系统的测试及检验。
搬迁前期准备工作
为每个搬迁项目提供有效的搬迁前咨询服务,我们通过细致的调研和有效的沟通,为数据中心的迁移研究可行的方案。搬迁前全面调研和需求分析对于搬迁方案的合理性起着关键作用,以下是主要的调研内容:
Ø 搬迁设备现场勘察、访谈并确认需搬迁系统及设备;
Ø 新数据中心基础设施调研确认满足现有及将来可能增加的设备各类需求;
Ø 设备物理位置变动调研;设备新机房新位置可行性规划;
Ø 系统变更需求调研;业务地址变更需求;
Ø 系统配置信息收集;如系统硬件配置,HA配置等;
Ø 应用系统信息收集;收集各类业务系统信息;
Ø 应用系统关联性分析是成功搬迁,降低停机时间的最关键所在;
Ø 数据风险、安全分析;对数据的安全性进行有效的分析;
Ø 物流条件和资源调研;熟悉搬迁路线,提前发现可能影响物流的问题。
通过前期沟通及调研,通过调研准备,获取最详细的老机房位置图。其中包含设备位置、设备配置信息、系统业务信息、管理人员等相关资料统计,作为搬迁的基础数据。在新机房,建议设备位置规划保持和原有机房保持一致,降低上下架所消耗的时间,可以提高搬迁的效率。
搬迁前数据备份
数据可以说是企业的生命,所以搬迁的重中之重就是要确保数据万无一失,要做到数据的绝对安全的最好办法就是在搬迁前进行一次全面的数据备份,以保证数据的可用性和完整性。
通过严格的备份策略来保障备份数据的有效性,具体备份计划在项目开始调研后完善。
Ø 系统、数据备份需求调研
Ø 备份方案测试
Ø 备份实施
Ø 必要的备份恢复
应急方案
数据中心搬迁会存在的一定的风险,为保证搬迁的按计划顺利进行,对每次搬迁都准备了相关的应急措施,以备搬迁过程中出现问题能尽快解决,尽量缩短由于突发事件引起的系统中断。根据用户普遍存在多平台、多层次的业务环境的情况,因此我们在搬迁过程中需要针对基础架构中每个层面/平台做出对应的应急处理方案,以确保搬迁过程的顺利进行。
搬迁风险分析
一、 项目风险管理概述
每个项目都会面临各种各样的风险,有偶发的、人为的、内部的、外部的原因,为此,对项目进行风险评估,以采取相应措施来降低可能出现的风险是项目管理必不可少的过程。
综合机房搬迁项目的设计和实施是一个高风险的项目,这些不利的风险存在于整个项目中,并往往会给项目的推进和项目的成功带来负面影响。风险一旦发生,它的影响是多方面的,如导致项目的最终功能无法满足用户的需要、项目费用超出预算、项目计划拖延或被迫取消等,其最终体现为客户满意度的降低。因此,在项目实施过程中,要确保及时获得项目进程中所需的各种信息,及时预见、报警和防范工程实施中可能出现的各种风险,从而保证最小程度的差误损失。识别风险、评估风险并采取措施应对风险即风险管理有着十分重要的意义。
二、 项目风险管理步骤
项目的风险是多方面的。为此,项目风险管理主要有以下几个步骤:风险识别、定性/定量风险分析、风险应对计划编制及风险监控。
Ø 风险识别(Risk Identification)
风险识别是指识别并记录可能对项目造成不利影响的因素。风险识别不是一次性的工作,而需要更多系统的、横向的思维。几乎所有关于项目的计划与信息都可能作为风险识别的依据,如项目进度及成本计划、工作分解结构、项目组织结构、项目范围、类似项目的历史信息等。
Ø 风险分析(Risk Analysis)
其次,通过风险识别过程所识别出的潜在风险数量很多,但这些潜在的风险对项目的影响是各不相同的。“风险分析”即通过分析、比较、评估等各种方式,对确定各风险的重要性,对风险排序并评估其对项目可能后果,从而使项目实施人员可以将主要精力集中于为数不多的主要风险上,从而使项目的整体风险得到有效的控制。
Ø 风险应对 (Risk response)
最常采用的应对威胁的几种措施是:规避、减轻、转移、接受。
Ø 风险监控(Risk monitoring)
风险监控主要包括以下任务:
在项目进行过程中跟踪已识别风险、监控残余风险并识别新风险。
保证风险应对计划的执行并评估风险应对计划执行效果。
对突发的风险或“接受”的风险采取适当的权变措施。
三、 项目总体风险评估及防范计划
下面,我们从整个项目的角度,从沟通、技术方案、时间、项目范围及项目实施不同层面进行分析,看本项目可能存在的风险,及我们的防范计划。
序号 |
工程实施风险 |
严重程度 |
可能性 |
应对措施 |
1 |
项目涉及机房内全部信息系统搬迁,工程实施内容多 |
高 |
高 |
1.制定详细、精确的搬迁方案; |
2.尽可能多配置有经验的实施人员,并尽可能并行实施; |
||||
3.严格的项目管理及进度控制。 |
||||
2 |
从实施方案制定到搬迁实施,; |
高 |
高 |
1.制定实施方案时对现状的梳理要完整、准确 |
2.配置变更必须及时通知搬迁项目管理小组; |
||||
3.搬迁前必须对“搬迁单元”进行再次检查、确认。 |
||||
3 |
数据中心搬迁项目包括新数据中心网络建设、服务器、网络、存储、外设的拆卸、安装和搬运技术方案复杂 |
高 |
高 |
1.专业咨询服务商进行详细方案设计,合理划分搬迁单元和搬迁任务; |
2.专业搬迁服务公司实施搬迁工作; |
||||
3.设备厂商提供现场支持、保障 |
||||
4 |
原有业务切换到应急环境失败 |
高 |
高 |
依据风险预估方案紧急实施业务回滚到原有IT环境. |
5 |
搬迁过程中设备或系统故障 |
中 |
高 |
1.搬迁过程中通过系统备份 |
2.搭建应急系统平台,搬迁前进行系统切换后再进行搬迁原系统平台 |
||||
6 |
搬迁过程中设备损毁 |
高 |
低 |
1.制定详细的安全防范措施,尤其是针对没有冗余的设备 |
2.要求相关设备厂商和系统厂商提供现场支持,并确保备品、备件的库存及快速响应能力 |
||||
3.选择有经验和资质的物流公司 |
||||
4.选择合适的合作伙伴签订紧急供货及安装服务协议 |
||||
5.购买保险 |
||||
7 |
搬迁导致数据破坏 |
高 |
低 |
1.制定搬迁前的数据保护方案及紧急恢复预案 |
2.测试、验证数据保护与恢复预案 |
||||
3.搬迁前严格按照预案进行数据保护,并验证保护的有效性 |
||||
8 |
外围用户无法访问搬迁后的业务应用 |
高 |
中 |
1.准确、完整的《应用关联关系》分析 |
2.详细的用户访问路线分析,与网络部门确定、测试网络是否满足相关要求。 |
||||
9 |
搬迁遭遇不可抗力暂停,周期延长 |
高 |
低 |
制定搬迁策略、搬迁单元时要考虑此因素,避免对业务带来严重影响。 |
10 |
业务部门不能及时或无法配合搬迁后的业务验证、测试工作。 |
高 |
低 |
1.完善的计划 |
2.领导小组协调、安排 |
||||
11 |
搬迁后可能带来外围用户访问的变更要求 |
中 |
低 |
在制定搬迁方案中需要考虑可能对外围用户的变更要求,并提出相应计划。 |
12 |
搬迁过程导致的业务中断时间超出计划中断时间 |
中~高 |
高 |
制定应急预案(主要是通报、沟通方面) |
13 |
设备长时间运行,搬迁可能导致无法启动 |
高 |
高 |
1.通过断电重新启动区分工作界面 |
14 |
业务系统主机设备故障 |
高 |
高 |
1.通过租赁设备搭建备用主机应急搬迁 |
15 |
物流公司工具不够、搬迁线路搬迁困难 |
高 |
高 |
1.采用专业精密设备物流公司提供搬迁服务 |
灾难恢复组织和职责
客户应结合其日常组织机构的具体情况建立处理灾难的应急预案组织机构,并明确其职责。其中一些人可负责两种或多种职责,一些职位可由多人担任(应急预案中应明确他们的替代顺序)。
应急预案中的组织机构应由客户的管理、业务、技术和行政后勤等人员组成,分为应急指挥小组、应急响应组、灾难恢复组。
我们将作为应急响应组成员与客户一同加入应急预案流程执行灾难发生情况下的应急环境切换流程及相关操作。
未来设立客户应急响应中心的组织机构设置和职责定义如下:
组织机构 |
人员构成 |
主要职责 |
应急指挥组 |
客户高层领导 |
审核并批准应急预案; 组织应急预案的测试和演练;批准应急预案的执行。 |
应急响应组 |
维保服务厂、客户IT部门 |
提出灾难恢复策略和等级; 制定应急预案的各种策略、流程。 |
灾难恢复组 |
客户IT部门 维保服务厂商 |
容灾中心日常管理; 容灾系统运行和维护; 应急预案的培训和演练; 维护和管理应急预案; 灾难发生后信息系统和业务功能的恢复; 灾难发生后的外部协作。 |
响应时间和方式
● 电话支持:我们的客服中心接到客户故障申告后,在10分钟之内安排责任工程师提供电话支持服务,解答客户疑问并指导客户现场操作方法。
● 远程接入支持:我们在进行电话支持服务的同时,得到客户许可后通过远程接入方式登录客户网络,诊断并解决故障,并在3个工作日内向客户提交《故障诊断报告》。
● 现场支持:当电话或远程接入支持都无法解决问题,经双方确认需要现场支持时,我们将指派专职工程师并在规定的时间抵达客户现场提供支持服务。现场服务包括人力、硬件部件和维护材料,通过现场硬件部件测试、备件更换、系统软件相关问题处理,使得系统恢复至正常状态,更换下来的部件应属所有。现场硬件系统支持完成后的2个工作日内将向客户提交《现场服务报告》。
● 备件支持:发生紧迫故障时,我们将提供与故障可能涉及到的所有相关备件,并提供主要备件的冗余(比如同时携带2块甚至多块控制器),避免备件发生现场DOA(到货即损)的情况而拖延故障的修复时间。
● 不间断服务:我们的工程师到达现场后即开始进行不间断服务,直至您的设备能够重新运行。如需额外的部件或资源,立即通知后方支持资源,在最快的时间里调用所需部件,直至恢复系统,工程师才离开现场。
搬迁后保障服务
我们承诺:
此次搬迁后所有系统的运行状况与搬迁前完全一致。
在搬迁中产生的所有损坏设备,我司将提供维修服务(硬件及操作系统)。
我们拥有一支具备跨平台技术支持能力、丰富的IT设备维护服务经验的工程师组成的高水平的技术支持与售后服务团队,随时向用户提供最新的有关先进技术,以使用户的应用系统得到搬迁运维保障。
公司针对本项目的售后服务体制建立在以下三个层面:
7*24小时技术响应:7*24小时客户服务中心,用户可通过800电话或传真、电子邮件等任何形式报修;
现场服务:到达客户现场,解决客户的设备问题;
远程服务:由专职的技术人员负责,通过远程登录等方式解决客户的疑难问题;
注释:具体的后续服务内容由双方共同协商约定。
文明施工组织措施
信息机房施工是有风险的,不可预见的事情也很多,搬迁项目由于涉及设备移动,线缆更改,出故障的概率更大。但是,措施严密、责任心强即主观客观同时努力,就可以避免许多事故的发生。
Ø 严格办理进局施工通知单,按照甲方要求签字盖章、日期明确、不得私用其他单位或其他工程的进局施工通知单,禁止在施工通知单上随意改变内容。
Ø 工作人员进入通信机房(含设备间)施工时,需佩戴胸卡(或进局施工证),同时填写《出入机房登记表》,严格遵守局方的各项规章制度。
Ø 进入机房完成工作后,及时归还钥匙并做好登记。
Ø 落实安全责任,指定安全负责人或配备安全员。
Ø 确保竣工资料及时、准确,健全竣工资料交接签收制度;严格按照甲方要求时限完成工程的验收及结算。
Ø 施工现场的安全用电,严格执行用电操作规定,由持上岗证的专业电工管理和操作。
Ø 施工现场严禁吸烟、堆放易燃、易爆物品;施工现场整洁,做到文明施工、日干日清消除火灾隐患。
Ø 对工程中设备加电、割接及隐蔽工程,要高度重视提高工程质量保证施工安全。在制作各种设备数据、割接工作时,做好施工前的准备工作,制定周密的施工方案,分析施工风险,并包含失败倒回措施。
Ø 施工人员严禁在机房内吸烟和大声喧哗,杜绝一切有损本公司形象的举止、行为,不接触与施工无关的设施。完工后做好善后工作。
Ø 在线路施工时,要采取措施注意保护相邻的、原有的、尤其是光缆、电缆和通信设备的安全。
Ø 施工人员进入机房以及人、手孔内施工,要遵守安全操作规程,严禁吸烟,防止人身和通信设备事故发生。工毕,要清理现场,做好卫生,做到文明生产,文明施工。
Ø 施工人员要遵纪守法,遵守主业和局内各项规章制度,同时遵守交通法规,严禁酒后驾车,确保安全生产。
Ø 出现问题要及时组织解决并向上级主管部门报告。
零散设备包装
根据产品的不同规格订购不同尺寸的纸箱,包装要求:
1)纸箱底部需要使用3张5公分厚的海绵
2)箱体四周各使用1张5公分厚的海绵
3)顶部使用1张5公分厚的海绵
4) 所有配件装在1个塑料袋内
5)服务器及配件装入箱内后使用海棉填实,直到所有内物不会晃动为止
货物标签
制作货物标签。标签上应该有货物的型号,始发地位置和目的地的位置。共有2份,一份贴在货物上,另一份贴在货物外包装上。
设备运输方案
设备装车
1)机柜装车前需要车厢底部铺设防震材料,然后用卡车的尾板将货物送到车厢内,再用绑带固定。
打包完成的设备装托盘,然后用液压车和卡车的尾板将货物送到车厢内。
设备运输
1)所有包装材料和托盘必须在正式操作前先运至始发地的暂放点,车辆的进入时间必须按照目的地所规定时间段。
2)所有车辆,驾驶员必须有经验,能确保车内货物在运输途中不出现破损。
3)每部车装载完毕后,对所运车辆进行加封,并填写装车清单。装车清单上需注明所运货物的总数、托盘数、封志号、司机签名。
4)车辆行驶过程中严格控制速度,保证车速不高于40公里每小时。
设备卸车
1)当货车抵达目的地后接货人员须按“装车清单”的内容进行核对,并签收。
2)机柜卸车后,拆除包装,然后推到指定地点。
工具和材料
1)运输工具,平板车和液压车。
2)车厢内固定货物的工具,绑带。
运输车辆安排
1) 货物运输车辆。使用封闭厢式货车运输货物,自带尾板,便于货物的起重。
2) 备份运输车辆。为了预防在途中运输车辆发生故障无法行驶,因此安排备份运输车辆待命。
3)维修车辆。为了预防在途中运输车辆发生故障造成暂时不能行驶,安排维修车辆待命。
4)工作人员的交通车辆。安排运输车辆将工作人员送到操作现场。操作完成后,将工作人员从操作现场带走。
5)后勤保障的车辆。
保险事宜
运输保险
我们为用户购买运输保险,保证客户IT设备在运输当中因未知因素带来的损失降低到最低。
开关机保险
1)设备在搬迁之前,需关机掉电;设备运输到位后,需进行必要的加电开机测试。开关机过程中,可能因为设备电气性能老化引起硬件故障。负责更换损坏部件或整机。
2)用户可对重要设备、以及部分其他设备购买开关机保险。
搬迁完成测试验收
在搬迁完成后,我们对每套上线系统进行详细检查,确认无硬件故障,硬件搬迁成功验收签字。
在涉及数据的搬迁方案中,在最后系统调试完全成功后,我们认为搬迁项目完全成功。
主机搬迁测试及验收
Ø 电源的测试,测量电源是否符合该设备的要求;
Ø 设备上电后,检查操作系统是否运行正常;
Ø 操作系统运行后,检查相应系统硬件是否工作正常;
Ø 主机请查看相关网卡是否运行正常,使用ping网关的方式来确定网卡是否正常运行;
Ø 主机请查看相关HBA卡是否运行正常,查看相关连接设备的方式来确定HBA卡是否正常运行;
Ø 数据库,请测试相关数据库是否正常启动,运行相关sql程序检查数据库运行正常;
Ø 应用,请测试相关应用的是否正常启动,运行相关程序检查数据库运行正常;
当下述任一事项先发生,即视为本项目验收完成:
1. 完成工作说明书中所描述的服务内容,并通过主机系统测试。
2. 系统上线或系统投入使用。
存储搬迁验收
存储设备系统搬迁的测试主要包括以下内容:
Ø 存储设备上架加电
Ø 存储设备系统日志无故障
Ø 主机访问存储正常
Ø 带库设备,测试相关带库设备是否正常运行;
当下述任一事项先发生,即视为本项目验收完成:
1. 完成工作说明书中所描述的服务内容,并通过主机系统测试。
2. 系统上线或系统投入使用。
网络设备搬迁验收
网络核心系统搬迁的测试主要包括以下内容:
Ø 网络设备硬件测试,包括防火墙交换机外观及加电测试及软/硬件配置确认,以及核心交换机路由器外观及加电测试及软/硬件配置确认。
Ø 网络连通性测试,包括基本路由测试和服务器连通性测试。
Ø 网络冗余性测试,包括防火墙/交换机的电源备份测试,防火墙的冗余线路测试,防火墙冗余测试和交换机冗余测试。
当下述任一事项先发生,即视为本项目验收完成:
1. 完成工作说明书中所描述的服务内容,并通过网络系统测试。
2. 系统上线或系统投入使用。
搬迁后数据库测试
Ø 启动数据库
Ø 检查数据库运行是否异常
Ø 检查数据库日志信息是否异常
Ø 检查数据库与应用的连接
Ø 抓取数据库运行报告
1. 完成工作说明书中所描述的服务内容,并通过数据库系统测试。
2. 系统上线或系统投入使用。
搬迁后应用测试
Ø 启动业务系统
Ø 检查应用运行是否正常
Ø 检查应用日志是否错误
Ø 检查应用与数据库连接是否正常
Ø 前端系统进行正常业务操作测试
Ø 正常业务操作压力测试
1. 完成工作说明书中所描述的服务内容,并通过数据库系统测试。
2. 系统上线或系统投入使用。
搬迁后恢复工作
设备搬迁到迁入机房后,负责所有设备的联调工作,主要包括以下内容:
系统到位重组
系统设备到迁入机房后,从运输工具上搬下,进入迁入机房,并摆放到指定的位置,进行系统重组工作,注意事项:
l 操作人员有专业化水平,搬运途中注意安全;
l 卸下后设备存放在过渡区(室温、湿度接近机房内环境),待全部卸下工作完成后,统一拆封;
l 拆封后清点设备数量,如有遗失立即展开寻找工作,并同时联系硬件厂商寻找替代备件;
l 拆封后设备至少在过渡区摆放10分钟;
系统信息复原
系统设备重组完成之后,分别对各个子系统进行复位,包括主机、存储、网络等系统组件的复原,并核对启动后的系统信息是否与搬迁前一致,当出现差异时,主机工程师、网络工程师将相互配合,按用户要求对设备进行复原调整。
施工组织
项目实施组织
在项目实施期间,我们采用项目经理AB角制度,统筹安排整个搬迁项目的实施过程。同时将在以下具有高级工程师资质的人员中,挑选具有过多次大型搬迁服务经验的工程师担当现场项目经理,负责现场具体搬迁事宜。参与工程师有各项原厂认证。
项目分工界面
在搬迁过程中,需要做一个较好的工作界面的划分,确保后期维保的正常延续。
本次项目涉及的其他单位包括:新机房设计单位、客户方、各系统软件开发商、布线施工单位等。在搬迁过程中,由我公司进行整个搬迁工作的项目管理,各参与单位必须紧密配合,密切协作。在搬迁过程中,各参与单位的工作界面界定如下:
1. 搬迁筹备阶段
负责进行设备的系统搬迁信息整理和方案设计工作。完成方案设计,并完成搬迁所需的灾备系统环境的建设等。
2. 搬迁过程
1) 系统搬迁前,系统的健康检查由我公司、设备维保服务提供方和客户方共同进行,并经三方共同签字确认;
2) 由在搬迁前协助搭建应急系统基础环境,环境完毕后开始筹备系统的搬迁工作
3) 搬迁设备的标签工作,由我公司完成,布线施工单位协助,将在搬迁前完成,提高搬迁过程中的效率
4) 搬迁设备的下电、拆卸、上电等工作均由负责完成。
3. 搬迁设备上电后
1) 设备搬迁后的健康检查由我公司、设备维保服务提供方和客户方共同进行,并经三方共同签字确认;该部分搬迁过程中产生的设备损坏导致的维修费用均由我公司承担
2) 协助完成搬迁割接后,租赁设备的重新利用,基础环境准备工作
3) 对于无保设备,在设备搬迁过程中因各种原因导致故障所需备件及原厂应急服务费用由我公司承担。
上一篇:医院智能化系统工程方案
下一篇:没有了