數據中心機房在線搬遷的規劃實施

來源:本站原創 CISCO 超過966 views圍觀 0條評論

導讀]如何控制實施風險,穩妥做好數據中心機房在線搬遷,保障生產系統在機房搬遷期間不中斷服務,是科技部門在機房搬迂中要解決的重大難題。  

  數據中心機房在線搬遷,是在保障信息系統整體完好、連續運行條件下,在有限時間內將正在生產運行的IT設備從原機房拆除、移動、安裝到新機房的過程。近年來,隨著信息技術的飛速發展,新的IT技術和設備不斷投入使用,使得企業的IT系統對機房場地的要求不斷提高。因此,對數據中心機房進行在線改造和在線搬遷,成為科技部門需要考慮和應對的工作。如何控制實施風險,穩妥做好數據中心機房在線搬遷,保障生產系統在機房搬遷期間不中斷服務,是科技部門在機房搬迂中要解決的重大難題。

  在線搬遷的對象,狹義上主要指與生產系統運行相關的IT設備及附屬設備,廣義上還可能包括UPS、空調、供配電等機房場地設備和辦公家具等。機房搬遷實質上需要搬遷兩類對象,包括IT設備(計算機設備、網絡通信設備、設備機架及其他相關配套設備)等顯性對象和IT設備的各類連接(電氣連接、網絡連接、應用邏輯連接)等隱性對象。

數據中心機房在線搬遷的特點

  業務部門對機房搬遷的要求通常是運行時間短暫中斷,運行服務能力無損。相應地,機房在線搬遷工作具備以下特點。

  (1)實施時間緊迫。運行單位可接受的中斷服務時間限定為業務系統營業休息時間,如一個晚上或一個周末。

  (2)實施質量要求高。運行單位要求搬遷后各類IT設備均正常工作,搬遷前、后期間,應用系統須連續提供服務。

  (3)實施組織難度大。因需拆除、拆分和重新組裝,并建立所有設備及連接,對于大中型機房和較復雜的應用系統,常常涉及運行、建設、場地、系統維護、搬運、機房裝修等各責任方,參加人員多,實施組織難度大。

  數據中心機房在線搬遷風險

  機房在線搬遷的風險主要包括以下幾種。

  (1)管理風險。其表現為“沒想到”、“來不及”,組織管理不善,準備不充分,流程考慮不細致,工序銜接不順暢,時間分配不合理。一旦某一工作環節出現問題,會造成不能按時完成預定工作任務,不能按時恢復生產運行的情況。

  (2)技術風險。其表現為“啟不來”,“連不上”,原始建設資料殘缺、IT設備無法正確組裝、連接,搬遷后設備無法啟動,更改服務器IP地址后無法建立邏輯/應用連接。

  (3)實施風險。其表現為“差一個”,“不小心”,工作細節考慮不夠,準備不足,如工具、插頭、線纜不夠,設備組裝、連接不上,實施質量不高,IT設備損壞;電氣設施不合格,嚴重時甚至可能燒壞設備,造成慘重損失。

數據中心機房在線搬遷工作規劃

  工作規劃是控制在線搬遷風險,成功完成工程實施的重要基礎。搬遷工作規劃主要應包含以下幾個方面。

  1.人員規劃

  按照“專業人員做專業工作”的原則,確定參加方、人員專業技術要求,確定現場總指揮,以及拆除、搬運、安裝、檢查、開機等各工作環節的牽頭人和責任人,編制人員組織圖,明確責任分工,劃分工作界面,登記聯系方式。

  2.IT設備準備

  (1)設備整理。對待搬遷設備列出清單并分類、編號,列明現在位置、供電類型和容量,規劃設備搬遷批次。

  (2)擺放規劃。按機房裝修設計方案,分區、分類或分系統規劃設備搬遷后的擺放區位、機架、上架位置編號,完成設備布局圖、分類擺放圖、上架圖。

  (3)供電核查。以機架為單位計算用電量,按照一般不超過每機柜5kW的原則,調整擺放位置。核實機房配電系統竣工圖,檢查各用電回路容量、設施類型與規格,確認機柜的供電條件可以得到滿足。

  (4)網絡規劃。設計系統網絡拓撲圖、IP地址空間規劃、系統邏輯連接圖、設備接線圖。接線圖應至少包含每臺設備的名稱、編號、精確位置、IP地址、端口號,以及每個連接的雙方名稱與端口等信息。
  3.搬運準備

  (1)貨箱規劃。根據設備情況確定需要使用的包裝箱和貨箱的尺寸、個數,分析有無傾斜角度限制。

  (2)通道調查。調查電梯、走廊、出入口、斜坡、臺階等的尺寸、承重力,確保通過無障礙。

  (3)搬遷車輛。確定車輛的類型、臺數和尺寸要求。

  4.實施過程準備

  (1)工作流程。編制工作流程并與有關方面反復討論修改,使流程順暢、無遺漏、可操作。

  (2)工作步驟書。編制步驟書,細化流程,明確每個步驟的前提、結束條件、時間要求、責任人、工具等,形成詳細步驟書。特別需要注意的是,每個工作環節最好設定為一人執行,另一人復核。

  5.技術準備

  有些搬遷可能需要更改服務器IP地址。對包含操作系統、中間件、數據庫、負載均衡、應用的復雜系統,更改IP地址,重新建立邏輯連接較為繁瑣,需要擬定技術方案,編寫修改腳本,并嚴格測試。

  6.工具規劃

  根據工作要求,確定需要使用的網絡安裝、接線、電氣檢查、搬運、拆裝、清潔等工具、規格和數量,確定提供方和攜帶保管人員。

  7.應急方案

  數據中心機房搬遷過程中造成IT設備損壞、不能正常啟動、應用服務中斷的可能性很大,因此,機房搬迂必須考慮應急處置方案。

  (1)應急方案。制定應急工作方案,全面考慮可能發生故障的環節、應對手段和應急回退措施,包括管理流程、技術手段、實施步驟等具體信息。

  (2)系統備份。對關鍵系統、關鍵業務設備進行系統和業務數據備份。根據不同的條件選擇磁帶備份、磁盤備份、系統克隆等不同備份策略。對HA架構的應用系統可選擇分批搬遷設備,保持業務的連續運行。

  (3)對非IT設備,考慮搬遷工程中可能出現的意外情況,需設計應急處置方案,落實處置負責人,準備應急處置需要的物資工具。

文章出自:CCIE那點事 http://www.qdxgqk.live/ 版權所有。本站文章除注明出處外,皆為作者原創文章,可自由引用,但請注明來源。 禁止全文轉載。
本文鏈接:http://www.qdxgqk.live/?p=259轉載請注明轉自CCIE那點事
如果喜歡:點此訂閱本站
  • 相關文章
  • 為您推薦
  • 各種觀點
?
暫時還木有人評論,坐等沙發!
發表評論

您必須 [ 登錄 ] 才能發表留言!

?
?
萌宠夺宝游戏