數(shù)據(jù)中心采用一定的戰(zhàn)略,以確保能夠獲得清潔、持續(xù)的電力資源對(duì)于其IT系統(tǒng)而言是必不可少的。
曾幾何時(shí), IT僅僅只是另一項(xiàng)重要的商業(yè)資源。但到了今天,IT已然成為了許多公司的業(yè)務(wù)。沒有了IT,大多數(shù)企業(yè)組織及哦股將無(wú)法為他們的客戶服務(wù);與合作伙伴展開合作,開發(fā)新的產(chǎn)品或執(zhí)行其他基本的業(yè)務(wù)功能。
其結(jié)果是,數(shù)據(jù)中心的可用性已經(jīng)成為確保企業(yè)組織機(jī)構(gòu)的市場(chǎng)競(jìng)爭(zhēng)力和盈利能力的一個(gè)重要的先決條件。然而,盡管企業(yè)組織機(jī)構(gòu)已經(jīng)盡了自己最大的努力來確保數(shù)據(jù)中心系統(tǒng)的可用性,但他們?nèi)匀环浅H菀资艿礁鞣N各樣的威脅。而其中最主要的是便是來自電力系統(tǒng)的影響問題。數(shù)據(jù)中心的健康運(yùn)營(yíng)需要依靠持續(xù)的清潔電力供應(yīng)。然而,從電源系統(tǒng)設(shè)計(jì)的哪怕一絲一????的缺陷到整個(gè)電網(wǎng)發(fā)生的故障,都可能導(dǎo)致即使是最現(xiàn)代和先進(jìn)的數(shù)據(jù)中心陷入癱瘓。
慶幸的是,企業(yè)組織可以通過采取對(duì)他們的業(yè)務(wù)流程和電力系統(tǒng)管理經(jīng)過驗(yàn)證的改變辦法來顯著的減輕其電源相關(guān)的停機(jī)時(shí)間。在本文中,我們將與廣大讀者朋友們共同探討關(guān)于如何建立和維護(hù)一個(gè)高度可用的數(shù)據(jù)中心電力基礎(chǔ)設(shè)施的10項(xiàng)尚未被業(yè)界充分利用的最佳實(shí)踐解決方案。
業(yè)務(wù)流程管理實(shí)踐方案
1、打破企業(yè)組織機(jī)構(gòu)間的壁壘
在大多數(shù)公司,通常都是由兩個(gè)獨(dú)立的部門負(fù)責(zé)數(shù)據(jù)中心的管理:IT部門和基礎(chǔ)設(shè)施部門。IT部門負(fù)責(zé)監(jiān)控?cái)?shù)據(jù)中心的計(jì)算機(jī)基礎(chǔ)設(shè)施與應(yīng)用程序,該部門通常是向所在企業(yè)的首席信息官報(bào)告。而基礎(chǔ)設(shè)施部門則負(fù)責(zé)處理數(shù)據(jù)中心的能源和冷卻方面的要求,該部門通常是向所在企業(yè)的首席運(yùn)營(yíng)官或負(fù)責(zé)公司不動(dòng)產(chǎn)方面的副總裁報(bào)告。長(zhǎng)期以來,這種企業(yè)組織???????構(gòu)的劃分已經(jīng)成為大型企業(yè)的規(guī)范常態(tài),但其往往會(huì)導(dǎo)致負(fù)責(zé)維持工作負(fù)載的人員與負(fù)責(zé)提供電力資源的人員之間的溝通不暢。
從歷史上看,企業(yè)IT和基礎(chǔ)設(shè)施部門之間的協(xié)商不充分并為對(duì)數(shù)據(jù)中心的可用性構(gòu)成太大的危險(xiǎn)。直到最近,即使是在最大型的數(shù)據(jù)中心,其工作負(fù)載和功耗要求也是較為適中的,其IT管理人員們可以安全地重新安置服務(wù)器和工作負(fù)載,而不會(huì)對(duì)電力或冷卻系統(tǒng)帶來太大的壓力。
然而,今天的大規(guī)模的服務(wù)器基礎(chǔ)架構(gòu)正在變得越來越大、更為耗電、同時(shí)也就會(huì)散發(fā)更多的熱量。此外,刀片式服務(wù)器和虛擬化的廣泛采用——在簡(jiǎn)化管理,并提高服務(wù)器利用率的同時(shí),也大大增加了計(jì)算密度和由此產(chǎn)生的熱量——也進(jìn)一步的加速了上述這些趨勢(shì)。 而在今天,在沒有咨詢基礎(chǔ)設(shè)施工程師的前提下,服務(wù)器的蔓延,數(shù)據(jù)中心的散熱冷????,工作負(fù)載或硬件的遷移都可能導(dǎo)致電力設(shè)施的超負(fù)荷或HVAC系統(tǒng)的不堪重負(fù),這可能反過來進(jìn)一步降低關(guān)鍵系統(tǒng)的運(yùn)行效率。
然而,不幸的是,雖然最近幾年以來數(shù)據(jù)中心行業(yè)本身已經(jīng)獲得了相當(dāng)顯著的發(fā)展,但數(shù)據(jù)中心內(nèi)部的企業(yè)組織結(jié)構(gòu)卻并沒有。其內(nèi)部的IT和基礎(chǔ)設(shè)施部門仍然是兩個(gè)相關(guān)獨(dú)立的部門,且相互之間在重要的業(yè)務(wù)事項(xiàng)方面往往缺乏充分有效的溝通。
解決方案:為了盡可能的減少與電力相關(guān)的停機(jī)時(shí)間的發(fā)生,企業(yè)組織應(yīng)該就IT管理人員和基礎(chǔ)設(shè)施管理人員在對(duì)數(shù)據(jù)中心的實(shí)現(xiàn)修改時(shí)應(yīng)該如何以及何時(shí)進(jìn)行相互協(xié)商的程序建立明確且標(biāo)準(zhǔn)的文檔記錄。
為了進(jìn)一步推動(dòng)IT和基礎(chǔ)設(shè)施部門之間的有效溝通,企業(yè)組織也應(yīng)該考慮改變自己的組織結(jié)構(gòu)圖,使得IT和基礎(chǔ)設(shè)施兩個(gè)部門都向相同的CXO級(jí)的高管報(bào)告。這可以通過在兩個(gè)部門之間設(shè)置一套通用的業(yè)務(wù)期望目標(biāo)和共同的報(bào)告結(jié)構(gòu),使得IT和設(shè)施管理人員之間的互動(dòng)變得更容易。
▲圖1:在經(jīng)過優(yōu)化的企業(yè)組織架構(gòu)方案中,IT部門、基礎(chǔ)設(shè)施部門和企業(yè)高管之間公開分享信息,并做出協(xié)同做出決策。
▲圖2:最新的企業(yè)管理應(yīng)用程序?yàn)槠髽I(yè)的IT和基礎(chǔ)設(shè)施部門提供了一款單一的、基于Web的視圖,來幫助他們掌握數(shù)據(jù)中心的功耗和散熱情況。如果電力系統(tǒng)元件存在能耗和溫度超過閾值的危險(xiǎn),其還可以主動(dòng)提醒運(yùn)營(yíng)人員和設(shè)備管理人員。
8、采用適合您企業(yè)需求的電力系統(tǒng)拓?fù)浣Y(jié)構(gòu)
電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)對(duì)采購(gòu)成本、運(yùn)營(yíng)費(fèi)用、可靠性和平均維修時(shí)間有著重要的影響。對(duì)于一處既定的數(shù)據(jù)中心,您所設(shè)計(jì)的冗余越多,那么在其建造和運(yùn)行過程中您企業(yè)所花費(fèi)的成本也就會(huì)越多,但其也能夠更快地從中斷中恢復(fù)。
國(guó)際正常運(yùn)行時(shí)間協(xié)會(huì)(The Uptime Institute)是一家專為企業(yè)數(shù)據(jù)中心的業(yè)主和運(yùn)營(yíng)商服務(wù)的獨(dú)立的研究機(jī)構(gòu)。該機(jī)構(gòu)為數(shù)據(jù)中心的關(guān)鍵任務(wù)設(shè)施定義了四項(xiàng)電源系統(tǒng)拓?fù)浣Y(jié)構(gòu)來說明這一原理:
較之Tier III或Tier IV拓?fù)?,一個(gè)Tier I或Tier II的拓?fù)湎鄬?duì)便宜,但同時(shí)也提供了較少的可靠性和正常運(yùn)行時(shí)間。
解決方案:當(dāng)涉及到選擇一款電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)時(shí),并沒有唯一正確的答案。企業(yè)組織應(yīng)將他們的特殊業(yè)務(wù)情況和需求與其電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)相匹配。
例如,一個(gè)Tier II的拓?fù)浣Y(jié)構(gòu)對(duì)于托管了一款Web應(yīng)用程序的一處數(shù)據(jù)中心可能是良好的,假設(shè)多個(gè)備份站點(diǎn)是可用的,那么用戶如果偶爾會(huì)遇到幾秒鐘的延遲的話,他們不太可能會(huì)過多抱怨。然而,如若是在華爾街,哪怕僅僅幾秒鐘的延遲所可能導(dǎo)致的損失則也是以數(shù)百萬(wàn)美元計(jì)算的。因此,一處托管了金融交易應(yīng)用程序的數(shù)據(jù)中心,選擇采用一個(gè)Tier IV拓?fù)浣Y(jié)構(gòu)將是明智的。
9、更換過時(shí)的舊設(shè)備
電力異??赡軙?huì)影響到敏感電子設(shè)備的運(yùn)行,并包括組件中斷,可能會(huì)對(duì)整個(gè)企業(yè)的業(yè)務(wù)產(chǎn)生重大影響。
數(shù)據(jù)中心一般利用不間斷電源設(shè)備(UPS)來防止電源異常。這樣的系統(tǒng)能夠清潔“臟”的電力系統(tǒng),并在供電中斷期間提供應(yīng)急電源。然而,直到最近,相對(duì)于其功耗而言,可用性最高的雙轉(zhuǎn)換UPS 系統(tǒng)往往是效率最低的,反之亦然。因此,那些希望能夠盡量壓低運(yùn)營(yíng)成本的企業(yè)組織可能已經(jīng)部署實(shí)施了節(jié)能的UPS產(chǎn)品,這類產(chǎn)品交付低于平均水平的可用性;而那些更關(guān)注正常運(yùn)行???????間的企業(yè)組織則部署實(shí)施了高可用性的UPS系統(tǒng),同時(shí)也浪費(fèi)了電力資源。
解決方案:今天,已充分市場(chǎng)充分驗(yàn)證的成熟的UPS技術(shù)使得企業(yè)組織能夠在一款單一的設(shè)備中同時(shí)享受到高可用性和高效率。對(duì)于那些使用較舊的不間斷電源技術(shù)的企業(yè)組織而言,他們應(yīng)考慮升級(jí)到這種新一代的設(shè)備,以便能夠提高應(yīng)用程序的可用性,并同時(shí)降低總擁有成本。
10、審查您企業(yè)數(shù)據(jù)中心的電力系統(tǒng)
大多數(shù)數(shù)據(jù)中心管理人員都認(rèn)為,他們對(duì)于其電力系統(tǒng)的交付能力是清楚知道的。然而,事實(shí)上,真正能夠做到這一點(diǎn)的數(shù)據(jù)中心管理人員是少之又少。這是因?yàn)榇蠖鄶?shù)企業(yè)并沒有定期對(duì)他們的電力基礎(chǔ)設(shè)施進(jìn)行審計(jì)。
只有通過審核電力系統(tǒng),及您企業(yè)組織用來支持該系統(tǒng)的操作流程,您才能夠建立您的數(shù)據(jù)中心的最大負(fù)載參數(shù)。當(dāng)您需要把重要的新的IT工作負(fù)載投入生產(chǎn),但卻因?yàn)殡娏Σ蛔愣鵁o(wú)法做到時(shí),僅僅靠依托產(chǎn)品規(guī)格和承包商的承諾會(huì)讓您企業(yè)暴露在容量能力不足的困難風(fēng)險(xiǎn)之下。
解決方案:定期徹底的審核您數(shù)據(jù)中心的電源系統(tǒng)。
結(jié)論
在今天,維持一處大型的、散熱量大且復(fù)雜的數(shù)據(jù)中心的可用性比以往任何時(shí)候都更為困難,也更具重要的戰(zhàn)略性意義。特別是考慮到當(dāng)前的全球經(jīng)濟(jì)一體化,可持續(xù)發(fā)展的壓力和普遍的人口老齡化所導(dǎo)致的勞動(dòng)力減少的大背景之下。企業(yè)組織已經(jīng)利用了各種技術(shù)和流程,以確保關(guān)鍵任務(wù)的IT 系統(tǒng)能夠獲得清潔,可靠的電力資源供應(yīng)。然而,大多數(shù)企業(yè)組織可以通過采用本????中所討論到的相關(guān)解決方案來進(jìn)一步減輕他們數(shù)據(jù)中心的停機(jī)時(shí)間。誠(chéng)然,上文中所提到的某些方案可能需要您企業(yè)數(shù)據(jù)中心增加在新的硬件或軟件方面的投資。但其實(shí)許多都如同讓IT和基礎(chǔ)設(shè)施人員互相有效溝通一樣簡(jiǎn)單。
當(dāng)然,在本文中所討論的10項(xiàng)最佳實(shí)踐解決方案并沒有窮盡企業(yè)組織可以用來保護(hù)他們的數(shù)據(jù)中心,防止出現(xiàn)電力系統(tǒng)相關(guān)的服務(wù)中斷的全部方式。而那些嚴(yán)重依賴于其數(shù)據(jù)中心的可用性的企業(yè)組織應(yīng)該不斷密切的關(guān)注和研究最一流的數(shù)據(jù)中心前沿技術(shù)和流程,并積極的采用這些前沿技術(shù)和流程。而在這樣的任務(wù)上所花費(fèi)的時(shí)間幾乎總是以確保數(shù)據(jù)中心業(yè)務(wù)連續(xù)性的新的想法和思路的產(chǎn)生而給予回報(bào)的。

