
數據中心最佳實踐介紹
數據(ju)中心存在(zai)的(de)(de)唯(wei)一(yi)最重要(yao)的(de)(de)原因(yin)是(shi)保持托管(guan)在(zai)其中的(de)(de)服務以(yi)(yi)及從中分發的(de)(de)服務的(de)(de)可用性(xing)(xing)。這些基于建筑物內的(de)(de)IT設(she)備,它需要(yao)四個關鍵資源,包括安(an)全性(xing)(xing),網絡彈性(xing)(xing)以(yi)(yi)及電源和散熱的(de)(de)連續性(xing)(xing)。
數據中心(xin)運(yun)營商必須(xu)盡可能(neng)(neng)以最(zui)節能(neng)(neng)和最(zui)具成(cheng)本效益的(de)方(fang)式保(bao)持此服務的(de)可用性。以下系列文章介紹(shao)了(le)旨在實(shi)(shi)現此目(mu)標的(de)經過實(shi)(shi)踐(jian)檢驗的(de)實(shi)(shi)踐(jian)。目(mu)的(de)是強調行業領(ling)先的(de)最(zui)佳實(shi)(shi)踐(jian),最(zui)著名的(de)方(fang)法和行為,應(ying)在任何數據中心(xin)站點上(shang)一致地應(ying)用該軟件,以實(shi)(shi)現此目(mu)標。
數據中心運營和管理
如上所(suo)述,數據中心是建筑物(wu)或(huo)建筑物(wu)的隔離區域,其(qi)唯一目(mu)的是提供安(an)全,高可用性和(he)可靠的IT服務。為了獲得(de)高(gao)可用性的(de)服務,站點(dian)的(de)基礎架構和(he)操(cao)作需要緊密同步(bu),并(bing)(bing)與(yu)政策,程(cheng)序,人員和(he)培訓密切(qie)相關,并(bing)(bing)加以記錄,以識(shi)別(bie)和(he)減(jian)輕(qing)可能導致服務中斷或(huo)威脅(xie)服務連續(xu)性的(de)任何風險。為了實現長期可靠性,必須以高(gao)標準(zhun)操(cao)作和(he)維護數據中心(xin)設施,并(bing)(bing)且必須識(shi)別(bie),記錄所有(you)潛在風險并制定適(shi)當的(de)緩解(jie)計劃。
操(cao)作(zuo)(zuo)(zuo)(zuo)風險很難建模(mo)和量(liang)化(hua),因為(wei)它直接關(guan)系(xi)到操(cao)作(zuo)(zuo)(zuo)(zuo)人(ren)員的(de)(de)能力(li),他們所接受培訓(xun)的(de)(de)充分性以(yi)及有效的(de)(de)措施或適(shi)當(dang)(dang)的(de)(de)流(liu)程。為(wei)了(le)最大程度地降低操(cao)作(zuo)(zuo)(zuo)(zuo)風險,操(cao)作(zuo)(zuo)(zuo)(zuo)和維護(hu)人(ren)員必須具有操(cao)作(zuo)(zuo)(zuo)(zuo)設(she)施中所包(bao)含設(she)備的(de)(de)適(shi)當(dang)(dang)資格。
維(wei)護(hu)質量(liang)對(dui)于任何數據(ju)中心的可靠運行都至關重(zhong)要(yao)(yao)。所有維(wei)護(hu)活動均(jun)應(ying)完整(zheng)記(ji)(ji)錄(lu),并應(ying)保留平(ping)均(jun)故障間(jian)(jian)隔(ge)時間(jian)(jian)(MTBF)和平(ping)均(jun)維(wei)修時間(jian)(jian)(MTBR)記(ji)(ji)錄(lu),以進行生命周(zhou)期分析(xi)。應(ying)要(yao)(yao)求供應(ying)商保留此類信息的記(ji)(ji)錄(lu),并應(ying)要(yao)(yao)求提(ti)供這些記(ji)(ji)錄(lu)。這將提(ti)高風(feng)險分析(xi)和績效(xiao)趨勢研究的準(zhun)確性(xing)。
人員配置
數(shu)據中(zhong)心運營(ying)團隊通(tong)常(chang)由(you)來自多個組織或部門的個人(ren)組成,每個人(ren)都有自己的范(fan)圍(wei)和職(zhi)責。
明(ming)確定(ding)義(yi)和記錄這(zhe)些(xie)角色和職責對于成功的數據(ju)中心運營(ying)至關重要。責任分(fen)立或(huo)不確定(ding)會增加(jia)風(feng)險(xian),尤其是在復雜的運營(ying)環境中。因此,一開始就應(ying)非常清楚(chu)地記錄所有責任領域,報告路線和升級機制,并向(xiang)所有各方(fang)明(ming)確。
與(yu)特定(ding)(ding)建筑(zhu)區(qu)域(yu)(辦公室/廠房等)有關的(de)所(suo)有責(ze)任(ren)也(ye)應非常明(ming)(ming)確(que)地定(ding)(ding)義和詳細說明(ming)(ming)。這些(xie)應擴展到所(suo)有IT,安全和設(she)施人(ren)員(yuan)和主(zhu)要供應商。明(ming)(ming)確(que)確(que)定(ding)(ding)責(ze)任(ren)和組織仍然是“最佳運(yun)營最佳實踐”總體制度的(de)組成部分,因此,對現場運(yun)營感興趣(qu)的(de)各個(ge)個(ge)人(ren),團體,部門和組織的(de)明(ming)(ming)確(que)責(ze)任(ren)界定(ding)(ding)對于(yu)運(yun)營績效至關重要。
所有現(xian)場操(cao)作(zuo)人(ren)員都應(ying)(ying)受過良好的(de)訓(xun)練和良好的(de)實踐,有信心并(bing)有能力(li)操(cao)作(zuo)現(xian)場基礎架(jia)構(gou),包括在(zai)任何時候甚(shen)至(zhi)在(zai)壓(ya)力(li)很大(da)的(de)事件(例如(ru)可(ke)能導致(zhi)服務(wu)中斷的(de)設(she)備故障)期間。具體來說,應(ying)(ying)由現(xian)場安裝的(de)設(she)備的(de)供(gong)應(ying)(ying)商對人(ren)員進行培訓(xun),以確保最高程(cheng)度(du)的(de)培訓(xun)和理(li)解。重要的(de)是在(zai)新(xin)設(she)備的(de)招標(biao)中要考慮到(dao)這(zhe)一點。一個運行良好的數據(ju)中心將始終考慮與(yu)站點運營和(he)管理(li)相關的人為(wei)因素。
數(shu)據中(zhong)心(xin)運營的可用性和可靠性
可用性和(he)可靠性對于任何(he)數(shu)據中心的運營都是至關重要的,但是如何(he)定(ding)義和(he)衡(heng)量(liang)它(ta)們呢?以下部分提供(gong)了(le)該領域的一些基本知識。
可靠性
在給定的環境(jing)中,出于(yu)特(te)定目的,在指定時間內無故障系統(tong)運行(xing)的可能(neng)性
可用性
系統在某(mou)個時(shi)間(jian)點將(jiang)能(neng)夠(gou)運行并(bing)能(neng)夠(gou)提(ti)供所請(qing)求的(de)服務的(de)概率始(shi)終以(yi)正常運行時(shi)間(jian)與停機時(shi)間(jian)的(de)百分(fen)比來(lai)衡量(liang);越接近100%越好。
可用性,以其最(zui)簡單的形式:A =正常運行(xing)時間/(正常運行(xing)時間+停(ting)機時間)可(ke)用(yong)性(xing)是系(xi)(xi)統(tong)運行時(shi)的時(shi)間(jian)百(bai)分比。組件的可(ke)用(yong)性(xing)可(ke)通過以下(xia)公(gong)式獲得。與(yu)可(ke)用(yong)性(xing)和可(ke)靠(kao)性(xing)有(you)關(guan),但與(yu)眾(zhong)不(bu)同,可(ke)用(yong)性(xing)考慮了系(xi)(xi)統(tong)停止服務的時(shi)間(jian),如果(guo)重新啟(qi)動時(shi)間(jian)短,則不(bu)可(ke)靠(kao)的系(xi)(xi)統(tong)可(ke)能具有(you)較高(gao)的可(ke)用(yong)性(xing)(在(zai)數據中心中無(wu)用(yong),尤其(qi)是在(zai)電(dian)源方面)可(ke)用(yong)性(xing)提(ti)供有(you)關(guan)時(shi)間(jian)使用(yong)的信(xin)息(xi)。可(ke)靠(kao)性(xing)提(ti)供有(you)關(guan)無(wu)故(gu)障間(jian)隔的信(xin)息(xi)。


























































































































