中文字幕无码系列专区|92国产精品午夜福利|久久久综合九色综合88|国产天天看免费无码在线|国产精品黄国产在线综合网|韩国三级在线视频一区二区|伊人久久大香线蕉AV网址|国产精品美女一区二区三区不卡污

北京數(shù)據(jù)家科技股份有限公司-數(shù)據(jù)家,idc官網(wǎng),算力,裸金屬,高電機房,邊緣算力,云網(wǎng)合一,北京機房 北京數(shù)據(jù)家科技股份有限公司-數(shù)據(jù)家,idc官網(wǎng),算力,裸金屬,高電機房,邊緣算力,云網(wǎng)合一,北京機房

新聞中心

數(shù)據(jù)家,idc官網(wǎng),算力,裸金屬,高電機房,邊緣算力,云網(wǎng)合一,北京機房,北京云計算,北京邊緣計算,北京裸金屬服務(wù)器,北京數(shù)據(jù)服務(wù)器,北京GPU服務(wù)器,高算力服務(wù)器,數(shù)據(jù)機房相關(guān)技術(shù)新聞最新報道

高功率工作負(fù)載是否導(dǎo)致數(shù)據(jù)中心運行崩潰?

2024-04-18 17:54:56

在2023年下半年,越來越多的數(shù)據(jù)中心因工廠故障而中斷。至少可以說,這種突出的增長是不尋常的。

在過去的十年,數(shù)據(jù)中心的設(shè)計已經(jīng)得到了很大的改進和優(yōu)化。數(shù)據(jù)中心設(shè)施的規(guī)模不斷擴大,以滿足超大規(guī)模的需求。數(shù)據(jù)中心設(shè)施的復(fù)雜性不斷增加,以充當(dāng)各種云計算服務(wù)和光纖運營商的互連點;數(shù)據(jù)中心設(shè)施的數(shù)量不斷增加,以滿足對空間不斷增長的需求。

用于運行數(shù)據(jù)中心的工廠通常部署2N冗余或更高級別的冗余,以確保滿足可用性和正常運行時間指標(biāo)。雖然曾經(jīng)有過發(fā)電機組在需要時無法啟動和承擔(dān)生產(chǎn)負(fù)荷的情況,但隨著數(shù)據(jù)中心運營商對冗余系統(tǒng)進行更徹底和定期的測試,這些情況正在減少。

在這種情況下,越來越多的故障被認(rèn)為是導(dǎo)致數(shù)據(jù)中心中斷的原因,而數(shù)據(jù)中心中斷又會導(dǎo)致云計算服務(wù)和應(yīng)用程序的損失,這些服務(wù)和應(yīng)用程序使用的服務(wù)器耗盡了這些數(shù)據(jù)中心設(shè)施的資源,這可能會讓人感到有些驚訝。

但是,對于這些工廠故障的增加,有一些看似合理的解釋。

外部條件

氣候是一個顯而易見的解釋:在過去的一年里,數(shù)據(jù)中心設(shè)施的停電往往與高溫或風(fēng)暴等極端天氣事件同時發(fā)生。

idc網(wǎng),算力,裸金屬,高電機房,邊緣算力,云網(wǎng)合一,北京機房,北京云計算,北京邊緣計算,北京裸金屬服務(wù)器,北京數(shù)據(jù)服務(wù)器,北京GPU服務(wù)器,高算力服務(wù)器,數(shù)據(jù)機房在極端高溫期間,電網(wǎng)普遍存在壓力。對于數(shù)據(jù)中心運營商來說,這可能會導(dǎo)致電力質(zhì)量波動,例如浪涌和限電,并且可能需要使用現(xiàn)場工廠自己產(chǎn)生一些電力,以平穩(wěn)供應(yīng)并繼續(xù)為IT設(shè)備提供服務(wù)。冷水機組也必須更加努力地將數(shù)據(jù)地板溫度保持在指定的安全范圍內(nèi)。

另一方面,風(fēng)暴帶來了一系列不同的問題。雷擊可以摧毀現(xiàn)場變電站和一個或多個電力來源。也有冰雹或暴雨導(dǎo)致水進入設(shè)備層,損壞設(shè)備并使受影響地區(qū)的配電裝置短路的情況發(fā)生。

高性能的要求

雖然天氣狀況可以解釋一些數(shù)據(jù)中心的中斷,但其他中斷似乎是另一種現(xiàn)象的結(jié)果:在這些數(shù)據(jù)中心處理的計算密集型、數(shù)據(jù)驅(qū)動的工作負(fù)載的增加。對于較舊的數(shù)據(jù)中心,這些工作量使機架密度遠(yuǎn)遠(yuǎn)超過現(xiàn)有規(guī)格,導(dǎo)致正在進行冷卻器和其他數(shù)據(jù)中心設(shè)施升級和更換項目的此類設(shè)施數(shù)量增加。

一些數(shù)據(jù)中心運營商通過將密集的工作負(fù)載分離到更小的、專門建造的、高密度的數(shù)據(jù)中心來應(yīng)對。以前,在規(guī)模較大的托管數(shù)據(jù)中心設(shè)施中,密集的工作負(fù)載將在滿足更高機架設(shè)備密度的指定房間或數(shù)據(jù)大廳中運行。傳統(tǒng)的機架密度傳統(tǒng)上最大約為7kW,高密度區(qū)域迎合機架高達(dá)50kW。但在當(dāng)前數(shù)據(jù)驅(qū)動的環(huán)境中,機架的最大密度不再是50kW:有些數(shù)據(jù)中心的功率密度正在向200kW以上的極端密度發(fā)展。

顯然,不建議使用舊的或更通用的托管數(shù)據(jù)中心設(shè)施來支持這類密集的計算工作負(fù)載。將它們托管在專門建造的數(shù)據(jù)中心設(shè)施中更有意義,這些數(shù)據(jù)中心設(shè)施的設(shè)計目的是為了做好一件事:通過擁有相匹配的技術(shù)空間和設(shè)備來支持極端的計算需求。

然而,將密集的工作負(fù)載集中到一個較小空間中也不能保證正常運行時間。密集的工作負(fù)載并行運行給設(shè)施運營商帶來了更大的壓力,以確保數(shù)據(jù)中心的正常運行時間。這樣的環(huán)境包含大量IT設(shè)備,這些設(shè)備對電力可用性或冷卻能力的微小變化更加敏感,任何故障都可能降低或損壞為世界上一些關(guān)鍵基礎(chǔ)設(shè)施提供數(shù)據(jù)驅(qū)動決策的計算能力。

將密集的工作負(fù)載集中到較小空間中不能保證正常運行時間

數(shù)據(jù)中心故障不斷增加的另一個可能的解釋是,基礎(chǔ)設(shè)施被從消費者中抽象出來。應(yīng)用程序的架構(gòu)決策是孤立發(fā)生的,不需要很好地理解底層基礎(chǔ)設(shè)施需求。

這是因為平臺即服務(wù)(PaaS)和無服務(wù)器架構(gòu)的提升意味著開發(fā)人員可以專注于編寫代碼;他們不一定需要了解底層基礎(chǔ)設(shè)施的來龍去脈,包括如何限制應(yīng)用程序代碼運行所需的處理強度。

此外,應(yīng)用程序現(xiàn)在經(jīng)常利用第三方通過API來完成功能。這將把更多的處理需求轉(zhuǎn)移到其他方,并有效地依賴于使用底層基礎(chǔ)設(shè)施的這些方法。低效的代碼意味著基礎(chǔ)設(shè)施沒有有效利用。很明顯,這可能會給數(shù)據(jù)中心帶來不適當(dāng)?shù)膲毫Γ詽M足更高的處理需求。

在當(dāng)今的環(huán)境中,為了避免猝不及防,有能力檢測云服務(wù)或應(yīng)用程序所依賴的數(shù)據(jù)中心站點上發(fā)生的任何降級是至關(guān)重要的。這不僅對確保即時正常運行很重要,而且通過減少對任何單個數(shù)據(jù)中心的依賴來改進云服務(wù)或應(yīng)用程序的設(shè)計也很重要。

為了確保無縫的用戶體驗,云服務(wù)和基于web的應(yīng)用程序的運營商需要能夠理解支撐它們的一切。這可能包括對底層基礎(chǔ)設(shè)施的額外考慮,包括其(數(shù)據(jù)中心所在位置,以及該數(shù)據(jù)中心在其設(shè)計和冗余設(shè)備方面的能力。