據IDC的預測,到2024年,全球將創建、復制和消費143ZB的數據,其中中國創建的數據為36ZB,占25%。如此龐大的數據有多少被存儲下來了呢?西部數據認為只有不到1.5%的數據被存儲下來了。業界更是有人認為這個估計過于樂觀,被存儲下來的數據其實是低于這個比例的。
企業級存儲架構面臨挑戰
為什么會出現這種情況呢?幾年前業界就在宣傳數據是當代石油,是發展的動力。那這么多寶貴的石油就這樣流失掉了,沒有進行挖掘和分析處理,不是很浪費嗎?
西部數據公司副總裁兼中國區業務總經理劉鋼認為,這么多數據沒有被存儲下來的主要原因是因為存儲的架構和存儲的技術沒有及時跟上,因此大部分的數據都沒有辦法被存儲下來并及時使用。
圖:西部數據公司副總裁兼中國區業務總經理劉鋼
這也就是說,目前企業級的存儲架構正面臨著一些不可避免的挑戰,包括數據增長迅速、存儲性能需求倍增、TCO成本負擔增加,及更綠色能耗體系標準的挑戰。
人們需要大容量、能快速訪問、并且成本更低,能耗更低的存儲。那么,有沒有一個存儲設備,或者一種存儲介質能夠同時滿足這四個方面的要求呢?
劉鋼在不久前的2021深圳國際大數據與存儲峰會上表示,能滿足這四個要求的單一存儲介質或者存儲設備的確是非常難找到。但幸運的是,人們可以通過創新的架構,用系統來滿足用戶各方面、各種存儲場景的需求。“因為用戶的數據是要進行分層的,用戶的數據有不同的類型,不同類型的數據對存儲的要求也是不一樣的。”
創新存儲架構應對海量數據需求
在劉鋼看來,數據是有分層的,因此他把數據分成了極熱數據、熱數據、溫數據、冷數據和極冷數據五層。并且還劃分了每層對應的應用場景。
而對于不同層的數據,需要采用的存儲介質和存儲設備是不一樣的。比如對于冷數據和極冷數據而言,業界目前常用的方案是高密度的大容量企業級硬盤。
劉鋼對媒體表示,目前高密度企業級硬盤已經進化到了18T。針對極冷存儲,西部數據利用軟件和技術優化,采用了SMR疊瓦式的硬盤能做到20T的高密度企業應用。
談到具體產品,劉鋼介紹說,20TB Ultrastar DC HC650主機管理SMR HDD和16TB與18TB Ultrastar DC HC550 CMR HDD已經于2019年9月發布,是優先進入商業化實施階段的EAMR技術。憑借西部數據HelioSeal技術提供的出色功耗以及機械創新(例如提高磁頭定位精度并提供更大容量功能的TSA),這些HDD可提供領先的面密度,九磁碟硬盤還使客戶能夠更有效地配置和擴展數據中心環境,同時提供更低的總體擁有成本。
單位TB價格( $/TB) 是存儲服務器購置成本的關鍵組成部分,也是構建現代云數據中心的一個考量核心。相比較于$/TB這一維度,TCO則更能體現準確的數據中心運營成本:TCO 的降低并不限于降低 $/TB。每個硬盤的容量越大,意味著更少的服務器擁有更大的儲存容量,從而節省資本支出和運營成本。例如從14TB遷移到18TB呈現出顯著的TCO收益:服務器減少了22%;TCO降低了11%。鑒于數據中心占用空間有限,通過更高的HDD容量進行更密集的存儲部署,還可以產生更多的收入。
存儲服務器的成本通常要求控制在數據中心總體運營成本的60%以內。而實際上,更高容量的HDD可以更有效地平衡這一需求。西部數據持續進行多項技術的創新,例如能量輔助、機械設計、材料和記錄技術,幫助所有數據中心客戶,無論是超大規模云客戶,大型企業還是中小企業來有效應對他們的數據基礎架構挑戰。
圖:從左到右依次為:西部數據Ultrastar DC HC550 HDD 16TB、Ultrastar DC HC550 HDD 18TB和Ultrastar DC HC650 HDD 20TB
劉鋼還透露了一個消息,那就頭部的云服務商硬盤在過去4年當中,從8T進化到了18T。而的IPFS的服務商則在以更快的速度進化,他們幾乎在過去四個季度就走完了云服務商過去4年的演進過程,也從8T進化到了18T。
圖:云服務商與IPFS服務商使用硬盤的演進過程。
為什么數據中心能迅速從8T進化到18T呢?其實是當數據中心只是從14T升級到18T,為了達到同樣存儲的容量,服務器數量會減少約22%,而且不僅是服務器數量減少了,存儲密度也提高了,而且單位功耗還降低了約21%,因此部署成本降低了,運維成本也降低了。
除了大數據之外,還有一部分的數據用戶需要能夠快速訪問,比如像熱存儲、溫存儲等,這些數據指的就是快速據。西部數據把SSD劃分成了兩類,一類是主流的SSD,還有一類是針對寫密集、計算密集的高性能SSD。
據劉鋼介紹,西部數據推出了新的Ultrastar DC SN840 NVMe SSD和Ultrastar DC SN640 NVMe SSD。應用到IPFS里面,尤其是針對封裝計算機、封裝服務器的時候用SSD,對于IPFS的封裝機器來講,4個7.68T的SSD能提供非常好的加速。
談到SSD,目前其主要容量點是3.84T和7.68T。“SSD的主要成本在閃存(Flash),Flash決定了SSD硬盤的成本和性能。所以一家SSD的供應商需要有大規模的產能,能夠保證供應,同時能夠降低成本,還要有領先的Flash技術能夠提供高性能Flash、有自主可控的控制器和部件來縱向地優化SSD的產品,提供一致穩定的高性能,而不只是某個時間的高性能或者峰值的高性能。”他指出。
劉鋼還提到了他們剛剛發布的第6代3D閃存技術,162層的3D閃存技術,該技術會進一步地縮小芯片的尺寸,降低成本、提高性能。它的程序性能可以提高兩倍以上,輸入/輸出的IOPS提高約66%。
在劉鋼看來,西部數據最大的優勢是縱向集成的優勢。他們不僅有控制器及其固件,再將它們與Flash縱向集成后,可以達到非常穩定的一致性。
與合作伙伴的成功案例
截止目前,西部數據已經與諸多行業領先的公司開展了合作,致力于依靠行業領先的技術和整體解決方案來支持客戶與合作伙伴。
1.Dropbox超大容量企業級HDD全球應用
Dropbox與西部數據攜手,為確保流暢無縫地實現向SMR的遷移,Dropbox針對其特定機箱配置進行內部測試,采用SMR技術替換原有CMR技術后存儲密度增加了10%-20%,節約了20%的TCO。
作為率先認證Ultrastar 20TB SMR HDD的企業之一,Dropbox利用數據中心的大容量、高效率和擴展能力,應對滿足全球企業、團隊和個人對云存儲和服務不斷增長的前沿需求。Dropbox日前成為首批認證西部數據主機管理疊瓦式磁記錄 SMR HDD — Ultrastar DC HC650 20TB — 的企業之一。通過將西部數據SMR HDD用作定制的EB級存儲平臺的存儲基石,Dropbox遵循其戰略路線,以更好總體擁有成本(TCO)實現更高的存儲密度。
2浪潮、星辰天合的IPFS解決方案
西部數據、浪潮、星辰天合多方攜手,聯合推出IPFS 解決方案,在軟件層面,該解決方案搭載了專為 IPFS 場景而生的 XSFS(XSKY Scalable File System)系統,通過全新的存儲技術手段,基于通用的 X86 服務器構建了一個無限擴容、持續在線的高性價比存儲架構體系,在保證數據高安全性的同時,打破存儲規模壁壘,降低 IPFS 建設的投入,滿足 IPFS 業務存儲需求。
在硬件層面,該解決方案包括浪潮英信服務器 NF5466M5、西部數據 Ultrastar DC SN840 SSD、Ultrastar DC HC550 硬盤以及 Ultrastar Data60 JBOD 存儲平臺。通過搭載 44 塊/36 塊大容量的 Ultrastar DC HC550,NF5466M5 為 IPFS 存儲提供了海量的存儲空間,并借助硬盤的高穩定性,顯著降低復制證明和時空證明提交過程中出現錯誤的幾率。
3聯手杉巖數據打造IPFS解決方案
杉巖數據聯合西部數據,共同推出搭載了杉巖 MOS 海量對象存儲系統以及西部數據SSD, HDD與JBOD存儲平臺,并針對 IPFS 進行了優化的解決方案。該系統能夠滿足算力集群數據寫入需要的高吞吐量存儲集群性能,并對時空證明請求進行了優化,使其可以獲取多個文件的多段內容。同時,杉巖數據還在該方案中部署了 EC(22+2)冗余技術,實現了高達 91.6% 的存儲空間利用率。
該解決方案搭載了西部數據 Ultrastar DC SN840 NVMe SSD和Ultrastar DC SN640 NVMe SSD,Ultrastar DC HC550 18TB大容量HDD,以及 Ultrastar Data102 JBOD 存儲平臺,可以全面滿足 IPFS 存儲集群需求。得益于西部數據在存儲硬件方面的優勢以及杉巖數據卓越的存儲系統設計,該解決方案能夠幫助 IPFS 服務提供商顯著提升性能、穩定性并提升投資回報率。其中 Ultrastar DC HC550 HDD 18TB的超大容量以及 Ultrastar Data102 的組合有利于實現集約性的空間設計,使得組建 IPFS集群所需要的機柜空間、電源功耗、硬件成本大大降低。
4聯手長城超云打造IPFS新范式
長城超云與西部數據聯手打造出多款完美貼合IPFS場景的產品級解決方案,在IPFS行業種得到廣泛的應用。方案主要以西部數據高性能大容量企業級硬盤Ultrastar DC HC550系列的18TB HDD為基礎,設計了異構產品組合的集群測試方案,包括Miner、Worker和Storage,大幅提升了客戶的業務效率,從而增強了客戶在IPFS領域的核心競爭力。通過優越的產品配置與算法調優使得整體效率提升50%以上,同時單T有效算力硬件成本大幅降低。