對于存儲而言,性能是產品要追求的重要指標,但更關鍵的在于如何真正貼合用戶實際場景的使用需求,為用戶業務的高效運轉帶來切實的幫助。深信服也在探索中不斷思考,對于用戶而言什么才是更好的存儲。基于上千家用戶案例的積累,深信服分布式存儲EDS從用戶的業務場景痛點出發,為醫療、政府、企業、廣電等行業提供性能支持。
一、醫學影像業務場景
醫院醫學影像數據(主要是CT和MR)的迅速增長,對醫院現有PACS系統的承載能力提出挑戰,在數據重壓之下,PACS系統的底層存儲也成為被廣泛關注的焦點。深信服EDS承載醫院海量醫學影像文件的同時,為醫生帶來更為順暢的閱片體驗。
場景痛點:海量醫學影像文件讀取卡頓
病人一次CT檢查會產生幾千張500KB左右大小的影像文件,放射科醫生閱片時,通過閱片終端加載這些影像文件進行診斷。
據統計,三級醫院每年新增的醫學影像文件數量超過1億,大規模的小文件數量會對存儲的訪問效率產生極大影響,如果從存儲讀取某張影像時延過高,便會出現卡頓,嚴重時會極度影響工作效率。而在業務高峰期,上百位門診醫生、臨床醫生同時閱片時,效率問題會更明顯。
解決方案:雙重預讀模式實現高效閱片
為了進一步提升醫生的閱片效率,EDS通過智能預加載技術,內置一個預測模塊,根據客戶端在目錄上產生的讀取文件操作生成預讀序列,預讀線程根據預讀序列將影像文件預加載到內存。為了實現更精準的預讀,EDS針對不同場景推出基于目錄和時間兩種不同的預讀機制。
基于目錄預加載:大部分場景下,一個目錄僅存放一個病人的某次檢測結果,若單次檢測產生的文件數量不多,則將整個目錄的文件都加載到內存。但由于PACS軟件設計問題,存在一個目錄存放了多個病人的檢測結果,幾十萬的文件數量無法采用基于目錄的預加載機制,就需要基于時間預加載。
基于時間預加載:某個病人的檢測結果,其影像創建時間是比較臨近的,通過創建時間將目錄內的文件進行分組,當某個組中的文件在短時間內被讀取超過3個,則將整個組中的文件加載到內存。
通過EDS兩種加載機制,目前醫生閱片時可實現單張讀取時長不超過10ms。
二、廣電非編業務場景
隨著4K的普及,各電視臺需要重構已有IT架構以實現對4K的支持,4K意味著媒資數據量更加龐大,需要“采,編,播,存,傳”全流程各個環節的進行支撐,對采編效率、底層存儲的吞吐能力有著更高的要求。深信服EDS讓音視頻素材讀取更加迅速,實現廣電超清4K節目高效制作。
場景痛點:超清節目制作時延過大導致丟幀
超清4K節目的生產制作流程由素材上載、文件收錄、在線編輯、合成轉碼、審查等環節組成,4K場景的非編操作,視頻碼率大、層數多,需要存儲系統提供穩定的高帶寬,對時延敏感,時延過大會導致視頻畫面出現丟幀。同時,非編業務涉及到視頻素材編輯的多個層次疊加,每一層都需要從音視頻素材讀取數據,層數越多,對存儲吞吐的要求越高。
4K編輯性能需求:
解決方案:存儲介質+存儲網絡升級降低讀寫時延
EDS使用NVMe SSD作為Tier分層,數據優先寫入Tier分層,并優先從分層中讀取數據,并搭配RDMA低時延網絡,來降低業務讀寫時延。
EDS通過3節點混合盤配置存儲集群提供6GB/s吞吐,以國內標準的500Mbps的4K素材為例,3節點即可滿足16臺4K超高清工作站同時進行6層素材編輯(或120臺高清工作站同時進行4層100Mbps高清素材編輯)的性能需求,不出現丟幀和錯幀。
三、測繪航測建模業務場景
測繪作為地理信息行業主要的數據生產方,其主要業務為傾斜攝影(即航測)和衛星遙感,無人機或有人機傾斜攝影是通過飛行平臺搭載相機從多個不同視角同步采集地表影像,獲取到豐富的地表信息,用于進行三維模型建模。深信服EDS可以充分滿足建模過程對大文件吞吐以及小文件讀寫的不同性能訴求。
場景痛點:空三解算、三維建模性能需求各異
航測業務流程可以劃分為3個主要階段:
1、外業采集:外業采集中外業人員通過有人機或無人機對測區進行傾斜攝影,采集大量幾MB~幾十MB大小的圖片文件和控制點坐標文件;
2、內業生產:外業采集的圖片數據被傳送到數據中心后,在三維建模軟件里進行空三解算和三維建模環節:
空三解算:空三解算過程會產生大量讀原圖片(MB級文件)操作,對存儲的吞吐性能要求高;
三維建模:三維建模通過多臺建模工作站并發計算,這個過程會產生大量幾KB-幾百KB級別小文件的讀寫操作,對存儲的小文件讀寫性能要求高。
3、數據流轉:建模完成后三維模型數據作為交付物交付給甲方,原片數據、過程報告等數據需要歸檔做長期保存。
解決方案:軟件邏輯層IO路徑優化滿足并發建模需求
在大量原片數據承載上,EDS使用NVMe SSD分層并搭配RDMA低時延網絡,來降低業務讀寫時延,滿足空三解算階段拉取原片的吞吐需求,在建模過程數據承載上,EDS使用全固態配置,并搭配一系列存儲軟件邏輯層IO路徑優化降低小文件讀寫時延。
EDS航測建模存儲方案做到建模效率相比傳統存儲方案提高30%以上,并可滿足同時200個工作站并發建模不掉速。
四、交管海量圖片場景
隨著城市安防建設推進,交管行業每天都會產生大量的人臉抓拍、車輛抓拍圖片數據,這些數據往往需要長期保存,如卡口抓拍照片保存的數據不短于180天等,只有實現安全存放、快速調取這些圖片數據,才能讓公安、交管等行業業務平臺發揮作用。深信服EDS實現交通管理場景下海量圖片小文件的高效處理。
場景痛點:海量照片小文件刪除、調用處理難度大
交通卡口抓拍圖片具有以下特征:
單個圖片文件小,大部分圖片數據小于1MB;
文件數量多,一個市每天產生的圖片數量超過千萬張;
存儲在承載10億以上文件規模的圖片數據的同時要滿足每天高速讀寫需求,并且需要支持每天高速刪除千萬張照片釋放存儲空間。
解決方案:自研元數據管理+小文件合并實現輕松承載
EDS對象存儲通過小對象合并技術大幅降低元數據規模,保證關鍵元數據都能夠完全存儲在有限的SSD上,并利用自研PhxKV數據庫對元數據進行管理,提升元數據訪問效率及故障修復的效率,從而提升EDS對海量小文件/對象讀寫效率,可以從容承載百億級別的小文件/對象。
EDS對象存儲3節點混合盤集群可以做到承載百億規模對象,且性能下降不超過5%,通過對象生命周期管理,可以實現每天刪除2000萬個對象,并快速釋放存儲空間。
五、數據庫場景(OLTP/OLAP)
數據庫承載著很多企業的核心業務數據,主要作用體現在兩方面:支撐業務系統的運轉和支撐分析決策,即OLTP和OLAP,OLTP常見的比如關系型數據庫,主要是基本的事務處理,比如銀行交易,OLAP是數據倉庫的主要應用,支持復雜的分析操作,側重于決策支持。深信服EDS可以為企業數據庫數據調用和分析提供充分的性能支撐。
場景痛點:I/O讀寫既要低時延又要高吞吐
關系型數據庫具有結構化程度高、獨立性強的特點,以Oracle為代表,可以很好的滿足OLTP(聯機事務處理)所需的數據信息和操作需求,即面向“事務”所進行的數據庫的增刪改查。比如銀行取錢操作。這類操作的數據I/O模型特征為:以小塊隨機讀寫為主,對時延要求高。
而OLAP主要面向數據分析,以數據倉庫為例,數據倉庫將各個散落獨立的數據庫孤島整合在了一個數據結構里面,其所做工作是將數據從各個數據庫中抽取出來,并經過數據格式轉換、清洗和儲存,為上層商務智能系統的分析提供數據源。數據I/O模型特征為:以大塊I/O讀寫為主,對存儲吞吐要求高。
解決方案:自研算法同時承載OLTP/OLAP類型業務
EDS通過Tier分層、多副本并發寫、緩存熱力圖算法等,以及RDMA技術來降低I/O時延,同多虛擬IP實現多節點并發,并通過自適應條帶化、自研數據分布算法實現高吞吐。
基于以上優化,EDS 3節點混合盤集群承載Oracle Rac數據庫可以達到42萬TPM,3節點使用全固態盤集群承載數據倉庫可實現5GB/s吞吐性能,滿足OLTP/OLAP類型業務承載需求。
截至目前,深信服EDS已經為醫療、廣電、企業、政府等不同行業數千家用戶提供存儲服務,未來深信服EDS還將在應用級性能優化的方向持續精進,打造最懂用戶業務的高性能存儲。